单项选择题
以下哪个模型使用了双向的Transformer作为特征提取()
A.BERTB.Word2VecC.ELMOD.GPT
单项选择题 Transformer中的Q,K,V为什么用不同的权重矩阵生成()
单项选择题 RNN和CNN都可以处理文本,哪个处理长文本效果更好()
单项选择题 传统的RNN存在哪些问题()