多项选择题
Transformer如何体现出的参数共享()
A.Encoder和Decoder间的Embedding层
B.Decoder中Embedding层和FC层权重共享
C.没有任何层参数进行了共享
D.以上都正确
点击查看答案
相关考题
-
单项选择题
以下哪个模型使用了双向的Transformer作为特征提取()
A.BERT
B.Word2Vec
C.ELMO
D.GPT -
单项选择题
Transformer中的Q,K,V为什么用不同的权重矩阵生成()
A.无实际的意义
B.减小表达能力
C.降低了泛华能力
D.这样可以在不同的空间上进行投影,增加表达能力 -
单项选择题
RNN和CNN都可以处理文本,哪个处理长文本效果更好()
A.RNN
B.CNN
C.一样好
D.不确定
