相关考题
-
判断题
BERT可以处理的最长序列是768。 -
判断题
Transformer的encoder中先进行前馈神经网络,然后将处理后的数据输入到Self-Attention中。 -
多项选择题
编解码模型有哪些弊端()
A.对于编码器来说无法完全的表示整个序列信息
B.对于编码器来说,长序列问题,先输入的有可能被覆盖掉
C.对于解码器来说,对于输入的每个单词权重是不一样的
D.对于解码器来说,对于输入的每个单词权重是相同的
