判断题
Transformer的encoder中先进行前馈神经网络,然后将处理后的数据输入到Self-Attention中。
错误
多项选择题 编解码模型有哪些弊端()
多项选择题 Transformer如何体现出的参数共享()
单项选择题 以下哪个模型使用了双向的Transformer作为特征提取()