相关考题
-
单项选择题
预训练模型GPT的优点是什么()
A.引入了单向的Transformer效果得到提升
B.使用双向的Transformer
C.抛开了下文只用了上文信息
D.使用了双向的LSTM做特征提取 -
单项选择题
Dropout函数的作用是什么()
A.随机失活单元,防止过拟合
B.代价函数
C.动态优化器
D.交叉熵函数 -
单项选择题
每个Transformer编码器中的第一层是()
A.前馈神经网络
B.Attention
C.Self-Attention
