问答题
比较批处理,小批处理和随机梯度下降。
批处理是指在估计数据时获取整个数据;小批处理是通过对几个数据点进行采样来进行小批量处理;而随机梯度下降是指在每个时期更新......
(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)
问答题 解释Adam优化器的概念。
问答题 假设一个神经网络拥有3层的结构和ReLU激活函数。如果我们用同一个值初始化所有权重,结果会怎样?如果我们只有1层(即线性/逻辑回归)会怎样?
问答题 在优化学习速率时,分别尝试学习速率:0.1、0.2,…,0.5是好办法吗?