问答题
当使用小批量梯度下降时,为什么打乱数据很重要?
如果不打乱数据的顺序,那么假设我们训练一个神经网络分类器,且有两个类别:A和B,那么各个epoch中的所有小批量都会完全......
(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)
问答题 使用批量梯度下降法时,是否有必要打乱训练数据?
问答题 如何解决梯度爆炸的问题?
问答题 如果在最后一层中,我们先使用ReLU激活函数,然后再使用Sigmoid函数,会怎样?