问答题
使用批量梯度下降法时,是否有必要打乱训练数据?
没有必要。因为每个epoch的梯度计算都会使用整个训练数据,所以打乱顺序也没有任何影响。
问答题 如何解决梯度爆炸的问题?
问答题 如果在最后一层中,我们先使用ReLU激活函数,然后再使用Sigmoid函数,会怎样?
问答题 什么是端到端学习?列举一些优点。