问答题
迁移学习的超参数有哪些?
迁移学习的超参数有保留多少层、添加多少层、冻结多少层。
问答题 当使用小批量梯度下降时,为什么打乱数据很重要?
问答题 使用批量梯度下降法时,是否有必要打乱训练数据?
问答题 如何解决梯度爆炸的问题?