问答题
如何解决梯度爆炸的问题?
解决梯度爆炸问题的一个最简单的方法就是梯度修剪,即当梯度的绝对值大于M(M是一个很大的数字)时,设梯度为±M。
问答题 如果在最后一层中,我们先使用ReLU激活函数,然后再使用Sigmoid函数,会怎样?
问答题 什么是端到端学习?列举一些优点。
问答题 什么是多任务学习?应该在什么时候使用?