问答题
假设训练错误/成本很高,而且验证成本/错误几乎与之相等。这是什么意思?我们应该做些什么?
这表明欠拟合。我们可以添加更多参数,增加模型的复杂性或减少正则化。
问答题 将L2正则化添加到RNN有助于解决梯度消失的问题,是否正确。
问答题 什么时候不能使用BiLSTM?
问答题 举个适合多对一RNN架构的例子。