问答题
错误,添加L2正则化会将权重缩小为零,在某些情况下这实际上会让梯度消失的问题更严重。
什么时候不能使用BiLSTM?
问答题什么时候不能使用BiLSTM?
举个适合多对一RNN架构的例子。
问答题举个适合多对一RNN架构的例子。
说明为什么神经网络中的dropout可以作为正则化。
问答题说明为什么神经网络中的dropout可以作为正则化。