问答题
解决梯度爆炸问题的一个最简单的方法就是梯度修剪,即当梯度的绝对值大于M(M是一个很大的数字)时,设梯度为±M。
如果在最后一层中,我们先使用ReLU激活函数,然后再使用Sigmoid函数,会怎样?
问答题如果在最后一层中,我们先使用ReLU激活函数,然后再使用Sigmoid函数,会怎样?
什么是端到端学习?列举一些优点。
问答题什么是端到端学习?列举一些优点。
什么是多任务学习?应该在什么时候使用?
问答题什么是多任务学习?应该在什么时候使用?