单项选择题
A.计算复杂性B.收敛速度C.使用的梯度类型D.是否需要学习率
A.增加正则化惩罚项,降低模型复杂度B.增加隐藏层神经元数目,提高模型效果C.使用更大的学习率,更快地收敛到最优解D.在训练过程中,以一定的概率随机使某些神经元失活,减少过拟合的可能性
A.SGD只考虑一阶梯度,而Adam结合了一阶动量和二阶动量B.Adam只考虑一阶梯度,而SGD基于动量梯度方法C.SGD和Adam都只使用一阶梯度D.SGD和Adam都考虑二阶梯度
A.SigmoidB.TanhC.ReLUD.Softmax
微信扫一扫,加关注免费搜题