单项选择题
A.SGD只考虑一阶梯度,而Adam结合了一阶动量和二阶动量B.Adam只考虑一阶梯度,而SGD基于动量梯度方法C.SGD和Adam都只使用一阶梯度D.SGD和Adam都考虑二阶梯度
在深度学习中,哪种激活函数通常不存在梯度消失问题,并且计算效率较高?()A.SigmoidB.TanhC.Re...
单项选择题在深度学习中,哪种激活函数通常不存在梯度消失问题,并且计算效率较高?()
A.SigmoidB.TanhC.ReLUD.Softmax
为什么在使用sigmoid作为激活函数时,常用交叉熵损失函数而不用均方差误差损失函数?()A.均方差误差损失函...
单项选择题为什么在使用sigmoid作为激活函数时,常用交叉熵损失函数而不用均方差误差损失函数?()
A.均方差误差损失函数容易陷入局部最优解B.均方差误差损失函数在sigmoid函数下容易导致梯度消失C.因为交叉熵损失函数不适于分类问题D.交叉熵损失函数比均方差误差损失函数计算更简单
在什么条件下,最小二乘法与极大似然估计是等价的?()A.样本服从正态分布B.残差服从正态分布C.样本量足够大D...
单项选择题在什么条件下,最小二乘法与极大似然估计是等价的?()
A.样本服从正态分布B.残差服从正态分布C.样本量足够大D.模型自变量无共线性