判断题

AdaGrad方法学习率是所有梯度历史平方值总和的平方根的倒数,具有损失大的特性。

【参考答案】

正确

(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)