问答题
关于dropout的工作原理有几种解释。我们可以将其视为模型平均的一种形式:我们可以在每一步中“去掉”模型的一部分并取平......
(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)
测试集上是否需要使用dropout?
问答题测试集上是否需要使用dropout?
迁移学习的超参数有哪些?
问答题迁移学习的超参数有哪些?
当使用小批量梯度下降时,为什么打乱数据很重要?
问答题当使用小批量梯度下降时,为什么打乱数据很重要?