问答题
Adam结合了两个想法来改善收敛性:每个参数更新可加快收敛速度;动量可避免卡在鞍点上。
假设一个神经网络拥有3层的结构和ReLU激活函数。如果我们用同一个值初始化所有权重,结果会怎样?如果我们只有1...
问答题假设一个神经网络拥有3层的结构和ReLU激活函数。如果我们用同一个值初始化所有权重,结果会怎样?如果我们只有1层(即线性/逻辑回归)会怎样?
在优化学习速率时,分别尝试学习速率:0.1、0.2,…,0.5是好办法吗?
问答题在优化学习速率时,分别尝试学习速率:0.1、0.2,…,0.5是好办法吗?
说明在图像分类任务中可视化CNN特征的两种方法。
问答题说明在图像分类任务中可视化CNN特征的两种方法。