单项选择题
A.数据并行B.模型并行C.流水线并行D.混合并行
在大模型中,哪种技术通常用于减少模型大小和计算复杂度?()A.知识蒸馏B.模型剪枝C.模型量化D.稀疏注意力机...
单项选择题在大模型中,哪种技术通常用于减少模型大小和计算复杂度?()
A.知识蒸馏B.模型剪枝C.模型量化D.稀疏注意力机制
大模型训练中,哪种优化策略可以有效减少模型参数的更新方差?()A.学习率衰减B.动量C.二阶梯度方法D.模型剪...
单项选择题大模型训练中,哪种优化策略可以有效减少模型参数的更新方差?()
A.学习率衰减B.动量C.二阶梯度方法D.模型剪枝
大模型在应用时,以下哪种方法可以减少推理延迟?()A.模型压缩B.并行计算C.硬件加速D.所有上述
单项选择题大模型在应用时,以下哪种方法可以减少推理延迟?()
A.模型压缩B.并行计算C.硬件加速D.所有上述