单项选择题

大模型训练时,哪种并行策略可以减少梯度通信的开销?()

A.数据并行
B.模型并行
C.流水线并行
D.混合并行