判断题

在DQN中,求解Q(s,a)时采⽤的策略是有限采样s,a,并通过采样值来估计Q值。

【参考答案】

正确

(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)