单项选择题

在强化学习中,策略网络和价值网络通常用于()。

A.深度强化学习
B.无监督学习
C.监督学习
D.半监督学习