单项选择题

Q learning和DQN的区别在于()
A、Qlearning能处理连续动作,DQN不能
B、Qlearning是off-policy,DQN是on-policy
C、DQN使用了神经网络和经验回放
D、以上都不对