欢迎来到牛牛题库网 牛牛题库官网
logo

单项选择题

关于策略梯度的方法说法正确的是()。A、只适用于离散动作空间B、适用于连续动作空间C、策略梯度的方法与DQN中的目标函数一致D、策略梯度的方法通过Q值挑选动作

点击查看答案&解析
微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题