欢迎来到牛牛题库网 牛牛题库官网
logo
全部科目 > 大学试题 > 计算机科学 > 人工智能

单项选择题

强化学习算法中,用于优化策略的一种方法是:()。

A.监督学习
B.无监督学习
C.半监督学习
D.策略梯度

点击查看答案&解析
微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题