欢迎来到牛牛题库网 牛牛题库官网
logo
全部科目 > 大学试题 > 计算机科学 > 人工智能

多项选择题

关于值迭代和策略迭代,下列说法不正确的是()。

A.值迭代和策略迭代是求解马尔科夫决策过程问题的两个最基本的方法
B.马尔科夫决策过程将客观世界的动态特性用状态转移来描述
C.策略迭代中,策略没有显式表示,整个过程按动态规划的贝尔曼公式不断进行迭代更新来改进值函数
D.值迭代中,策略显式表示,可以计算得到相对应的值函数,然后用贝尔曼公式改进策略

点击查看答案&解析
微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题