单项选择题
A.时域B.值域C.定义域D.频域
规划技术的两大研究任务是()。A.问题描述B.问题求解C.经典描述
多项选择题规划技术的两大研究任务是()。
A.问题描述B.问题求解C.经典描述
关于值迭代和策略迭代,下列说法不正确的是()。A.值迭代和策略迭代是求解马尔科夫决策过程问题的两个最基本的方法...
多项选择题关于值迭代和策略迭代,下列说法不正确的是()。
A.值迭代和策略迭代是求解马尔科夫决策过程问题的两个最基本的方法B.马尔科夫决策过程将客观世界的动态特性用状态转移来描述C.策略迭代中,策略没有显式表示,整个过程按动态规划的贝尔曼公式不断进行迭代更新来改进值函数D.值迭代中,策略显式表示,可以计算得到相对应的值函数,然后用贝尔曼公式改进策略
马尔科夫决策过程中的关键要素包括()。A.状态B.行动C.策略表示方式D.观察
多项选择题马尔科夫决策过程中的关键要素包括()。
A.状态B.行动C.策略表示方式D.观察