多项选择题
A.值迭代和策略迭代是求解马尔科夫决策过程问题的两个最基本的方法B.马尔科夫决策过程将客观世界的动态特性用状态转移来描述C.策略迭代中,策略没有显式表示,整个过程按动态规划的贝尔曼公式不断进行迭代更新来改进值函数D.值迭代中,策略显式表示,可以计算得到相对应的值函数,然后用贝尔曼公式改进策略
马尔科夫决策过程中的关键要素包括()。A.状态B.行动C.策略表示方式D.观察
多项选择题马尔科夫决策过程中的关键要素包括()。
A.状态B.行动C.策略表示方式D.观察
概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由()构成的四元组。A...
多项选择题概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由()构成的四元组。
A.行动集合B.报酬函数C.状态转移函数D.状态集合
关于经典描述和集合描述,下列说法正确是()。A.经典描述是经典规划问题描述的方法之一,它用使用一阶逻辑符号,...
多项选择题关于经典描述和集合描述,下列说法正确是()。
A.经典描述是经典规划问题描述的方法之一,它用使用一阶逻辑符号,用公式来表达状态集和行动,通过语义解释来确定具体的状态和行动B.集合描述是经典规划问题描述的方法之一,它用有限的命题符号集来表达状态转移系统C.状态变量描述是经典规划问题描述的方法之一,它将状态表示为向量值,动作表示为函数映射D.状态变量描述与经典描述方法在能力上是等价的