多项选择题
A.支持向量机 B.决策树 C.神经网络 D.线性回归
强化学习的回报值一个重要特点是具有()。A.客观性B.主体性C.超前性D.滞后性
单项选择题强化学习的回报值一个重要特点是具有()。
A.客观性 B.主体性 C.超前性 D.滞后性
马尔可夫性质强调在每一个动作状态序列中,下一个状态与()有关。A.外部影响B.主体内因C.历史状态D.当前状态
单项选择题马尔可夫性质强调在每一个动作状态序列中,下一个状态与()有关。
A.外部影响 B.主体内因 C.历史状态 D.当前状态
强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。A.探索B.开发C.输入D.输...
单项选择题强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。
A.探索 B.开发 C.输入 D.输出