多项选择题
A.状态 B.动作 C.回报 D.强化
用于监督分类的算法有()。A.支持向量机B.决策树C.神经网络D.线性回归
多项选择题用于监督分类的算法有()。
A.支持向量机 B.决策树 C.神经网络 D.线性回归
强化学习的回报值一个重要特点是具有()。A.客观性B.主体性C.超前性D.滞后性
单项选择题强化学习的回报值一个重要特点是具有()。
A.客观性 B.主体性 C.超前性 D.滞后性
马尔可夫性质强调在每一个动作状态序列中,下一个状态与()有关。A.外部影响B.主体内因C.历史状态D.当前状态
单项选择题马尔可夫性质强调在每一个动作状态序列中,下一个状态与()有关。
A.外部影响 B.主体内因 C.历史状态 D.当前状态