单项选择题
A.期望值 B.最大值 C.最小值 D.总和
在Q-Learning中,所谓的Q函数是指()。A.状态动作函数B.状态值函数C.动作值函数D.策略函数
单项选择题在Q-Learning中,所谓的Q函数是指()。
A.状态动作函数 B.状态值函数 C.动作值函数 D.策略函数
()有跟环境进行交互,从反馈当中进行不断的学习的过程。A.监督学习B.非监督学习C.强化学习D.线性回归
单项选择题()有跟环境进行交互,从反馈当中进行不断的学习的过程。
A.监督学习 B.非监督学习 C.强化学习 D.线性回归
典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于()。A.监督学习B.非监督学习C.强化学习D.线性回归
单项选择题典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于()。