单项选择题
A.期望值 B.最大值 C.最小值 D.总和
A.状态动作函数 B.状态值函数 C.动作值函数 D.策略函数
A.监督学习 B.非监督学习 C.强化学习 D.线性回归
微信扫一扫,加关注免费搜题