单项选择题
在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
A.大;小
B.大;大
C.小;小
D.小;大
点击查看答案

单项选择题
A.大;小
B.大;大
C.小;小
D.小;大
微信扫一扫,加关注免费搜题