判断题
在DQN中,求解Q(s,a)时采⽤的策略是有限采样s,a,并通过采样值来估计Q值。
【参考答案】
正确
(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
点击查看答案&解析

判断题
正确
(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
微信扫一扫,加关注免费搜题