在强化学习中，什么是“策略”（）？A.智能体选择的动作序列B.智能体根据状态选择动作的规则C.智能体获得的累积_财会考试题库网

人工智能

单项选择题

在强化学习中，什么是“策略”（）？

A.智能体选择的动作序列
B.智能体根据状态选择动作的规则
C.智能体获得的累积奖励
D.智能体与环境交互的次数

相关考题

单项选择题以下哪个不是谱聚类的主要步骤（）？

单项选择题在K-means 算法中，初始聚类中心的选择对结果有何影响（）？

单项选择题在深度学习的序列建模任务中，为什么长短期记忆网络（LSTM）比标准的循环神经网络（RNN）更为常用（）？

All Rights Reserved 版权所有©财会考试题库(ckkao.com)

备案号：湘ICP备2022003000号-2