单项选择题
在强化学习中,什么是“策略”()?
A.智能体选择的动作序列B.智能体根据状态选择动作的规则C.智能体获得的累积奖励D.智能体与环境交互的次数
单项选择题 以下哪个不是谱聚类的主要步骤()?
单项选择题 在K-means 算法中,初始聚类中心的选择对结果有何影响()?
单项选择题 在深度学习的序列建模任务中,为什么长短期记忆网络(LSTM)比标准的循环神经网络(RNN)更为常用()?