单项选择题

A.智能体选择的动作序列
B.智能体根据状态选择动作的规则
C.智能体获得的累积奖励
D.智能体与环境交互的次数