欢迎来到财会考试题库网 财会考试题库官网
logo
全部科目 > 大学试题 > 计算机科学 > 人工智能

单项选择题

Q学习是强化学习的常用框架之一,其中的Q是指()

    A.策略
    B.主体状态
    C.某一状态下执行某一动作的分数
    D.某一状态下使用某一动作学习策略的分数

点击查看答案&解析

相关考题

微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题