【动作值函数】

目录

释义
翻译

go top

动作值函数

网络释义

action-value function

Q-learning学习算法——这是一种通过学习动作值函数（action-value function）完成的强化学习算法，函数采取在给定状态的给定动作，并计算出期望的效用价值，在此后遵循固定的策略。

基于16个网页-相关网页

相关文章

有道翻译

动作值函数

Action value function

以上为机器翻译结果，长、整句建议使用人工翻译。

应用推荐

$firstVoiceSent

- 来自原声例句

关于有道 Investors 有道智选官方博客技术博客诚聘英才联系我们站点地图网络举报 © 2024 网易公司隐私政策服务条款京ICP证080268号京ICP备10005211号

小调查

请问您想要如何调整此模块？

模块上移

模块下移

不移动

感谢您的反馈，我们会尽快进行适当修改！

进来说说原因吧确定

小调查

请问您想要如何调整此模块？

模块上移

模块下移

不移动

感谢您的反馈，我们会尽快进行适当修改！

进来说说原因吧确定