go top

网络释义专业释义

  temporal difference

结合Monte Carlo方法和动态规划技术,式(8)给出强化学习中时间差分学习(TD,Temporal difference)的值函数迭代公式。

基于2个网页-相关网页

  • temporal difference learning

·2,447,543篇论文数据,部分数据来源于NoteExpress

$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定