go top

时序差分算法

网络释义

  temporal difference

基于模拟退火q学习的移动机器人路径规划技术研究(优秀硕博学位论文) - docin.com豆丁网 再学习最优策略,称这类方法为模型有关的方法,典型算法 有蒙特卡罗(MontaCarlo,MC)方法、时序差分算法(TemporalDifference,TD)、Q学习 算法等。下面对强化学习中的这些常见算法分别介绍。 2.3.2动态规划方法 动态规划的思想是

基于2个网页-相关网页

有道翻译

时序差分算法

Temporal difference algorithm

以上为机器翻译结果,长、整句建议使用 人工翻译

双语例句

  • 动态规划蒙特卡罗算法时序差分算法Q-学习指出它们之间的区别联系

    Then the four main algorithms including dynamic programming, monte carlo method, temporal-difference and Q-learning are given respectively, and their difference and relation are pointed out.

    youdao

更多双语例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定