go top

temporal difference learning

  • 时序差分学习:一种强化学习算法,通过比较不同时间步骤上的预测值来更新状态值函数。

网络释义专业释义英英释义

  差学习

暂态偏差学习Temporal Difference Learning)技术可以较为有效的剔除随机误差沈J,我们想在 今后的工作中采用此技术减少输入信号中的随机分量。

基于12个网页-相关网页

  差分学习

TDPig是使用神经网络及时间差分学习Temporal Difference Learning)实现的智能拱猪纸牌程序,TD法是再励学习(Reinforcement Learning)的主要方法之一。

基于8个网页-相关网页

  时间差学习

... 3.4 增强学习 Reinforcement Learning 时间差学习 Temporal difference learning 堆叠泛化 Stacked Generalization ...

基于3个网页-相关网页

  时间差分学习

他为该领域做出了许多重大贡献,包括:时间差分学习temporal difference learning)、策略梯度方法(policy gradient methods)、Dyna 架构。

基于1个网页-相关网页

  • 时间差分学习
    即时差分学习
  • 瞬时差分算法

·2,447,543篇论文数据,部分数据来源于NoteExpress

Temporal difference learning

  • abstract: Temporal difference (TD) learning is a prediction method. It has been mostly used for solving the reinforcement learning problem.

以上来源于: WordNet

双语例句

  • Then the four main algorithms including dynamic programming, monte carlo method, temporal-difference and Q-learning are given respectively, and their difference and relation are pointed out.

    动态规划蒙特卡罗算法时序差分算法Q-学习指出它们之间的区别联系

    youdao

更多双语例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定