【temporal_difference_learning】什么意思_英语temporal_difference_learning的翻译_音标_读音_用法_例句_在线翻译

temporal difference learning

差学习

暂态偏差学习（Temporal Difference Learning）技术可以较为有效的剔除随机误差沈J，我们想在今后的工作中采用此技术减少输入信号中的随机分量。

基于12个网页-相关网页

差分学习

TDPig是使用神经网络及时间差分学习（Temporal Difference Learning）实现的智能拱猪纸牌程序，TD法是再励学习（Reinforcement Learning）的主要方法之一。

基于8个网页-相关网页

时间差学习

... 3.4 增强学习 Reinforcement Learning 时间差学习 Temporal difference learning 堆叠泛化 Stacked Generalization ...

基于3个网页-相关网页

时间差分学习

他为该领域做出了许多重大贡献，包括：时间差分学习（temporal difference learning）、策略梯度方法（policy gradient methods）、Dyna 架构。

基于1个网页-相关网页

短语

计算机科学技术 | 体育

·2,447,543篇论文数据，部分数据来源于NoteExpress

abstract: Temporal difference (TD) learning is a prediction method. It has been mostly used for solving the reinforcement learning problem.

以上来源于: WordNet

Then the four main algorithms including dynamic programming, monte carlo method, temporal-difference and Q-learning are given respectively, and their difference and relation are pointed out.

动态规划、蒙特卡罗算法、时序差分算法、Q-学习，并指出了它们之间的区别和联系。

youdao

更多双语例句

应用推荐

$firstVoiceSent

- 来自原声例句