go top

reinforcement learning algorithm

  • 强化学习算法

网络释义专业释义

  学习算法

Narendra-Shapiro巩固再励学习算法reinforcement learning algorithm)if N( t) = 0 (奖励)then p i(t + 1) = p i(t) + C(t)<1 - p i(t) > U(t) = U i p i(t) - C(t)p i(t)U(...

基于16个网页-相关网页

短语

Sarsa reinforcement learning algorithm Sarsa增强学习算法

linear reinforcement learning algorithm 线性再励学习算法

multi-agent reinforcement learning algorithm 多Agent强化学习算法

algorithm of reinforcement learning 强化学习算法

 更多收起网络短语
  • 强化学习算法

·2,447,543篇论文数据,部分数据来源于NoteExpress

双语例句

  • An average reward reinforcement learning algorithm for control Markov chains is presented.

    讨论平均准则控制马氏强化学习算法

    youdao

  • Simulation machine car through reinforcement learning algorithm, learning optimal navigation strategies.

    说明:模拟智能机器小车通过强化学习算法,学习最优导航策略

    youdao

  • Q learning algorithm is the most popular reinforcement learning algorithm, but the algorithm exist some problems.

    目前主流的强化学习算法Q学习算法,Q学习本身存在一些问题

    youdao

更多双语例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定