go top

action sub-rewards

网络释义专业释义

  动作分值

动作分值

基于1个网页-相关网页

  • 动作分值 - 引用次数:4

    In order to solve both of the "curse of dimensionality" and slow convergence speed problem,a reward optimization method based on action sub-rewards in hierarchical reinforcement learning was proposed.

    针对强化学习的“维数灾”问题和算法收敛速度过慢的困难,提出了一种基于动作分值的分层强化学习奖赏优化方法。

    参考来源 - 强化学习维数灾问题解决方法研究

·2,447,543篇论文数据,部分数据来源于NoteExpress

$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定