go top

markov decision process

  • 马尔可夫决策过程

网络释义

  马尔可夫决策过程

...的自主缩减 将具有连续状态空间的强化学习问题投影到经典强化 学习算法模型———马尔可夫决策过程( Markov decision processing , MDP) 模型中,首先要将连续状态空间离散化, 离散粒度影响了算法的泛化精度和收敛速度,离散粒度越 细,泛化...

基于1个网页-相关网页

$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定