go top

policy iteration

  • 策略迭代法
  • 策略迭代

网络释义专业释义

  策略迭代法

增强学习中有一个比较有名的算法叫策略迭代法policy iteration),这个算法长期以来没有理论上的分析结果,但是实际上有广泛的应用。

基于74个网页-相关网页

  策略迭代

...方法研究 - docin.com豆丁网 来描述状态 转移概率函数(stateTransition ProbabilityFunction),在策略迭代Policy Iteration, PI)和值迭代(ValueIteration)这些算法中采用决策树结构的策略和值函数表示 方法,使计算倾向..

基于20个网页-相关网页

短语

policy iteration method 策略迭代法

M-step look-ahead policy iteration M步向前策略迭代

Least squares policy iteration 最小二乘策略迭代

Value iteration & policy iteration

modified policy iteration 改进的策略迭代法

policy improvement iteration [数] 策略改进迭代

 更多收起网络短语
  • 策略迭代 - 引用次数:8

    Theoretically,we can use numerical methods,such as value iteration and policy iteration,to solve the above problem.

    理论上,其优化问题可通过数值迭代策略迭代等理论计算方法来求解。

    参考来源 - 多机器人搬运系统的作业分配研究
  • 策略迭代法

·2,447,543篇论文数据,部分数据来源于NoteExpress

双语例句

  • The policy iteration method is used in solving process.

    文中应用策略迭代求解

    youdao

  • The optimal allocation policy was obtained using policy iteration or value iteration.

    采用策略迭代迭代的办法,可以求解系统的优库存分配策略。

    youdao

  • An appropriate selection of basis function directly in?uences the learning performance of a policy iteration method during the value function approximation.

    算法先渐进方法进行多序列比对,然后通过迭代策略利用上一轮多序列比对结果修正指导树,产生新一轮比对。

    youdao

更多双语例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定