go top

value iteration

  • 数值迭代

网络释义专业释义

  值迭代

...状态转移概率函数(state Transition Probability Function),在策略迭代(Policy Iteration,PI)和值迭代Value Iteration)这些算法中采用决策树结构的策略和值函数表示方法,使计算倾向于状态空间中必要的部分,避免了不停的穷举。

基于34个网页-相关网页

  价值迭代

价值迭代(Value Iteration) 价值迭代方法是对上面所描述的方法的一种简化: 在策略评估过程中,对于每个状态\(s\),只找最优(价值是最大的)行动\(a\)。

基于20个网页-相关网页

短语

element value iteration 元素值迭代法

Value Iteration Algorithm 算法

Value iteration & policy iteration

Point-Based Value Iteration 基于点的值迭代

media value iteration 中值迭代

Initial Value Iteration 初值迭代

Value Iteration Network 价值迭代网络

Relative Value Iteration 关联值递归

asynchronous value iteration 异步数值迭代

 更多收起网络短语
  • 数值迭代 - 引用次数:4

    Theoretically,we can use numerical methods,such as value iteration and policy iteration,to solve the above problem.

    理论上,其优化问题可通过数值迭代或策略迭代等理论计算方法来求解。

    参考来源 - 多机器人搬运系统的作业分配研究

·2,447,543篇论文数据,部分数据来源于NoteExpress

双语例句

  • The optimal allocation policy was obtained using policy iteration or value iteration.

    采用策略迭代迭代的办法,可以求解系统的优库存分配策略。

    youdao

  • The paper adopts the method of extreme value iteration based on subjective empowers for determining weight of indicators.

    对于指标权重确定本文采用基于主观赋权的集迭代

    youdao

  • Because traditional theoretical methods such as policy iteration and value iteration can usually not be used to optimize large-scale systems, we rely on simulation methods.

    针对传统理论优化方法策略迭代数值迭代不能适用大规模系统的问题,我们采用仿真方法。

    youdao

更多双语例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定