【policy_iteration】什么意思_英语policy_iteration的翻译_音标_读音_用法_例句_在线翻译

policy iteration

策略迭代法
策略迭代

网络释义 专业释义

策略迭代法

增强学习中有一个比较有名的算法叫策略迭代法（policy iteration），这个算法长期以来没有理论上的分析结果，但是实际上有广泛的应用。

基于74个网页-相关网页

策略迭代

...方法研究 - docin.com豆丁网来描述状态转移概率函数（stateTransition ProbabilityFunction），在策略迭代（Policy Iteration， PI）和值迭代（ValueIteration）这些算法中采用决策树结构的策略和值函数表示方法，使计算倾向..

基于20个网页-相关网页

短语

policy iteration method 策略迭代法

M-step look-ahead policy iteration M步向前策略迭代

Least squares policy iteration 最小二乘策略迭代

Value iteration & policy iteration 二

modified policy iteration 改进的策略迭代法

policy improvement iteration [数] 策略改进迭代

更多收起网络短语

计算机科学技术 | 数学

策略迭代 - 引用次数：8
Theoretically,we can use numerical methods,such as value iteration and policy iteration,to solve the above problem.

理论上,其优化问题可通过数值迭代或策略迭代等理论计算方法来求解。

参考来源 - 多机器人搬运系统的作业分配研究
策略迭代法

·2,447,543篇论文数据，部分数据来源于NoteExpress

双语例句

The policy iteration method is used in solving process.

文中应用策略迭代法求解。

youdao
The optimal allocation policy was obtained using policy iteration or value iteration.

采用策略迭代或值迭代的办法，可以求解系统的最优库存分配策略。

youdao
An appropriate selection of basis function directly in?uences the learning performance of a policy iteration method during the value function approximation.

该算法先用渐进方法进行多序列比对，然后通过迭代策略，利用上一轮多序列比对结果修正指导树，产生新一轮比对。

youdao

更多双语例句

应用推荐

$firstVoiceSent

- 来自原声例句

目录

policy iteration

网络释义 专业释义

相关文章

双语例句

修改单词