go top

off-policy

  • 离策略

网络释义

  策略

这 其中包括了Watkins等人于1989年提出的著名算法Q学习[1314],它可以被 看成是一种离线策略off-policy)的时序差分算法[i5]。Watkins对Q学习 方法的收敛性进行了证明[15]。

基于36个网页-相关网页

  离策略

... Odds 几率 Off-Policy 离策略 One shot learning 一次性学习 ...

基于1个网页-相关网页

短语

hands-off policy 不干涉政策

Off Policy 学习和离线

Back-off Policy 退避方案

a hands-off policy 不干涉政策

a hands-off policy n 不干涉政策

OFF-SHORE POLICY 国际保单

Policy trade-off 政策权衡

off-body policy 脱身

 更多收起网络短语

双语例句原声例句权威例句

  • These legislators argue that such a policy would reduce crime dramatically, since it would take people with a proven tendency to commit crimes off the streets permanently.

    这些立法者认为政策大幅减少犯罪率,因为使那些已被证明犯罪倾向永远远离街头。

    youdao

  • This policy rounds off the size of the allocation request to the next highest available block.

    这种策略分配请求大小向上取整一个可用的块大小。

    youdao

  • It's another to pretend that Washington will adopt a 'hands off' policy.

    假定华盛顿采取“不干涉”的政策另外一回事了。

    youdao

更多双语例句
  • The communist North called off reunions in response to what it considers South Korean President Lee Myung Bak's hard-line policy.

    VOA: standard.2009.08.26

更多权威例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定