optimal expected reward
最优预期奖励
以上为机器翻译结果,长、整句建议使用 人工翻译 。
Under the criterion of infinite-horizon expected discounted reward, the existence of some optimal policy is proved.
在无穷时间和连续折扣情况下,证明了最优修理、更新策略的存在,以使设备的期望折扣净收入最大。
youdao
应用推荐
模块上移
模块下移
不移动