MichaelL.Littman于 1994年首次提出用随机对策过程(StochasticGame,SG)作为多智能体强化学习任务的 模型框架,针对二元零和对策问题,提出了Minimax.Q学习算法来寻找一...
基于1个网页-相关网页
随机对策过程
Random game process
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动