通过一种名为反事实遗憾最小化(counterfactual regret minimization)的算法,它先是随机地玩,然后最终在经过几个月的训练以及玩了上万亿手扑克之后,它也达到了能挑战最好人类玩家的高度,不仅如此...
基于32个网页-相关网页
反事实遗憾最小化
Minimize counterfactual regrets
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动