德州扑克知识库
Cepheus
扑克选手

Cepheus

加拿大

由阿尔伯塔大学开发的扑克人工智能,在限注德州扑克中达到接近最优玩法。

1 阅读

Cepheus 是由加拿大阿尔伯塔大学计算机科学系的研究人员开发的扑克人工智能,专门针对二人限注德州扑克Heads-Up Limit Hold'em)设计。该项目由 Michael Bowling 教授领导,于 2015 年 1 月公开宣布,声称 Cepheus 已经通过自我对弈强化学习,将游戏解决到接近纳什均衡,理论上无法被人类或任何其他程序持续击败。

Cepheus 的算法基于反事实遗憾最小化CFR),这是一种迭代方法,通过模拟大量对局来逼近均衡策略。研究人员使用了约 4000 个 CPU 核心进行数月计算,生成了包含约 10^12 个决策点的策略。最终,Cepheus 的策略被证明在 95% 的置信水平下,其期望损失不超过每手牌 0.001 个大盲注,实际上达到了可忽略的漏洞

在公开测试中,Cepheus 与人类顶尖玩家进行了数千手牌的对局,结果符合理论预期:人类无法获得显著盈利。然而,Cepheus 并非完美无缺,其策略针对的是限注规则,且仅适用于二人对局。在无限注或多人桌场景中,Cepheus 的策略并不直接适用。

Cepheus 的发布引发了关于人工智能在扑克中应用的广泛讨论。一些职业玩家认为,Cepheus 证明了在特定规则下,人类直觉无法与机器计算抗衡;另一些人则指出,现实扑克中的心理战和诈唬在 Cepheus 的均衡策略中已被数学化,但人类仍可通过偏离均衡来利用对手的弱点。

尽管 Cepheus 从未参加正式比赛,其影响力体现在后续 AI 如 Libratus 和 Pluribus 的开发中,这些 AI 进一步挑战了无限注德州扑克。Cepheus 的代码和策略已公开,供学术研究和爱好者学习。

评论 (0)

|

登录 后参与讨论

相关推荐