扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限德州扑克AI，首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook AI（现Meta AI）与卡内基梅隆大学（CMU）合作开发的扑克人工智能，专门针对六人桌无限德州扑克（No-Limit Texas Hold'em）设计。2019年，Pluribus在《科学》杂志上发表的研究中宣称，它在与15名人类顶尖扑克选手的5000手牌对局中取得了显著胜率，成为首个在多人（超过两人）扑克中击败人类精英的AI。

技术背景

Pluribus基于自我对弈（self-play）和蒙特卡洛树搜索（MCTS）算法，结合了深度学习和有限状态抽象。与之前专注于一对一（heads-up）的AI（如Libratus）不同，Pluribus需要处理六人桌中更复杂的动态博弈，包括多对手策略、隐含赔率和诈唬频率。其核心创新在于使用“蓝图策略”（blueprint strategy）进行预计算，并在实时对局中通过搜索进行微调，从而在有限计算资源下实现高效决策。

打法风格

Pluribus的风格被描述为“激进且混合”，它经常采用非标准的下注尺度（如超池下注）和频繁的诈唬，以利用人类对手的认知偏差。例如，它会在翻牌圈用弱牌下注，在转牌圈或河牌圈转为诈唬，或者用强牌慢打以诱导对手犯错。人类选手反馈称，Pluribus的下注模式难以预测，且能快速适应对手的倾向。

公开印象与影响

Pluribus的发布引发了扑克社区的广泛讨论。一些职业选手（如Chris Ferguson）在测试后认为其策略具有启发性，但质疑其是否真正“击败”了人类，因为测试环境（如固定盲注级别、有限手牌数）与真实锦标赛存在差异。此外，Pluribus并未公开其完整代码或进行持续在线对战，因此其长期表现未经验证。尽管如此，Pluribus被视为AI在多人不完全信息博弈中的重要里程碑，推动了扑克策略研究的发展。

争议与局限

部分批评指出，Pluribus的对手并非同时在线对抗，而是分别与AI进行单挑式对局，这降低了多人博弈的复杂性。此外，AI在测试中使用了人类不常用的下注尺度（如2.5倍底池），可能利用了人类对非标准尺度的不适应。总体而言，Pluribus展示了AI在复杂博弈中的潜力，但尚未完全解决多人扑克的终极挑战。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象与影响

争议与局限

评论 (0)

相关推荐

下注

慢打

蓝图策略

隐含赔率

超池下注

六人桌

专注

单挑