扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI，首次在多人对战中击败人类顶尖选手。

1 阅读

Pluribus是由Facebook AI（现Meta AI）与卡内基梅隆大学（CMU）合作开发的六人桌无限注德州扑克人工智能。2019年，Pluribus在六人桌德州扑克中击败了15名人类顶尖职业选手，成为首个在多人对战中超越人类水平的AI。

技术背景

Pluribus基于自博弈（self-play）和蒙特卡洛树搜索（MCTS）算法，结合深度神经网络进行策略优化。与之前专注于一对一（heads-up）的AI（如Libratus）不同，Pluribus需要处理六人桌中更复杂的动态博弈，包括多对手策略、位置优势和隐含赔率。

打法风格

Pluribus的风格以激进和混合策略著称。它经常采用小尺度下注（约1/3底池）来维持宽范围，并在翻牌圈频繁过牌-加注以施加压力。其关键创新之一是“不均衡下注”（unbalanced betting），即在不同情况下使用相同下注尺度但不同牌力，从而模糊对手的读牌。此外，Pluribus善于利用“反事实遗憾最小化”（CFR）来平衡诈唬和价值下注的比例，使得人类难以针对。

公开印象

在测试中，人类选手普遍反映Pluribus难以捉摸，其下注模式与传统人类策略差异显著。例如，它会在河牌圈用弱牌进行大额诈唬，也会用强牌慢打。职业选手如Chris Ferguson和Darren Elias参与了对战，并承认Pluribus在长期对局中具有明显优势。

影响与争议

Pluribus的论文发表于《Science》杂志，标志着AI在多人博弈中的重大突破。然而，其策略是否完全适用于真实锦标赛（如考虑ICM和奖金结构）仍存争议。此外，Pluribus的代码未完全公开，限制了独立验证。

总结

Pluribus证明了AI在复杂多人博弈中的潜力，其混合策略和自适应能力为扑克策略研究提供了新视角。尽管未直接参与线上或线下赛事，但其影响力已延伸至博弈论和人工智能领域。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象

影响与争议

总结

评论 (0)

相关推荐

口袋对T

价值下注

混合策略

过牌-加注

下注

慢打

无限注

反事实遗憾