扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI，首次在多人游戏中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook AI（现Meta AI）与卡内基梅隆大学（CMU）合作开发的六人桌无限注德州扑克人工智能。2019年，Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手，成为首个在多人（超过两人）扑克中达到超人水平的人工智能。

技术背景

Pluribus基于自博弈（self-play）和蒙特卡洛树搜索（MCTS）算法，结合深度学习进行策略优化。与之前专注于一对一（heads-up）的AI（如Libratus）不同，Pluribus需要处理六人桌的复杂动态，包括多对手策略、位置优势和隐含赔率。其核心创新在于使用“蓝图策略”（blueprint strategy）作为基础，并在实时游戏中通过有限深度搜索进行微调。

打法风格

Pluribus的风格被描述为“混合且不可预测”。它经常采用非常规的下注尺度，例如在翻牌圈使用小注（约1/3底池）或超池下注，以平衡范围并迫使对手犯错。Pluribus特别擅长使用“反直觉”的诈唬和慢打，例如在河牌圈用弱牌下注或在有利位置用强牌过牌。人类选手反馈称，Pluribus的玩法“令人困惑”，因为它似乎没有固定的模式，且能快速适应对手的倾向。

公开印象

Pluribus的胜利被视为AI在博弈论和战略游戏中的里程碑。与AlphaGo在围棋中的成就不同，扑克涉及不完整信息（隐藏牌），因此Pluribus的成功展示了AI在不确定性和欺骗性环境中的能力。然而，Pluribus并未公开其完整代码或策略，因此其具体算法细节仍属商业机密。

影响与争议

Pluribus的出现引发了关于在线扑克公平性的讨论。部分玩家担心AI可能被用于作弊，但Pluribus的开发者强调其设计目的是研究而非滥用。目前，Pluribus已不再活跃于公开扑克平台，但其技术影响了后续AI扑克研究。

总结

Pluribus是多人扑克AI的标杆，证明了在复杂不完全信息博弈中，AI可以超越人类顶尖水平。其混合策略和自适应能力为AI博弈论研究提供了重要参考。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象

影响与争议

总结

评论 (0)

相关推荐

混合策略

小注

下注

慢打

无限注

蓝图策略

隐含赔率

位置优势