扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限德州扑克AI，首个在多人对战中击败人类顶尖职业牌手的AI系统。

1 阅读

Pluribus 是由 Facebook AI 与卡内基梅隆大学（CMU）联合开发的六人桌无限德州扑克人工智能。2019 年，Pluribus 在六人桌无限德州扑克中击败了多名人类顶尖职业牌手，成为首个在多人对战中超越人类水平的 AI。

技术背景

Pluribus 采用自博弈（self-play）和蒙特卡洛树搜索（MCTS）相结合的方法。与之前专注于一对一（heads-up）的 AI 不同，Pluribus 需要处理六人桌中更复杂的动态和隐藏信息。其核心创新在于一种称为“蓝图策略”的离线计算与实时搜索的混合架构，使得 AI 能够在有限计算资源下做出接近纳什均衡的决策。

打法风格

Pluribus 的风格以激进和混合策略著称。它经常采用小尺度下注（约 1/3 底池），并频繁进行过牌-加注，给对手施加巨大压力。Pluribus 善于利用范围优势，在翻牌圈和转牌圈保持较高的下注频率，迫使对手在不利位置做出艰难决定。此外，Pluribus 在河牌圈会混合使用价值下注和诈唬，其下注尺度变化多端，难以预测。

公开印象

人类职业牌手在与 Pluribus 对战后普遍认为其打法“非人类”，经常做出看似奇怪但实际高效的决策。例如，Pluribus 会在某些情况下用弱牌进行大额诈唬，而在另一些情况下用强牌过牌诱捕。这种平衡策略使得人类难以针对。

影响与意义

Pluribus 的成功证明了 AI 在多人不完全信息博弈中的潜力，对扑克策略研究和 AI 发展具有里程碑意义。尽管 Pluribus 并未公开其完整代码，但其核心思想已被后续研究广泛借鉴。

局限性

Pluribus 主要针对六人桌无限德州扑克，且其策略基于固定筹码深度（100 大盲注）。在更复杂的变种或不同筹码深度下，其表现可能有所下降。此外，Pluribus 并未考虑对手的个体倾向，而是假设对手接近最优玩法。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象

影响与意义

局限性

评论 (0)

相关推荐

筹码

大盲注

价值下注

筹码深度

范围优势

混合策略

过牌-加注

下注