扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI，首次在多人对战中击败人类顶尖职业牌手。

0 阅读

Pluribus 是由 Facebook AI Research 和卡内基梅隆大学（CMU）联合开发的扑克人工智能，专注于六人桌无限注德州扑克（No-Limit Texas Hold'em）。2019年，Pluribus 在与其他AI及人类职业牌手的对战中取得了显著成果，成为首个在多人扑克游戏中击败人类顶尖选手的AI系统。

技术背景

Pluribus 基于自博弈（self-play）和蒙特卡洛树搜索（MCTS）算法，通过自我对弈不断优化策略。与之前专注于一对一（heads-up）的AI（如 Libratus）不同，Pluribus 需要处理多人对局中更复杂的动态博弈。其核心创新在于使用“蓝图策略”（blueprint strategy）结合实时搜索，在每手牌中动态调整决策。

打法风格

Pluribus 的策略以混合策略和不可预测性著称。它倾向于采用非标准的下注尺度，例如频繁使用超池下注（overbet）和非常规的加注大小，以扰乱对手的读牌。Pluribus 在翻牌前和翻牌后的范围构建上表现出极高的平衡性，使得人类对手难以利用其模式。此外，Pluribus 在诈唬和抓诈唬方面表现出色，能够根据对手的倾向动态调整。

公开印象

在2019年的测试中，Pluribus 与多名世界级职业牌手（如 Chris Ferguson、Jason Les 等）进行了超过10,000手牌的对抗，并取得了显著盈利。职业牌手普遍反映 Pluribus 的决策难以预测，且其下注模式与传统人类策略差异较大。Pluribus 的成功标志着AI在多人不完全信息博弈中的重大突破，但也引发了关于扑克未来和人类职业牌手角色的讨论。

影响与局限

Pluribus 的代码和策略细节未完全公开，但其研究成果已发表在《科学》杂志上。尽管 Pluribus 在六人桌中表现出色，但其策略是否适用于其他变体（如锦标赛或短牌）尚不明确。此外，Pluribus 的计算资源需求较高，限制了其在实时应用中的普及。

总体而言，Pluribus 是扑克AI发展史上的里程碑，展示了深度学习与博弈论在复杂策略游戏中的潜力。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象

影响与局限

评论 (0)

相关推荐

混合策略

下注

无限注

蓝图策略

超池下注

六人桌

限注德州扑克

专注