扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI，首个在多人游戏中击败人类顶尖选手的AI。

0 阅读

Pluribus是由Facebook AI（现Meta AI）与卡内基梅隆大学（CMU）合作开发的六人桌无限注德州扑克人工智能。2019年，Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手，成为首个在多人（超过两人）不完全信息博弈中达到超人水平的AI。

技术背景

Pluribus基于自博弈（self-play）和蒙特卡洛树搜索（MCTS）算法，结合深度神经网络进行策略优化。与之前专注于一对一（heads-up）的AI（如Libratus）不同，Pluribus需要应对六人桌中复杂的动态博弈，包括多对手的交互、位置变化和隐含赔率。其核心创新在于使用“蓝图策略”（blueprint strategy）结合实时搜索，在每手牌中动态调整决策。

打法风格

Pluribus的风格以激进和混合策略著称。它经常采用小尺度下注（约1/3底池），并频繁进行反主动下注（donk-bet）和过牌-加注，以扰乱对手的读牌。Pluribus倾向于在翻牌圈和转牌圈使用高频率的持续下注，但在河牌圈则更谨慎，避免过度诈唬。其策略中一个显著特点是“薄价值下注”的运用，即用边缘牌在河牌圈下注以获取微弱价值。

Pluribus的决策基于对对手范围的精确建模，它能够快速适应不同对手的倾向，并利用对手的漏洞。例如，它会在对手弃牌率过高时增加诈唬频率，而在对手跟注过多时减少诈唬。

公开印象

Pluribus的发布在扑克界和AI领域引起轰动。人类职业选手在测试后普遍反映，Pluribus的玩法“非人类”，其下注尺度和时机常常令人困惑。许多选手认为Pluribus在翻牌圈和转牌圈的表现尤其强大，但在河牌圈偶尔会出现“奇怪”的弃牌或跟注。

值得注意的是，Pluribus并未公开其完整的源代码或训练数据，因此其策略细节仍部分保密。此外，Pluribus的测试环境为固定筹码深度（100大盲）和标准六人桌规则，未涉及锦标赛或短筹码场景。

影响与局限

Pluribus证明了AI在多人不完全信息博弈中的可行性，但其策略是否适用于线上扑克中的实际玩家池仍有争议。由于AI的决策基于完美理性假设，而人类玩家存在情绪和认知偏差，Pluribus的策略可能无法直接转化为人类可学习的“最优打法”。

总体而言，Pluribus是扑克AI发展的重要里程碑，但其实际应用更多停留在学术研究层面，而非直接指导人类玩家。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象

影响与局限

评论 (0)

相关推荐

下注

无限注

蓝图策略

隐含赔率

弃牌

过牌

六人桌

限注德州扑克