德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首个在多人游戏中击败人类顶尖选手的AI。

0 阅读

Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌限注德州扑克人工智能。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人(超过两人)不完全信息博弈中达到超人水平的AI。

技术背景

Pluribus基于自博弈(self-play)和蒙特卡洛树搜索(MCTS)算法,结合深度神经网络进行策略优化。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要应对六人桌中复杂的动态博弈,包括多对手的交互、位置变化隐含赔率。其核心创新在于使用“蓝图策略”(blueprint strategy)结合实时搜索,在每手牌中动态调整决策。

打法风格

Pluribus的风格以激进和混合策略著称。它经常采用小尺度下注(约1/3底池),并频繁进行反主动下注donk-bet)和过牌-加注,以扰乱对手的读牌。Pluribus倾向于在翻牌圈和转牌圈使用高频率的持续下注,但在河牌圈则更谨慎,避免过度诈唬。其策略中一个显著特点是“薄价值下注”的运用,即用边缘牌在河牌圈下注以获取微弱价值。

Pluribus的决策基于对对手范围的精确建模,它能够快速适应不同对手的倾向,并利用对手的漏洞。例如,它会在对手弃牌率过高时增加诈唬频率,而在对手跟注过多时减少诈唬。

公开印象

Pluribus的发布在扑克界和AI领域引起轰动。人类职业选手在测试后普遍反映,Pluribus的玩法“非人类”,其下注尺度和时机常常令人困惑。许多选手认为Pluribus在翻牌圈和转牌圈的表现尤其强大,但在河牌圈偶尔会出现“奇怪”的弃牌跟注

值得注意的是,Pluribus并未公开其完整的源代码或训练数据,因此其策略细节仍部分保密。此外,Pluribus的测试环境为固定筹码深度(100大盲)和标准六人桌规则,未涉及锦标赛或短筹码场景。

影响与局限

Pluribus证明了AI在多人不完全信息博弈中的可行性,但其策略是否适用于线上扑克中的实际玩家池仍有争议。由于AI的决策基于完美理性假设,而人类玩家存在情绪和认知偏差,Pluribus的策略可能无法直接转化为人类可学习的“最优打法”。

总体而言,Pluribus是扑克AI发展的重要里程碑,但其实际应用更多停留在学术研究层面,而非直接指导人类玩家。

评论 (0)

|

登录 后参与讨论

相关推荐