德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌限注德州扑克人工智能。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。

技术背景

Pluribus基于自博弈(self-play)和蒙特卡洛树搜索(MCTS)算法,结合了深度学习和有限状态抽象。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要处理六人桌中更复杂的动态博弈,包括多对手策略、隐含赔率诈唬频率的平衡。

打法风格

Pluribus的策略以混合策略和平衡下注著称。它倾向于采用混合下注mixed strategy),即同一手牌在不同情况下可能选择下注过牌加注,使得对手难以读牌。Pluribus在翻牌前和翻牌后都表现出激进的加注频率,但并非盲目进攻,而是基于精确的胜率计算和对手模型。

  • 翻牌前:Pluribus的起手牌范围较宽,但会根据位置和对手倾向调整。它经常在小盲位加注,并在大盲位防守较宽。
  • 翻牌后:Pluribus擅长利用下注尺度传递信息,例如在有利位置使用小注试探,在不利位置使用大注保护强牌。它也会频繁使用过牌-加注check-raise)来惩罚对手的持续下注
  • 诈唬:Pluribus的诈唬频率经过精确校准,使其在长期博弈中保持不可剥削性。

公开印象

Pluribus的胜利被视为AI在博弈论领域的里程碑,因为六人桌的复杂性远高于一对一。人类选手评价Pluribus“难以捉摸”,其下注模式与人类直觉不同,但长期来看非常有效。Pluribus的代码和策略细节未完全公开,但其核心思想影响了后续扑克AI和游戏理论的研究。

局限性

Pluribus仅在固定规则(六人桌无限注德州扑克)下测试,且未考虑实际比赛中的筹码深度变化、玩家动态调整等因素。此外,其策略基于大量计算,无法直接应用于实时决策。

影响

Pluribus证明了AI在多人不完全信息博弈中的潜力,推动了AI在金融、谈判等领域的应用。对于扑克界,它促使职业选手重新审视传统策略,并开始使用AI辅助训练工具。

评论 (0)

|

登录 后参与讨论

相关推荐