Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首个在多人无限注德州扑克中击败人类顶尖职业选手的AI系统。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)联合开发的六人桌无限德州扑克人工智能。2019年,Pluribus在六人桌无限德州扑克中击败了15名人类顶尖职业选手,成为首个在多人无限注德州扑克中超越人类水平的AI。
技术背景
Pluribus采用了一种结合自我对弈(self-play)和蒙特卡洛树搜索(MCTS)的算法。与之前专注于两人对战的AI(如Libratus)不同,Pluribus需要应对六人桌中更复杂的动态博弈,包括多对手策略、隐含赔率和诈唬频率的平衡。其核心创新在于使用了一种称为“蓝图策略”(blueprint strategy)的预计算策略,并在实时游戏中通过有限深度搜索进行微调。
打法风格
Pluribus的风格以激进和混合策略著称。它经常采用大额下注(如底池的2/3或满池),并在翻牌圈频繁加注,以施加压力并迫使对手犯错。同时,Pluribus善于使用混合策略(mixed strategy),即同一手牌在不同情况下采取不同行动,使其难以被预测。例如,它有时会用强牌慢打,也会用弱牌诈唬,从而保持平衡。
在河牌圈,Pluribus倾向于使用超额下注(overbet),尤其是在牌面结构有利于其范围时。这种策略迫使对手在边缘情况下做出艰难决策。此外,Pluribus在翻牌前和翻牌圈的范围非常宽,但会根据对手的倾向动态调整。
公开印象
Pluribus的发布引发了扑克界的广泛讨论。许多职业选手认为,Pluribus的玩法与人类顶尖选手有显著差异,尤其是在多人底池中的处理方式。一些选手指出,Pluribus在某些情况下会采取看似“非标准”的行动,例如用弱牌跟注大额下注,但事后分析表明这些行动在数学上是合理的。
Pluribus的成功也标志着AI在多人博弈中的重大突破。与单挑AI不同,六人桌AI需要处理更复杂的交互和隐含信息,Pluribus的算法为此提供了新的思路。
影响与遗产
Pluribus的代码和策略并未完全公开,但其研究成果对扑克AI领域产生了深远影响。它证明了自我对弈和搜索算法在多人博弈中的有效性,并为其他不完全信息博弈(如桥牌、麻将)的AI开发提供了参考。在扑克社区,Pluribus被用作训练工具,帮助玩家分析自身策略的漏洞。
尽管Pluribus在六人桌中表现出色,但它并非完美无缺。在特定情况下(如短筹码或特殊牌面结构),人类选手仍能找到利用其弱点的方法。不过,Pluribus的出现标志着扑克AI进入了一个新阶段,即AI不仅能在单挑中击败人类,也能在多人局中占据优势。
评论 (0)
登录 后参与讨论