Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的扑克人工智能,专门针对六人桌无限德州扑克(No-Limit Texas Hold'em)设计。2019年,Pluribus在《科学》杂志上发表的研究中宣称,它在与15名人类顶尖扑克选手的5000手牌对局中取得了显著胜率,成为首个在多人(超过两人)扑克中击败人类精英的AI。
技术背景
Pluribus基于自我对弈(self-play)和蒙特卡洛树搜索(MCTS)算法,结合了深度学习和有限状态抽象。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要处理六人桌中更复杂的动态博弈,包括多对手策略、隐含赔率和诈唬频率。其核心创新在于使用“蓝图策略”(blueprint strategy)进行预计算,并在实时对局中通过搜索进行微调,从而在有限计算资源下实现高效决策。
打法风格
Pluribus的风格被描述为“激进且混合”,它经常采用非标准的下注尺度(如超池下注)和频繁的诈唬,以利用人类对手的认知偏差。例如,它会在翻牌圈用弱牌下注,在转牌圈或河牌圈转为诈唬,或者用强牌慢打以诱导对手犯错。人类选手反馈称,Pluribus的下注模式难以预测,且能快速适应对手的倾向。
公开印象与影响
Pluribus的发布引发了扑克社区的广泛讨论。一些职业选手(如Chris Ferguson)在测试后认为其策略具有启发性,但质疑其是否真正“击败”了人类,因为测试环境(如固定盲注级别、有限手牌数)与真实锦标赛存在差异。此外,Pluribus并未公开其完整代码或进行持续在线对战,因此其长期表现未经验证。尽管如此,Pluribus被视为AI在多人不完全信息博弈中的重要里程碑,推动了扑克策略研究的发展。
争议与局限
部分批评指出,Pluribus的对手并非同时在线对抗,而是分别与AI进行单挑式对局,这降低了多人博弈的复杂性。此外,AI在测试中使用了人类不常用的下注尺度(如2.5倍底池),可能利用了人类对非标准尺度的不适应。总体而言,Pluribus展示了AI在复杂博弈中的潜力,但尚未完全解决多人扑克的终极挑战。
评论 (0)
登录 后参与讨论