Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在六人桌德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。
技术背景
Pluribus基于自博弈(self-play)和蒙特卡洛树搜索(MCTS)算法,结合深度神经网络进行策略优化。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要处理六人桌中更复杂的动态博弈,包括多对手策略、位置优势和隐含赔率。
打法风格
Pluribus的风格以激进和混合策略著称。它经常采用小尺度下注(约1/3底池)来维持宽范围,并在翻牌圈频繁过牌-加注以施加压力。其关键创新之一是“不均衡下注”(unbalanced betting),即在不同情况下使用相同下注尺度但不同牌力,从而模糊对手的读牌。此外,Pluribus善于利用“反事实遗憾最小化”(CFR)来平衡诈唬和价值下注的比例,使得人类难以针对。
公开印象
在测试中,人类选手普遍反映Pluribus难以捉摸,其下注模式与传统人类策略差异显著。例如,它会在河牌圈用弱牌进行大额诈唬,也会用强牌慢打。职业选手如Chris Ferguson和Darren Elias参与了对战,并承认Pluribus在长期对局中具有明显优势。
影响与争议
Pluribus的论文发表于《Science》杂志,标志着AI在多人博弈中的重大突破。然而,其策略是否完全适用于真实锦标赛(如考虑ICM和奖金结构)仍存争议。此外,Pluribus的代码未完全公开,限制了独立验证。
总结
Pluribus证明了AI在复杂多人博弈中的潜力,其混合策略和自适应能力为扑克策略研究提供了新视角。尽管未直接参与线上或线下赛事,但其影响力已延伸至博弈论和人工智能领域。
评论 (0)
登录 后参与讨论
相关推荐
口袋对T
TT 是德州扑克中两张十(10)组成的一对,即口袋对十。
术语价值下注
当玩家认为自己的手牌领先于对手的跟注范围时,为了从更弱的牌中获取价值而进行的下注。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语过牌-加注
先过牌,待对手下注后再加注的进攻性打法。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语慢打
故意示弱以隐藏强牌,诱使对手下注或加注,从而在后续轮次中获取更大价值的策略。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语反事实遗憾
在博弈论中,反事实遗憾是指一个玩家在特定信息集上,如果采取不同行动所能获得的收益与当前策略收益之间的差值,用于指导策略迭代优化。