Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首个在多人游戏中击败人类顶尖选手的AI。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人(超过两人)不完全信息博弈中达到超人水平的AI。
技术背景
Pluribus基于自博弈(self-play)和蒙特卡洛树搜索(MCTS)算法,结合深度神经网络进行策略优化。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要应对六人桌中复杂的动态博弈,包括多对手的交互、位置变化和隐含赔率。其核心创新在于使用“蓝图策略”(blueprint strategy)结合实时搜索,在每手牌中动态调整决策。
打法风格
Pluribus的风格以激进和混合策略著称。它经常采用小尺度下注(约1/3底池),并频繁进行反主动下注(donk-bet)和过牌-加注,以扰乱对手的读牌。Pluribus倾向于在翻牌圈和转牌圈使用高频率的持续下注,但在河牌圈则更谨慎,避免过度诈唬。其策略中一个显著特点是“薄价值下注”的运用,即用边缘牌在河牌圈下注以获取微弱价值。
Pluribus的决策基于对对手范围的精确建模,它能够快速适应不同对手的倾向,并利用对手的漏洞。例如,它会在对手弃牌率过高时增加诈唬频率,而在对手跟注过多时减少诈唬。
公开印象
Pluribus的发布在扑克界和AI领域引起轰动。人类职业选手在测试后普遍反映,Pluribus的玩法“非人类”,其下注尺度和时机常常令人困惑。许多选手认为Pluribus在翻牌圈和转牌圈的表现尤其强大,但在河牌圈偶尔会出现“奇怪”的弃牌或跟注。
值得注意的是,Pluribus并未公开其完整的源代码或训练数据,因此其策略细节仍部分保密。此外,Pluribus的测试环境为固定筹码深度(100大盲)和标准六人桌规则,未涉及锦标赛或短筹码场景。
影响与局限
Pluribus证明了AI在多人不完全信息博弈中的可行性,但其策略是否适用于线上扑克中的实际玩家池仍有争议。由于AI的决策基于完美理性假设,而人类玩家存在情绪和认知偏差,Pluribus的策略可能无法直接转化为人类可学习的“最优打法”。
总体而言,Pluribus是扑克AI发展的重要里程碑,但其实际应用更多停留在学术研究层面,而非直接指导人类玩家。
评论 (0)
登录 后参与讨论
相关推荐
下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语隐含赔率
隐含赔率是指根据后续下注可能赢得的额外筹码计算的潜在赔率,用于评估是否值得跟注。
术语弃牌
玩家放弃当前手牌,不再参与该局游戏,并输掉已投入底池的筹码。
术语过牌
在扑克中,当轮到玩家行动时选择不下注,将行动权交给下一位玩家,同时保留当前手牌继续游戏。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。