Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖职业选手。
Pluribus 是由 Facebook AI Research(现 Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus 在六人桌无限注德州扑克中击败了多名人类顶尖职业选手,包括 Chris Ferguson、Darren Elias 等,成为首个在多人对战中超越人类水平的 AI。
Pluribus 的核心算法基于自我对弈和蒙特卡洛树搜索,但与传统 AI 不同,它不依赖大量的先验知识或人类策略数据。在训练过程中,Pluribus 通过不断与自身副本对弈,从零开始学习策略。其关键创新在于一种称为“蓝图策略”的预计算策略,以及实时搜索时的“受限搜索”技术,使得 AI 能够在有限计算资源下做出接近最优的决策。
在打法风格上,Pluribus 表现出高度混合和不可预测的特点。它经常采用非常规的下注尺度,例如使用超池下注(overbet)和非常小的下注,以平衡范围并给对手施加压力。Pluribus 还擅长在翻牌圈和转牌圈使用混合策略,即同一手牌在不同情况下采取不同行动,使得人类难以读牌。此外,Pluribus 在河牌圈的下注频率极高,尤其是当它持有强牌或诈唬时,其下注模式与人类职业选手有明显差异。
Pluribus 的公开印象是“冷酷无情”且“难以捉摸”。人类选手在与其对战后普遍反映,Pluribus 的决策似乎没有明显的模式,且经常在看似无关紧要的底池中投入大量筹码,迫使对手做出艰难决定。然而,Pluribus 并非完美无缺,它在某些特定局面下(如面对极小下注时的防守)可能显得过于被动,但整体上其策略的稳健性远超人类。
Pluribus 的诞生标志着 AI 在多人博弈领域的重要突破,其技术也被应用于其他多智能体系统。尽管 Pluribus 并未参与真实赛事,但其研究成果对扑克策略理论产生了深远影响,许多职业选手开始研究其打法以改进自身游戏。
评论 (0)
登录 后参与讨论
相关推荐
筹码
扑克游戏中代表货币价值的圆形代币,用于下注、加注和支付底池。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语行动
指玩家在牌局中的操作,包括弃牌、过牌、下注、跟注、加注或全下。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语下注频率
在特定情况下玩家选择下注而非过牌或弃牌的频率,通常以百分比表示。
术语超池下注
在有人已经下注或加注后,跟注该下注或加注的行为。