Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖职业选手。
Pluribus是由Facebook AI研究院和卡内基梅隆大学联合开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。
Pluribus的核心算法结合了自我对弈、蒙特卡洛树搜索和抽象技术。与之前专注于两人对战的AI(如Libratus)不同,Pluribus需要应对六人桌中更复杂的动态和隐藏信息。其策略以混合下注和频繁的诈唬著称,能够平衡价值下注和诈唬的频率,使对手难以判断。Pluribus在翻牌前和翻牌后的决策中表现出极高的适应性,能够根据对手的倾向调整策略。
在实验中,Pluribus与人类选手进行了10,000手牌的对战,平均每手牌赢得约5个大盲注。人类选手包括多名WSOP金手链得主和顶尖职业玩家,如Chris Ferguson、Darren Elias等。Pluribus的胜利标志着AI在多人博弈中的重大突破,因为六人桌的复杂性远高于两人对弈。
Pluribus的公开印象是“冷酷而高效”,其打法风格被描述为“反直觉”,经常采用非常规的下注尺寸和时机。例如,Pluribus会在某些情况下进行超池下注,或在不利位置频繁加注,这些策略在人类玩家中并不常见。然而,Pluribus的成功也引发了关于AI在扑克中应用的伦理讨论,包括在线扑克中AI作弊的风险。
尽管Pluribus并未参与真实赛事,其研究成果已发表在《科学》杂志上。目前,Pluribus的代码并未完全公开,但相关算法已被用于改进其他博弈AI。
评论 (0)
登录 后参与讨论
相关推荐
大盲注
大盲注是德州扑克中每局开始前由庄家顺时针方向第二位玩家强制下注的金额,通常是底注的两倍。
术语价值下注
当玩家认为自己的手牌领先于对手的跟注范围时,为了从更弱的牌中获取价值而进行的下注。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语金手链
世界扑克系列赛(WSOP)主赛事及部分高额赛事冠军获得的黄金手链状奖杯,是扑克界最高荣誉之一。
术语超池下注
在有人已经下注或加注后,跟注该下注或加注的行为。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。