Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首个在多人桌击败人类顶尖职业选手的AI。
Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限德州扑克AI。2019年,Pluribus在六人桌无限德州扑克中击败了15名人类顶尖职业选手,成为首个在多人桌(超过两人)扑克中战胜人类精英的AI。
Pluribus采用了一种结合自我对弈和蒙特卡洛树搜索的算法,其核心创新在于使用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度搜索进行微调。与之前的AI(如Libratus)不同,Pluribus不需要在每手牌中搜索整个游戏树,而是利用抽象和采样技术,使得计算效率大幅提升。
在风格上,Pluribus表现出非常规的混合策略,例如频繁地使用小尺度下注和过牌-加注,以及在不同情况下混合使用多种下注尺度。它善于利用对手的倾向,并能够通过随机化策略来避免被剥削。人类选手普遍反映Pluribus的玩法难以预测,且经常在河牌圈做出令人意外的决策。
Pluribus的胜利标志着AI在多人博弈中的重大突破,因为六人桌扑克的不完美信息特性比一对一扑克更为复杂。该研究发表在《科学》杂志上,引起了广泛关注。尽管Pluribus并未参加正式赛事,但其在测试中展现的水平被认为远超人类。
评论 (0)
登录 后参与讨论
相关推荐
混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语过牌-加注
先过牌,待对手下注后再加注的进攻性打法。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语过牌
在扑克中,当轮到玩家行动时选择不下注,将行动权交给下一位玩家,同时保留当前手牌继续游戏。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语剥削
利用对手策略中的弱点或倾向,调整自身打法以获取更大利润的行为。
术语下注尺度
指玩家在扑克下注轮中选择的下注金额大小,通常以底池百分比或具体筹码数表示。