Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶级职业牌手。
Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶级职业牌手,成为首个在多人对战中超越人类水平的AI。
Pluribus的策略核心是结合自我对弈强化学习与受限的搜索算法。与以往AI不同,Pluribus在每手牌中仅搜索有限的未来行动,从而在计算资源有限的情况下做出接近最优的决策。其打法风格以混合策略著称,即在同一局面下随机选择不同行动,使对手难以读牌。例如,Pluribus会以一定频率在翻牌前用弱牌加注,以平衡强牌范围。
在实战中,Pluribus表现出极强的适应性和剥削性。它善于利用对手的倾向,例如针对某些玩家过度弃牌或跟注过多的弱点进行调整。同时,Pluribus的诈唬频率和尺度经过精确计算,使得人类对手难以判断其真实牌力。
Pluribus的公开印象是“冷酷而高效”,其决策过程不依赖人类直觉,而是基于数学期望。尽管Pluribus并未参与真实金钱比赛,但其研究成果对扑克策略理论产生了深远影响,推动了GTO(博弈论最优)策略在多人桌中的应用。
值得注意的是,Pluribus并非完美无缺。在特定情况下,人类顶尖选手仍能通过非标准打法制造困难。然而,Pluribus的出现标志着AI在复杂不完全信息博弈中的重大突破。
评论 (0)
登录 后参与讨论
相关推荐
过度弃牌
指玩家在面对对手的下注或加注时,弃牌频率高于理论最优策略(GTO)所建议的频率。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语行动
指玩家在牌局中的操作,包括弃牌、过牌、下注、跟注、加注或全下。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语弃牌
玩家放弃当前手牌,不再参与该局游戏,并输掉已投入底池的筹码。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。
术语剥削
利用对手策略中的弱点或倾向,调整自身打法以获取更大利润的行为。