Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus 是由 Facebook AI 研究团队与卡内基梅隆大学(CMU)合作开发的扑克人工智能,专注于六人桌无限德州扑克。2019年,Pluribus 在为期12天的实验中与13名人类顶尖职业选手进行了10,000手牌的对战,最终以显著优势获胜,成为首个在多人对战中击败人类精英的AI。
Pluribus 的策略核心是结合自我对弈强化学习与蒙特卡洛树搜索(MCTS)。与之前专注于两人对战的AI(如Libratus)不同,Pluribus 需要应对多人对局中更复杂的动态和隐藏信息。其关键创新在于“抽象策略”与“实时搜索”的结合:在每手牌中,Pluribus 会构建一个简化的策略树,并通过有限前瞻搜索来调整决策。
在打法风格上,Pluribus 表现出极高的侵略性和平衡性。它频繁使用下注和加注来施加压力,尤其是在翻牌圈和转牌圈。其下注尺度多样,包括小额下注和超池下注,以最大化对手的决策难度。Pluribus 还擅长混合策略,例如在相同情况下有时跟注有时加注,使对手难以读牌。
值得注意的是,Pluribus 的决策并非基于人类直觉,而是纯粹的计算结果。它不依赖对手模型,而是假设对手接近最优,从而迫使对手犯错。这种“无模型”方法使其在面对不同风格的人类选手时都能保持稳定表现。
Pluribus 的胜利引发了关于AI在扑克中应用的广泛讨论。一些职业选手认为,其策略揭示了人类在多人对局中的常见漏洞,例如过度弃牌和缺乏平衡。然而,也有观点指出,实验环境(如固定盲注结构、有限手牌数)可能限制了结论的普适性。
总体而言,Pluribus 代表了AI在非完美信息博弈中的重大突破,其技术思路对扑克策略研究具有深远影响。
评论 (0)
登录 后参与讨论
相关推荐
漏洞
指玩家在扑克策略中存在的系统性错误或弱点,导致长期输掉筹码。
术语过度弃牌
指玩家在面对对手的下注或加注时,弃牌频率高于理论最优策略(GTO)所建议的频率。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语小额下注
指下注金额明显小于底池大小,通常低于底池的50%,旨在以低成本获取信息或引诱对手跟注。
术语弃牌
玩家放弃当前手牌,不再参与该局游戏,并输掉已投入底池的筹码。
术语超池下注
在有人已经下注或加注后,跟注该下注或加注的行为。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。