Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖职业牌手。
Pluribus 是由 Facebook AI Research 和卡内基梅隆大学(CMU)联合开发的扑克人工智能,专注于六人桌无限注德州扑克(No-Limit Texas Hold'em)。2019年,Pluribus 在与其他AI及人类职业牌手的对战中取得了显著成果,成为首个在多人扑克游戏中击败人类顶尖选手的AI系统。
技术背景
Pluribus 基于自博弈(self-play)和蒙特卡洛树搜索(MCTS)算法,通过自我对弈不断优化策略。与之前专注于一对一(heads-up)的AI(如 Libratus)不同,Pluribus 需要处理多人对局中更复杂的动态博弈。其核心创新在于使用“蓝图策略”(blueprint strategy)结合实时搜索,在每手牌中动态调整决策。
打法风格
Pluribus 的策略以混合策略和不可预测性著称。它倾向于采用非标准的下注尺度,例如频繁使用超池下注(overbet)和非常规的加注大小,以扰乱对手的读牌。Pluribus 在翻牌前和翻牌后的范围构建上表现出极高的平衡性,使得人类对手难以利用其模式。此外,Pluribus 在诈唬和抓诈唬方面表现出色,能够根据对手的倾向动态调整。
公开印象
在2019年的测试中,Pluribus 与多名世界级职业牌手(如 Chris Ferguson、Jason Les 等)进行了超过10,000手牌的对抗,并取得了显著盈利。职业牌手普遍反映 Pluribus 的决策难以预测,且其下注模式与传统人类策略差异较大。Pluribus 的成功标志着AI在多人不完全信息博弈中的重大突破,但也引发了关于扑克未来和人类职业牌手角色的讨论。
影响与局限
Pluribus 的代码和策略细节未完全公开,但其研究成果已发表在《科学》杂志上。尽管 Pluribus 在六人桌中表现出色,但其策略是否适用于其他变体(如锦标赛或短牌)尚不明确。此外,Pluribus 的计算资源需求较高,限制了其在实时应用中的普及。
总体而言,Pluribus 是扑克AI发展史上的里程碑,展示了深度学习与博弈论在复杂策略游戏中的潜力。
评论 (0)
登录 后参与讨论
相关推荐
混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语超池下注
在有人已经下注或加注后,跟注该下注或加注的行为。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。
术语专注
在德州扑克中,指玩家在决策时集中注意力,排除干扰,以提高决策质量的心理状态。