Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首个在多人对战中击败人类顶尖职业选手的AI系统。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)联合开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。
技术背景
Pluribus采用了一种结合自我对弈(self-play)和蒙特卡洛树搜索(MCTS)的算法。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要应对六人桌中更复杂的动态博弈。其核心创新在于使用了一种称为“蓝图策略”(blueprint strategy)的预计算策略,并在实时游戏中通过有限深度搜索进行微调。
打法风格
Pluribus的风格以激进和混合策略著称。它经常采用大额下注(overbet)和混合下注频率,使得人类对手难以判断其牌力。Pluribus特别擅长在翻牌圈和转牌圈进行持续下注,并在河牌圈根据对手反应调整策略。其打法高度平衡,几乎不存在可被利用的模式。
公开印象
Pluribus的发布在扑克界引起了巨大反响。许多职业选手在测试后表示,Pluribus的玩法与人类顶尖选手截然不同,其某些下注模式甚至被认为是“反直觉”的。然而,也有选手指出,Pluribus在特定情况下(如面对极端松凶玩家时)可能存在弱点。总体而言,Pluribus被视为AI在非完全信息博弈领域的重要里程碑。
影响与意义
Pluribus的成功证明了AI在多人博弈中的潜力,其算法思想已被应用于其他领域,如网络安全和金融交易。在扑克领域,Pluribus推动了策略分析工具的发展,许多职业选手开始借鉴其混合下注策略。
评论 (0)
登录 后参与讨论
相关推荐
混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语下注频率
在特定情况下玩家选择下注而非过牌或弃牌的频率,通常以百分比表示。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。
术语专注
在德州扑克中,指玩家在决策时集中注意力,排除干扰,以提高决策质量的心理状态。