Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在《科学》杂志上发表的研究中展示了其能力:在与15名人类顶尖扑克选手的10,000手牌对局中,Pluribus取得了显著胜率,成为首个在多人对战中击败人类精英的AI。
Pluribus的核心策略基于自我对弈和蒙特卡洛树搜索,但与传统AI不同,它不依赖大量先验知识,而是通过强化学习从零开始训练。其打法风格以混合策略著称,频繁使用下注尺度变化和诈唬,使得人类对手难以读牌。Pluribus特别擅长在翻牌后利用范围优势,通过小注额持续下注施加压力,并在河牌圈进行大额诈唬。
与单挑AI(如Libratus)相比,Pluribus需要处理更复杂的多人动态,包括牌桌位置、对手倾向和底池赔率。它采用了一种称为“抽象博弈树”的技术,将庞大的决策空间简化为可计算模型。Pluribus的公开印象是“冷酷而高效”,其决策几乎不受情绪影响,但有时会做出看似反直觉的弃牌或加注。
尽管Pluribus未参与真实赛事,但其研究对扑克策略理论产生了影响,例如强调范围平衡和频率下注的重要性。目前,Pluribus的代码未完全公开,但相关论文提供了算法框架。
评论 (0)
登录 后参与讨论
相关推荐
范围优势
范围优势是指一名玩家的起手牌范围相对于对手更强,从而在翻牌后拥有更高的胜率或更易实现其权益。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语底池赔率
底池赔率是指当前底池总额与需要跟注的金额之比,用于判断跟注是否有利可图。
术语小注
在德州扑克中,通常指翻牌前和翻牌圈的最小下注额,等于大盲注的金额。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语弃牌
玩家放弃当前手牌,不再参与该局游戏,并输掉已投入底池的筹码。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。