Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook AI研究院和卡内基梅隆大学联合开发的扑克人工智能,专攻六人桌无限注德州扑克。2019年,Pluribus在一系列实验中击败了多名世界级职业选手,包括Chris Ferguson、Darren Elias和Jason Les等,成为首个在多人对战中超越人类顶尖水平的AI。
Pluribus的核心策略基于自我对弈和蒙特卡洛树搜索,但与传统AI不同,它不依赖大量预计算,而是实时进行有限前瞻。其打法风格以激进和混合策略著称:Pluribus频繁使用下注和加注,迫使对手做出困难决策,同时通过随机化行动来避免被剥削。例如,它在翻牌圈和转牌圈的下注频率远高于人类常规,且在不同牌面结构下保持平衡,使得对手难以读牌。
在公开报道中,Pluribus展现出几个显著特点:一是对底池赔率和隐含赔率的精确计算,二是善于利用位置优势,三是在河牌圈有极高的诈唬和抓诈唬能力。职业选手评价其打法“非人类”,因为Pluribus会做出一些看似反直觉但数学上最优的行动,例如在弱牌时超池下注或在强牌时慢打。
Pluribus的胜利标志着AI在非完美信息博弈中的重大突破,但它的策略并非完全可复制于人类——其计算能力和无情绪决策是核心优势。目前,Pluribus已不再公开对战,但其算法思想影响了后续扑克AI和博弈论研究。
评论 (0)
登录 后参与讨论
相关推荐
混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语底池赔率
底池赔率是指当前底池总额与需要跟注的金额之比,用于判断跟注是否有利可图。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语慢打
故意示弱以隐藏强牌,诱使对手下注或加注,从而在后续轮次中获取更大价值的策略。
术语行动
指玩家在牌局中的操作,包括弃牌、过牌、下注、跟注、加注或全下。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语隐含赔率
隐含赔率是指根据后续下注可能赢得的额外筹码计算的潜在赔率,用于评估是否值得跟注。
术语位置优势
在德州扑克中,指玩家因处于后位(如庄位)而获得的信息和行动上的优势。