Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖职业牌手。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限德州扑克人工智能。2019年,Pluribus在为期12天的实验中与13名人类职业牌手进行了10,000手牌的对战,最终以显著优势获胜,成为首个在多人扑克中击败人类精英的AI。
Pluribus的核心算法基于自我对弈和蒙特卡洛树搜索,但与传统AI不同,它并未依赖大量先验知识,而是通过自博弈学习策略。其关键创新在于“蓝图策略”与实时搜索的结合:在每手牌中,Pluribus会预先计算一个基础策略,然后根据实际牌局动态调整。这种混合方法使其在计算资源有限的情况下仍能高效决策。
在风格上,Pluribus以激进的诈唬和精准的尺度控制著称。它倾向于频繁下注,尤其是使用小尺度下注(如底池的1/3)来施加压力,同时混合过牌-加注等复杂线路。人类选手普遍反映Pluribus的玩法“非人类”,因为它能平衡极宽的范围,并在河牌圈做出难以预测的决策。
Pluribus的胜利标志着AI在博弈论领域的重要突破,但因其未公开完整代码,且实验环境为固定盲注结构,其实际应用仍有限。不过,它的策略思想已影响现代扑克教学,尤其是关于范围平衡和频率调整的讨论。
评论 (0)
登录 后参与讨论
相关推荐
过牌-加注
先过牌,待对手下注后再加注的进攻性打法。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语过牌
在扑克中,当轮到玩家行动时选择不下注,将行动权交给下一位玩家,同时保留当前手牌继续游戏。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语加注
在德州扑克中,加注是指玩家在当前下注轮中,在已有下注的基础上增加下注金额的行为。
术语诈唬
在德州扑克中,诈唬是指玩家在持弱牌时通过下注或加注来迫使对手弃牌,从而赢得底池的行为。
术语盲注结构
盲注结构是指扑克锦标赛或现金局中,小盲注和大盲注金额随时间或级别变化的设定规则。