Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在线上六人桌比赛中与15名人类顶尖职业牌手进行了10000手牌的对战,并取得了显著胜率,成为首个在多人扑克中击败人类的AI。
Pluribus的核心策略基于自我对弈和蒙特卡洛树搜索,但为了应对六人桌的复杂性,它采用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度的搜索进行微调。其打法风格以混合策略著称,即在同一局面下随机选择不同行动,使得对手难以读牌。例如,Pluribus会在翻牌前频繁加注,但在翻牌后根据底池赔率和对手范围灵活调整,有时会采用非常规的过牌-加注或小注额下注来制造不平衡。
与单挑AI(如Libratus)不同,Pluribus需要处理更多玩家带来的复杂交互。它特别擅长在多人底池中利用位置优势,并在河牌圈做出精确的诈唬或价值下注。据公开报道,Pluribus在对抗人类时的平均赢率约为每百手牌5个大盲注,但具体数据因对手水平而异。
Pluribus的公开印象是“冷酷而高效”,其策略常被职业牌手评价为“反直觉但合理”。例如,它会在某些边缘情况下放弃强牌,而在其他情况下用弱牌激进诈唬。这种平衡性使得人类对手难以适应。
尽管Pluribus未参与任何线下赛事,但其研究成果对扑克理论产生了深远影响,尤其是在多人策略和范围构建方面。目前,Pluribus的代码未完全公开,但其核心思想已被许多扑克学习工具借鉴。
评论 (0)
登录 后参与讨论
相关推荐
大盲注
大盲注是德州扑克中每局开始前由庄家顺时针方向第二位玩家强制下注的金额,通常是底注的两倍。
术语价值下注
当玩家认为自己的手牌领先于对手的跟注范围时,为了从更弱的牌中获取价值而进行的下注。
术语多人底池
指有三名或更多玩家参与的底池。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语底池赔率
底池赔率是指当前底池总额与需要跟注的金额之比,用于判断跟注是否有利可图。
术语过牌-加注
先过牌,待对手下注后再加注的进攻性打法。
术语小注
在德州扑克中,通常指翻牌前和翻牌圈的最小下注额,等于大盲注的金额。
术语赢率
衡量玩家在扑克游戏中盈利能力的指标,通常以每百手牌赢取的大盲注数量(bb/100)表示。