德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。

2 阅读

Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌限注德州扑克人工智能。2019年,Pluribus在线上六人桌比赛中与15名人类顶尖职业牌手进行了10000手牌的对战,并取得了显著胜率,成为首个在多人扑克中击败人类的AI。

Pluribus的核心策略基于自我对弈和蒙特卡洛树搜索,但为了应对六人桌的复杂性,它采用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度的搜索进行微调。其打法风格以混合策略著称,即在同一局面下随机选择不同行动,使得对手难以读牌。例如,Pluribus会在翻牌前频繁加注,但在翻牌后根据底池赔率和对手范围灵活调整,有时会采用非常规的过牌-加注小注下注来制造不平衡。

与单挑AI(如Libratus)不同,Pluribus需要处理更多玩家带来的复杂交互。它特别擅长在多人底池中利用位置优势,并在河牌圈做出精确的诈唬价值下注。据公开报道,Pluribus在对抗人类时的平均赢率约为每百手牌5个大盲注,但具体数据因对手水平而异。

Pluribus的公开印象是“冷酷而高效”,其策略常被职业牌手评价为“反直觉但合理”。例如,它会在某些边缘情况下放弃强牌,而在其他情况下用弱牌激进诈唬。这种平衡性使得人类对手难以适应。

尽管Pluribus未参与任何线下赛事,但其研究成果对扑克理论产生了深远影响,尤其是在多人策略和范围构建方面。目前,Pluribus的代码未完全公开,但其核心思想已被许多扑克学习工具借鉴。

评论 (0)

|

登录 后参与讨论

相关推荐