德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)联合开发的扑克人工智能,专攻六人桌无限德州扑克。2019年,Pluribus在为期12天的实验中与13名人类顶尖职业牌手进行了10,000手牌的对战,最终以显著优势获胜,成为首个在多人对战中击败人类精英的AI。

Pluribus的核心策略基于自我对弈的强化学习,结合了搜索算法和神经网络。与之前专注于一对一(heads-up)的AI不同,Pluribus需要处理六人桌中更复杂的动态,包括多对手的博弈、位置变化隐含赔率。其打法风格以混合策略著称:它会在不同情况下随机化下注尺度,避免被人类对手读透。例如,Pluribus经常采用小尺度下注(约1/3底池)来施加压力,同时也会在有利位置进行大额诈唬

Pluribus的公开印象是“冷酷而高效”。它不依赖人类直觉,而是通过计算纳什均衡近似值来决策。在实验中,人类选手评价其打法“非人类”,因为它会在看似无关紧要的牌面做出极端下注,或是在河牌圈用弱牌跟注大额下注。这种策略迫使人类选手不断调整,但往往徒劳。

值得注意的是,Pluribus并未公开其完整代码或模型,因此其具体架构和训练细节仍属保密。它的成功标志着AI在多人博弈领域的重要突破,但也引发了对扑克未来发展的讨论——部分职业选手担忧AI会改变游戏本质,而另一些人则认为它提供了学习工具。

总体而言,Pluribus是扑克AI史上的里程碑,展示了强化学习在复杂不完全信息博弈中的潜力。它的策略强调平衡与随机化,对现代扑克理论产生了深远影响。

评论 (0)

|

登录 后参与讨论

相关推荐