德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶级职业牌手。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌限注德州扑克人工智能。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶级职业牌手,成为首个在多人对战中超越人类水平的AI。

Pluribus的策略核心是结合自我对弈强化学习与受限的搜索算法。与以往AI不同,Pluribus在每手牌中仅搜索有限的未来行动,从而在计算资源有限的情况下做出接近最优的决策。其打法风格以混合策略著称,即在同一局面下随机选择不同行动,使对手难以读牌。例如,Pluribus会以一定频率在翻牌前用弱牌加注,以平衡强牌范围

在实战中,Pluribus表现出极强的适应性和剥削性。它善于利用对手的倾向,例如针对某些玩家过度弃牌跟注过多的弱点进行调整。同时,Pluribus的诈唬频率和尺度经过精确计算,使得人类对手难以判断其真实牌力。

Pluribus的公开印象是“冷酷而高效”,其决策过程不依赖人类直觉,而是基于数学期望。尽管Pluribus并未参与真实金钱比赛,但其研究成果对扑克策略理论产生了深远影响,推动了GTO博弈论最优)策略在多人桌中的应用。

值得注意的是,Pluribus并非完美无缺。在特定情况下,人类顶尖选手仍能通过非标准打法制造困难。然而,Pluribus的出现标志着AI在复杂不完全信息博弈中的重大突破。

评论 (0)

|

登录 后参与讨论

相关推荐