德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖职业牌手。

0 阅读

Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限德州扑克人工智能。2019年,Pluribus在为期12天的实验中与13名人类职业牌手进行了10,000手牌的对战,最终以显著优势获胜,成为首个在多人扑克中击败人类精英的AI。

Pluribus的核心算法基于自我对弈和蒙特卡洛树搜索,但与传统AI不同,它并未依赖大量先验知识,而是通过自博弈学习策略。其关键创新在于“蓝图策略”与实时搜索的结合:在每手牌中,Pluribus会预先计算一个基础策略,然后根据实际牌局动态调整。这种混合方法使其在计算资源有限的情况下仍能高效决策。

在风格上,Pluribus以激进的诈唬和精准的尺度控制著称。它倾向于频繁下注,尤其是使用小尺度下注(如底池的1/3)来施加压力,同时混合过牌-加注等复杂线路。人类选手普遍反映Pluribus的玩法“非人类”,因为它能平衡极宽的范围,并在河牌圈做出难以预测的决策。

Pluribus的胜利标志着AI在博弈论领域的重要突破,但因其未公开完整代码,且实验环境为固定盲注结构,其实际应用仍有限。不过,它的策略思想已影响现代扑克教学,尤其是关于范围平衡和频率调整的讨论。

评论 (0)

|

登录 后参与讨论

相关推荐