德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌限注德州扑克人工智能。2019年,Pluribus在《科学》杂志上发表的研究中展示了其能力:在与15名人类顶尖扑克选手的10,000手牌对局中,Pluribus取得了显著胜率,成为首个在多人对战中击败人类精英的AI。

Pluribus的核心策略基于自我对弈和蒙特卡洛树搜索,但与传统AI不同,它不依赖大量先验知识,而是通过强化学习从零开始训练。其打法风格以混合策略著称,频繁使用下注尺度变化和诈唬,使得人类对手难以读牌。Pluribus特别擅长在翻牌后利用范围优势,通过小注持续下注施加压力,并在河牌圈进行大额诈唬

与单挑AI(如Libratus)相比,Pluribus需要处理更复杂的多人动态,包括牌桌位置、对手倾向和底池赔率。它采用了一种称为“抽象博弈树”的技术,将庞大的决策空间简化为可计算模型。Pluribus的公开印象是“冷酷而高效”,其决策几乎不受情绪影响,但有时会做出看似反直觉的弃牌加注

尽管Pluribus未参与真实赛事,但其研究对扑克策略理论产生了影响,例如强调范围平衡和频率下注的重要性。目前,Pluribus的代码未完全公开,但相关论文提供了算法框架。

评论 (0)

|

登录 后参与讨论

相关推荐