德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI与CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。

Pluribus的核心算法结合了自我对弈(self-play)和蒙特卡洛树搜索(MCTS),但与传统AI不同,它不依赖完整的博弈树搜索,而是通过有限前瞻和抽象策略来决策。其关键创新在于“蓝图策略”(blueprint strategy)与实时搜索的结合:AI在离线阶段通过自我对弈生成一个基础策略,然后在实际对局中利用有限深度的搜索进行微调。

Pluribus的打法风格以混合策略和平衡下注著称。它能够根据对手的倾向动态调整,例如在面对激进玩家时更频繁地过牌-加注,而在面对保守玩家时则增加诈唬频率。Pluribus的翻牌前范围非常宽,且在不同位置采用差异化的加注尺度,使得对手难以读牌。在翻牌后,Pluribus善于利用小注额(如1/3底池)来维持宽范围,同时在大注额时代表强牌。

Pluribus的公开对局中,其最令人印象深刻的是在河牌圈的高频诈唬和薄价值下注。它经常在不利位置用中等牌力进行过牌-加注,迫使对手弃牌。此外,Pluribus在多人底池中的决策尤为出色,能够准确评估不同对手的牌力范围。

尽管Pluribus没有参加任何线下或线上锦标赛,其研究成果对扑克策略产生了深远影响。许多职业选手开始借鉴其平衡下注尺度混合策略,尤其是在六人桌游戏中。Pluribus的论文发表于《Science》杂志,详细描述了其算法架构。

需要注意的是,Pluribus并非公开可用的软件,其代码也未完全开源。因此,普通玩家无法直接使用该AI进行对局。但Pluribus的贡献在于证明了AI在多人博弈中的可行性,并为后续的扑克AI研究奠定了基础。

评论 (0)

|

登录 后参与讨论

相关推荐