德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖职业牌手。

0 阅读

Pluribus 是由 Facebook AI Research 和卡内基梅隆大学(CMU)联合开发的扑克人工智能,专注六人桌限注德州扑克(No-Limit Texas Hold'em)。2019年,Pluribus 在与其他AI及人类职业牌手的对战中取得了显著成果,成为首个在多人扑克游戏中击败人类顶尖选手的AI系统。

技术背景

Pluribus 基于自博弈(self-play)和蒙特卡洛树搜索(MCTS)算法,通过自我对弈不断优化策略。与之前专注于一对一(heads-up)的AI(如 Libratus)不同,Pluribus 需要处理多人对局中更复杂的动态博弈。其核心创新在于使用“蓝图策略”(blueprint strategy)结合实时搜索,在每手牌中动态调整决策。

打法风格

Pluribus 的策略以混合策略和不可预测性著称。它倾向于采用非标准的下注尺度,例如频繁使用超池下注overbet)和非常规的加注大小,以扰乱对手的读牌。Pluribus 在翻牌前和翻牌后的范围构建上表现出极高的平衡性,使得人类对手难以利用其模式。此外,Pluribus 在诈唬和抓诈唬方面表现出色,能够根据对手的倾向动态调整。

公开印象

在2019年的测试中,Pluribus 与多名世界级职业牌手(如 Chris Ferguson、Jason Les 等)进行了超过10,000手牌的对抗,并取得了显著盈利。职业牌手普遍反映 Pluribus 的决策难以预测,且其下注模式与传统人类策略差异较大。Pluribus 的成功标志着AI在多人不完全信息博弈中的重大突破,但也引发了关于扑克未来和人类职业牌手角色的讨论。

影响与局限

Pluribus 的代码和策略细节未完全公开,但其研究成果已发表在《科学》杂志上。尽管 Pluribus 在六人桌中表现出色,但其策略是否适用于其他变体(如锦标赛或短牌)尚不明确。此外,Pluribus 的计算资源需求较高,限制了其在实时应用中的普及。

总体而言,Pluribus 是扑克AI发展史上的里程碑,展示了深度学习与博弈论在复杂策略游戏中的潜力。

评论 (0)

|

登录 后参与讨论

相关推荐