德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook AI研究院和卡内基梅隆大学(CMU)合作开发的扑克人工智能,专门针对六人桌无限德州扑克。2019年,Pluribus在与其他AI及人类职业选手的对抗中取得了显著成果,成为首个在多人对战中击败人类顶尖选手的AI系统。

技术背景

Pluribus采用了一种结合自我对弈和蒙特卡洛树搜索的算法。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要处理六人桌中更复杂的动态,包括多对手策略、隐含赔率范围平衡。其核心创新在于使用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度搜索进行微调。

打法风格

Pluribus的风格被描述为极其激进且混合。它经常采用大额下注(如底池的2-3倍),并频繁进行诈唬,同时也会用强牌慢打。人类对手指出,Pluribus善于利用“反直觉”的下注尺度,例如在河牌圈用弱牌超池下注迫使对手弃牌,或用强牌小额下注诱导跟注。此外,Pluribus在翻牌前和翻牌圈的范围非常宽,但在转牌和河牌圈会精确调整,使得对手难以读牌。

公开印象

与Pluribus对战的职业选手(如Chris Ferguson、Darren Elias)普遍认为其打法难以对付,因为它似乎没有明显的模式可循。Pluribus的决策基于大量计算,不受情绪或疲劳影响,但人类选手也注意到它偶尔会犯一些“非人类”的错误,例如在特定情况下过度诈唬。总体而言,Pluribus被视为AI在多人扑克领域的里程碑,但其策略是否完全优于人类仍有争议,因为测试样本有限。

影响与局限

Pluribus的论文发表在《科学》杂志上,引起了广泛关注。然而,由于AI的复杂性,其策略难以被人类直接模仿。此外,Pluribus仅在固定规则下运行,未考虑实际比赛中的筹码深度变化和玩家动态调整。尽管如此,Pluribus证明了在多人不完全信息博弈中,AI可以超越人类水平。

评论 (0)

|

登录 后参与讨论

相关推荐