德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。

1 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。

Pluribus的核心算法结合了自我对弈(self-play)和蒙特卡洛树搜索(MCTS),并采用了一种称为“蓝图策略”(blueprint strategy)的预计算策略,在实时决策时通过有限深度搜索进行微调。与之前专注于两人对战的AI(如Libratus)不同,Pluribus需要处理多人对局中更复杂的动态博弈,其策略强调平衡与不可预测性。

在打法风格上,Pluribus表现出几个显著特点:首先,它倾向于频繁使用下注加注,尤其是在翻牌圈和转牌圈,以施加压力并迫使对手犯错。其次,Pluribus在河牌圈的下注尺度变化较大,有时会采用超池下注overbet)来最大化价值或作为诈唬。此外,Pluribus在翻牌前会混合使用不同大小的加注,包括小额加注和标准加注,以保持范围平衡。

Pluribus的公开印象是“冷酷而高效”,其决策基于精确的数学计算,不受情绪或疲劳影响。在与人类选手的测试中,Pluribus平均每手牌赢利约5个大盲注bb/100),显著高于人类顶尖选手的通常水平。值得注意的是,Pluribus并未使用任何人类历史牌局数据进行训练,完全通过自我对弈学习策略。

Pluribus的突破性在于证明了AI在多人不完全信息博弈中也能达到超人水平,为人工智能在复杂策略游戏中的应用提供了重要参考。然而,Pluribus并未商业化,其技术细节部分公开,主要用于学术研究。

评论 (0)

|

登录 后参与讨论

相关推荐