德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首个在多人桌击败人类顶尖职业选手的AI。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限德州扑克AI。2019年,Pluribus在六人桌无限德州扑克中击败了15名人类顶尖职业选手,成为首个在多人桌(超过两人)扑克中战胜人类精英的AI。

Pluribus采用了一种结合自我对弈和蒙特卡洛树搜索的算法,其核心创新在于使用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度搜索进行微调。与之前的AI(如Libratus)不同,Pluribus不需要在每手牌中搜索整个游戏树,而是利用抽象和采样技术,使得计算效率大幅提升。

在风格上,Pluribus表现出非常规的混合策略,例如频繁地使用小尺度下注过牌-加注,以及在不同情况下混合使用多种下注尺度。它善于利用对手的倾向,并能够通过随机化策略来避免被剥削。人类选手普遍反映Pluribus的玩法难以预测,且经常在河牌圈做出令人意外的决策。

Pluribus的胜利标志着AI在多人博弈中的重大突破,因为六人桌扑克的不完美信息特性比一对一扑克更为复杂。该研究发表在《科学》杂志上,引起了广泛关注。尽管Pluribus并未参加正式赛事,但其在测试中展现的水平被认为远超人类。

评论 (0)

|

登录 后参与讨论

相关推荐