德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中达到超人类水平的AI。

Pluribus的策略核心是“蓝图策略”与实时搜索的结合。它通过自我对弈预先计算出一个基础策略,然后在实际对局中利用有限深度搜索(类似AlphaGo的蒙特卡洛树搜索)进行实时调整。与以往AI不同,Pluribus在每手牌中只搜索部分决策点,从而在计算资源有限的情况下实现高效决策。

Pluribus的打法风格以激进和平衡著称。它频繁使用下注加注,迫使对手在压力下犯错。同时,Pluribus善于利用混合策略,即对同一手牌在不同情况下采取不同行动,使得对手难以读牌。例如,它有时会用强牌慢打,有时用弱牌诈唬,保持行动不可预测。

在公开测试中,Pluribus平均每手牌盈利约5个大盲注bb/100),远超人类顶尖选手的通常水平。人类选手评价其打法“非人类”,因为它能做出一些看似奇怪但长期有利的决策,例如在不利位置用弱牌跟注,或在河牌圈用中等牌力超额下注

Pluribus的突破在于证明了AI在多人博弈中也能超越人类,而此前多人博弈因复杂性被认为是AI的难点。它的成功推动了扑克AI研究,也为其他多智能体博弈(如拍卖、谈判)提供了思路。

尽管Pluribus未参加正式扑克赛事,但其成果在学术界和扑克界引起轰动。它展示了AI在信息不完整博弈中的潜力,同时也引发了对扑克未来发展的讨论——AI是否将改变人类对策略的理解。

评论 (0)

|

登录 后参与讨论

相关推荐