德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖牌手。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌限注德州扑克人工智能。2019年7月,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业牌手,成为首个在多人对战中超越人类水平的AI。

Pluribus的策略基于自我对弈的强化学习,结合了搜索算法和抽象技术。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要应对多人对局中更复杂的动态。其核心创新在于使用了一种称为“持续重新求解”的实时搜索方法,在每手牌中动态调整策略,而非依赖预先计算好的策略表。

在实验中,Pluribus与人类牌手进行了10,000手牌的对抗,平均每手牌赢取约2.5个大盲注bb/100),显著高于人类顶尖水平。人类牌手包括多名WSOP金手链得主和线上高额桌常客,如Chris Ferguson、Jason Les等。

Pluribus的打法风格以混合策略和反直觉下注著称。它经常采用小尺度下注(约1/3底池),并在转牌和河牌圈频繁使用过牌-加注。其翻牌前范围较宽,但会根据对手倾向动态调整。Pluribus特别擅长在不利位置时通过过牌-加注来剥夺对手的权益,并利用“范围下注”策略在特定牌面施加压力。

值得注意的是,Pluribus并非完美无缺。在对抗中,人类牌手发现其有时会过度弃牌,尤其是在面对大尺度下注时。此外,Pluribus的策略在短码情况下可能不够优化。

Pluribus的发布标志着AI在多人博弈中的重大突破,但其策略是否完全适用于现实扑克环境仍存在争议。由于六人桌的复杂性,Pluribus的算法无法像Libratus那样公开完整细节,但FAIR团队发表了相关论文,概述了其技术框架。

总体而言,Pluribus展示了AI在非完美信息多人博弈中的潜力,但其打法风格更偏向理论最优,而非人类直觉。对于职业牌手而言,研究Pluribus的策略有助于理解GTO博弈论最优)在多人对局中的应用,但直接模仿可能因对手调整而失效。

评论 (0)

|

登录 后参与讨论

相关推荐