德州扑克知识库
Pluribus
扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首个在多人桌击败人类顶尖职业选手的AI系统。

0 阅读

Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人桌(超过两人)扑克中战胜人类的AI。

技术背景

Pluribus采用了一种结合自我对弈(self-play)和蒙特卡洛树搜索(MCTS)的算法。与之前的AI(如Libratus)不同,Pluribus不需要在每手牌开始时重新计算策略,而是使用一种称为“蓝图策略”的预计算策略,并在游戏过程中进行实时搜索优化。这使得Pluribus在计算资源上更加高效,能够在普通服务器上运行。

打法风格

Pluribus的打法以混合策略和平衡著称。它能够根据对手的倾向动态调整,同时保持自身策略的不可预测性。具体特点包括:

  • 频繁的过牌-加注check-raise:Pluribus在翻牌圈和转牌圈经常使用过牌-加注,给对手施加压力。
  • 小尺度下注:Pluribus倾向于使用较小的下注尺度(如底池的1/3),以控制底池并诱导对手犯错。
  • 混合下注范围:Pluribus在河牌圈的下注范围非常平衡,既包含价值牌也包含诈唬牌,使得对手难以判断。
  • 适应性强:Pluribus能够快速识别对手的弱点并加以利用,例如针对过于激进的玩家增加抓诈唬的频率。

公开印象

Pluribus的出现被视为扑克AI领域的里程碑,因为六人桌扑克比一对一扑克复杂得多,需要处理更多玩家之间的互动和隐含信息。人类职业选手在测试后普遍表示,Pluribus的打法非常“人类化”,甚至有些“狡猾”,其策略与人类顶尖选手的直觉相吻合。

影响与意义

Pluribus的成功证明了AI在复杂不完全信息博弈中的能力,其算法思想也被应用于其他领域,如网络安全和金融交易。对于扑克界而言,Pluribus推动了扑克策略的进化,许多职业选手开始研究其打法并融入自己的游戏。

局限性

尽管Pluribus在六人桌中表现出色,但它并非完美。在特定情况下,如面对极端激进的对手或非常规下注尺度时,Pluribus的应对可能不够优化。此外,Pluribus的算法依赖于预计算策略,无法像人类一样进行长期学习或适应全新环境。

评论 (0)

|

登录 后参与讨论

相关推荐