扑克选手

Pluribus

美国

由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI，首个在多人桌击败人类顶尖职业选手的AI系统。

0 阅读

Pluribus是由Facebook人工智能实验室（FAIR）与卡内基梅隆大学（CMU）合作开发的六人桌无限注德州扑克AI。2019年，Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手，成为首个在多人桌（超过两人）扑克中战胜人类的AI。

技术背景

Pluribus采用了一种结合自我对弈（self-play）和蒙特卡洛树搜索（MCTS）的算法。与之前的AI（如Libratus）不同，Pluribus不需要在每手牌开始时重新计算策略，而是使用一种称为“蓝图策略”的预计算策略，并在游戏过程中进行实时搜索优化。这使得Pluribus在计算资源上更加高效，能够在普通服务器上运行。

打法风格

Pluribus的打法以混合策略和平衡著称。它能够根据对手的倾向动态调整，同时保持自身策略的不可预测性。具体特点包括：

频繁的过牌-加注（check-raise）：Pluribus在翻牌圈和转牌圈经常使用过牌-加注，给对手施加压力。
小尺度下注：Pluribus倾向于使用较小的下注尺度（如底池的1/3），以控制底池并诱导对手犯错。
混合下注范围：Pluribus在河牌圈的下注范围非常平衡，既包含价值牌也包含诈唬牌，使得对手难以判断。
适应性强：Pluribus能够快速识别对手的弱点并加以利用，例如针对过于激进的玩家增加抓诈唬的频率。

公开印象

Pluribus的出现被视为扑克AI领域的里程碑，因为六人桌扑克比一对一扑克复杂得多，需要处理更多玩家之间的互动和隐含信息。人类职业选手在测试后普遍表示，Pluribus的打法非常“人类化”，甚至有些“狡猾”，其策略与人类顶尖选手的直觉相吻合。

影响与意义

Pluribus的成功证明了AI在复杂不完全信息博弈中的能力，其算法思想也被应用于其他领域，如网络安全和金融交易。对于扑克界而言，Pluribus推动了扑克策略的进化，许多职业选手开始研究其打法并融入自己的游戏。

局限性

尽管Pluribus在六人桌中表现出色，但它并非完美。在特定情况下，如面对极端激进的对手或非常规下注尺度时，Pluribus的应对可能不够优化。此外，Pluribus的算法依赖于预计算策略，无法像人类一样进行长期学习或适应全新环境。

登录后参与讨论

Pluribus

技术背景

打法风格

公开印象

影响与意义

局限性

评论 (0)

相关推荐

混合策略

过牌-加注

下注

无限注

蓝图策略

过牌

六人桌

限注德州扑克