扑克选手

Claudico

美国

Claudico 是卡内基梅隆大学开发的德州扑克人工智能，曾在2015年与四位顶尖人类牌手进行单挑比赛。

1 阅读

Claudico 是由卡内基梅隆大学（CMU）计算机科学系开发的德州扑克人工智能，旨在通过博弈论和机器学习技术挑战人类顶尖牌手。其名称来源于拉丁语“claudicare”，意为“跛行”，暗示AI在决策中的不完美但持续改进的特性。

2015年4月至5月，Claudico 在匹兹堡的 Rivers Casino 与四位顶尖人类牌手进行了为期两周的无限注德州扑克单挑比赛。人类选手包括 Doug Polk、Bjorn Li、Dong Kim 和 Jason Les，均为当时高额桌的知名玩家。比赛共进行了约8万手牌，Claudico 最终以约73.2万美元的亏损告负。然而，这一结果并非简单的失败：Claudico 在部分手牌中展现了强大的策略，尤其是在翻牌前和翻牌圈的下注模式上，其混合策略让人类选手感到棘手。

Claudico 的核心算法基于“虚拟遗憾最小化”（CFR）技术，这是一种通过自我对弈逐步逼近纳什均衡的方法。与之前的扑克AI（如 Polaris）不同，Claudico 能够处理无限注德州扑克的复杂下注结构，并实时调整策略。然而，其弱点在于对对手剥削性玩法的适应能力不足：人类选手很快发现 Claudico 在某些局面下存在模式化倾向，例如在河牌圈对特定下注尺度的反应过于保守。

尽管 Claudico 未能战胜人类，但其表现证明了AI在非完整信息博弈中的巨大潜力。比赛后，CMU 团队基于 Claudico 的经验开发了更强大的 Libratus，后者在2017年以显著优势击败了四位人类专家。Claudico 的遗产在于推动了扑克AI从理论走向实战，并为后续研究提供了关键数据。

在扑克社区中，Claudico 被视为一个里程碑式的实验。人类选手对其评价褒贬不一：有人称赞其某些决策的精确性，也有人批评其整体策略的漏洞。无论如何，Claudico 的出现加速了AI在博弈论和战略游戏中的应用，并引发了关于人类与机器在扑克中孰优孰劣的广泛讨论。

登录后参与讨论

Claudico

评论 (0)

相关推荐

漏洞

混合策略

下注

无限注

反事实遗憾最小化

高额桌

限注德州扑克

剥削