德州扑克知识库
Claudico
扑克选手

Claudico

美国

Claudico 是卡内基梅隆大学开发的德州扑克人工智能,曾在2015年与四位顶尖人类牌手进行单挑比赛。

1 阅读

Claudico 是由卡内基梅隆大学(CMU)计算机科学系开发的德州扑克人工智能,旨在通过博弈论和机器学习技术挑战人类顶尖牌手。其名称来源于拉丁语“claudicare”,意为“跛行”,暗示AI在决策中的不完美但持续改进的特性。

2015年4月至5月,Claudico 在匹兹堡的 Rivers Casino 与四位顶尖人类牌手进行了为期两周的无限注德州扑克单挑比赛。人类选手包括 Doug Polk、Bjorn Li、Dong Kim 和 Jason Les,均为当时高额桌的知名玩家。比赛共进行了约8万手牌,Claudico 最终以约73.2万美元的亏损告负。然而,这一结果并非简单的失败:Claudico 在部分手牌中展现了强大的策略,尤其是在翻牌前和翻牌圈的下注模式上,其混合策略让人类选手感到棘手。

Claudico 的核心算法基于“虚拟遗憾最小化”(CFR)技术,这是一种通过自我对弈逐步逼近纳什均衡的方法。与之前的扑克AI(如 Polaris)不同,Claudico 能够处理无限注德州扑克的复杂下注结构,并实时调整策略。然而,其弱点在于对对手剥削性玩法的适应能力不足:人类选手很快发现 Claudico 在某些局面下存在模式化倾向,例如在河牌圈对特定下注尺度的反应过于保守。

尽管 Claudico 未能战胜人类,但其表现证明了AI在非完整信息博弈中的巨大潜力。比赛后,CMU 团队基于 Claudico 的经验开发了更强大的 Libratus,后者在2017年以显著优势击败了四位人类专家。Claudico 的遗产在于推动了扑克AI从理论走向实战,并为后续研究提供了关键数据。

在扑克社区中,Claudico 被视为一个里程碑式的实验。人类选手对其评价褒贬不一:有人称赞其某些决策的精确性,也有人批评其整体策略的漏洞。无论如何,Claudico 的出现加速了AI在博弈论和战略游戏中的应用,并引发了关于人类与机器在扑克中孰优孰劣的广泛讨论。

评论 (0)

|

登录 后参与讨论

相关推荐