Claudico
美国
Claudico 是卡内基梅隆大学开发的德州扑克人工智能,曾在2015年与四位顶尖人类牌手进行单挑比赛。
Claudico 是由卡内基梅隆大学(CMU)计算机科学系开发的德州扑克人工智能,旨在通过博弈论和机器学习技术挑战人类顶尖牌手。其名称来源于拉丁语“claudicare”,意为“跛行”,暗示AI在决策中的不完美但持续改进的特性。
2015年4月至5月,Claudico 在匹兹堡的 Rivers Casino 与四位顶尖人类牌手进行了为期两周的无限注德州扑克单挑比赛。人类选手包括 Doug Polk、Bjorn Li、Dong Kim 和 Jason Les,均为当时高额桌的知名玩家。比赛共进行了约8万手牌,Claudico 最终以约73.2万美元的亏损告负。然而,这一结果并非简单的失败:Claudico 在部分手牌中展现了强大的策略,尤其是在翻牌前和翻牌圈的下注模式上,其混合策略让人类选手感到棘手。
Claudico 的核心算法基于“虚拟遗憾最小化”(CFR)技术,这是一种通过自我对弈逐步逼近纳什均衡的方法。与之前的扑克AI(如 Polaris)不同,Claudico 能够处理无限注德州扑克的复杂下注结构,并实时调整策略。然而,其弱点在于对对手剥削性玩法的适应能力不足:人类选手很快发现 Claudico 在某些局面下存在模式化倾向,例如在河牌圈对特定下注尺度的反应过于保守。
尽管 Claudico 未能战胜人类,但其表现证明了AI在非完整信息博弈中的巨大潜力。比赛后,CMU 团队基于 Claudico 的经验开发了更强大的 Libratus,后者在2017年以显著优势击败了四位人类专家。Claudico 的遗产在于推动了扑克AI从理论走向实战,并为后续研究提供了关键数据。
在扑克社区中,Claudico 被视为一个里程碑式的实验。人类选手对其评价褒贬不一:有人称赞其某些决策的精确性,也有人批评其整体策略的漏洞。无论如何,Claudico 的出现加速了AI在博弈论和战略游戏中的应用,并引发了关于人类与机器在扑克中孰优孰劣的广泛讨论。
评论 (0)
登录 后参与讨论
相关推荐
漏洞
指玩家在扑克策略中存在的系统性错误或弱点,导致长期输掉筹码。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语反事实遗憾最小化
一种迭代算法,通过最小化每个决策点的反事实遗憾来逼近纳什均衡,常用于求解不完全信息博弈(如德州扑克)。
术语高额桌
指盲注或买入金额极高的扑克牌局,通常参与者为职业牌手或富豪。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。
术语剥削
利用对手策略中的弱点或倾向,调整自身打法以获取更大利润的行为。