Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook AI研究院和卡内基梅隆大学(CMU)合作开发的扑克人工智能,专门针对六人桌无限德州扑克。2019年,Pluribus在与其他AI及人类职业选手的对抗中取得了显著成果,成为首个在多人对战中击败人类顶尖选手的AI系统。
技术背景
Pluribus采用了一种结合自我对弈和蒙特卡洛树搜索的算法。与之前专注于一对一(heads-up)的AI(如Libratus)不同,Pluribus需要处理六人桌中更复杂的动态,包括多对手策略、隐含赔率和范围平衡。其核心创新在于使用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度搜索进行微调。
打法风格
Pluribus的风格被描述为极其激进且混合。它经常采用大额下注(如底池的2-3倍),并频繁进行诈唬,同时也会用强牌慢打。人类对手指出,Pluribus善于利用“反直觉”的下注尺度,例如在河牌圈用弱牌超池下注迫使对手弃牌,或用强牌小额下注诱导跟注。此外,Pluribus在翻牌前和翻牌圈的范围非常宽,但在转牌和河牌圈会精确调整,使得对手难以读牌。
公开印象
与Pluribus对战的职业选手(如Chris Ferguson、Darren Elias)普遍认为其打法难以对付,因为它似乎没有明显的模式可循。Pluribus的决策基于大量计算,不受情绪或疲劳影响,但人类选手也注意到它偶尔会犯一些“非人类”的错误,例如在特定情况下过度诈唬。总体而言,Pluribus被视为AI在多人扑克领域的里程碑,但其策略是否完全优于人类仍有争议,因为测试样本有限。
影响与局限
Pluribus的论文发表在《科学》杂志上,引起了广泛关注。然而,由于AI的复杂性,其策略难以被人类直接模仿。此外,Pluribus仅在固定规则下运行,未考虑实际比赛中的筹码深度变化和玩家动态调整。尽管如此,Pluribus证明了在多人不完全信息博弈中,AI可以超越人类水平。
评论 (0)
登录 后参与讨论
相关推荐
筹码
扑克游戏中代表货币价值的圆形代币,用于下注、加注和支付底池。
术语过度诈唬
指玩家在诈唬时频率过高,导致其范围中诈唬组合与价值组合的比例失衡,从而被对手利用。
术语筹码深度
筹码深度指玩家在牌局中持有的筹码数量相对于当前盲注级别的大小,通常以“大盲注倍数”(BB)来衡量。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语小额下注
指下注金额明显小于底池大小,通常低于底池的50%,旨在以低成本获取信息或引诱对手跟注。
术语慢打
故意示弱以隐藏强牌,诱使对手下注或加注,从而在后续轮次中获取更大价值的策略。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语隐含赔率
隐含赔率是指根据后续下注可能赢得的额外筹码计算的潜在赔率,用于评估是否值得跟注。