Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。
Pluribus的策略核心是结合自我对弈强化学习和受限纳什均衡求解。与之前专注于两人对战的AI(如Libratus)不同,Pluribus需要应对多人博弈的复杂性。它采用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度搜索进行微调。Pluribus的玩法以混合策略著称,即在同一局面下随机选择不同行动,使对手难以预测。
在公开报道中,Pluribus的风格被描述为极其激进且平衡。它经常在翻牌前进行大额加注,并在翻牌后频繁下注和加注,给对手施加巨大压力。人类选手反馈称,Pluribus善于利用位置优势,并在河牌圈做出精确的诈唬和价值下注。此外,Pluribus在多人底池中的处理尤为出色,能够根据对手数量动态调整策略。
Pluribus的胜利引发了关于AI在扑克中应用的广泛讨论。一些职业选手认为,Pluribus的玩法为人类提供了新的策略思路,尤其是在多人桌的激进打法方面。然而,也有观点指出,Pluribus的成功依赖于大量计算资源,其策略在人类比赛中难以直接复制。
值得注意的是,Pluribus并未参与任何正式扑克赛事,其成就仅限于受控实验环境。因此,它没有奖金记录或冠军头衔。Pluribus的代码和策略细节未完全公开,但其核心算法在学术界产生了深远影响,推动了多智能体强化学习的发展。
评论 (0)
登录 后参与讨论
相关推荐
价值下注
当玩家认为自己的手牌领先于对手的跟注范围时,为了从更弱的牌中获取价值而进行的下注。
术语多人底池
指有三名或更多玩家参与的底池。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语行动
指玩家在牌局中的操作,包括弃牌、过牌、下注、跟注、加注或全下。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语位置优势
在德州扑克中,指玩家因处于后位(如庄位)而获得的信息和行动上的优势。