Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。
Pluribus的核心算法结合了自我对弈(self-play)和蒙特卡洛树搜索(MCTS),并采用了一种称为“蓝图策略”(blueprint strategy)的预计算策略,在实时决策时通过有限深度搜索进行微调。与之前专注于两人对战的AI(如Libratus)不同,Pluribus需要处理多人对局中更复杂的动态博弈,其策略强调平衡与不可预测性。
在打法风格上,Pluribus表现出几个显著特点:首先,它倾向于频繁使用下注和加注,尤其是在翻牌圈和转牌圈,以施加压力并迫使对手犯错。其次,Pluribus在河牌圈的下注尺度变化较大,有时会采用超池下注(overbet)来最大化价值或作为诈唬。此外,Pluribus在翻牌前会混合使用不同大小的加注,包括小额加注和标准加注,以保持范围平衡。
Pluribus的公开印象是“冷酷而高效”,其决策基于精确的数学计算,不受情绪或疲劳影响。在与人类选手的测试中,Pluribus平均每手牌赢利约5个大盲注(bb/100),显著高于人类顶尖选手的通常水平。值得注意的是,Pluribus并未使用任何人类历史牌局数据进行训练,完全通过自我对弈学习策略。
Pluribus的突破性在于证明了AI在多人不完全信息博弈中也能达到超人水平,为人工智能在复杂策略游戏中的应用提供了重要参考。然而,Pluribus并未商业化,其技术细节部分公开,主要用于学术研究。
评论 (0)
登录 后参与讨论
相关推荐
大盲注
大盲注是德州扑克中每局开始前由庄家顺时针方向第二位玩家强制下注的金额,通常是底注的两倍。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语每百手大盲注
衡量扑克玩家盈利能力的标准指标,表示每100手牌赢取的大盲注数量。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。
术语超池下注
在有人已经下注或加注后,跟注该下注或加注的行为。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语限注德州扑克
一种固定下注结构的德州扑克变体,每轮下注的金额和加注次数均受严格限制。