Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首次在多人对战中击败人类顶尖选手。
Pluribus是由Facebook人工智能实验室(FAIR)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克AI。2019年,Pluribus在六人桌无限注德州扑克中击败了15名人类顶尖职业选手,成为首个在多人对战中达到超人类水平的AI。
Pluribus的策略核心是“蓝图策略”与实时搜索的结合。它通过自我对弈预先计算出一个基础策略,然后在实际对局中利用有限深度搜索(类似AlphaGo的蒙特卡洛树搜索)进行实时调整。与以往AI不同,Pluribus在每手牌中只搜索部分决策点,从而在计算资源有限的情况下实现高效决策。
Pluribus的打法风格以激进和平衡著称。它频繁使用下注和加注,迫使对手在压力下犯错。同时,Pluribus善于利用混合策略,即对同一手牌在不同情况下采取不同行动,使得对手难以读牌。例如,它有时会用强牌慢打,有时用弱牌诈唬,保持行动不可预测。
在公开测试中,Pluribus平均每手牌盈利约5个大盲注(bb/100),远超人类顶尖选手的通常水平。人类选手评价其打法“非人类”,因为它能做出一些看似奇怪但长期有利的决策,例如在不利位置用弱牌跟注,或在河牌圈用中等牌力超额下注。
Pluribus的突破在于证明了AI在多人博弈中也能超越人类,而此前多人博弈因复杂性被认为是AI的难点。它的成功推动了扑克AI研究,也为其他多智能体博弈(如拍卖、谈判)提供了思路。
尽管Pluribus未参加正式扑克赛事,但其成果在学术界和扑克界引起轰动。它展示了AI在信息不完整博弈中的潜力,同时也引发了对扑克未来发展的讨论——AI是否将改变人类对策略的理解。
评论 (0)
登录 后参与讨论
相关推荐
大盲注
大盲注是德州扑克中每局开始前由庄家顺时针方向第二位玩家强制下注的金额,通常是底注的两倍。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语每百手大盲注
衡量扑克玩家盈利能力的标准指标,表示每100手牌赢取的大盲注数量。
术语慢打
故意示弱以隐藏强牌,诱使对手下注或加注,从而在后续轮次中获取更大价值的策略。
术语行动
指玩家在牌局中的操作,包括弃牌、过牌、下注、跟注、加注或全下。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。
术语蓝图策略
一种在特定扑克局面中预先设计好的、高度优化的标准打法,通常基于数学计算和对手模型,旨在最大化期望值。