Pluribus
美国
由Facebook AI和CMU联合开发的六人桌无限注德州扑克AI,首个在多人对战中击败人类顶尖职业选手的AI系统。
Pluribus是由Facebook AI(现Meta AI)与卡内基梅隆大学(CMU)合作开发的六人桌无限注德州扑克人工智能。2019年,Pluribus在六人桌无限注德州扑克中击败了多名人类顶尖职业选手,成为首个在多人对战中超越人类水平的AI。
技术背景
Pluribus采用了一种结合自我对弈和蒙特卡洛树搜索的算法。与之前专注于两人对决的AI(如Libratus)不同,Pluribus需要处理六人桌中更复杂的动态博弈。其核心创新在于使用了一种称为“蓝图策略”的预计算策略,并在实时游戏中通过有限深度搜索进行调整。
打法风格
Pluribus的打法以混合策略和不可预测性著称。它经常采用非标准的下注尺度,例如在翻牌圈进行超池下注,或在河牌圈进行小额下注。Pluribus还擅长使用混合范围,即同一手牌在不同情况下采取不同行动,使得对手难以读牌。此外,Pluribus在翻牌前会频繁进行3-bet和4-bet,给对手施加巨大压力。
公开印象
Pluribus的胜利被视为AI在博弈论领域的重要里程碑。与之前AI在围棋、国际象棋等完美信息游戏中的突破不同,扑克是不完美信息游戏,需要处理隐藏信息和虚张声势。Pluribus证明了AI可以在多人不完美信息博弈中达到超人类水平。
影响与争议
Pluribus的出现引发了关于AI在扑克中应用的讨论。一些职业选手认为AI的混合策略和精确计算为人类提供了学习机会,但也有人担忧AI可能被用于在线扑克作弊。Pluribus的代码和策略并未完全公开,但研究论文详细描述了其算法框架。
后续发展
Pluribus之后,Meta AI继续研究更通用的博弈AI,但未再发布针对扑克的专门系统。Pluribus的算法思想被应用于其他多智能体博弈场景,如拍卖和谈判。
评论 (0)
登录 后参与讨论
相关推荐
3Bet百分比
3Bet% 是德州扑克中衡量玩家在有机会时进行3Bet(翻牌前第三次加注)的频率的统计指标。
术语4-Bet
在翻牌前,对对手的3-Bet再次加注的行为,通常表示持有超强牌。
术语3-Bet
翻牌前或翻牌后,在有人加注后再次加注的行为,通常表示强牌或诈唬。
术语混合策略
在博弈论和扑克中,指玩家以特定概率随机选择不同行动的策略,而非固定使用单一行动。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语小额下注
指下注金额明显小于底池大小,通常低于底池的50%,旨在以低成本获取信息或引诱对手跟注。
术语行动
指玩家在牌局中的操作,包括弃牌、过牌、下注、跟注、加注或全下。
术语无限注
一种德州扑克下注结构,玩家在任何时刻可以下注任意数量的筹码,上限为当前持有筹码量。