扑克选手
Computer poker player
美国
人工智能扑克程序,通过算法在德州扑克中击败人类顶尖选手。
1 阅读
Computer poker player 泛指通过人工智能算法进行扑克对战的程序。早期程序如 Loki 和 Poki 基于规则和博弈树搜索,而近年来的突破性系统如 Libratus 和 Pluribus 由卡内基梅隆大学团队开发,采用无限制德州扑克中的纳什均衡近似策略。
Libratus 在 2017 年与四位人类职业选手的 12 万手对局中取得显著盈利,其核心是结合反事实遗憾最小化(CFR)算法与实时子游戏求解。Pluribus 则在 2019 年成为首个在六人桌无限制德州扑克中击败人类精英的程序,通过自我对弈和有限内存搜索实现。
这些程序不依赖人类经验,而是通过大量计算找到近似最优策略,其打法包括频繁的混合下注、非直觉的诈唬与价值下注比例,以及适应对手漏洞的调整。由于是 AI,它们没有国籍或奖金记录,但被视为扑克策略研究的里程碑。
评论 (0)
|
登录 后参与讨论
相关推荐
术语
价值下注
当玩家认为自己的手牌领先于对手的跟注范围时,为了从更弱的牌中获取价值而进行的下注。
术语漏洞
指玩家在扑克策略中存在的系统性错误或弱点,导致长期输掉筹码。
术语下注
在扑克中,当前轮次第一个或后续主动向底池投入筹码的行动。
术语子游戏
在博弈论和德州扑克中,指从某个决策节点开始,后续所有可能行动和结果构成的完整博弈子结构。
术语反事实遗憾
在博弈论中,反事实遗憾是指一个玩家在特定信息集上,如果采取不同行动所能获得的收益与当前策略收益之间的差值,用于指导策略迭代优化。
术语反事实遗憾最小化
一种迭代算法,通过最小化每个决策点的反事实遗憾来逼近纳什均衡,常用于求解不完全信息博弈(如德州扑克)。
术语六人桌
指一张牌桌上最多容纳六名玩家的德州扑克游戏形式。
术语中间位置
在满人桌(通常9人或10人)中,位于枪口位置之后、劫位之前的座位,一般包括MP1和MP2两个位置。