知识专题共 29 条关联内容
反事实遗憾最小化
反事实遗憾最小化 — 术语解释、相关策略与新闻
选手 24术语 5
相关术语
求解器
Solver
一种通过数学算法计算扑克最优策略的软件工具,用于分析博弈树并找到纳什均衡策略。
树构建
Tree Building
在德州扑克中,通过构建决策树来模拟和分析游戏中的各种可能行动路径,以优化策略。
迭代
Iteration
在扑克中,迭代指通过反复调整策略或模型参数来逼近最优解的过程,常见于GTO求解器或AI训练中。
反事实遗憾最小化
CFR
一种迭代算法,通过最小化每个决策点的反事实遗憾来逼近纳什均衡,常用于求解不完全信息博弈(如德州扑克)。
反事实遗憾
Counterfactual Regret
在博弈论中,反事实遗憾是指一个玩家在特定信息集上,如果采取不同行动所能获得的收益与当前策略收益之间的差值,用于指导策略迭代优化。
相关选手
Computer poker player
美国
人工智能扑克程序,通过算法在德州扑克中击败人类顶尖选手。
Cepheus
加拿大
由阿尔伯塔大学开发的扑克人工智能,在限注德州扑克中达到接近最优玩法。
Libratus
美国
卡内基梅隆大学开发的AI扑克程序,以击败人类顶尖玩家闻名。
Cepheus
加拿大
由阿尔伯塔大学开发的扑克人工智能,在限注德州扑克中首次被证明接近最优解。
Claudico
美国
Claudico 是卡内基梅隆大学开发的德州扑克人工智能,曾在2015年与四位顶尖人类牌手进行单挑比赛。
Polaris
美国
Polaris 是卡内基梅隆大学开发的限注德州扑克人工智能,以击败顶级人类选手而闻名。
Polaris
加拿大
Polaris 是阿尔伯塔大学开发的限注德州扑克人工智能,以击败顶级人类牌手而闻名。
Cepheus
加拿大
由阿尔伯塔大学开发的扑克人工智能,在限注德州扑克中达到接近最优玩法。