单击游戏交流网

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 176|回复: 0

游戏策略

[复制链接]

2

主题

2

帖子

6

积分

新手上路

Rank: 1

积分
6
发表于 2022-12-28 13:46:33 | 显示全部楼层 |阅读模式

由 德扑科学家团队 撰写
中国区合作伙伴 Oishi 翻译

在无限德州扑克中,可能有超过 10^165 种不同的游戏情况 [1]。这超过了整个宇宙中原子总数(约 10^80)。要计算这种大小的 GTO 游戏策略,需要一台具有 10^49 yottabytes RAM [2] 的机器。
为了利用我们可调用的计算能力解决这个问题,应用了各种抽象算法途径让原本的游戏转换为更简单的游戏。这些算法对游戏策略的 结果EV 和实际最大 EV 之间存在差异(称为 EV 损失)有不同的影响。一些算法不会导致 EV 损失,一些会导致少量 EV 损失,还有一些会显着的 EV 损失。

到目前为止,每个 GTO 游戏策略使用的算法,都消耗了大量 EV 。在这些界限被限制的条件下,仍然产生了所谓 GTO 解决方案 - 但是本身 EV成本存在时,这些策略的质量有多高?
在过去三年中,我们制定了一个 GTO 游戏策略,其中不包含 增加 EV 成本的算法。这导致我们的策略在翻前范围、部分翻牌和转牌的解决方案以及很多河牌解决方案中尤为明显。差异与实际情况的复杂性相关,而复杂性又与博弈树中的范围情况、有效筹码和策略树设置有关。
<hr/>
分离翻牌前和翻牌后的游戏策略 – 高 EV 损失
将翻牌前和翻牌后游戏策略分开计算,这会降低计算的复杂性。计算翻前范围需要做出各种假设。包括下注尺度子集、翻牌数量和出牌数必须由用户预先定义。这些因素与翻前范围的质量高度相关。每手牌的 EV 都受到这些决定的影响。
例如:如果您只允许翻前 用较小的3-bet 尺度和翻后用较大的加注尺度,则翻前解算器会选择在其范围内用高胜率牌(如 KK/AA)更频繁地埋伏而不是开池-加注。针对所有可能在翻后场景,配置最佳下注尺度子集很重要。如果不这样做,EV成本就会增加。
<hr/>分两步计算翻牌、转牌和河牌——中高 EV 损失
同时计算翻牌和转牌,再根据需要计算河牌解决方案,会导致与一次计算整个翻牌后游戏策略时,有不同的河牌策略。原因是当独立于翻牌和转牌计算河牌时,玩家到达河牌时有固定的范围。当从头到尾计算完整的游戏计划时,在河牌回合的范围不是固定的。当范围不固定时,这允许玩家根据河牌回合行动“选择”他们的策略。总体而言,使用从翻牌到河牌一步计算的游戏策略,对应玩家在河牌回合的平均 范围EV更高。
<hr/>用 3 个步骤计算翻牌、转牌和河牌 - 高 EV 损失
与同时计算整个翻后游戏策略相比,分 三个独立步骤计算翻牌、转牌和河牌回合的策略,会导致不同的转牌和河牌策略。和上文提到的原因是一样的。使用从翻牌到河牌一步计算的游戏策略,对应玩家在转牌回合和河牌回合平均具有更高的范围 EV。
<hr/>用户为翻后定义自己的下注尺度子集——从低到高的 EV 损失
每手牌对于特定行动都有其最高的 EV,但很多手牌在采取不同行动时也有很好的 EV 。但尺度子集的设定,直接关系到未来可能延申的策略树数量,以及筹码量、SPR 和范围宽度。
另一个因素是下注尺度之间的插值。使用 40%/55%(差值为 15)的底池尺度或 40%/80%(差值为 40)的底池下注尺度子集也会影响的下注范围。最佳下注子集是范围内所有手牌都有其最大Ev的下注子集,来面对每种可能情况 [4]。我们的游戏策略,每个场景包括都包括这些下注子集,在每个节点上会选择 1 到 6 个动作。
删除一个高 EV 损失的抽象算法,会显着增加执行计算时所需的计算机 RAM 量。例如,将翻前/翻后游戏策略与一个简单的下注尺度子集连接起来,需要大约 16,000,000 GB RAM。这导致无法用家用电脑或普通虚拟机计算“最大 EV” 的GTO 游戏策略(所有抽象算法为的是更低的 EV 损失)[3]。
而扑克科学家提供了这个游戏策略。
<hr/>有效的简化游戏策略:
消除不相关的行动线(节点)使游戏计划更简单,并且不会减少玩家的范围 EV。求解器使用的纳什均衡算法,并不关心它产生的行动线 - 但玩家关心。
我们在游戏策略中添加了一个额外的算法,可以消除类似可忽略的节点。这些行动线可以忽略不计,意味着纳什均衡没有在“复杂”博弈策略和简化博弈策略之间变形。
简单说明:
该算法计算游戏策略的节点数“n”。然后它从中删除“x”个节点,
直到函数 (nx) = 0
进行第一次推导并且当纳什均衡处无偏差的条件为真时,定义有效
结果是游戏策略平均进一步简化了 41%
以上的场景,由以下等式衡量:
#nodes(简化游戏计划)/#nodes(复杂游戏计划):

德扑科学家 提出了最高 EV GTO 游戏策略,并进行了有效的简化。
特别感谢整个 扑克科学家 团队和科隆大学。
<hr/>
附录:
[1] https://arxiv.org/pdf/1510.08578.pdf
[2] https://poker.cs.ualberta.ca/publications/2013-techreport-nl-size.pdf
[3] https://www.cs.cmu.edu/~noamb/papers/15-AAMAS-Tartanian7.pdf
[4] https://papers.nips.cc/paper/2017/file/7fe1f8abaad094e0b5cb1b01d712f708-Paper.pdf

这是回答你的问题?
可以和我们保持沟通
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|单击游戏交流网

Copyright © 2001-2013 Comsenz Inc.Template by Comsenz Inc.All Rights Reserved.

Powered by Discuz!X3.4

快速回复 返回顶部 返回列表