游戏策略

比其 · 发表于 2022-12-28 13:46:33

由德扑科学家团队撰写
中国区合作伙伴 Oishi 翻译

在无限德州扑克中，可能有超过 10^165 种不同的游戏情况 [1]。这超过了整个宇宙中原子总数（约 10^80）。要计算这种大小的 GTO 游戏策略，需要一台具有 10^49 yottabytes RAM [2] 的机器。
为了利用我们可调用的计算能力解决这个问题，应用了各种抽象算法途径让原本的游戏转换为更简单的游戏。这些算法对游戏策略的结果EV 和实际最大 EV 之间存在差异（称为 EV 损失）有不同的影响。一些算法不会导致 EV 损失，一些会导致少量 EV 损失，还有一些会显着的 EV 损失。

到目前为止，每个 GTO 游戏策略使用的算法，都消耗了大量 EV 。在这些界限被限制的条件下，仍然产生了所谓 GTO 解决方案 - 但是本身 EV成本存在时，这些策略的质量有多高？
在过去三年中，我们制定了一个 GTO 游戏策略，其中不包含增加 EV 成本的算法。这导致我们的策略在翻前范围、部分翻牌和转牌的解决方案以及很多河牌解决方案中尤为明显。差异与实际情况的复杂性相关，而复杂性又与博弈树中的范围情况、有效筹码和策略树设置有关。
<hr/>
分离翻牌前和翻牌后的游戏策略 – 高 EV 损失
将翻牌前和翻牌后游戏策略分开计算，这会降低计算的复杂性。计算翻前范围需要做出各种假设。包括下注尺度子集、翻牌数量和出牌数必须由用户预先定义。这些因素与翻前范围的质量高度相关。每手牌的 EV 都受到这些决定的影响。
例如：如果您只允许翻前用较小的3-bet 尺度和翻后用较大的加注尺度，则翻前解算器会选择在其范围内用高胜率牌（如 KK/AA）更频繁地埋伏而不是开池-加注。针对所有可能在翻后场景，配置最佳下注尺度子集很重要。如果不这样做，EV成本就会增加。
<hr/>分两步计算翻牌、转牌和河牌——中高 EV 损失
同时计算翻牌和转牌，再根据需要计算河牌解决方案，会导致与一次计算整个翻牌后游戏策略时，有不同的河牌策略。原因是当独立于翻牌和转牌计算河牌时，玩家到达河牌时有固定的范围。当从头到尾计算完整的游戏计划时，在河牌回合的范围不是固定的。当范围不固定时，这允许玩家根据河牌回合行动“选择”他们的策略。总体而言，使用从翻牌到河牌一步计算的游戏策略，对应玩家在河牌回合的平均范围EV更高。
<hr/>用 3 个步骤计算翻牌、转牌和河牌 - 高 EV 损失
与同时计算整个翻后游戏策略相比，分三个独立步骤计算翻牌、转牌和河牌回合的策略，会导致不同的转牌和河牌策略。和上文提到的原因是一样的。使用从翻牌到河牌一步计算的游戏策略，对应玩家在转牌回合和河牌回合平均具有更高的范围 EV。
<hr/>用户为翻后定义自己的下注尺度子集——从低到高的 EV 损失
每手牌对于特定行动都有其最高的 EV，但很多手牌在采取不同行动时也有很好的 EV 。但尺度子集的设定，直接关系到未来可能延申的策略树数量，以及筹码量、SPR 和范围宽度。
另一个因素是下注尺度之间的插值。使用 40%/55%（差值为 15）的底池尺度或 40%/80%（差值为 40）的底池下注尺度子集也会影响的下注范围。最佳下注子集是范围内所有手牌都有其最大Ev的下注子集，来面对每种可能情况 [4]。我们的游戏策略，每个场景包括都包括这些下注子集，在每个节点上会选择 1 到 6 个动作。
删除一个高 EV 损失的抽象算法，会显着增加执行计算时所需的计算机 RAM 量。例如，将翻前/翻后游戏策略与一个简单的下注尺度子集连接起来，需要大约 16,000,000 GB RAM。这导致无法用家用电脑或普通虚拟机计算“最大 EV” 的GTO 游戏策略（所有抽象算法为的是更低的 EV 损失）[3]。
而扑克科学家提供了这个游戏策略。
<hr/>有效的简化游戏策略：
消除不相关的行动线（节点）使游戏计划更简单，并且不会减少玩家的范围 EV。求解器使用的纳什均衡算法，并不关心它产生的行动线 - 但玩家关心。
我们在游戏策略中添加了一个额外的算法，可以消除类似可忽略的节点。这些行动线可以忽略不计，意味着纳什均衡没有在“复杂”博弈策略和简化博弈策略之间变形。
简单说明：
该算法计算游戏策略的节点数“n”。然后它从中删除“x”个节点，
直到函数 (nx) = 0
进行第一次推导并且当纳什均衡处无偏差的条件为真时，定义有效
结果是游戏策略平均进一步简化了 41%
以上的场景，由以下等式衡量：
#nodes（简化游戏计划）/#nodes（复杂游戏计划）：

德扑科学家提出了最高 EV GTO 游戏策略，并进行了有效的简化。
特别感谢整个扑克科学家团队和科隆大学。
<hr/>
附录：
[1] https://arxiv.org/pdf/1510.08578.pdf
[2] https://poker.cs.ualberta.ca/publications/2013-techreport-nl-size.pdf
[3] https://www.cs.cmu.edu/~noamb/papers/15-AAMAS-Tartanian7.pdf
[4] https://papers.nips.cc/paper/2017/file/7fe1f8abaad094e0b5cb1b01d712f708-Paper.pdf

这是回答你的问题？
可以和我们保持沟通

		自动登录	找回密码
密码			立即注册