GTO poker ir už jo ribų: Nash Equilibrium

Game Theory Optimal o GTO en el póker se ha convertido en uno de los términos más utilizados en los últimos años. Desafortunadamente, la comprensión de este concepto entre los jugadores de póker es bastante limitada, generalmente reduciéndose a explicaciones del nivel de “buen juego” o “mal juego contra fish”. En este artículo discutiremos la base teórica del GTO.

Pokeris GTO

La teoría de juegos pertenece al campo de las ciencias matemáticas. Los juegos en este caso tienen un significado muy amplio. Esencialmente, es una teoría que analiza cualquier situación en la que los actores racionales (generalmente personas) actúan según una estrategia establecida (o predecible). Solo a partir de esta definición, no es difícil determinar la aplicación de los conceptos GTO en el póker.

TOP salas de póker

Uno de los principios más conocidos e importantes en la teoría de juegos del póker es el equilibrio de Nash (o Nash equilibrium). Muchos jugadores de póker conocen este concepto solo a partir de las tablas que son Push/Fold All in preflop. En estas tablas generalmente se indica a cuántos BB se puede empujar o hacer call All in contra un solo jugador. Por supuesto, estas tablas también se pueden hacer para un mayor número de jugadores, pero generalmente no es tan fácil (ni útil).

GTO en el póker – Equilibrio de Nash

El equilibrio de Nash apareció por primera vez en el póker en forma de las bien conocidas tablas de “preflop All in”, ya que es el estado más fácil de calcular en el juego. Cuantos menos fichas y jugadores queden, menos decisiones posibles (teóricamente) puede tomar cada uno de ellos.

Para entender mejor cómo surgió el cálculo de estas situaciones, es necesario comprender qué estado se considera equilibrio de Nash. El equilibrio de Nash es un estado del juego que se alcanza cuando existen las siguientes condiciones:

  1. Hay al menos dos jugadores.
  2. Se juega un juego no cooperativo (uno en el que los jugadores pueden ganar algo a expensas de otros).
  3. Se conocen las estrategias de todos los jugadores.
  4. Se forman estrategias tales que ningún jugador puede ganar más cambiando solo su estrategia.

El cuarto punto es el más importante en este caso. El equilibrio de Nash describe una estrategia en la que todos los jugadores juegan de manera óptima. En términos de póker, es un plan de acción tal que cambiándolo solo a él no es posible ganar más EV. En el caso del póker, el equilibrio de Nash significaría 0 EV para todos los jugadores.

Ejemplo de GTO fuera del póker
El dilema del prisionero – el ejemplo más común de la teoría de juegos

John Forbes Nash, el descubridor de este equilibrio, ha demostrado un fenómeno muy importante: la teoría de la existencia del equilibrio de Nash. Este teorema afirma que el equilibrio de Nash se puede encontrar en todos los juegos en los que la cantidad de decisiones no es infinita y las ganancias están correlacionadas con las acciones de los jugadores (o proporcionan un incentivo para crear una estrategia basada en ciertos principios). Esto significa que el equilibrio de Nash existe no solo en las tablas, sino en todo el juego de póker desde el preflop hasta la última decisión en el river. Para cualquier estrategia de póker que tenga al menos una regla, existe una solución GTO que se manifestaría como un equilibrio de Nash unilateral. La búsqueda de tales soluciones óptimas de la teoría de juegos en el póker se discutirá en la siguiente parte de este artículo. Ya es posible encontrar tales estrategias con los solvers ofrecidos. Así que, GTO no es solo para los “top top regs”.

Mitos sobre GTO y el equilibrio de Nash

Como se mencionó anteriormente, generalmente escuchamos sobre el equilibrio de Nash en el póker solo cuando hablamos de tablas preflop, y GTO solo cuando hablamos de solvers o como una estrategia muy lejana y abstracta. De hecho, estos conceptos se aplican a todos los niveles de póker.

¿Por qué primero se crearon las tablas de Nash antes de comenzar a crear y hablar sobre estrategias GTO más complejas? Primero, como es bien sabido, estas tablas son más aplicables en situaciones de tamaño de pila efectiva muy baja. Cuantas menos fichas, menos posibilidades tanto preflop como postflop. A esta razón se suma la importancia del postflop cuando se está deep. Muchos jugadores no les gusta hacer open shove con AA en cada oportunidad que se presenta.

En segundo lugar, una razón mucho más importante es la simplificación del juego. El equilibrio de Nash requiere comprender la estrategia de al menos un jugador completamente, lo cual no es realista en muchas situaciones de póker. Muchos jugadores recreativos probablemente solo tienen esbozos de una estrategia en lugar de reglas racionales de juego. Por esta razón, alcanzar el equilibrio de Nash en el póker solo fue posible simplificando el juego.

Los solvers GTO y otros programas modernos permiten calcular una estrategia que se acerca al equilibrio de Nash. Los mejores solvers, sin embargo, aún no alcanzan la perfección, pero para muchos jugadores esto no es importante. La explotabilidad promedio por bote no alcanza el 0.1%, por lo que en la práctica del póker esto no significa nada, ya que los jugadores no podrán memorizar todas las estrategias GTO posibles. El aspecto práctico y teórico más importante de GTO y los solvers es la formulación de una contrastrategia perfecta. Para cualquier estrategia de póker se puede encontrar una estrategia óptima de máximo EV. Esta estrategia será la más rentable hasta que el otro jugador la cambie.

Ejemplo de solver GTO en el póker
Ejemplo de solver GTO en el póker

Por supuesto, para comenzar incluso con las estrategias óptimas más simples, es necesario conocer el estilo de juego del oponente. Lo mejor sería conocer reglas específicas, ya que estas pueden afectar mucho el resultado final. Por ejemplo, si tuviéramos dos jugadores, uno que en posición hace cbet con top pair 100% de las veces con un tamaño de ½ del bote, y otro que en posición hace cbet solo el 50% de las veces con top pair (con mejores kickers), incluso si todas las demás reglas de su juego fueran idénticas, las estrategias óptimas serían muy diferentes.

GTO en el póker – Recalcular el equilibrio de Nash

Una de las frases más importantes que se añaden a todas estas tablas de Nash es que es un juego de póker simplificado. En él, el Small Blind solo puede hacer All in o Fold, y el Big Blind solo puede hacer Call o Fold. Los jugadores no pueden realizar ninguna otra acción como Raise y nunca pueden llegar al postflop. Esta es la razón principal por la que estas tablas siempre muestran decisiones de All in del Small Blind con 20+ BB o incluso más, aunque en la práctica generalmente no son aplicables.

Finalmente, muchas de estas tablas y decisiones se basan en los cálculos del libro Mathematics of Poker. Contrariamente a lo que muchos jugadores creen, no deberíamos aplicar ciegamente estas tablas a nuestro juego, ya que nosotros, especialmente contra jugadores recreativos, nunca alcanzaremos el equilibrio de Nash deseado con estas tablas.

Un ejemplo muy simple pero que ilustra bien la situación es un jugador que hace shove con cualquier par de cartas con 25 BB de profundidad. En este caso, las tablas no estarían ni cerca del equilibrio de Nash ni cerca del máximo EV, ya que la estrategia óptima sería diferente. La estrategia óptima permitiría hacer call más ampliamente, ya que el Small Blind estaría empujando muchas más manos malas de las que se presentan en las decisiones.

Cambios en el equilibrio de Nash

Por supuesto, en la realidad habrá muchas más desviaciones menores de la estrategia descrita en las tablas. Los jugadores de Spin n Go y HUSNG saben que en los rangos de 14-9 BB Heads Up se jugará de manera muy diferente. Algunos oponentes harán mucho limp, otros tendrán más minraise en sus rangos, y así sucesivamente. Debido a estas diferencias, siempre, bastante significativamente, diferirán los rangos óptimos de shove/fold, por lo que siempre se deben revisar estas situaciones en ICMizer, especialmente desde la perspectiva del BB. Por supuesto, en situaciones en las que solo se encuentra a un jugador una vez, puede ser necesario confiar en la intuición o en otras simplificaciones de la situación.

Este es un video muy antiguo sobre los cambios de Nash, pero ilustra bien cómo debería cambiar el juego óptimo.

Se puede confiar en las tablas de push/fold a medida que el juego se acerca a pilas efectivas de 1 BB, ya que todas las estrategias posibles se acercan al equilibrio de Nash. Excepto por la estrategia de “fold todo”, muchas estrategias con 2, 3, 4 o 5 big blinds serán casi idénticas o diferirán muy ligeramente.

Así que, en este artículo hemos discutido los fundamentos de GTO en el póker y el concepto más conocido de esta teoría, el equilibrio de Nash. En otros artículos se prestará más atención a la búsqueda de estrategias óptimas y a los principios de funcionamiento de los solvers.