GTO en el poker y más allá: Nash Equilibrium

Game Theory Optimal o GTO en el poker se ha convertido en uno de los términos más utilizados en los últimos años. Desafortunadamente, la comprensión de este concepto entre los jugadores de poker es bastante limitada, a menudo reduciéndose a explicaciones del nivel de “buen juego” o “mal juego vs fish”. En este artículo discutiremos la base teórica del GTO.

Poker GTO

La teoría de juegos pertenece al campo de las matemáticas. Los juegos en este caso tienen un significado muy amplio. Esencialmente, es una teoría que analiza cualquier situación en la que los actores racionales (generalmente personas) actúan según una estrategia establecida (o predecible). Solo a partir de esta definición, no es difícil determinar la aplicación de los conceptos GTO en el póker.

TOP salas de póker

Uno de los principios más conocidos e importantes en la teoría de juegos del póker es el equilibrio de Nash (o Nash equilibrium). Muchos jugadores de póker conocen este concepto solo a partir de tablas que son Push/Fold All in preflop.

En estas tablas generalmente se indica a cuántos BB se puede empujar o hacer call All in contra un solo jugador. Por supuesto, tales tablas también se pueden crear para un mayor número de jugadores, pero generalmente no es tan fácil (ni útil).

GTO en el póker – Nash equilibrium

El equilibrio de Nash apareció por primera vez en el póker en forma de tablas de “preflop All in”, ya que es el estado más fácil de calcular en el juego. Cuantos menos fichas y jugadores queden, menos decisiones posibles (teóricamente) puede implementar cada uno de ellos.

Para comprender mejor cómo surgió el cálculo de estas situaciones, es necesario entender qué estado se considera equilibrio de Nash. Nash equilibrium es un estado del juego que se alcanza cuando existen las siguientes condiciones:

  1. Hay al menos dos jugadores.
  2. Se juega un juego no cooperativo (uno en el que los jugadores pueden ganar algo a expensas de otros).
  3. Se conocen las estrategias de todos los jugadores.
  4. Se forman estrategias tales que ningún jugador puede ganar más cambiando solo su estrategia.

El cuarto punto es el más importante en este caso. Nash equilibrium describe una estrategia en la que todos los jugadores juegan de manera óptima. En términos de póker, es un plan de acción tal que cambiándolo solo a él no es posible ganar más EV.

En el caso del póker, Nash Equilibrium significaría 0 EV para todos los jugadores.

Ejemplo de GTO fuera del póker
El dilema del prisionero – el ejemplo más común de teoría de juegos

John Forbes Nash, el descubridor de este equilibrio, ha demostrado un fenómeno muy importante: la teoría de la existencia del equilibrio de Nash. Este teorema afirma que el Nash Equilibrium se puede encontrar en todos los juegos donde la cantidad de decisiones no es infinita y las ganancias correlacionan con las acciones de los jugadores (o proporcionan un incentivo para crear una estrategia basada en ciertos principios).

Esto significa que el Nash Equilibrium existe no solo en las tablas, sino en todo el juego de póker desde el preflop hasta la última decisión del river. Para cada estrategia de póker que tenga al menos una regla, existe una solución GTO que se manifestaría como un Nash equilibrium unilateral. Exploraremos la búsqueda de tales soluciones de Game Theory Optimal en la siguiente parte de este artículo.

Ya es posible encontrar tales estrategias con los solvers disponibles. Así que, GTO no es solo para los “top top regs”.

Mitos sobre GTO y Nash Equilibrium

Como se mencionó anteriormente, sobre el Nash Equilibrium en el póker generalmente solo se escucha al hablar de tablas preflop, y GTO solo al hablar de solvers o como una estrategia muy lejana y abstracta. De hecho, estos conceptos se aplican a todos los niveles del póker.

¿Por qué primero se crearon las tablas de Nash antes de comenzar a desarrollar y hablar sobre estrategias GTO más complejas? Primero, como es bien sabido, estas tablas se aplican mejor cuando el tamaño del stack efectivo es extremadamente bajo.

Cuantas menos fichas, menos posibilidades tanto pre como postflop. A esta razón se suma la importancia del postflop cuando se está deep. Muchos jugadores no les gusta hacer open shove con AA cada vez que tienen la oportunidad.

En segundo lugar, una razón mucho más importante es la simplificación del juego. Nash equilibrium requiere comprender al menos la estrategia de un jugador completamente, lo cual no es realista en muchas situaciones de póker. Muchos jugadores recreativos probablemente solo tienen esbozos de una estrategia en lugar de reglas de juego racionales. Por esta razón, alcanzar el equilibrio de Nash en el póker solo fue posible simplificando el juego.

Los solvers GTO y otros programas modernos permiten calcular una estrategia que se acerca al equilibrio de Nash. Los mejores solvers, sin embargo, todavía no alcanzan la perfección, pero para muchos jugadores eso no es importante. La explotabilidad media por bote no alcanza el 0.1%, por lo que en la práctica del póker eso no significa nada, ya que los jugadores no podrán memorizar todas las estrategias GTO posibles.

El aspecto práctico y teórico más importante de GTO y los solvers es la formulación de una contrastrategia perfecta. Para cualquier estrategia de póker se puede encontrar una estrategia óptima de máximo EV. Esta estrategia será la más rentable hasta que otro jugador la cambie.

Ejemplo de solver GTO de póker
Ejemplo de solver GTO de póker

Por supuesto, para comenzar incluso con las estrategias óptimas más simples es necesario conocer el estilo de juego del oponente. Lo mejor sería conocer reglas específicas, ya que estas pueden afectar mucho el resultado final.

Por ejemplo, si tuviéramos dos jugadores, uno que en posición hace cbet 100% del top pair con un tamaño de ½ del bote, y otro que en posición solo hace cbet 50% del top pair (con mejores kickers), incluso si todas sus otras reglas de juego fueran idénticas, las estrategias óptimas diferirían significativamente.

GTO en el póker – Recalcular el equilibrio de Nash

Una de las frases más importantes que se añaden a todas estas tablas de Nash es que es un juego de póker simplificado. En él, el Small Blind solo puede hacer All in o Fold, y el Big Blind solo puede hacer Call o Fold.

Los jugadores no pueden realizar ninguna otra acción como Raise y nunca pueden llegar al postflop. Esta es la razón principal por la que estas tablas siempre muestran decisiones de All in del Small Blind con 20+ BB o incluso más altas, aunque en la práctica generalmente no se aplican.

Finalmente, muchas de estas tablas y decisiones se crean basándose en los cálculos del libro Mathematics of Poker. Contrariamente a lo que muchos jugadores piensan, no deberíamos aplicar ciegamente estas tablas a nuestro juego, ya que nosotros, especialmente contra jugadores recreativos, nunca alcanzaremos el deseado Nash Equilibrium con esta tabla.

Un ejemplo muy simple pero que ilustra bien la situación es un jugador que hace shove con cualquier par de cartas con 25 BB deep. En tal caso, las tablas no estarían ni cerca del Nash Equilibrium ni cerca del máximo EV, ya que la estrategia óptima sería diferente.

La estrategia óptima permitiría hacer call más ampliamente, ya que el Small Blind dispararía muchas más manos malas de lo que se presenta en las soluciones.

Cambios en el equilibrio de Nash

Por supuesto, en la realidad habrá muchas más desviaciones menores de la estrategia descrita en las tablas. Los jugadores de Spin n Go y HUSNG saben que en los rangos de 14-9 BB en Heads Up se jugará de manera muy diferente. Algunos oponentes harán mucho limp, otros tendrán más minraise en sus rangos y así sucesivamente.

Debido a estas diferencias, siempre, bastante significativamente, diferirá el rango óptimo de shove/fold, por lo que siempre se debe revisar tales situaciones en ICMizer, especialmente desde la perspectiva del BB. Por supuesto, en situaciones donde el jugador se encuentra solo una vez, puede ser necesario usar la intuición u otras simplificaciones de la situación.

Este es un video muy antiguo sobre los cambios de Nash, pero ilustra perfectamente cómo debería cambiar el juego óptimo.

Se puede confiar en las tablas de push/fold a medida que el juego se acerca a 1 BB de stack efectivo, ya que todas las estrategias posibles se acercan al Nash Equilibrium. Excepto por la estrategia de “fold todo”, muchas estrategias con 2, 3, 4 o 5 big blinds serán casi idénticas o diferirán muy ligeramente.

Así que, en este artículo hemos discutido los fundamentos del GTO en el póker y el concepto más conocido de esta teoría, el Nash Equilibrium. En otros artículos se prestará más atención a la búsqueda de la estrategia óptima y a los principios de funcionamiento de los solvers.

Los mejores salones de póker en línea