La ciencia del póquer: ¿qué podemos aprender de la inteligencia artificial?

En esta ocasión, analizaremos un artículo ligeramente diferente, en el que los autores intentan desarrollar reglas para el póquer utilizando algoritmos de aprendizaje profundo. Tras jugar al juego de inteligencia artificial Claudico y Libratus, se descubrió que la parte más fuerte del juego es la solución a las situaciones de river. Los autores de este trabajo pretenden analizar las decisiones que toman los programas en river y crear reglas comprensibles.

Para este experimento se escribieron dos inteligencias artificiales idénticas, sin más reglas predefinidas que la comprensión de la fuerza de la carta. Tales condiciones permiten descubrir nuevas formas de resolver situaciones de póquer, ya que no implican los conocimientos de los jugadores habituales. Los programas sólo aprendieron el uno del otro jugando 100 000 partidas Heads-Up No-Limit.

Es cierto que los autores han limitado en cierta medida las posibilidades del juego, por lo que las conclusiones deben tomarse con cautela. Otras limitaciones del juego son las siguientes:

  1. Las manos se analizan según su propia fuerza y la de su rival en situaciones de river en términos de porcentaje (es decir, qué parte del rango del rival se supera).
  2. Sólo se abordan las situaciones fluviales. Esta restricción no cambia mucho la primera.
  3. Sólo se analizan las situaciones de check/call y check/fold. Probablemente la restricción más cambiante, ya que se excluyen las situaciones de donk y raise.
  4. Se juega con una baraja rotatoria de 10 cartas. Esta restricción no cambia nada en principio con respecto a la segunda y la primera restricción, sino que solo reduce el árbol de decisiones.
  5. Análisis del juego de posición.

Tras 100.000 simulaciones, se observó el juego aprendido y se presentó en un complejo árbol de decisiones:

Los autores derivan dos reglas básicas del juego de la IA:

  1. Si la mano del river vence a la mano de un oponente entre 20% y 80%, se suele hacer check back o small sizing.
  2. Si la mano del river gana a 95% de las manos del oponente y el oponente tiene al menos 10% de manos muy fuertes, el jugador va all-in.

Estas reglas son más adecuadas para un juego con poco stack, pero la idea se puede mantener. Tomar poco valor en el river a menudo no traerá muchos beneficios debido a la posibilidad de ser derrotado. Mientras que cuando tienes al menos la segunda mano más fuerte en el river y tu oponente tiene manos fuertes en tu rango en esta situación, puedes apostar más que el bote o ir all-in. Por supuesto, en partidas con stacks de más de 50 BB, a menudo no tendrá que ir all-in.

Algunos puntos secundarios del árbol de decisiones: la IA casi nunca llega a un enfrentamiento (necheckbackina) si su mano no toca la mano del adversario 16%. Normalmente serán cartas altas débiles. En ese caso apostará al menos la mitad del bote. En otras situaciones, la IA elige un tamaño de apuesta muy variado. Otra característica común sólo se da en un juego de valor fuerte: si hay una mano fuerte, casi siempre se apuesta al menos el bote.

Por supuesto, la IA tiene muchas limitaciones, por lo que estas reglas no deben tomarse a la ligera. En la mayoría de los casos, jugaremos contra jugadores regulares más débiles o de fuerza media, no contra maestros del póquer de alto nivel super-GTO. Estas reglas deben tenerse en cuenta, pero recuerda que el juego explotador siempre traerá más beneficios.

¿Cuál es el mejor sitio para jugar al póquer?