La ciencia del póker: ¿qué podemos aprender de la inteligencia artificial?

Esta vez discutiremos un artículo algo diferente, cuyos autores buscan crear reglas adecuadas para el póker basándose en algoritmos de programas de aprendizaje profundo. Después del juego de inteligencia artificial Claudico y Libratus, se observó que su parte más fuerte son las decisiones en situaciones de river. Los autores del artículo buscan examinar las decisiones que toman los programas en el river y crear reglas comprensibles.

Para este experimento, se escribieron dos inteligencias artificiales idénticas que no tenían ninguna regla previa, excepto la comprensión de la fuerza de las cartas. Estas condiciones permiten descubrir nuevas formas de resolver situaciones de póker, ya que no se incluyen los conocimientos de los jugadores regulares. Los programas se entrenaron solo entre sí, jugando 100,000 partidas de Heads-Up No-Limit.

Es cierto que los autores limitaron un poco las posibilidades del juego, por lo que las conclusiones deben tomarse con cierta precaución. Las restricciones adicionales del juego fueron las siguientes:

Se analizan las manos según la fuerza propia y del oponente en situaciones de river en porcentaje (es decir, cuánto del rango del oponente se supera).
Solo se resuelven situaciones de river. Esta restricción no cambia mucho debido a la primera restricción.
Solo se analizan check/call y check/fold. Probablemente la restricción que más cambia, ya que se descartan situaciones de donk y raise.
Se juega con una baraja variable de 10 cartas. Esta restricción esencialmente no cambia nada debido a la segunda y primera restricción, solo reduce el árbol de decisiones.
Se analiza el juego en posición.

Después de 100,000 simulaciones, se observó el juego aprendido, que se presenta en un complejo árbol de decisiones:

Los autores derivan dos reglas principales del juego de la inteligencia artificial:

Si en el river la mano supera del 20% al 80% de las manos del oponente, generalmente se hace check back o se pone un tamaño pequeño de apuesta.
Si en el river la mano supera el 95% de las manos del oponente y el oponente tiene al menos el 10% de manos muy fuertes, se pone all-in.

Estas reglas son más adecuadas para el juego con shortstack, pero la idea se puede mantener. Tomar thin value en el river a menudo no traerá muchas ganancias debido a la posibilidad de ser superado. Mientras tanto, cuando se tiene al menos la segunda mano más fuerte en el river y el oponente tiene manos fuertes en su rango en tal situación, se puede poner más que el tamaño del bote o ir all-in. Por supuesto, en juegos donde hay stacks de más de 50 BB, a menudo no se disparará all-in.

Algunos aspectos secundarios del árbol de decisiones: la inteligencia artificial casi nunca va al showdown (no hace check back) si su mano no supera el 16% de las manos del oponente. Generalmente, esto serán simplemente cartas altas débiles. En tal caso, ponen al menos la mitad del bote. En otras situaciones, la inteligencia artificial elige un tamaño de apuesta muy variable. Una similitud surge solo del juego de valor fuerte: si se tiene una mano fuerte, casi siempre se pone al menos el tamaño del bote.

Por supuesto, el juego de la inteligencia artificial tiene muchas limitaciones, por lo que no se deben aceptar estas reglas sin cuestionarlas. En la mayoría de los casos, jugaremos contra jugadores más débiles o regulares de fuerza media, no contra maestros de póker de nivel super-GTO. Estas reglas deben tenerse en cuenta, pero hay que recordar que siempre traerá más ganancias el juego explotativo.

Ciencia sobre el póker: ¿Qué podemos aprender de la inteligencia artificial?

¿Dónde es mejor jugar al póker?