La importancia del riesgo en el póker

Anteriormente hemos discutido cómo la mente está dividida en redes neuronales. Las conexiones formadas entre las neuronas se fortalecen al realizar acciones repetitivas y se debilitan si no se activan. Así que, si se realizan ciertas acciones constantes, gradualmente se forman y cambian las mencionadas redes neuronales. Estas redes son los cimientos de nuestra psique: todo nuestro conocimiento y habilidades residen en estas estructuras.

El aprendizaje se puede definir como cualquier cambio entre las conexiones en nuestras redes neuronales. Cada vez que una conexión se fortalece o se debilita (de cualquier manera), lo llamaremos aprendizaje (excepto los cambios causados por lesiones o agotamiento). Tal vez protestes que esta definición incluye demasiado, pero a veces las mismas redes neuronales te harán jugar peor. Si tu mente te convence de que J4o es una mano ganadora, eso ya es un cambio que muestra cómo tus neuronas interpretan J4o. ¿Y realmente queremos llamar a ese proceso aprendizaje?

Sin duda. Es esencial entender que no podemos formarnos una opinión previa sobre el aprendizaje o pensar que solo ocurre cuando estamos aprendiendo de manera seria y productiva. El conocimiento implica prueba y error, por lo que aprender acciones incorrectas es una parte inevitable y muy importante del proceso de aprendizaje, especialmente en las primeras etapas del desarrollo de las redes. Así que, para contrarrestar un mal hábito, debes aprender dos buenos.

Ahora intentemos plantear la afirmación de que existe alguna construcción neuronal ideal. Podemos llamarlo “red óptima”. Esta red es la mente de un jugador de póker perfecto: es la estructura perfecta del juego de póker. Tu propia red tiene su forma, probablemente más simple que la óptima. Si superpusieras tu estructura sobre la óptima, como si colocaras una copia sobre el original, todas tus discrepancias con el juego perfecto serían evidentes. Todo lo que queremos es entrenar nuestras redes neuronales para que estas diferencias desaparezcan.

Este entrenamiento ocurre naturalmente, ya que la forma de la red óptima genera la mayor cantidad de dinero a largo plazo, y estás condicionado por lo que te hace ganar dinero, por lo que automáticamente te atrae hacia esta forma de red. El proceso es muy similar a la selección natural. Aun así, lograrlo por completo es complicado. Si todo fuera sencillo, cualquiera que jugara millones de manos se convertiría en un gran jugador. ¿Por qué el camino se bloquea al avanzar hacia la forma óptima?

Hay muchas razones: la falta de situaciones complejas (evitar jugar en situaciones complejas), desplazamientos y malentendidos cognitivos constantes, falta de autocrítica, motivación e incentivos distintos al dinero (por ejemplo, la emoción, etc.) y a veces obstáculos de movimientos complejos (como una acción arriesgada, efectiva solo si tienes ciertas cartas, pero catastrófica de lo contrario). Todos estos obstáculos los enfrenta el aprendiz, sin que nadie lo guíe en la dirección correcta.

Por un momento, imagina que aprender póker es lo mismo que trazar un campo minado. Cuando comienzas, tu mapa del territorio del póker es muy simple, no entiendes qué es bueno o malo, todo simplemente parece un campo vacío. La realidad verdadera (la óptima, el verdadero mapa del póker) es muy compleja, pero aún no lo sabes. Simplemente ves un mapa vacío. La única manera de obtener más información y llenar tu mapa es explorando. Debes descubrir dónde se esconden las minas. Al viajar por ese territorio, descubres minas (acciones incorrectas) y zonas seguras (acciones correctas). Pero en el póker, a diferencia de un campo minado real, no perderás una extremidad al pisar una mina. Puedes perder el bote, pero se te permite seguir jugando. En el peor de los casos, empezarás a golpear la pared. Así que el póker nos anima a asumir riesgos, cometer errores. Explora tanto como sea posible, descubre qué funciona y qué no. Cuantos más datos tengas, mejor y más rápido conocerás este territorio. La forma ideal de aprender es aquella que revela el territorio frente a ti de la manera más rápida y exhaustiva.

Aprender póker es difícil. Si fuera fácil, no sería rentable. Pero entender lo que significa aprender póker (que es la formación de nuestras redes neuronales para alcanzar una estructura óptima) nos proporciona valiosas ideas. Es un camino de prueba y error, retroalimentación constante y ajuste. Al aprender, nuestro objetivo es acelerar y optimizar este proceso tanto como sea posible. Queremos aprovechar al máximo los datos disponibles, aumentar la velocidad de entrenamiento de las redes neuronales y asimilar el conocimiento adquirido de la mejor manera posible. Es completamente cierto que si no pruebas las capacidades de cualquier habilidad que tengas, no te desafías a ti mismo, no mejoras.

Hubo una vez un experimento con patinadores olímpicos. Mostró que los atletas que lograron los mejores resultados fueron aquellos que cometieron más errores durante los ensayos. En lugar de ver cometer errores como una mala señal, piénsalo como una señal de que estás elevando tu nivel de habilidad.

Así que la clave para aprender es estar dispuesto a tener una estrategia que implique mucho riesgo. Estás jugando al juego de Buscaminas, solo que tus vidas nunca se acaban. Da vueltas, comete errores. Al final, cada error es una oportunidad para obtener nueva experiencia sobre el territorio y aprovechar esta ventaja en el futuro.

Haseeb Qureshi

¿Dónde es mejor jugar al póker?