La science du poker : que pouvons-nous apprendre de l'intelligence artificielle ?

Cette fois-ci, nous allons examiner un article légèrement différent, dans lequel les auteurs tentent de développer des règles pour le poker à l'aide d'algorithmes d'apprentissage profond. Après avoir joué au jeu d'intelligence artificielle Claudico et Libratus, il a été découvert que la partie la plus forte du jeu est la solution aux situations de river. Les auteurs de cet article ont pour objectif d'analyser les décisions prises par les programmes dans les situations de rivière et de créer des règles compréhensibles.

Pour cette expérience, deux intelligences artificielles identiques ont été écrites, sans règles prédéfinies autres que la compréhension de la force de la carte. De telles conditions permettent de découvrir de nouvelles façons de résoudre les situations de poker, car elles ne font pas appel aux connaissances des joueurs réguliers. Les programmes eux-mêmes n'ont appris que l'un de l'autre en jouant 100 000 parties Heads-Up No-Limit.

Il est vrai que les auteurs ont limité les possibilités du jeu dans une certaine mesure, de sorte que les conclusions doivent être prises avec un grain de sel. Les limitations supplémentaires du jeu sont les suivantes :

  1. Les mains sont analysées en fonction de leur propre force et de celle de l'adversaire dans les situations de rivière en termes de pourcentages (c'est-à-dire la part de l'éventail de l'adversaire qui est dépassée).
  2. Seules les situations concernant les rivières sont abordées. Cette restriction ne change pas grand-chose à la première restriction.
  3. Seuls les check/call et check/fold sont analysés. Il s'agit probablement de la contrainte la plus changeante, puisque les situations de donk et de raise sont exclues.
  4. Il se joue avec un jeu tournant de 10 cartes. Cette restriction ne change rien en principe par rapport à la deuxième et à la première restriction, mais réduit seulement l'arbre de décision.
  5. Analyse du jeu en position.

Après 100 000 simulations, le jeu appris est observé et présenté sous la forme d'un arbre de décision complexe :

Les auteurs tirent deux règles de base du jeu de l'IA :

  1. Si la main de la rivière bat la main d'un adversaire entre 20% et 80%, un check back ou un small sizing est généralement effectué.
  2. Si la main de la rivière bat 95% des mains de l'adversaire et que l'adversaire a au moins 10% de mains très fortes, le joueur est all-in.

Ces règles sont plus adaptées à un jeu shortstacked, mais l'idée peut être maintenue. Prendre une faible valeur à la rivière n'apportera souvent pas beaucoup de profit en raison de la possibilité d'être battu. En revanche, lorsque vous avez au moins la deuxième main la plus forte à la rivière et que votre adversaire a des mains fortes dans votre range dans cette situation, vous pouvez soit miser plus que le pot, soit faire tapis. Bien sûr, dans les jeux avec des tapis de plus de 50 BB, vous n'aurez souvent pas à faire tapis.

Quelques points secondaires de l'arbre de décision - l'IA ne va presque jamais à l'abattage (necheckbackina) si sa main ne touche pas la main de l'adversaire 16%. En général, il s'agit simplement de cartes hautes faibles. Dans ce cas, elle mise au moins la moitié du pot. Dans d'autres situations, l'IA choisit une taille de mise très variable. Un autre point commun provient uniquement d'un jeu à forte valeur ajoutée - s'il y a une main forte, il y a presque toujours une taille de mise au moins égale à celle du pot.

Bien entendu, l'IA comporte de nombreuses limites et ces règles ne doivent donc pas être prises à la légère. Dans la plupart des cas, nous jouerons contre des joueurs ordinaires plus faibles ou de force moyenne, et non contre des maîtres du poker de haut niveau super-OGT. Ces règles doivent être gardées à l'esprit, mais n'oubliez pas que le jeu d'exploitation rapportera toujours plus de bénéfices.

Quel est le meilleur endroit pour jouer au poker ?