Cette fois, nous discuterons d'un article un peu différent, dont les auteurs cherchent à créer des règles adaptées au poker en se basant sur les algorithmes des programmes d'apprentissage profond. Après les parties jouées par les intelligences artificielles Claudico et Libratus, il a été observé que leur point fort réside dans les décisions prises lors des situations de river. Les auteurs de l'article cherchent à examiner les décisions prises par les programmes sur la river et à créer des règles compréhensibles.
Pour cet expériment, deux intelligences artificielles identiques ont été écrites, sans aucune règle préalable, à l'exception de la compréhension de la force des cartes. De telles conditions permettent de découvrir de nouvelles façons de résoudre les situations de poker, car les connaissances des joueurs réguliers ne sont pas incluses. Les programmes eux-mêmes n'ont appris qu'en jouant l'un contre l'autre, en disputant 100 000 parties de Heads-Up No-Limit.
Cependant, les auteurs ont quelque peu limité les possibilités de jeu, donc les conclusions doivent être prises avec une certaine prudence. Les restrictions supplémentaires du jeu étaient les suivantes :
- Les mains sont analysées en fonction de leur force et de celle de l'adversaire dans les situations de river en pourcentage (c'est-à-dire combien de la partie du range de l'adversaire est battue).
- Seules les situations de river sont résolues. Cette restriction ne change pas beaucoup en raison de la première restriction.
- Seuls le check/call et le check/fold sont analysés. Probablement la restriction la plus changeante, car les situations de donk et de raise sont exclues.
- Le jeu se fait avec un deck de 10 cartes variables. Cette restriction ne change essentiellement rien en raison des deuxième et première restrictions, elle réduit simplement l'arbre de décision.
- Le jeu en position est analysé.
Après 100 000 simulations, le jeu appris a été observé, présenté dans un arbre de décision complexe :
Les auteurs tirent deux règles principales du jeu de l'intelligence artificielle :
- Si la main bat entre 20% et 80% des mains de l'adversaire sur la river, un check back ou une petite mise est généralement effectué.
- Si la main bat 95% des mains de l'adversaire sur la river et que l'adversaire a au moins 10% de mains très fortes, un all-in est effectué.
Ces règles sont plus adaptées au jeu shortstacked, mais l'idée peut être maintenue. Prendre une thin value sur la river n'apportera souvent pas beaucoup de profit en raison de la possibilité d'être battu. En revanche, lorsqu'on a au moins la deuxième main la plus forte sur la river et que l'adversaire a des mains fortes dans son range dans une telle situation, on peut miser plus que le pot ou aller all-in. Bien sûr, dans les jeux où les stacks sont supérieurs à 50 BB, il sera souvent inutile de tirer un all-in.
Quelques éléments secondaires de l'arbre de décision – l'intelligence artificielle ne va presque jamais au showdown (ne checkback pas) si sa main ne bat pas 16% des mains de l'adversaire. En général, ce seront simplement des cartes hautes faibles. Dans ce cas, ils misent au moins la moitié du pot. Dans d'autres situations, l'intelligence artificielle choisit une taille de mise très variable. Une certaine généralité n'apparaît que dans le jeu de value forte – si une main forte est détenue, au moins une mise de la taille du pot est presque toujours effectuée.
Bien sûr, le jeu de l'intelligence artificielle a de nombreuses restrictions, il ne faut donc pas prendre ces règles à la légère. Dans la plupart des cas, nous jouerons contre des joueurs réguliers plus faibles ou de force moyenne, pas contre des maîtres du poker super-GTO de haut niveau. Ces règles doivent être gardées à l'esprit, mais il faut se rappeler que le jeu exploitant apportera toujours plus de profit.