GTO au poker et au-delà : l'équilibre de Nash

La théorie des jeux optimaux, ou GTO, est devenue l'un des termes les plus couramment utilisés au poker ces dernières années. Malheureusement, la compréhension de ce concept par les joueurs de poker est plutôt médiocre, se résumant généralement à des explications du type "bon jeu" ou "mauvais jeu contre poisson". Dans cet article, nous aborderons les fondements théoriques du GTO.
Poker GTO

La théorie des jeux fait partie des sciences mathématiques. Dans ce contexte, les jeux ont un sens très large. Il s'agit essentiellement d'une théorie qui analyse toute situation dans laquelle des acteurs rationnels (généralement des êtres humains) agissent selon une stratégie fixe (ou prévisible). A partir de cette seule définition, il est facile d'identifier Les concepts GTO au poker l'adaptation.

TOP salles de poker

L'un des principes les plus connus et les plus importants de la théorie des jeux de poker est l'équilibre de Nash. La plupart des joueurs de poker ne connaissent ce concept qu'à travers les tables Push/Fold All in preflop. Ces tables indiquent généralement le nombre de BB Disponible à l'adresse suivante tirer ou suivre All in contre un joueur. Bien sûr, il est possible de créer de tels tableaux pour un plus grand nombre de joueurs, mais ce n'est généralement pas si facile (et utile).

GTO poker - L'équilibre de Nash

L'équilibre de Nash est apparu pour la première fois au poker dans le célèbre jeu "préflop All in"Il s'agit de l'état le plus facile à calculer dans le jeu. Moins il reste de jetons et de joueurs, moins il y a de solutions possibles (théoriquement) pour chaque joueur.

Pour mieux comprendre comment le calcul de cette situation a été effectué, il est nécessaire de comprendre ce qu'est un état d'équilibre de Nash. L'équilibre de Nash est l'état du jeu qui est atteint lorsque les conditions suivantes sont réunies :

  1. Il y a au moins deux joueurs.
  2. Un jeu non coopératif (dans lequel les joueurs peuvent gagner quelque chose aux dépens des autres).
  3. Stratégies connues pour tous les joueurs.
  4. Les stratégies sont élaborées de telle sorte qu'aucun joueur ne peut gagner davantage en changeant uniquement sa stratégie.

Le quatrième point est le plus important dans ce cas. L'équilibre de Nash décrit une stratégie dans laquelle tous les joueurs jouent de manière optimale. En termes de poker, il s'agit d'un plan d'action tel qu'il est impossible de gagner plus d'EV en le modifiant. Au poker, l'équilibre de Nash signifierait 0 VE pour tous les joueurs.

Un exemple de GTO qui ne joue pas au poker
Le dilemme du prisonnier - l'exemple le plus courant de la théorie des jeux

John Forbes Nashle découvreur de cet équilibre, a prouvé un phénomène très important : le théorème de l'équilibre de Nash. Ce théorème stipule que l'équilibre de Nash peut être trouvé dans tous les jeux où le nombre de décisions n'est pas infini et où les gains sont en corrélation avec les actions des joueurs (ou incitent à développer une stratégie basée sur certains principes). Cela signifie que l'équilibre de Nash existe non seulement dans les tables, mais aussi dans l'ensemble du jeu de poker, depuis le préflop jusqu'à la dernière décision de la rivière. Pour chaque stratégie de poker comportant au moins une règle, il existe une solution GTO qui se manifesterait sous la forme d'un équilibre de Nash unilatéral. Nous aborderons la recherche de telles solutions de poker optimales en théorie des jeux dans la prochaine partie de cet article. Il est déjà possible de découvrir de telles stratégies avec les solveurs proposés. Le GTO n'est donc pas réservé aux "top top regs".

Les mythes du GTO et de l'équilibre de Nash

Comme nous l'avons déjà mentionné, au poker, nous n'entendons généralement parler de l'équilibre de Nash que dans le contexte des tables préflop, et de GTO que dans le contexte des solvers ou d'une stratégie très lointaine et abstraite. En réalité, ces concepts s'appliquent à tous les niveaux du poker.

Pourquoi les tables de Nash ont-elles été développées en premier, avant que des stratégies GTO plus complexes ne soient élaborées et discutées ? Tout d'abord, comme chacun sait, ces tables sont plus efficaces lorsque la taille du tapis est très faible. Moins il y a de jetons, moins il y a d'opportunités pré et postflop. Ceci est aggravé par l'importance du postflop au deep. De nombreux joueurs n'aiment pas ouvrir un shove AA à chaque fois qu'ils en ont l'occasion.

La deuxième raison, beaucoup plus importante, est de simplifier le jeu. L'équilibre de Nash nécessite une compréhension de la stratégie d'au moins un joueur Completce qui n'est pas réaliste dans la plupart des situations de poker. De nombreux joueurs récréatifs n'ont probablement qu'un semblant de stratégie au lieu de règles de jeu rationnelles. C'est pourquoi L'équilibre de Nash au poker ne pouvait être obtenue qu'en simplifiant le jeu.

Les solveurs GTO et d'autres applications modernes nous permettent de calculer une stratégie qui se rapproche de l'équilibre de Nash. Les meilleurs solveurs ne sont toujours pas parfaits, mais pour de nombreux joueurs, cela n'a pas d'importance. L'exploitabilité moyenne par pot est inférieure à 0,1%, ce qui ne signifie donc rien dans la pratique du poker, car les joueurs ne seront pas en mesure de mémoriser toutes les stratégies GTO possibles. L'aspect pratique et théorique le plus important des GTO et des solveurs est la formulation de la contre-stratégie parfaite. Pour toute stratégie de poker, il est possible de trouver une stratégie optimale, à valeur ajoutée maximale. Cette stratégie sera maximalement rentable jusqu'à ce qu'un autre joueur la modifie.

Exemple d'un solveur Poker GTO
Exemple d'un solveur Poker GTO

Bien entendu, même les stratégies optimales les plus simples nécessitent de connaître le style de jeu de l'adversaire pour commencer. Il serait préférable de connaître les règles spécifiques, car elles peuvent faire une grande différence dans le résultat final. Par exemple, si nous avons deux joueurs, l'un qui en position 100% a floppé une top paire cbettina ½ taille de pot, et l'autre qui en position bettina seulement 50% a floppé cbet (avec un meilleur kicker), même si toutes les autres règles du jeu sont identiques, les stratégies optimales seront très différentes.

GTO Poker - Rééquilibrage de Nash

L'une des phrases les plus importantes qui accompagnent toutes ces tables de Nash est qu'il s'agit d'un jeu de poker simplifié. Il permet à une Petite Blind de jouer uniquement All in ou Fold, et à une Grande Blind de jouer uniquement Call ou Fold. Les joueurs ne peuvent pas effectuer d'autres actions telles qu'une relance et ne peuvent jamais jouer postflop. C'est la raison principale pour laquelle ces tables affichent toujours des décisions Small Blind All in 20+ BB ou même des décisions plus élevées, même si elles ne sont généralement pas applicables dans la pratique.

Enfin, beaucoup de ces tables et solutions sont basées sur les calculs des Mathématiques du Poker. Contrairement à ce que croient de nombreux joueurs, nous ne devrions pas appliquer aveuglément ces tables à notre propre jeu, car nous n'atteindrons jamais l'équilibre de Nash souhaité avec ces tables, en particulier contre les joueurs récréatifs.

Un exemple très simple, mais bien illustré, est celui d'un joueur qui shoppe deux cartes quelconques à une profondeur de 25 BB. Dans ce cas, les tables ne seraient ni proches de l'équilibre de Nash ni proches de l'EV maximale, car la stratégie optimale serait différente. La stratégie optimale permettrait un plus large éventail d'appels, puisque le petit aveugle tirerait beaucoup plus de mauvaises mains que les solutions.

Modifications de l'équilibre de Nash

Bien sûr, dans la réalité, il y aura beaucoup plus d'écarts mineurs par rapport à la stratégie décrite dans les tableaux. Les joueurs de Spin n Go et de HUSNG savent que le Heads Up se jouera très différemment dans la fourchette 14-9 BB. Certains adversaires limperont beaucoup, d'autres auront plus de minraise dans leurs rangs, etc. En raison de ces différences, il y aura toujours une grande différence dans la fourchette optimale de shove/fold. Vous devriez donc toujours revoir ces situations sur ICMizer, en particulier du point de vue de la BB. Bien sûr, dans les situations où un joueur n'est rencontré qu'une seule fois, il peut être nécessaire d'utiliser l'intuition ou d'autres simplifications de la situation.

Il s'agit d'une très vieille vidéo sur les changements de Nash, mais elle illustre très bien comment un jeu optimal devrait changer.

On peut se fier aux tableaux push/fold lorsque le jeu se rapproche de plus en plus d'un stack effectif de 1 BB, car toutes les stratégies possibles se rapprochent de l'équilibre de Nash. À l'exception de la stratégie all-fold, la plupart des stratégies dans les 2, 3, 4 ou 5 big blinds seront presque identiques ou très légèrement différentes.

Dans cet article, nous avons donc abordé les bases de la GTO au poker et le concept le plus célèbre de cette théorie, l'équilibre de Nash. Les prochains articles se concentreront davantage sur la recherche de la stratégie optimale et les principes des solvers.