GTO dans le poker et au-delà : Nash Equilibrium

Game Theory Optimal ou GTO dans le poker est devenu l'un des termes les plus couramment utilisés ces dernières années. Malheureusement, la compréhension de ce concept parmi les joueurs de poker est assez limitée, se résumant souvent à des explications du type "bon jeu" ou "mauvais jeu contre fish". Dans cet article, nous discuterons des bases théoriques du GTO.

Pokeris GTO

La théorie des jeux appartient au domaine des sciences mathématiques. Les jeux, dans ce cas, ont un sens très large. Essentiellement, c'est une théorie qui analyse toutes les situations où des acteurs rationnels (généralement des personnes) agissent selon une stratégie définie (ou prévisible). Rien qu'à partir de cette définition, il est facile de déterminer l'application des concepts GTO dans le poker.

TOP salles de poker

L'un des principes les plus connus et les plus importants de la théorie des jeux de poker est l'équilibre de Nash (ou Nash equilibrium). De nombreux joueurs de poker connaissent ce concept uniquement à partir des tableaux Push/Fold All in preflop.

Ces tableaux indiquent généralement à combien de BB il est possible de pousser ou de caller All in contre un seul joueur. Bien sûr, de tels tableaux peuvent être établis pour un plus grand nombre de joueurs, mais ce n'est généralement pas aussi facile (et utile).

GTO dans le poker – Nash equilibrium

L'équilibre de Nash est apparu pour la première fois dans le poker sous la forme bien connue des tableaux “preflop All in”, car c'est l'état le plus facilement calculable dans le jeu. Moins il reste de jetons et de joueurs, moins il y a de décisions possibles (théoriquement) que chacun d'eux peut prendre.

Pour mieux comprendre comment le calcul de ces situations est apparu, il faut comprendre quel état est considéré comme un équilibre de Nash. L'équilibre de Nash est un état de jeu atteint lorsque les conditions suivantes existent :

  1. Il y a au moins deux joueurs.
  2. Le jeu est non coopératif (c'est-à-dire que les joueurs peuvent gagner quelque chose aux dépens des autres).
  3. Les stratégies de tous les joueurs sont connues.
  4. Des stratégies sont formées de telle sorte qu'aucun joueur ne peut gagner plus en changeant uniquement sa propre stratégie.

Le quatrième point est le plus important dans ce cas. L'équilibre de Nash décrit une stratégie où tous les joueurs jouent de manière optimale. En termes de poker, c'est un plan d'action tel qu'en le changeant uniquement, il est impossible de gagner plus d'EV.

Dans le cas du poker, l'équilibre de Nash signifierait 0 EV pour tous les joueurs.

GTO pavyzdys ne pokeryje
Le dilemme du prisonnier – l'exemple le plus courant de la théorie des jeux

John Forbes Nash, le découvreur de cet équilibre, a prouvé un phénomène très important – la théorie de l'existence de l'équilibre de Nash. Ce théorème affirme que l'équilibre de Nash peut être trouvé dans tous les jeux où le nombre de décisions n'est pas infini et où les gains sont corrélés aux actions des joueurs (ou incitent à créer une stratégie basée sur certains principes).

Cela signifie que l'équilibre de Nash existe non seulement dans les tableaux, mais dans tout le jeu de poker, du preflop à la dernière décision de la rivière. Pour chaque stratégie de poker ayant au moins une règle, il existe une solution GTO qui se manifesterait comme un équilibre de Nash unilatéral. Nous discuterons de la recherche de telles solutions Game Theory Optimal dans la prochaine partie de cet article.

Il est déjà possible de découvrir de telles stratégies avec les solveurs proposés. Ainsi, le GTO n'est pas seulement pour les “top top regs”.

Mythes sur le GTO et l'équilibre de Nash

Comme mentionné précédemment, on entendra généralement parler de l'équilibre de Nash dans le poker uniquement en parlant des tableaux preflop, et du GTO uniquement en parlant de solveurs ou comme d'une stratégie très lointaine et abstraite. En réalité, ces concepts s'appliquent à tous les niveaux de poker.

Pourquoi les tableaux de Nash ont-ils été créés en premier avant de commencer à créer et à parler de stratégies GTO plus complexes ? Tout d'abord, comme on le sait bien, ces tableaux sont les mieux adaptés aux tailles de stack effectives très faibles.

Moins il y a de jetons, moins il y a de possibilités tant preflop que postflop. À cette raison s'ajoute l'importance du postflop lorsqu'on est deep. De nombreux joueurs nem aiment pas open shove AA à chaque occasion.

Deuxièmement, une raison beaucoup plus importante est la simplification du jeu. L'équilibre de Nash nécessite de comprendre au moins une stratégie de joueur complètement, ce qui n'est pas réaliste dans de nombreuses situations de poker. De nombreux joueurs récréatifs ont probablement seulement des ébauches de stratégie au lieu de règles de jeu rationnelles. Pour cette raison, l'équilibre de Nash dans le poker ne pouvait être atteint qu'en simplifiant le jeu.

Les solveurs GTO et d'autres programmes modernes permettent de calculer une stratégie qui s'approche de l'équilibre de Nash. Les meilleurs solveurs, cependant, n'atteignent toujours pas la perfection, mais pour de nombreux joueurs, cela n'a pas d'importance. L'exploitabilité moyenne par pot ne dépasse pas 0,1 %, donc en pratique de poker, cela ne signifie rien, car les joueurs ne seront pas capables de mémoriser toutes les stratégies GTO possibles.

L'aspect pratique et théorique le plus important du GTO et des solveurs est la formulation d'une contre-stratégie parfaite. Pour toute stratégie de poker, il est possible de trouver une stratégie optimale, de maximum EV. Cette stratégie sera la plus rentable tant que l'autre joueur ne la changera pas.

Pokerio GTO solverio pavyzdys
Exemple de solveur GTO de poker

Bien sûr, pour commencer même les stratégies optimales les plus simples, il est nécessaire de connaître le style de jeu de l'adversaire. Il serait préférable de connaître des règles spécifiques, car celles-ci peuvent très fortement influencer le résultat final.

Par exemple, si nous avions deux joueurs, l'un qui en position floppe 100 % du temps une top pair en cbettant à ½ pot size, et l'autre qui en position bette seulement 50 % du temps une top pair cbet (avec de meilleurs kickers), même si toutes leurs autres règles de jeu sont identiques, les stratégies optimales différeront fortement.

GTO dans le poker – recalcul de l'équilibre de Nash

L'une des phrases les plus importantes ajoutées à tous ces tableaux de Nash est qu'il s'agit d'un jeu de poker simplifié. Dans celui-ci, le Small Blind ne peut faire que All in ou Fold, et le Big Blind ne peut que Call ou Fold.

Les joueurs ne peuvent effectuer aucune autre action telle que Raise et ne peuvent jamais aller au postflop. C'est la principale raison pour laquelle ces tableaux montrent toujours des décisions Small Blind All in 20+ BB ou même plus élevées, bien qu'elles ne soient généralement pas applicables en pratique.

Enfin, de nombreux tableaux et décisions sont créés sur la base des calculs du livre Mathematics of Poker. Contrairement à ce que pensent de nombreux joueurs, nous ne devrions pas appliquer aveuglément ces tableaux à notre jeu, car nous, surtout contre des joueurs récréatifs, n'atteindrons jamais l'équilibre de Nash souhaité avec ce tableau.

Un exemple très simple mais illustrant bien la situation est un joueur qui shove n'importe quelles deux cartes à 25 BB deep. Dans ce cas, les tableaux ne seraient ni proches de l'équilibre de Nash ni proches du maximum EV, car la stratégie optimale serait différente.

Une stratégie optimale permettrait de call plus largement, car le Small Blind tirerait beaucoup plus de mauvaises mains que celles présentées dans les solutions.

Changements dans l'équilibre de Nash

Bien sûr, dans la réalité, il y aura beaucoup plus de petites déviations par rapport à la stratégie décrite dans les tableaux. Les joueurs de Spin n Go et HUSNG savent que dans les limites de 14-9 BB en Heads Up, le jeu sera très différent. Certains adversaires feront beaucoup de limps, d'autres auront plus de minraises dans leurs gammes, et ainsi de suite.

En raison de ces différences, le range optimal de shove/fold variera toujours considérablement, il est donc toujours nécessaire de revoir ces situations avec ICMizer, surtout du point de vue du BB. Bien sûr, dans les situations où le joueur est rencontré une seule fois, il peut être nécessaire de se fier à l'intuition ou à d'autres simplifications de la situation.

C'est une très vieille vidéo sur les changements de Nash, mais elle illustre parfaitement comment le jeu optimal devrait changer.

On peut se fier aux tableaux de push/fold à mesure que le jeu se rapproche de 1 BB de stack effectif, car toutes les stratégies possibles se rapprochent de l'équilibre de Nash. À l'exception de la stratégie “tout fold”, la plupart des stratégies à 2, 3, 4 ou 5 big blinds seront presque identiques ou différeront très légèrement.

Ainsi, dans cet article, nous avons abordé les bases du GTO dans le poker et le concept le plus connu de cette théorie, l'équilibre de Nash. Dans d'autres articles, plus d'attention sera accordée à la recherche de stratégies optimales et aux principes de fonctionnement des solveurs.

Les meilleures salles de poker en ligne