GTO i poker och därutöver: Nash-jämvikten

Game Theory Optimal, eller GTO, har blivit en av de vanligaste termerna inom poker de senaste åren. Tyvärr är förståelsen för detta koncept bland pokerspelare ganska dålig och kokar vanligtvis ner till förklaringar på nivån "bra spel" eller "dåligt spel vs fisk". I den här artikeln kommer vi att diskutera den teoretiska grunden för GTO.
Poker GTO

Spelteori är en gren inom matematiken. Spel har i detta sammanhang en mycket bred betydelse. Det är i grunden en teori som analyserar alla situationer där rationella aktörer (vanligtvis människor) agerar enligt en fast (eller förutsägbar) strategi. Enbart utifrån denna definition är det lätt att identifiera GTO-koncept i poker anpassning.

Bästa pokerrummen

En av de mest kända och viktigaste principerna inom spelteori för poker är Nash-jämvikten. De flesta pokerspelare känner bara till detta koncept från de tabeller som är Push/Fold All in preflop. Dessa tabeller anger vanligtvis hur många BB Tillgänglig på kasta eller syna All in mot en spelare. Naturligtvis är det möjligt att göra sådana tabeller för ett större antal spelare, men det är vanligtvis inte så enkelt (och användbart).

GTO-poker - Nash-jämvikt

Nash-jämvikt gjorde sitt tidigaste framträdande i poker i den välkända "preflop All in" tabeller, eftersom detta är det enklaste tillståndet att beräkna i spelet. Ju färre marker och spelare som finns kvar, desto färre möjliga lösningar (teoretiskt) kan varje spelare genomföra.

För att bättre förstå hur beräkningen av denna situation uppstod är det nödvändigt att förstå vilket tillstånd som anses vara en Nash-jämvikt. Nash-jämvikt är det tillstånd i spelet som uppnås när följande villkor är uppfyllda:

  1. Det finns minst två spelare.
  2. Ett icke-kooperativt spel (ett spel där spelarna kan vinna något på bekostnad av andra).
  3. Kända strategier för alla spelare.
  4. Strategier utformas på ett sådant sätt att ingen spelare kan vinna mer genom att bara ändra sin strategi.

Den fjärde punkten är den viktigaste i detta fall. Nash-jämvikt beskriver en strategi där alla spelare spelar optimalt. I pokersammanhang är det en handlingsplan som är sådan att det är omöjligt att vinna mer EV genom att ändra den. I poker skulle Nash-jämvikt innebära 0 EV för alla spelare.

Ett exempel på att GTO inte är med i poker
Fångarnas dilemma - det vanligaste exemplet på spelteori

John Forbes Nashsom upptäckte denna jämvikt, har bevisat ett mycket viktigt fenomen: Nashjämviktsteoremet. Detta teorem säger att Nash-jämvikt kan hittas i alla spel där antalet beslut inte är oändligt och där utbetalningarna korrelerar med spelarnas handlingar (eller ger ett incitament att utveckla en strategi baserad på vissa principer). Detta innebär att Nash-jämvikten inte bara existerar vid borden, utan även i hela pokerspelet från preflop till det sista river-beslutet. För varje pokerstrategi med minst en regel finns det en GTO-lösning som skulle manifestera sig som en ensidig Nash-jämvikt. Vi kommer att diskutera sökandet efter sådana Game Theory Optimal-pokerlösningar i nästa del av detta dokument. Det är redan möjligt att upptäcka sådana strategier med de föreslagna lösarna. GTO är alltså inte bara för "top top regs".

Myter om GTO och Nash Equilibrium

Som nämnts ovan kommer du i poker vanligtvis bara att höra om Nash-jämvikt när det gäller preflop-bord, och GTO endast när det gäller solvers eller som en mycket avlägsen och abstrakt strategi. Faktum är att dessa begrepp gäller för alla nivåer av poker.

Varför utvecklades Nash-tabellerna först, innan mer komplexa GTO-strategier utvecklades och diskuterades? Först och främst är det välkänt att dessa tabeller bäst tillämpas vid mycket låga stackstorlekar. Ju färre marker, desto färre möjligheter för både pre och postflop. Detta förvärras av vikten av postflop på djupet. Många spelare gillar inte att öppna med AA vid varje tillfälle.

Det andra, och mycket viktigare skälet, är att förenkla spelet. Nash-jämvikt kräver en förståelse av åtminstone en spelares strategi Fullvilket inte är realistiskt i de flesta pokersituationer. Många fritidsspelare har förmodligen bara en antydan till strategi istället för rationella spelregler. Av denna anledning Nashs balans i poker kunde endast uppnås genom att förenkla spelet.

GTO-solvers och andra moderna applikationer gör det möjligt för oss att beräkna en strategi som närmar sig Nashs balans. De bästa lösarna är fortfarande inte perfekta, men för många spelare är detta inte viktigt. Den genomsnittliga exploaterbarheten per pott är mindre än 0,1%, så det betyder ingenting i pokerpraxis, eftersom spelare inte kommer att kunna memorera alla möjliga GTO-strategier. Den viktigaste praktiska och teoretiska aspekten av GTO:er och solvers är formuleringen av den perfekta motstrategin. För varje pokerstrategi är det möjligt att hitta en optimal, maximal EV-strategi. Denna strategi kommer att vara maximalt lönsam tills en annan spelare ändrar den.

Exempel på en Poker GTO-lösare
Exempel på en Poker GTO-lösare

Naturligtvis kräver även de enklaste optimala strategierna kunskap om motståndarens spelstil för att komma igång. Det bästa vore att känna till de specifika reglerna, eftersom dessa kan göra stor skillnad i slutresultatet. Om vi till exempel har två spelare, en som i position 100% floppade topp par cbettina ½ pot size, och den andra som i position bettina endast 50% floppade cbet (med en bättre kicker), även om alla andra regler i spelet är identiska, kommer de optimala strategierna att skilja sig mycket åt.

GTO Poker - Nashs ombalansering

En av de viktigaste meningarna som följer med alla dessa Nash-bord är att det är ett förenklat pokerspel. Det tillåter en Small Blind att endast spela All in eller Fold, och en Big Blind att endast spela Call eller Fold. Spelarna kan inte göra några andra handlingar, t.ex. en höjning, och kan aldrig gå postflop. Detta är den främsta anledningen till att dessa bord alltid visar Small Blind All in 20+ BB eller ännu högre beslut, även om de vanligtvis inte är tillämpliga i praktiken.

Slutligen är många av dessa tabeller och lösningar baserade på beräkningarna i Mathematics of Poker. I motsats till vad många spelare tror bör vi inte blint tillämpa dessa tabeller på vårt eget spel, eftersom vi aldrig kommer att uppnå den önskade Nash-jämvikten med dessa tabeller, särskilt inte mot fritidsspelare.

Ett mycket enkelt, men väl illustrerat exempel är en spelare som shuffar två valfria kort 25 BB djupt. I det här fallet skulle borden varken vara nära Nash-jämvikten eller nära den maximala EV, eftersom den optimala strategin skulle vara annorlunda. Den optimala strategin skulle tillåta ett bredare urval av call, eftersom Small Blind skulle skjuta många fler dåliga händer än lösningarna.

Förändringar i Nash-jämvikten

Naturligtvis kommer det i verkligheten att finnas många fler mindre avvikelser från den strategi som beskrivs i tabellerna. Spin n Go- och HUSNG-spelare vet att Heads Up kommer att spela väldigt annorlunda i intervallet 14-9 BB. Vissa motståndare kommer att limpa mycket, vissa kommer att ha fler minraise i sina led och så vidare. På grund av dessa skillnader kommer det alltid att finnas en stor skillnad i det optimala shove/fold-intervallet, så du bör alltid granska dessa situationer på ICMizer, särskilt ur ett BB-perspektiv. I situationer där en spelare bara träffas en gång kan det naturligtvis vara nödvändigt att använda intuition eller andra förenklingar av situationen.

Detta är en mycket gammal video om Nash-förändringarna, men den illustrerar mycket bra hur ett optimalt spel bör förändras.

Du kan lita på push/fold-tabellerna när spelet närmar sig 1 BB effektiva stackar, eftersom alla möjliga strategier närmar sig Nash-jämvikten. Med undantag för all-fold-strategin kommer de flesta strategier för 2, 3, 4 eller 5 big blinds att vara nästan identiska eller mycket lite annorlunda.

Så i den här artikeln har vi diskuterat grunderna i GTO i poker och det mest kända konceptet i denna teori, Nash-jämvikten. Nästa artikel kommer att fokusera mer på att hitta den optimala strategin och principerna för solvers.