GTO v pokery a mimo neho: Nashova rovnováha

Game Theory Optimal alebo GTO v pokri sa v posledných rokoch stalo jedným z najčastejšie používaných pojmov. Bohužiaľ, pochopenie tohto konceptu medzi hráčmi pokru je dosť slabé, často sa zredukuje na vysvetlenia typu „dobrá hra“ alebo „zlá hra proti fish“. V tomto článku sa budeme zaoberať teoretickým základom GTO.

Poker GTO

Teória hier má svoje miesto v matematických vedách. Hry v tomto prípade majú veľmi široký význam. V podstate ide o teóriu, ktorá analyzuje akékoľvek situácie, v ktorých racionálni aktéri (zvyčajne ľudia) konajú podľa stanovenej (alebo predvídateľnej) stratégie. Už z tejto definície nie je ťažké určiť aplikáciu GTO konceptov v pokri.

TOP pokerové herne

Jedným z najznámejších a najdôležitejších princípov v teórii pokerových hier je Nashova rovnováha (alebo Nash equilibrium). Mnohí pokeroví hráči poznajú tento pojem len z tabuliek, ktoré sú Push/Fold All in preflop. V týchto tabuľkách je zvyčajne uvedené, pri koľkých BB je možné strieľať alebo callovať All in proti jednému hráčovi. Samozrejme, takéto tabuľky je možné zostaviť aj pre väčší počet hráčov, ale zvyčajne to nie je také jednoduché (a užitočné).

GTO v pokri – Nashova rovnováha

Nashova rovnováha sa v pokri objavila najskôr vo forme dobre známych „preflop All in“ tabuliek, pretože je to najľahšie vypočítateľný stav v hre. Čím menej žetónov a hráčov zostáva, tým menej možných rozhodnutí (teoreticky) môže každý z nich urobiť.

Aby sme lepšie pochopili, ako vznikol tento výpočet situácií, musíme pochopiť, aký stav sa považuje za Nashovu rovnováhu. Nash equilibrium je stav hry, ktorý sa dosiahne, keď existujú tieto podmienky:

  1. Sú aspoň dvaja hráči.
  2. Hrá sa nekooperatívna hra (taká, v ktorej hráči môžu niečo vyhrať na úkor iných).
  3. Sú známe stratégie všetkých hráčov.
  4. Sú vytvorené také stratégie, že žiadny hráč nemôže vyhrať viac, ak zmení len svoju stratégiu.

Štvrtý bod je v tomto prípade najdôležitejší. Nashova rovnováha opisuje takú stratégiu, v ktorej všetci hráči hrajú optimálne. V pokerových termínoch je to taký plán akcií, že zmenou len jeho nie je možné vyhrať viac EV. V pokri by Nashova rovnováha znamenala 0 EV pre všetkých hráčov.

Príklad GTO mimo pokeru
Väzňova dilema – najčastejší príklad teórie hier

John Forbes Nash, objaviteľ tejto rovnováhy, dokázal jeden veľmi dôležitý jav – teóriu existencie Nashovej rovnováhy. Táto teória tvrdí, že Nashovu rovnováhu je možné nájsť vo všetkých hrách, v ktorých počet rozhodnutí nie je nekonečný a výhry korelujú s akciami hráčov (alebo poskytujú podnet na vytvorenie nejakej stratégie založenej na princípoch). To znamená, že Nashova rovnováha existuje nielen v tabuľkách, ale aj v celej pokerovej hre od preflopu až po posledné rozhodnutie na riveri. Pre každú pokerovú stratégiu, ktorá má aspoň jedno pravidlo, existuje GTO riešenie, ktoré by sa prejavilo ako jednostranná Nashova rovnováha. Hľadanie takýchto Game Theory Optimal pokerových riešení budeme diskutovať v ďalšej časti tohto článku. Takéto stratégie je už možné nájsť pomocou ponúkaných solverov. Takže GTO nie je len pre „top top regov“.

Mýty o GTO a Nashovej rovnováhe

Ako bolo napísané vyššie, o Nashovej rovnováhe v pokri sa najčastejšie dozvieme len pri rozhovoroch o preflop tabuľkách, a o GTO len pri rozhovoroch o solveroch alebo ako o nejakej veľmi vzdialenej a abstraktnej stratégii. V skutočnosti sú tieto koncepty použiteľné pre všetky úrovne pokeru.

Prečo boli najprv vytvorené Nashove tabuľky predtým, ako sa začali vytvárať a hovoriť o zložitejších GTO stratégiách? Po prvé, ako je dobre známe, tieto tabuľky sú najlepšie použiteľné pri veľmi nízkych efektívnych stack size. Čím menej žetónov, tým menej možností pred aj po flopu. K tomuto dôvodu prispieva aj dôležitosť postflopu pri deep stackoch. Mnohí hráči nemajú radi open shovovanie AA pri každej príležitosti.

Po druhé, oveľa dôležitejším dôvodom je zjednodušenie hry. Nashova rovnováha vyžaduje pochopenie aspoň jednej stratégie hráča úplne, čo v mnohých pokerových situáciách nie je realistické. Mnohí rekreační hráči pravdepodobne majú len základy stratégie namiesto racionálnych pravidiel hry. Z tohto dôvodu bolo možné dosiahnuť Nashovu rovnováhu v pokri len zjednodušením hry.

GTO solveri a iné moderné programy umožňujú vypočítať stratégiu, ktorá sa blíži k Nashovej rovnováhe. Najlepšie solveri, pravda, stále nedosahujú dokonalosť, ale pre mnohých hráčov to nie je dôležité. Priemerná exploitability na pot nepresahuje 0,1%, takže v pokerovej praxi to nič neznamená, pretože hráči si nebudú schopní zapamätať všetky možné GTO stratégie. Najdôležitejším praktickým a teoretickým aspektom GTO a solverov je formulovanie dokonalej kontrastratégie. Pre akúkoľvek pokerovú stratégiu je možné nájsť optimálnu, maximálne EV stratégiu. Táto stratégia bude maximálne zisková, pokiaľ ju druhý hráč nezmení.

Príklad pokerového GTO solvera
Príklad pokerového GTO solvera

Samozrejme, aby sme mohli začať aj s najjednoduchšími optimálnymi stratégiami, je potrebné vedieť o štýle hry súpera. Najlepšie by bolo poznať konkrétne pravidlá, pretože tie môžu veľmi silno ovplyvniť konečný výsledok. Napríklad, ak by sme mali dvoch hráčov, jedného, ktorý in position 100% flopuje top pair a cbetuje ½ pot size, a druhého, ktorý in position betuje len 50% flopov cbet (s lepšími kickermi), aj keď budú všetky ostatné pravidlá ich hry identické, optimálne stratégie sa budú výrazne líšiť.

GTO v pokri – Prepočítanie Nashovej rovnováhy

Jednou z najdôležitejších viet, ktoré sa pridávajú k všetkým týmto Nashovým tabuľkám, je, že ide o zjednodušenú pokerovú hru. V nej môže Small Blind vykonať len All in alebo Fold, a Big Blind môže len Call alebo Fold. Hráči nemôžu vykonať žiadne iné akcie, ako je Raise, a nikdy nemôžu ísť na postflop. To je hlavný dôvod, prečo tieto tabuľky vždy ukazujú Small Blind All in 20+ BB alebo ešte vyššie rozhodnutia, aj keď v praxi zvyčajne nie sú použiteľné.

Nakoniec, mnohé z týchto tabuliek a rozhodnutí sú vytvorené na základe výpočtov z knihy Mathematics of Poker. Na rozdiel od toho, čo si mnohí hráči myslia, tieto tabuľky by sme nemali slepo aplikovať na svoju hru, pretože my, najmä proti rekreačným hráčom, nikdy nedosiahneme požadovanú Nashovu rovnováhu pomocou tejto tabuľky.

Veľmi jednoduchý, ale situáciu dobre ilustrujúci príklad – hráč, ktorý shovuje akékoľvek dve karty 25 BB deep. V takom prípade by tabuľky neboli ani blízko Nashovej rovnováhy, ani blízko maximálneho EV, pretože optimálna stratégia by bola iná. Optimálna stratégia by umožnila callovať širšie, pretože Small Blind by strieľal oveľa viac slabých rúk, než je uvedené v rozhodnutiach.

Zmeny Nashovej rovnováhy

Samozrejme, v skutočnosti bude oveľa viac drobných odchýlok od stratégie opísanej v tabuľkách. Spin n Go a HUSNG hráči vedia, že v rozmedzí 14-9 BB Heads Up sa bude hrať veľmi odlišne. Niektorí súperi budú veľa limpovať, iní budú mať viac minraise vo svojich rangoch a tak ďalej. Kvôli týmto rozdielom sa vždy, dosť výrazne, bude líšiť optimálny shove/fold range, preto by ste mali vždy prehodnotiť takéto situácie v ICMizer, najmä z perspektívy BB. Samozrejme, v situáciách, kde sa hráč stretne len raz, môže byť potrebné spoliehať sa na intuíciu alebo iné zjednodušenia situácie.

Toto je veľmi staré video o zmenách Nashovej rovnováhy, ale dobre ilustruje, ako by sa mala meniť optimálna hra.

Spoliehať sa na push/fold tabuľky je možné, keď sa hra blíži k 1 BB effective stackom, pretože všetky možné stratégie sa blížia k Nashovej rovnováhe. Okrem stratégie „všetko fold“, väčšina stratégií pri 2, 3, 4 alebo 5 big blindov bude takmer identická alebo sa bude líšiť veľmi nepatrne.

Takže v tomto článku sme diskutovali o základoch GTO v pokri a najznámejšom koncepte tejto teórie, Nashovej rovnováhe. V ďalších článkoch sa budeme viac venovať hľadaniu optimálnej stratégie a princípom fungovania solverov.