GTO v pokru in zunaj njega: Nash Equilibrium

Game Theory Optimal ali GTO v pokru je v zadnjih letih postal eden najpogosteje uporabljenih pojmov. Na ลพalost je razumevanje tega koncepta med poker igralci precej pomanjkljivo, pogosto se omejuje na razlage na ravni "dobra igra" ali "slaba igra proti fish". V tem ฤlanku bomo obravnavali teoretiฤne osnove GTO.

Pokeris GTO

Teorija iger je del matematiฤnih znanosti. Igre v tem primeru imajo zelo ลกirok pomen. V bistvu je to teorija, ki analizira kakrลกne koli situacije, v katerih racionalni akterji (najpogosteje ljudje) delujejo po doloฤeni (ali predvidljivi) strategiji. ลฝe iz te definicije ni teลพko doloฤiti uporabe GTO konceptov v pokru.

TOP poker sobe

Eden najbolj znanih in pomembnih principov teorije iger v pokru je Nashovo ravnovesje (ali Nash equilibrium). Mnogi poker igralci poznajo ta pojem le iz tabel, ki so Push/Fold All in preflop.

V teh tabelah je obiฤajno navedeno, pri koliko BB je mogoฤe ลกovirati ali klicati All in proti enemu igralcu. Seveda je mogoฤe takลกne tabele sestaviti tudi za veฤje ลกtevilo igralcev, vendar to obiฤajno ni tako enostavno (in koristno).

GTO v pokru – Nashovo ravnovesje

Nashovo ravnovesje se je najprej pojavilo v pokru v obliki dobro znanih โ€œpreflop All inโ€ tabel, saj je to najlaลพje izraฤunljivo stanje v igri. Manj kot je ลพetonov in igralcev, manj moลพnih odloฤitev (teoretiฤno) lahko izvede vsak od njih.

Da bi bolje razumeli, kako je priลกlo do izraฤuna teh situacij, je treba razumeti, kakลกno stanje se ลกteje za Nashovo ravnovesje. Nashovo ravnovesje je stanje igre, ki se doseลพe, ko obstajajo naslednji pogoji:

  1. Obstajata vsaj dva igralca.
  2. Igra se nekooperativna igra (takลกna, v kateri lahko igralci nekaj pridobijo na raฤun drugih).
  3. Znane so strategije vseh igralcev.
  4. Oblikujejo se takลกne strategije, da noben igralec ne more pridobiti veฤ z menjavo le svoje strategije.

ฤŒetrta toฤka je v tem primeru najpomembnejลกa. Nashovo ravnovesje opisuje takลกno strategijo, v kateri vsi igralci igrajo optimalno. V poker terminih to pomeni takลกen naฤrt dejanj, da z menjavo le tega ni mogoฤe pridobiti veฤ EV.

V primeru pokra bi Nashovo ravnovesje pomenilo 0 EV za vse igralce.

GTO pavyzdys ne pokeryje
Dilema zapornika – najpogostejลกi primer teorije iger

John Forbes Nash, odkritelj tega ravnovesja, je dokazal en zelo pomemben pojav – teorijo obstoja Nashovega ravnovesja. Ta teorema pravi, da je Nashovo ravnovesje mogoฤe najti v vseh igrah, kjer ลกtevilo odloฤitev ni neskonฤno in dobitki korelirajo z dejanji igralcev (ali dajejo spodbudo za ustvarjanje strategije, ki temelji na doloฤenih naฤelih).

To pomeni, da Nashovo ravnovesje obstaja ne le v tabelah, ampak tudi v celotni poker igri od preflopa do zadnje odloฤitve na riverju. Za vsako poker strategijo, ki ima vsaj eno pravilo, obstaja GTO reลกitev, ki bi se pokazala kot enostransko Nashovo ravnovesje. Iskanje takลกnih Game Theory Optimal poker reลกitev bomo obravnavali v naslednjem delu tega ฤlanka.

Takลกne strategije je ลพe mogoฤe odkriti s ponujenimi solverji. Torej, GTO ni le za โ€œtop top regeโ€.

GTO in Nashovo ravnovesje miti

Kot je bilo ลพe zapisano, o Nashovem ravnovesju v pokru najpogosteje sliลกimo le, ko govorimo o preflop tabelah, in o GTO le, ko govorimo o solverjih ali kot o neki zelo oddaljeni in abstraktni strategiji. V resnici so ti koncepti uporabni za vse ravni pokra.

Zakaj so bile najprej ustvarjene Nashove tabele, preden so zaฤeli ustvarjati in govoriti o bolj zapletenih GTO strategijah? Najprej, kot je dobro znano, so te tabele najbolje uporabne pri zelo nizkih effect stack size.

Manj kot je ลพetonov, manj je moลพnosti tako pre kot postflop. K temu razlogu prispeva tudi postflop pomembnost pri deep igri. Mnogi igralci ne marajo open shovirati AA ob vsaki priloลพnosti.

Drugiฤ, veliko pomembnejลกi razlog je poenostavitev igre. Nashovo ravnovesje zahteva razumevanje vsaj ene igralฤeve strategije v celoti, kar v mnogih poker situacijah ni realistiฤno. Mnogi rekreativni igralci verjetno imajo le zametke strategije namesto racionalnih pravil igre. Zaradi tega je bilo Nashovo ravnovesje v pokru mogoฤe doseฤi le s poenostavitvijo igre.

GTO solverji in drugi sodobni programi omogoฤajo izraฤun strategije, ki se pribliลพuje Nashovemu ravnovesju. Najboljลกi solverji sicer ลกe vedno ne doseลพejo popolnosti, vendar to za mnoge igralce ni pomembno. Povpreฤna exploitability na pot ne presega 0,1%, zato v poker praksi to ne pomeni niฤ, saj igralci ne bodo mogli zapomniti vseh moลพnih GTO strategij.

Najpomembnejลกi praktiฤni in teoretiฤni vidik GTO in solverjev je oblikovanje popolne kontrstrategije. Za katero koli poker strategijo je mogoฤe najti optimalno, maksimalno EV strategijo. Ta strategija bo maksimalno donosna, dokler je drugi igralec ne spremeni.

Pokerio GTO solverio pavyzdys
Primer poker GTO solverja

Seveda, da bi zaฤeli tudi z najpreprostejลกimi optimalnimi strategijami, je treba poznati nasprotnikov stil igre. Najbolje bi bilo poznati konkretna pravila, saj ta lahko zelo moฤno vplivajo na konฤni rezultat.

Na primer, ฤe bi imeli dva igralca, enega, ki in position 100% flopira top pair cbettina ยฝ pot size, in drugega, ki in position bettina le 50% flopira cbet (z boljลกimi kickerji), tudi ฤe bodo vsa druga pravila njihove igre enaka, se bodo optimalne strategije moฤno razlikovale.

GTO v pokru – ponovni izraฤun Nashovega ravnovesja

Eden najpomembnejลกih stavkov, ki se dodajo k vsem tem Nashovim tabelam, je, da gre za poenostavljeno poker igro. V njej lahko Small Blind izvede le All in ali Fold, Big Blind pa lahko le Call ali Fold.

Igralci ne morejo izvesti nobenih drugih dejanj, kot je Raise, in nikoli ne morejo iti na postflop. To je glavni razlog, zakaj te tabele vedno prikazujejo Small Blind All in 20+ BB ali celo viลกje odloฤitve, ฤeprav v praksi obiฤajno niso uporabne.

Na koncu je veliko teh tabel in odloฤitev ustvarjenih na podlagi izraฤunov iz knjige Mathematics of Poker. V nasprotju s tem, kar mnogi igralci mislijo, teh tabel ne bi smeli slepo uporabljati v svoji igri, saj zlasti proti rekreativnim igralcem nikoli ne bomo dosegli ลพelenega Nashovega ravnovesja s to tabelo.

Zelo preprost, a situacijo dobro ponazarjajoฤ primer je igralec, ki shovina katerikoli dve karti 25 BB deep. V tem primeru tabele ne bi bile niti blizu Nashovega ravnovesja niti blizu maksimalnega EV, saj bi bila optimalna strategija drugaฤna.

Optimalna strategija bi omogoฤila ลกirลกi klic, saj bi Small Blind stavil precej veฤ slabih rok kot je prikazano v reลกitvah.

Spremembe Nashovega ravnoteลพja

Seveda bo v resniฤnosti veliko veฤ manjลกih odstopanj od strategije, opisane v tabelah. Igralci Spin n Go in HUSNG vedo, da se bo Heads Up pri 14-9 BB igralo zelo razliฤno. Nekateri nasprotniki bodo veliko limpali, nekateri bodo imeli veฤ minraise v svojih rangih in tako naprej.

Zaradi teh razlik se bo optimalni shove/fold range vedno precej razlikoval, zato je vedno priporoฤljivo pregledati takลกne situacije v ICMizerju, ลกe posebej z vidika BB. Seveda, v situacijah, kjer se igralec sreฤa le enkrat, bo morda treba uporabiti intuicijo ali druge poenostavitve situacije.

To je zelo star video o Nashovih spremembah, vendar odliฤno prikazuje, kako bi se morala spreminjati optimalna igra.

Zanaลกanje na push/fold tabele je mogoฤe, ko se igra pribliลพuje 1 BB effective stackom, saj se vse moลพne strategije pribliลพujejo Nashovemu ravnoteลพju. Razen strategije “vse fold”, bo veฤina strategij pri 2, 3, 4 ali 5 big blindih skoraj identiฤna ali se bo razlikovala zelo neznatno.

Tako smo v tem ฤlanku obravnavali osnove GTO v pokru in najbolj znan koncept te teorije, Nashovo ravnoteลพje. V naslednjih ฤlankih bo veฤ pozornosti namenjene iskanju optimalne strategije in delovanju solverjev.

Najboljลกe poker sobe na spletu