GTO pokeryje ir už jo ribų: Nash Equilibrium

Game Theory Optimal arba GTO pokerye pastaraisiais metais tapo viena dažniausiai vartojamų sąvokų. Deja, šio koncepto supratimas tarp pokerio žaidėjų yra gana menkas, dažniausiai susivedantis į “geras žaidimas” arba “blogas žaidimas vs fish” lygio paaiškinimus. Šiame straipsnyje aptarsime teorinį GTO pagrindą.
Pokeris GTO

Žaidimų teorija priklauso matematikos mokslų sričiai. Žaidimai šiuo atveju turi labai plačią prasmę. Iš esmės tai teorija analizuojanti bet kokias situacijas, kuriose racionalūs veikėjai (dažniausiai žmonės) veikia pagal nustatytą (arba nuspėjamą) strategiją. Vien iš šio apibrėžimo nesunku nustatyti GTO konceptų pokeryje pritaikymą.

TOP pokerio kambariai

Vienas iš žinomiausių ir svarbiausių principų pokerio žaidimų teorijoje yra Nasho pusiausvyra (arba Nash equilibrium). Daugelis pokerio žaidėjų šią sąvoką žino tik iš lentelių, kurios yra Push/Fold All in preflop. Šiose lentelėse paprastai nurodyta ties kiek BB galima šauti arba callinti All in esant prieš vieną žaidėją. Žinoma, tokias lenteles galima sudaryti ir didesniam žaidėjų skaičių, tačiau paprastai tai nėra taip lengva (ir naudinga).

GTO pokeryje – Nash equilibrium

Nasho pusiausvyra anksčiausiai pasirodė pokeryje gerai žinomu “preflop All in” lentelių pavidalu, nes tai lengviausiai apskaičiuojama būsena žaidime. Kuo mažiau žetonų ir žaidėjų lieka, tuo mažiau įmanomų sprendimų (teoriškai) gali įgyvendinti kiekvienas iš jų.

Norint geriau suprasti kaip atsirado šios situacijos apskaičiavimas reikia suprasti kokia būsena laikoma Nasho pusiausvyra. Nash equilibrium yra žaidimo būsena, kuri pasiekiama, kai egzistuoja šios sąlygos:

  1. Yra bent du žaidėjai.
  2. Žaidžiamas nekooperatyvinis žaidimas (toks, kuriame žaidėjai gali kažką laimėti kitų sąskaita).
  3. Žinomos visų žaidėjų strategijos.
  4. Suformuojama tokios strategijos, jog nei vienas žaidėjas negali laimėti daugiau keisdamas tik savo strategiją.

Ketvirtasis punktas šiuo atveju svarbiausias. Nasho equilibrium apibūdina tokią strategiją, kurioje visi žaidėjai žaidžia optimaliai. Pokerio terminais tariant, tai toks veiksmų planas, jog keičiant tik jį neįmanoma laimėti daugiau EV. Pokerio atveju Nash Equilibrium reikštų 0 EV visiems žaidėjams.

GTO pavyzdys ne pokeryje
Kalinio dilema – dažniausias žaidimų teorijos pavyzdys

John Forbes Nash, šios pusiausvyros atradėjas, yra įrodęs vieną itin svarbų reiškinį – Nasho pusiausvyros egzistavimo teoriją. Ši teorema teigia, jog Nash Equilibrium galima atrasti visuose žaidimuose, kuriuose sprendimų kiekis nėra begalinis ir laimėjimai koreliuoja su žaidėjų veiksmais (arba suteikia paskatą sukurti kažkokiais principais grįstą strategiją). Tai reiškia, jog Nash Equilibrium egzistuoja ne tik lentelėse, bet ir visam pokerio žaidime nuo preflop iki paskutiniojo river sprendimo. Kiekvienai bent vieną taisyklę turinčiai pokerio strategijai egzistuoja GTO sprendimas, kuris pasireikštų kaip vienpusis Nash equilibrium. Tokių Game Theory Optimal pokerio sprendimų paieškas aptarsime kitoje šio straipsnio dalyje. Atrasti tokias strategijas jau galima su siūlomais solveriais. Taigi, GTO nėra vien “top top regams”.

GTO ir Nash Equilibrium mitai

Kaip rašyta anksčiau, apie Nash Equilibrium pokeryje dažniausiai išgirsime tik kalbėdami apie preflop lenteles, o GTO tik šnekant apie solverius ar kaip kažkokią labai tolimą ir abstrakčią strategiją. Iš tiesų, šie konceptai pritaikomi visiems pokerio lygiams.

Kodėl pirmiausia buvo sukurtos Nasho lentelės prieš pradedant kurti ir kalbėti apie sudėtingesnes GTO strategijas? Pirmiausia, kaip gerai žinoma, šios lentelės geriausiai pritaikomos esant itin žemiems effect stack size. Kuo mažiau žetonų tuo mažiau galimybių tiek pre tiek postflop. Prie šios priežasties prisideda ir postflop svarba esant deep. Daugelis žaidėjų nemėgsta open shovinti AA kiekvienai progai pasitaikius.

Antra, gerokai svarbesnė priežastis, yra žaidimo supaprastinimas. Nash equilibrium reikalauja suprasti bent vieno žaidėjo strategiją pilnai, o tai daugelyje pokerio situacijų nėra realistiška. Daugelis rekreacinių žaidėjų turbūt turi tik strategijos užuomazgas vietoj racionalių žaidimo taisyklių. Dėl šios priežasties Nasho pusiausvyrą pokeryje pasiekti buvo galima tik supaprastinus žaidimą.

GTO solveriai ir kitos modernios programos leidžia suskaičiuoti strategiją, kuri artėja prie Nasho pusiausvyros. Geriausi solveriai, tiesa, vis dar nepasiekia tobulumo, tačiau daugeliui žaidėjų tai nėra svarbu. Vidutinis exploitability per pot nesiekia 0.1%, todėl pokerio praktikoje tai nieko nereiškia, kadangi žaidėjai nesugebės įsiminti visų įmanomų GTO strategijų. Svarbiausias GTO ir solverių praktinis ir teorinis aspektas – tobulos kontrstrategijos suformulavimas. Bet kokiai pokerio strategijai galima surasti optimalią, maksimalaus EV strategiją. Ši strategija bus maksimaliai pelninga kol kitas žaidėjas jos nepakeis.

Pokerio GTO solverio pavyzdys
Pokerio GTO solverio pavyzdys

Žinoma, norint pradėti net pačius paprasčiausias optimalias strategijas būtina žinoti apie oponento žaidimo stilių. Geriausia būtų žinoti konkrečias taisykles, kadangi šios gali labai stipriai galutinį rezultatą. Pavyzdžiui, jei turėtume du žaidėjus, vieną, kuris in position 100% flopintų top pair cbettina ½ pot size, ir kitą, kuris in position bettina tik 50% flopintų cbet (su geresniais kicker), net jei visos kitos jų žaidimo taisyklės bus identiškos, optimalios strategijos stipriai skirsis.

GTO pokeryje – Nasho pusiausvyros perskaičiavimas

Vienas iš svarbiausių sakinių, kurie pridedami prie visų šių Nasho lentelių, yra, kad tai yra supaprastintas pokerio žaidimas. Jame galima Small Blind gali atlikti tik All in arba Fold, o Big Blindas gali tik Call arba Fold. Žaidėjai negali atlikti jokių kitų veiksmų tokių kaip Raise bei niekada negali nueiti į postflop. Tai pagrindinė priežastis kodėl šiose lentelėse visada rodomi Small Blind All in 20+ BB ar net aukštesni sprendimai, nors jie praktikoje dažniausiai nėra pritaikomi.

Galiausiai, daugelis šių lentelių ir sprendimų yra sukurti remiantis knygos Mathematics of Poker skaičiavimais. Priešingai nei mano daugelis žaidėjų, šių lentelių aklai neturėtume pritaikyti savo žaidimui, kadangi mes, ypač prieš rekreacinius žaidėjus, niekada šia lentele nepasieksime norimo Nash Equilibrium.

Itin paprastas, bet situaciją gerai iliustruojantis pavyzdys – žaidėjas, kuris shovina bet kurias dvi kortas 25 BB deep. Tokiu atveju lentelės nebūtų nei arti Nash Equilibrium nei arti maksimalaus EV, kadangi optimali strategija būtų kitokia. Optimali strategija leistų callinti plačiau, kadangi Small Blindas šaudytų gerokai daugiau prastų rankų nei pateikta sprendimuose.

Nasho pusiausvyros pasikeitimai

Žinoma, tikrovėje bus daug daugiau smulkesnių nukrypimų nuo lentelėse aprašytos strategijos. Spin n Go bei HUSNG žaidėjai žino, jog 14-9 BB ribose Heads Up bus žaidžiama labai skirtingai. Kai kurie oponentai daug limpins, kai kurie turės daugiau minraise savo ranguose ir taip toliau. Dėl šių skirtumų visada, gan stipriai, skirsis optimaliausias shove/fold range todėl visada reikėtų peržiūrėti tokias situacijas ICMizer ypač iš BB perspektyvos. Žinoma, situacijose, kuriose žaidėjas sutinkamas tik vieną kartą gali tekti naudotis intuicija ar kitokiais situacijos supaprastinimais.

Tai labai senas video apie Nash pasikeitimus, tačiau puikiai iliustruoja kaip turėtų keistis optimalus žaidimas.

Pasikliauti push/fold lentelėmis galima žaidimui vis artėjant ties 1 BB effective stackų, kadangi visos įmanomos strategijos artėja prie Nash Equilibrium. Išskyrus strategiją “viską fold”, daugelis strategijų prie 2, 3, 4 ar 5 big blindų bus beveik identiškos ar skirsis labai neženkliai.

Taigi, šiame straipsnyje aptarėme GTO pokeryje pagrindus bei žinomiausią šios teorijos konceptą Nash Equilibrium. Kituose straipsniuose daugiau dėmesio bus skiriama optimalios strategijos paieškoms bei solverių veikimo principams.