GTO pokerio ir už jo ribų: Nešo pusiausvyra

Game Theory Optimal jeb GTO pokerā pēdējos gados ir kļuvusi par vienu no visbiežāk lietotajiem jēdzieniem. Diemžēl šī koncepta izpratne starp pokera spēlētājiem ir diezgan vāja, bieži vien aprobežojoties ar “labs spēles stils” vai “slikts spēles stils pret fish” līmeņa skaidrojumiem. Šajā rakstā apspriedīsim teorētisko GTO pamatu.

Pokers GTO

Spēļu teorija pieder matemātikas zinātņu jomai. Spēles šajā gadījumā ir ļoti plašā nozīmē. Būtībā tā ir teorija, kas analizē jebkuras situācijas, kurās racionāli dalībnieki (parasti cilvēki) darbojas saskaņā ar noteiktu (vai paredzamu) stratēģiju. No šīs definīcijas vien ir viegli noteikt GTO konceptu pielietojumu pokerā.

TOP pokera istabas

Viens no zināmākajiem un svarīgākajiem principiem pokera spēļu teorijā ir Neša līdzsvars (vai Nash equilibrium). Daudzi pokera spēlētāji šo jēdzienu zina tikai no tabulām, kas ir Push/Fold All in preflop. Šajās tabulās parasti norādīts, pie cik BB var šaut vai call All in pret vienu spēlētāju. Protams, šādas tabulas var sastādīt arī lielākam spēlētāju skaitam, taču parasti tas nav tik viegli (un noderīgi).

GTO pokerā – Nash equilibrium

Neša līdzsvars agrāk parādījās pokerā labi zināmu “preflop All in” tabulu veidā, jo tas ir vieglāk aprēķināms stāvoklis spēlē. Jo mazāk žetonu un spēlētāju paliek, jo mazāk iespējamo lēmumu (teorētiski) katrs no tiem var īstenot.

Lai labāk saprastu, kā radās šo situāciju aprēķins, ir jāsaprot, kāds stāvoklis tiek uzskatīts par Neša līdzsvaru. Nash equilibrium ir spēles stāvoklis, kas tiek sasniegts, kad pastāv šādi nosacījumi:

  1. Ir vismaz divi spēlētāji.
  2. Spēlē nekooperatīvu spēli (tādu, kurā spēlētāji var kaut ko iegūt uz citu rēķina).
  3. Ir zināmas visu spēlētāju stratēģijas.
  4. Izveidojas tādas stratēģijas, ka neviens spēlētājs nevar iegūt vairāk, mainot tikai savu stratēģiju.

Ceturtā punkta šajā gadījumā ir vissvarīgākā. Neša līdzsvars raksturo tādu stratēģiju, kurā visi spēlētāji spēlē optimāli. Pokera terminoloģijā tas ir tāds rīcības plāns, ka, mainot tikai to, nav iespējams iegūt vairāk EV. Pokerā Nash Equilibrium nozīmētu 0 EV visiem spēlētājiem.

GTO piemērs ne pokerā
Cietumnieka dilemma – biežākais spēļu teorijas piemērs

John Forbes Nash, šī līdzsvara atklājējs, ir pierādījis vienu ļoti svarīgu parādību – Neša līdzsvara eksistences teoriju. Šī teorēma apgalvo, ka Nash Equilibrium var atrast visās spēlēs, kurās lēmumu skaits nav bezgalīgs un laimesti korelē ar spēlētāju darbībām (vai sniedz stimulu izveidot kādiem principiem balstītu stratēģiju). Tas nozīmē, ka Nash Equilibrium pastāv ne tikai tabulās, bet arī visā pokera spēlē no preflop līdz pēdējam river lēmumam. Katrai vismaz vienu noteikumu saturošai pokera stratēģijai pastāv GTO risinājums, kas izpaustos kā vienpusējs Nash equilibrium. Šādu Game Theory Optimal pokera risinājumu meklējumus apspriedīsim nākamajā šī raksta daļā. Atrast šādas stratēģijas jau ir iespējams ar piedāvātajiem solveriem. Tātad, GTO nav tikai “top top regiem”.

GTO un Nash Equilibrium mīti

Kā rakstīts iepriekš, par Nash Equilibrium pokerā visbiežāk dzirdēsim tikai runājot par preflop tabulām, bet GTO tikai runājot par solveriem vai kā par ļoti tālu un abstraktu stratēģiju. Patiesībā šie koncepti ir piemērojami visiem pokera līmeņiem.

Kāpēc vispirms tika izveidotas Neša tabulas, pirms sāka veidot un runāt par sarežģītākām GTO stratēģijām? Pirmkārt, kā labi zināms, šīs tabulas vislabāk piemērojamas, ja ir ļoti zems effect stack size. Jo mazāk žetonu, jo mazāk iespēju gan pre, gan postflop. Pie šī iemesla pieskaitāma arī postflop nozīme, ja ir deep. Daudzi spēlētāji nemīl open shovēt AA katru reizi, kad ir iespēja.

Otrkārt, daudz svarīgāks iemesls ir spēles vienkāršošana. Nash equilibrium prasa saprast vismaz viena spēlētāja stratēģiju pilnībā, un tas daudzās pokera situācijās nav reāli. Daudzi rekreācijas spēlētāji, iespējams, ir tikai stratēģijas aizmetņi, nevis racionāli spēles noteikumi. Šī iemesla dēļ Neša līdzsvaru pokerā varēja sasniegt tikai vienkāršojot spēli.

GTO solveri un citas modernas programmas ļauj aprēķināt stratēģiju, kas tuvojas Neša līdzsvaram. Labākie solveri, tiesa, joprojām nesasniedz pilnību, taču daudziem spēlētājiem tas nav svarīgi. Vidējais exploitability per pot nesasniedz 0.1%, tāpēc pokera praksē tas neko nenozīmē, jo spēlētāji nespēs iegaumēt visas iespējamās GTO stratēģijas. Svarīgākais GTO un solveru praktiskais un teorētiskais aspekts ir perfektas kontrstratēģijas formulēšana. Jebkurai pokera stratēģijai var atrast optimālu, maksimāla EV stratēģiju. Šī stratēģija būs maksimāli ienesīga, kamēr cits spēlētājs to nemainīs.

Pokera GTO solvera piemērs
Pokera GTO solvera piemērs

Protams, lai sāktu pat visvienkāršākās optimālās stratēģijas, ir jāzina par pretinieka spēles stilu. Vislabāk būtu zināt konkrētus noteikumus, jo tie var ļoti stipri ietekmēt galarezultātu. Piemēram, ja mums būtu divi spēlētāji, viens, kurš in position 100% flopē top pair cbettina ½ pot size, un otrs, kurš in position bettina tikai 50% flopē cbet (ar labākiem kicker), pat ja visas pārējās viņu spēles noteikumi būs identiski, optimālās stratēģijas stipri atšķirsies.

GTO pokerā – Neša līdzsvara pārrēķināšana

Viens no svarīgākajiem teikumiem, kas tiek pievienoti visām šīm Neša tabulām, ir tas, ka tas ir vienkāršots pokera spēles modelis. Tajā Small Blind var veikt tikai All in vai Fold, bet Big Blind var tikai Call vai Fold. Spēlētāji nevar veikt nekādas citas darbības, piemēram, Raise, un nekad nevar nonākt postflop. Tas ir galvenais iemesls, kāpēc šajās tabulās vienmēr tiek rādīti Small Blind All in 20+ BB vai pat augstāki lēmumi, lai gan praksē tie bieži vien nav piemērojami.

Galu galā, daudzas no šīm tabulām un lēmumiem ir izveidotas, pamatojoties uz grāmatas Mathematics of Poker aprēķiniem. Pretēji tam, ko domā daudzi spēlētāji, šīs tabulas akli nevajadzētu piemērot savai spēlei, jo mēs, īpaši pret rekreācijas spēlētājiem, nekad ar šo tabulu nesasniegsim vēlamo Nash Equilibrium.

Ļoti vienkāršs, bet situāciju labi ilustrējošs piemērs – spēlētājs, kurš shovē jebkuras divas kārtis 25 BB deep. Šādā gadījumā tabulas nebūtu ne tuvu Nash Equilibrium, ne tuvu maksimālam EV, jo optimālā stratēģija būtu citāda. Optimālā stratēģija ļautu callēt plašāk, jo Small Blind šautu daudz vairāk sliktu roku nekā norādīts lēmumos.

Neša līdzsvara izmaiņas

Protams, realitātē būs daudz vairāk sīku noviržu no tabulās aprakstītās stratēģijas. Spin n Go un HUSNG spēlētāji zina, ka 14-9 BB robežās Heads Up tiks spēlēts ļoti atšķirīgi. Daži pretinieki daudz limpēs, daži vairāk minraise savos diapazonos un tā tālāk. Šo atšķirību dēļ vienmēr, diezgan stipri, atšķirsies optimālākais shove/fold diapazons, tāpēc vienmēr vajadzētu pārskatīt šādas situācijas ICMizer, īpaši no BB perspektīvas. Protams, situācijās, kurās spēlētājs sastopams tikai vienu reizi, var nākties izmantot intuīciju vai citus situācijas vienkāršojumus.

Tas ir ļoti sens video par Neša izmaiņām, taču lieliski ilustrē, kā vajadzētu mainīties optimālajai spēlei.

Paļauties uz push/fold tabulām var, spēlei arvien vairāk tuvojoties 1 BB effective stackiem, jo visas iespējamās stratēģijas tuvojas Nash Equilibrium. Izņemot stratēģiju “visu fold”, daudzas stratēģijas pie 2, 3, 4 vai 5 big blindiem būs gandrīz identiskas vai atšķirsies ļoti nenozīmīgi.

Tātad, šajā rakstā mēs apspriedām GTO pokerā pamatus un zināmāko šīs teorijas konceptu Nash Equilibrium. Nākamajos rakstos vairāk uzmanības tiks pievērsts optimālās stratēģijas meklējumiem un solveru darbības principiem.