Pokera zinātne: Ko mēs varam mācīties no mākslīgā intelekta?

Šoreiz apspriedīsim nedaudz atšķirīgu rakstu, kura autori cenšas izveidot pokera piemērotus noteikumus, balstoties uz dziļās mācīšanās programmu algoritmiem. Pēc mākslīgā intelekta Claudico un Libratus spēles tika novērots, ka spēcīgākā to daļa ir river situāciju risinājumi. Raksta autori cenšas izpētīt programmu pieņemtos lēmumus riverā un izveidot saprotamus noteikumus.

Šim eksperimentam tika izveidoti divi identiski mākslīgie intelekti, kuriem nebija nekādu iepriekšēju noteikumu, izņemot izpratni par kāršu stiprumu. Šādi nosacījumi ļauj atrast jaunus veidus, kā risināt pokera situācijas, jo netiek iekļautas regulāru spēlētāju zināšanas. Pašas programmas mācījās tikai viena no otras, spēlējot 100 000 Heads-Up No-Limit partijas.

Tiesa, autori nedaudz ierobežoja spēles iespējas, tāpēc secinājumi jāpieņem ar zināmu piesardzību. Papildu spēles ierobežojumi bija šādi:

  1. Analizētas rokas pēc savas un pretinieka stipruma river situācijās procentuāli (t.i., cik pretinieka diapazona daļas tiek pārspētas).
  2. Risinātas tikai river situācijas. Šis ierobežojums daudz nemaina pirmā ierobežojuma dēļ.
  3. Analizēts tikai check/call un check/fold. Droši vien visvairāk mainošais ierobežojums, jo tiek izslēgtas donk un raise situācijas.
  4. Spēlēts ar mainīgu 10 kāršu kavu. Šis ierobežojums būtībā neko nemaina otrā un pirmā ierobežojuma dēļ, tikai samazina lēmumu koku.
  5. Analizēta in position spēle.

Pēc 100 000 simulācijām tika novērota apgūtā spēle, kas attēlota sarežģītā lēmumu kokā:

Autori no mākslīgā intelekta spēles izvada divus galvenos noteikumus:

  1. Ja riverā handa pārspēj no 20% līdz 80% pretinieka roku, visbiežāk tiek veikts check back vai likts mazs sizing.
  2. Ja riverā handa pārspēj 95% pretinieka roku un pretiniekam ir vismaz 10% ļoti stipru roku, tiek likts all-in.

Šie noteikumi vairāk piemēroti shortstacked spēlei, bet ideju var saglabāt. Ņemt thin value riverā bieži neatnesīs daudz peļņas, jo pastāv iespēja tikt pārspētam. Savukārt, ja ir vismaz otrā stiprākā roka riverā un pretiniekam ir stipras rokas savā diapazonā šādā situācijā, var likt vairāk nekā pot bet vai iet all-in. Protams, spēlēs, kurās ir vairāk nekā 50 BB stacki, bieži nebūs nepieciešams šaut all-in.

Daži blakus aspekti no lēmumu koka – mākslīgais intelekts gandrīz nekad neiet uz showdown (necheckbackina), ja viņu roka nepārspēj 16% pretinieka roku. Parasti tās būs vienkārši vājas augstās kārtis. Šādā gadījumā viņi liek vismaz pusi bankas. Citās situācijās mākslīgais intelekts izvēlas ļoti mainīgu bet sizing. Viena vai otra kopība parādās tikai no stipras value spēles – ja ir stipra roka, gandrīz vienmēr tiek likts vismaz pot bet sizing.

Protams, mākslīgā intelekta spēlei ir daudz ierobežojumu, tāpēc šos noteikumus nevajadzētu pieņemt bez ierunām. Vairumā gadījumu spēlēsim pret vājākiem vai vidēja stipruma regulāriem spēlētājiem, nevis pret super-GTO augstākā līmeņa pokera meistariem. Šos noteikumus vajadzētu paturēt prātā, taču jāatceras, ka vairāk peļņas vienmēr nesīs exploitative spēle.

Kur vislabāk spēlēt pokeru?