Znanost o pokru: kaj se lahko naučimo od umetne inteligence?

Tokrat si bomo ogledali nekoliko drugačen članek, v katerem avtorji poskušajo razviti pravila za poker z algoritmi globokega učenja. Po igranju igre z umetno inteligenco Claudico in Libratus so ugotovili, da je najmočnejši del igre reševanje situacij v riverju. Cilj avtorjev tega članka je analizirati odločitve programov v riverju in ustvariti razumljiva pravila.

Za ta poskus sta bili napisani dve enaki umetni inteligenci brez vnaprej določenih pravil, razen razumevanja moči karte. Takšni pogoji omogočajo odkrivanje novih načinov reševanja situacij v pokru, saj ne vključujejo znanja običajnih igralcev. Sama programa sta se učila le drug od drugega z igranjem 100 000 iger Heads-Up No-Limit.

Res je, da so avtorji do neke mere omejili možnosti igre, zato je treba ugotovitve jemati z rezervo. Dodatne omejitve igre so bile naslednje:

  1. Karte se analizirajo glede na njihovo lastno in nasprotnikovo moč v river situacijah v odstotkih (tj. koliko nasprotnikovega razpona je preseženega).
  2. Obravnavane so le razmere na rekah. Ta omejitev ne spreminja veliko glede prve omejitve.
  3. Analizirana sta le check/call in check/fold. To je verjetno najbolj spreminjajoča se omejitev, saj sta izključeni situaciji donk in raise.
  4. Igra se z vrtljivim kompletom 10 kart. Ta omejitev načeloma ne spremeni ničesar glede na drugo in prvo omejitev, temveč le zmanjša drevo odločanja.
  5. Analiza igre v položaju.

Po 100.000 simulacijah so opazovali naučeno igro in jo predstavili v obliki zapletenega drevesa odločanja:

Avtorja iz igre umetne inteligence izpeljeta dve osnovni pravili:

  1. Če river kombinacija premaga nasprotnikovo kombinacijo med 20% in 80%, se običajno uporabi check back ali majhna velikost.
  2. Če river kombinacija premaga 95% nasprotnikovih kombinacij in ima nasprotnik vsaj 10% zelo močnih kombinacij, je igralec all-in.

Ta pravila so primernejša za igro s kratkimi skladovnicami, vendar je mogoče idejo ohraniti. Če v riverju vzamete majhno vrednost, to pogosto ne prinese veliko dobička zaradi možnosti, da boste premagani. Medtem ko lahko v primeru, ko imate na riverju vsaj drugo najmočnejšo kombinacijo in ima nasprotnik v tej situaciji močne kombinacije v svojem razponu, stavite več kot pot ali pa greste all-in. Seveda vam v igrah z več kot 50 BB žetoni pogosto ne bo treba iti all-in.

Nekaj stranskih točk iz drevesa odločanja - UI skoraj nikoli ne gre v razkritje (necheckbackina), če se njena kombinacija ne dotika nasprotnikove kombinacije 16%. Običajno gre le za šibke visoke karte. V tem primeru bodo stavili vsaj polovico pota. V drugih primerih umetna inteligenca izbere zelo močno spreminjajočo se velikost stav. Še ena skupna značilnost izhaja le iz igre z močno vrednostjo - če je na voljo močna kombinacija, je skoraj vedno vsaj pot bet sizing.

Seveda ima umetna inteligenca veliko omejitev, zato teh pravil ne smete jemati zlahka. V večini primerov bomo igrali proti šibkejšim ali srednje močnim običajnim igralcem in ne proti vrhunskim mojstrom pokra super-GTO. Ta pravila je treba upoštevati, vendar ne pozabite, da bo izkoriščevalska igra vedno prinesla več dobička.

Kje je najboljši kraj za igranje pokra?