Mokslas apie pokerį: Ko galime išmokti iš dirbtinio intelekto?

Šį kartą aptarsime kiek kitokį straipsnį, kurio autoriai siekia sukurti pokeriui tinkamas taisykles remdamiesi deep-learning programų algoritmais. Po dirbtinio intelekto Claudico ir Libratus žaidimo buvo pastebėta, jog stipriausioji jų dalis yra river situacijų sprendimai. Straipsnio autoriai siekia išnagrinėti programų daromus sprendimus riveryje ir sukurti suprantamas taisykles.

Šiam eksperimentui buvo parašyti du identiški dirbtiniai intelektai, kurie neturėjo jokių išankstinių taisyklių, išskyrus supratimą apie kortos stiprumą. Tokios sąlygos leidžia atrasti naujų būdų spręsti pokerio situacijas, kadangi neįtraukiamos reguliarių žaidėjų žinios. Pačios programos mokėsi tik viena iš kitos, žaisdamos 100 000 Heads-Up No-Limit partijų.

Tiesa, autoriai kiek apribojo žaidimo galimybes, todėl išvadas reikėtų priimti su tam tikra atsarga. Papildomi žaidimo apribojimai buvo tokie:

  1. Analizuojamos rankos pagal savo ir oponento stiprumą river situacijose procentaliai (t.y. kiek oponento range dalies lenkiama).
  2. Sprendžiamos tik river situacijos. Šis apribojimas nedaug keičia dėl pirmojo apribojimo.
  3. Analizuojamas tik check/call ir check/fold. Turbūt daugiausiai keičiantis apribojimas, kadangi atmetamos donk ir raise situacijos.
  4. Žaidžiama su kintančia 10 kortų kalade. Šis apribojimas iš esmės nieko nekeičia dėl antrojo ir pirmojo apribojimo, tik sumažina sprendimų medį.
  5. Analizuojamas in position žaidimas.

Po 100 000 simuliacijų stebėtas išmoktas žaidimas, kuris pateiktas sudėtingame sprendimų medyje:

Autoriai iš dirbtinio intelekto žaidimo išveda dvi pagrindines taisykles:

  1. Jei riveryje handas beatina nuo 20% iki 80% oponento rankų, dažniausiai daromas check back arba dedamas mažas sizing.
  2. Jei riveryje handas beatina 95% oponento handų ir oponentas turi bent 10% labai stiprių rankų, dedamas all-in.

Šios taisykles labiau tinka shortstacked žaidimui, bet idėją galima išlaikyti. Imti thin value riveryje dažnai neatneš labai daug pelno dėl galimybės būti beatinamam. Tuo tarpu kai turima bent antra pagal stiprumą ranka riveryje ir oponentas turi stiprių handų savo range tokioje situacijoje, galima dėti daugiau nei pot bet arba eiti all-in. Žinoma, žaidimuose kuriuose yra daugiau nei 50 BB stackai, dažnai neteks šauti all-in.

Keletas šalutinių dalykų iš sprendimo medžio – dirbtinis intelektas beveik niekada neina į showdown (necheckbackina) jei jų ranka nelenkia 16% oponento rankų. Paprastai tai bus tiesiog silpni high cards. Tokiu atveju jie deda bent pusę banko. Kitokiose situacijose dirbtinis intelektas renkasi labai stipriai kintantį bet sizing. Vienas kitas bendrumas atsiranda tik iš stipraus value žaidimo – jei turima stipri ranka, beveik visada dedami bent jau pot bet sizing.

Žinoma, dirbtinio intelekto žaidimas turi daugybę apribojimų, todėl nereikėtų priimti šių taisyklių beatodairiškai. Daugeliu atvejų žaisime prieš silpnesnius arba vidutinio stiprumo reguliarius žaidėjus, ne prieš super-GTO aukščiausio lygio pokerio meistrus. Šias taisykles reikėtų turėti galvoje, tačiau reikia prisiminti, jog daugiau pelno visada atneš exploitative žaidimas.

Kur geriausiai žaisti pokerį?