Wissenschaft über Poker: Was können wir von künstlicher Intelligenz lernen?

Diesmal werden wir einen etwas anderen Artikel besprechen, dessen Autoren versuchen, geeignete Regeln für Poker zu erstellen, basierend auf Algorithmen von Deep-Learning-Programmen. Nach den Spielen der künstlichen Intelligenzen Claudico und Libratus wurde festgestellt, dass ihre stärkste Seite die Entscheidungen in Riversituationen sind. Die Autoren des Artikels versuchen, die Entscheidungen der Programme im River zu analysieren und verständliche Regeln zu erstellen.

Für dieses Experiment wurden zwei identische künstliche Intelligenzen geschrieben, die keine vorgegebenen Regeln hatten, außer dem Verständnis der Kartenstärke. Solche Bedingungen ermöglichen es, neue Wege zur Lösung von Pokersituationen zu finden, da das Wissen regulärer Spieler nicht einbezogen wird. Die Programme lernten nur voneinander, indem sie 100.000 Heads-Up No-Limit-Partien spielten.

Allerdings haben die Autoren die Spielmöglichkeiten etwas eingeschränkt, daher sollten die Schlussfolgerungen mit einer gewissen Vorsicht betrachtet werden. Die zusätzlichen Spielbeschränkungen waren wie folgt:

  1. Hände werden nach ihrer und der Stärke des Gegners in Riversituationen prozentual analysiert (d.h. wie viel des gegnerischen Ranges übertroffen wird).
  2. Es werden nur Riversituationen gelöst. Diese Einschränkung ändert sich kaum aufgrund der ersten Einschränkung.
  3. Es werden nur Check/Call und Check/Fold analysiert. Wahrscheinlich die am meisten verändernde Einschränkung, da Donk- und Raise-Situationen ausgeschlossen werden.
  4. Es wird mit einem variablen 10-Karten-Deck gespielt. Diese Einschränkung ändert sich im Wesentlichen nicht aufgrund der zweiten und ersten Einschränkung, sondern reduziert nur den Entscheidungsbaum.
  5. Es wird das Spiel in Position analysiert.

Nach 100.000 Simulationen wurde das erlernte Spiel beobachtet, das in einem komplexen Entscheidungsbaum dargestellt wird:

Die Autoren leiten aus dem Spiel der künstlichen Intelligenz zwei Hauptregeln ab:

  1. Wenn die Hand im River 20% bis 80% der Hände des Gegners schlägt, wird meistens ein Check Back gemacht oder eine kleine Bet gesetzt.
  2. Wenn die Hand im River 95% der Hände des Gegners schlägt und der Gegner mindestens 10% sehr starke Hände hat, wird All-In gesetzt.

Diese Regeln eignen sich eher für das Shortstack-Spiel, aber die Idee kann beibehalten werden. Thin Value im River zu nehmen, bringt oft nicht viel Gewinn, da die Möglichkeit besteht, geschlagen zu werden. Wenn man jedoch mindestens die zweitstärkste Hand im River hat und der Gegner starke Hände in seinem Range hat, kann man mehr als den Pot setzen oder All-In gehen. Natürlich wird man in Spielen mit mehr als 50 BB Stacks selten All-In gehen müssen.

Einige Nebensachen aus dem Entscheidungsbaum – die künstliche Intelligenz geht fast nie zum Showdown (checkbackt nicht), wenn ihre Hand nicht mindestens 16% der Hände des Gegners schlägt. Normalerweise sind dies einfach schwache High Cards. In diesem Fall setzen sie mindestens die Hälfte des Pots. In anderen Situationen wählt die künstliche Intelligenz sehr stark variierende Bet-Sizes. Eine Gemeinsamkeit ergibt sich nur aus dem starken Value-Spiel – wenn man eine starke Hand hat, wird fast immer mindestens Pot-Bet gesetzt.

Natürlich hat das Spiel der künstlichen Intelligenz viele Einschränkungen, daher sollten diese Regeln nicht blind befolgt werden. In den meisten Fällen spielen wir gegen schwächere oder mittelstarke reguläre Spieler, nicht gegen Super-GTO-Pokermeister auf höchstem Niveau. Diese Regeln sollten im Hinterkopf behalten werden, aber man muss sich daran erinnern, dass exploitatives Spiel immer mehr Gewinn bringen wird.

Wo spielt man am besten Poker?