Der Cepheus-Bot ist dank dank ausgeklügelter GTO-Strategien die erste Maschine, die beim Limit-Hold’em unschlagbar ist. Sollten wir Menschen deswegen auch nach GTO spielen und was soll “GTO” überhaupt heißen?
Zunächst zur Begriffsklärung: GTO ist die Abkürzung für Game Theory Optimal – oder auf deutsch: optimal nach Spieltheorie. Die Idee dahinter ist eine einfache: Es gibt verschiedenste Strategien beim Poker und es lässt sich mathematisch zeigen, dass es eine Strategie gibt, die unschlagbar ist – unabhängig davon, wie die Gegner spielen.
Ja, es gibt mit Sicherheit eine unschlagbare Strategie für jede Pokervariante. Insbesondere für Spiele wie No-Limit-Hold’em oder Omaha kennen wir diese Strategie zwar noch nicht, aber wir wissen, dass so eine Strategie existiert. Diese nennen wir GTO-Strategie.
Für eher einfache Poker-Varianten ist man dieser Strategie schon sehr nahe gekommen. Der Cepheus-Poker-Bot spielt Heads-Up Limit-Hold’em de facto spieltheoretisch optimal.
Im Allgemeinen allerdings ist man allerdings noch meilenweit von GTO-Strategien für Poker entfernt. Dazu kommt, dass man diese Strategien nur sehr, sehr schwer angeben kann. Die Cepheus-Stragie ist zum Beispiel eine auf 12 Terabyte komprimierte Datenbank mit Anweisungen für jede einzelne mögliche Spielsituation.
Nichtsdestominder gibt es unzählige einzelne Situationen beim Poker, bei denen Profis von GTO-Spielweisen und Strategien sprechen, etwa bei Turnieren mit hohen Blinds, Bluffs auf dem River, Ranges, Range-Merging und ähnlichen Spezialitäten.
Was genau dieses GTO beim Poker heißt und wozu das gut ist, wollen wir hier ein wenig beleuchten.
GTO bei einfachen Spielen
Um zu verstehen, wie GTO-Strategien funktionieren, schauen wir zunächst auf ein deutlich einfacheres Spiel als Poker: Stein, Schere, Papier.
Hier gibt es eine ganz einfache und unschlagbare GTO-Strategie: Man spielt je in einem Drittel aller Fälle Stein, Schere und Papier. Was man spielt, wählt man zufällig aus.
Eine solche Strategie kann langfristig kein Gegner schlagen, egal wie er spielt.
Allerdings ist das auch schon alles, was diese GTO-Strategie kann. Sie gewinnt auf lange Sicht keine Spiele, sondern stellt nur sicher, dass man nicht verliert.
GTO beim Poker
Beim Poker spricht man – wenn man nicht grade Limit-Hold’em-Bots programmiert – nur in einzelnen, konkreten Situationen von GTO-Strategien.
Das sind dann Strategien der Natur: “Du solltest hier mit 35,3 Prozent Deiner Hände raisen.”
Zum Beispiel sind reine Push-Fold-Situationen mit zwei Spielern nach GTO-Strategien gelöst. Siehe » Korrektes Pushen nach Equilibrium-Strategien.
Ein Beispiel für diese Strategie: Man sollte bis zu einem Stack von 7,7 Big Blinds mit 10 3 aus dem Small Blind all-in gehen. Auf der anderen Seite sollte der Big Blind ein All-in mit der selben Hand callen, wenn sein Stack weniger als 4,8 Big Blinds umfasst.
Spielt man nach diesen Strategien, die in diesem konkreten Fall nichts anderes als Push-Fold-Tabellen sind, stellt man sicher, dass der Gegenspieler auf lange Sicht nicht gegen einen gewinnen kann.
Natürlich kann man immer noch Pech haben und verlieren, aber wiederholt man die selbe Situation oft genug, sind diese oben verlinkten Push-Fold-Strategien nach Equilibrium unschlagbar. Das heißt aber nicht, dass eine GTO-Strategie immer die beste Strategie ist, wie wir jetzt zeigen werden:
Anpassen bringt meistens mehr als GTO
Kehren wir zum Spiel Stein, Schere, Papier zurück und nehmen wir an, wir haben einen Gegner gefunden, der niemals Papier spielt, sondern zufällig zwischen Stein und Schere auswählt.
Die oben angegebene GTO-Strategie (jeweils mit einem Drittel eine der drei Optionen spielen) gewinnt im Schnitt jedes dritte Spiel gegen diesen Spieler, spielt jedes dritte Unentschieden und verliert jedes dritte.
Allerdings können wir wesentlich besser abschneiden, indem wir einfach immer Stein spielen. Dann gewinnen wir jedes zweite Spiel (wenn er Schere spielt) und spielen ansonsten unentschieden (wenn er ebenfalls Stein spielt).
Dies wäre eine anpassende Strategie und diese schneidet gegen diesen spezifischen Gegner wesentlich besser als die GTO-Strategie ab.
Ebenso funktionieren Strategien auch beim Poker. Weiß man, wie der Gegner spielt, sind GTO-Strategien selten die besten. Denn besser sind die Strategien, die sich dem Gegner anpassen.
Nehmen wir die oben verlinken Push-Fold-Tabellen nach Equilibrium-Strategien – hat man zum Beispiel einen Gegner, der auf GTO und Equilibrium pfeift und einfach nur mit den besten 10% aller Hände all-in geht, wäre es fatal, mit Zehn-Drei ein All-In zu callen, auch wenn die Strategie das empfehlen würde. Man gewinnt gegen einen solchen Spieler, indem man aggressiver all-in geht und tighter callt.
Eine GTO-Strategie würde gegen diesen Gegner langfristig auch gewinnen, aber mit einer anpassenden Strategie gewinnt man wesentlich mehr.
Wozu braucht man GTO dann überhaupt?
Abgesehen von Limit-Hold’em-Bots spielt niemand nach GTO-Strategien und dies wird auch in Zukunft nicht passieren.
Allerdings haben spieltheoretische Überlegungen durchaus eine große Relevanz beim Poker.
Spielen die selben spielstarken Gegner sehr häufig gegeneinander, versuchen diese immer auf’s neue die Strategie der Mitspieler zu schlagen und es werden neue Konter-Strategien entwickelt. Die Strategien entwickeln sich dabei immer weiter und nähern sich einer spieltheoretisch optimalen Strategie an. Das ist genau das was passiert, wenn starke Spieler versuchen, Schwächen bei den anderen auszunutzen – die Spieler versuchen Strategien zu finden, die möglichst wenige Schwächen offenbaren. Und GTO-Strategien sind genau das: Strategien ohne Schwächen.
Sprich: Für Spieler, die immer wieder gegen die selben Gegner (oder Gegnerpool) antreten, die versuchen Schwächen am eigenen Spiel auszunutzen, sind GTO-Strategien sehr relevant.
Darüber hinaus bieten GTO-Strategien eine hilfreiche Orientierung für Otto-Normal-Spieler. Am weitesten sind diese bei den Push-Fold-Tabellen – zumeist für Turniere – entwickelt und auch wenn diese Tabellen selten die beste Strategie gegen spezifische Gegner aufzeigen, bieten diese ein durchaus relevantes Sicherheitsnetz bei Strategien.
Ein sehr einfaches Beispiel: Sitzt man mit einem Stack von 20 Big Blinds im Small Blind, alle folden zu einem und man findet A 6 , ist es rein rechnerisch korrekt, All-In zu gehen. Zumindest hat ein Push einen höheren Erwartungswert, als ein Fold. Das gilt unabhängig davon, wie der Gegner im Big Blind spielt. Ob ein All-In für 20 Big Blinds nun der absolut beste Spielzug ist, steht auf einem anderen Blatt, aber verkehrt ist es auf alle Fälle nicht.
Überlegungen dieser Natur sind der wichtigste Hintergrund zu GTO-Strategien. Diese zeigen eine Spielweise auf, bei der man immerhin sicher sein kann, dass sie nicht verkehrt ist. Je nach Gegner und konkreter Spielsituation kann man dann gegebenenfalls von dieser Strategie abweichen.
» GTO-Pushen nach Equilibrium-Strategien
» Pushen nach Sklansky-Chubukov+
Dieser Artikel erschien auf PokerOlymp am 09.03.2015.