Das Thema künstliche Intelligenz wird immer brisanter. Nach und nach erobern Computerprogramme klassische Bastionen menschlichen Denkens. Die Programme wurden immer besser, Schachspieler Garry Kasparov verlor schon vor Jahren gegen Deep Blue von IBM, Go-Champion Lee Sodol unterlag gegen Alpha Go von Google.
Zu Beginn dieses Jahres verloren die hervorragenden Heads-Up-No-Limit-Spieler Dong Kim, Jason Les, Jimmy Chou und Daniel McAuley eine Challenge gegen das Programm "Libratus", das von einem Team der Carnegie Mellon University Pittsburgh entwickelt wurde.
Nach 20 Tagen waren 120.000 Hände gespielt und das Ergebnis war eindeutig: Libratus gewann gegen jeden Spieler und das mit einer Quote von $14,72 pro Hand. Die Sensation war perfekt, zumindest die Variante Heads-Up-No-Limit schien 'gelöst'.
Programmierer Noam Brown erklärt
Jetzt hat ein Entwickler von Libratus ausgepackt und in einem ausführlichen Podcast verraten, wie sie dem Programm das Bluffen und mehr beigebracht haben. Gerade das Bluffen gilt vielen im Poker als besondere Leistung, da man mit nichts oder wenig auf der Hand abräumen kann. Laut Noam Brown ist das Bluffen aber vor allem ein mathematisches Problem:
"Ich werde immer wieder gefragt, wie man einer künstlichen Intelligenz beibringen kann, zu bluffen wie ein Mensch. Die Leute haben diese Vorstellung, dass Bluffen ein sehr menschliches Verhalten ist, das von einer künstlichen Intelligenz nicht nachgeahmt werden kann.
In Wirklichkeit ist es aber so, dass das Bluffverhalten und eigentlich auch die ganze Pokerstrategie sehr mathematisch ist und man deswegen auch sehr gute Strategin erarbeiten kann. Wir haben eine perfekte Strategie für Heads-Up erstellt, indem wir bestimmte Algorithmen verwendeten.
Natürlich ist das Ganze nicht einfach, es ist viel schwerer als bei Spielen wie Schach oder Go. Insofern haben die Leute natürlich Recht, dass es für die künstliche Intelligenz im Poker weitaus schwerer ist. Es ist aber möglich.
Die Leute haben diese Idee, dass die Computer in einigen Sachen gut sind und die Menschen in anderen. Oft liegen die Leute aber bei diesen Kategorien falsch, sie dachten ja in der Vergangenheit auch, dass eine künstliche Intelligenz niemals Schach oder Go schlagen kann. Bis vor kurzem dachten sie auch, dass Poker nicht geschlagen werden kann. Es zeigte sich aber, dass ein Computer in all diesen Feldern überlegen sein kann."
Vor allem in späteren Wettrunden könne der Computer laut Brown glänzen: "Die künstliche Intelligenz ist sehr gut darin, den Turn und den River zu spielen. Weitaus besser als ein Mensch. Man kann hier sehr ausgefeilte Taktiken verwenden, die normalen Menschen quasi nicht zugänglich sind.
Man nehme zum Beispiel das Blockieren, hat man beispielsweise das Pik-Ass auf der Hand, kann der Gegner keinen Ace-High-Spade-Flush haben. Hier vergisst die künstliche Intelligenz im Gegensatz zu Menschen nichts und das war eine der Hauptstärken in der Challenge."
Wie entwickelt man eine Strategie?
An anderer Stelle sagt er: "Wenn man im Poker weit in der Hand ist, wird es sehr hart für einen Computer oder einen Menschen, da es so viele hypothetische Situation gibt, die man überdenken muss, um eine Strategie zu entwickeln.
Man könnte das ganze Meta-Game nennen, für mich ist es aber das Spiel an sich. Für mich ist das die Essenz des Pokerspiels, man entwickelt eine Strategie für das ganze Spiel, die der Gegner nicht ausnutzen kann.
Das, was wir beim Poker eingesetzt haben, war der so genannte verstärkte Lernprozess. Die Idee dahinter ist, dass das Programm selber lernt. Es beginnt sozusagen bei Null und spielt zunächst nur zufällig gegen sich selber. Dabei absolviert es aber unzählige Hände und nach einer gewissen Zeit tritt eine Verbesserung ein.
Wenn Menschen Poker spielen, passiert etwas Ähnliches. Nach einer gespielten Hand fragen Pokerspieler ihre Freunde zum Beispiel, ob sie bei einer Erhöhung mitgegangen wären. Die A.I. macht im Prinzip genau dasselbe.
In diesen Abermillionen Händen verbessert sich die künstliche Intelligenz genau wie ein Mensch."
Dieser Artikel erschien auf PokerOlymp am 04.10.2017.