Anfang dieses Jahres erschütterten die Erfolge von Libratus und Deepstack die Pokerwelt: Poker-Bots bezwangen Poker-Profis im Heads-Up-No-Limit-Hold'em und demonstrierten dabei eine beeindruckende Gewinnquote.
An der Universät Kopenhagen arbeitet Professor Troels Bjerre Lund und er war 2008 Teil der Forschungsgruppe, die an der Carnegie Mellon University den Grundstein für das Programm legte, welches dieses Jahr unter dem Namen Libratus weltweit Berühmtheit erlangte und seine vier menschlichen Gegenspieler vernichtend schlug. (» Libratus Poker Bot bezwingt Profi-Spieler)
Unser Kollege Thomas Hviid hat sich mit Bjerre Lund über die Entwicklung der Poker-Bots unterhalten:
Was ist der Bezug Ihrer bisherigen Arbeit und dem Pokerspiel?
Troels Bjerre Lund: Als ich mit meinem Ph.D.-Studium an der Universität Aarhus anfing, beschäftigte ich mich mit Algorithmen, die Spielstrategien erstellen. "Spiel" meinte hierbei alle möglichen strategischen Situationen und nicht nur die Spiele, die wir Menschen üblicherweise gegeneinander spielen.
Mein Doktorvater war am Pokerspiel interessiert und bat mich um eine spezifische Analyse von Turnierpoker. Es ging hierbei um die Berechnung von fast-optimalen Strategien für die Spätphase von Turnieren wenn die Blinds hoch sind und nur noch zwei Spieler übrig sind.
Während meines Ph.D.-Studiums hatte ich einen Forschungsaufenthalt an der Carnegie Mellon University in Pittsburgh, wo es eine Forschungsgruppe gibt, die an Lösungen für Pokerspiele forscht. Ich war in der Gruppe, die Programme entwickelte, die in der jährlichen AAAI-Computer-Poker-Meisterschaft antraten.
Das Programm an dem ich mitgearbeitet hatte, war sehr gut und gewann in dem Jahr in der Kategorie Bankroll für Texas Hold'em. Das heißt, es hatte die höchste Gesamtsumme gegen alle anderen Programme gewonnen.
Warum ist Poker ein interessantes Spiel für künstliche Intelligenz und Spieltheorie?
Damit verschiedene Forschungsgruppen ihre Algorithmen vergleichen können, es wichtig, einen identischen Maßstab zu haben. Poker ist hier aus verschiedenen Gründen sehr geeignet. Das Spiel umfasst viele Aspekte, die strategische Entscheidungen schwierig machen:
- Zufall und Unsicherheit: Niemand weiß, welche Karten in der nächsten Runde kommen.
- Unbekannte Informationen: Du weißt nicht, welche Karten dein Gegner hat.
- Riesige Entscheidungsbäume: dadurch, dass es so viele mögliche Kartenverteilungen gibt, kann man nicht einfach alle möglichen Situationen gleichberechtigt untersuchen.
Poker ist auch kulturell fundiert, so das es einfacher ist, die Algorithmen Nicht-Spezialisten zu erklären, denn das generelle Problemfeld ist leicht zu verstehen.
Hat es Sie überrascht, dass ein Computer bereits im Jahr 2017 die besten Pokerspieler mi Heads-Up bezwingen konnte?
Es hat mich überrascht, dass dies im No-Limit möglich war. Vor zwei Jahren wurde das gleiche Problem für Limit-Hold'em jedoch bereits stärker gelöst.
Hat es Sie überrascht, dass Libratus so hoch gewonnen hat?
Nein, nicht beim No-Limit. Ich habe in dieser Variante große Verbesserungen erwartet und sobald der Computer besser spielt als die Menschen, sind auch diese Größenordnungen zu erwarten. Ich hatte allerdings nicht damit gerechnet, dass dies bereits in diesem Jahr geschieht.
Wenn Sie sich das Spiel von Libratus ansehen, hatte es irgendwelche Schwächen?
Über die ersten Tage sah es so aus, doch dies wurde schnell korrigiert. No-Limit-Hold'em hat eine so große Zustandskomplexität, dass es keine guten Algorithmen gibt, um Schwächen zu finden. Deswegen ist es schwer zu sagen, ob Libratus bereits eine fehlerfreie Strategie gefunden hat. Dies scheint jedoch unwahrscheinlich, denn es ist bekannt, dass die benutzten Algorithmen Schwachstellen haben.
Wie wird Ihrer Meinung nach der nächste Schritt bei der künstlichen Intelligenz und Poker aussehen?
Ich denke, im Laufe der Zeit wird Heads-Up als Maßstabsspiel verschwinden. Mit den jüngsten Resultaten haben wir eine gute Vorstellung davon, wie man die Probleme dieses Spiels lösen kann.
Ist es nur eine Frage der Zeit bevor Bots auch Full-Ring oder gar ganze Turniere gewinnen?
Sobald mehr als zwei Spieler beteiligt sind, ist nicht mehr klar, wie man die Spielqualität eines Spielers einschätzen soll. Heads-Up ist ein sehr einfaches Null-Summen-Spiel: Die Interessen und Ergebnisse der Spieler sind diametral und es ist das gleiche, ob ein Spieler versucht zu gewinnen, oder versucht, uns zum Verlieren zu bringen.
Haben wir jedoch mehr als einen Gegner, ist diese Verbindung nicht mehr gegeben. Wenn all deine Gegner gegen dich spielen, hast du – egal wie gut du bist – keine Chance.
Es ist hier einfach nicht klar, in welche Richtung das Programm optimieren soll und wie man es bewertet.
Stehen wir vor dem Ende von Online-Poker?
Heads-Up auf jeden Fall. Das Ende ist da. Full-Ring wird dies möglicherweise auch bald gelten.
Spielen Sie selbst online?
Nein, seit zehn Jahren nicht mehr und ich war nie gut. Es ist für mich leichter, ein Programm zu schreiben, das besser spielt. Am Live-Tisch spiele ich aber ab und zu mit ein paar Freunden über einem Bier.
In diesem englischen Video-Cast geht Troels Bjerre Lund detailliert auf die Entwicklung von Poker-Bots ein:
Dieser Artikel erschien auf PokerOlymp am 30.03.2017.