Ein Mann nimmt seine Flinte, schießt wahllos ein paar Löcher in seine Scheune, zeichnet danach eine Zielscheibe um die Löcher und erklärt sich zu einem Scharfschützen.
So in etwa funktioniert der texanische Scharfschützen-Trugschluss, zu deutsch auch Zielscheibenfehler genannt. Was genau das ist und was das mit Poker zu tun hat, soll dieser Artikel beleuchten.
Der Scharfschützen-Trugschluss
Der Scharfschützen-Trugschluss lauert überall dort, wo man mit einer vergleichsweise großen Menge an Daten zu tun hat und diese nicht sauber genug auswertet. Bei diesem Trugschluss werden Daten zunächst auf eine Menge Dinge getestet und erst danach wird eine Hypothese formuliert. Diese ist dann genau so gewählt, dass sie zu den getesteten Daten passt.
Nehmen wir ein einfaches Beispiel für diesen Trugschluss: An einer Schule mit 1.000 Schülern lassen wir jeden Schüler zehnmal eine Münze werfen. Für jeden Wurf von “Zahl” bekommt ein Schüler einen Punkt. Die Wahrscheinlichkeit, dass ein einzelner Schüler 10 Mal hintereinander Zahl wirft, beträgt etwa 1 zu 1.000. Im Schnitt dürfte also einer der tausend Schüler zehn Mal Zahl werfen und 10 Punkte bekommen. Ein Scharfschützen-Trugschluss wäre es nun, diesen einen Schüler im Nachhinein als besonders talentierten Münzwerfer zu präsentieren, da er die meisten Punkte geworfen hat. Es war rein zufällig, dass dieser Schüler zehn Mal Zahl warf und das Ergebnis lässt keinen Rückschluss auf das Münzwurf-Talent des Schülers zu.
Dieses Münzwurf-Beispiel ist noch sehr einleuchtend, da schon im Vorfeld recht klar ist, dass das Ergebnis eines Münzwurfes zufällig ist. Aber der Scharfschützen-Trugschluss kommt ebenso bei weit weniger offensichtlichen Dingen zum Tragen, wie folgendes Beispiel zeigt:
Der Scharfschützen-Trugschluss in Praxis: Leukämie und Stromleitungen
Eines der bekanntesten Beispiele für einen solchen Trugschluss stammt von einer schwedischen Studie aus dem Jahr 1992. Diese Studie untersuchte über einen Zeitraum von 25 Jahren alle schwedischen Haushalte, die in der Nähe einer Hochspannungsleitung wohnten auf verschiedenste Krankheiten.
Stromleitungen und LeukämieAm Ende stellte sich heraus, dass Kinder, die in der Nähe von Hochspannungsleitungen lebten, etwa viermal so häufig an Leukämie erkrankten, wie andere Kinder.
Schnell war ein sehr pressewirksames Fazit der Studie gefunden: Hochspannungsleitungen führen zu einem drastisch gesteigerten Leukämie-Risiko bei Kindern.
In Folge wurde viel Geld für Ursachenforschung ausgegeben und unzählige weitere Studien zu dem Thema in Auftrag gegeben.
Allerdings konnte keine weitere Studie die Verbindung zwischen Leukämie und Hochspannungsleitungen bestätigen. In allen folgenden Studien zeigten die Kinder unter Hochspannungsleitungen die gleichen Leukämie-Raten wie Kinder, die nicht in der Nähe solcher Leitungen wohnten.
Der Fehler der Studie
Das Ergebnis der ursprünglichen Studie bestätigte sich nicht. Was war hier der Fehler?
Die schwedische Studie untersuchte nicht nur Leukämie, sondern über 800 verschiedene Krankheitsbilder. Die Ergebnisse wurden dann auch noch auf verschiedene Altersgruppen und die beiden Geschlechter verteilt. In Folge hatte man mehrere tausend Krankheiten (Durchfall bei Frauen, Grippe bei Alten, Leukämie bei Kindern, etc.), die eventuell mit Hochspannungsleitungen in Verbindung stehen könnten.
Bei so vielen verschiedenen Datenpunkten wird rein statistisch mindestens einer eine signifikante Abweichung aufweisen, ohne dass dies mit der Gegebenheit der Hochspannungsleitungen etwas zu tun hat.
Die Autoren der Studie begingen den Fehler, ohne eine Hypothese Daten zu sammeln und erst im Nachhinein eine Hypothese zu formulieren, die zu den Daten passte.
Genauso gut hätte die Studie erhöhte Durchfallraten bei Frauen oder Grippe-Erkrankungen bei Alten aufzeigen können und dann wäre diese Verbindung eben der Titel der Studie geworden.
Dass es nun Leukämie bei Kindern war, war rein zufällig. Im Mindestens hätte man die Hypothese, dass Hochspannungsleitungen zu Leukämie führen, an einer weiteren Personengruppe testen müssen, um dem Scharfschützen-Fehler zu entgehen.
So stellte diese Studie eine Verbindung zwischen Dingen her, die es gar nicht gab und sorgte unnötig für Angst und Irritationen.
Der Scharfschützen-Trugschluss und Poker
Beim Poker kann es bei der Auswertung von Daten und Spielweisen sehr schnell passieren, dass man eben diesem Scharfschützen-Trugschluss erliegt.
Pokertracker DatenInsbesondere wenn man online mit einem Tracker spielt und sein Spiel auswertet, sollte man die Auswertung einzelner Datenpunkte immer mit einer Prise Vorsicht genießen.
Nehmen wir zum Beispiel einen Spieler, der ein paar hunderttausend Hände gespielt hat und sich nun seine Gewinnraten für einzelne Hände ansieht. Insgesamt gibt es beim Texas-Hold’em 169 verschiedene Hände (13 Paare und je 78 ungepaarte Karten suited und off-suit). Stellt dieser Spieler nun fest, dass er mit einer bestimmten Hand, etwa AJo, weniger gewinnt als mit einer eigentlich schlechteren Hand, etwa ATo, könnte er versucht sein, sofort zu schlussfolgern, dass er diese Hand überspielt.
Bei so einer Schlussfolgerung erliegt man dem Scharfschützen-Trugschluss: Wenn man 169 Datenpunkte zum Analysieren hat, wird man rein statistisch mindestens einen finden, der zufällig ein gutes Stück vom erwarteten Mittel abweicht. Aus so einer Abweichung ad hoc Rückschlüsse zu ziehen, kann verfehlt sein. Im Beispiel sollte sich der Spieler zumindest die AJo-Hände einmal genauer ansehen, um zu evaluieren, ob die Vermutung, dass er die Hand überspielt, stimmt. Es kann nämlich gut sein, dass er nur ein paar Mal häufiger in ein böses Setup oder einen Bad Beat gelaufen ist, aber ansonsten alles in Ordnung ist mit seiner Spielweise dieser Hand.
Fatal wäre es unter gewissen Umständen, von den nackten Daten ohne Hinterfragen Rückschlüsse über das eigene Spielvermögen anzustellen. Angenommen ein Spieler spielt über einen längeren Zeitraum verschiedene Sit-And-Gos (180-Mann-Turbos, Heads-Up, Satellites, Fifty50s, etc.). Nach ein paar tausend Turnieren schaut er sich seine Gewinnraten an und spielt in Folge nur noch den Sit-And-Go-Typ, bei dem er die höchste Gewinnrate hatte.
Auch dies ist ein Scharfschützen-Trugschluss. Notwendigerweise hat irgendein Typ die höchste Gewinnrate, aber daraus die Schlussfolgerung ziehen, dass man diesen Typus am besten beherrscht, ist voreilig. Es ist zwar wahrscheinlicher, dass man diesen Typus besser beherrscht als einen anderen, aber der Zufall spielt auch hier eine große Rolle. Am Ende hat man eben nur den Typen genommen, über den man die höchste Gewinnrate über eine gewisse Anzahl von Turnieren hatte. Für die Spielstärke bei diesem Turnier-Typ ist dies nur ein Indikator und je weniger Turniere man als Grundlage hat und je mehr verschiedene Typen man gespielt, desto schwächer ist dieser Indikator.
Scharfschützen und Rigged-Theorien
Gerne gesehen wird der Scharfschützen-Trugschluss auch bei Rigged-Vermutungen, enttarnt diese aber häufig als einen statistischer Fehlschluss.
Nehmen wir zum Beispiel einen Spieler, der 60.000 Hände Texas-Hold’em an 6-Max-Tischen gespielt hat und nun einmal zusammenzählt, wie häufig er welche Paare an welcher Position bekommen hat.
Er hat an jeder Position 10.000 Hände gespielt und sollte im Schnitt so jedes Paar rund 45 Mal pro Position erhalten haben. Aber natürlich spielt auch hier der Zufall eine Rolle, wie genau diese Verteilung aussieht.
Wir haben einmal 60.000 Hände simuliert und die Anzahl der Paare pro Position festgehalten. Die Verteilung sieht wie folgt aus:
BB | SB | BU | CO | UTG+1 | UTG | Gesamt | |
AA | 49 | 47 | 37 | 30 | 48 | 56 | 267 |
KK | 53 | 42 | 38 | 30 | 60 | 46 | 269 |
38 | 48 | 52 | 54 | 42 | 42 | 276 | |
JJ | 39 | 53 | 50 | 54 | 39 | 49 | 284 |
TT | 48 | 47 | 41 | 37 | 47 | 44 | 264 |
99 | 51 | 55 | 48 | 29 | 37 | 36 | 256 |
88 | 36 | 45 | 34 | 48 | 49 | 56 | 268 |
77 | 40 | 47 | 53 | 49 | 42 | 36 | 267 |
66 | 48 | 60 | 41 | 47 | 49 | 45 | 290 |
55 | 40 | 52 | 43 | 49 | 56 | 48 | 288 |
44 | 50 | 44 | 44 | 30 | 49 | 52 | 269 |
33 | 41 | 44 | 46 | 33 | 47 | 49 | 260 |
22 | 38 | 39 | 51 | 43 | 41 | 39 | 251 |
Schaut man sich die Verteilungen an, stellt man fest, dass man in der Cut-Off-Position nur 30 Mal Asse und 30 Mal Könige bekommen hat. Zu erwarten waren 45 – die tatsächliche Verteilung ist also über 30 Prozent unter dem Erwartungswert. Die Wahrscheinlichkeit für eine solche Abweichung liegt bei unter einem Prozent.
Ein Fehler wäre es, nun genau diese beiden Datenpunkte zur Hypothese zu erheben: Am Cut-Off bekomme ich viel zu wenige Asse und Könige, da stimmt doch etwas nicht!
Genau das ist der Scharfschützenfehler: Von den vorhandenen 78 Datenpunkten wurden einfach die 2 mit der signifikantesten Abweichung genommen und deren Abweichung als inhärente Besonderheit herausgestellt. Dem ist aber nicht so. Irgendetwas weicht immer ab, wenn man eine Menge Daten hat und man kann aus der nackten Abweichung allein nur sehr bedingt Rückschlüsse auf die Ursachen ziehen, denn diese können schlicht dem Zufall geschuldet sein.
Natürlich reicht der Scharfschützenfehler nur bis zu einer gewissen Grenze. Stellte man in obigem Beispiel fest, dass man nur 15 Mal Asse auf dem Cut-Off bekam, wäre diese Abweichung allein wesentlich aussagekräftiger. Denn die Wahrscheinlichkeit für eine solche Abweichung liegt bei 1 zu 400.000. Wichtig ist es, den Rahmen der Abweichung zu kennen und zu wissen, wie viele verschiedene Datenpunkte untersucht wurden, um sinnvolle Aussagen zur Korrektheit des Systems treffen zu können.
Einzelne Datenpunkte allein sagen über Spielverhalten, Gesetzmäßigkeiten und (Un-)Regelmäßigkeiten beim Spiel nur etwas aus, wenn man den Kontext kennt. Betrachtet man sie ohne diesen, können sie zu statischen Fehlschlüssen führen und komplett gehaltlos sein.
Dieser Artikel erschien auf PokerOlymp am 11.04.2016.