Homepage von Oliver Lenz


Statistik: Das Bayessche Theorem

Geschrieben von Oliver Lenz am 18. Juli 2005 12:36:21, überarbeitet am 02.02.2006

In Ergänzung der Antwort von WW versuche ich jetzt, die Theorie von ,,Bayes`` zu erklären. Das Bayessche Theorem sagt nicht mehr und nicht weniger aus, WIE wir im Lichte neuer Daten unsere Einschätzung von ,,Chancen`` ändern sollten.

Hier das Bayessche Theorem ganz allgemein: Die (neue) Wahrscheinlichkeit P einer Ursache U ergibt sich bei Vorliegen einer Beobachtung B zu


\begin{displaymath}P(U\vert B) = P(B\vert U) \frac{P(U)}{P(B)} \end{displaymath}

(Der senkrechte Strich $\vert$ ist zu lesen als ,,nach ...`` oder ,,bei ...``)

Im Klartext: die Wahrscheinlichkeit einer bestimmten Ursache U bei Vorliegen einer Beobachtung B ist gleich der Wahrscheinlichkeit einer Beobachtung B bei Vorliegen der Ursache U, multipliziert mit dem Quotienten aus Wahrscheinlichkeit der Ursache U und der Wahrscheinlichkeit der Beobachtung B. Wenn verschiedene Ursachen $U_n$ für eine Beobachtung in Frage kommen, so ist $P(B) = \sum_{n} P(B\vert U_n)$, also die Summe aller Wahrscheinlichkeiten der Beobachtung B bei den verschiedenen Ursachen.

Beispiel: Um die Ecke öffnet ein neuer Weinladen. Zwei Personen (A und B) möchten wissen, ob das ein guter oder ein schlechter Weinladen ist. In einem schlechten Weinladen sollen 1/4 aller Weine sauer sein. In einem guten Weinladen hingegen nur 1/20.

Zunächst mal gibt eine ,,Grundüberzeugung``, was solche Weinläden allgemein taugen. Person A hat schlechte Erfahrungen gemacht und bisher auch überwiegend schlechtes gehört. Person A schätzt a priori ein, daß 90% der Weinläden schlecht sind. (A könnte demzufolge eine Wette wie folgt anbieten: ,,Ich setze 9 Euro darauf, daß das ein schlechter Weinladen ist. Setzt jemand 1 Euro dagegen?`` Person B hat bisher nur gute Erfahrungen gemacht, und auch nur ganz wenig schlechtes gehört und schätzt die Chance auf einen schlechten Weinladen a priori nur zu 5%. (B könnte demzufolge eine faire Wette wie folgt anbieten: ,,Ich setze 19 Euro darauf, daß dies ein guter Weinladen ist. Setzt jemand 1 Euro dagegen?``

A und B gehen hin und kaufen sich eine Flasche und stellen beim Trinken fest, daß der Wein sauer ist. Ändert sich ihre Überzeugung? Allerdings! (Schon gefühlsmäßig können wir uns sicher sein, daß A in seiner schlechten Meinung bestärkt ist und in Zukunft diesen Läden noch weniger zutraut, und Person B, mit dem schlechten Geschmack im Hals, ebenfalls von seiner Meinung abrücken wird!) Um welchen GENAUEN Betrag nun die Anfangsüberzeugung im Lichte der neuen Daten (hier die schlechte Flasche Wein) vernünftigerweise geändert wird, genau das ist der Inhalt des Bayesschen Theorems!

Um den Rechengang jetzt möglichst einfach zu halten, nehme ich einfach mal an, daß es nur zwei Arten von Weinläden gibt: Gute Weinladen, wo nur jede hundertste Flasche sauer schmeckt (1%), und schlechte Weinläden, wo schon jede vierte Flasche (25%) Wein sauer schmeckt.

Das Bayessches Theorem sagt nun:

Wahrscheinlichkeit, daß der Laden schlecht ist, NACH DER BEOBACHTUNG, daß die gekaufte Flasche schlecht schmeckt, IST GLEICH Wahrscheinlichkeit, daß die Flasche schlecht ist, BEI DER ANNAHME, daß der Laden schlecht ist, MULTIPLIZIERT mit dem QUOTIENTEN aus Wahrscheinlichkeit eines schlechten Laden allgemein, und der Wahrscheinlichkeit einer sauren Flasche Wein allgemein.

Mathematisch ausgedrückt:

\begin{displaymath}
P(L_{schlecht}\vert W_{sauer}) = P(W_{sauer}\vert L_{schlecht}) \frac{P(L_{schlecht})}{P(W_{sauer})}
\end{displaymath}

Jetzt brauchen A und B nur ihre Werte einsetzen:

Wahrscheinlichkeit einer schlechten Flasche in einem schlechten Laden: 0,25. Wahrscheinlichkeit eines schlechten Ladens:

Die Wahrscheinlichkeit einer schlechten Flasche allgemein, ist hier die Wahrscheinlichkeit einen schlechten Laden vorzufinden, multipliziert mit der Wahrscheinlichkeit, dort eine saure Flasche Wein zu kriegen PLUS der Wahrscheinlichkeit, einen guten Laden vorzufinden, multipliziert mit der Wahrscheinlichkeit, dort eine saure Flasche Wein zu kriegen.

(Im Prinzip werden somit alle Wege abgeschritten, über die die Beobachtung gemacht worden sein kann.)

Für Person A ändert sich die Anfangsüberzeugung (90% Wahrscheinlichkeit, daß der neue Weinladen schlecht ist) in


\begin{displaymath}0,25 \frac {0,9}{0,226} = 0,9956 \to 99,56\% \end{displaymath}

d. h. in die neue Einschätzung von 99,56% Wahrscheinlichkeit dafür, daß das ein schlechter Weinladen ist. A wird sich nun seiner Sache ganz sicher sein und nie wieder einen Fuß über die Schwelle dieses Ladens setzen!

Für Person B ändert sich die Anfangsüberzeugung (5% Wahrscheinlichkeit, daß der neue Weinladen schlecht ist) in


\begin{displaymath}0,25 \frac{0,05}{0,022} = 0,5682 \to 56,82\% \end{displaymath}

d. h. in die neue Einschätzung von 56,82% Wahrscheinlichkeit dafür, daß das ein schlechter Weinladen ist. Das Vertrauen von B in den Weinladen ist zwar deutlich erschüttert, aber sicherlich wird B noch einen zweiten Versuch dort unternehmen.

Wie gesagt, daß Bayessche Theorem sagt nur aus, wie sich die Einschätzungen der Chancen ändern!

Wie hätte A am Anfang gewettet? 9:1 darauf, daß das ein schlechter Weinladen ist. Wie würde er jetzt wetten? 99,56:0,44! Eine Änderung der Wettchancen um den Faktor 25,14!

Wie hätte B am Anfang gewettet? 1:19 darauf, daß das ein schlechter Weinladen ist. Wie würde er jetzt wetten? 56,8:43,2. Eine Änderung der Wettchancen um den Faktor 25,14!

Bayes sagt überhaupt nichts darüber aus, wie die Einschätzung der Chancen am Anfang oder am Ende sein sollen, nur wie sie sich ändern sollten! (Der Änderungsfaktor wird als ,,likelihood ratio`` bezeichnet.)

Und es ist sogar so, daß ohne ,,Vorurteil`` (A: 90%, B: 5%) ein ,,Lernen`` aus den neuen Daten nicht möglich ist! Man versuche nur mal, eine Wahrscheinlichkeit für einen schlechten Laden auszurechnen, wenn man keinen Startwert hat (d. h. bei völliger Unkenntnis von Wein und Weinläden). Das geht nicht!

Aber offensichtlich enthält ,,Bayes`` einen ,,subjektiver Faktor``. Denn A und B haben unterschiedliche Werte erhalten, obwohl sie die gleichen neuen Daten berücksichtigt haben.

Genau deshalb wurde das Bayessche Theorem kritisiert. Subjektivität in der Wissenschaft!? Niemals!!!!!

Doch, das geht, und das geht sogar viel besser, als jede andere Methode.

Und was hat Bayes mit der Medizin zu tun?

Neue Daten (ob saure Flasche Wein, oder positives AIDS-Test, oder eine signifikante Betaferon-Studie) ergeben nur dann eine sinnvolle neue Einschätzung der Sachlage, wenn vorher Grundannahmen existieren. Das kann die rein subjektive Einschätzung der Häufigkeit von schlechten Weinläden sein. Aber das kann auch die sachliche Information über die mittlere Verbreitung von AIDS sein. Oder die Information über die mittlere Häufigkeit, mit der in Studien ein wirksames Medikament getestet wird.

Und nur mit diesen Zusatzangaben kann aus den Daten (saure Flasche Wein, positiver AIDS-test, positives Studienergebnis) eine Wahrscheinlichkeit dafür ermittelt werden, ob der Laden schlecht ist, ob AIDS vorliegt, oder ob das neue Medikament wirksam ist.


Erste Veröffentlichung: 18.07.2005 Hinweise, Anmerkungen, Fragen? © 2005-2010 Oliver Lenz
Letzte Änderung: 19.02.2010 Kontakt
http://www.cvo6.de

Valid HTML 4.0!