Vierfeldertafel · Wahrscheinlichkeit

Vierfeldertafel

Tennis-Situation zur Vierfeldertafel

Situation

Wir betrachten eine große Gruppe von Sporttreibenden. Einige Personen sind Tennisprofis, andere nicht.

Außerdem wird betrachtet, ob eine Person linkshändig ist.

Nun analysieren wir die Gruppe nach zwei Merkmalen.

\(A\): Person ist Tennisprofi
\(B\): Person ist linkshändig

Ziel der Vierfeldertafel

Die Vierfeldertafel zeigt, wie sich zwei Merkmale auf vier mögliche Kombinationen verteilen.

So kann man untersuchen, ob zwischen den Merkmalen ein Zusammenhang besteht.

Allgemeine Struktur

Schnittwahrscheinlichkeiten
Zeilenrandwahrscheinlichkeiten
Spaltenrandwahrscheinlichkeiten

Hinweis: Gehe mit der Maus auf eine Zelle in der Tabelle.

\(B\)linkshändig \(\overline B\)nicht linkshändig Summe
\(A\)Tennisprofi \(P(A\cap B)\) \(P(A\cap \overline B)\) \(P(A)\)
\(\overline A\)kein Tennisprofi \(P(\overline A\cap B)\) \(P(\overline A\cap \overline B)\) \(P(\overline A)\)
Summe \(P(B)\) \(P(\overline B)\) \(\frac{200}{200}=1\)
Die inneren Felder heißen hier Schnittwahrscheinlichkeiten: Sie beschreiben UND-Ereignisse wie \(A\cap B\).

Konkrete Vierfeldertafel

\(B\)linkshändig \(\overline B\)nicht linkshändig Summe
\(A\)Tennisprofi 0,03 0,17 0,20
\(\overline A\)kein Tennisprofi 0,07 0,73 0,80
Summe 0,10 0,90 1

Gehe mit der Maus auf eine Zahl in der Tabelle.

Fragestellung

Sind unter Tennisprofis mehr Linkshänder als in der ganzen Sportgruppe?

Baumdiagramm aus der Tafel

Die Zeilenrandwahrscheinlichkeiten bilden die erste Stufe. Die Schnittwahrscheinlichkeiten stehen am Ende der Pfade. Die zweite Stufe ist zunächst unbekannt.

Hinweis: Gehe mit der Maus auf eine Zahl im Diagramm.

Start 1. Stufe 2. Stufe Schnitt Wahrsch. 0,20 0,80 ? ? ? ? S A B B A ∩ B A ∩ B̅ A̅ ∩ B A̅ ∩ B̅ 0,03 0,17 0,07 0,73

Zweites Baumdiagramm

Zu einer Vierfeldertafel gehören immer zwei Baumdiagramme. Im oberen Diagramm haben wir zuerst nach dem Merkmal Tennisprofi aufgeteilt. Jetzt teilen wir zuerst nach dem Merkmal linkshändig auf.

Wie groß ist der Anteil der Tennisprofis unter den Linkshändern?

Hinweis: Gehe mit der Maus auf eine Zahl im Diagramm.

Start 1. Stufe 2. Stufe Schnitt Wahrsch. 0,10 0,90 ? ? ? ? S B A A A ∩ B A̅ ∩ B A ∩ B̅ A̅ ∩ B̅ 0,03 0,07 0,17 0,73

Bedingte Wahrscheinlichkeit

Situation

Eine Schule untersucht den Schulweg.

\(A\): kommt mit dem Fahrrad
\(B\): kommt pünktlich

Vierfeldertafel

\(B\)pünktlich \(\overline B\)nicht pünktlich Summe
\(A\)Fahrrad 0,32 0,08 0,40
\(\overline A\)nicht Fahrrad 0,48 0,12 0,60
Summe 0,80 0,20 1

Gehe mit der Maus auf eine Zahl in der Tabelle.

Schreibweise

\(P(B\mid A)\) liest man: Wahrscheinlichkeit von \(B\), wenn \(A\) gilt.
Oder kürzer: Anteil von \(B\) unter allen \(A\).

Der Strich bedeutet nicht „geteilt durch“.

Er bedeutet: unter der Bedingung.

Im Beispiel

\(P(B\mid A)\) bedeutet:

Wahrscheinlichkeit, dass jemand pünktlich kommt, wenn diese Person mit dem Fahrrad kommt.

Also: Unter den Fahrradfahrern – wie viele kommen pünktlich?

Berechnung

\(P(B\mid A)\)
\[ P(B\mid A)=\frac{P(A\cap B)}{P(A)} \]
\[ P(B\mid A)=\frac{0{,}32}{0{,}40}=0{,}80=80\,\% \]
Unter den Fahrradfahrern kommen \(80\,\%\) pünktlich.

Andere Richtung

Jetzt steht \(B\) rechts vom Strich. Die Grundmenge sind alle pünktlichen Personen.

Gefragt ist: Unter den pünktlichen Personen – wie viele kommen mit dem Fahrrad?

\(P(A\mid B)\)
\[ P(A\mid B)=\frac{P(A\cap B)}{P(B)} \]
\[ P(A\mid B)=\frac{0{,}32}{0{,}80}=0{,}40=40\,\% \]
Unter den pünktlichen Personen kommen \(40\,\%\) mit dem Fahrrad.
Die Bedingung steht rechts vom Strich und bestimmt die Grundmenge.

Häufigkeiten

Situation

Eine Schule befragt \(200\) Schülerinnen und Schüler.

\(A\): wohnt nah an der Schule
\(B\): nutzt GTA

GTA bedeutet hier: Ganztagsangebot.

Begriffe

Eine absolute Häufigkeit ist eine Anzahl.
Eine relative Häufigkeit ist der entsprechende Anteil an der Gesamtzahl.
Randhäufigkeiten sind die Zeilen- und Spaltensummen.

Die Gesamtzahl ist hier:

\[ n=200 \]

Aus einer Häufigkeit wird eine Wahrscheinlichkeit, indem man durch die Gesamtzahl teilt.

\[ \text{relative Häufigkeit} = \frac{\text{absolute Häufigkeit}}{\text{Gesamtzahl}} \]

Vierfeldertafel mit Häufigkeiten

\(B\)nutzt GTA \(\overline B\)nutzt kein GTA Summe
\(A\)wohnt nah 24 56 80
\(\overline A\)wohnt nicht nah 66 54 120
Summe 90 110 200

Gehe mit der Maus auf eine Zahl in der Tabelle.

Die Werte am Rand zeigen die Summen der Zeilen und Spalten.

24 wohnen nah an der Schule und nutzen GTA.
56 wohnen nah an der Schule und nutzen kein GTA.
66 wohnen nicht nah an der Schule und nutzen GTA.
54 wohnen nicht nah an der Schule und nutzen kein GTA.
Hier sind alle Werte echte Anzahlen, nicht Wahrscheinlichkeiten.

Umwandeln in Wahrscheinlichkeiten

Jede Häufigkeit wird durch \(200\) geteilt.

Beispielrechnung
\[ P(A\cap B)=\frac{24}{200}=0{,}12 \]

Vierfeldertafel mit Wahrscheinlichkeiten

\(B\)nutzt GTA \(\overline B\)nutzt kein GTA Summe
\(A\)wohnt nah \(\frac{24}{200}=0{,}12\) \(\frac{56}{200}=0{,}28\) \(\frac{80}{200}=0{,}40\)
\(\overline A\)wohnt nicht nah \(\frac{66}{200}=0{,}33\) \(\frac{54}{200}=0{,}27\) \(\frac{120}{200}=0{,}60\)
Summe \(\frac{90}{200}=0{,}45\) \(\frac{110}{200}=0{,}55\) \(\frac{200}{200}=1\)
Häufigkeiten sind konkrete Anzahlen. Wahrscheinlichkeiten sind Anteile an der Gesamtzahl.

Zusammenhang prüfen

Theorie

Zwei Merkmale \(A\) und \(B\) sind unabhängig, wenn die Bedingung nichts verändert.

\[ P(B\mid A)=P(B) \]

Das bedeutet:

Unter den \(A\)-Personen ist der Anteil von \(B\) genauso groß wie in der ganzen Gruppe.

Man kann auch mit der Produktregel prüfen:

\[ P(A\cap B)=P(A)\cdot P(B) \]

Wenn das nicht gilt, sind die Merkmale abhängig.

Beispiel 1 – unabhängig

Eine Schule untersucht zwei Merkmale.

\(A\): trägt eine Brille
\(B\): spielt ein Instrument
\(B\)spielt ein Instrument \(\overline B\)spielt kein Instrument Summe
\(A\)trägt eine Brille 0,10 0,30 0,40
\(\overline A\)trägt keine Brille 0,15 0,45 0,60
Summe 0,25 0,75 1

Gehe mit der Maus auf eine Zahl in der Tabelle.

erwartet: unabhängig

Beispiel 2 – abhängig

Eine Schule untersucht den Schulweg.

\(A\): wohnt nah an der Schule
\(B\): kommt mit dem Fahrrad
\(B\)kommt mit dem Fahrrad \(\overline B\)kommt nicht mit dem Fahrrad Summe
\(A\)wohnt nah 0,30 0,10 0,40
\(\overline A\)wohnt nicht nah 0,15 0,45 0,60
Summe 0,45 0,55 1

Gehe mit der Maus auf eine Zahl in der Tabelle.

erwartet: abhängig

Bayes: Richtung wechseln

Grundidee

Manchmal kennt man eine bedingte Wahrscheinlichkeit in einer Richtung, braucht aber die andere Richtung.

Man kennt: \(P(B\mid A)\) — den Anteil von \(B\) unter allen \(A\).
Man sucht: \(P(A\mid B)\) — den Anteil von \(A\) unter allen \(B\).
\(P(B\mid A)\) bekannt \(\quad\longrightarrow\quad\) \(P(A\mid B)\) gesucht

Das ist ein Richtungswechsel der Bedingung. Der Satz von Bayes beschreibt, wie man diesen Wechsel rechnerisch durchführt.

Beispiel

Eine seltene Krankheit betrifft \(1\,\%\) der Bevölkerung. Ein Schnelltest schlägt bei \(90\,\%\) der Kranken an. Insgesamt liefert er bei \(10{,}8\,\%\) aller Personen ein positives Ergebnis. Wie wahrscheinlich ist es, bei positivem Testergebnis tatsächlich krank zu sein?

Formalisierung

\(A\): Person ist krank
\(B\): Test ist positiv

\(P(A)=0{,}01\)

\(P(B)=0{,}108\)

\(P(B\mid A)=0{,}90\)

Gesucht: \(P(A\mid B)\)

Schritt 1 — Schnittwahrscheinlichkeit

Zuerst berechnet man den gemeinsamen Anteil: krank und positiv getestet. Dafür nutzt man die Multiplikationsregel.

0,01 0,90 S A B A ∩ B
\[P(A\cap B)=P(A)\cdot P(B\mid A)\]
\[P(A\cap B)=0{,}01\cdot 0{,}90=0{,}009\]

Schritt 2 — Richtungwechsel

Jetzt dreht man die Betrachtung um. Die Grundmenge sind alle positiv Getesteten (\(B\)). Man teilt den gemeinsamen Anteil durch die Randwahrscheinlichkeit von \(B\).

0,108 ? S B A A ∩ B = 0,009 aus Schritt 1
\[P(A\mid B)=\frac{P(A\cap B)}{P(B)}\]
\[P(A\mid B)=\frac{0{,}009}{0{,}108}\approx 0{,}083=8{,}3\,\%\]
Obwohl der Test in \(90\,\%\) der Fälle bei Kranken anschlägt, sind unter den positiv Getesteten nur etwa \(8\,\%\) tatsächlich krank. Das liegt an der sehr geringen Verbreitung der Krankheit.

Von zwei Schritten zur Formel

Die beiden Schritte lassen sich zu einem einzigen zusammenfassen: Man setzt den Ausdruck aus Schritt 1 direkt in die Formel aus Schritt 2 ein.

Statt zuerst \(P(A\cap B)\) zu berechnen und dann zu dividieren, schreibt man beides in eine einzige Formel.

Bayes-Formel

Satz von Bayes
\[P(A\mid B)=\frac{P(A)\cdot P(B\mid A)}{P(B)}\]

Im Zähler steht \(P(A)\cdot P(B\mid A)\) — das ist genau die Schnittwahrscheinlichkeit \(P(A\cap B)\) aus Schritt 1.

Der Nenner \(P(B)\) ist die Randwahrscheinlichkeit der neuen Bedingung.

Übungen

Fülle die fehlenden Werte aus. Nutze Komma oder Punkt. Beispiel: 0,25 oder 0.25.

Aufgabe 1 – Vierfeldertafel ergänzen

Eine Schule untersucht das Essen in der Mensa.

Ergänze die fehlenden Wahrscheinlichkeiten in der Vierfeldertafel.

\(B\)vegetarisch \(\overline B\)nicht vegetarisch Summe
\(A\)Mensa 0,18 0,45
\(\overline A\)keine Mensa
Summe 0,30 1
Nutze Zeilen- und Spaltensummen: \(0{,}45-0{,}18=0{,}27\), \(0{,}30-0{,}18=0{,}12\).
Aufgabe 2 – Häufigkeiten umwandeln

Eine Schule befragt \(100\) Schülerinnen und Schüler.

Wandle die Häufigkeitstafel in eine Wahrscheinlichkeitstafel um.

\(B\)pünktlich \(\overline B\)nicht pünktlich Summe
\(A\)Bus 30 10 40
\(\overline A\)nicht Bus 50 10 60
Summe 80 20 100

Trage die relativen Häufigkeiten ein.

\(B\)pünktlich \(\overline B\)nicht pünktlich Summe
\(A\)Bus
\(\overline A\)nicht Bus
Summe
Jede Häufigkeit wird durch \(100\) geteilt.
Aufgabe 3

Eine Klasse untersucht Lernverhalten und Testerfolg.

60 % der Klasse lernen regelmäßig. Unter den regelmäßig Lernenden bestehen 80 % den Test. Insgesamt bestehen 70 % den Test.

Fülle die Vierfeldertafel aus. Berechne zuerst den Anteil, der regelmäßig lernt und den Test besteht.

\(B\)bestanden \(\overline B\)nicht bestanden Summe
\(A\)lernt regelmäßig 0,60
\(\overline A\)lernt nicht regelmäßig
Summe 0,70 1
Zuerst: \(P(A\cap B)=P(A)\cdot P(B\mid A)=0{,}60\cdot0{,}80=0{,}48\).
Dann können alle Zellen der Tabelle gefüllt werden.
Aufgabe 4 – Sechsfeldertafel

Eine Schule untersucht Entfernung zur Schule und Nutzung des Ganztagsangebots.

35 % wohnen nah an der Schule, 40 % wohnen in mittlerer Entfernung und 25 % wohnen weit entfernt.

Unter den Nahwohnenden nutzen 20 % das Ganztagsangebot. Bei mittlerer Entfernung sind es 35 %, bei weiter Entfernung 48 %.

Fülle die Sechsfeldertafel aus.

nah mittel weit Summe
nutzt GTA
nutzt kein GTA
Summe 0,35 0,40 0,25 1
Zuerst werden die drei oberen Felder berechnet:
\[ \begin{aligned} P(\text{GTA und nah}) &= 0{,}35\cdot0{,}20=0{,}07 \\ P(\text{GTA und mittel}) &= 0{,}40\cdot0{,}35=0{,}14 \\ P(\text{GTA und weit}) &= 0{,}25\cdot0{,}48=0{,}12 \end{aligned} \]
Danach können alle übrigen Zellen über Summen ergänzt werden.
Aufgabe 5

Eine Schule untersucht AG-Teilnahme und Schulfest.

\(30\,\%\) besuchen eine AG. Unter den AG-Besuchenden nehmen \(60\,\%\) am Schulfest teil. Insgesamt nehmen \(45\,\%\) am Schulfest teil.

Gesucht ist der Anteil der AG-Besuchenden unter den Schulfest-Teilnehmenden.

Berechne zuerst den gemeinsamen Anteil. Berechne danach den gesuchten bedingten Anteil.

\(P(A\cap B)=P(A)\cdot P(B\mid A)\)
\(P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}\)
Schritt 1: \(P(A\cap B)=0{,}30\cdot0{,}60=0{,}18\).
Schritt 2: \(P(A\mid B)=\dfrac{0{,}18}{0{,}45}=0{,}40\).
Unter den Schulfest-Teilnehmenden besuchen \(40\,\%\) eine AG.

Alternativ mit der Bayes-Formel in einem Schritt:
\(P(A\mid B)=\dfrac{P(A)\cdot P(B\mid A)}{P(B)}=\dfrac{0{,}30\cdot0{,}60}{0{,}45}=0{,}40\)
Aufgabe 6 – Zusammenhang prüfen

Eine Schule untersucht Lernen mit Musik.

Berechne die beiden Werte und entscheide, ob die Merkmale abhängig oder unabhängig sind.

\(A\): hört Musik beim Lernen
\(B\): lernt länger als 60 Minuten
\(B\)über 60 Minuten \(\overline B\)höchstens 60 Minuten Summe
\(A\)Musik 0,21 0,09 0,30
\(\overline A\)keine Musik 0,14 0,56 0,70
Summe 0,35 0,65 1

Berechne und entscheide.

\(P(B)\)
\(P(B\mid A)\)
Ergebnis
\(P(B)=0{,}35\), aber \(P(B\mid A)=\frac{0{,}21}{0{,}30}=0{,}70\). Die Merkmale sind abhängig.