Vierfeldertafel
Situation
Wir betrachten eine große Gruppe von Sporttreibenden. Einige Personen sind Tennisprofis, andere nicht.
Außerdem wird betrachtet, ob eine Person linkshändig ist.
Nun analysieren wir die Gruppe nach zwei Merkmalen.
Ziel der Vierfeldertafel
Die Vierfeldertafel zeigt, wie sich zwei Merkmale auf vier mögliche Kombinationen verteilen.
So kann man untersuchen, ob zwischen den Merkmalen ein Zusammenhang besteht.
Allgemeine Struktur
Hinweis: Gehe mit der Maus auf eine Zelle in der Tabelle.
| \(B\)linkshändig | \(\overline B\)nicht linkshändig | Summe | |
|---|---|---|---|
| \(A\)Tennisprofi | \(P(A\cap B)\) | \(P(A\cap \overline B)\) | \(P(A)\) |
| \(\overline A\)kein Tennisprofi | \(P(\overline A\cap B)\) | \(P(\overline A\cap \overline B)\) | \(P(\overline A)\) |
| Summe | \(P(B)\) | \(P(\overline B)\) | \(\frac{200}{200}=1\) |
Konkrete Vierfeldertafel
| \(B\)linkshändig | \(\overline B\)nicht linkshändig | Summe | |
|---|---|---|---|
| \(A\)Tennisprofi | 0,03 | 0,17 | 0,20 |
| \(\overline A\)kein Tennisprofi | 0,07 | 0,73 | 0,80 |
| Summe | 0,10 | 0,90 | 1 |
Gehe mit der Maus auf eine Zahl in der Tabelle.
Fragestellung
Baumdiagramm aus der Tafel
Die Zeilenrandwahrscheinlichkeiten bilden die erste Stufe. Die Schnittwahrscheinlichkeiten stehen am Ende der Pfade. Die zweite Stufe ist zunächst unbekannt.
Hinweis: Gehe mit der Maus auf eine Zahl im Diagramm.
Zweites Baumdiagramm
Zu einer Vierfeldertafel gehören immer zwei Baumdiagramme. Im oberen Diagramm haben wir zuerst nach dem Merkmal Tennisprofi aufgeteilt. Jetzt teilen wir zuerst nach dem Merkmal linkshändig auf.
Hinweis: Gehe mit der Maus auf eine Zahl im Diagramm.
Bedingte Wahrscheinlichkeit
Situation
Eine Schule untersucht den Schulweg.
Vierfeldertafel
| \(B\)pünktlich | \(\overline B\)nicht pünktlich | Summe | |
|---|---|---|---|
| \(A\)Fahrrad | 0,32 | 0,08 | 0,40 |
| \(\overline A\)nicht Fahrrad | 0,48 | 0,12 | 0,60 |
| Summe | 0,80 | 0,20 | 1 |
Gehe mit der Maus auf eine Zahl in der Tabelle.
Schreibweise
Oder kürzer: Anteil von \(B\) unter allen \(A\).
Der Strich bedeutet nicht „geteilt durch“.
Er bedeutet: unter der Bedingung.
Im Beispiel
\(P(B\mid A)\) bedeutet:
Wahrscheinlichkeit, dass jemand pünktlich kommt, wenn diese Person mit dem Fahrrad kommt.
Also: Unter den Fahrradfahrern – wie viele kommen pünktlich?
Berechnung
Andere Richtung
Jetzt steht \(B\) rechts vom Strich. Die Grundmenge sind alle pünktlichen Personen.
Gefragt ist: Unter den pünktlichen Personen – wie viele kommen mit dem Fahrrad?
Häufigkeiten
Situation
Eine Schule befragt \(200\) Schülerinnen und Schüler.
GTA bedeutet hier: Ganztagsangebot.
Begriffe
Eine relative Häufigkeit ist der entsprechende Anteil an der Gesamtzahl.
Randhäufigkeiten sind die Zeilen- und Spaltensummen.
Die Gesamtzahl ist hier:
Aus einer Häufigkeit wird eine Wahrscheinlichkeit, indem man durch die Gesamtzahl teilt.
Vierfeldertafel mit Häufigkeiten
| \(B\)nutzt GTA | \(\overline B\)nutzt kein GTA | Summe | |
|---|---|---|---|
| \(A\)wohnt nah | 24 | 56 | 80 |
| \(\overline A\)wohnt nicht nah | 66 | 54 | 120 |
| Summe | 90 | 110 | 200 |
Gehe mit der Maus auf eine Zahl in der Tabelle.
Die Werte am Rand zeigen die Summen der Zeilen und Spalten.
Umwandeln in Wahrscheinlichkeiten
Jede Häufigkeit wird durch \(200\) geteilt.
Vierfeldertafel mit Wahrscheinlichkeiten
| \(B\)nutzt GTA | \(\overline B\)nutzt kein GTA | Summe | |
|---|---|---|---|
| \(A\)wohnt nah | \(\frac{24}{200}=0{,}12\) | \(\frac{56}{200}=0{,}28\) | \(\frac{80}{200}=0{,}40\) |
| \(\overline A\)wohnt nicht nah | \(\frac{66}{200}=0{,}33\) | \(\frac{54}{200}=0{,}27\) | \(\frac{120}{200}=0{,}60\) |
| Summe | \(\frac{90}{200}=0{,}45\) | \(\frac{110}{200}=0{,}55\) | \(\frac{200}{200}=1\) |
Zusammenhang prüfen
Theorie
Zwei Merkmale \(A\) und \(B\) sind unabhängig, wenn die Bedingung nichts verändert.
Das bedeutet:
Man kann auch mit der Produktregel prüfen:
Wenn das nicht gilt, sind die Merkmale abhängig.
Beispiel 1 – unabhängig
Eine Schule untersucht zwei Merkmale.
| \(B\)spielt ein Instrument | \(\overline B\)spielt kein Instrument | Summe | |
|---|---|---|---|
| \(A\)trägt eine Brille | 0,10 | 0,30 | 0,40 |
| \(\overline A\)trägt keine Brille | 0,15 | 0,45 | 0,60 |
| Summe | 0,25 | 0,75 | 1 |
Gehe mit der Maus auf eine Zahl in der Tabelle.
Beispiel 2 – abhängig
Eine Schule untersucht den Schulweg.
| \(B\)kommt mit dem Fahrrad | \(\overline B\)kommt nicht mit dem Fahrrad | Summe | |
|---|---|---|---|
| \(A\)wohnt nah | 0,30 | 0,10 | 0,40 |
| \(\overline A\)wohnt nicht nah | 0,15 | 0,45 | 0,60 |
| Summe | 0,45 | 0,55 | 1 |
Gehe mit der Maus auf eine Zahl in der Tabelle.
Bayes: Richtung wechseln
Grundidee
Manchmal kennt man eine bedingte Wahrscheinlichkeit in einer Richtung, braucht aber die andere Richtung.
Man sucht: \(P(A\mid B)\) — den Anteil von \(A\) unter allen \(B\).
Das ist ein Richtungswechsel der Bedingung. Der Satz von Bayes beschreibt, wie man diesen Wechsel rechnerisch durchführt.
Beispiel
Eine seltene Krankheit betrifft \(1\,\%\) der Bevölkerung. Ein Schnelltest schlägt bei \(90\,\%\) der Kranken an. Insgesamt liefert er bei \(10{,}8\,\%\) aller Personen ein positives Ergebnis. Wie wahrscheinlich ist es, bei positivem Testergebnis tatsächlich krank zu sein?
Formalisierung
\(P(A)=0{,}01\)
\(P(B)=0{,}108\)
\(P(B\mid A)=0{,}90\)
Gesucht: \(P(A\mid B)\)
Schritt 1 — Schnittwahrscheinlichkeit
Zuerst berechnet man den gemeinsamen Anteil: krank und positiv getestet. Dafür nutzt man die Multiplikationsregel.
Schritt 2 — Richtungwechsel
Jetzt dreht man die Betrachtung um. Die Grundmenge sind alle positiv Getesteten (\(B\)). Man teilt den gemeinsamen Anteil durch die Randwahrscheinlichkeit von \(B\).
Von zwei Schritten zur Formel
Die beiden Schritte lassen sich zu einem einzigen zusammenfassen: Man setzt den Ausdruck aus Schritt 1 direkt in die Formel aus Schritt 2 ein.
Bayes-Formel
Im Zähler steht \(P(A)\cdot P(B\mid A)\) — das ist genau die Schnittwahrscheinlichkeit \(P(A\cap B)\) aus Schritt 1.
Der Nenner \(P(B)\) ist die Randwahrscheinlichkeit der neuen Bedingung.
Übungen
Fülle die fehlenden Werte aus. Nutze Komma oder Punkt. Beispiel: 0,25 oder 0.25.
Eine Schule untersucht das Essen in der Mensa.
Ergänze die fehlenden Wahrscheinlichkeiten in der Vierfeldertafel.
| \(B\)vegetarisch | \(\overline B\)nicht vegetarisch | Summe | |
|---|---|---|---|
| \(A\)Mensa | 0,18 | 0,45 | |
| \(\overline A\)keine Mensa | |||
| Summe | 0,30 | 1 |
Eine Schule befragt \(100\) Schülerinnen und Schüler.
Wandle die Häufigkeitstafel in eine Wahrscheinlichkeitstafel um.
| \(B\)pünktlich | \(\overline B\)nicht pünktlich | Summe | |
|---|---|---|---|
| \(A\)Bus | 30 | 10 | 40 |
| \(\overline A\)nicht Bus | 50 | 10 | 60 |
| Summe | 80 | 20 | 100 |
Trage die relativen Häufigkeiten ein.
| \(B\)pünktlich | \(\overline B\)nicht pünktlich | Summe | |
|---|---|---|---|
| \(A\)Bus | |||
| \(\overline A\)nicht Bus | |||
| Summe |
Eine Klasse untersucht Lernverhalten und Testerfolg.
60 % der Klasse lernen regelmäßig. Unter den regelmäßig Lernenden bestehen 80 % den Test. Insgesamt bestehen 70 % den Test.
Fülle die Vierfeldertafel aus. Berechne zuerst den Anteil, der regelmäßig lernt und den Test besteht.
| \(B\)bestanden | \(\overline B\)nicht bestanden | Summe | |
|---|---|---|---|
| \(A\)lernt regelmäßig | 0,60 | ||
| \(\overline A\)lernt nicht regelmäßig | |||
| Summe | 0,70 | 1 |
Dann können alle Zellen der Tabelle gefüllt werden.
Eine Schule untersucht Entfernung zur Schule und Nutzung des Ganztagsangebots.
35 % wohnen nah an der Schule, 40 % wohnen in mittlerer Entfernung und 25 % wohnen weit entfernt.
Unter den Nahwohnenden nutzen 20 % das Ganztagsangebot. Bei mittlerer Entfernung sind es 35 %, bei weiter Entfernung 48 %.
Fülle die Sechsfeldertafel aus.
| nah | mittel | weit | Summe | |
|---|---|---|---|---|
| nutzt GTA | ||||
| nutzt kein GTA | ||||
| Summe | 0,35 | 0,40 | 0,25 | 1 |
Eine Schule untersucht AG-Teilnahme und Schulfest.
\(30\,\%\) besuchen eine AG. Unter den AG-Besuchenden nehmen \(60\,\%\) am Schulfest teil. Insgesamt nehmen \(45\,\%\) am Schulfest teil.
Gesucht ist der Anteil der AG-Besuchenden unter den Schulfest-Teilnehmenden.
Berechne zuerst den gemeinsamen Anteil. Berechne danach den gesuchten bedingten Anteil.
| \(P(A\cap B)=P(A)\cdot P(B\mid A)\) | |
| \(P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}\) |
Schritt 2: \(P(A\mid B)=\dfrac{0{,}18}{0{,}45}=0{,}40\).
Unter den Schulfest-Teilnehmenden besuchen \(40\,\%\) eine AG.
Alternativ mit der Bayes-Formel in einem Schritt:
\(P(A\mid B)=\dfrac{P(A)\cdot P(B\mid A)}{P(B)}=\dfrac{0{,}30\cdot0{,}60}{0{,}45}=0{,}40\)
Eine Schule untersucht Lernen mit Musik.
Berechne die beiden Werte und entscheide, ob die Merkmale abhängig oder unabhängig sind.
| \(B\)über 60 Minuten | \(\overline B\)höchstens 60 Minuten | Summe | |
|---|---|---|---|
| \(A\)Musik | 0,21 | 0,09 | 0,30 |
| \(\overline A\)keine Musik | 0,14 | 0,56 | 0,70 |
| Summe | 0,35 | 0,65 | 1 |
Berechne und entscheide.
| \(P(B)\) | |
| \(P(B\mid A)\) | |
| Ergebnis |