Wahrscheinlichkeiten, Bäume und Kreuztabellen


1

 

Angenommen, in einem Behälter, den ich jetzt einfach mal Urne nenne, befinden sich 15 Kugeln. Davon sind 9 blau und 6 rot. Du kannst nacheinander Kugeln aus der Urne ziehen, aber Du kannst nicht in die Urne hineinschauen. Wie hoch ist die Wahrscheinlichkeit, zweimal nacheinander je eine Kugel mit gleicher Farbe zu ziehen?

 

Fall 1: mit zurücklegen

Zunächst möchte ich den einfacheren Fall vorstellen: Du ziehst eine Kugel, schaust, welche Farbe sie hat, legst sie in die Urne zurück und ziehst noch einmal eine Kugel.

Dieser Fall ist deshalb einfacher, weil sich die Wahrscheinlichkeiten vom ersten zum zweiten Zug nicht verändern. Das Ergebnis des zweiten Zugs wird durch den ersten Zug nicht beeinflusst. Das ist zum Beispiel so, wenn Du würfelst oder auf dem Jahrmarkt ein Glücksrad drehst.

Wenn Du zum Beispiel nach 1000 Würfen mit einem Würfel keine 6 gewürfelt hast, dann ist das ein mögliches, doch sehr unwahrscheinliches Ereigneis. Aber das beeinflusst nicht die Wahrscheinlichkeit, beim 1001. Wurf eine 6 zu würfeln. Die liegt nach wie vor bei \(\frac{1}{6}\).

Wenn Du das erste Mal ziehst, sind in der Urne 9 blaue und 6 rote Kugeln, zusammen also 15 Kugeln. Die Wahrscheinlichkeit, eine blaue Kugel zu ziehen, liegt deshalb bei \(\frac{9}{15}\), die Wahrscheinlichkeit, eine rote Kugel zu ziehen bei \(\frac{6}{15}\). Weil nur rote oder blaue Kugeln gezogen werden können (etwas anderes befindet sich nicht in der Urne), ist die Summe der beiden Wahrscheinlichkeiten gleich 1.

Die gezogene Kugel wird wieder in die Urne zurückgelegt!

Dadurch befinden sich in der Urne wieder 9 blaue und 6 rote Kugeln, zusammen also 15 Kugeln. Die Wahrscheinlichkeiten dafür, eine blaue oder eine rote Kugel zu bekommen, wenn Du das zweite Mal ziehst, sind gegenüber dem ersten Mal also vollkommen unverändert. Das bedeutet: Die Wahrscheinlichkeiten, eine rote oder eine blaue Kugel zu ziehen, werden von den vorherigen Zügen nicht beeinflusst. Sie sind stochastisch unabhängig. Deshalb können die einzelnen Wahrscheinlichkeiten dafür, im ersten Zug eine blaue oder rote Kugel und im zweiten Zug eine blaue oder eine rote Kugel zu ziehen (das sind vier mögliche Kombinationen) genauso ermittelt werden, wie die Werte der Indifferenztabelle eines Chi-Quadrat-Tests, nämlich indem die Randhäufigkeiten miteinander multipliziert und dann durch die Fallzahl geteilt werden. Die Fallzahl steht in einer Kreuztabelle immer in der rechten unteren Ecke. Da wir hier nicht mit absoluten Zahlen, sondern mit Wahrscheinlichkeiten zu tun haben, ist die Fallzahl gleich 1.

Mehr dazu kannst Du hier nachlesen:

Stochastische Unabhängigkeit und Chi-Quadrat-Test

Wie das berechnet wird, siehst Du in Tabelle 1.

Tabelle 1: Berechnung der Zellenwahrscheinlichkeiten
\(
\begin{array}{|l|cc|c|}
\hline
\textrm{2. Zug}\downarrow\mid\textrm{1. Zug}\rightarrow & R(1) & B(1) & \textrm{Gesamt}\\
\hline
R(2) & \frac{\frac{{\displaystyle 6}}{{\displaystyle 15}}\cdot\frac{{\displaystyle 6}}{{\displaystyle 15}}}{{\displaystyle 1}} & \frac{\frac{{\displaystyle 6}}{{\displaystyle 15}}\cdot\frac{{\displaystyle 9}}{{\displaystyle 15}}}{{\displaystyle 1}} & \frac{{\displaystyle 6}}{{\displaystyle 15}}\\
B(2) & \frac{\frac{{\displaystyle 9}}{{\displaystyle 15}}\cdot\frac{{\displaystyle 6}}{{\displaystyle 15}}}{{\displaystyle 1}} & \frac{\frac{{\displaystyle 9}}{{\displaystyle 15}}\cdot\frac{{\displaystyle 9}}{{\displaystyle 15}}}{{\displaystyle 1}} & \frac{{\displaystyle 9}}{{\displaystyle 15}}\\
\hline
\textrm{Gesamt} & \frac{{\displaystyle 6}}{{\displaystyle 15}} & \frac{{\displaystyle 9}}{{\displaystyle 15}} & \frac{{\displaystyle 15}}{{\displaystyle 15}}=1\\
\hline
\end{array}
\)

Dabei bedeutet

  • \(R(1)\) im ersten Zug eine rote Kugel zu ziehen;
  • \(B(1)\) im ersten Zug eine blaue Kugel zu ziehen;
  • \(R(2)\) im zweiten Zug eine rote Kugel zu ziehen;
  • \(B(2)\) im zweiten Zug eine blaue Kugel zu ziehen.

Das führt dann zu Tabelle 2.

Tabelle 2: Unbedingte Wahrscheinlichkeiten mit zurücklegen
\(
\begin{array}{|l|cc|c|}
\hline
\textrm{2. Zug}\downarrow\mid\textrm{1. Zug}\rightarrow & R(1) & B(1) & \textrm{Gesamt}\\
\hline
R(2) & \frac{{\displaystyle 36}}{{\displaystyle 225}} & \frac{{\displaystyle 54}}{{\displaystyle 225}} & \frac{{\displaystyle 6}}{{\displaystyle 15}}=\frac{{\displaystyle 90}}{{\displaystyle 225}}\\
B(2) &
\frac{{\displaystyle 54}}{{\displaystyle 225}} & \frac{{\displaystyle 81}}{{\displaystyle 225}} & \frac{{\displaystyle 9}}{{\displaystyle 15}}=\frac{{\displaystyle 135}}{{\displaystyle 225}}\\
\hline \textrm{Gesamt} & \frac{{\displaystyle 6}}{{\displaystyle 15}}=\frac{{\displaystyle 90}}{{\displaystyle 225}} & \frac{{\displaystyle 9}}{{\displaystyle 15}}=\frac{{\displaystyle 135}}{{\displaystyle 225}} & \frac{{\displaystyle 15}}{{\displaystyle 15}}=\frac{{\displaystyle 225}}{{\displaystyle 225}}=1\\
\hline
\end{array}
\)

Nun kann der entsprechnende Wahrscheinlichkeitsbaum erstellt werden (siehe Abbildung 1).

 

Abbildung 1: Unbedingte Wahrscheinlichkeiten mit zurücklegen

 

Nun lässt sich die Ausgangsfrage beantworten. Die entsprechenden Zahlen kannst Du sowohl Tabelle 2 als auch Abbildung 1 entnehmen. Es handelt sich um die unbedingten Wahrscheinlichkeiten dafür, im ersten und im zweiten Zug eine rote (\(P\left(R(1)\cap R(2)\right)\)) oder im ersten und im zweiten Zug eine blaue (\(P\left(B(1)\cap B(2)\right)\)) Kugel zu ziehen. Diese beiden Wahrscheinlichkeiten müssen addiert werden. Das bedeutet, es gilt Gleichung (1)

$$P\left(R(1)\cap R(2)\right)+P\left(B(1)\cap B(2)\right)=\frac{36}{225}+\frac{81}{225}=\frac{117}{225}=\frac{52}{100}=0,52 \tag{1}$$

In dem Fall, dass die beim ersten Zug gezogene Kugel vor dem zweiten Zug wieder in die Urne zurückgelegt wird, beträgt die Wahrscheinlichkeit zwei gleichfarbige Kugeln zu ziehen genau 52 Prozent.

Dass es tatsächlich dazu führt, dass die verschiedenen Züge aus der Urne stochastisch voneinander unabhängig sind, wenn die jeweils gezogene Kugel vor dem darauf folgenden Zug wieder in die Urne zurückgelegt wird, lässt sich sehr einfach zeigen, indem in der Tabelle spaltenweise bedingte Wahrscheinlichkeiten gebildet werden. Dazu werden die Spaltensummen auf 1 gesetzt, in dem die Zellenwahrscheinlichkeiten durch die Spaltensummen geteilt werden. So ergibt sich zum Beispiel für die Zelle \((1,1)\) in Tabelle 2 die bedingte Wahrscheinlichkeit \(\frac{6}{15}\) oder 40 Prozent, wie Gleichung (2) zeigt.

$$\frac{\frac{36}{225}}{\frac{90}{225}}=\frac{36}{225}\cdot\frac{225}{90}=\frac{36}{90}=\frac{6}{15}=0,4 \tag{2}$$

Dieses Vorgehen führt zu Tabelle 3 und entsprechend zu Abbildung 2.

Tabelle 3: Bedingte Wahrscheinlichkeiten mit zurücklegen
\(
\begin{array}{|l|cc|c|}
\hline
\textrm{2. Zug}\downarrow\mid\textrm{1. Zug}\rightarrow & R(1) & B(1) & \textrm{Gesamt}\\
\hline R(2) & \frac{{\displaystyle 6}}{{\displaystyle 15}}=0,4 & \frac{{\displaystyle 6}}{{\displaystyle 15}}=0,4 & \frac{{\displaystyle 6}}{{\displaystyle 15}}=0,4\\
B(2) & \frac{{\displaystyle 9}}{{\displaystyle 15}}=0,6 & \frac{{\displaystyle 9}}{{\displaystyle 15}}=0,6 & \frac{{\displaystyle 9}}{{\displaystyle 15}}=0,6\\
\hline
\textrm{Gesamt} & \frac{{\displaystyle 15}}{{\displaystyle 15}}=1,0 & \frac{{\displaystyle 15}}{{\displaystyle 15}}=1,0 & \frac{{\displaystyle 15}}{{\displaystyle 15}}=1,0\\
\hline
\end{array}
\)

 


Abbildung 2: Bedingte Wahrscheinlichkeiten mit zurücklegen

 

Fall 2: ohne zurücklegen

Jetzt komme ich zu dem etwas schwierigeren Fall. Du ziehst eine Kugel, schaust, welche Farbe sie hat, legst sie beiseite und ziehst noch einmal eine Kugel. In diesem Fall verändern sich die Wahrscheinlichkeiten. Nach dem ersten Zug ist eine Kugel mit der einen oder der anderen Farbe weniger in der Urne.

Ein Beispiel für ziehen ohne zurücklegen ist ein Kartenspiel. Nimm an, das Spiel habe 32 Karten. Beim ersten Mal ist die Wahrscheinlichkeit, einen Kreuz-Buben zu zu ziehen, genau \(\frac{1}{32}\). Wenn die gezogene Karte kein Kreuz-Bube ist und Du sie beiseite legst, dann sind noch 31 Karten im Spiel. Ziehst Du jetzt noch einmal, dann ist die Wahrscheinlichkeit für einen Kreuz-Buben \(\frac{1}{31}\), also etwas höher als beim ersten Zug. So geht das dann weiter.

Die Ausgangssituation ist im Fall ohne zurücklegen dieselbe, wie im Fall mit zurücklegen. Wenn Du das erste mal ziehst, sind in der Urne 9 blaue und 6 rote Kugeln, zusammen also 15 Kugeln. Du hast also wieder eine Wahrscheinlichkeit von \(\frac{9}{15}\) eine blaue und von \(\frac{6}{15}\) eine rote Kugel zu ziehen.

Aber jetzt legst Du die gezogene Kugel nicht wieder in die Urne zurück. 

Dadurch sind jetzt nur noch 14 Kugeln in der Urne. Dabei sind zwei Fälle zu unterscheiden:

  • entweder die gezogene Kugel war blau. Dann sind noch 8 blaue und 6 rote Kugeln in der Urne.
  • oder die gezogene Kugel war rot. Dann sind 9 blaue und 6 rote Kugeln in der Urne.

Dadurch haben sich die Wahrscheinlichkeiten verändert, wenn Du das zweite Mal ziehst, abhängig davon, was Du beim ersten Mal gezogen hast. Der erste Zug beeinflusst also die Wahrscheinlichkeiten beim zweiten Zug. Beide Züge sind nicht stochastisch unabhängig. Deshalb ist es in diesem Fall nicht möglich, die Zellenwahrscheinlichkeiten aus den Randverteilungen der Kreuztabelle zu bestimmen. Aus diesem Grund, ist es besser, hier zuerst den Wahrscheinlichkeitsbaum zu erstellen (siehe Abbildung 3).

 

Abbildung 3: Unbedingte Wahrscheinlichkeiten ohne zurücklegen

 

Danach kann jetzt die Kreuztabelle konstruiert werden (Tabelle 4).

 

Tabelle 4: Unbedingte Wahrscheinlichkeiten ohne zurücklegen
\(
\begin{array}{|l|cc|c|}
\hline
\textrm{2. Zug}\downarrow\mid\textrm{1. Zug}\rightarrow & R(1) & B(1) & \textrm{Gesamt}\\
\hline R(2) & \frac{{\displaystyle 30}}{{\displaystyle 210}} & \frac{{\displaystyle 54}}{{\displaystyle 210}} & \frac{{\displaystyle 6}}{{\displaystyle 15}}=\frac{{\displaystyle 84}}{{\displaystyle 210}}\\
B(2) & \frac{{\displaystyle 54}}{{\displaystyle 210}} & \frac{{\displaystyle 72}}{{\displaystyle 210}} & \frac{{\displaystyle 9}}{{\displaystyle 15}}=\frac{{\displaystyle 126}}{{\displaystyle 210}}\\
\hline
\textrm{Gesamt} & \frac{{\displaystyle 6}}{{\displaystyle 15}}=\frac{{\displaystyle 84}}{{\displaystyle 210}} & \frac{{\displaystyle 9}}{{\displaystyle 15}}=\frac{{\displaystyle 126}}{{\displaystyle 210}} & \frac{{\displaystyle 15}}{{\displaystyle 15}}=\frac{{\displaystyle 210}}{{\displaystyle 210}}=1\\
\hline
\end{array}
\)

Nun kann nach Gleichung (3) auch für den Fall ohne zurücklegen die Wahrscheinlichkeit dafür bestimmt werden, nacheinander zwei gleichfarbige Kugeln zu ziehen. Dazu werden, wie im Fall mit zurücklegen, die Wahrscheinlichkeit, nacheinander zwei rote Kugeln zu ziehen und die Wahrscheinlichkeit, nacheinander zwei blaue Kugeln zu ziehen, addiert.

$$P\left(R(1)\cap R(2)\right)+P\left(B(1)\cap B(2)\right)=\frac{30}{210}+\frac{72}{210}=\frac{102}{210}\approx0,49 \tag{3}$$

Tabelle 5 und Abbildung 4 zeigen die bedingten Wahrscheinlichkeiten ohne zurücklegen. Es zeigt sich, dass die Züge in dem Fall ohne zurücklegen nicht stochastisch unabhängig sind.

 

Tabelle 5: Bedingte Wahrscheinlichkeiten ohne zurücklegen
\(
\begin{array}{|l|cc|c|}
\hline
\textrm{2. Zug}\downarrow\mid\textrm{1. Zug}\rightarrow & R(1) & B(1) & \textrm{Gesamt}\\
\hline R(2) & \frac{{\displaystyle 30}}{{\displaystyle 84}}\approx0,36 & \frac{{\displaystyle 54}}{{\displaystyle 126}}\approx0,43 & \frac{{\displaystyle 6}}{{\displaystyle 15}}=\frac{{\displaystyle 84}}{{\displaystyle 210}}=0,40\\
B(2) & \frac{{\displaystyle 54}}{{\displaystyle 84}}\approx0,64 & \frac{{\displaystyle 72}}{{\displaystyle 126}}\approx0,57 & \frac{{\displaystyle 9}}{{\displaystyle 15}}=\frac{{\displaystyle 126}}{{\displaystyle 210}}=0,60\\
\hline
\textrm{Gesamt} & \frac{{\displaystyle 84}}{{\displaystyle 84}}=1,00 & \frac{{\displaystyle 15}}{{\displaystyle 15}}=1,00 & \frac{{\displaystyle 15}}{{\displaystyle 15}}=\frac{{\displaystyle 210}}{{\displaystyle 210}}=1,00\\
\hline
\end{array}
\)

 

Abbildung 4: Bedingte Wahrscheinlichkeiten ohne zurücklegen

 

 

 

 

 

 

 

 

 

 

 

Community Artikel, geschrieben vor 2 Monate, 1 Woche
jake2042, verified
Sonstiger Berufsstatus, Punkte: 1200
 
Kommentar schreiben Diesen Artikel melden
0 Antworten