Stochastische Unabhängigkeit


0

Hallo, 

kann mir jemand folgenden Zusammenhang erklären?

X,Y sind zwei stochastisch unabhängige Zufallsvariablen. Daraus folgt, dass der Korrelationskoeffizient = 0 ist. 

Soweit verstanden. Allerdings kann man, wenn der Korrelationskoeffizient = 0 ist nicht auf stochastische Unabhängigkeit schließen. Warum ist das so? 

Was muss immer gelten, dass zwei Zufallsvariablen stochastisch unabhängig sind?

 

gefragt vor 2 Wochen, 1 Tag
f
felipeloentes,
Student, Punkte: 10
 
Kommentar schreiben Diese Frage melden
2 Antworten
2

Hallo,

der Korrelationskoeffizient ist ein Maß für den rein linearen Zusammenhang. Ist der Korrelationskoeffizient Null, so heißt das lediglich das es keinen linearen Zusammenhang gibt. Es kann aber ein anderweitiger Zusammenhang bestehen. 
Sind zwei Zufallsvariablen unabhängig, so sind sie auch nicht linear abhängig, also ist der Korrelationskoeffizient Null.

Die allgemeine Definition ist, gilt

\( P(A \cap B) = P(A) \cdot P(B) \)

dann sind die Zufallsvariablen stochastisch unabhängig.

Grüße Christian

geantwortet vor 2 Wochen, 1 Tag
christianteam, verified
Sonstiger Berufsstatus, Punkte: 13318
 
Kommentar schreiben Diese Antwort melden
1

Ich nehme an, mit »Korrelationskoeffizient« ist Pearsons r gemeint. (Eigentlich hört dieses Zusammenhangsmaß auf den Namen Produkt-Moment-Korrelationskoeffzient.) Pearsons r ist in Bezug auf die Bestimmung einer Regressionsgeraden definiert. Angenommen, ich habe zwei metrische Variablen [1], die sich in einem Scatterdiagramm U-förmig verteilen. Dann kann ich auf keine vernüftige Weise eine Gerade so durch die Punktewolke ziehen, dass die Gerade genau diesen U-förmigen Zusammenhang zwischen den beiden Variablen irgendwie wiedergibt. Deshalb ist dann Pearsons r gleich Null oder in der Nähe von Null.

Wenn ich mir aber das Scatterdiagramm anschaue und die U-förmige Punktewolke sehe, dann könnte ich schon auf die Idee kommen, dass ich besser versuche, nicht eine Geradengleichung, sondern zum Beispiel eine quadratische Funnktion zu suchen, deren Parabel sich möglichst gut an die Punktewolke anpasst. Wenn ich so etwas versuche, werde ich sehr wahrscheinlich sehr viel höhere Ausprägungen von Pearsons r bekommen als im linearen Fall. Das nennt sich dann Kurvenanpassung. SPSS bietet verschiedene Modelle dafür an, wie hier zu sehen ist:

Quelle: Bühl 2012:489
(Warum das Foto querliegend importiert wird, weiß ich nicht.)


Es gibt aber noch ein weiteres Problem. Es könnte nämlich sein, dass eine oder mehrere Drittvariablen einen an sich vorhandenen Zusammenhang zwischen unseren beiden metrischen Variablen soweit stören, dass er nicht mehr sichtbar ist.

Der umgekehrte Fall einer Scheinkorrelation, die auf dem Einfluss einer Drittvariablen beruht, ist bekannter. Ein immer wieder zitiertes Beispiel ist die signifikante Korrelation, die zwischen der Anzahl von Störchen in einem Gebiet und der Geburtenrate dieses Gebiets gibt. Auf dem Lande gibt es mehr Störche als in der Stadt. Gleichzeitig ist in ländlichen Gebieten die Geburtenrate höher.

So ein Einfluss einer Drittvariablen mag jetzt auch in umgekehrter Richtung wirken. Deshalb ist es immer wichtig, sich über den möglichen Einfluss von Drittvariablen Gedanken zu machen.

Außerdem sollte klar sein, dass statistische Korrelation, auch wenn sie signifikant ist, noch kein Kausalzusammenhang ist. Das Quadrat von Pearsons r, also r², heißt Determinationskoeffizient. Der Determinationskoeffizient sagt etwas darüber, welcher Anteil der Varianz der abhängigen Variablen (y) durch die unabhängige Variable (x) »erklärt« werden kann. Bei einem r von 0,7 ist das etwa die Hälfte der Varianz (genauer 49 Prozent, r² liegt dann bei 0,49). Nur ist der Determinationskoeffizient symmetrisch. Das heißt, es werden dann nicht nur 49 Prozent der Varianz der abhängen von der unabhängigen Variablen »erklärt«, sondern eben auch 49 Prozent der Varianz der unabhängigen Variablen durch die abhängige. Eine Korrelation zwischen Orten, an denen es brennt und Orten, an denen Feuerwehrleute zugegen sind, sagt eben nichts darüber aus, ob die Brände die Ursache für die Anwesenheit der Feuerwehrleute oder die Anwesenheit der Feuerwehrleute die Ursache für die Brände ist.

Viele Grüße
jake2042


[1]
»Metrisch« heißt »mindestens intervallskaliert«. Sind die Skalennieveaus klar?

Literatur

Bühl, Achim, (13)2012: SPSS 20. Einführung in die moderne Datenanalyse. (= scientific tools 4150) München: Pearson

geantwortet vor 1 Woche, 2 Tage
jake2042, verified
Sonstiger Berufsstatus, Punkte: 230
 

Das Foto ist doch nicht querliegend importiert worden. Das sah nur so aus, solange ich meine Antwort noch nicht gepotet hatte. Wieder was gelernt.   -   jake2042, verified kommentiert vor 1 Woche, 2 Tage

Doch, das Bild müsste um 90° rotiert werden. Ist aber ein Fehler der Seite, die Bilder werden oftmals auch falsch skaliert.
  -   maccheroni_konstante, verified kommentiert vor 1 Woche, 2 Tage
Kommentar schreiben Diese Antwort melden

Deine Antwort
Hinweis: So gibst du Formeln ein.