Mathematik: Statistik: Abhängigkeit von Zufallsvariablen

Aus Wikibooks

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Stochastische Unabhängigkeit

Falls X und Y stochastisch unabhängig sind, ist

 f_{X,Y}(x_i;y_j) = f_X(x_i) \cdot f_Y(y_j)  .

Beispiel:

Z.B. ist P(X = 0 ∧ Y = 0) = 0, aber P(X = 0) · P(Y = 0) = 0,4 · 0,2 ≠ 0.

Also sind X und Y stochastisch abhängig. Es genügt schon, wenn die Unabhängigkeitsvoraussetzung für ein Paar nicht erfüllt ist.


Kovarianz

Man interessiert sich bei gemeinsam verteilten Variablen im allgemeinen auch dafür, inwieweit zwischen diesen Variablen ein Zusammenhang besteht. In unserer Wahrscheinlichkeitstabelle des Beispiels der Qualitätskontrolle stehen beispielsweise links unten und rechts oben die größeren Wahrscheinlichkeiten, also scheinen niedrige Ausprägungen von X eher mit hohen Ausprägungen von Y und hohe Ausprägungen von X eher mit niedrigen Ausprägungen von Y einherzugehen.

Wahrscheinlichkeitstabelle des Beispiels von oben
Gemeinsame Wahrscheinlichkeit von Qualitätskontrolle X und Reklamationskosten Y
x \ y 0 5 10 15 fX(x)
0 0,00 0,00 0,10 0,30 0,4
5 0,00 0,05 0,05 0,10 0,2
10 0,20 0,15 0,05 0,00 0,4
fY(y) 0,2 0,2 0,2 0,4 1,0

Ein Maß für beispielsweise einen linearen Zusammenhang zweier Zufallsvariablen X und Y ist die Kovarianz covXY. Sie ist für diskrete Zufallsvariablen definiert als

covXY = \sum_{i=1}^n \sum_{j=1}^m (x_i - EX)(y_j - EY)f_{X,Y}(x_i;y_j)

bzw. wegen des Verschiebungssatzes

covXY= \sum_{i=1}^n \sum_{j=1}^m x_i \cdot y_j \cdot f_{X,Y}(x_i;y_j) - EX \cdot EY

Es ergibt für unser Beispiel

EX = 0 \cdot  0{,}4 + 5 \cdot 0{,}2 + 10 \cdot  0{,}4 = 5

und

EY =  0 \cdot  0{,}2 + 5 \cdot  0{,}2 + 10 \cdot  0{,}2 + 15 \cdot  0{,}4 = 9

und damit die Kovarianz

covXY =  (0 - 5) (0 - 9) \cdot  0 +  (5 - 5) (0 - 9) \cdot  0+  (10 - 5) (0 - 9) \cdot  0{,}2
  +  (0 - 5) (5 - 9) \cdot  0 +  (5 - 5) (5 - 9) \cdot  0{,}05 +  (10 - 5) (5 - 9) \cdot  0{,}15
  +  (0 - 5) (10 - 9) \cdot  0{,}1  +  (5 - 5) (10 - 9) \cdot  0{,}05 +  (10 - 5) (10 - 9) \cdot  0{,}05
  + (0 - 5) (15 - 9) \cdot  0{,}3 +  (5 - 5) (15 - 9) \cdot  0{,}1 +  (10 - 5) (15 - 9) \cdot  0
= 0 + 0 + (-5) \cdot  0{,}1 + (-30) \cdot  0{,}3 + 0 + 0 + 0 + 0
  + (-45) \cdot  0{,}2 + (-20) \cdot  0{,}15 + 5 \cdot  0{,}05 + 0 = -21{,}25

Eine positive Kovarianz deutet daraufhin, dass eher ein proportionaler Zusammenhang zwischen X und Y besteht, eine negative Kovarianz dagegen, dass eher ein umgekehrt proportionaler Zusammenhang zwischen X und Y besteht.

Korrelationskoeffizient

Ist die Kovarianz Null, sind die Zufallsvariablen unkorreliert, sonst korreliert.

Die Kovarianz ist nicht normiert. Ein normiertes Maß für den linearen Zusammenhang stellt der Korrelationkoeffizient nach BRAVAIS-PEARSON ρX,Y dar, der definiert ist als

\rho_{X,Y} = \frac {\mathrm{cov}XY}{ \sqrt{\mathrm{var}X} \sqrt{\mathrm{var}Y}} .


Es gilt für den Korrelationskoeffizienten ρX,Y :

 -1 \le \rho_{X,Y} \le 1 .

Ist ρX,Y 1 oder -1, besteht ein exakter linearer Zusammenhang zwischen X und Y.

Sind X und Y stochastisch unabhängig, ist covXY und damit ρX,Y gleich Null. Der Umkehrschluss ist nicht zulässig, da eine nichtlineare Abhängigkeitsstruktur zwischen X und Y bestehen kann, die vom Korrelationskoeffizienten nicht erfasst werden kann.

Beispiel:

Wir berechnen zunächst die Varianz von X als

\mathrm{var}X = (0 - 5)^2 \cdot 0{,}4 +  (5 - 5)^2 \cdot 0{,}2 +  (10 - 5)^2 \cdot 0{,}4 = 20

und entsprechend die Varianz von Y als

\mathrm{var}Y = 34\,.

Damit erhalten wir

\rho_{X,Y} = \frac {\mathrm{cov}(X,Y)}{ \sqrt{\mathrm{var}X} \sqrt{\mathrm{var}Y}} = \frac {-21{,}25}{ \sqrt{20} \sqrt{34}}  = - 0{,}8149.

Bedingte Wahrscheinlichkeiten von Zufallsvariablen

Auch für Zufallsvariablen sind bedingte Wahrscheinlichkeiten angebbar, nämlich

die bedingte Wahrscheinlichkeit einer Zufallsvariablen als

P(X \le x_i | X \le x_k) =  \frac {P(X \le x_i \wedge X \le x_k)}{P(X \le x_k)}

und die bedingte Wahrscheinlichkeit zweier Zufallsvariablen

P(X \le x_i | Y \le y_j) =  \frac {P(X \le x_i \wedge Y \le y_j)}{P(Y \le y_j)} .

Entsprechendes gilt für ≥ und =.


Ebenso gilt:

Wenn X und Y stochastisch unabhängig sind, ist

 P(X \le x_i \wedge Y \le y_j) =  P(X \le x_i ) \cdot P(Y \le y_j)

für alle i,j.

Beispiele:

P(Y \ge 15| Y \ge 5) = \frac{P(Y \ge 15 \wedge Y \ge 5)}{P(Y \ge 5)} = \frac{P(Y \ge 15)}{P(Y \ge 5)} = \frac {0{,}4} {0{,}8} = 0{,}5 .

„Die Hälfte aller Unternehmen mit Reklamationskosten hatte mindestens 15% Aufwand.“


P(Y \ge 5| X = 10) = \frac {P(Y \ge 5 \wedge X = 10)}{P(X = 10)}   =  \frac {0{,}15 + 0{,}05 + 0}{0{,}4}   = 0{,}5 .

„Die Hälfte aller Unternehmen mit sehr viel Qualitätskontrolle hatte Reklamationskosten.“


↓Funktionen von Zufallsvariablen
↑Mehrdimensionale Zufallsvariablen
↑↑Inhaltsverzeichnis Statistik
Persönliche Werkzeuge