Mathematik: Statistik: Nichtlineare Funktionen der Normalverteilung

Aus Wikibooks

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

χ2-Verteilung

Beispiel

Wir haben 3 normalverteilte, paarweise stochastisch unabhängige Zufallsvariablen X1, X2 und X3 gegeben mit den Erwartungswerten μ1, μ2 μ3 und den Varianzen σ12, σ2232. Wir standardisieren diese Variablen und erhalten 3 standardnormalverteilte Zufallsvariablen Z1, Z2 und Z3,


Z_1 = \frac{X_1-\mu_1}{\sigma_1},  \; Z_2 = \frac{X_2-\mu_2}{\sigma_2},\; Z_3 = \frac{X_3-\mu_3}{\sigma_3} \; .


Dichtefunktion der χ2-Verteilung mit ausgewählten Freiheitsgraden
Dichtefunktion der χ2-Verteilung mit ausgewählten Freiheitsgraden

Nun werden die standardnormalverteilten Zufallsvariablen quadriert und aufsummiert. Wir erhalten eine neue Zufallsvariable

Y = Z_1^2+Z_2^2+Z_3^2 \;.

Y ist χ2-verteilt mit 3 Freiheitsgraden.

Allgemein

Es gilt: Die Summe von m quadrierten, stochastisch unabhängigen, standardnormalverteilten Zufallsvariablen ist χ2-verteilt mit m Freiheitsgraden.

Man sieht anhand der Grafik, dass sich die Dichtefunktion mit wachsenden Freiheitsgraden einer symmetrischen Kurve nähert.

Die Wahrscheinlichkeit wird bezeichnet als P(Y ≤ a) = fY(a|n). Das p-Quantil ist χ2(p;n).

Die Verteilungsfunktion der χ2-Verteilung kann nicht analytisch ermittelt werden. Numerische Berechnungen können beispielsweise aus Tabellenwerken, etwa Tabelle der χ2-Verteilung ersehen werden. Da Y für jeden Freiheitsgrad eine eigene Verteilung besitzt, sind in kleineren Tabellen wie oben nur Quantile nach Freiheitsgraden und ausgewählten Wahrscheinlichkeiten aufgeführt. Es ist z.B. das 95%-Quantil (Spalte) der χ2-Verteilung mit 3 Freiheitsgraden (Zeile)

fY(0,95;3) = 7,81. Das bedeutet, die Wahrscheinlichkeit P(y ≤ 7,81) = 0,95.

Gilt n > 30, ist

Z = \sqrt{2X} - \sqrt{2n-1}

näherungsweise standardnormalverteilt.

Nähere Erläuterungen zur χ2-Verteilung, beispielsweise ihre Dichtefunktion, findet man bei Wikipedia. Da die Dichtefunktion jedoch nicht für die Berechnung der Verteilungswerte unmittelbar verwendet werden kann, wird sie hier nicht angeführt.


Beispiele:

Sei Y χ2-verteilt mit 10 Freiheitsgraden. Es ist

  •  P(Y \le 15,99)=0,9
  • P(Y > 3,94) = 1- P(Y \le 3,94) = 1 - 0,05 = 0,95
  • P( 3,25 \le Y \le 20,48) =  P(Y \le 20,48) -  P(Y \le 3,25) = 0,975 - 0,025 = 0,95
  • 10%-Quantil von Y : χ2(0,1;10) = 4,87
  • 95%-Quantil von Y : χ2(0,95;10) = 18,31


Sei Y χ2-verteilt mit 61 Freiheitsgraden. Gesucht ist  P(Y \le 98) . Hier ist die Zahl der Freiheitsgrade k > 30. Es wird eine neue Zufallsvariable X = \sqrt{2Y} gebildet. X ist näherungsweise normalverteilt wie  N(\sqrt {2k-1};1) = N(11;1).  P(Y \le 98) entspricht also  P(X \le \sqrt {2 \cdot 98} ) =  P(X \le 14)

Es ist ΦX(14 | 11;1) =  \Phi_X ( \frac { 14 - 11 } {1} ) = \Phi_X (3) = 0,9987 .

Bemerkung

Die χ2-Verteilung ist reproduktiv, d.h. die Summe von zwei stochastisch unabhängigen χ2-verteilten Zufallsvariablen mit m und n Freiheitsgraden ist wieder χ2-verteilt mit m+n Freiheitsgraden.

Die χ2-Verteilung ist eine so genannte Stichprobenverteilung.


Übung

  1. Die Zufallsvariable X ist χ2-verteilt mit 12 Freiheitsgraden.
    1. Bestimmen Sie die Wahrscheinlichkeit, dass X kleiner als 6,30 ist.
    2. Bestimmen Sie die Wahrscheinlichkeit, dass X mindestens 18,55 beträgt.
    3. Bestimmen Sie das 5%-Quantil der Verteilung.
  2. Die Zufallsvariable Y ist χ2-verteilt mit 40 Freiheitsgraden.
    1. Bestimmen Sie die Wahrscheinlichkeit, dass Y kleiner als 40 ist.
    2. Bestimmen Sie das 95%-Quantil der Verteilung.
  3. Es sei U=X+Y.
    1. Bestimmen Sie den Erwartungswert von U.
    2. Bestimmen Sie die Wahrscheinlichkeit, dass U kleiner als 40 ist.


F-Verteilung

Dichtefunktion der F-Verteilung mit m und n Freiheitsgraden
Dichtefunktion der F-Verteilung mit m und n Freiheitsgraden

Beispiel

Wir haben die drei standardnormalverteilten Zufallsvariablen von oben und vier weitere Z4, Z5, Z6 und Z7 gegeben. Alle Variablen sind wieder stochastisch unabhängig. Der Quotient

F = \frac { \frac{Z_1^2+Z_2^2+Z_3^2}{3}} { \frac{Z_4^2+Z_5^2+Z_6^2+Z_7^2}{4}}

ist dann F-verteilt mit 3 und 4 Freiheitsgraden.


Allgemein

Der Quotient aus zwei χ2-verteilten Zufallsvariablen, jeweils geteilt durch ihre Freiheitsgrade, wobei die Zufallsvariable im Zähler m und die im Nenner n Freiheitsgrade hat, ist F-verteilt mit m und n Freiheitsgraden. Einzelheiten dazu gibt es auch in der Wikipedia. Man schreibt

F \sim F_{m;n}

Die Wahrscheinlichkeit wird bezeichnet als P(F ≤ a) = fF(a|m;n). Das p-Quantil ist F(p;m;n).

Auch die F-Verteilung liegt tabelliert vor und ist meistens nach ausgewählten Freiheitsgraden und Quantilen tabelliert. Eine nützliche Beziehung ist dabei

F(p;m;n) = \frac {1}{F(1-p;n;m)}.

Für viele Freiheitsgrade kann man sich die Faustregel merken: Sind m und n größer als 30, kann man die Quantile näherungsweise mit der Standardnormalverteilung ermitteln:

F(p;m;n) \approx z(p)\;.

Die F-verteilung ist ebenfalls eine Stichprobenverteilung. Sie ist aber nicht reproduktiv.

t-Verteilung

Beispiel

Gegeben sind die standardnormalverteilten Zufallsvariablen von oben.

Der Quotient

t = \frac {Z_1}{\sqrt {\frac{Z_2^2+Z_3^2+Z_4^2+Z_5^2}{4}}} ist t-verteilt mit 4 Freiheitsgraden.

Allgemein

Der Quotient aus einer standardnormalverteilten Zufallsvariablen und der Wurzel einer χ2-verteilten Zufallsvariablen mit n Freiheitsgraden, geteilt durch ihre Freiheitsgrade, ist t-verteilt mit n Freiheitsgraden.

Die Wahrscheinlichkeit wird bezeichnet als P(t ≤ a) = ft(a|n). Das p-Quantil ist t(p;n).

Die Dichtefunktion der t-Verteilung ist, ähnlich wie die der Standardnormalverteilung, symmetrisch bezüglich des Erwartungswertes 0. Es gilt daher für die Berechnung der Verteilungswerte:

P(t \le -a) = P(t \ge a),

a ∈ R.

Auch die t-Verteilung ist meistens nach Freiheitsgraden und ausgewählten Quantilen tabelliert: t-Verteilung

Für n > 30 kann man die Wahrscheinlichkeiten der t-Verteilung approximativ mit der Normalverteilung berechnen:

t(p;n) \approx z(p)\;.

Bemerkungen:

  • Das Quadrat einer t-verteilten Zufallsvariablen ist F-verteilt.
  • Die t-Verteilung ist eine Stichprobenverteilung
  • Weitere Eigenschaften können in der Wikipedia nachgelesen werden.


↓Approximation von Verteilungen
↑Lineare Funktionen der Normalverteilung
↑↑Inhaltsverzeichnis Statistik
Persönliche Werkzeuge