Statistik: Nichtlineare Funktionen der Normalverteilung
χ2-Verteilung
Beispiel
Wir haben 3 normalverteilte, paarweise stochastisch unabhängige Zufallsvariablen X1, X2 und X3 gegeben mit den Erwartungswerten μ1, μ2 μ3 und den Varianzen σ12, σ22,σ32. Wir standardisieren diese Variablen und erhalten 3 standardnormalverteilte Zufallsvariablen Z1, Z2 und Z3,
Nun werden die standardnormalverteilten Zufallsvariablen quadriert und aufsummiert. Wir erhalten eine neue Zufallsvariable
Y ist χ2-verteilt mit 3 Freiheitsgraden.
Allgemein
Es gilt: Die Summe von m quadrierten, stochastisch unabhängigen, standardnormalverteilten Zufallsvariablen ist χ2-verteilt mit m Freiheitsgraden.
Man sieht anhand der Grafik, dass sich die Dichtefunktion mit wachsenden Freiheitsgraden einer symmetrischen Kurve nähert.
Die Wahrscheinlichkeit wird bezeichnet als P(Y ≤ a) = fY(a|n). Das p-Quantil ist χ2(p;n).
Die Verteilungsfunktion der χ2-Verteilung kann nicht analytisch ermittelt werden. Numerische Berechnungen können beispielsweise aus Tabellenwerken, etwa Tabelle der χ2-Verteilung ersehen werden. Da Y für jeden Freiheitsgrad eine eigene Verteilung besitzt, sind in kleineren Tabellen wie oben nur Quantile nach Freiheitsgraden und ausgewählten Wahrscheinlichkeiten aufgeführt. Es ist z. B. das 95%-Quantil (Spalte) der χ2-Verteilung mit 3 Freiheitsgraden (Zeile)
fY(0,95;3) = 7,81. Das bedeutet, die Wahrscheinlichkeit P(y ≤ 7,81) = 0,95.
Gilt n > 30, ist
näherungsweise standardnormalverteilt.
Nähere Erläuterungen zur χ2-Verteilung, beispielsweise ihre Dichtefunktion, findet man bei Wikipedia. Da die Dichtefunktion jedoch nicht für die Berechnung der Verteilungswerte unmittelbar verwendet werden kann, wird sie hier nicht angeführt.
Beispiele:
Sei Y χ2-verteilt mit 10 Freiheitsgraden. Es ist
- 10%-Quantil von Y :
- 95%-Quantil von Y :
Sei Y χ2-verteilt mit 61 Freiheitsgraden. Gesucht ist .
Hier ist die Zahl der Freiheitsgrade k > 30. Es wird eine neue Zufallsvariable gebildet.
X ist näherungsweise normalverteilt wie . entspricht also
Es ist
Bemerkung
Die χ2-Verteilung ist reproduktiv, d. h. die Summe von zwei stochastisch unabhängigen χ2-verteilten Zufallsvariablen mit m und n Freiheitsgraden ist wieder χ2-verteilt mit m+n Freiheitsgraden.
Die χ2-Verteilung ist eine so genannte Stichprobenverteilung.
Übung
- Die Zufallsvariable X ist χ2-verteilt mit 12 Freiheitsgraden.
- Bestimmen Sie die Wahrscheinlichkeit, dass X kleiner als 6,30 ist.
- Bestimmen Sie die Wahrscheinlichkeit, dass X mindestens 18,55 beträgt.
- Bestimmen Sie das 5%-Quantil der Verteilung.
- Die Zufallsvariable Y ist χ2-verteilt mit 40 Freiheitsgraden.
- Bestimmen Sie die Wahrscheinlichkeit, dass Y kleiner als 40 ist.
- Bestimmen Sie das 95%-Quantil der Verteilung.
- Es sei U=X+Y.
- Bestimmen Sie den Erwartungswert von U.
- Bestimmen Sie die Wahrscheinlichkeit, dass U kleiner als 40 ist.
F-Verteilung
Beispiel
Wir haben die drei standardnormalverteilten Zufallsvariablen von oben und vier weitere Z4, Z5, Z6 und Z7 gegeben. Alle Variablen sind wieder stochastisch unabhängig. Der Quotient
ist dann F-verteilt mit 3 und 4 Freiheitsgraden.
Allgemein
Der Quotient aus zwei χ2-verteilten Zufallsvariablen, jeweils geteilt durch ihre Freiheitsgrade, wobei die Zufallsvariable im Zähler m und die im Nenner n Freiheitsgrade hat, ist F-verteilt mit m und n Freiheitsgraden. Einzelheiten dazu gibt es auch in der Wikipedia. Man schreibt
Die Wahrscheinlichkeit wird bezeichnet als P(F ≤ a) = fF(a|m;n). Das p-Quantil ist F(p;m;n).
Auch die F-Verteilung liegt tabelliert vor und ist meistens nach ausgewählten Freiheitsgraden und Quantilen tabelliert. Eine nützliche Beziehung ist dabei
Die F-verteilung ist ebenfalls eine Stichprobenverteilung. Sie ist aber nicht reproduktiv.
t-Verteilung
Beispiel
Gegeben sind die standardnormalverteilten Zufallsvariablen von oben.
Der Quotient
ist t-verteilt mit 4 Freiheitsgraden.
Allgemein
Der Quotient aus einer standardnormalverteilten Zufallsvariablen und der Wurzel einer χ2-verteilten Zufallsvariablen mit n Freiheitsgraden, geteilt durch ihre Freiheitsgrade, ist t-verteilt mit n Freiheitsgraden.
Die Wahrscheinlichkeit wird bezeichnet als P(t ≤ a) = ft(a|n). Das p-Quantil ist t(p;n).
Die Dichtefunktion der t-Verteilung ist, ähnlich wie die der Standardnormalverteilung, symmetrisch bezüglich des Erwartungswertes 0. Es gilt daher für die Berechnung der Verteilungswerte:
mit
- a ∈ R.
Auch die t-Verteilung ist meistens nach Freiheitsgraden und ausgewählten Quantilen tabelliert: t-Verteilung
Für n > 30 kann man die Wahrscheinlichkeiten der t-Verteilung approximativ mit der Normalverteilung berechnen:
Bemerkungen:
- Das Quadrat einer t-verteilten Zufallsvariablen ist F-verteilt.
- Die t-Verteilung ist eine Stichprobenverteilung
- Weitere Eigenschaften können in der Wikipedia nachgelesen werden.