Diskussion:Mathematik: Statistik: Nichtlineare Funktionen der Normalverteilung

Aus Wikibooks

Wechseln zu: Navigation, Suche

[Bearbeiten] Herleitung von Schätzfunktionen

Hier folgt eine einfache Einführung in die χ2-Verteilung:

In der Statistik begegnet man oft eine stochastisch unabhängige Stichprobe X1,...,Xn aus eine Normalverteilung N(μ,σ2). Aus dieser Stichprobe berechnet man meistens der Stichprobemittelwert \overline X, der selber auch wieder normalverteilt ist, und die Stichprobevarianz:

S^2=\frac 1{n-1}\sum_{k=1}^n(X_k-\overline X)^2.

Was ist die Verteilung von S2? Es ist wegen dieser Frage dass die χ2-Verteilung eingeführt worden ist. Man kan beweisen dass

(n-1)\frac {S^2}{\sigma^2}

eine sogenannte χ2-Verteilung mit n-1 Freiheitsgraden hat.

Wenn wir die Größe näher betrachten, sehen wir:

(n-1)\frac {S^2}{\sigma^2}=\sum_{k=1}^n\left(\frac{X_k-\overline X}{\sigma}\right)^2.

Das schaut aus wie eine summe von Quadrate der standartisierten Stichprobe. Leider steht der Stichprobemittelwert dort, wo der Erwartungswert μ stehen soll. Es is doch nicht verwunderlich dass eine χ2-Verteilung die Verteilung ist von eine summe von Quadrate von standartnormalvereilten Zufallsvariablen.

Wenn Z1,...,Zn eine stochastisch unabhängige Stichprobe ist von N(0,1)-verteilte Zufallsvariablen, hat

\chi^2_n=\sum_{k=1}^n Z_k^2

eine χ2-Verteilung mit n Freiheitsgraden.

Nijdam 12:42, 7. Jul 2006 (UTC)

Auf analoger Art kan die F-Verteilung eingeführt werden

Man vergleicht zwei Normalverteilungen. Es liegt eine unabhängige Stichprobe X1,...,Xn aus eine N(μ,σ2)-verteilung vor und unabhängig davon eine unabhängige Stichprobe Y1,...,Ym aus eine N(ν,τ2)-verteilung. Aus beiden Stichproben werden die Stichprobevarianzen S_X^2 und S_Y^2 berechnet.

Zum Vergleichen der Varianzen σ2 und τ2 berechnet man den Quotient der beide Schätzfunktionen:

\frac{S_X^2}{S_Y^2}.

Es ist dieser Quotient das zur Einführung der F-Verteilung geführt hat.

Wenn beide Varianzen σ2 und τ2 einander gleich sind, hat dieser Quotient eine F-verteilung. Es handelt sich dann um ein Quotient von zwei unabhängige χ2-verteilte Zufallsvariablen geteilt durch ihren Freiheitsgraden. Sind die beide Varianzen ungleich dann kann man dafür korrigieren, und berechnen:

\frac{S_X^2/\sigma^2}{S_Y^2/\tau^2}.

Dies ist auch wieder ein Quotient von zwei unabhängige χ2-verteilte Zufallsvariablen geteilt durch ihren Freiheitsgraden. Ein solcher Quotient hat nun eine F-verteilung.

Wenn \chi^2_{1n} und \chi^2_{2m} zwei stochastisch unabhängige χ2-verteilte Zufallsvariablen sind mit bzw. n und m Freiheitsgraden, hat der Quotient

F_{n,m}=\frac{\chi^2_{1n}/n}{\chi^2_{2m}/m}

eine F-verteilung mit n und m Freiheitsgraden.

Nijdam 13:26, 7. Jul 2006 (UTC)

Auch der t-Verteilung findet so seine begründung.

Man hat wieder eine stochastisch unabhängige Stichprobe X1,...,Xn aus eine Normalverteilung N(μ,σ2). Der Stichprobemittelwert \overline X ist auch wieder normalverteilt und zwar N(μ,σ2/n). Kennt man die Erwartungswert μ, aber nicht die Varianz σ2, dan weiss man zwar das der standardisierte Form:

Z=\frac {\overline X -\mu}{\sigma/\sqrt{n}}

eine N(0,1)-verteilung hat, aber Z ist noch abhängig des unbekannten Parameters σ, und deshalb nicht berechenbar. Zersetzt man σ durch sein Schatzfunktion S, dan bekommt man die Zufallvariable:

T=\frac {\overline X -\mu}{S/\sqrt{n}},

der berechenbar ist, aber nicht mehr N(0,1)-verteilt. Es lässt sich denken das die verteilung van T viel Ähnlichkeit mit der N(0,1)-Verteilung haben muss. Man nennt die Verteilung von der Zufallvariable T eine t-Verteilung. Man kann T schreiben als:

T=\frac 
{\frac {\overline X - \mu}{\sigma/\sqrt{n} } }
{\sqrt{\frac{S^2}{\sigma^2}}} = \frac{Z}{\sqrt{\chi^2_{n-1}/(n-1)}}
.

Wir sehen ein Quotient einer N(0,1)-verteilte Zufallvariable Z und der Quadratwurzel einer χ2-verteilte Zufallsvariable geteilt durch ihre Freiheitsgraden von deren man beweisen kan sie sei unabhängig van Z.

Algemein nennt man, wenn Z eine N(0,1)-verteilte Zufallvariable ist und \chi^2_n eine von Z unabhängige χ2-verteilte Zufallsvariable, die Verteilung von

T_n= \frac{Z}{\sqrt{\chi^2_n/n}}

eine t-Verteilung mit n Freiheitsgraden.

Nijdam 14:36, 7. Jul 2006 (UTC)


Ich gehe mal davon aus, dass dieser Text ein Vorschlag für den Einbau in nichtlineare Funktionen sein soll. Allerdings steht das meiste davon schon in Hypothesentests [1] für Varianzen. Da passt es, finde ich, besser hin. In diesem Kapitel hier soll es nur um die reinen Verteilungen gehen, vor allem, wie man sie berechnet. Da würde der Einsschub über die Schätzfunkionen eher verwirren. Aber, wie schon vorgeschlagen: Die Wahrscheinlichkeitstheorie wartet. Da würde der obige Beitrag gut zu einem Kapitel Schätzfunktionen passen. --Philipendula ? 16:09, 7. Jul 2006 (UTC)

Persönliche Werkzeuge