Mathematik: Statistik: Test auf Varianz

Aus Wikibooks

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Test auf Varianz

Herleitung der Prüfgröße

Betrachten wir eine normalverteilte Grundgesamtheit. Die Schätzung für die Varianz ist hier

\hat \sigma^2 =  s^2 = \frac {1}{n-1} \sum_{i=1}^n (x_i - \bar x)^2.

Wir wollen nun eine passende Prüfgröße für einen Varianztest herleiten. Seien  x_i \, : i=1,\ldots ,n unabhängige, normalverteilte Zufallsgrößen mit Mittelwert μ und Varianz σ2. Dann sind die Größen (xi − μ) / σ unabhängige, standardnormalverteilte Zufallsvariablen und die Summe der Quadrate ist χ2-verteilt mit n Freiheitsgraden:

 \sum^n_{i=1} \frac{(x_i - \mu )^2}{\sigma^2} .

Schätzt man

\hat \mu = \bar x

geht ein Freiheitsgrad verloren.

 \sum^n_{i=1} \frac{(x_i - \bar x)^2 }{\sigma^2}

ist χ2-verteilt mit n-1 Freiheitsgraden. Wir wollen nun diese Summe mit S2 verquicken, um eine Prüfgröße für diesen Test zu erhalten. Es ist dann

 \sum^n_{i=1} \frac{\frac{(x_i - \bar x)^2}{n-1} \cdot (n-1) }{\sigma^2} = \frac { S^2 \cdot (n-1) }{\sigma^2}

ebenfalls χ2-verteilt mit n-1 Freiheitsgraden. Unter der Nullhypothese H0: σ2 = σ20 ist dann

 Y = \frac { S^2 \cdot (n-1) }{\sigma^2_0}

ebenfalls verteilt wie oben.

Wir wollen nun für H0: σ2 = σ20 den Nichtablehnungsbereich für den Test angeben. Die Hypothese wird nicht abgelehnt, wenn die Prüfgröße y in das Intervall

[\chi^2(\frac{\alpha}{2};n-1);\chi^2(1-\frac{\alpha}{2};n-1)]

fällt, wobei χ2(p;k) das p-Quantil der χ2-Verteilung mit k Freiheitsgraden ist.

Die Nichtablehnungsbereiche für die Bereichshypothesen werden analog zu der Vorgehensweise bei Erwartungswerden festgelegt:

Bei der Mindesthypothese H_0: \sigma^2 \ge \sigma^2_0 wird die Hypothese abgelehnt, wenn die Prüfgröße

Y < χ2(α;n − 1) ist.

Bei der Höchsthypothese H_0: \sigma^2 \le \sigma^2_0 wird die Hypothese abgelehnt, wenn die Prüfgröße

Y > χ2(1 − α;n − 1) ist.

Beispiel für eine Punkthypothese

Ein großer Blumenzwiebelzüchter hat eine neue Sorte von Lilien gezüchtet. Die Zwiebeln sollen im Verkauf in verschiedenen Größenklassen angeboten werden. Um das Angebot planen zu können, benötigt der Züchter eine Information über die Varianz der Zwiebelgröße. Es wurden 25 Zwiebeln zufällig ausgewählt und gemessen. Man erhielt die Durchmesser (cm)

8 10 9 7 6 10 8 8 8 6 7 9 7 10 9 6 7 7 8 8 8 10 10 7 7

Es soll die Hypothese überprüft werden, dass die Varianz der Zwiebelgröße 3 cm2 beträgt (α = 0,05).

Die Nullhypothese lautet H_0: \sigma^2 = \sigma^2_0 = 3

Nichtablehnungsbereich für die Prüfgröße y ist

[\chi^2(\frac{\alpha}{2};n-1);\chi^2(1-\frac{\alpha}{2};n-1)] =

2(0,025;24);χ2(0,975;24)] = [12,40;39,36].

Es ergab sich für die Stichprobe \bar x = 8 und s^2 = \frac{42}{24} = 1,75. Die Prüfgröße errechnet sich als

 y = \frac { S^2 \cdot (n-1) }{\sigma^2_0} = \frac { 1,75 \cdot 24 }{3} =  14 .

Die Hypothese kann nicht abgelehnt werden.

Beispiel für eine Bereichshypothese

An einer Abfüllanlage werden Tagesdosen für ein sehr teures flüssiges Medikament in Plastikschälchen eingebracht. Da das Medikament hochwirksam ist, soll die Abweichung der Füllmenge vom Mittelwert möglichst wenig schwanken. Man weiß, dass die Füllmenge normalverteilt ist. Zur Kontrolle soll die Hypothese getestet werden, dass die Varianz höchstens 0,01 ml2 beträgt. Eine Stichprobe von 20 Schälchen ergab den Mittelwert 0,5 und die Varianz 0,014.

Zu testen ist H_0: \sigma^2 \le \sigma_0^2 .

Die Prüfgröße für H0 ist  Y = \frac { S^2 \cdot (n-1) }{\sigma^2_0} .

Die Hypothese wird abgelehnt, wenn y > χ2(1 − α;n − 1) = χ2(0,9;19) = 27,20 ist.

Die Stichprobe ergab

 y = \frac { 0,014 \cdot 19 }{0,01} =  26,6

Die Hypothese wird nicht abgelehnt. Man geht davon aus, dass die Varianz der Füllmenge sich nicht verändert hat.

Vergleich zweier Varianzen

Wir haben es mit zwei verschiedenen Grundgesamtheiten zu tun. Wir interessieren uns dafür, ob die Varianzen dieser beiden Grundgesamtheiten gleich sind. Beide Merkmale dieser Grundgesamtheiten sollen normalverteilt sein.


Herleitung der Prüfgröße

Zu prüfen ist also die Hypothese: H0: σ12 = σ22.

Geschätzt werden beide Varianzen wieder mit der Stichprobenvarianz

 s^2 = \frac {1}{n-1} \sum_{i=1}^n (x_i - \bar x)^2.

Es soll nun daraus eine Prüfgröße konstruiert werden. Wir wissen bereits, dass der Quotient

Y = \sum^n_{i=1} \frac{(X_i - \bar X)^2 }{\sigma^2}

χ2-verteilt mit n-1 Freiheitsgraden ist. Eine Möglichkeit, zwei solche Zufallsvariablen zu verquicken, ist die F-Verteilung. Es ist nämlich der Quotient

f = \frac {\frac {Y_1}{n_1-1}}{\frac {Y_2}{n_2-1}} = \frac {\frac {\sum_{i=1}^{n_1} (X_{1i} - \bar X_1)^2} { (n_1-1) \sigma_1^2}} {\frac {\sum_{i=1}^{n_2} (X_{2i} - \bar X_2)^2} {(n_2-1) \sigma_2^2 } }

F-verteilt mit n1 - 1 und n2 - 1 Freiheitsgraden. Wir müssen nun noch unsere Stichprobenvarianzen einpflegen und wir sehen, dass ja in Zähler und Nenner die Stichprobenvarianzen S12 und S22 schon dastehen. Also erhalten wir

f = \frac {\frac {S_1^2} {\sigma_1^2}} {\frac {S_2^2}{\sigma_2^2 }} = \frac {S_1^2} {S_2^2} \cdot \frac {\sigma_2^2 } {\sigma_1^2 }

Wir wollen diesen Quotienten nun mit der Nullhypothese in Verbindung bringen. Die Hypothese

H_0: \sigma_1^2 = \sigma_2^2 lässt sich auch schreiben als H_0: \frac {\sigma_1^2} {\sigma_2^2} =1 und es ist dann der Quotient der Prüfgröße unter H0

f = \frac {S_1^2} {S_2^2} \cdot 1 .

Wenn die Nullhypothese wahr ist, sollte f nicht zu groß sein, aber auch nicht zu klein, weil sonst die Stichprobenvarianzen zu unterschiedlich wären. H0 wird also nicht abgelehnt, wenn die Stichprobe f in den „mittleren“ Bereich

[f(\frac{\alpha}{2};n_1-1;n_2-1);f(1-\frac{\alpha}{2};n_1-1;n_2-1)]

fällt, wobei f(p;k1;k2) das p-Quantil der F-Verteilung mit k1 und k2 Freiheitsgraden ist.

Bereichhypothesen werden entsprechend aufgefasst:

H_0: \sigma_1^2 \le \sigma_2^2 lässt sich auch schreiben als H_0: \frac {\sigma_1^2} {\sigma_2^2} \le 1.

Dieser Test wird abgelehnt, wenn

f > f(1-\frac{\alpha}{2};n_1-1;n_2-1),

wobei sich f wie oben berechnet.

Entsprechend wird H_0: \frac {\sigma_1^2} {\sigma_2^2} \ge 1 abgelehnt, wenn

f < f(\frac{\alpha}{2};n_1-1;n_2-1).

Beispiel

Bert und Berta haben im Fach Analysis ein Tutorium gehalten. Die Zeit, die die n1 bzw. n2 Studierenden für eine typische Klausuraufgabe benötigten, wurde festgehalten:

Tutorium von Bert:  8  3  4  4  10  9  2  9
Tutorium von Berta: 5  4  7  6  4

Beide Gruppen erzielten eine durchschnittliche Bearbeitungsdauer von 6 min. Ist aber auch die Varianz beider Gruppenleistungen gleich?

Wir wollen also nun bei einem Signifikanzniveau 0,05 die Nullhypothese testen, dass die Varianzen gleich sind.

Der Nichtablehnungsbereich für diesen Test ist


\begin{array}{ccl}
&&[f(\frac{\alpha}{2};n_1-1;n_2-1);f(1-\frac{\alpha}{2};n_1-1;n_2-1)]\\
&=& [f(0,025;8;5);f(0,975;8;5)] \\
&=& [0,21;6,76] 
\end{array}
,

wobei sich

f(0,025;8;5) = \frac {1}{f(0,975;5;8)} = \frac {1}{4,82} = 0,21

errechnet. Wir erhalten zunächst die Stichprobenvarianzen

 
\begin{array}{ccl}
s_1^2 &=& \frac {1}{n-1} \sum_{i=1}^n (x_i - \bar x)^2 \\
&=& \overset{\text{ } }{\frac{1}{8} }  ((8-6)^2 + (3-6)^2 +(4-6)^2 + .. +(9-6)^2 = \frac {72}{8} = 9 
\end{array}

und analog dazu

 s_2^2 = 5,2 .

Die Prüfgröße errechnet sich nun als

 \frac {S_1^2} {S_2^2} \cdot 1 = \frac {9} {5,2} \cdot 1 = 1,73 .

Sie fällt in den Nichtablehnungsbereich und man kann die Hypothese nicht ablehnen.


↓Prüfung des Zusammenhangs zweier Merkmale
↑Test auf Anteilswert
↑↑Inhaltsverzeichnis Statistik
Persönliche Werkzeuge