Mathematik: Statistik: Test auf Varianz
Aus Wikibooks
Inhaltsverzeichnis |
Test auf Varianz
Herleitung der Prüfgröße
Betrachten wir eine normalverteilte Grundgesamtheit. Die Schätzung für die Varianz ist hier
.
Wir wollen nun eine passende Prüfgröße für einen Varianztest herleiten. Seien
unabhängige, normalverteilte Zufallsgrößen mit Mittelwert μ und Varianz σ2. Dann sind die Größen (xi − μ) / σ unabhängige, standardnormalverteilte Zufallsvariablen und die Summe der Quadrate ist χ2-verteilt mit n Freiheitsgraden:
.
Schätzt man
geht ein Freiheitsgrad verloren.
ist χ2-verteilt mit n-1 Freiheitsgraden. Wir wollen nun diese Summe mit S2 verquicken, um eine Prüfgröße für diesen Test zu erhalten. Es ist dann
ebenfalls χ2-verteilt mit n-1 Freiheitsgraden. Unter der Nullhypothese H0: σ2 = σ20 ist dann
ebenfalls verteilt wie oben.
Wir wollen nun für H0: σ2 = σ20 den Nichtablehnungsbereich für den Test angeben. Die Hypothese wird nicht abgelehnt, wenn die Prüfgröße y in das Intervall
fällt, wobei χ2(p;k) das p-Quantil der χ2-Verteilung mit k Freiheitsgraden ist.
Die Nichtablehnungsbereiche für die Bereichshypothesen werden analog zu der Vorgehensweise bei Erwartungswerden festgelegt:
Bei der Mindesthypothese
wird die Hypothese abgelehnt, wenn die Prüfgröße
- Y < χ2(α;n − 1) ist.
Bei der Höchsthypothese
wird die Hypothese abgelehnt, wenn die Prüfgröße
- Y > χ2(1 − α;n − 1) ist.
Beispiel für eine Punkthypothese
Ein großer Blumenzwiebelzüchter hat eine neue Sorte von Lilien gezüchtet. Die Zwiebeln sollen im Verkauf in verschiedenen Größenklassen angeboten werden. Um das Angebot planen zu können, benötigt der Züchter eine Information über die Varianz der Zwiebelgröße. Es wurden 25 Zwiebeln zufällig ausgewählt und gemessen. Man erhielt die Durchmesser (cm)
8 10 9 7 6 10 8 8 8 6 7 9 7 10 9 6 7 7 8 8 8 10 10 7 7
Es soll die Hypothese überprüft werden, dass die Varianz der Zwiebelgröße 3 cm2 beträgt (α = 0,05).
Die Nullhypothese lautet 
Nichtablehnungsbereich für die Prüfgröße y ist
=
[χ2(0,025;24);χ2(0,975;24)] = [12,40;39,36].
Es ergab sich für die Stichprobe
und
. Die Prüfgröße errechnet sich als
.
Die Hypothese kann nicht abgelehnt werden.
Beispiel für eine Bereichshypothese
An einer Abfüllanlage werden Tagesdosen für ein sehr teures flüssiges Medikament in Plastikschälchen eingebracht. Da das Medikament hochwirksam ist, soll die Abweichung der Füllmenge vom Mittelwert möglichst wenig schwanken. Man weiß, dass die Füllmenge normalverteilt ist. Zur Kontrolle soll die Hypothese getestet werden, dass die Varianz höchstens 0,01 ml2 beträgt. Eine Stichprobe von 20 Schälchen ergab den Mittelwert 0,5 und die Varianz 0,014.
Zu testen ist
.
Die Prüfgröße für H0 ist
.
Die Hypothese wird abgelehnt, wenn y > χ2(1 − α;n − 1) = χ2(0,9;19) = 27,20 ist.
Die Stichprobe ergab
Die Hypothese wird nicht abgelehnt. Man geht davon aus, dass die Varianz der Füllmenge sich nicht verändert hat.
Vergleich zweier Varianzen
Wir haben es mit zwei verschiedenen Grundgesamtheiten zu tun. Wir interessieren uns dafür, ob die Varianzen dieser beiden Grundgesamtheiten gleich sind. Beide Merkmale dieser Grundgesamtheiten sollen normalverteilt sein.
Herleitung der Prüfgröße
Zu prüfen ist also die Hypothese: H0: σ12 = σ22.
Geschätzt werden beide Varianzen wieder mit der Stichprobenvarianz
.
Es soll nun daraus eine Prüfgröße konstruiert werden. Wir wissen bereits, dass der Quotient
χ2-verteilt mit n-1 Freiheitsgraden ist. Eine Möglichkeit, zwei solche Zufallsvariablen zu verquicken, ist die F-Verteilung. Es ist nämlich der Quotient
F-verteilt mit n1 - 1 und n2 - 1 Freiheitsgraden. Wir müssen nun noch unsere Stichprobenvarianzen einpflegen und wir sehen, dass ja in Zähler und Nenner die Stichprobenvarianzen S12 und S22 schon dastehen. Also erhalten wir
Wir wollen diesen Quotienten nun mit der Nullhypothese in Verbindung bringen. Die Hypothese
lässt sich auch schreiben als
und es ist dann der Quotient der Prüfgröße unter H0
.
Wenn die Nullhypothese wahr ist, sollte f nicht zu groß sein, aber auch nicht zu klein, weil sonst die Stichprobenvarianzen zu unterschiedlich wären. H0 wird also nicht abgelehnt, wenn die Stichprobe f in den „mittleren“ Bereich
fällt, wobei f(p;k1;k2) das p-Quantil der F-Verteilung mit k1 und k2 Freiheitsgraden ist.
Bereichhypothesen werden entsprechend aufgefasst:
lässt sich auch schreiben als
.
Dieser Test wird abgelehnt, wenn
,
wobei sich f wie oben berechnet.
Entsprechend wird
abgelehnt, wenn
.
Beispiel
Bert und Berta haben im Fach Analysis ein Tutorium gehalten. Die Zeit, die die n1 bzw. n2 Studierenden für eine typische Klausuraufgabe benötigten, wurde festgehalten:
Tutorium von Bert: 8 3 4 4 10 9 2 9 Tutorium von Berta: 5 4 7 6 4
Beide Gruppen erzielten eine durchschnittliche Bearbeitungsdauer von 6 min. Ist aber auch die Varianz beider Gruppenleistungen gleich?
Wir wollen also nun bei einem Signifikanzniveau 0,05 die Nullhypothese testen, dass die Varianzen gleich sind.
Der Nichtablehnungsbereich für diesen Test ist
,
wobei sich
errechnet. Wir erhalten zunächst die Stichprobenvarianzen
und analog dazu
.
Die Prüfgröße errechnet sich nun als
.
Sie fällt in den Nichtablehnungsbereich und man kann die Hypothese nicht ablehnen.







![[f(\frac{\alpha}{2};n_1-1;n_2-1);f(1-\frac{\alpha}{2};n_1-1;n_2-1)]](http://upload.wikimedia.org/math/2/f/9/2f91a3976582f8e48e1e35cbddd374da.png)

