Statistik: Streuungsparameter eines metrischen Merkmals mit wenigen verschiedenen Beobachtungen

Aus Wikibooks
Zur Navigation springen Zur Suche springen

Varianz als Streuungsparameter

Der Lageparameter allein reicht für die Beschreibung einer Datenmenge nicht aus (analoges Problem wie bei Zufallsverteilungen). Information über die Streuung der Beobachtungswerte liefert ein Streuungsparameter. Es kommen verschiedene Kennwerte als Streuungsparameter in Betracht, beispielsweise die Varianz, die Spannweite, der Quartilsabstand und der Variationskoeffizient.


Varianz

Am häufigsten wird als Kennwert die Varianz verwendet, da sie wahrscheinlichkeitstheoretisch am besten zu untersuchen ist. Die Varianz sind die mittleren quadratischen Abweichungen der Einzelwerte xi vom arithmetischen Mittel

Der Nenner n-1 wirkt vielleicht etwas befremdlich. Allerdings hat die Verwendung von n-1 statt n wahrscheinlichkeitstheoretische Vorzüge, wenn man die Varianz der Verteilung eines Merkmals mit s2 schätzen möchte. Man nennt dieses Art der Varianz inferentielle Varianz.

Beispiel

Eine Firma möchte einen Kachelofen auf den Markt bringen, der für einen Komplettpreis zu erwerben ist. Für die Kalkulation dieses Preises benötigt die Firma Informationen über die Montagezeit für einen Kachelofen. Bei der Endmontage von 11 Kachelöfen ergaben sich die Zeiten

2,5  3  3  3,3  3,6  3  2,3  3  3,1  3,2  3

Die Varianz der Montagezeiten soll bestimmt werden. Nach der obigen Formel muss zunächst das arithmetische Mittel bestimmt werden:

.

Dann erhalten wir als Varianz

.

Verzichtet man auf eine Schätzung, kann man auch die deskriptive Varianz

für die Beschreibung von statistischen Daten verwenden, was aber hier zur Vermeidung von Verwechslungen unterlassen wird.

Bei der manuellen Berechnung von s2 ist es oftmals mühsam, erst die einzelnen Differenzen xi - x zu bilden und dann zu quadrieren. Mit Hilfe des Verschiebungssatzes kann die laufende Differenzenbildung vermieden werden. Betrachten wir die Summe

.

Diese Summe lässt sich zerlegen in

.

Setzt man den Ausdruck oben ein, erhält man für die Varianz


Beispiel:

.

Da die Varianz ein quadratischer Ausdruck ist, hat sie z.B. auch die Einheit h2, wenn die xi die Einheit h haben. Um die Varianz anschaulicher zu machen, kann man ihre Quadratwurzel, die Standardabweichung s betrachten:

Beispiel

,

also ca. 20 Minuten. Man könnte etwas flapsig sagen, dass die Montagezeit eines Ofens im Mittel 3 Stunden +/- 20 Minuten beträgt.

Auch die Varianz reagiert empfindlich auf Ausreißer. Es gibt hier resistente Streuungsparameter, die weiter unten behandelt werden.


↓  Daten, die in Häufigkeitstabellen zusammengefasst sind
↑  Lageparameter bei wenigen verschiedenen Beobachtungen
↑↑ Inhaltsverzeichnis Statistik