Statistik: Streuungsparameter eines Merkmals mit wenig verschiedenen Ausprägungen
Hier wollen wir die Berechnung der Varianz eines häufbaren metrischen Merkmals ansehen. Unsere Überlegungen laufen analog zum arithmetischen Mittel. Wir betrachten das
Beispiel mit den verkauften Weinflaschen
Aus der Urliste mit 25 Beobachtungen:
4 4 4 4 4 5 5 5 5 5 5 5 5 7 7 7 7 7 7 7 10 10 10 10 10
berechnen wir die Stichprobenvarianz aus
In dieser Formel ist xi die i. Beobachtung aus der Urliste.
Analog zum arithmetischen Mittel eines Merkmals mit wenig Ausprägungen werden wir aber nicht die obige Formel für die Varianz verwenden, sondern die Vorteile der Häufigkeitstabelle nützen. Wir können nämlich die Stichprobenvarianz berechnen als
wobei die xj jetzt die verschiedenen Ausprägungen des Merkmals darstellen.
j | Preis für eine Weinflasche xj |
absolute Häufigkeit nj |
xj nj | ||
---|---|---|---|---|---|
1 |
4 |
5 |
20 |
5,5696 |
27,8480 |
2 |
5 |
8 |
40 |
1,8496 |
14,7968 |
3 |
7 |
7 |
49 |
0,4096 |
2,8672 |
4 |
10 |
5 |
50 |
13,2496 |
66,2480 |
Σ |
25 |
159 |
111,7600 |
Zunächst benötigen wir den Mittelwert . Er berechnet sich wie in Lageparameter als
Wir erhalten nun
Der Computer kann das leicht ermitteln. Möchten wir jedoch die Varianz händisch ausrechnen, finden wir den „krummen“ Mittelwert als störend. Wir können natürlich auch hier den Verschiebungssatz anwenden. Es gilt nämlich für die benötigte Quadratsumme:
Wir berechnen sukzessive in unserer Häufigkeitstabelle die xj2 und xj2 nj und erhalten zunächst für Q
und für die Varianz
j | Preis für eine Weinflasche xj |
absolute Häufigkeit nj |
xj nj |
xj2 | xj2nj |
---|---|---|---|---|---|
1 | 4 | 5 | 20 | 16 | 80 |
2 | 5 | 8 | 40 | 25 | 200 |
3 | 7 | 7 | 49 | 49 | 343 |
4 | 10 | 5 | 50 | 100 | 500 |
Σ | 25 | 159 | 1123 |