Mathematik: Statistik: Streuungsparameter eines Merkmals mit wenig verschiedenen Ausprägungen

Aus Wikibooks

Wechseln zu: Navigation, Suche

Hier wollen wir die Berechnung der Varianz eines häufbaren metrischen Merkmals ansehen. Unsere Überlegungen laufen analog zum arithmetischen Mittel. Wir betrachten das

Beispiel mit den verkauften Weinflaschen

Aus der Urliste mit 25 Beobachtungen:

4 4 4 4 4 5 5 5 5 5 5 5 5 7 7 7 7 7 7 7 10 10 10 10 10  

berechnen wir die Stichprobenvarianz aus

s^2 = \frac {1}{n-1}\sum_{i=1}^n (x_i - \bar x)^2.

In dieser Formel ist xi die i. Beobachtung aus der Urliste.

Analog zum arithmetischen Mittel eines Merkmals mit wenig Ausprägungen werden wir aber nicht die obige Formel für die Varianz verwenden, sondern die Vorteile der Häufigkeitstabelle nützen. Wir können nämlich die Stichprobenvarianz berechnen als

s^2 = \frac {1}{n-1} \sum_{j=1}^m (x_j - \overline x)^2 \cdot n_j ,

wobei die xj jetzt die verschiedenen Ausprägungen des Merkmals darstellen.

j Preis für eine
Weinflasche

xj
absolute
Häufigkeit

nj
xj nj (xj - x)2 (xj - x)2nj

1

4

5

20

5,5696

27,8480

2

5

8

40

1,8496

14,7968

3

7

7

49

0,4096

2,8672

4

10

5

50

13,2496

66,2480

Σ

25

159

111,7600

Zunächst benötigen wir den Mittelwert x. Er berechnet sich wie in Lageparameter als

 \overline x = \frac {1}{n}\sum_{j=1}^m x_jn_j = \frac {159}{25} = 6,36 .

Wir erhalten nun

s^2 = \frac {1}{24} \cdot 111,7600 \approx 4,66 .

Der Computer kann das leicht ermitteln. Möchten wir jedoch die Varianz händisch ausrechnen, finden wir den "krummen" Mittelwert als störend. Wir können natürlich auch hier den Verschiebungssatz anwenden. Es gilt nämlich für die benötigte Quadratsumme:

Q = \sum_{j=1}^n (x_j - \bar x)^2 \cdot n_j = (\sum_{j=1}^n x_j^2 \cdot n_j) - n \cdot \bar x^2  .

Wir berechnen sukzessive in unserer Häufigkeitstabelle die xj2 und xj2 nj und erhalten zunächst für Q

Q= 1123 - 25 \cdot 6,36^2 = 111,76

und für die Varianz

s^2 = \frac {111,76} {25-1} = 4,66.


j Preis für eine
Weinflasche

xj
absolute
Häufigkeit

nj
 
xj nj
xj2 xj2nj
1 4 5 20 16 80
2 5 8 40 25 200
3 7 7 49 49 343
4 10 5 50 100 500
Σ   25 159   1123


↑Lageparameter
↑↑Inhaltsverzeichnis Statistik
Persönliche Werkzeuge