Statistik: Lageparameter eines Merkmals mit wenig verschiedenen Ausprägungen
Arithmetisches Mittel
Beispiel
Es wurden in einem Einkaufszentrum n = 20 Kunden bezüglich der Kinderzahl befragt. Wir erhielten die geordnete Urliste
0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 4 5 5
Es resultierte die Häufigkeitsverteilung
j | Zahl der Kinder xj |
absolute Häufigkeit nj |
relative Häufigkeit pj |
xjnj |
xjpj |
---|---|---|---|---|---|
1 | 0 | 4 | 0,2 | 0 | 0 |
2 | 1 | 5 | 0,25 | 5 | 0,25 |
3 | 2 | 5 | 0,25 | 10 | 0,5 |
4 | 3 | 3 | 0,15 | 9 | 0,45 |
5 | 4 | 1 | 0,05 | 4 | 0,2 |
6 | 5 | 2 | 0,1 | 10 | 0,5 |
Σ | 20 | 1 | 38 | 1,9 |
Wir bestimmen das arithmetische Mittel als
Wir können das Mittel aber auch so berechnen:
was in Formelschreibweise ergibt
Ermitteln wir das arithmetische Mittel von Hand, können wir in der Häufigkeitstabelle die Summanden xjnj in der jten Zeile eintragen und aufsummieren.
Alternativ können wir das arithmetische Mittel mit Hilfe der relativen Häufigkeit pj ermitteln:
Zur Verdeutlichung ist auch diese Variante in der Häufigkeitstabelle aufgeführt.
Für ordinal- oder nominalskalierte Merkmale ist das arithmetische Mittel nicht geeignet.
Entsprechende Überlegungen gelten auch für die Varianz s2 der Stichprobe.
Median
Beispiel mit den verkauften Weinflaschen
Wir haben die Urliste nun geordnet.
4 4 4 4 4 5 5 5 5 5 5 5 5 7 7 7 7 7 7 7 10 10 10 10 10
Der Median teilt die kleineren 50% der Datenwerte von den 50% größeren Werten ab. Also liegt hier der Median auf dem 13. Beobachtungswert.
Bei Daten in Häufigkeitstabellen liegen die Werte schon zwangläufig geordnet vor. Es muss nur die Kategorie gefunden werden, die den Median enthält.
j | Preis für eine Weinflasche xj |
absolute Häufigkeit nj |
absolute Summenhäufigkeit Sj |
1 | 4 | 5 | 5 |
2 | 5 | 8 | 13 |
3 | 7 | 7 | 20 |
4 | 10 | 5 | 25 |
Σ | 25 |
Anhand der Summenhäufigkeiten können wir sehen, dass der 13. Wert gerade noch in der 2. Kategorie liegt. Diese Kategorie ist die Einfallsklasse des Medians.