Statistik: Lageparameter eines Merkmals mit wenig verschiedenen Ausprägungen

Aus Wikibooks

Arithmetisches Mittel

Beispiel

Es wurden in einem Einkaufszentrum n = 20 Kunden bezüglich der Kinderzahl befragt. Wir erhielten die geordnete Urliste

0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 4 5 5

Es resultierte die Häufigkeitsverteilung

j Zahl der Kinder
xj
absolute Häufigkeit
nj
relative Häufigkeit
pj
 
xjnj
 
xjpj
1 0 4 0,2 0 0
2 1 5 0,25 5 0,25
3 2 5 0,25 10 0,5
4 3 3 0,15 9 0,45
5 4 1 0,05 4 0,2
6 5 2 0,1 10 0,5
Σ   20 1 38 1,9

Wir bestimmen das arithmetische Mittel als


Wir können das Mittel aber auch so berechnen:

was in Formelschreibweise ergibt

Ermitteln wir das arithmetische Mittel von Hand, können wir in der Häufigkeitstabelle die Summanden xjnj in der jten Zeile eintragen und aufsummieren.


Alternativ können wir das arithmetische Mittel mit Hilfe der relativen Häufigkeit pj ermitteln:

Zur Verdeutlichung ist auch diese Variante in der Häufigkeitstabelle aufgeführt.


Für ordinal- oder nominalskalierte Merkmale ist das arithmetische Mittel nicht geeignet.


Entsprechende Überlegungen gelten auch für die Varianz s2 der Stichprobe.


Median

Beispiel mit den verkauften Weinflaschen

Wir haben die Urliste nun geordnet.

4 4 4 4 4 5 5 5 5 5 5 5 5 7 7 7 7 7 7 7 10 10 10 10 10  

Der Median teilt die kleineren 50% der Datenwerte von den 50% größeren Werten ab. Also liegt hier der Median auf dem 13. Beobachtungswert.

Bei Daten in Häufigkeitstabellen liegen die Werte schon zwangläufig geordnet vor. Es muss nur die Kategorie gefunden werden, die den Median enthält.


j Preis für eine Weinflasche
xj
absolute Häufigkeit
nj
absolute Summenhäufigkeit
Sj
1 4 5 5
2 5 8 13
3 7 7 20
4 10 5 25
Σ   25  

Anhand der Summenhäufigkeiten können wir sehen, dass der 13. Wert gerade noch in der 2. Kategorie liegt. Diese Kategorie ist die Einfallsklasse des Medians.