Statistik: Lageparameter eines metrischen Merkmals mit vielen verschiedenen Ausprägungen
Arithmetisches Mittel
Ist die Urliste gegeben, berechnet sich das arithmetische Mittel aus der bekannten Durchschnittsbildung der Beobachtungswerte. Sind jedoch die Informationen der Urliste nicht mehr verfügbar, kann man das arithmetische Mittel nur noch näherungsweise bestimmen. Man verwendet die Klassenmitte xj' als Ersatz für die Merkmalsausprägung xj in der Klasse j und nähert das arithmetische Mittel an als
Die Klassenmitte soll das Niveau einer Klasse widerspiegeln. Das ist vor allem der Fall, wenn sich die Einzelwerte der Urliste gleichmäßig in einer Klasse verteilen. Sind die Einzelwerte mehrheitlich an einer Klassengrenze gelegen, gibt xj' unter Umständen nicht mehr das Niveau korrekt wieder. Die optimale Aufteilung der Klassen sollte schon bei Klassenbildung berücksichtigt werden. Im Sinne einer einfachen Handhabung sollte xj' eine Zahl sein, mit der man leicht rechnen kann, also z.B. 200 und nicht 199,5.
PKW-Beispiel
Es ergibt sich also als angenähertes arithmetisches Mittel
Klasse |
Intervall |
Absolute |
Klassenmitte |
|
---|---|---|---|---|
j |
nj |
xj' |
xj' nj | |
1 |
0 - bis 200 |
5 |
100 |
500 |
2 |
200 bis 300 |
6 |
250 |
1500 |
3 |
300 bis 400 |
6 |
350 |
2100 |
4 |
400 bis 500 |
9 |
450 |
4050 |
5 |
500 bis 700 |
6 |
600 |
3600 |
Σ |
32 |
11750 |
Median
Grafische Ermittlung
Hier bietet sich vor allem die grafische Ermittlung des Medians an:
Man bestimmt aus der absoluten (relativen) Summenkurve grafisch den Wert x, der zu n/2 (0,5) gehört.
Im PKW-Beispiel wurde der Median aus der relativen Summenkurve grafisch ermittelt. Der x-Wert, der zu S*(X)=0,5 gehört, beträgt etwa 382. Es hatten also 50% der untersuchten Länder höchstens ca. 382 Fahrzeuge pro 1000 Einwohner.
Ist n klein, könnte man auch vom Ordinatenwert (n+1)/2 bei geradem n ausgehen.
Ermittlung mit der Häufigkeitstabelle
Man kann den Median auch näherungsweise durch lineare Interpolation aus der Häufigkeitstabelle ermitteln. Allerdings genügt im Allgemeinen auch die Klassenmitte der Einfallsklasse als Näherung für den Median, da ohnehin meistens keine Informationen über die Verteilung der Beobachtungen in den Klassen vorliegen.
Im PKW-Beispiel ergäbe die Näherung durch die Klassenmitte z' = 350.
Lineare Interpolation würde
ergeben.