Statistik: Lageparameter eines metrischen Merkmals mit vielen verschiedenen Ausprägungen

Aus Wikibooks

Arithmetisches Mittel

Ist die Urliste gegeben, berechnet sich das arithmetische Mittel aus der bekannten Durchschnittsbildung der Beobachtungswerte. Sind jedoch die Informationen der Urliste nicht mehr verfügbar, kann man das arithmetische Mittel nur noch näherungsweise bestimmen. Man verwendet die Klassenmitte xj' als Ersatz für die Merkmalsausprägung xj in der Klasse j und nähert das arithmetische Mittel an als

Die Klassenmitte soll das Niveau einer Klasse widerspiegeln. Das ist vor allem der Fall, wenn sich die Einzelwerte der Urliste gleichmäßig in einer Klasse verteilen. Sind die Einzelwerte mehrheitlich an einer Klassengrenze gelegen, gibt xj' unter Umständen nicht mehr das Niveau korrekt wieder. Die optimale Aufteilung der Klassen sollte schon bei Klassenbildung berücksichtigt werden. Im Sinne einer einfachen Handhabung sollte xj' eine Zahl sein, mit der man leicht rechnen kann, also z.B. 200 und nicht 199,5.


PKW-Beispiel

Es ergibt sich also als angenähertes arithmetisches Mittel

Klasse

Intervall

Absolute
Häufigkeit

Klassenmitte

j

nj

xj'

xj' nj

1

0 - bis 200

5

100

500

2

200 bis 300

6

250

1500

3

300 bis 400

6

350

2100

4

400 bis 500

9

450

4050

5

500 bis 700

6

600

3600

Σ

32

11750

Median

Grafische Ermittlung des Medians

Grafische Ermittlung

Hier bietet sich vor allem die grafische Ermittlung des Medians an:

Man bestimmt aus der absoluten (relativen) Summenkurve grafisch den Wert x, der zu n/2 (0,5) gehört.

Im PKW-Beispiel wurde der Median aus der relativen Summenkurve grafisch ermittelt. Der x-Wert, der zu S*(X)=0,5 gehört, beträgt etwa 382. Es hatten also 50% der untersuchten Länder höchstens ca. 382 Fahrzeuge pro 1000 Einwohner.

Ist n klein, könnte man auch vom Ordinatenwert (n+1)/2 bei geradem n ausgehen.


Ermittlung mit der Häufigkeitstabelle

Man kann den Median auch näherungsweise durch lineare Interpolation aus der Häufigkeitstabelle ermitteln. Allerdings genügt im Allgemeinen auch die Klassenmitte der Einfallsklasse als Näherung für den Median, da ohnehin meistens keine Informationen über die Verteilung der Beobachtungen in den Klassen vorliegen.

Im PKW-Beispiel ergäbe die Näherung durch die Klassenmitte z' = 350.

Lineare Interpolation würde

ergeben.