Statistik: Lageparameter eines Merkmals mit wenigen verschiedenen Beobachtungen
Lageparameter
Der Lageparameter gibt an, auf welchem Niveau die Daten liegen.
Arithmetisches Mittel
Das arithmetische Mittel ist landläufig als „Durchschnitt“ bekannt. Es ist eigentlich nur für metrisch skalierte Merkmale (Problem Notendurchschnitt) geeignet. Es berechnet sich als
Beispiel Pfundschalen Erdbeeren:
- .
Es waren die Schälchen also im Durchschnitt untergewichtig.
Median oder Zentralwert
Sind die Beobachtungswerte der Größe nach geordnet, also x[1] , x[2] , x[3] , ... , x[n], ist der Median z die Stelle, die die Teilgesamtheit in zwei gleiche Hälften teilt. Er kann für rang- und metrisch skalierte Merkmale verwendet werden.
n ungerade
Beispiel für n = 7
Es wurden 7 Autofahrer nach ihren Fahrtkosten befragt. Es ergab sich für das Merkmal x: Monatliche Ausgaben für Benzin (in Euro) die Liste
x[1] | x[2] | x[3] | x[4] | x[5] | x[6] | x[7] |
20 | 50 | 100 | 170 | 200 | 200 | 280 |
Es ist also der Median z = 170.
n gerade
Beispiel für n = 10 (Erdbeeren)
x[1] | x[2] | x[3] | x[4] | x[5] | x[6] | x[7] | x[8] | x[9] | x[10] | |
400 | 450 | 480 | 480 | 480 | z | 490 | 500 | 505 | 510 | 510 |
Der Median liegt zwischen dem 5. und 6. Beobachtungswert. Man nimmt hier den mittleren Wert
Wir berechnen also den Median so:
n ungerade: z ist der te Wert x[i], also
n gerade: z liegt zwischen dem ten und dem ten Beobachtungswert x[i], also
Bemerkungen:
- Der Median kann für ordinal- und metrisch skalierte Werte verwendet werden.
- Bei sehr großem und geradem n kann man vereinfachend
- setzen.
Vergleich Median - arithmetisches Mittel
Beispiel:
Eine Autozeitschrift hat n = 7 PKWs einer bestimmten Marke getestet. Unter anderem wurde auch untersucht, ob das Auto zuverlässig anspringt.
Es ergab sich die geordnete Urliste
- 1 1 1 1 1 2 14
Wir erhalten als durchschnittliche Zahl der Startversuche
- .
Wir würden hier also als Ergebnis erhalten: „Ein PKW sprang im Durchschnitt erst nach 3 Versuchen an“. Irgendwie erscheint einem das nicht gerechtfertigt. Bis auf einen PKW, der offensichtlich einen Ausreißer darstellt, sprangen ja alle Fahrzeuge zuverlässig an.
Wir verwenden nun den Median als Lageparameter: Der Median ist der 4. Wert, also z = 1. Hier ist also der Median eher zutreffend, doch so ganz zufrieden sind wir auch nicht, denn immerhin gab es ja auch 2 und 14 Versuche.
Wir sehen also, dass bei Verwendung des Median sehr viel Information der Daten verloren geht, andererseits reagiert aber das arithmetische Mittel empfindlich auf Ausreißer in den Daten.
Es gibt aber auch Kompromisse zwischen diesen beiden Extremen, beispielsweise das getrimmte Mittel:
- .
Es werden in der geordneten Urliste links und rechts jeweils ein oder mehrere Werte gestrichen. Aus den restlichen Beobachtungen berechnet man dann ein arithmetisches Mittel. Dieser Mittelwert erscheint eher die Sachlage zutreffend zu beschreiben. Man nennt Parameter, die nur schwach auf Ausreißer reagieren, resistente Parameter. Neben dem getrimmten Mittel gibt es noch mehrere andere Ansätze.
Der Vergleich des Medians mit dem arithmetischen Mittel kann als Ausreißeranalyse verwendet werden. Weicht der Median auffällig vom arithmetischen Mittel ab, sollten die Daten auf Ausreißer oder stark schiefe Verteilungen hin überprüft werden.
Weitere Lageparameter sind etwa der Modalwert, geometrisches Mittel oder harmonisches Mittel.