Zum Inhalt springen

Statistik: Streuungsparameter eines metrischen Merkmals mit vielen verschiedenen Ausprägungen

Aus Wikibooks

Einleitung

Liegen bei einem klassierten Merkmal keine Informationen über die Urliste mehr vor, können wir die Varianz des Merkmals analog zum arithmetischen Mittel mit den Klassenmitten näherungsweise berechnen. Wir erhalten für die Näherung s2'

deren Exaktheit auch wieder von der Verteilung der einzelnen Werte in den Klassen abhängt. Verwenden wir statt der absoluten Häufigkeiten nj die relativen pj, berechnet sich die Varianz als

Man kann auch im Fall der näherungsweisen Berechnung den Verschiebungssatz anwenden. Wir wollen ihn hier nur für absolute Häufigkeiten angeben. Für die Quadratsumme der zentrierten Klassenmittel gilt

so dass sich für die angenäherte Varianz ergibt


PKW-Beispiel

Wie bei der Ermittlung des arithmetischen Mittels verwenden wir auch hier zweckmäßigerweise eine Tabelle. Es war das angenäherte arithmetische Mittel 367, 1875. Es wird zunächst die Varianz mit Hilfe der zentrierten Werte ermittelt. Ausgehend von der Tabelle

Klasse

Intervall

Absolute
Häufigkeit

Klassenmitte

j

über ...
bis ...

nj

x'j

1

0 - 200

5

100

2

200 - 300

6

250

3

300 - 400

6

350

4

400 - 500

9

450

5

500 - 700

6

600

Σ

--

32

--

können wir berechnen

Klasse

 

 

 

j

1

-267,19

71390,50

356952,48

2

-117,19

13733,50

82400,98

3

-17,19

295,50

1772,98

4

82,81

6857,50

61717,46

5

232,81

54200,50

325202,98

Σ

--

--

828046,88


und erhalten für die Varianz

und für die Standardabweichung

Mit dem Verschiebungssatz dagegen erhalten wir mit


Klasse

Intervall

Absolute
Häufigkeit

Klassen-
mitte

 

 

j

über ...
bis ...

nj

xj'

xj'2

xj'2 nj

1

0 - 200

5

100

10000

50000

2

200 - 300

6

250

62500

375000

3

300 - 400

6

350

122500

735000

4

400 - 500

9

450

202500

1822500

5

500 - 700

6

600

360000

2160000

Σ

 

32

 

 

5142500

die Varianz