Mathematik: Statistik: Streuungsparameter eines metrischen Merkmals mit vielen verschiedenen Ausprägungen

Aus Wikibooks

Wechseln zu: Navigation, Suche

Einleitung

Liegen bei einem klassierten Merkmal keine Informationen über die Urliste mehr vor, können wir die Varianz des Merkmals analog zum arithmetischen Mittel mit den Klassenmitten näherungsweise berechnen. Wir erhalten für die Näherung s2'

 s^2 \approx {s^2}' = \frac {1}{n-1} \sum_{j=1}^m (x'_j - \bar x')^2 \cdot n_j \; ,

deren Exaktheit auch wieder von der Verteilung der einzelnen Werte in den Klassen abhängt. Verwenden wir statt der absoluten Häufigkeiten nj die relativen pj, berechnet sich die Varianz als

s^2 \approx {s^2}' = \frac {n}{n-1} \sum_{j=1}^m (x'_j -\bar x')^2 \cdot p_j \; .

Man kann auch im Fall der näherungsweisen Berechnung den Verschiebungssatz anwenden. Wir wollen ihn hier nur für absolute Häufigkeiten angeben. Für die Quadratsumme der zentrierten Klassenmittel gilt

 \sum_{j=1}^m (x_j' - \bar x')^2 \cdot n_j =  \sum_{j=1}^m x_j'^2  \cdot n_j - n \cdot \bar x'^2 ,

so dass sich für die angenäherte Varianz ergibt

 s^2  \approx {s^2}' = \frac {1} {n-1} ( \sum_{j=1}^m x_j'^2  \cdot n_j - n \cdot \bar x'^2
 \; .)


PKW-Beispiel

Wie bei der Ermittlung des arithmetischen Mittels verwenden wir auch hier zweckmäßigerweise eine Tabelle. Es war das angenäherte arithmetische Mittel 367, 1875. Es wird zunächst die Varianz mit Hilfe der zentrierten Werte ermittelt:

Klasse

Intervall

Absolute
Häufigkeit

Klassenmitte

 

 

 

j

über ...
bis ...

nj

xj

xj' - xj

(xj' - xj)2

(xj' - xj)2 nj

1

0 - 200

5

100

-267,19

71390,50

356952,48

2

200 - 300

6

250

-117,19

13733,50

82400,98

3

300 - 400

6

350

-17,19

295,50

1772,98

4

400 - 500

9

450

82,81

6857,50

61717,46

5

500 - 700

6

600

232,81

54200,50

325202,98

Σ

--

32

--

--

--

828046,88

Wir erhalten für die Varianz

s^2 = \frac{1}{32-1} \cdot 828046,88 = 26711,19

und für die Standardabweichung

s = \sqrt{26711,19} = 163,44

Mit dem Verschiebungssatz dagegen erhalten wir


Klasse

Intervall

Absolute
Häufigkeit

Klassenmitte

 

 

j

über ...
bis ...

nj

xj'

xj'2

xj'2 nj

1

0 - 200

5

100

10000

50000

2

200 - 300

6

250

62500

375000

3

300 - 400

6

350

122500

735000

4

400 - 500

9

450

202500

1822500

5

500 - 700

6

600

360000

2160000

Σ

 

32

 

 

5142500

Wir erhalten für die Varianz

s^2 = \frac{1}{32-1} (5142500 - 32 \cdot 367,19^2) = 26711,19


↑Lageparameter
↑↑Inhaltsverzeichnis Statistik
Persönliche Werkzeuge