Statistik: Häufigkeitsverteilung von Merkmalen mit wenig verschiedenen Ausprägungen

Aus Wikibooks

Häufigkeitstabelle

Um eine Urliste von Beobachtungen eines Merkmals mit wenig Ausprägungen aufzubereiten, wird als erster Schritt der Analyse das Zählen des Auftretens der Realisationen stehen. Die Ergebnisse können in einer Häufigkeitstabelle zusammengefasst werden. Anhand der Daten eines nominalskalierten Beispiels wollen wir uns das Prinzip einer Häufigkeitstabelle ansehen.


Nominalskaliertes Merkmal

Beispiel

Es wurden 50 Personen telefonisch bezüglich gewisser Konsumpräferenzen befragt. Unter anderem erhob man den Familienstand. Es ist das Merkmal

x: Familienstand - mit den Ausprägungen 1=ledig, 2=verheiratet, 3=geschieden, 4=verwitwet.

Es ergab sich die Urliste

2 2 1 2 3 3 1 2 3 2 3 4 4 1 2 1 1 2 3 2 1 2 2 1 2 
2 2 1 4 2 2 4 3 1 2 2 1 3 2 3 1 2 2 3 2 2 2 1 3 3

Wir wollen nun die Daten in einer Häufigkeitstabelle zusammenstellen:

j Familienstand absolute Häufigkeit relative Häufigkeit
1 ledig 12 0,24
2 verheiratet 23 0,46
3 geschieden 11 0,22
4 verwitwet 4 0,08
Σ   50 1,00


Es sind insgesamt n = 50 Untersuchungseinheiten erhoben worden. Die (absoluten) Häufigkeiten nj (j = 1, ... , 4) verteilen sich auf m = 4 Kategorien (kategoriale Variable), wie in der Häufigkeitstabelle aufgelistet.

Wenn man sich für den Anteil der einzelnen Ausprägungen an der Gesamtheit interessiert, kann man auch die relativen Häufigkeiten bestimmen:

Es ist natürlich

bzw.


Für die Verteilung von Merkmalen mit wenig Ausprägungen kann man sehr ansprechende Grafiken erstellen.

Ordinalskaliertes Merkmal

Beispiel:

Bei der letzten Wiki-Matheklausur der Wikiversity ergaben sich die Noten wie folgt:

12 x 1, 15 x 2, 8 x 3, 3 x 4, 2 x 5

Hier erhält man die unten folgende Häufigkeitstabelle:

j Note
xj
absolute Häufigkeit
nj
relative Häufigkeit
pj
1 sehr gut 12 12/40=0,3
2 gut 15 0,375
3 befriedigend 8 0,2
4 ausreichend 3 0,075
5 ungenügend 2 0,05
Σ   40 1

Auch hier bieten sich zur Veranschaulichung der Häufigkeiten Grafiken wie oben an.

Metrisch skaliertes Merkmal

Beispiel

Eine mainfränkische Weinbaustadt feiert ihr alljährliches Weinfest, bei dem auch die Winzerei Wavoma ihre Produkte anbietet. Sie verkauft Wein in Flaschen mit 0,5, 0,7, 1 und 2 Litern zu je 4, 5, 7 und 10 Euro. Es wurden am Sonntag Vormittag eingenommen (Merkmal x: Preis einer Flasche Wein (Euro)):

4 4 4 7 7 7 7 10 5 5 5 10 4 4 7 7 5 5 5 5 5 10 10 10 7

Wir erhalten die unten folgende Häufigkeitstabelle.

j Preis für eine Weinflasche
xj
absolute Häufigkeit
nj
relative Häufigkeit
pj
1 4 5 5/25=0,2
2 5 8 0,32
3 7 7 0,28
4 10 5 0,2
Σ   25 1


Grafische Darstellungen

Eine weitere Art, Verteilungen eines Merkmals übersichtlich darzustellen, ist die grafische Darstellung. Mit hoher Aussagekraft der Grafik geht meist ein Informationsverlust einher, so daß die Grafik die Tabelle nicht ersetzen, sondern nur unterstützen kann.

Da Grafiken auf einen Blick informieren sollen, sollen sie nicht überladen sein. Häufig verwendet werden heute Piktogramme, d.h. Diagramme, die den Sachverhalt optisch anschaulich verdeutlichen.

Für beliebig skalierte Merkmale mit wenigen Ausprägungen bieten sich eine Vielzahl grafischer Darstellungen an, darunter insbesondere Stabdiagramm, Säulendiagramm, Kreisdiagramm. Diese Diagramme eignen sich nicht für Urlisten mit vielen verschiedenen Beobachtungswerten.

Übung: Warum nicht?


Stabdiagramm bzw. Säulendiagramm

Auf der „x-Achse“ werden die verschiedenen Ausprägungen des Merkmals markiert. Dann werden die entsprechenden Häufigkeiten als Stab oder Säule senkrecht auf der Abszisse abgetragen.

Es sind hier anhand des obigen Beispiels bezüglich des Familienstandes die Säulendiagramme für die absoluten und relativen Häufigkeiten dargestellt. Wir sehen, dass die Struktur der Diagramme identisch ist.

Absolute Häufigkeiten des Familienstandes
Relative Häufigkeiten des Familienstandes

Kreisdiagramm

Kreisdiagramm: Relative Häufigkeiten des Familienstandes

Im Kreisdiagramm wird n als Gesamtfläche festgelegt. Die Häufigkeiten für die einzelnen Kategorien des Merkmals werden als „Tortenstücke“ eingetragen, wobei deren Fläche proportional zur Häufigkeit ist. Der zur Häufigkeit nj gehörende Winkel αj eines Segments berechnet sich dann aus der Verhältnisgleichung

Sollen zwei verschiedene Gesamtheiten mit verschiedenen Gesamthäufigkeiten nI und nII mittels zweier Kreisdiagramme verglichen werden, kann man die Flächen der Kreise proportional zu den nI und nII darstellen.

Für die Darstellung von Kreisdiagrammen gibt es heutzutage genügend Anwendersoftware, so dass eine genauere Erläuterung unterbleiben kann.