Zum Inhalt springen

Statistik: Summenfunktion eines Merkmals mit wenig verschiedenen Ausprägungen

Aus Wikibooks

Summenfunktion

Man interessiert sich für Fragen wie „Wieviel % der Kunden gaben höchstens 5 Euro für eine Flasche Wein aus?“ oder „Wieviel Einwohner Deutschlands sind mindestens 65 Jahre alt?“. Man könnte nun die einzelnen Häufigkeiten einer Häufigkeitstabelle aufsummieren und so den Wert ermitteln, aber einfacher ist es, schon in der Häufigkeitstabelle die Häufigkeiten (abs. oder rel.) laufend aufzuaddieren. Es ergeben sich die Summenhäufigkeiten als kumulierte Häufigkeiten Sj (absolut) bzw. Sj* (relativ) . Aus den Summenhäufigkeiten läßt sich dann einfach die Summenfunktion bestimmen.

Summenhäufigkeiten sind nur sinnvoll, wenn man das Merkmal nach Größe ordnen kann, also nur bei ordinal oder metrisch skalierten Merkmalen. Aus der Summenhäufigkeit kann man die Summenfunktion ermitteln.

Beispiel der verkauften Weinflaschen

j Preis für eine Weinflasche
xj
absolute Häufigkeit
nj
relative Häufigkeit
pj
absolute Summenhäufigkeit
Sj
relative Summenhäufigkeit
S*j
1 4 5 5/25=0,2 5 0,20
2 5 8 0,32 13 0,52
3 7 7 0,28 20 0,80
4 10 5 0,2 25 1,00
Σ   25 1    
Summenfunktion

Für die Erstellung der Summenfunktion müssen die Beobachtungen der Urliste geordnet vorliegen. Die Häufigkeitsverteilung enthält alle Werte der Urliste geordnet. Analog zu oben kann man sich beispielsweise überlegen:

20 Kunden zahlten höchstens 7 Euro für eine Flasche, also S(7) = 20.

So können wir wieder wie vorher die Summenfunktion von links her aufbauen:

0 Kunden zahlten höchstens 2 Euro für eine Flasche, also S(2) = 0

usw.

Nun können wir die kumulierten Häufigkeiten auch aus der Grafik ablesen: z.B. S(6) = 13, es sind also 13 Flaschen zu einem Preis von höchstens 6 Euro verkauft worden.