Statistik: Normalverteilung
Was ist die Normalverteilung?
Beispiel:
Auf einer Hühnerfarm mit sehr vielen Hühnern werden eine Woche lang die einzelnen Eier gewogen. Definieren wir die Zufallsvariable X: Gewicht eines Eies in Gramm. Es stellt sich heraus, dass ein Ei im Durchschnitt 50 g wiegt. Der Erwartungswert ist daher 50. Außerdem sei bekannt, dass die Varianz varX = 25 g2 beträgt. Man kann die Verteilung des Gewichts annähernd wie in der Grafik darstellen. Man sieht, dass sich die meisten Eier in der Nähe des Erwartungswerts 50 befinden und dass die Wahrscheinlichkeit, sehr kleine oder sehr große Eier zu erhalten, sehr klein wird. Wir haben hier eine Normalverteilung vor uns. Sie ist typisch für Zufallsvariablen, die sich aus sehr vielen verschiedenen Einflüssen zusammensetzen, die man nicht mehr trennen kann, z.B. Gewicht des Huhns, Alter, Gesundheit, Standort, Vererbung usw.
Die Dichtefunktion der Normalverteilung ist definiert als
wobei und ist. Man sagt, X ist normalverteilt mit den Parametern μ und σ2, in Symbolschreibweise
- oder kürzer
In unserem Beispiel ist
Die Normalverteilung ist symmetrisch bezüglich μ. Die Verteilung P(X ≤ a) von X ist wieder die Fläche unter dem Graphen der Dichtefunktion. Sie wird bezeichnet als
Beispielsweise beträgt die Wahrscheinlichkeit, dass ein Ei höchstens 55 g wiegt, 0,8413. Das entspricht der roten Fläche in der Abbildung.
Das Integral der Dichtefunktion kann nicht analytisch berechnet werden. Die Werte der Verteilungsfunktion liegen i. a. tabellarisch vor. Es besteht nun das Problem, dass für jeden Wert von μ und σ2 eine eigene Tabelle vorliegen müsste. Hier ist hilfreich, daß die aus X standardisierte Zufallsvariable Z wiederum normalverteilt ist und zwar mit den Parametern 0 und 1. Es kann jede beliebige Normalverteilung standardisiert werden. Mit Hilfe der standardisierten Zufallsvariablen wird dann die gesuchte Wahrscheinlichkeit bestimmt.
Standardnormalverteilung
Man definiert also eine neue Zufallsvariable
Diese Zufallsvariable Z ist normalverteilt mit EZ = 0 und varZ = 1. Ihre Dichtefunktion ist in der folgenden Grafik dargestellt. Es ist also
Die Dichtefunktion von Z ist
Ihre Verteilung, die man auch kurz als Φ(z) bezeichnet, ist (z const.)
Verteilungswerte
Es ist beispielsweise die Wahrscheinlichkeit
und
Wir wollen nun den Anteil der Eier mit höchstens 55 g bestimmen, also P(X ≤ 55). Wir standardisieren:
Es ist dann
Der Wert 0,8413 der Verteilungsfunktion wird in der Normalverteilungstabelle ermittelt. Der folgende Ausschnitt aus der Tabelle soll die Vorgehensweise verdeutlichen: In der ersten Spalte der Tabelle sind die zwei ersten signifikanten Stellen der Ausprägung z angegeben, in der ersten Tabellenzeile die zweite Nachkommastelle, so dass sich beispielsweise z = 1,00 zusammensetzt aus 1,0 + 0,00. Wo sich Zeile und Spalte des betreffenden Z-Wertes kreuzen, steht die gesuchte Wahrscheinlichkeit.
z |
0,00 |
0,01 |
0,02 |
---|---|---|---|
0,0 |
5000 |
5040 |
5080 |
0,1 |
5398 |
5438 |
5478 |
0,2 |
5793 |
5832 |
5871 |
0,3 |
6179 |
6217 |
6255 |
0,4 |
6554 |
6591 |
6628 |
0,5 |
6915 |
6950 |
6985 |
0,6 |
7257 |
7291 |
7324 |
0,7 |
7580 |
7611 |
7642 |
0,8 |
7881 |
7910 |
7939 |
0,9 |
8159 |
8186 |
8212 |
1,0 |
8413 |
8438 |
8461 |
1,1 |
8643 |
8665 |
8686 |
1,2 |
8849 |
8869 |
8888 |
Der errechnete Wert z kann gerundet werden, falls die errechneten Stellen die Zahl der Stellen des tabellierten z-Wertes übertreffen. Da die Verteilung von Z symmetrisch bezüglich μ = 0 ist, genügt die Tabellierung der Verteilungswerte ab z = 0 bzw. Φ(z) = 0,5. Es gilt, wie man auch anhand der Grafik leicht sieht:
bzw.
- .
Beispiel:
Quantil
Häufig sucht man zu einer gegebenen Wahrscheinlichkeit p den dazugehörigen z-Wert z(p). Er wird als p-Quantil bezeichnet.
Es gilt also:
- .
Beispielsweise ist z(0,975) = 1,96. Es ist also hier die Wahrscheinlichkeit 0,975 gegeben und der dazugehörige z-Wert wird gesucht. Man sucht in der Tabelle die Wahrscheinlichkeit 0,9750 und bestimmt dann am Rand den betreffenden z-Wert 1,96.
Liegt p zwischen zwei Tabellenwerten, genügt es, als p den Tabellenwert zu verwenden, der p am nächsten liegt.
Beispiel:
Gesucht: z(0,9)
näher bei | 0,9 | ||
Wahrscheinlichkeit Φ | 0,8997 | 0,9015 | |
z-Wert oder Quantil | 1,28 | 1,29 |
Es ist also z(0,9) ≈ 1,28.
Für eine Normalverteilung mit μ und σ2 berechnet sich das p-Quantil als
Beispiel:
Wie schwer sind höchstens die 2/3 leichtesten Eier? Gesucht ist also x(0,67):
Das schwerste der 67% leichtesten Eier wog also 52,2g .
Übung zur Berechnung von ΦZ(z)
Schraffieren Sie die gesuchte Wahrscheinlichkeit in der Grafik und berechnen Sie die gesuchten Werte:
P(Z ≤ 0,51) | P(Z ≤ 2,0) = | P(Z ≤ - 0,51) |
P(1,5 ≤ Z ≤ 2,35) | P(- 0,8 ≤ Z ≤ 1,05) | P(Z ≥ -0,89) |
P( Z ≤ -1,68 ∪ Z ≥ 2 ) | P(Z ≤ -1,96 ∪ Z ≥ 1,96) | P(Z ≤ -5) |
z(0,975) | z(0,8) | z(0,2) |
Übungen zum Eier-Beispiel
- Wie groß ist die Wahrscheinlichkeit, daß ein Ei höchstens 60 g wiegt?
- Wieviel Prozent der Eier wiegen höchstens 50 g?
- Wie groß ist die Wahrscheinlichkeit, daß ein Ei mindestens 45 g wiegt?
- Wieviel Prozent der Eier liegen zwischen 45 und 55 Gramm?
- Mit welcher Wahrscheinlichkeit wiegt ein Ei genau 53 Gramm?
- Welches Mindestgewicht haben die 30% schwersten Eier?
Lösungen:
Übung zur Berechnung von Φz(z)
a) 0,6950 b) 0,9772 c) 0,3050 d) 0,0574 e) 0,6412 f) 0,8133 g) 0,0693 h) 0,05 i) 0 j) 1,96 k) 0,84 l) -0,84