K7: Varianz und Standardabweichung
Diskrete Wahrscheinlichkeitsrechnung
Wir beschäftigen uns hier mit der mittleren Lage der Verteilung von , gekennzeichnet durch den Erwartungswert und der »Streuung« der Zufallswerte von . Damit ist gemeint, wie groß die allgemeine Abweichung vom Mittelwert ist. Man kann auch von der Ausdehnung oder der Skalierung der Verteilung sprechen.
Um die Streuung zu messen, betrachten wir, wie stark die Werte von von abweichen. Die Abweichungen werden bestimmt durch die Zufallsvariable , d. h. durch die Abstände von bis . Obwohl auch der Erwartungswert dieser Abstände, also , als Maß für die Streuung im Betracht kommt, ist es üblich, die Erwartung der Quadrate dieser Abstände, also das zweite zentrale Moment , als Maß zu nehmen. Diese Größe, also der erwartete quadratische Abstand, wird Varianz genannt.
Das zweite zentrale Moment einer Zufallsvariablen nennen wir die Varianz von und notieren es als :
Weil die Varianz eine quadratische Größe ist, wird, wenn in cm gemessen ist, die Varianz in cm2 ausgedrückt. Das bildet eine Schwierigkeit bei der praktischen Anwendung, die sich noch deutlicher zeigt, wenn wir die Varianz von z. B. bestimmen. Dann zeigt sich, dass , also eine Skalierungsänderung mit einem Faktor 10 bedeutet für das Skalierungsmaß einen Faktor 100. Deshalb wird die Quadratwurzel der Varianz, die wir Standardabweichung nennen, als praktisches Maß für Streuung benutzt.
Unter der Standardabweichung einer Zufallsvariablen , bezeichnet mit (oder ), verstehen wir die Größe:
Um zu berechnen, ist es oft nützlich die nächste Formel zu benutzen, die direkt aus der Definition von hergeleitet werden kann.
Für die Varianz einer Zufallvariablen gilt:
Vorsicht ist geboten bei Berechnungen mit dieser Formel. Außer durch Rechenfehler entsteht auch durch vorzeitiges oder zu grobes Abrunden der Zwischenergebnisse leicht ein ungenauer Wert für die Varianz, oft sogar ein negativer Wert.
Wir zeigen an Hand eines Beispiels einige Berechnungen.
Beispiel 1 (zweimal Würfeln (Fortsetzung))
[Bearbeiten]
Die nächste Tabelle zeigt die Verteilung von und die benötigte Berechnungen, um zu bestimmen.
|
|
|
|
|
|
|
1
|
1/36 |
1/36 |
−125/36 |
15625/1296 |
15625/46656 |
1/36
|
2
|
3/36 |
6/36 |
−89/36 |
7921/1296 |
23763/46656 |
12/36
|
3
|
5/36 |
15/36 |
−53/36 |
2809/1296 |
14045/46656 |
45/36
|
4
|
7/36 |
28/36 |
−17/36 |
289/1296 |
2023/46656 |
112/36
|
5
|
9/36 |
45/36 |
19/36 |
361/1296 |
3249/46656 |
225/36
|
6
|
11/36 |
66/36 |
55/36 |
3025/1296 |
33275/46656 |
396/36
|
Total
|
36/36 |
161/36 |
|
|
91980/46656 |
791/36
|
Es ergibt sich und
Mit dem Verschiebungssatz bekommen wir gleichfalls:
Die Standardabweichung ist:
Wir berechnen auch ):
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
Total
|
|
1/36 |
2/36 |
3/36 |
4/36 |
5/36 |
6/36 |
5/36 |
4/36 |
3/36 |
2/36 |
1/36 |
36/36
|
|
2/36 |
6/36 |
12/36 |
20/36 |
30/36 |
42/36 |
40/36 |
36/36 |
30/36 |
22/36 |
12/36 |
252/36
|
|
4/36 |
18/36 |
48/36 |
100/36 |
180/36 |
294/36 |
320/36 |
324/36 |
300/36 |
242/36 |
144/36 |
1974/36
|
Also ist
und
Man Bemerke, dass die Streuung in größer ist als in .
Die nächsten Eigenschaften der Varianz sind von Bedeutung.
Satz 7.2.2 (Eigenschaften von Varianz und Standardabweichung)
[Bearbeiten]
Für die Varianz einer Zufallsvariable gilt:
- (a) und .
- (b) wenn , dann ist entartet (d. h. )
- (c) und für jedes und .
- Beweis
(c) .
Beispiel 2 (zweimal Würfeln (Fortsetzung))
[Bearbeiten]
Wir haben berechnet:
und
Nun ist , und die Ergebnisse und der einzelnen Würfen sind identisch verteilt. Wir wissen schon, dass die Verteilung von eine andere ist als die Verteilung von . Das zeigt sich auch, wenn wir die Varianz von berechnen: