Mathematik: Wahrscheinlichkeitstheorie: DW: K7: Varianz und Standardabweichung

Aus Wikibooks

Wechseln zu: Navigation, Suche

←  zurück   -  zum Inhaltsverzeichnis   -  weiter  →

K7: Varianz und Standardabweichung

Diskrete Wahrscheinlichkeitsrechnung

Inhaltsverzeichnis

[Bearbeiten] 7.2 Varianz und Standardabweichung

Wir werden uns, neben mit der Lage der Verteilung von X, gekennzeichnet durch die Erwartungswert EX, nur beschäftigen mit die "Streuung" der möglichen Werten von X. Damit wird gemeint in welcher Ausmaß die Werte von einander unterschieden sind, oder gleichwertig in wie weit die Werte abweichen vom Zentrum der Verteilung. Mann kann auch sprechen von der Ausdehnung, oder die Skalierung der Verteilung.

Um die Streuung zu messen, betrachten wir wie die Werte von X abweichen können vom Zentrum EX. Die Abweichungen werden bestimmt durch die Zufallsvariable |X-EX|, d.h. durch die Abstände von X bis EX. Obwohl auch die Erwartungswert dieser Abstände, also E|X-EX|, als Maß für die Streuung im Betracht kommt, ist es üblich die Erwartung der Quadrate dieser Abstände, also das zweite zentrale Moment E(X-EX)2, als Maß zu nehmen. Diese Größe, also die erwartete quadratische Abstand, wird Varianz genannt.

[Bearbeiten] Definition 7.2.1

Das zweite zentrale Moment einer Zufallvariablen X nennen wir die Varianz von X und notieren es als Var(X):

\!\;\mathrm{Var}(X)= E(X - EX)^2.


Weil die Varianz eine quadratische Größe ist, wird, wenn X in cm gemessen ist, die Varianz in cm2 ausgedrückt. Das bildet eine Schwierigkeit bei der praktische Anwendung, die sich noch deutlicher zeigt wenn wir die Varianz von z.B. 10X bestimmen. Dann zeigt sich dass Var(10X) = 100·Var(X), also eine Skalierungsänderung mit einem Faktor 10 bedeutet für das Skalierungsmaß einen Faktor 100. Deshalb wird die Quadratwurzel der Varianz, die wir Standardabweichung nennen, als praktisches Maß für Streuung benutzt.

[Bearbeiten] Definition 7.2.2

Unter die Standardabweichung einer Zufallvariablen X, bezeichnet mit σX (oder σ(X)), verstehen wir die Größe:

\sigma_X = \sqrt{\mathrm{Var}(X)}.

Um Var(X) zu berechnen, ist es oft nützlich die nächste Formel zu benutzen, die direkt aus der Definition von Var(X) hergeleitet werden kann.

[Bearbeiten] Satz 7.2.1 (Verschiebungssatz)

Fur die Varianz einer Zufallvariablen X gilt:

\!\;\mathrm{Var}(X) = E(X^2) - (EX)^2.

Übrigens ist Vorsicht geboten bei Berechnungen mit dieser Formel. Außer durch Rechenfehler, entsteht auch durch vorzeitiges oder zu grobes Abrunden der Zwischenergebnisse leicht einen ungenauen Wert für die Varianz, oft sogar einen negativen Wert.

Wir zeigen an Hand eines Beispiels einige Berechnungen.

[Bearbeiten] Beispiel 1 (zweimal Würfeln (Fortsetzung))

In der nächsten Tabelle steht die Verteilung von M und es sind darin die benötigte Berechnungen ausgeführt worden um Var(M) zu bestimmen.

  m     P(M=m)  mP(M=m)    m–EM     (m–EM)2    (m–EM)2P(M=m) m2P(M=m)
──────┼───────┼────────┼─────────┼────────────┼─────────────┼────────
  1      1/36     1/36   –125/36   15625/1296   15625/46656     1/36
  
  2      3/36     6/36   – 89/36    7921/1296   23763/46656    12/36
     
  3      5/36    15/36   – 53/36    2809/1296   14045/46656    45/36
     
  4      7/36    28/36   – 17/36     289/1296    2023/46656   112/36
     
  5      9/36    45/36     19/36     361/1296    3249/46656   225/36
     
  6     11/36    66/36     55/36    3025/1296   33275/46656   396/36
──────┼───────┼────────┼─────────┼────────────┼─────────────┼────────      
Total   36/36   161/36                          91980/46656   791/36

Es zeigt sich dass: EM = 161/36 und


\mathrm{Var}(M) = E(M - EM)^2 = \sum_{m=1}^6 (m - \tfrac{161}{36})^2\cdot P(M=m) = \tfrac{91980}{46656} \approx 1{,}97.
.

Mit dem Verschiebungssatz bekommen wir gleichfalls:


\mathrm{ Var}(M) = EM^2 - (EM)^2 = \sum_{m=1}^6 m^2P(M=m) - (EM)^2 = \tfrac{791}{36} - (\tfrac{161}{36})^2 = \tfrac{91980}{46656}
.

Die Standardabweichung ist:


\sigma_M = \sqrt{\mathrm{Var}(M)} = \sqrt{\tfrac{91980}{46656}} = 1{,}40. 
.

Wir berechnen auch Var(Z):

    z       2      3      4      5      6      7      8      9     10     11     12      Total
─────────┼────────────────────────────────────────────────────────────────────────────┼───────────
  P(Z=z)   1/36   2/36   3/36   4/36   5/36   6/36   5/36   4/36   3/36   2/36   1/36     36/36
 zP(Z=z)   2/36   6/36  12/36  20/36  30/36  42/36  40/36  36/36  30/36  22/36  12/36    252/36
z2P(Z=z)   4/36  18/36  48/36 100/36 180/36 294/36 320/36 324/36 300/36 242/36 144/36   1974/36
 

Also ist


\mathrm{Var}(Z) = EZ^2 - (EZ)^2 = \tfrac{1974}{36} - 49 = \tfrac{210}{36} = 5 \tfrac 56

und


\sigma_Z = \sqrt{\mathrm{Var}(Z)} = \sqrt{\tfrac{210}{36}} = 2{,}42. 
.

Merke auf dass die Streuung in Z größer ist als in M.

Die nächsten Eigenschaften der Varianz sind von Bedeutung.

[Bearbeiten] Satz 7.2.2 (Eigenschaften von Varianz und Standardabweichung)

Für die Varianz einer Zufallsvariable X gilt:

(a) Var(X) ≥ 0 und σ(X) ≥ 0
(b) wenn Var(X) = 0, dann ist X entartet (d.h. P(X=EX) = 1)
(c) Var(aX + b) = a2Var(X) und σ(aX+b) = |a| σ(X) für jede a und b.
Beweis

(c) var(aX+b) = E(aX+b – E(aX+b))2 = E(aX + b – aEX – b)2 = a2E(X–EX)2 = a2var(X).

[Bearbeiten] Beispiel 2 (zweimal Würfeln (Fortsetzung))

Wir haben berechnet:


\mathrm{Var}(Z) = EZ^2 - (EZ)^2 = 5 \tfrac 56

und


\sigma_Z = \sqrt{\frac{210}{36}} = 2{,}42.
.

Nun ist Z = X + Y, und die Ergebnisse X und Y der einzelnen Würfen sind identisch Verteilt. Wir wissen schon dass die Verteilung von X + Y eine andere ist als die Verteilung von X + X = 2X. Das zeigt sich auch wenn wir die Varianz von 2X berechnen:


\mathrm{Var}(2X) = 2^2\mathrm{Var}(X) = 4\sum_{x=1}^6 (x-\tfrac 72 )^2\tfrac 16  = 4\times \tfrac{105}{36}  = 11 \tfrac 23 \ne \mathrm{Var}(Z).
.
Persönliche Werkzeuge