Statistik: Funktionen von Zufallsvariablen
Funktion einer Zufallsvariablen
Lineare Transformation einer Zufallsvariablen
Der Student Bert hat eine kleine schicke Appartementwohnung, die er hin und wieder säubern muss. Die Intervalle der Reinigungsaktionen sind unterschiedlich und lassen sich folgendermaßen beschreiben: Die Zeit in Wochen, die nach der letzten Säuberungsaktion verstrichen ist, wird als Zufallsvariable X bezeichnet. Die Intervalle verteilen sich folgendermaßen:
Zahl der Wochen bis zur nächsten Putzaktion xi | 0 | 1 | 2 | 3 | 4 | 5 |
Wahrscheinlichkeit f(xi) | 0,1 | 0,2 | 0,2 | 0,3 | 0,1 | 0,1 |
X hat den Erwartungswert EX =2,4 und die Varianz 2,04. Rechnen Sie das zur Übung selber nach.
Wenn Bert putzen muss, hängt der Aufwand in Stunden von der Zahl der Wochen ab, die er seine Wohnung vernachlässigt hat. Er braucht jedesmal ca. 1 Stunde für das Bad und einmal Durchsaugen. Für die restlichen Arbeiten muss er pro verstrichener Woche noch eine halbe Stunde Arbeitszeit hinzugeben. Morgen kommen seine Eltern zu Besuch. Mit welcher Wahrscheinlichkeit muss Bert heute 2 Stunden putzen? Wie lange putzt er durchschnittlich jedes Mal?
Hier überlegen wir uns zunächst mal, dass die Putzzeit von der vorherigen „Karenzzeit“ X abhängt. Sie ist also auch eine Zufallsvariable. Man könnte sie so darstellen:
Wie ist nun Y verteilt? Y hängt direkt von X ab und wir erhalten die Wahrscheinlichkeitstabelle
Zahl der Wochen bis zur nächsten Putzaktion xi | 0 | 1 | 2 | 3 | 4 | 5 |
Aufgewendete Putzzeit yi | 1 | 1,5 | 2 | 2,5 | 3 | 3,5 |
Wahrscheinlichkeit f(yi) | 0,1 | 0,2 | 0,2 | 0,3 | 0,1 | 0,1 |
Man kann sofort sehen, dass Bert mit einer Wahrscheinlichkeit von 20% 2 Stunden putzen wird.
Wir wollen nun Erwartungswert und Varianz von Y ermitteln. Der Erwartungswert berechnet sich wie gewohnt als
- .
Das bedeutet er putzt durchschnittlich 2,2 Stunden.
Die Varianz ergibt sich analog als
Schön wäre es allerdings, wenn man die Parameter der Verteilung etwas einfacher ausrechnen könnte. Y hat die schöne Eigenschaft, dass es eine lineare Transformation von X ist der Art
- .
Bei linearen Transformationen wie oben gilt
und
- .
Rechnen wir nach:
und
- .
Standardisierung
Eine spezielle lineare Transformation ist die Standardisierung einer Zufallsvariablen X durch
- .
Man kann nämlich Z so umformen:
mit und , denn Erwartungswert und Varianz von X sind Konstanten.
Es ist dann EZ = 0 und varZ = 1.
Nichtlineare Funktion einer Zufallsvariablen
Lakonisch könnte man sagen: Eine nichtlineare Funktion ist eine Funktion, die nicht linear ist. Man kann sie also nicht in der Form Y = a + bx schreiben. Beispiele sind etwa
Hier kann man die Parameter im Allgemeinen nur über die Verteilung der Zufallsvariablen bestimmen.
Beispiel
Es hat sich herausgestellt, dass der Aufwand an Putzmitteln (ml pro qm) in Abhängigkeit von der verstrichenen Zeit quadratisch steigt mit der Funktion
Zahl der Wochen bis zur nächsten Putzaktion xi | 0 | 1 | 2 | 3 | 4 | 5 |
Aufgewendete Putzmittel yi | 2 | 3 | 6 | 11 | 18 | 27 |
Wahrscheinlichkeit f(yi) | 0,1 | 0,2 | 0,2 | 0,3 | 0,1 | 0,1 |
Hier kann man Erwartungswert und Varianz von Y nur mit den bekannten Formeln ermitteln, etwa
- .
Lineare Funktionen mehrerer Zufallsvariablen
Zwei Variablen
Gegeben sind zwei Zufallsvariablen X1 und X2 mit den Verteilungsparametern EX1, varX1 und EX2, varX2. Außerdem sind die beiden Zufallsvariablen korreliert mit der Kovarianz covX1X2. Es wird eine Zufallsvariable
gebildet. Analog zu oben errechnet sich der Erwartungswert von Y durch
- .
Die Varianz von Y setzt sich aus den Einzelvarianzen der Zufallsvariablen zusammen. Hinzu kommt noch die Kovarianz:
- .
Wenn die zwei Zufallsvariablen X1 und X2 stochastisch unabhängig sind, ist ihre Kovarianz Null. Dann reduziert sich die Formel für die Varianz auf
- .
Beispiel
Die Versorgung mit Getränken in einem Fußballstadion mittlerer Größe wird bei Spielen von einem Gastronomieunternehmen betrieben. Man weiß aus Erfahrung, dass die Zahl der verkauften Bierbecher von der Zahl der vorbestellten Eintrittskarten abhängt, und zwar in unterschiedlicher Weise von einheimischen und auswärtigen Besuchern. Es sei X1: Zahl der bestellten Karten von Einheimischen und X2: Zahl der bestellten Karten von Auswärtigen.
Es hat sich herausgestellt, dass und sind.
Zudem sind X1 und X2 korreliert, denn je interessanter ein Spiel, desto mehr Einheimische und Auswärtige schauen das Spiel an. Es ist covX1X2 = 400.
Die Zahl der verkauften Getränke lässt sich angeben als
- .
Es ist hier
und
Mehr als zwei Variablen
Gegeben sind n Zufallsvariablen Xi (i = 1, ..., n) mit den Erwartungswerten EXi, den Varianzen varXi und den paarweisen Kovarianzen covX1X2, covX1X3, ..., covXn-1Xn . covXiXj (i < j; i = 1, ..., n-1; j = i+1, ..., n). Es sei
- .
Dann erhalten wir für den Erwartungswert
- .
Die Varianz von Y können wir als Summe der Varianzen und paarweisen Kovarianzen ermitteln als
- .
und, falls die Zufallsvariablen Xi stochastisch unabhängig sind, als Varianz
- .