Mathematik: Wahrscheinlichkeitstheorie: DW: K5: Einführung
← zurück - zum Inhaltsverzeichnis - weiter →
K5: Einführung
Diskrete Wahrscheinlichkeitsrechnung
5. Simultane Wahrscheinlichkeitsverteilungen
[Bearbeiten]5.1 Einführung
[Bearbeiten]Oft werden bei einem Experiment an einem Objekt mehrere Daten gemessen, z.B. messen wir Alter, Länge und Gewicht einer beliebig gewählten Person. Auf dem Wahrscheinlichkeitsraum gibt es dann (gleichzeitig) verschiedene Zufallsvariablen X1,X2,...,Xn. Interessant sind dann die Beziehungen zwischen den Variablen. Wenn wir die Verteilungen der Zufallsvariablen einzeln kennen, ist es im Allgemeinen nicht möglich eine Aussage zu machen über die Wahrscheinlichkeit eines Ereignisses das sich auf zwei oder mehr der Zufallsvariablen bezieht. Aber gerade solche gemeinsame Wahrscheinlichkeiten interessieren uns, denn solche Wahrscheinlichkeiten erzählen uns über den Zusammenhang der Variablen.
Beispiel 1 (zweimal Würfeln (Fortsetzung))
[Bearbeiten]Mit Z bezeichnen wir die Gesamtaugenzahl und mit M das Maximum der beiden Augenzahlen. Es ist klar dass es ein Zusammenhang gibt zwischen Z und M. Wenn z.B. M = 2, kann Z höchstens den Wert 4 haben. Die simultane Wahrscheinlichkeit P(Z=3 und M=2) können wir nicht herleiten aus der Wahrscheinlichkeiten P(Z=3) und P(M=2).
Definition 5.1.1
[Bearbeiten]Wenn auf dem Wahrscheinlichkeitsraum (S,P) die Zufallsvariablen X1,X2,...,Xn gegeben sind, nennen wir die Folge X = (X1,X2,...,Xn) einen stochastischen Vektor mit Dimension n. Die Zufallsvariablen X1,X2,...,Xn selbst nennen wir die Komponente von X.
Die Begriffe Wertebereich, Wahrscheinlichkeitsfunktion und Wahrscheinlichkeitsverteilung werden analog definiert wie in einer Dimension.
Definition 5.1.2
[Bearbeiten]Unter dem Wertebereich SX eines stochastischen Vektors X verstehen wir die Menge aller möglichen Werte die X annehmen kann, also SX = {X(s)|s∈S}.
Im nächsten werden wir, damit wir nicht immer wieder viele Indizes notieren müssen, nur den Fall von drei Zufallsvariablen X, Y und Z besprechen. Die Verallgemeinerung für beliebig viele Zufallsvariablen X1,X2,...,Xn ist meistens selbstverständlich.
Definition 5.1.3
[Bearbeiten]Es seien X, Y und Z die Komponente eines stochastischen Vektors V. Unter die simultane Wahrscheinlichkeitsfunktion von X, Y und Z verstehen wir die Funktion , definiert durch:
- pX,Y,Z(x,y,z) = P(X=x und Y=y und Z=z).
Die simultane Wahrscheinlichkeitsfunktion induziert wieder eine Wahrscheinlichkeit (Maß) PV auf dem Wertebereich SV von V = (X,Y,Z). Dieser Wahrscheinlichkeitsmaß nennen wir die simultane (Wahrscheinlichkeits)Verteilung von X, Y und Z. Wenn aber keinen Grund zur Verwirrung besteht, werden wir auch die simultane Wahrscheinlichkeitsfunktion gelegentlich mit Wahrscheinlichkeitsverteilung bezeichnen.
Definition 5.1.4
[Bearbeiten]Es seien X, Y und Z die Komponente eines stochastischen Vektors V. Unter der simultane (Wahrscheinlichkeits)Verteilung von X, Y und Z verstehen wir die Funktion PX,Y,Z , definiert für B ⊂ SV durch:
- ,
worin x, y und z die Komponente von V sind.
Satz 5.1.2
[Bearbeiten]Die simultane Wahrscheinlichkeitsverteilung PV des stochastischen Vektors V ist eine Wahrscheinlichkeit auf dem Wertebereich SV von V.
Beispiel 2 (zweimal Würfeln (Fortsetzung))
[Bearbeiten]Die simultane Wahrscheinlichkeitsfunktion pZ,M von Z und M wird gegeben durch:
Die nächste Tabelle zeigt diese simultane Wahrscheinlichkeitsfunktion .
2 3 4 5 6 7 8 9 10 11 12 1 1/36 1/36 2 2/36 1/36 3/36 3 2/36 2/36 1/36 5/36 4 2/36 2/36 2/36 1/36 7/36 5 2/36 2/36 2/36 2/36 1/36 9/36 6 2/36 2/36 2/36 2/36 2/36 1/36 11/36 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 36/36
Im rechten und unteren Rand der Tabelle sind die Zeilen- bzw. Spaltentotale angegeben. Diese Totale stellen gerade die Verteilungen (Wahrscheinlichkeitsfunktionen) pM von M und pZ von Z vor. Um ja z.B pM(3) zu bestimmen, bedenken wir dass:
- pM(3) = P(M=3) = P(Z=4 und M=3 oder Z=5 und M=3 oder Z=6 und M=3) =
- = P(Z=4 und M=3) + P(Z=5 und M=3) + P(Z=6 und M=3) = pZ,M(4,3) + pZ,M(5,3) + pZ,M(6,3).
Deshalb nennen wir in diesem Zusammenhang die Verteilungen von M und von Z auch Randverteilungen oder marginale Verteilungen.
Wenn die simultane Verteilung (Wahrscheinlichkeitsfunktion) einiger Zufallsvariablen bekannt ist, können wir, wie sich oben heraus stellt, von jedem auf diese Zufallsvariablen bezogen Ereignis die Wahrscheinlichkeit berechnen. Insbesondere können wir auch die Wahrscheinlichkeiten von Ereignissen bestimmen, die sich nur auf einen Teil der Zufallsvariablen beziehen. Die dazu gehörende Wahrscheinlichkeitsverteilung nennen wir die marginale Verteilung oder Randverteilung.
Definition 5.1.5a
[Bearbeiten]Es seien X, Y und Z die Komponente eines stochastischen Vektors V. Die Wahrscheinlichkeitsfunktionen pX, pY und pZ der Komponente von V nennen wir in diesem Zusammenhang auch marginale Wahrscheinlichkeitsfunktionen oder Randwahrscheinlichkeitsfunktionen.
Auch wenn es ein Teil der Komponente eines stochastischen Vektors V betrifft, sprechen wir von marginaler Verteilung. Wir formulieren die Definition nur für die zwei Komponente X und Z.
Definition 5.1.5b
[Bearbeiten]Es seien X, Y und Z die Komponente des stochastischen Vektors V. Die simultane Wahrscheinlichkeitsfunktion der Komponente X und Z nennen wir in dieser Zusammenhang die marginale Wahrscheinlichkeitsfunktion oder Randwahrscheinlichkeitsfunktion von X und Z.
Im Beispiel 2 haben wir bereits gesehen, wie die marginale Wahrscheinlichkeitsfunktion einer Zufallsvariable berechnet werden kann aus der simultane Verteilung dieser Zufallsvariable und eine Andere. Der nächste Satz beschreibt dies.
Satz 5.1.1
[Bearbeiten]Die marginale Wahrscheinlichkeitsfunktion der Zufallsvariable X bezieht sich zu der simultane Wahrscheinlichkeitsfunktion von X, Y und Z, laut:
- .
D.h. man bekommt die Wahrscheinlichkeit auf einen Wert x van X damit man die zu x gehörende simultane Wahrscheinlichkeiten aggregiert über alle mögliche Werte y von Y und z von Z.
Wir können diesen Satz verallgemeinern für das Berechnen der marginale Verteilung der m Komponente einer Zufallsvariable. aus die simultane Verteilung aller n (n>m) Komponente. Wir schreiben diese selbstverständliche Verallgemeinerung aber nicht auf, sondern überlassen dies dem Leser.
Bevor wir ein Beispiel besprechen, introduzieren wir zuerst eine Verallgemeinerung der Binomialverteilung, und zwar die Multinomialverteilung. Die Binomialverteilung entsteht unter anderem wenn wir einer Urne mit zwei Sorten Kugeln, z.B. weiße und schwarze, beliebig und mit Zurücklegen, n mal eine Kugel entnehmen. Die Anzahl der gezogenen, weißen Kugeln ist dann binomialverteilt. Mit der Anzahl Weiße ist auch die Anzahl der Schwarzen festgelegt. Als Verallgemeinerung betrachten wir eine Urne mit fünf Sorten Kugeln: weiße, rote, gelbe, grüne und blaue. Wir entnehmen der Urne wieder beliebig und mit Zurücklegen, n Kugeln. Die Stichprobe kann nun von jeder Farbe einige Kugeln enthalten. Die Anzahlen der Kugeln, X1,...,X5, für die unterschiedene Farben, haben simultan eine Multinomialverteilung. Die Parameter dieser Verteilung sind: die Anzahl n der entnommene Kugeln, die Anzahl der mögliche Farben, hier 5, und die relative Anteile p1,...,p5 der Farben in der Urne.
Definition 5.1.6 (Multinomialverteilung)
[Bearbeiten]Die Zufallsvariablen X1,X2,...,Xm haben eine Multinomialverteilung mit den Parametern n, m und p1,p2,...,pm, wenn der Wertebereich des stochastischen Vektors X = (X1,X2,...,Xm) gegeben wird durch: SX = {(n1,n2,...,nm)|ni ganzzählig, ni ≥ 0 und n1+ n2+...+ nm= n} und die simultane Wahrscheinlichkeitsverteilung von X1,X2,...,Xm bestimmt wird durch:
- .
Darin sind n und m natürliche Zahlen und ist pi ≥ 0 für jede i = 1,2,...,m, und es gilt: p1+ p2+...+ pm= 1.
Beispiel 3 (Multinomialverteilung)
[Bearbeiten]Als Verallgemeinerung eines Bernoulli-Versuches betrachten wir ein Experiment mit m unterschiedlichen Ergebnissen. Als Urnenmodell kann man an einer Urne mit Kugeln in m unterschiedlichen Farben denken. Die Wahrscheinlichkeiten der unterschiedlichen Ergebnisse nennen wir p1,p2,...,pm, wofür gilt: p1+ p2+...+ pm = 1. Wir entnehmen der Urne beliebig eine Kugel und legen sie zurück, nachdem wir die Farbe festgestellt haben. Mit Xi bezeichnen wir die Anzahl Malen dass die gezogene Kugel die Farbe i in n Wiederholungen des Versuchs hat. Die Zufallsvariablen X1,X2,...,Xm haben dann eine Multinomialverteilung mit Parametern n, m und p1,p2,...,pm.
Wir bestimmen für den Fall m=3 (Trinomialverteilung) die marginale Verteilung von X1. Für n1= 0,1,...,n berechnen wir:
-
- .
Es stellt sich heraus dass X1 eine Binomialverteilung hat mit Parametern n und p1.