Statistik: Vergleich zweier Lageparameter

Vergleich zweier Erwartungswerte

Wir betrachten ein Beispiel: Werbewirksamkeit der Farbe eines Verkaufsregals

Eine Unternehmung, die Tee aus fairem Anbau vertreibt, überlegt, für die Verkaufsregale ein einheitliches Design zu entwerfen. Als Farbe kommen ein dunkleres Gelb oder ein helles Türkis in Frage. Es werden in 11 Supermärkten gelbe Regale und in 9 Supermärkten türkise Regale aufgestellt. Es geht darum, ob sich die mittleren Umsätze bezüglich der Farbe unterscheiden.

Wir bezeichnen mit $X_{1}$ die Zahl der Pakete, die in den ersteren Märkten, und mit $X_{2}$ die Zahl der Pakete, die in den letzteren Märkten verkauft wurden. Die beiden Zufallsvariablen sind normalverteilt, jeweils mit dem Erwartungswert : $\mu _{1}$ bzw. $\mu _{2}$ .

Von Interesse ist, ob der durchschnittliche Absatz von Teepackungen aus gelben Regalen gleich dem von türkisen Regalen sein könnte. Wir testen also

H_{0}{\mbox{: }}\mu _{1}=\mu _{2}

.

Welche Prüfgröße nimmt man hier? Die obige Hypothesenstellung ist da wenig hilfreich, denn wir haben hier eine Gleichung als unbekannten Parameter. Wir können aber $H_{0}$ umformen zu

H_{0}{\mbox{: }}\mu _{1}-\mu _{2}=0

.

Nun brauchen wir noch eine passende Schätzfunktion für die Differenz der Erwartungswerte: Es bieten sich die entsprechenden arithmetischen Durchschnitte ${\overline {x}}_{1}$ und ${\overline {x}}_{2}$ an, die durchschnittlichen Absatzzahlen von Teepaketen je Regalfarbe. Die Differenz ${\overline {X}}_{1}-{\overline {X}}_{2}$ ist natürlich wieder eine Zufallsvariable, die ebenfalls normalverteilt ist. Ihr Erwartungswert ist $\mu _{1}-\mu _{2}$ , wie uns von linearen Transformationen von Zufallsvariablen bekannt ist. Wären die Varianzen von ${\overline {X}}_{1}$ und ${\overline {X}}_{2}$ bekannt, ergäbe sich die Varianz von ${\overline {X}}_{1}-{\overline {X}}_{2}$ als Summe der Varianzen von ${\overline {X}}_{1}$ und ${\overline {X}}_{2}$ , also $\sigma _{{\bar {x}}_{1}}^{2}+\sigma _{{\bar {x}}_{2}}^{2}$ . Wir hätten also nun normalverteilte Prüfgröße

z={\frac {({\overline {X}}_{1}-{\overline {X}}_{2})-(\mu _{1}-\mu _{2})}{\sqrt {\sigma _{{\overline {X}}_{1}}^{2}+\sigma _{{\overline {X}}_{2}}^{2}}}}

.

Leider ist der Statistikgott grausam und verrät uns normalerweise die Varianzen in den Grundgesamtheiten nicht. Hier beginnt die Tragödie: Da wir die Varianzen schätzen müssen, erhalten wir eine $t$ -verteilte Prüfgröße. Nun ist die $t$ -Verteilung nicht reproduktiv, eine Summe von $t$ -verteilten Zufallsvariablen ist nicht per se wieder $t$ -verteilt. Wir bekommen also bei der Bestimmung der Prüfgrößenverteilung Probleme. Wir sind mit zwei Möglichkeiten konfrontiert:

Die Varianzen der ${\overline {X}}$ sind gleich.

Hier ist die resultierende

t

-Verteilung reproduktiv, und die Ermittlung der Verteilung einfach.

Die Varianzen sind ungleich.

Im Nenner der Prüfgröße befinden sich nun die Wurzeln zweier verschiedener Quadratsummen. Hier können wir keine exakte Verteilung der Prüfgröße angeben. Wir haben eine

t

-Verteilung mit einer unbekannten Zahl von Freiheitsgraden, die lediglich näherungsweise bestimmt werden können.

Meistens wird wohl getestet, ob es generell zwischen den beiden Erwartungswerten einen Unterschied gibt, als Punkthypothese

H_{0}{\mbox{: }}\mu _{1}-\mu _{2}=0{\mbox{ bzw. }}H_{0}{\mbox{: }}\mu _{1}=\mu _{2}

,

als Bereichshypothesen

H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\geq 0{\mbox{ bzw. }}H_{0}{\mbox{: }}\mu _{1}\geq \mu _{2}

,

H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\leq 0{\mbox{ bzw. }}H_{0}{\mbox{: }}\mu _{1}\leq \mu _{2}

.

Bemerkung: Es kann mal vorkommen, dass wir eine Hypothese $H_{0}{\mbox{: }}\mu _{2}-\mu _{1}\geq 0$ gegeben haben, was bedeutet, $\mu _{2}$ ist größer als $\mu _{1}$ . Hielten wir uns an die Prüfgröße der Formel mit dem Zähler ${\overline {X}}_{1}-{\overline {X}}_{2}$ , müssten wir die Hypothese umformen zu $H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\leq 0$ . Das Hantieren mit Ungleichungen bereitet Anfängern häufig Schwierigkeiten. Wir können es aber auch in der Hypothese bei $H_{0}{\mbox{: }}\mu _{2}-\mu _{1}\geq 0$ belassen und in die Prüfgröße statt des Zählers ${\overline {X}}_{1}-{\overline {X}}_{2}$ die Differenz ${\overline {X}}_{2}-{\overline {X}}_{1}$ schreiben, was uns die Umdrehung der Ungleichung erspart. Ansonsten hat das keine Auswirkungen, denn die Ausdrücke mit den Varianzen bleiben gleich.

Vergleich von Erwartungswerten, wenn die Varianzen gleich sind

Sind die Varianzen gleich, steht auch nur eine Varianz im Nenner der Prüfgröße. Wir berechnen aus allen Beobachtungen die gemeinsame Stichprobenvarianz $s^{2}$ , die auch gepoolte Varianz genannt wird. Nennen wir die Daten aus der ersten Stichprobe $x_{1i}\;(i=1,\ldots ,n_{1})$ und die der zweiten Stichprobe $x_{2i}\;(i=1,\ldots ,n_{2})$ . Die Gesamtzahl aller Beobachtungen ist dann $n=n_{1}+n_{2}$ . Die gepoolte Varianz wird ermittelt als

s^{2}={\frac {(n_{1}-1)\cdot s_{1}^{2}+(n_{2}-1)\cdot s_{2}^{2}}{n_{1}+n_{2}-2}}

,

was wir auch schreiben können als

s^{2}={\frac {\sum _{i=1}^{n_{1}}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n_{2}}(x_{2i}-{\overline {x}}_{2})^{2}}{n_{1}+n_{2}-2}}

.

Woher wissen wir eigentlich, dass die Varianzen gleich sind, wenn wir sie gar nicht kenne? Das können wir mit einem Test auf Gleichheit der Varianzen zweier Zufallvariablen rauskriegen.

Wird dieser Test nicht abgelehnt, vermuten wir Gleichheit der Varianzen (mit allen Problemen des β-Fehlers, die man bei Nichtablehnung einkauft) und erhalten die Prüfgröße

$T={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}-(\mu _{1}-\mu _{2})}{S\cdot {\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}$ ,

die wegen $(\mu _{1}-\mu _{2})=0$ zu

$T={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{S\cdot {\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}$

vereinfacht werden kann. ${\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}$ im Nenner entspricht dem ${\frac {1}{\sqrt {n}}}$ , das wir von ${\frac {S}{\sqrt {n}}}$ schon kennen.

$T$ ist $t$ -verteilt mit $n-2$ Freiheitsgraden. Es gehen hier zwei Freiheitsgrade verloren, denn bei der Berechnung der Varianz ersetzen wir die unbekannten Erwartungswerte $\mu _{1}$ und $\mu _{2}$ durch die Schätzer ${\bar {X}}_{1}$ und ${\bar {X}}_{2}$ .

Vorgehensweise:

Der Stichprobenwert der Prüfgröße ist

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}}{s\cdot {\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}\

.

Wir verwenden die Entscheidungsregeln

\ H_{0}{\mbox{: }}\mu _{1}-\mu _{2}=0

wird abgelehnt, falls

t<-t(1-{\frac {\alpha }{2}};n_{1}+n_{2}-2)

oder

t>t(1-{\frac {\alpha }{2}};n_{1}+n_{2}-2)

ist.

\ H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\leq 0

wird abgelehnt, falls

t>t(1-\alpha ;n_{1}+n_{2}-2)

ist.

\ H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\geq 0

wird abgelehnt, falls

t<-z(1-\alpha ;n_{1}+n_{2}-2)

ist.

Nun wollen wir unser Verkaufsregalbeispiel durchrechnen:

Wir testen $H_{0}{\mbox{: }}\mu _{1}-\mu _{2}=0$ bei einem $\alpha =0{,}05$ .

Zuerst müssen wir den Nichtablehnungsbereich festlegen: Laut obiger Vorschrift ist er das Intervall

[-t(1-{\frac {\alpha }{2}};n_{1}+n_{2}-2);\ t(1-{\frac {\alpha }{2}};n_{1}+n_{2}-2)]=

[-t(0,975;11+9-2);\ t(0,975;11+9-2)]=

[-2,10;2,10].

Nun werden wir die Prüfgröße berechnen:

In den $n_{1}=11$ Supermärkten mit den gelben Regalen wurden

x_{1i}{\mbox{: }}

25 28 35 30 18 27 26 21 27 30 30

Päckchen verkauft, und in den $n_{2}=9$ Supermärkten mit den türkisen Regalen

x_{2i}{\mbox{: }}

30 18 24 26 27 23 18 24 26

viele. Es ergeben sich die Schätzungen ${\overline {x}}_{1}=27$ , ${\overline {x}}_{2}=24$ , $s_{1}^{2}=21{,}4$ und $s_{2}^{2}=15{,}75$ .

Die Nullhypothese, dass die Varianzen gleich sind, wird nicht abgelehnt (hier). Wir berechnen somit die gepoolte Varianz als

s^{2}={\frac {10\cdot 21{,}4+8\cdot 15{,}75}{18}}\,\approx 18{,}89

beziehungsweise

s\approx 4{,}35

.

Die Stichprobe ergibt also

$t={\frac {27-24-0}{4{,}35\cdot {\sqrt {{\frac {1}{11}}+{\frac {1}{9}}}}}}\ =1{,}54.$

Die Nullhypothese kann nicht abgelehnt werden. Die Farbe der Regale scheint die Kauflust nicht zu beeinflussen.

Vergleich von Erwartungswerten, wenn die Varianzen ungleich sind

Für die Nullhypothesen verwenden wir jetzt analog zur obigen Formel

z={\frac {({\overline {X}}_{1}-{\overline {X}}_{2})-(\mu _{1}-\mu _{2})}{\sqrt {\sigma _{{\overline {X}}_{1}}^{2}+\sigma _{{\overline {X}}_{2}}^{2}}}}

die entsprechende Prüfgröße

T={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}

,

die bei normalverteilter Grundgesamtheit grundsätzlich $t$ -verteilt ist.

Die Freiheitsgrade $k$ können jetzt nur näherungsweise ermittelt werden mit der Formel

k={\dfrac {\left({\dfrac {s_{1}^{2}}{n_{1}}}+{\dfrac {s_{2}^{2}}{n_{2}}}\right)^{2}}{{\dfrac {\left({\dfrac {s_{1}^{2}}{n_{1}}}\right)^{2}}{n_{1}-1}}+{\dfrac {\left({\dfrac {s_{2}^{2}}{n_{2}}}\right)^{2}}{n_{2}-1}}}}\,.

Wir verwenden die Entscheidungsregeln

\ H_{0}{\mbox{: }}\mu _{1}-\mu _{2}=0

wird abgelehnt, falls

t<-t(1-{\frac {\alpha }{2}};k)

oder

t>t(1-{\frac {\alpha }{2}};k)

ist.

\ H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\leq 0

wird abgelehnt, falls

t>t(1-\alpha ;k)

ist.

\ H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\geq 0

wird abgelehnt, falls

t<-z(1-\alpha ;k)

ist.

Beispiel

Es wurden $n_{1}=16$ Studentinnen und $n_{2}=25$ Studenten befragt, wie viel Zeit sie in in der Woche für das Pauken einer vorgeschriebenen Fremdsprache aufwendeten .

Beim Signifikanzniveau $\alpha =0{,}1$ soll geprüft werden, ob Studentinnen im Durchschnitt weniger Zeit aufwenden als Studenten, also

H_{0}{\mbox{: }}\mu _{1}\leq \mu _{2}

bzw.

H_{0}{\mbox{: }}\mu _{1}-\mu _{2}\leq 0

.

Es ergaben sich die Kennwerte ${\overline {x}}_{1}=50$ , ${\overline {x}}_{2}=45$ , $s_{1}^{2}=64$ und $s_{2}^{2}=225$ . Der Test auf Varianzgleichheit wurde abgelehnt. Die Zahl $k$ der Freiheitsgrade ist dann

{\dfrac {\left({\dfrac {64}{16}}+{\dfrac {225}{25}}\right)^{2}}{{\dfrac {\left({\dfrac {64}{16}}\right)^{2}}{15}}+{\dfrac {\left({\dfrac {225}{25}}\right)^{2}}{24}}}}=

{\frac {169}{{\dfrac {16}{15}}+{\dfrac {81}{24}}}}\approx 39{\mbox{ (aufgerundet).}}

Da wir eine Höchststhypothese haben, packen wir den Ablehnungsbereich ans obere Ende der Verteilung und entscheiden so: Wenn der Wert der Prüfgröße $t>t(1-\alpha ;39)$ ist, wird $H_{0}$ abgelehnt.

In unserem Beispiel haben wir es allerdings bei $k$ mit mehr als 30 Freiheitsgraden zu tun. Deshalb können wir die Prüfgröße als näherungsweise normalverteilt ansehen. Und wir lehnen nun ab, wenn $t>z(1-\alpha )=z(0{,}9)=1{,}29$ ist. Für $t$ erhalten wir

t={\frac {50-45}{\sqrt {{\frac {64}{16}}+{\frac {225}{25}}}}}={\frac {5}{\sqrt {4+9}}}=1{,}39

.

Da $1{,}39>1{,}29$ ist, wird die Hypothese abgelehnt. Studentinnen wenden vermutlich im Mittel mindestens genau so viel Zeit für das Erlernen von Sprachen auf wie Studenten.

Vergleich der Erwartungswerte von zwei Zufallsvariablen unbekannter Verteilung

Wir werden gelegentlich mit Daten konfrontiert sein, die wir bei bestem Willen nicht als normalverteilt andienen können. Ist der Stichprobenumfang genügend groß, kann die Verteilung der Prüfgröße als annähernd standardnormalverteilt angesehen werden.

Wir gehen so vor:

Es wird der Unterschied der Erwartungswerte $EX_{1}$ und $EX_{2}$ geprüft. Verteilung und Varianz von $X_{1}$ und $X_{2}$ sind unbekannt.

Wenn $n_{1}>30$ und $n_{2}>30$ oder $k>30$ gilt, ist die Prüfgröße $Z$ für

z={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}

näherungsweise normalverteilt.

$\ H_{0}{\mbox{: }}EX_{1}-EX_{2}=0$ wird abgelehnt, falls $z<-z(1-{\frac {\alpha }{2}})$ oder $z>z(1-{\frac {\alpha }{2}})$ ist.

$\ H_{0}{\mbox{: }}EX_{1}-EX_{2}\leq 0$ wird abgelehnt, falls $z>z(1-\alpha )$ ist.

$\ H_{0}{\mbox{: }}EX_{1}-EX_{2}\geq 0$ wird abgelehnt, falls $z<-z(1-\alpha )$ ist.

Vergleich der Anteilswerte zweier binomialverteilter Grundgesamtheiten

Wir betrachten zwei Urnen mit je zwei Sorten Kugeln. Zu jeder Urne (auch Grundgesamtheit genannt) gehört eine binomialverteilte Zufallsvariable $X_{1}$ und $X_{2}$ . Von Interesse könnte sein, ob die Parameter $\theta _{1}$ und $\theta _{2}$ verschieden sind. Wir testen also die Anteilswerte auf Gleichheit:

H_{0}:\theta _{1}=\theta _{2}

bzw.

H_{0}:\theta _{1}-\theta _{2}=0

bei der komplementären Alternativhypothese $H_{1}:\theta _{1}\neq \theta _{2}$ .

Es werden zufällig $n_{1}$ bzw. $n_{2}$ Kugeln mit Zurücklegen entnommen.

Für den Test müssen die $\theta$ s geschätzt werden: Der Anteilswert $\theta _{1}$ in der ersten Urne wird mit dem Stichprobenanteil $p_{1}={\frac {x_{1}}{n}}$ , $\theta _{2}$ entsprechend mit $p_{2}$ geschätzt.

Bei genügend großem Stichprobenumfang ist die Differenz der zu Grunde liegenden Zufallsvariablen $P_{1}-P_{2}$ näherungsweise normalverteilt.

Wir wenden wieder das bekannte Approximationskriterium an:

Wenn $n_{1}>{\dfrac {9}{p_{1}(1-p_{1})}}$ und $n_{2}>{\dfrac {9}{p_{2}(1-p_{2})}}$ sind, ist die resultierende Prüfgröße näherungsweise standardnormalverteilt.

Unter $H_{0}$ sind die Anteilswerte gleich, also dann auch ihre Varianz $n\cdot \theta \cdot (1-\theta )$ . Wir berechnen diese mit Hilfe des gepoolten Anteilswerts

p={\frac {n_{1}\cdot p_{1}+n_{2}\cdot p_{2}}{n_{1}+n_{2}}}.

Für die Prüfgröße verwenden wir den Stichprobenwert

z={\frac {p_{1}-p_{2}}{\sqrt {p(1-p)\cdot \left({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}\right)}}}\,.

Unsere Entscheidungsregeln lauten:

\ H_{0}{\mbox{: }}\theta _{1}-\theta _{2}=0

wird abgelehnt, falls

z<-z(1-{\frac {\alpha }{2}})

oder

z>z(1-{\frac {\alpha }{2}})

ist.

\ H_{0}{\mbox{: }}\theta _{1}-\theta _{2}\leq 0

wird abgelehnt, falls

z>z(1-\alpha )

ist.

\ H_{0}{\mbox{: }}\theta _{1}-\theta _{2}\geq 0

wird abgelehnt, falls

z<-z(1-\alpha )

ist.

Bemerkung: Grundsätzlich kann wie beim Vergleich von Erwartungswerten auch bei diesem Test auf einen bestimmten Unterschied hin geprüft werden. Es sollen hier aber lediglich die Tests auf Gleichheit betrachtet werden .

Beispiel: Zufriedenheit bei Bahnkunden

Ein privater Bahnbetreiber veranlasst zum Zweck der Qualitätssicherung eine Kundenbefragung. Unter anderem wurden die Kunden in die Kategorien Senior (mindestens 60 Jahre alt) und jüngerer Fahrgast eingeteilt. Während einer Zugfahrt wurden $n_{1}=280$ jüngere Fahrgäste und $n_{2}=110$ Senioren befragt. Von den jüngeren Fahrgästen wünschten 49, dass man auch ein Fahrrad mitnehmen kann, bei den Senioren waren es 22. Es soll bei $\alpha =0{,}05$ die Hypothese getestet werden, dass der Anteil der jüngeren Fahrgäste, die das Rad mitnehmen wollen, größer ist als der entsprechende Anteil der Senioren.

Zu prüfen ist

H_{0}{\mbox{: }}\theta _{1}\geq \theta _{2}{\mbox{ beziehungsweise }}H_{0}{\mbox{: }}\theta _{1}-\theta _{2}\geq 0

Der Stichprobenanteil für $\theta _{1}$ berechnet sich als $p_{1}={\dfrac {49}{280}}=0{,}175$ und der für $\theta _{2}$ als $p_{2}={\dfrac {22}{110}}=0{,}2$ .