Formelsammlung Statistik/ Hypothesentests

Vorgehen beim Hypothesentest

I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit

II. Aufstellen der Nullhypothese

III. Festlegen der Testfunktion T

IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)

Fällt die Prüfgröße ${\overline {x}}$ in den Bereich [ ${\overline {x}}$ _u; ${\overline {x}}$ _o],

wird H₀ nicht abgelehnt. Es soll sein

P({\bar {x}}_{u}\leq {\bar {X}}\leq {\bar {x}}_{o})=1-\alpha

(beachte: ein- oder zweiseitig)

α : Signifikanzniveau oder α-Fehler

V. Stichprobe erheben

VI. Entscheidung treffen

	H₀ ist wirklich wahr	H₁ ist wirklich wahr
H₀ wird beibehalten	richtige Entscheidung (1-α)	Fehler 2. Art (β-Fehler)
H₁ wird angenommen	Fehler 1. Art (α-Fehler)	richtige Entscheidung (1-β)

Tests auf Lageparameter (Erwartungswert, Median, Anteilswert)

Test auf Erwartungswert

Test	$H_{0}$	$H_{1}$
zweiseitig	μ = μ₀	μ ≠ μ₀
rechtsseitig	μ ≤ μ₀	μ > μ₀
linksseitig	μ ≥ μ₀	μ < μ₀

Zweiseitiger Test für ${\overline {x}}$
linksseitiger Test für ${\overline {x}}$
Rechtsseitiger Test für ${\overline {x}}$

1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30

Testfunktion: $T={\frac {{\bar {X}}_{n}-\mu _{0}}{\sigma }}\cdot {\sqrt {n}}\;\;\sim N(0;1)$ (Gauß-Test):

	Ablehnungsbereich
zweiseitig	$\|T\|>z_{1-\alpha /2}$
rechtsseitig	$\|T\|>z_{1-\alpha }$
linksseitig	$\|T\|<-z_{1-\alpha }$

2. X ist normalverteilt, σ ist unbekannt bei beliebigem n

Testfunktion: $T={\frac {{\bar {X_{n}}}-\mu _{0}}{S}}\cdot {\sqrt {n}}\;\;\sim t(n-1)\;\;$ (t-Test).

	Ablehnungsbereich
zweiseitig	$\|T\|>t_{1-n,1-\alpha /2}$
rechtsseitig	$\|T\|>t_{n-1,1-\alpha }$
linksseitig	$\|T\|<-t_{n-1,1-\alpha }$

3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30

Testfunktion: $T={\frac {{\bar {X_{n}}}-\mu _{0}}{S}}\cdot {\sqrt {n}}\;\approx N(0;1)$ (Gauß-Test) .

	Ablehnungsbereich
zweiseitig	$\|T\|>t_{1-n,1-\alpha /2}$
rechtsseitig	$\|T\|>t_{n-1,1-\alpha }$
linksseitig	$\|T\|<-t_{n-1,1-\alpha }$

Vorzeichentest

Einstichprobenproblem

	Einseitig		Zweiseitig
$\,H_{0}$	$\,P(X\geq \theta _{0})\geq 1/2$	$\,P(X\geq \theta _{0})\leq 1/2$	$\,P(X\geq \theta _{0})=1/2$
$\,H_{1}$	$\,P(X\geq \theta _{0})<1/2$	$\,P(X\geq \theta _{0})>1/2$	$\,P(X\geq \theta _{0})\neq 1/2$
$\,H_{0}$	$\,\theta \geq \theta _{0}$	$\,\theta \leq \theta _{0}$	$\,\theta =\theta _{0}$
$\,H_{1}$	$\,\theta <\theta _{0}$	$\,\theta >\theta _{0}$	$\,\theta \neq \theta _{0}$

Die Stichprobenwerte, die größer als der hypothetische Median $\theta _{0}$ sind, bekommen ein "+" zugeordnet;

Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.

Zweistichprobenproblem

Die $n$ Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar $(x_{1i},x_{2i})\,$ muss unabhängig

vom Wertepaar $(x_{1j},x_{2j}),\forall \;i\neq j$ sein.

Besitzen beide Grundgesamtheiten den gleichen Median, gilt $P(X_{11}>X_{12})=P(X_{11}<X_{12})$ .

Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:

	Einseitig		Zweiseitig
$\,H_{0}$	$\,P(X_{1}\geq X_{2})\geq 1/2$	$\,P(X_{1}\geq X_{2})\leq 1/2$	$\,P(X_{1}\geq X_{2})=1/2$
$\,H_{1}:$	$\,P(X_{1}\geq X_{2})<1/2$	$\,P(X_{1}\geq X_{2})>1/2$	$\,P(X_{1}\geq X_{2})\neq 1/2$

Die Wertepaare der Stichproben, bei denen $x_{i1}>x_{i2}$ gilt, bekommen ein "+" zugeordnet;

Wertepaare, für die $x_{i1}<x_{i2}$ gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt

und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):

V=\sum _{i=1}^{n'}\mathrm {I} (x_{i1}>x_{i2})\sim B(\pi =0{,}5,n')

mit

\mathrm {I} (x_{i1}>x_{i2})={\begin{cases}1,\quad {\text{wenn}}\;x_{i1}>x_{i2}\\0,\quad {\text{sonst}}\\\end{cases}}

Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.

Bei Gültigkeit der Nullhypothese $H_{0}$ ist die Summe der positiven Differenzen binomialverteilt mit $\pi =0{,}5$ ,

da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)

verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.

Approximation durch die Normalverteilung

Mit $n\rightarrow \infty$ nähert sich die Binomialverteilung einer Normalverteilung mit $N(np,np(1-p))$ ,

als Faustregel $np(1-p)\geq 9$ ( $H_{0}:p=1/2$ ).

Mit ${\tfrac {1}{4}}n\geq 9$ bzw. $n\geq 36$ ist die z-standardisierte Größe

$z_{V}={\frac {\sum _{i=1}^{n'}-{\frac {1}{2}}\cdot n'}{{\tfrac {1}{2}}{\sqrt {n'}}}}\approx N(0,1)$

näherungsweise standardnormalverteilt.

Bindungen (Nulldifferenzen) Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert

oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),

die man so behandeln kann:

Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.

Test auf Anteilswert (Binomialtest)

Der Anteilswert θ wird geschätzt durch

{\hat {\theta }}=p={\frac {x}{n}}

.

Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:

Test	$H_{0}$	$H_{1}$
zweiseitig	$\theta =\theta _{0}$	$\theta \neq \theta _{0}$
rechtsseitig	$\theta \leq \theta _{0}$	$\theta >\theta _{0}$
linksseitig	$\theta \geq \theta _{0}$	$\theta <\theta _{0}$

für n > 30 , nθ₀ ≥ 10 n(1-θ₀) ≥ 10: kann man durch die Gauß-Verteilung approximieren:

Testfunktion: $T={\frac {\theta -\theta _{0}}{\sqrt {\theta _{0}(1-\theta _{0})}}}\cdot {\sqrt {n}}\;\;\approx N(0;1)$ (Gauß-Test) .

	Ablehnungsbereich
zweiseitig	$\|T\|>z_{1-\alpha /2}$
rechtsseitig	$\|T\|>z-{1-\alpha }$
linksseitig	$\|T\|<-z-{1-\alpha }$

für n < 30 oder nθ₀ < 10 oder n(1-θ₀) < 10: ist der exakte Binomialtest anzuwenden:

Testfunktion

Die Teststatistik $X$ gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang $n$ aufgetreten ist.

Unter der Nullhypothese $H_{0}\colon \theta =\theta _{0}$ ist die Teststatistik $B(\theta _{0},n)$ -verteilt, das heißt

P(X=i)=B(i|\theta _{0},n)={\binom {n}{i}}\theta _{0}^{i}(1-\theta _{0})^{n-i}

.

Ablehnungsbereich

Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau $\alpha$ in der Regel nicht eingehalten werden.

Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau $\alpha _{\text{ex}}$ gilt $\alpha _{\text{ex}}\leq \alpha$ .

Für den zweiseitigen Test werden daher als kritische Werte das größte $c_{1}$ und das kleinste $c_{2}$ bestimmt, für die gilt

$\sum _{i=0}^{c_{1}}B(i|\theta _{0},n)\leq \alpha /2$ und
$\sum _{i=c_{2}}^{n}B(i|\theta _{0},n)\leq \alpha /2$ .

Das exakte Signifikanzniveau ergibt sich als

$\alpha _{\text{ex}}=\sum _{i=0}^{c_{1}}B(i|\theta _{0},n)+\sum _{i=c_{2}}^{n}B(i|\theta _{0},n)$ .

Für die beiden einseitigen Tests wird analog verfahren.

Test	Kritische Werte	Kritischer Bereich	Grenze(n)
zweiseitig	$c_{1}+1$ und $c_{2}-1$	$\{0,\dotsc ,c_{1}\}\cup \{c_{2},\dotsc ,n\}$
rechtsseitig	$c-1$	$\{c,\dotsc ,n\}$	c = kleinster Wert, für den $\sum _{i=c}^{n}B(i\|\theta _{0},n)=\alpha _{\text{ex}}\leq \alpha$
linksseitig	$c+1$	$\{0,\dotsc ,c\}$	c = größter Wert, für den $\sum _{i=0}^{c}B(i\|\theta _{0},n)=\alpha _{\text{ex}}\leq \alpha$

Tests auf Streuung

Test auf Varianz

Test	$H_{0}$	$H_{1}$
zweiseitig	$\sigma ^{2}=\sigma _{0}^{2}\,$	$\sigma ^{2}\neq \sigma _{0}^{2}$
rechtsseitig	$\sigma ^{2}\leq \sigma _{0}^{2}$	$\sigma ^{2}>\sigma _{0}^{2}\,$
linksseitig	$\sigma ^{2}\geq \sigma _{0}^{2}$	$\sigma ^{2}<\sigma _{0}^{2}\,$

1. X ist normalverteilt, μ ist unbekannt, n beliebig

Testfunktion: $T={\frac {(n-1)S^{2}}{\sigma _{0}^{2}}}={\frac {1}{\sigma _{0}^{2}}}\sum _{i=1}^{n}(X_{i}-{\bar {X}}^{2})^{2}\;\;\sim \chi ^{2}(n-1)$

	Ablehnungsbereich
zweiseitig	$T<\chi _{n-1,\alpha /2}^{2}$ oder $T>\chi _{n-1,1-\alpha /2}^{2}$
rechtsseitig	$T>\chi _{n-1,1-\alpha }^{2}$
linksseitig	$T<\chi _{n-1,\alpha }^{2}$

2. X ist normalverteilt, μ ist bekannt, n beliebig

Testfunktion: $T={\frac {(n-1){\tilde {S}}^{2}}{\sigma _{0}^{2}}}={\frac {1}{\sigma _{0}^{2}}}\sum _{i=1}^{n}(X_{i}-\mu )^{2}\;\;\sim \chi ^{2}(n)$

	Ablehnungsbereich
zweiseitig	$T<\chi _{n,\alpha /2}^{2}$ oder $T>\chi _{n,1-\alpha /2}^{2}$
rechtsseitig	$T>\chi _{n,1-\alpha }^{2}$
linksseitig	$T<\chi _{n,\alpha }^{2}$

Tests auf Zusammenhangs- und Assoziationsparameter

Chi-Quadrat-Unabhängigkeitstest

Nullhypothese: $H_{0}$ : Die Merkmale $X$ und $Y$ sind stochastisch unabhängig.

Die Beobachtungen der Merkmale $X$ und $Y$ liegen paarweise in $m$ bzw. $r$ Klassen vor.

Es gibt insgesamt

n

paarweise Beobachtungen von

X

und

Y

, die sich auf

m\cdot r

Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:

	Merkmal $Y$						Summe Σ
Merkmal $X$	1	2	…	k	…	r	n_j.
1	n₁₁	n₁₂	...	n_1k	...	n_1r	n_1.
2	n₂₁	n₂₂	…	n_2k	…	n_2r	n_2.
…	…	…	…	…	…	…	…
j	…	…	…	n_jk	…	…	n_j.
…	…	…	…	…	…	…	…
m	n_m1	n_m2	…	n_mk	…	n_mr	n_m.
Summe Σ	n_.1	n_.2	…	n_.k	…	n_.r	n

Absolute Randhäufigkeiten $n_{j\,\cdot }$ bzw. $n_{\cdot \,k}$

n_{j\,\cdot }=\sum _{k=1}^{r}n_{jk}

und

n_{\cdot \,k}=\sum _{j=1}^{m}n_{jk}

Prüfgröße für den Unabhängigkeitstest:

\chi ^{2}=\sum _{j=1}^{m}\sum _{k=1}^{r}{\frac {(n_{jk}-n_{jk}^{*})^{2}}{n_{jk}^{*}}}.

Mit : $n_{jk}^{*}={\frac {n_{j\,\cdot }\cdot n_{\cdot \,k}}{n}},$

$H_{0}$ wird abgelehnt, wenn $\chi ^{2}>\chi ^{2}(1-\alpha ;(m-1)(r-1))$ ist.

Anpassungs- oder Verteilungstests

Chi-Quadrat-Anpassungs- oder Verteilungstest

Die Wahrscheinlichkeiten eines Merkmals $X$ seien in der Grundgesamtheit unbekannt.

Nullhypothese: $H_{0}\,$ : Das Merkmal $X$ besitzt die Wahrscheinlichkeitsverteilung $F_{0}(x)$

Für $n$ unabhängige Beobachtungen $x_{1},\dots ,x_{n}$ des Merkmals $X$ wird die Zahl

der Beobachtungen in der $j$ -ten Klasse ist die beobachtete Häufigkeit $N_{j}$ .

Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit $p_{0j}$ ,

dass eine Ausprägung von $X$ in die Kategorie $j$ fällt. Die unter $H_{0}$ zu erwartende Häufigkeit ist:

n_{0j}=p_{0j}\cdot n

Die Prüfgröße (Größe der Abweichung)

\chi ^{2}=\sum _{j=1}^{m}{\frac {(N_{j}-n_{0j})^{2}}{n_{0j}}}

ist bei ausreichend großen $N_{j}$ annähernd chi-Quadrat-verteilt mit $m-1$ Freiheitsgraden.

$H_{0}$ wird abgelehnt, wenn $\chi ^{2}>\chi _{(1-\alpha ;m-1)}^{2}$ gilt.

Kolmogorow-Smirnow-Anpassungstest

Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.

Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.

\!\,H_{0}:F_{X}(x)=F_{0}(x)

(Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F₀.)

H_{1}:F_{X}(x)\neq F_{0}(x)

(Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F₀.)

Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion $F_{n}$ mit $F_{0}$ mittels der Teststatistik

d_{n}=\|F_{n}-F_{0}\|=\sup _{x}|F_{n}(x)-F_{0}(x)|,

(sup: Supremum)

Die Teststatistik ist unabhängig von der hypothetischen Verteilung F₀.

Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.

Einstichprobenproblem

Von einer reellen Zufallsvariablen $X$ liegen $n$ aufsteigend sortierte Beobachtungswerte $x_{i}$ ( $i=1,\dotsc ,n$ ) vor.

Von diesen Beobachtungen wird die relative Summenhäufigkeit $S(x_{i})$ mit der entsprechenden hypothetischen

Verteilung der Grundgesamtheit F₀(x_i) verglichen. Voraussetzung: $F_{0}$ ist stetig.

Für jedes $i=1,\dotsc ,n$ werden die absoluten Differenzen

d_{oi}=|S(x_{i})-F_{0}(x_{i})|~

und :

d_{ui}=|S(x_{i-1})-F_{0}(x_{i})|~

berechnet, wobei $S(x_{0}):=0$ gesetzt wird. Wenn die größte Differenz $d_{\max }$ aus allen Differenzen $d_{oi}$ , $d_{ui}$

einen kritischen Wert $d_{\alpha }$ übersteigt, wird die Hypothese abgelehnt.

Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere $n$ werden sie über $d_{\alpha }={\frac {\sqrt {\ln \left({\frac {2}{\alpha }}\right)}}{\sqrt {2n}}}$ angenähert.

Zweistichprobenproblem

Liegt nun zusätzlich zur Zufallsvariablen $X$ eine entsprechende Zufallsvariable $Y$ vor (mit $m$ geordneten Werten $y_{i}$ ),

so kann durch den Zweistichprobentest überprüft werden, ob $X$ und $Y$ derselben Verteilungsfunktion folgen.

Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen $S_{X}(x_{i})$ bzw. $S_{Y}(y_{i})$ ermittelt:

d(z)=|S_{X}(z)-S_{Y}(z)|~

und :

d_{max}=\sup _{z}d(z)~

.

Die Nullhypothese wird abgelehnt, falls $d_{max}$ den kritischen Wert $d_{krit}(\alpha ,n,m)$ überschreitet.

Für kleine Werte von $n$ und $m$ greift man auf Tabellen zurück.

Für große Werte von n und m wird die Nullhypothese abgelehnt, falls

{\sqrt {\frac {nm}{n+m}}}d_{max}>K_{\alpha }

,

wobei $K_{\alpha }$ für große $n$ und $m$ näherungsweise als $K_{\alpha }={\sqrt {\frac {\ln \left({\frac {2}{\alpha }}\right)}{2}}}$ berechnet werden kann.