Mathematik: Statistik: Ausgewählte Konfidenzintervalle

Aus Wikibooks

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Konfidenzintervalle für den Durchschnitt einer Grundgesamtheit

Es sei X1,...Xn eine unabhängige Stichprobe aus der Grundgesamtheit. Der Stichprobenmittelwert ist:

\bar X =\frac 1n \sum_{i=1}^n X_i\,

und die Stichprobenvarianz:

 S^2 = \frac 1{n-1} \sum_{i=1}^n(X_i - \bar X)^2.

Die observierten Werte dieser Stichprobenfunktionen deuten wir an mit \bar{x}, und s2,.


Normalverteiltes Merkmal mit bekannter Varianz

Im obigen Beispiel war die Verteilung des Merkmals in der Grundgesamtheit bekannt und normalverteilt und die Varianz σ2 war bekannt. Man erhält hier das 1-α-Konfidenzintervall für μ, den Durchschnitt des Merkmals in der Grundgesamtheit

[\bar x - z(1-\begin{matrix}\frac {\alpha}2 \end{matrix}) \frac{\sigma}{\sqrt {n}} ; \bar x + z(1-\begin{matrix}\frac {\alpha}2 \end{matrix}) \frac{ \sigma } {\sqrt{n}}]\;.

Normalverteiltes Merkmal mit unbekannter Varianz

Ist zwar das Merkmal in der Grundgesamtheit normalverteilt, aber die Varianz unbekannt, muss die Varianz des Merkmals durch s2 geschätzt werden. Damit erhalten wir ein Zufallsintervall daß mit Wahrscheinlichkeit 1-α den Parameter enthält:

P( \bar X - t(1- \begin{matrix}\frac {\alpha}2 \end{matrix} ; n-1 ) \frac S{\sqrt {n}} \le  \mu \le \bar X + t( 1-\begin{matrix}\frac {\alpha}2 \end{matrix}  ; n-1 ) \frac S{\sqrt {n}}) = 1 - \alpha  \; . .

Daraus folgt das 1-α-Konfidenzintervall für den Durchschnitt μ des Merkmals in der Grundgesamtheit:

[\bar x - t(1- \begin{matrix}\frac {\alpha}2 \end{matrix} ; n-1 ) \frac s{\sqrt {n}}\ ;\ \bar x + t( 1-\begin{matrix}\frac {\alpha}2 \end{matrix};n-1 ) \frac s{\sqrt {n}}]\;.

Das Quantil t(1- \begin{matrix}\frac {\alpha}2 \end{matrix} ; n-1 ) kommt jetzt aus einer t-Verteilung mit n-1 Freiheitsgraden. Die t-Verteilung hat eine ähnliche Form wie die Normalverteilung, ist aber etwas breiter. In der hier betrachteten Art (zentral) ist sie ebenfalls symmetrisch. Da sie verschiedene Freiheitsgrade hat, ist sie nur für ausgewählte Quantile tabelliert. Es gilt beispielsweise

t(0,975;4) = 2,776

und

t(0,025;4) = -2,776.

Merkmal mit unbekannter Verteilung und bekannter Varianz

Ist die Verteilung des Merkmals unbekannt, aber die Varianz σ2 bekannt, kann man für EX des Merkmals X, das Konfidenzintervall

[\bar x - z(1-\begin{matrix}\frac {\alpha}2 \end{matrix}) \frac{\sigma}{\sqrt {n}} ; \bar x + z(1-\begin{matrix}\frac {\alpha}2 \end{matrix}) \frac{ \sigma } {\sqrt{n}}]\;.

angeben, falls n groß genug ist (Faustregel n > 30).

Merkmal mit unbekannter Verteilung und unbekannter Varianz

Sind Verteilung und Varianz des Merkmals unbekannt, kann man für n > 50 das Konfidenzintervall für EX angeben als

[\bar x - z(1- \begin{matrix}\frac {\alpha}2 \end{matrix}) \frac s{\sqrt {n}}\ ;\ \bar x + z( 1-\begin{matrix}\frac {\alpha}2 \end{matrix} ) \frac s{\sqrt {n}}]\;.

Konfidenzintervalle für den Anteilswert einer dichotomen Grundgesamtheit

Modell mit Zurücklegen

Die Verteilung eines Merkmals einer dichotomen Grundgesamtheit lässt sich durch das Urnenmodell beschreiben. Man möchte den Anteilswert p, also den Anteil der Kugeln erster Sorte in der Urne bestimmen. Der Anteilswert wird geschätzt durch

 \hat{p} = \frac xn\; ,

worin x der beobachtete Wert der Anzahl X der Kugeln erster Sorte in der Stichprobe ist.

Bei einem Urnenmodell mit Zurücklegen ist X binomialverteilt. Falls n groß genug ist (als Faustregel gilt: n > 100 und n\hat{p}(1-\hat{p}) \ge 9 ), erhält man das 1-α-Konfidenzintervall für p durch eine Approximation der Binomialverteilung mit Hilfe der Normalverteilung:


\left[
\hat p - 
z(1 - \begin{matrix}\frac {\alpha}2 \end{matrix}) \sqrt{\frac{\hat p(1-\hat p)}n }
\ ;\   
\hat p + 
z(1 - \begin{matrix}\frac {\alpha}2 \end{matrix}) \sqrt{\frac{\hat p(1-\hat p)}n } 
\right].

Exakt läßt sich das Konfidenzintervall mit den Verteilungswerten der Binomialverteilung bestimmen. Dafür muß zum Beispiel für eine untere Vertrauensgrenze ein Parameter pu für die Binomialverteilung bestimmt werden, das so klein ist, daß die Wahrscheinlichkeit aus einer Binomialverteilung mit den Parametern n und pu gerade x oder mehr Treffer zu erhalten höchstens die eingeräumte Irrtumswahrscheinlichkeit ist.

Für eine Alternative zu diesem Verfahren ist der Zusammenhang der Binomialverteilung mit der Betaverteilung nützlich. Eine untere Vertrauensgrenze für pu liefert das α-Quantil der Betaverteilung mit den Parametern x und nx + 1. Eine obere Vertrauensgrenze liefert das 1 − α-Quantil der Betaverteilung mit den Parametern x + 1 und nx. Dabei handelt es sich nicht um zwei verschiedene Methoden, sondern nur um zwei verschiedene Suchverfahren nach einem geeigneten Parameter für die Binomialverteilung, so dass jeweils der einseitige Test für den Parameter der Binomialverteilung nicht zu Ablehnung führt. Weil Quantile der Betaverteilung durch eine Nullstellensuche in der unvollständigen Beta-Funktion bestimmt werden können, ist die Suchstrategie über die Betaverteilung schon dann leicht zugänglich, wenn man einen numerischen Zugang zur unvollständigen Betafunktion und ein allgemeines Verfahren zur Nullstellensuche zu Verfügung hat. Dies kann ein Vorteil gegenüber der Suche nach einem geeigneten Parameter der Binonialverteilung sein, für den das beobachtete x gerade nicht zur Ablehnung führt.

Die exakte Methode über die Suche nach einem geeigneten Parameter der Binomialverteilung so, dass ein einseitiger Test für die Beobachtung x gerade nicht zu Ablehung führt, ist nur für die Suche nach einer einseitigen Vertrauensgrenze unverfälscht. Ein unverfälschtes zweiseitiges Konfidenzintervall für den Parameter p der Binomialverteilung muss aus einem unverfälschten zweiseitigen Test für den Parameter p abgeleitet werden. Weil die Binomialverteilung außer für p = 1 / 2 nicht symmetrisch ist, genügt es nicht die Irrtumswahrscheinlichkeit α zu gleichen Teilen auf die beiden Enden der Verteilung aufzuteilen.

Modell ohne Zurücklegen

Bei einem Urnenmodell ohne Zurücklegen ist X hypergeometrisch verteilt. Falls die Bedingungen

  •  n >  9 / (p \cdot (1-p)) ,
  • n > 100
  •  n/N \le 0,05

erfüllt sind, ist die Approximation der hypergeometrischen Verteilung durch die Normalverteilung brauchbar und man erhält das approximative (1 − α)-Konfidenzintervall für θ

\left[ p - z\left( 1- \frac {\alpha} {2}\right) \cdot \sqrt {\frac{p(1-p) } { n}} \sqrt {\frac{N-n} { N-1}} ;  p + z\left( 1- \frac {\alpha} {2}\right) \cdot \sqrt {\frac{p(1-p) } { n}}\sqrt {\frac{N-n} { N-1}}\;\right] \; . .


↑Prinzip des Konfidenzintervalls
↑↑Inhaltsverzeichnis Statistik
Persönliche Werkzeuge