Mathematik: Statistik: Ausgewählte Konfidenzintervalle
Aus Wikibooks
Inhaltsverzeichnis |
Konfidenzintervalle für den Durchschnitt einer Grundgesamtheit
Es sei X1,...Xn eine unabhängige Stichprobe aus der Grundgesamtheit. Der Stichprobenmittelwert ist:
und die Stichprobenvarianz:
Die observierten Werte dieser Stichprobenfunktionen deuten wir an mit
und s2,.
Normalverteiltes Merkmal mit bekannter Varianz
Im obigen Beispiel war die Verteilung des Merkmals in der Grundgesamtheit bekannt und normalverteilt und die Varianz σ2 war bekannt. Man erhält hier das 1-α-Konfidenzintervall für μ, den Durchschnitt des Merkmals in der Grundgesamtheit
Normalverteiltes Merkmal mit unbekannter Varianz
Ist zwar das Merkmal in der Grundgesamtheit normalverteilt, aber die Varianz unbekannt, muss die Varianz des Merkmals durch s2 geschätzt werden. Damit erhalten wir ein Zufallsintervall daß mit Wahrscheinlichkeit 1-α den Parameter enthält:
.
Daraus folgt das 1-α-Konfidenzintervall für den Durchschnitt μ des Merkmals in der Grundgesamtheit:
Das Quantil
kommt jetzt aus einer t-Verteilung mit n-1 Freiheitsgraden. Die t-Verteilung hat eine ähnliche Form wie die Normalverteilung, ist aber etwas breiter. In der hier betrachteten Art (zentral) ist sie ebenfalls symmetrisch. Da sie verschiedene Freiheitsgrade hat, ist sie nur für ausgewählte Quantile tabelliert. Es gilt beispielsweise
- t(0,975;4) = 2,776
und
- t(0,025;4) = -2,776.
Merkmal mit unbekannter Verteilung und bekannter Varianz
Ist die Verteilung des Merkmals unbekannt, aber die Varianz σ2 bekannt, kann man für EX des Merkmals X, das Konfidenzintervall
angeben, falls n groß genug ist (Faustregel n > 30).
Merkmal mit unbekannter Verteilung und unbekannter Varianz
Sind Verteilung und Varianz des Merkmals unbekannt, kann man für n > 50 das Konfidenzintervall für EX angeben als
Konfidenzintervalle für den Anteilswert einer dichotomen Grundgesamtheit
Modell mit Zurücklegen
Die Verteilung eines Merkmals einer dichotomen Grundgesamtheit lässt sich durch das Urnenmodell beschreiben. Man möchte den Anteilswert p, also den Anteil der Kugeln erster Sorte in der Urne bestimmen. Der Anteilswert wird geschätzt durch
worin x der beobachtete Wert der Anzahl X der Kugeln erster Sorte in der Stichprobe ist.
Bei einem Urnenmodell mit Zurücklegen ist X binomialverteilt. Falls n groß genug ist (als Faustregel gilt: n > 100 und
), erhält man das 1-α-Konfidenzintervall für p durch eine Approximation der Binomialverteilung mit Hilfe der Normalverteilung:
Exakt läßt sich das Konfidenzintervall mit den Verteilungswerten der Binomialverteilung bestimmen. Dafür muß zum Beispiel für eine untere Vertrauensgrenze ein Parameter pu für die Binomialverteilung bestimmt werden, das so klein ist, daß die Wahrscheinlichkeit aus einer Binomialverteilung mit den Parametern n und pu gerade x oder mehr Treffer zu erhalten höchstens die eingeräumte Irrtumswahrscheinlichkeit ist.
Für eine Alternative zu diesem Verfahren ist der Zusammenhang der Binomialverteilung mit der Betaverteilung nützlich. Eine untere Vertrauensgrenze für pu liefert das α-Quantil der Betaverteilung mit den Parametern x und n − x + 1. Eine obere Vertrauensgrenze liefert das 1 − α-Quantil der Betaverteilung mit den Parametern x + 1 und n − x. Dabei handelt es sich nicht um zwei verschiedene Methoden, sondern nur um zwei verschiedene Suchverfahren nach einem geeigneten Parameter für die Binomialverteilung, so dass jeweils der einseitige Test für den Parameter der Binomialverteilung nicht zu Ablehnung führt. Weil Quantile der Betaverteilung durch eine Nullstellensuche in der unvollständigen Beta-Funktion bestimmt werden können, ist die Suchstrategie über die Betaverteilung schon dann leicht zugänglich, wenn man einen numerischen Zugang zur unvollständigen Betafunktion und ein allgemeines Verfahren zur Nullstellensuche zu Verfügung hat. Dies kann ein Vorteil gegenüber der Suche nach einem geeigneten Parameter der Binonialverteilung sein, für den das beobachtete x gerade nicht zur Ablehnung führt.
Die exakte Methode über die Suche nach einem geeigneten Parameter der Binomialverteilung so, dass ein einseitiger Test für die Beobachtung x gerade nicht zu Ablehung führt, ist nur für die Suche nach einer einseitigen Vertrauensgrenze unverfälscht. Ein unverfälschtes zweiseitiges Konfidenzintervall für den Parameter p der Binomialverteilung muss aus einem unverfälschten zweiseitigen Test für den Parameter p abgeleitet werden. Weil die Binomialverteilung außer für p = 1 / 2 nicht symmetrisch ist, genügt es nicht die Irrtumswahrscheinlichkeit α zu gleichen Teilen auf die beiden Enden der Verteilung aufzuteilen.
Modell ohne Zurücklegen
Bei einem Urnenmodell ohne Zurücklegen ist X hypergeometrisch verteilt. Falls die Bedingungen
,- n > 100

erfüllt sind, ist die Approximation der hypergeometrischen Verteilung durch die Normalverteilung brauchbar und man erhält das approximative (1 − α)-Konfidenzintervall für θ
.


![[\bar x - z(1-\begin{matrix}\frac {\alpha}2 \end{matrix}) \frac{\sigma}{\sqrt {n}} ; \bar x + z(1-\begin{matrix}\frac {\alpha}2 \end{matrix}) \frac{ \sigma } {\sqrt{n}}]\;.](http://upload.wikimedia.org/math/3/b/1/3b14f433255c350b8bfe556864dea254.png)
![[\bar x - t(1- \begin{matrix}\frac {\alpha}2 \end{matrix} ; n-1 ) \frac s{\sqrt {n}}\ ;\ \bar x + t( 1-\begin{matrix}\frac {\alpha}2 \end{matrix};n-1 ) \frac s{\sqrt {n}}]\;.](http://upload.wikimedia.org/math/3/d/3/3d356940dc397dd32d0986759394e74c.png)
![[\bar x - z(1- \begin{matrix}\frac {\alpha}2 \end{matrix}) \frac s{\sqrt {n}}\ ;\ \bar x + z( 1-\begin{matrix}\frac {\alpha}2 \end{matrix} ) \frac s{\sqrt {n}}]\;.](http://upload.wikimedia.org/math/2/8/0/280ddbf2670554766786c9501f582719.png)

![\left[
\hat p -
z(1 - \begin{matrix}\frac {\alpha}2 \end{matrix}) \sqrt{\frac{\hat p(1-\hat p)}n }
\ ;\
\hat p +
z(1 - \begin{matrix}\frac {\alpha}2 \end{matrix}) \sqrt{\frac{\hat p(1-\hat p)}n }
\right].](http://upload.wikimedia.org/math/9/4/d/94dacc4b5b3ab0fbdd9b9d3c69ef32a8.png)

