Formelsammlung Statistik/ Druckversion

Aus Wikibooks
Formelsammlung Statistik


Uli Schell
Wikibooks

Grundlagen[Bearbeiten]

Mengenlehre und DE MORGANsche Regeln[Bearbeiten]

und

Kombinatorik[Bearbeiten]

Fakultät[Bearbeiten]

Binomialkoeffizient[Bearbeiten]

Zufallsstichproben[Bearbeiten]

Anzahl der möglichen Stichproben vom Umfang n aus einer Grundgesamtheit vom Umfang N:

Ohne Zurücklegen Mit Zurücklegen
Mit      
Ohne Berücksichtigung der Reihenfolge      

Definition der Wahrscheinlichkeit[Bearbeiten]

(Symmetrieprinzip oder Prinzip nach LAPLACE)

Jedes Ergebnis A aus der Ergebnismenge Ω sei gleich häufig. |A| ist die Zahl der Ergebnisse,

die durch A belegt werden (Anzahl der günstigen Ergebnisse), |Ω| ist die Zahl aller möglichen Ergebnisse. Es ist

Axiome der Wahrscheinlichkeiten (Kolmogoroff):

Gegeben sind zwei Ereignisse A,B ⊂ Ω.

  1. Nichtnegativität
  2. Normiertheit
  3. falls A und B disjunkt sind.

Additionssatz[Bearbeiten]

Für zwei Ereignisse A, B aus Ω gilt :

Für drei Ereignisse A, B, C aus Ω gilt analog :

Falls die Ereignisse disjunkt sind, gilt

Bedingte Wahrscheinlichkeit[Bearbeiten]

Unabhängigkeit von Ereignissen[Bearbeiten]

Ein Ereignis A ist unabhängig von B, wenn

Totale Wahrscheinlichkeit[Bearbeiten]

Sei A1 ...Ak eine disjunkte Zerlegung von Ω. Dann gilt für B ⊂ Ω:

.

BAYES Theorem[Bearbeiten]

Für zwei Ereignisse und mit lässt sich die Wahrscheinlichkeit von

unter der Bedingung, dass eingetreten ist, angeben durch die Wahrscheinlichkeit von

unter der Bedingung, dass eingetreten ist:

.

Hierbei ist

die (bedingte) Wahrscheinlichkeit des Ereignisses unter der Bedingung, dass eingetreten ist,
die (bedingte) Wahrscheinlichkeit des Ereignisses unter der Bedingung, dass eingetreten ist,
die A-priori-Wahrscheinlichkeit des Ereignisses und
die A-priori-Wahrscheinlichkeit des Ereignisses .


Endlich viele Ereignisse:

Wenn eine Zerlegung der Ergebnismenge in disjunkte Ereignisse ist, gilt für die A-posteriori-Wahrscheinlichkeit

.

Den letzten Umformungsschritt bezeichnet man auch als Marginalisierung.


Da ein Ereignis und sein Komplement stets eine Zerlegung der Ergebnismenge darstellen, gilt insbesondere

.

Zufallsvariablen und Verteilungsmodelle[Bearbeiten]

diskrete Zufallsvariablen[Bearbeiten]

Ein Merkmal X, das aufgrund zufälliger Ereignisse eine (endliche) Menge

von Ausprägungen x1, x2 ... annehmen kann, nennt man diskrete

Zufallsvariable X.

Eindimensionale Zufallsvariablen[Bearbeiten]

Wahrscheinlichkeitsfunktion:

Verteilungsfunktion:

Normiertheit:

Erwartungswert

Varianz

bzw. mit dem Verschiebungssatz

Standardabweichung

Varianz der Summe unabhängiger Zufallsvariablen

Mehrdimensionale Zufallsvariablen[Bearbeiten]

Einzelwahrscheinlichkeit

Kovarianz

bzw. mit dem Verschiebungssatz

Korrelationskoeffizient rxy nach Bravais-Pearson[Bearbeiten]

für metrisch skalierte Merkmale zweier statistischer Variablen x und y

mit als dem arithmetischen Mittel des Merkmals x. Mit Hilfe des Verschiebungssatzes:


Rangkorrelationskoeffizient nach Spearman[Bearbeiten]

  • für Variablen, die stark von der Normalverteilung abweichen
  • sowie ordinalskalierte Variablen

Nach Ordnung der einzelnen Beobachtungen von x bzw. y der Größe nach wird

jedem Wert wird seine Rangzahl rg(xi) und rg(yi) zugewiesen. Damit:

.

diskrete Verteilungsmodelle[Bearbeiten]

Binomialverteilung[Bearbeiten]

Für eine binomialverteilte Zufallsvariable X mit den Parametern n und θ (0 ≤ θ ≤ 1) lautet die Wahrscheinlichkeitsfunktion

Erwartungswert

Varianz

Hypergeometrische Verteilung[Bearbeiten]

Eine Zufallsvariable X ist hypergeometrisch verteilt mit den Parametern

N (Grundgesamtheit), M ("Kugeln der ersten Sorte") und n (Stichprobenumfang),

wenn ihre Wahrscheinlichkeitsfunktion lautet

Erwartungswert

Varianz

Der Bruch wird Korrekturfaktor genannt.

Poissonverteilung[Bearbeiten]

Wahrscheinlichkeitsfunktion ()


Erwartungswert und Varianz

stetige Zufallsvariablen[Bearbeiten]

Eine stetige Zufallsvariable kann in jedem beschränkten Intervall unendlich viele Ausprägungen annehmen.

Ihre Verteilung lässt sich durch eine Dichtefunktion f(x) beschreiben.

(f(x) ist hier keine Wahrscheinlichkeit, sondern eine Dichte !)

Verteilungsfunktion

  • Es gilt: P(X = a) = 0.
  • Wegen P(X = a) = 0 ist P(X ≤ a) = P(X < a) und P(X > a) = P(X ≥ a)

Die Dichtefunktion f(x) ist die erste Ableitung der Verteilungsfunktion, falls diese an der Stelle x differenzierbar ist.

  • Die Dichtefunktion f(a) kann auch größer als 1 werden.
  • Ausgehend von ist das p-Quantil x(p) der Wert x, der zu einer gegebenen Wahrscheinlichkeit p gehört. Speziell x(0,5) ist der Median.

Erwartungswert

falls E(X) existiert, d.h. nicht unendlich wird.

Varianz

wobei auch hier der Verschiebungssatz angewendet werden kann:

stetige Verteilungsmodelle[Bearbeiten]

Stetige Gleichverteilung (Rechteckverteilung)[Bearbeiten]

Dichtefunktion der Gleichverteilung im Intervall [a,b]

Erwartungswert

Varianz

Exponentialverteilung[Bearbeiten]

Dichtefunktion der Exponentialverteilung

Verteilungsfunktion

Erwartungswert

Varianz

.

Normalverteilung[Bearbeiten]

Für eine Zufallsvariable lautet die Dichtefunktion der NV

für

Normierung mit ergibt die Standardnormalverteilung mit der Dichtefunktion :

Anm.:Es wird auch die Schreibweise anstelle verwendet

Erwartungswert

Varianz

p-Quantil

Der zu einer gegebenen Wahrscheinlichkeit p zugehörige z-Wert z(p)

.

97,5%-Quantil der Standardnormalverteilung

Beispielsweise ist z(0,975) = 1,96.

Linearkombinationen normalverteilter Zufallsvariablen[Bearbeiten]

Für n normalverteilte Zufallsvariablen

ist die Linearkombination

ebenfalls normalverteilt mit dem Erwartungswert

.

Falls die stochastisch unabhängig sind, gilt für die Varianz

.

Die Varianz muss größer Null sein, deshalb muss zudem für mindestens ein gelten.

Verteilung des Stichprobendurchschnitts[Bearbeiten]

Sind die n Zufallsvariablen (i = 1, ... , n) sämtlich normalverteilt

mit gleichem μ und gleichem σ2, ist die Linearkombination

X mit a0 = 0, a1 = a2 = ... = an = 1/n, also :

normalverteilt dem Erwartungswert

und, falls die Xi (i = 1, ... , n) stochastisch unabhängig sind, mit der Varianz

.

CHI-Quadrat-verteilung[Bearbeiten]

Die seien unabhängige standardnormalverteilte Zufallsvariablen.

Dann ist die Verteilung der Zufallsvariablen

chi-quadrat verteilt mit n Freiheitsgraden

Erwartungswert:

Varianz

.

Anm.: Die Gruppe der Hypothesentests mit -Verteilung bezeichnet man als -Test.

Hierunter sind mehrere Tests zu verstehen:

Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.

Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.

Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.

t- (Student-) Verteilung[Bearbeiten]

Für die unabhängigen Variablen (standardnormalverteilt) und ist die Variable

t-verteilt mit n Freiheitsgraden.

Erwartungswert

für

Varianz

für


Fisher- Verteilung[Bearbeiten]

Für die unabhängigen Variablen und ist die Verteilung der Variablen

Fisher- oder F-verteilt mit den Freiheitsgraden m und n.

Erwartungswert

für

Varianz

für


Approximation von Verteilungen[Bearbeiten]

Gesuchte Verteilung Approximation durch
Binomial Poisson Normal
Binomial
---


Hypergeometrische

über Binomialverteilung

Poisson
--- ---
χ2-Verteilung
--- ---
t-Verteilung
--- ---
F-Verteilung
--- ---

Grenzwertsatz[Bearbeiten]

Gesetz der großen Zahlen[Bearbeiten]

Für ein beliebig kleines c > 0 gilt

für

Theorem von Bernoulli[Bearbeiten]

Die relative Häufigkeit, mit der ein Ereignis A bei n unabhängigen Wiederholungen

eines Zufallsereignisses eintritt, konvergiert nach Wahrscheinlichkeit gegen P(A)

Hauptsatz der Statistik[Bearbeiten]

Für eine Zufallsvariable X mit der Verteilungsfunktion F(x) gilt für die Verteilungsfunktion Fn(x)

für die unabhängigen wie identisch wie X verteilten X1…Xn (x∈ R)

(sup: Maximale Abweichung zwischen und ).

Zentraler Grenzwertsatz[Bearbeiten]

Für unabhängig identisch verteilte Zufallsvariablen X1…Xn mit E(Xi ) = μ

und Var(Xi ) =σ2 > 0 konvergiert die Verteilungsfunktion Fn(z) = P(Zn≤z)

der standardisierten Summe

für n → ∞ an jeder Stelle gegen die Verteilungsfunktion der Standardnormalverteilung

Grenzwertsatz von De Moivre[Bearbeiten]

Die Verteilung der standardisierten absoluten Häufigkeit der Standardnormalverteilung

konvergiert für n → ∞ gegen eine Standardnormalverteilung.

Deskriptive Statistik[Bearbeiten]

Skalenniveaus[Bearbeiten]

Nominalskala[Bearbeiten]

Die Ausprägungen des nominalskalierten Merkmals können nicht geordnet werden,

man kann sie nur vergleichen und abzählen.

Es handelt sich um qualitative Merkmale. Erhalten die Ausprägungen Ziffern zugeordnet,

handelt es sich nur um eine Verschlüsselung (Codierung): 1 = männlich, 2 = weiblich.

Ordinalskala[Bearbeiten]

Zwischen den Ausprägungen des ordinalskalierten (rangskalierten) Merkmals existiert eine Beziehung

der Form mehr oder weniger, < oder >, besser oder schlechter.

Eine Quotientenbildung macht wenig Sinn (Beispiel Noten: 1, 2, 3, 4, 5).

Intervallskala[Bearbeiten]

Die Abstände zwischen den Ausprägungen des (quantitativen) Merkmals der Intervallskala

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen.

Beispiel: Kinderzahl, Temperatur.

Verhältnissskala[Bearbeiten]

Sowohl die Abstände als auch Verhältnisse zwischen den Ausprägungen des (quantitativen) Merkmals

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen. Beispiel: Einkommen.

Zweig-Blätter-(stem-leaf-) Diagramm[Bearbeiten]

Die linke Spalte enthält als „Stämme“ die Äquivalenzklassen, in die die auf der rechten Seite als „Blätter“

dargestellten Merkmale eingeteilt werden. Beispiel: Gegeben sind die Werte 0,3 0,4 2,5 2,5 2,6 2,7 2,8 3,5 3,7.

Wählt man die natürlichen Zahlen als Klasseneinteilung, ergibt sich folgendes Stamm-Blatt-Diagramm:
3 5 7
2 5 5 6 7 8
1
0 3 4

Lageparameter[Bearbeiten]

Arithmetisches Mittel[Bearbeiten]

Median (Zentralwert)[Bearbeiten]

Sind die Beobachtungswerte der Größe nach geordnet, ist der Median z die Stelle, die die Teilgesamtheit in zwei gleiche Hälften teilt.

geometrisches Mittel[Bearbeiten]

harmonisches Mittel[Bearbeiten]

Modalwert[Bearbeiten]

Der am häufigsten auftretende Wert

Varianz[Bearbeiten]

Grundgesamtheit:

Stichprobe:

Verschiebungssatz[Bearbeiten]

Für jedes gilt

Damit erhält man als Varianz

Variationskoeffizient[Bearbeiten]


Konzentrationsmasse[Bearbeiten]

Konzentrationsrate[Bearbeiten]

Die Konzentrationsrate CRn ist die Summe der Marktanteile der n größten Unternehmen eines relevanten Marktes. Im GWB werden die Raten CR1, CR3 und CR5 herangezogen.

Lorenzkurve[Bearbeiten]

Für eine geordnete Urliste x1 ≤ x2… ≤xn trägt man die kumulierte relative Merkmalssumme

über den Anteil der Merkmalsträger auf.

Liegen die Merkmale in gruppierter Form vor, trägt man die kumulierte relative Merkmalssumme

über der Häufigkeit auf.

Zwischen (0;0) und (1;1) wird die Winkelhalbierende des Koordinatensystems eingetragen.

Gini-Koeffizient[Bearbeiten]

Als Ginikoeffizient G bezeichnet man das Verhältnis der Fläche zwischen Winkelhalbierender und der Lorenzkurve

zur Gesamtfläche unter der Winkelhalbierenden (= 1/2).

Die Fläche unterhalb der Lorenzkurve kann man einfach aus Teil-Trapezflächen zusammensetzen:

(p0 = 0 ; q0 = 0):


Herfindahl-Index[Bearbeiten]

Parameterschätzung[Bearbeiten]

Konfidenzintervall für den Erwartungswert μ[Bearbeiten]

Normalverteiltes Merkmal mit bekannter Varianz[Bearbeiten]

Das Zufallsintervall enthält mit einer Wahrscheinlichkeit 1-α den Parameter:

Konfidenzintervall

(Quantil z aus Normalverteilungstabelle)

Normalverteiltes Merkmal mit unbekannter Varianz[Bearbeiten]

Für normalverteilte Merkmale und unbekannter Varianz muss die Varianz durch s2 geschätzt werden.

.

Konfidenzintervall

(Quantil aus der t-Verteilungstabelle bei Freiheitsgrad n-1).

Merkmal mit unbekannter Verteilung und bekannter Varianz[Bearbeiten]

Konfidenzintervall

für n > 30.


Merkmal mit unbekannter Verteilung und unbekannter Varianz[Bearbeiten]

Konfidenzintervall

für n > 50

Konfidenzintervalle für den Anteilswert einer dichotomen Grundgesamtheit[Bearbeiten]

Modell mit Zurücklegen[Bearbeiten]

Beschreibung durch den geschätztem Anteilswert . Für n > 100 und )

erhält man das 1-α-Konfidenzintervall für p durch eine Approximation der Binomialverteilung mit Hilfe der Normalverteilung:

Modell ohne Zurücklegen[Bearbeiten]

Für kann die hypergeometrische Verteilung durch die Normalverteilung approximiert werden:


-Konfidenzintervall für :


Hypothesentests[Bearbeiten]

Vorgehen beim Hypothesentest[Bearbeiten]

I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit

II. Aufstellen der Nullhypothese

III. Festlegen der Testfunktion T

IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)


Fällt die Prüfgröße in den Bereich [u; o],

wird H0 nicht abgelehnt. Es soll sein

(beachte: ein- oder zweiseitig)

α : Signifikanzniveau oder α-Fehler


V. Stichprobe erheben

VI. Entscheidung treffen


H0 ist wirklich wahr H1 ist wirklich wahr
H0 wird beibehalten richtige Entscheidung (1-α) Fehler 2. Art (β-Fehler)
H1 wird angenommen Fehler 1. Art (α-Fehler) richtige Entscheidung (1-β)

Tests auf Lageparameter (Erwartungswert, Median, Anteilswert)[Bearbeiten]

Test auf Erwartungswert[Bearbeiten]

Test
zweiseitig μ = μ0 μ ≠ μ0
rechtsseitig μ ≤ μ0 μ > μ0
linksseitig μ ≥ μ0 μ < μ0


1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30

Testfunktion
(Gauß-Test):
Ablehnungsbereich
zweiseitig  
rechtsseitig  
linksseitig  

2. X ist normalverteilt, σ ist unbekannt bei beliebigem n

Testfunktion
(t-Test).
Ablehnungsbereich
zweiseitig  
rechtsseitig  
linksseitig  

3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30

Testfunktion
(Gauß-Test) .
Ablehnungsbereich
zweiseitig  
rechtsseitig  
linksseitig  

Vorzeichentest[Bearbeiten]

Einstichprobenproblem[Bearbeiten]

Einseitig Zweiseitig

Die Stichprobenwerte, die größer als der hypothetische Median sind, bekommen ein "+" zugeordnet;

Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.

Zweistichprobenproblem[Bearbeiten]

Die Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar muss unabhängig

vom Wertepaar sein.

Besitzen beide Grundgesamtheiten den gleichen Median, gilt .

Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:

Einseitig Zweiseitig

Die Wertepaare der Stichproben, bei denen gilt, bekommen ein "+" zugeordnet;


Wertepaare, für die gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt

und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):

mit

Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.

Bei Gültigkeit der Nullhypothese ist die Summe der positiven Differenzen binomialverteilt mit ,

da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)

verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.

Approximation durch die Normalverteilung

Mit nähert sich die Binomialverteilung einer Normalverteilung mit ,

als Faustregel ().

Mit bzw. ist die z-standardisierte Größe

näherungsweise standardnormalverteilt.

Bindungen (Nulldifferenzen) Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert

oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),

die man so behandeln kann:

  • Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
  • Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
  • Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.


Test auf Anteilswert (Binomialtest)[Bearbeiten]

Der Anteilswert θ wird geschätzt durch

.

Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:

Test
zweiseitig
rechtsseitig
linksseitig


für n > 30 , nθ0 ≥ 10 n(1-θ0) ≥ 10
kann man durch die Gauß-Verteilung approximieren:
Testfunktion
(Gauß-Test) .
Ablehnungsbereich
zweiseitig  
rechtsseitig  
linksseitig  
für n < 30 oder nθ0 < 10 oder n(1-θ0) < 10
ist der exakte Binomialtest anzuwenden:
Testfunktion

Die Teststatistik gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang aufgetreten ist.

Unter der Nullhypothese ist die Teststatistik -verteilt, das heißt

.
Ablehnungsbereich

Teststatistik für den Binomialtest, die roten Balken gehören zum kritischen Bereich.

Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau in der Regel nicht eingehalten werden.

Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau gilt .

Für den zweiseitigen Test werden daher als kritische Werte das größte und das kleinste bestimmt, für die gilt

  • und
  • .

Das exakte Signifikanzniveau ergibt sich als

.

Für die beiden einseitigen Tests wird analog verfahren.

Test Kritische Werte Kritischer Bereich Grenze(n)
zweiseitig   und
rechtsseitig   c = kleinster Wert, für den
linksseitig c = größter Wert, für den

Tests auf Streuung[Bearbeiten]

Test auf Varianz[Bearbeiten]

Test
zweiseitig  
rechtsseitig    
linksseitig    


1. X ist normalverteilt, μ ist unbekannt, n beliebig

Testfunktion
Ablehnungsbereich
zweiseitig   oder
rechtsseitig  
linksseitig  

2. X ist normalverteilt, μ ist bekannt, n beliebig

Testfunktion
Ablehnungsbereich
zweiseitig   oder
rechtsseitig  
linksseitig  

Tests auf Zusammenhangs- und Assoziationsparameter[Bearbeiten]

Chi-Quadrat-Unabhängigkeitstest[Bearbeiten]

Nullhypothese
: Die Merkmale und sind stochastisch unabhängig.

Die Beobachtungen der Merkmale und liegen paarweise in bzw. Klassen vor.

Es gibt insgesamt paarweise Beobachtungen von und , die sich auf Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:
Merkmal Summe Σ
Merkmal 1 2 k r nj.
1 n11 n12 ... n1k ... n1r n1.
2 n21 n22 n2k n2r n2.
j njk nj.
m nm1 nm2 nmk nmr nm.
Summe Σ n.1 n.2 n.k n.r n

Absolute Randhäufigkeiten bzw.

und


Prüfgröße für den Unabhängigkeitstest:

Mit :

wird abgelehnt, wenn ist.

Anpassungs- oder Verteilungstests[Bearbeiten]

Chi-Quadrat-Anpassungs- oder Verteilungstest[Bearbeiten]

Die Wahrscheinlichkeiten eines Merkmals seien in der Grundgesamtheit unbekannt.

Nullhypothese: : Das Merkmal besitzt die Wahrscheinlichkeitsverteilung

Für unabhängige Beobachtungen des Merkmals wird die Zahl

der Beobachtungen in der -ten Klasse ist die beobachtete Häufigkeit .

Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit ,

dass eine Ausprägung von in die Kategorie fällt. Die unter zu erwartende Häufigkeit ist:

Die Prüfgröße (Größe der Abweichung)

ist bei ausreichend großen annähernd chi-Quadrat-verteilt mit Freiheitsgraden.

wird abgelehnt, wenn gilt.


Kolmogorow-Smirnow-Anpassungstest[Bearbeiten]

Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.

Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.

(Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F0.)
(Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F0.)

Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion mit mittels der Teststatistik

(sup: Supremum)

Die Teststatistik ist unabhängig von der hypothetischen Verteilung F0.

Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.

Einstichprobenproblem[Bearbeiten]

Von einer reellen Zufallsvariablen liegen aufsteigend sortierte Beobachtungswerte () vor.

Von diesen Beobachtungen wird die relative Summenhäufigkeit mit der entsprechenden hypothetischen

Verteilung der Grundgesamtheit F0(xi) verglichen. Voraussetzung: ist stetig.

Für jedes werden die absoluten Differenzen

und :

berechnet, wobei gesetzt wird. Wenn die größte Differenz aus allen Differenzen ,

einen kritischen Wert übersteigt, wird die Hypothese abgelehnt.

Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere werden sie über angenähert.


Zweistichprobenproblem[Bearbeiten]

Liegt nun zusätzlich zur Zufallsvariablen eine entsprechende Zufallsvariable vor (mit geordneten Werten ),

so kann durch den Zweistichprobentest überprüft werden, ob und derselben Verteilungsfunktion folgen.

Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen bzw. ermittelt:

und  : .


Die Nullhypothese wird abgelehnt, falls den kritischen Wert überschreitet.

Für kleine Werte von und greift man auf Tabellen zurück.

Für große Werte von n und m wird die Nullhypothese abgelehnt, falls

,

wobei für große und näherungsweise als berechnet werden kann.

Varianzanalyse[Bearbeiten]

univariate Varianzanalyse (ANOVA)[Bearbeiten]

Man untersucht man den Einfluss einer unabhängigen Variable (Faktor) mit k verschiedenen Stufen (Gruppen) auf die Ausprägungen einer Zufallsvariablen.

Dazu werden die k Mittelwerte der Ausprägungen für die Gruppen miteinander verglichen, und zwar vergleicht man die Varianz zwischen den Gruppen mit der Varianz innerhalb der Gruppen.

Weil sich die totale Varianz aus den zwei genannten Komponenten zusammensetzt, spricht man von Varianzanalyse.

Die einfaktorielle ANOVA ist die Verallgemeinerung des t-Tests bei mehr als zwei Gruppen. Für k=2 ist sie äquivalent mit dem t-Test.

Es sei der Erwartungswert der abhängigen Variable in der i. Gruppe.


(Es besteht kein Unterschied zwischen den Erwartungswerten der Gruppen.)


(Es besteht zwischen mindestens zwei Erwartungswerten ein Unterschied.)


→ Wir wissen dann nur mit einer bestimmten Wahrscheinlichkeit, dass mindestens zwei Ausprägungen einen bedeutsamen Unterschied aufweisen.

Effektdarstellung :

Darin sind:
Xij: Zielvariable; annahmegemäß in den Gruppen normalverteilt
  k: Anzahl der Faktorstufen des betrachteten Faktors
  ni: Stichprobenumfänge für die einzelnen Faktorstufen
  μ: arithmetisches Mittel der Erwartungswerte in den Gruppen
 αi: Effekt der i-ten Faktorstufe
εij: Störvariablen, unabhängig und normalverteilt mit Erwartungswert 0 und gleicher (unbekannter) Varianz σ2.

Erwartungswert in der i. Gruppe:

Betrachtung der Quadratsummen (Variabiliät)

Die gesamte Variabilität QST (gesamte quadratische Abweichung vom Mittelwert) lässt sich in zwei Teile zerlegen:

Der erste Teil QSA (Gruppenzugehörigkeit) entspricht der ('Inter-')Variabilität zwischen den Gruppen.

Der Rest QSE entspricht der Variabilität innerhalb der Gruppen (gesamte 'Intra'-Abweichung von den Mittelwerten in den Gruppen, der 'Zufall'):

Die zwei Quadratsummen QSA und QSE sind stochastisch unabhängig.

Im Fall von k Gruppen mit gleichem Umfang b=n/k gilt unter der Nullhypothese außerdem:

folgt einer Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden,

und

folgt einer Chi-Quadrat-Verteilung mit n-k Freiheitsgraden.

mittlere Quadratsummen:

und :

Prüfgröße:

Gruppen gleicher Größe[Bearbeiten]

Im Falle Gruppen gleicher Größe ist F unter der Nullhypothese F-verteilt

mit Freiheitsgraden im Zähler und Freiheitsgraden im Nenner.

Wenn die Prüfgröße

signifikant (d.h. wird, unterscheiden sich mindestens zwei Faktoren ('Gruppen') voneinander.

In Post-Hoc-Tests kann dann berechnet werden, zwischen welchen einzelnen Gruppen der Unterschied liegt.

Regressionsrechnung[Bearbeiten]

Lineare Regression[Bearbeiten]

Methode der kleinsten Quadrate

bezüglich a und b.

Nach Ausmultiplikation, Ableiten und Nullsetzen

erhält man die gesuchten Regressionskoeffizienten als die Lösungen

und

wobei .

Mit dem Verschiebungssatz kann man auch so ermitteln:

Schätzungen

Residuen ri :

Stichprobenvarianz der Residuen:

Bestimmtheitsmaß

mit dem Verschiebungssatz :


Varianz der Residuen

Variablentransformation[Bearbeiten]

Funktion u v

Die Methode kann auf weitere Parameter erweitert werden.

Zeitreihenanalyse[Bearbeiten]

Komponentenunterteilung bei Zeitreihen[Bearbeiten]

Mögliche Aufteilung einer Zeitreihe in Komponenten:

  • Trend Q
  • Konjunkturelle Schwankung K
  • Saisonale Schwankung S
  • Restschwankung r

Bei Unabhängigkeit dieser Komponenten kann man ein additives Modell annehmen:

Nehmen beispielsweise zyklische Schwankungen mit steigendem Trend zu, könnte ein multiplikatives Modell

angebracht sein. Variablentransformation durch Logarithmieren


Schätzung des Trends durch Regression[Bearbeiten]

‘‘‘Regressionsmodell‘‘‘

bzw.

mit den Lösungen

und

.

Die Trendwerte Qt sind dann

.

Nichtlinearer Trendverlauf: Lösung über Variablentransformation oder Anwendung eines nichtlinearen Regressionsansatzes

Schätzung der Saisonkomponente[Bearbeiten]

Additives Modell

Nach Schätzung der Trendkomponente Qt bleibt noch die Abweichung

und

dt: trendbereinigter Zeitreihenwert

Bestimmung der saisonalen Komponente St über Fourieranalyse oder (einfacher)

Bildung des arithmetischen Durchschnitts aller Werte dt, die die gleiche Saison betreffen,

als Schätzung für die saisonale Komponente. Dann bleibt die nichterklärte Restschwankung

Prognose für den Zeitpunkt T+k (mit St als Wert in der Saison T+k)


Schätzung der glatten Komponente mit gleitenden Mittelwerten[Bearbeiten]

Lässt sich die Trendkomponente des Zeitreihenmodells offensichtlich durch keine funktionale lineare oder

nichtlineare Beziehung darstellen, kann man eine glatte Komponente mit Hilfe gleitender Mittelwerte bestimmen.

einfacher gleitender Mittelwert[Bearbeiten]

Beispiel: Mittelwert dritter Ordnung:

Die Ordnung des Mittelwerts sollte so gewählt werden, daß möglichst genau eine Periode umfasst wird.

Zur Prognose über den Beobachtungszeitraum hinaus sind gleitende Mittelwerte bedingt geeignet,

da die Randwerte der Zeitreihe nicht geschätzt werden.

gewichteter gleitender Mittelwert[Bearbeiten]

Beispiel: Mittelwert dritter Ordnung mit z.B.

Exponentielle Glättung[Bearbeiten]

Gewichtung durch den Glättungsfaktor mit :

Geglätteter Schätzwert y*t als gewichteter Durchschnitt aus dem aktuellen Zeitreihenwert yt

und dem Schätzwert der Vorperiode y*t-1 (y*0 geeignet wählen):

Auflösung der Rekursivität:

Für die Wahl des Glättungsfaktors wird häufig 0,2 bis 0,3 empfohlen. Man kann aber auch mit Hilfe der Regressionsanalyse den Glättungsfaktor schätzen.


Exponentielle Glättung bei trendbehafteten Werten[Bearbeiten]

Bei Trend werden die Zeitreihenwerte systematisch unter- bzw. überschätzt. Abhilfe bieten ggf. gleitende Durchschnitte zweiter Ordung.

Die bereits einmal geglätteten Werte erneut einer Glättung unterzogen. Man erhält den Schätzwert , der sich analog zu oben berechnet aus

Für einen brauchbaren Prognosewert für Periode t+1 muss man dann bestimmen

.

Symbolverzeichnis[Bearbeiten]

allgemein[Bearbeiten]

Symbol Verwendung
A,B Ereignisse
Ω = {A,B,C...} Ereignisraum
|A| Anzahl der Ereignisse A
P(A) Wahrscheinlichkeit für das Eintreten von A
∪ ∩ Und-Verknüpfung (Konjunktion) / Oder-Verknüpfung (Disjunktion)
P(A | B) Bedingte Wahrscheinlichkeit (A wenn B)
E(X) Erwartungswert von X
f(X) Wahrscheinlichkeitsfunktion
F(X) Verteilungsfunktion
N Grundgesamtheit
n Stichprobe
X Zufallsvariable
Varianz von X
Θ Anteilswert einer Grundgesamtheit

Verteilungsmodelle[Bearbeiten]

Symbol Verwendung
Binomialverteilung
F(m,n) Fisherverteilung
Hypergeometrische Verteilung
Poissonverteilung
Normalverteilung
t(n) t- (Student-) Verteilung
Standardnormalverteilung

Tabellen[Bearbeiten]

Binomialverteilung (Wahrscheinlichkeitsfunktion)

n

x
p=
0,01
...
0,05

0,1

0,2

0,25

0,3

0,5
2 0 0,9801 0,9025 0,81 0,64 0,5625 0,49 0,25
1 0,0198 0,095 0,18 0,32 0,375 0,42 0,5
2 0,0001 0,0025 0,01 0,04 0,0625 0,09 0,25
3 0 0,9703 0,8574 0,729 0,512 0,4219 0,343 0,125
1 0,0294 0,1354 0,243 0,384 0,4219 0,441 0,375
2 0,0003 0,0071 0,027 0,0960 0,1406 0,189 0,375
3 0 0,0001 0,001 0,008 0,0156 0,027 0,125
4 0 0,9606 0,8145 0,6561 0,4096 0,3164 0,2401 0,0625
1 0,0388 0,1715 0,2916 0,4096 0,4219 0,4116 0,25
2 0,0006 0,0135 0,0486 0,1536 0,2109 0,2646 0,375
3 0 0,0005 0,0036 0,0256 0,0469 0,0756 0,25
4 0 0 0,0001 0,0016 0,0039 0,0081 0,0625
5 0 0,951 0,7738 0,5905 0,3277 0,2373 0,1681 0,0313
1 0,048 0,2036 0,3281 0,4096 0,3955 0,3602 0,1563
2 0,001 0,0214 0,0729 0,2048 0,2637 0,3087 0,3125
3 0 0,0011 0,0081 0,0512 0,0879 0,1323 0,3125
4 0 0 0,0005 0,0064 0,0146 0,0284 0,1563
5 0 0 0 0,0003 0,001 0,0024 0,0313
6 0 0,9415 0,7351 0,5314 0,2621 0,178 0,1176 0,0156
1 0,0571 0,2321 0,3543 0,3932 0,356 0,3025 0,0938
2 0,0014 0,0305 0,0984 0,2458 0,2966 0,3241 0,2344
3 0 0,0021 0,0146 0,0819 0,1318 0,1852 0,3125
4 0 0,0001 0,0012 0,0154 0,033 0,0595 0,2344
5 0 0 0,0001 0,0015 0,0044 0,0102 0,0938
6 0 0 0 0,0001 0,0002 0,0007 0,0156
7 0 0,9321 0,6983 0,4783 0,2097 0,1335 0,0824 0,0078
1 0,0659 0,2573 0,372 0,367 0,3115 0,2471 0,0547
2 0,002 0,0406 0,124 0,2753 0,3115 0,3177 0,1641
3 0 0,0036 0,023 0,1147 0,173 0,2269 0,2734
4 0 0,0002 0,0026 0,0287 0,0577 0,0972 0,2734
5 0 0 0,0002 0,0043 0,0115 0,025 0,1641
6 0 0 0 0,0004 0,0013 0,0036 0,0547
7 0 0 0 0 0,0001 0,0002 0,0078


Binomialverteilung (Wahrscheinlichkeitsfunktion)

n

x
p=
0,01
...
0,05

0,1

0,2

0,25

0,3

0,5
8 0 0,9227 0,6634 0,4305 0,1678 0,1001 0,0576 0,0039
1 0,0746 0,2793 0,3826 0,3355 0,267 0,1977 0,0313
2 0,0026 0,0515 0,1488 0,2936 0,3115 0,2965 0,1094
3 0,0001 0,0054 0,0331 0,1468 0,2076 0,2541 0,2188
4 0 0,0004 0,0046 0,0459 0,0865 0,1361 0,2734
5 0 0 0,0004 0,0092 0,0231 0,0467 0,2188
6 0 0 0 0,0011 0,0038 0,01 0,1094
7 0 0 0 0,0001 0,0004 0,0012 0,0313
8 0 0 0 0 0 0,0001 0,0039
9 0 0,9135 0,6302 0,3874 0,1342 0,0751 0,0404 0,002
1 0,083 0,2985 0,3874 0,302 0,2253 0,1556 0,0176
2 0,0034 0,0629 0,1722 0,302 0,3003 0,2668 0,0703
3 0,0001 0,0077 0,0446 0,1762 0,2336 0,2668 0,1641
4 0 0,0006 0,0074 0,0661 0,1168 0,1715 0,2461
5 0 0 0,0008 0,0165 0,0389 0,0735 0,2461
6 0 0 0,0001 0,0028 0,0087 0,021 0,1641
7 0 0 0 0,0003 0,0012 0,0039 0,0703
8 0 0 0 0 0,0001 0,0004 0,0176
9 0 0 0 0 0 0 0,002
10 0 0,9044 0,5987 0,3487 0,1074 0,0563 0,0282 0,001
1 0,0914 0,3151 0,3874 0,2684 0,1877 0,1211 0,0098
2 0,0042 0,0746 0,1937 0,302 0,2816 0,2335 0,0439
3 0,0001 0,0105 0,0574 0,2013 0,2503 0,2668 0,1172
4 0 0,001 0,0112 0,0881 0,146 0,2001 0,2051
5 0 0,0001 0,0015 0,0264 0,0584 0,1029 0,2461
6 0 0 0,0001 0,0055 0,0162 0,0368 0,2051
7 0 0 0 0,0008 0,0031 0,009 0,1172
8 0 0 0 0,0001 0,0004 0,0014 0,0439
9 0 0 0 0 0 0,0001 0,0098
10 0 0 0 0 0 0 0,001


Weitere Werte können mittels =BINOMVERT(x;n;p;0) bei Tabellenkalkulationsprogrammen

oder der R-Funktion dbinom(x, n , p) bestimmt werden

Standard-Normalverteilung (Verteilungsfunktion)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5 0,504 0,508 0,512 0,516 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,591 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,648 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,67 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,695 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,719 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,758 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,791 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,834 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,877 0,879 0,881 0,883
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,898 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,937 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,975 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,983 0,9834 0,9838 0,9842 0,9846 0,985 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,989
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,992 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,994 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,996 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,997 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,998 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,999 0,999
3,1 0,999 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


Zur Bildung von z ist der Wert von linker Spalte und oberer Zeile zu addieren.

Ablesebeispiel:

weitere Werte: =NORM.S.VERT(z;WAHR) bzw. (R-Aufruf): pnorm(z)

-Verteilung (Quantile)
n p=
0,005
...
0,01
...
0,025

0,05

0,1

0,5

0,9

0,95

0,975

0,99

0,995
1 0,000 0,000 0,001 0,004 0,016 0,455 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 1,386 4,605 5,991 7,378 9,21 10,597
3 0,072 0,115 0,216 0,352 0,584 2,366 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 3,357 7,779 9,488 11,143 13,277 14,86
5 0,412 0,554 0,831 1,145 1,61 4,351 9,236 11,07 12,833 15,086 16,75
6 0,676 0,872 1,237 1,635 2,204 5,348 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,69 2,167 2,833 6,346 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,18 2,733 3,49 7,344 13,362 15,507 17,535 20,09 21,955
9 1,735 2,088 2,7 3,325 4,168 8,343 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,94 4,865 9,342 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 10,341 17,275 19,675 21,92 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 11,34 18,549 21,026 23,337 26,217 28,3
13 3,565 4,107 5,009 5,892 7,042 12,34 19,812 22,362 24,736 27,688 29,819
14 4,075 4,66 5,629 6,571 7,79 13,339 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 14,339 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 15,338 23,542 26,296 28,845 32 34,267
17 5,697 6,408 7,564 8,672 10,085 16,338 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,39 10,865 17,338 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 18,338 27,204 30,144 32,852 36,191 38,582
20 7,434 8,26 9,591 10,851 12,443 19,337 28,412 31,41 34,17 37,566 39,997
21 8,034 8,897 10,283 11,591 13,24 20,337 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 21,337 30,813 33,924 36,781 40,289 42,796
23 9,26 10,196 11,689 13,091 14,848 22,337 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 23,337 33,196 36,415 39,364 42,98 45,559
25 10,52 11,524 13,12 14,611 16,473 24,337 34,382 37,652 40,646 44,314 46,928
26 11,16 12,198 13,844 15,379 17,292 25,336 35,563 38,885 41,923 45,642 48,29
27 11,808 12,879 14,573 16,151 18,114 26,336 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 27,336 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 28,336 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 29,336 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 30,336 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 31,336 42,585 46,194 49,48 53,486 56,328
33 15,815 17,074 19,047 20,867 23,11 32,336 43,745 47,4 50,725 54,776 57,648
34 16,501 17,789 19,806 21,664 23,952 33,336 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 34,336 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 35,336 47,212 50,998 54,437 58,619 61,581
37 18,586 19,96 22,106 24,075 26,492 36,336 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 37,335 49,513 53,384 56,896 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 38,335 50,66 54,572 58,12 62,428 65,476
40 20,707 22,164 24,433 26,509 29,051 39,335 51,805 55,758 59,342 63,691 66,766


p = 1−α

weitere Werte: =CHIQU.INV(n;p) bzw. (R-Aufruf): qchisq(p,n)

Kritische Werte für den Kolmogorov-Smirnov- (KS-) Anpassungstest
n D0,20 D0,10 D0,05 D0,02 D0,01 D0,005
1 0,9 0,95 0,975 0,99 0,995 0,9975
2 0,68377 0,77638 0,84187 0,89998 0,92925 0,94995
3 0,56481 0,63604 0,70758 0,78452 0,82895 0,86419
4 0,49265 0,56521 0,62392 0,68884 0,73417 0,77628
5 0,44697 0,50944 0,56326 0,62715 0,66848 0,70533
6 0,41035 0,46799 0,51925 0,57738 0,61655 0,65277
7 0,38145 0,43606 0,48341 0,53841 0,57576 0,60966
8 0,35828 0,40962 0,45426 0,50652 0,54174 0,5742
9 0,33907 0,38746 0,43 0,47957 0,51327 0,54435
10 0,32257 0,36866 0,40924 0,4566 0,48889 0,51864
11 0,30825 0,35241 0,39121 0,43668 0,46766 0,49631
12 0,29573 0,33814 0,37542 0,41916 0,449 0,47664
13 0,28466 0,32548 0,36142 0,4036 0,43243 0,45914
14 0,27477 0,31416 0,34889 0,38968 0,41758 0,44345
15 0,26585 0,30397 0,33759 0,37711 0,40416 0,42927
16 0,25774 0,29471 0,32733 0,36569 0,39197 0,41637
17 0,25035 0,28626 0,31796 0,35526 0,38083 0,40458
18 0,24356 0,2785 0,30935 0,34568 0,37059 0,39374
19 0,23731 0,27135 0,30142 0,33684 0,36114 0,38373
20 0,23152 0,26473 0,29407 0,32864 0,35238 0,37445
21 0,22614 0,25857 0,28724 0,32103 0,34423 0,36582
22 0,22111 0,25283 0,28086 0,31392 0,33663 0,35776
23 0,21642 0,24746 0,2749 0,30727 0,32951 0,35021
24 0,21201 0,24241 0,2693 0,30102 0,32283 0,34313
25 0,20786 0,23767 0,26404 0,29515 0,31654 0,33646
26 0,20396 0,2332 0,25907 0,28961 0,3106 0,33016
27 0,20026 0,22897 0,25437 0,28437 0,30499 0,32421
28 0,19676 0,22497 0,24993 0,2794 0,29968 0,31857
29 0,19344 0,22117 0,24571 0,27469 0,29463 0,31322
30 0,19029 0,21756 0,2417 0,27021 0,28984 0,30813
31 0,18728 0,21412 0,23788 0,26595 0,28527 0,30328
32 0,18442 0,21084 0,23424 0,26188 0,28091 0,29865
33 0,18168 0,20771 0,23076 0,25799 0,27675 0,29423
34 0,17906 0,20471 0,22743 0,25428 0,27276 0,29
35 0,17655 0,20184 0,22424 0,25072 0,26895 0,28595


Für kann näherungsweise die Formel verwendet werden.

Werte berechnet nach George Marsaglia et al. “Evaluating Kolmogorov’s Distribution”. Journal of Statistical Software, 8(18):1-4, Nov 2003.

F-Verteilung (rechtsseitige Quantile)

n1
p
n2=
1
n2=
2
...
3

4

5

6

7

8

9
1

0,950
0,975
0,990
0,995

161,45
647,79
4052,2
16211
18,513
38,506
98,503
198,5
10,128
17,443
34,116
55,552
7,709
12,218
21,198
31,333
6,608
10,007
16,258
22,785
5,987
8,813
13,745
18,635
5,591
8,073
12,246
16,236
5,318
7,571
11,259
14,688
5,117
7,209
10,561
13,614
2

0,950
0,975
0,990
0,995

199,5
799,5
4999,5
20000
19
39
99
199
9,552
16,044
30,817
49,8
6,944
10,649
18
26,284
5,786
8,434
13,274
18,314
5,143
7,26
10,925
14,544
4,737
6,542
9,547
12,404
4,459
6,059
8,649
11,042
4,256
5,715
8,022
10,107
3

0,950
0,975
0,990
0,995

215,71
864,16
5403,4
21615
19,164
39,165
99,166
199,17
9,277
15,439
29,457
47,467
6,591
9,979
16,694
24,259
5,409
7,764
12,06
16,53
4,757
6,599
9,78
12,917
4,347
5,89
8,451
10,882
4,066
5,416
7,591
9,596
3,863
5,078
6,992
8,717
4

0,950
0,975
0,990
0,995

224,58
899,58
5624,6
22500
19,296
39,298
99,299
199,3
8,941
14,735
27,911
44,838
6,094
9,074
14,976
21,622
4,818
6,757
10,289
13,961
4,099
5,523
7,976
10,391
3,637
4,761
6,62
8,38
3,313
4,243
5,734
7,104
3,073
3,868
5,111
6,227
5

0,950
0,975
0,990
0,995

230,16
921,85
5763,6
23056
19,296
39,298
99,299
199,3
9,013
14,885
28,237
45,392
6,256
9,364
15,522
22,456
5,05
7,146
10,967
14,94
4,387
5,988
8,746
11,464
3,972
5,285
7,46
9,522
3,687
4,817
6,632
8,302
3,482
4,484
6,057
7,471
6

0,950
0,975
0,990
0,995

233,99
937,11
5859
23437
19,33
39,331
99,333
199,33
8,941
14,735
27,911
44,838
6,163
9,197
15,207
21,975
4,95
6,978
10,672
14,513
4,284
5,82
8,466
11,073
3,866
5,119
7,191
9,155
3,581
4,652
6,371
7,952
3,374
4,32
5,802
7,134
7

0,950
0,975
0,990
0,995

236,77
948,22
5928,4
23715
19,353
39,355
99,356
199,36
8,887
14,624
27,672
44,434
6,094
9,074
14,976
21,622
4,876
6,853
10,456
14,2
4,207
5,695
8,26
10,786
3,787
4,995
6,993
8,885
3,5
4,529
6,178
7,694
3,293
4,197
5,613
6,885
8

0,950
0,975
0,990
0,995

238,88
956,66
5981,1
23925
19,371
39,373
99,374
199,37
8,845
14,54
27,489
44,126
6,041
8,98
14,799
21,352
4,818
6,757
10,289
13,961
4,147
5,6
8,102
10,566
3,726
4,899
6,84
8,678
3,438
4,433
6,029
7,496
3,23
4,102
5,467
6,693
9

0,950
0,975
0,990
0,995

240,54
963,28
6022,5
24091
19,385
39,387
99,388
199,39
8,812
14,473
27,345
43,882
5,999
8,905
14,659
21,139
4,772
6,681
10,158
13,772
4,099
5,523
7,976
10,391
3,677
4,823
6,719
8,514
3,388
4,357
5,911
7,339
3,179
4,026
5,351
6,541
10

0,950
0,975
0,990
0,995

241,88
968,63
6055,8
24224
19,396
39,398
99,399
199,4
8,786
14,419
27,229
43,686
5,964
8,844
14,546
20,967
4,735
6,619
10,051
13,618
4,06
5,461
7,874
10,25
3,637
4,761
6,62
8,38
3,347
4,295
5,814
7,211
3,137
3,964
5,257
6,417
11

0,950
0,975
0,990
0,995

242,98
973,03
6083,3
24334
19,405
39,407
99,408
199,41
8,763
14,374
27,133
43,524
5,936
8,794
14,452
20,824
4,704
6,568
9,963
13,491
4,027
5,41
7,79
10,133
3,603
4,709
6,538
8,27
3,313
4,243
5,734
7,104
3,102
3,912
5,178
6,314


F-Verteilung (rechtsseitige Quantile)

n1
p
n2=
1
n2=
2
...
3

4

5

6

7

8

9
12

0,950
0,975
0,990
0,995

243,91
976,71
6106,3
24426
19,413
39,415
99,416
199,42
8,745
14,337
27,052
43,387
5,912
8,751
14,374
20,705
4,678
6,525
9,888
13,384
4
5,366
7,718
10,034
3,575
4,666
6,469
8,176
3,284
4,2
5,667
7,015
3,073
3,868
5,111
6,227
13

0,950
0,975
0,990
0,995

244,69
979,84
6125,9
24505
19,419
39,421
99,422
199,42
8,729
14,304
26,983
43,271
5,891
8,715
14,307
20,603
4,655
6,488
9,825
13,293
3,976
5,329
7,657
9,95
3,55
4,628
6,41
8,097
3,259
4,162
5,609
6,938
3,048
3,831
5,055
6,153
14

0,950
0,975
0,990
0,995

245,36
982,53
6142,7
24572
19,424
39,427
99,428
199,43
8,715
14,277
26,924
43,172
5,873
8,684
14,249
20,515
4,636
6,456
9,77
13,215
3,956
5,297
7,605
9,877
3,529
4,596
6,359
8,028
3,237
4,13
5,559
6,872
3,025
3,798
5,005
6,089
15

0,950
0,975
0,990
0,995

245,95
984,87
6157,3
24630
19,429
39,431
99,433
199,43
8,703
14,253
26,872
43,085
5,858
8,657
14,198
20,438
4,619
6,428
9,722
13,146
3,938
5,269
7,559
9,814
3,511
4,568
6,314
7,968
3,218
4,101
5,515
6,814
3,006
3,769
4,962
6,032
20

0,950
0,975
0,990
0,995

248,01
993,1
6208,7
24836
19,446
39,448
99,449
199,45
8,66
14,167
26,69
42,778
5,803
8,56
14,02
20,167
4,558
6,329
9,553
12,903
3,874
5,168
7,396
9,589
3,445
4,467
6,155
7,754
3,15
3,999
5,359
6,608
2,936
3,667
4,808
5,832
40

0,950
0,975
0,990
0,995

251,14
1005,6
6286,8
25148
19,471
39,473
99,474
199,47
8,594
14,037
26,411
42,308
5,717
8,411
13,745
19,752
4,464
6,175
9,291
12,53
3,774
5,012
7,143
9,241
3,34
4,309
5,908
7,422
3,043
3,84
5,116
6,288
2,826
3,505
4,567
5,519
50

0,950
0,975
0,990
0,995

251,77
1008,1
6302,5
25211
19,476
39,478
99,479
199,48
8,581
14,01
26,354
42,213
5,699
8,381
13,69
19,667
4,444
6,144
9,238
12,454
3,754
4,98
7,091
9,17
3,319
4,276
5,858
7,354
3,02
3,807
5,065
6,222
2,803
3,472
4,517
5,454
75

0,950
0,975
0,990
0,995

252,62
1011,5
6323,6
25295
19,482
39,485
99,486
199,49
8,563
13,974
26,278
42,086
5,676
8,34
13,615
19,554
4,418
6,101
9,166
12,351
3,726
4,937
7,022
9,074
3,29
4,232
5,789
7,263
2,99
3,762
4,998
6,133
2,771
3,426
4,449
5,367
100

0,950
0,975
0,990
0,995

253,04
1013,2
6334,1
25337
19,486
39,488
99,489
199,49
8,554
13,956
26,24
42,022
5,664
8,319
13,577
19,497
4,405
6,08
9,13
12,3
3,712
4,915
6,987
9,026
3,275
4,21
5,755
7,217
2,975
3,739
4,963
6,088
2,756
3,403
4,415
5,322
150

0,950
0,975
0,990
0,995

253,46
1014,9
6344,7
25380
19,489
39,491
99,492
199,49
8,545
13,938
26,202
41,957
5,652
8,299
13,539
19,44
4,392
6,059
9,094
12,248
3,698
4,893
6,951
8,977
3,26
4,188
5,72
7,17
2,959
3,716
4,929
6,042
2,739
3,38
4,38
5,278


p = 1−α

weitere Werte: =F.INV(p;n1;n2) bzw. (R-Aufruf): qf(p,n1,n2)

t-(Student-)Verteilung (Quantile)

n
p=
0,75
...
0,90

0,95

0,975

0,99

0,995

0,999

0,9995

0,9999
1 1,00 3,078 6,314 12,706 31,821 63,657 318,31 636,62 3183,1
2 0,816 1,886 2,92 4,303 6,965 9,925 22,327 31,599 70,700
3 0,765 1,638 2,353 3,182 4,541 5,841 10,215 12,924 22,204
4 0,741 1,533 2,132 2,776 3,747 4,604 7,173 8,61 13,034
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893 6,869 9,678
6 0,718 1,44 1,943 2,447 3,143 3,707 5,208 5,959 8,025
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785 5,408 7,063
8 0,706 1,397 1,86 2,306 2,896 3,355 4,501 5,041 6,442
9 0,703 1,383 1,833 2,262 2,821 3,25 4,297 4,781 6,01
10 0,7 1,372 1,812 2,228 2,764 3,169 4,144 4,587 5,694
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025 4,437 5,453
12 0,695 1,356 1,782 2,179 2,681 3,055 3,93 4,318 5,263
13 0,694 1,35 1,771 2,16 2,65 3,012 3,852 4,221 5,111
14 0,692 1,345 1,761 2,145 2,624 2,977 3,787 4,14 4,985
15 0,691 1,341 1,753 2,131 2,602 2,947 3,733 4,073 4,88
16 0,69 1,337 1,746 2,12 2,583 2,921 3,686 4,015 4,791
17 0,689 1,333 1,74 2,11 2,567 2,898 3,646 3,965 4,714
18 0,688 1,33 1,734 2,101 2,552 2,878 3,61 3,922 4,648
19 0,688 1,328 1,729 2,093 2,539 2,861 3,579 3,883 4,59
20 0,687 1,325 1,725 2,086 2,528 2,845 3,552 3,85 4,539
21 0,686 1,323 1,721 2,08 2,518 2,831 3,527 3,819 4,493
22 0,686 1,321 1,717 2,074 2,508 2,819 3,505 3,792 4,452
23 0,685 1,319 1,714 2,069 2,5 2,807 3,485 3,768 4,415
24 0,685 1,318 1,711 2,064 2,492 2,797 3,467 3,745 4,382
25 0,684 1,316 1,708 2,06 2,485 2,787 3,45 3,725 4,352
26 0,684 1,315 1,706 2,056 2,479 2,779 3,435 3,707 4,324
27 0,684 1,314 1,703 2,052 2,473 2,771 3,421 3,69 4,299
28 0,683 1,313 1,701 2,048 2,467 2,763 3,408 3,674 4,275
29 0,683 1,311 1,699 2,045 2,462 2,756 3,396 3,659 4,254
30 0,683 1,31 1,697 2,042 2,457 2,75 3,385 3,646 4,234
31 0,682 1,309 1,696 2,04 2,453 2,744 3,375 3,633 4,216
32 0,682 1,309 1,694 2,037 2,449 2,738 3,365 3,622 4,198
33 0,682 1,308 1,692 2,035 2,445 2,733 3,356 3,611 4,182
34 0,682 1,307 1,691 2,032 2,441 2,728 3,348 3,601 4,167
35 0,682 1,306 1,69 2,03 2,438 2,724 3,34 3,591 4,153
37 0,681 1,305 1,687 2,026 2,431 2,715 3,326 3,574 4,127
38 0,681 1,304 1,686 2,024 2,429 2,712 3,319 3,566 4,116
39 0,681 1,304 1,685 2,023 2,426 2,708 3,313 3,558 4,105
40 0,681 1,303 1,684 2,021 2,423 2,704 3,307 3,551 4,094


p = 1−α

weitere Werte: =T.INV(p ;n) bzw. (R-Aufruf): qt(p ,n)