Formelsammlung Statistik/ Zufallsvariablen und Verteilungsmodelle

Aus Wikibooks

diskrete Zufallsvariablen[Bearbeiten]

Ein Merkmal X, das aufgrund zufälliger Ereignisse eine (endliche) Menge

von Ausprägungen x1, x2 ... annehmen kann, nennt man diskrete

Zufallsvariable X.

Eindimensionale Zufallsvariablen[Bearbeiten]

Wahrscheinlichkeitsfunktion:

Verteilungsfunktion:

Normiertheit:

Erwartungswert

Varianz

bzw. mit dem Verschiebungssatz

Standardabweichung

Varianz der Summe unabhängiger Zufallsvariablen

Mehrdimensionale Zufallsvariablen[Bearbeiten]

Einzelwahrscheinlichkeit

Kovarianz

bzw. mit dem Verschiebungssatz

Korrelationskoeffizient rxy nach Bravais-Pearson[Bearbeiten]

für metrisch skalierte Merkmale zweier statistischer Variablen x und y

mit als dem arithmetischen Mittel des Merkmals x. Mit Hilfe des Verschiebungssatzes:


Rangkorrelationskoeffizient nach Spearman[Bearbeiten]

  • für Variablen, die stark von der Normalverteilung abweichen
  • sowie ordinalskalierte Variablen

Nach Ordnung der einzelnen Beobachtungen von x bzw. y der Größe nach wird

jedem Wert wird seine Rangzahl rg(xi) und rg(yi) zugewiesen. Damit:

.

diskrete Verteilungsmodelle[Bearbeiten]

Binomialverteilung[Bearbeiten]

Für eine binomialverteilte Zufallsvariable X mit den Parametern n und θ (0 ≤ θ ≤ 1) lautet die Wahrscheinlichkeitsfunktion

Erwartungswert

Varianz

Hypergeometrische Verteilung[Bearbeiten]

Eine Zufallsvariable X ist hypergeometrisch verteilt mit den Parametern

N (Grundgesamtheit), M ("Kugeln der ersten Sorte") und n (Stichprobenumfang),

wenn ihre Wahrscheinlichkeitsfunktion lautet

Erwartungswert

Varianz

Der Bruch wird Korrekturfaktor genannt.

Poissonverteilung[Bearbeiten]

Wahrscheinlichkeitsfunktion ()


Erwartungswert und Varianz

stetige Zufallsvariablen[Bearbeiten]

Eine stetige Zufallsvariable kann in jedem beschränkten Intervall unendlich viele Ausprägungen annehmen.

Ihre Verteilung lässt sich durch eine Dichtefunktion f(x) beschreiben.

(f(x) ist hier keine Wahrscheinlichkeit, sondern eine Dichte !)

Verteilungsfunktion

  • Es gilt: P(X = a) = 0.
  • Wegen P(X = a) = 0 ist P(X ≤ a) = P(X < a) und P(X > a) = P(X ≥ a)

Die Dichtefunktion f(x) ist die erste Ableitung der Verteilungsfunktion, falls diese an der Stelle x differenzierbar ist.

  • Die Dichtefunktion f(a) kann auch größer als 1 werden.
  • Ausgehend von ist das p-Quantil x(p) der Wert x, der zu einer gegebenen Wahrscheinlichkeit p gehört. Speziell x(0,5) ist der Median.

Erwartungswert

falls E(X) existiert, d.h. nicht unendlich wird.

Varianz

wobei auch hier der Verschiebungssatz angewendet werden kann:

stetige Verteilungsmodelle[Bearbeiten]

Stetige Gleichverteilung (Rechteckverteilung)[Bearbeiten]

Dichtefunktion der Gleichverteilung im Intervall [a,b]

Erwartungswert

Varianz

Exponentialverteilung[Bearbeiten]

Dichtefunktion der Exponentialverteilung

Verteilungsfunktion

Erwartungswert

Varianz

.

Normalverteilung[Bearbeiten]

Für eine Zufallsvariable lautet die Dichtefunktion der NV

für

Normierung mit ergibt die Standardnormalverteilung mit der Dichtefunktion :

Anm.:Es wird auch die Schreibweise anstelle verwendet

Erwartungswert

Varianz

p-Quantil

Der zu einer gegebenen Wahrscheinlichkeit p zugehörige z-Wert z(p)

.

97,5%-Quantil der Standardnormalverteilung

Beispielsweise ist z(0,975) = 1,96.

Linearkombinationen normalverteilter Zufallsvariablen[Bearbeiten]

Für n normalverteilte Zufallsvariablen

ist die Linearkombination

ebenfalls normalverteilt mit dem Erwartungswert

.

Falls die stochastisch unabhängig sind, gilt für die Varianz

.

Die Varianz muss größer Null sein, deshalb muss zudem für mindestens ein gelten.

Verteilung des Stichprobendurchschnitts[Bearbeiten]

Sind die n Zufallsvariablen (i = 1, ... , n) sämtlich normalverteilt

mit gleichem μ und gleichem σ2, ist die Linearkombination

X mit a0 = 0, a1 = a2 = ... = an = 1/n, also :

normalverteilt dem Erwartungswert

und, falls die Xi (i = 1, ... , n) stochastisch unabhängig sind, mit der Varianz

.

CHI-Quadrat-verteilung[Bearbeiten]

Die seien unabhängige standardnormalverteilte Zufallsvariablen.

Dann ist die Verteilung der Zufallsvariablen

chi-quadrat verteilt mit n Freiheitsgraden

Erwartungswert:

Varianz

.

Anm.: Die Gruppe der Hypothesentests mit -Verteilung bezeichnet man als -Test.

Hierunter sind mehrere Tests zu verstehen:

Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.

Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.

Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.

t- (Student-) Verteilung[Bearbeiten]

Für die unabhängigen Variablen (standardnormalverteilt) und ist die Variable

t-verteilt mit n Freiheitsgraden.

Erwartungswert

für

Varianz

für


Fisher- Verteilung[Bearbeiten]

Für die unabhängigen Variablen und ist die Verteilung der Variablen

Fisher- oder F-verteilt mit den Freiheitsgraden m und n.

Erwartungswert

für

Varianz

für


Approximation von Verteilungen[Bearbeiten]

Gesuchte Verteilung Approximation durch
Binomial Poisson Normal
Binomial
---


Hypergeometrische

über Binomialverteilung

Poisson
--- ---
χ2-Verteilung
--- ---
t-Verteilung
--- ---
F-Verteilung
--- ---

Grenzwertsatz[Bearbeiten]

Gesetz der großen Zahlen[Bearbeiten]

Für ein beliebig kleines c > 0 gilt

für

Theorem von Bernoulli[Bearbeiten]

Die relative Häufigkeit, mit der ein Ereignis A bei n unabhängigen Wiederholungen

eines Zufallsereignisses eintritt, konvergiert nach Wahrscheinlichkeit gegen P(A)

Hauptsatz der Statistik[Bearbeiten]

Für eine Zufallsvariable X mit der Verteilungsfunktion F(x) gilt für die Verteilungsfunktion Fn(x)

für die unabhängigen wie identisch wie X verteilten X1…Xn (x∈ R)

(sup: Maximale Abweichung zwischen und ).

Zentraler Grenzwertsatz[Bearbeiten]

Für unabhängig identisch verteilte Zufallsvariablen X1…Xn mit E(Xi ) = μ

und Var(Xi ) =σ2 > 0 konvergiert die Verteilungsfunktion Fn(z) = P(Zn≤z)

der standardisierten Summe

für n → ∞ an jeder Stelle gegen die Verteilungsfunktion der Standardnormalverteilung

Grenzwertsatz von De Moivre[Bearbeiten]

Die Verteilung der standardisierten absoluten Häufigkeit der Standardnormalverteilung

konvergiert für n → ∞ gegen eine Standardnormalverteilung.