Formelsammlung Statistik/ Varianzanalyse
univariate Varianzanalyse (ANOVA)
[Bearbeiten]Man untersucht man den Einfluss einer unabhängigen Variable (Faktor) mit k verschiedenen Stufen (Gruppen) auf die Ausprägungen einer Zufallsvariablen.
Dazu werden die k Mittelwerte der Ausprägungen für die Gruppen miteinander verglichen, und zwar vergleicht man die Varianz zwischen den Gruppen mit der Varianz innerhalb der Gruppen.
Weil sich die totale Varianz aus den zwei genannten Komponenten zusammensetzt, spricht man von Varianzanalyse.
Die einfaktorielle ANOVA ist die Verallgemeinerung des t-Tests bei mehr als zwei Gruppen. Für k=2 ist sie äquivalent mit dem t-Test.
Es sei der Erwartungswert der abhängigen Variable in der i. Gruppe.
- (Es besteht kein Unterschied zwischen den Erwartungswerten der Gruppen.)
- (Es besteht zwischen mindestens zwei Erwartungswerten ein Unterschied.)
→ Wir wissen dann nur mit einer bestimmten Wahrscheinlichkeit, dass mindestens zwei Ausprägungen einen bedeutsamen Unterschied aufweisen.
Effektdarstellung :
Darin sind:
Xij: Zielvariable; annahmegemäß in den Gruppen normalverteilt
k: Anzahl der Faktorstufen des betrachteten Faktors
ni: Stichprobenumfänge für die einzelnen Faktorstufen
μ: arithmetisches Mittel der Erwartungswerte in den Gruppen
αi: Effekt der i-ten Faktorstufe
εij: Störvariablen, unabhängig und normalverteilt mit Erwartungswert 0 und gleicher (unbekannter) Varianz σ2.
Erwartungswert in der i. Gruppe:
Betrachtung der Quadratsummen (Variabiliät)
Die gesamte Variabilität QST (gesamte quadratische Abweichung vom Mittelwert) lässt sich in zwei Teile zerlegen:
Der erste Teil QSA (Gruppenzugehörigkeit) entspricht der ('Inter-')Variabilität zwischen den Gruppen.
Der Rest QSE entspricht der Variabilität innerhalb der Gruppen (gesamte 'Intra'-Abweichung von den Mittelwerten in den Gruppen, der 'Zufall'):
Die zwei Quadratsummen QSA und QSE sind stochastisch unabhängig.
Im Fall von k Gruppen mit gleichem Umfang b=n/k gilt unter der Nullhypothese außerdem:
- folgt einer Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden,
und
- folgt einer Chi-Quadrat-Verteilung mit n-k Freiheitsgraden.
mittlere Quadratsummen:
- und :
Prüfgröße:
Gruppen gleicher Größe
[Bearbeiten]Im Falle Gruppen gleicher Größe ist F unter der Nullhypothese F-verteilt
mit Freiheitsgraden im Zähler und Freiheitsgraden im Nenner.
Wenn die Prüfgröße
signifikant (d.h. wird, unterscheiden sich mindestens zwei Faktoren ('Gruppen') voneinander.
In Post-Hoc-Tests kann dann berechnet werden, zwischen welchen einzelnen Gruppen der Unterschied liegt.