Einfaktorielle Varianzanalyse
… Vergleich mehrerer Mittelwerte
Es wurden die anorganischen Phosphatwerte im Serum (mg/dl) eine Stunde nach einem Glukosetoleranztest bei übergewichtigen Personen mit Hyperinsulinämie, nicht- Hyperinsulinämie und Kontrollen gemessen.
Gibt es Unterschiede zwischen den 3 Gruppen?
Beispiel
Hypothesen
• Nullhypothese:
H0: μ1 = μ2 = μ3 = … = μk
• Alternativhypothese:
H1: wenigstens ein μi unterscheidet sich von den anderen
Globaltest
Voraussetzungen
• Voraussetzungen:
• Daten aller Stichproben entstammen normalverteilten Grundgesamtheiten
• Varianzhomogenität
(Faustregel: Verhältnis größter zu kleinster Standardabweichung muss kleiner 2:1 sein; Levene-Test, …)
• Die Messwerte bzw. Faktorstufen sind voneinander unabhängig
Modellbetrachtung
yij ist die jte Beobachtung (j=1,2,…,ni) in Gruppe i (i=1,2,…,k) µ ist das Gesamtmittel
αi ist die Differenz zwischen Mittelwert von Gruppe i und dem Gesamtmittel
εij ist der Fehlerterm
ij i
y
ij= μ + α + ε
Varianzanalyse
Vergleicht die Variation zwischen den Gruppen mit der Variation innerhalb der Gruppen.
• Gesamtvariabilität wird in 2 Komponenten aufgeteilt:
• Variabilität “zwischen” Gruppen, und
• Variabilität “innerhalb” Gruppen
• Varianzanalysetafel (ANOVA Tafel)
( ) ∑∑ ( ) ∑∑ ( )
∑∑
i jy
ij− y
.. 2=
i jy
i.− y
.. 2+
i jy
ij− y
i. 2SST SSB SSW
Quadratsummen
SST: Gesamt-Quadratsumme
SSB: Quadratsumme der Behandlungen SSW: Fehler-Quadratsumme
Varianzanalyse
ONEWAY ANOVA y
56,000 2 28,000 42,000 ,000
6,000 9 ,667
62,000 11
Between groups Within groups Total
Sum of
Squares df
Mean
Square F
Significan ce
Wir können die Nullhypothese verwerfen.
• df = (n – 1) = (n – k) + (k – 1)
• SS / df = mittlere Quadrate (MQ)
• Entstammen alle Gruppen derselben Grundgesamtheit, dann sollten die Varianzen, also die Mittleren Quadrate, MQzwischen und MQinnerhalb, gleich groß sein.
Varianzanalyse
( )
( )
∑∑
∑
= =
=
− −
=
− −
=
k
i
n
j
i ij
innerhalb
k
i
i i zwischen
i
y k y
MQ
y y
k n MQ
1 1
2 . 1
2 ..
.
1 1
1
1
• Sind diese nicht gleich groß, d.h. ist der Quotient aus MQzwischen und MQinnerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch df1, df2 und α), so wird die Nullhypothese verworfen.
• df1 = k – 1; df2 = n - k
• D.h. Es gibt Gruppen mit unterschiedlichen Mittelwerten,
Varianzanalyse
( ) H verwerfen ˆ > F
k−1;n−k;α→
0F
Multiple Vergleiche, p-Werte müssen korrigiert werden.
• Bonferroni
Die Unsicherheit (Irrtumswahrscheinlichkeit α=0,05) wird zu gleichen Teilen auf alle Paarvergleiche aufgeteilt. Bei 4 Gruppen gibt es
3+2+1=6 Vergleiche; jeder dieser Tests wird mit α/6 durchgeführt.
Die Bonferroni-Korrektur ist konservativ, d.h. sie hält lange an der Nullhypothese fest
Alternativen
• Bonferroni-Holm-Korrektur
• LSD – Least-Signifikant-Difference
• HSD – Honest-Significant-Difference (Tukey)
Post-hoc Tests
Untersucht wurde die Gerinnungszeit von Plasma, das mit vier verschiedenen Methoden behandelt wurde. Von 8 zufällig
ausgewählten Patienten einer Population werden je 4 Blutproben genommen und zufällig den 4
Behandlungsmethoden zugeteilt. Die Gerinnungszeiten (min) von diesen 8x4 Plasmen wurden bestimmt.
Gibt es Unterschiede zwischen den Behandlungen.
Beispiel – randomisiertes Blockexperiment
Daten – randomisiertes Blockexperiment
Subject treat1 treat2 treat3 treat4
1 8,4 9,4 9,8 12,2
2 12,8 15,2 12,9 14,4
3 9,6 9,1 11,2 9,8
4 9,8 8,8 9,9 12
5 8,4 8,2 8,5 8,5
6 8,6 9,9 9,8 10,9
7 8,9 9 9,2 10,4
8 7,9 8,1 8,2 10
Analyse – randomisiertes Blockexperiment
Tests der Zwischensubjekteffekte Abhängige Variable: clot_time
92,005a 10 9,201 14,027 ,000
3196,001 1 3196,001 4872,749 ,000
78,989 7 11,284 17,204 ,000
13,016 3 4,339 6,615 ,003
13,774 21 ,656
3301,780 32
105,779 31
Quelle
Korrigiertes Modell Konstanter Term subjects
treatments Fehler Gesamt Korrigierte
Gesamtvariation
Quadratsum
me vom Typ III df
Mittel der
Quadrate F Signifikanz
a.
• Kruskal Wallis Test
• Friedman Test
Nichtparametrische Methoden
• Zweifaktorielle ANOVA (die Varianz wird zwei Faktoren und Wechselwirkung zugeschrieben)
• Mehrfaktorielle ANOVA (MANOVA)
• ANOVA mit Messwiederholungen (Repeated Measurement – mehrere Messungen am gleichen Objekt, häufig ein zeitlicher Verlauf)
• GLM, ANCOVA, GEE, Mixed Models,…..