• Keine Ergebnisse gefunden

7 TESTEN VON HYPOTHESEN III: VARIANZANALYSE

N/A
N/A
Protected

Academic year: 2021

Aktie "7 TESTEN VON HYPOTHESEN III: VARIANZANALYSE"

Copied!
16
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

7 TESTEN VON HYPOTHESEN III: VARIANZANALYSE

Inhalt:

7.1 Einfaktorielle Varianzanalyse

7.2 Untersuchung der Modellvoraussetzungen 7.3 Paarweise Mittelwertvergleiche von Tukey

7.4 Rangvarianzanalysen für unabhängige Stichproben 7.5 Übungsbeispiele

Lernziele:

- Den Einfluss eines k-stufigen Faktors auf den Mittelwert einer auf jeder Faktorstufe mit gleicher Varianz normalverteilten

Zielvariablen feststellen können.

- Die Voraussetzungen des Modells der einfaktoriellen ANOVA überpüfen können.

- Nach signifikantem Ausgang des Globaltests der einfaktoriellen ANOVA die Mittelwertpaare mit voneinander verschiedenen Mittelwerten feststellen können.

- Mit dem H-Test Lageunterschiede der Verteilungen einer

Zielvariablen Y auf k > 2 Faktorstufen prüfen können, wenn Y auf

jeder Faktorstufe (bis auf die Lage) zwar identisch verteilt, aber

nicht notwendigerweise normalverteilt ist.

(2)

7.1 Einfaktorielle Varianzanalyse (ANOVA) Lernziel 7.1:

Den Einfluss eines k-stufigen Faktors auf den Mittelwert einer auf jeder Faktorstufe mit gleicher Varianz normalverteilten Zielvariablen

feststellen können.

Die 1-faktorielle Varianzanalyse ermöglicht es, unter gewissen

Voraussetzungen, die Mittelwerte von k >2 unabhängigen Stichproben im Rahmen der Globalhypothesen H

0

: „Alle k Mittelwerte sind gleich“ vs.

H

1

: „Wenigstens 2 Mittelwerte sind verschieden“ vergleichen zu können.

Ablaufschema:

• Beobachtungsdaten und Modell:

Variable Y unter k Versuchsbedingungen (= Faktorstufen) wiederholt (an n

j

Untersuchungseinheiten auf der Faktorstufe j) gemessen

k unabhängige Stichproben

Anordnung in Datentabelle (y

ij

= Messwert von der i-ten Untersuchungseinheit unter der j -Versuchsbedingung):

Jedes y

ij

ist eine Realisation einer N( µ

j

, σ

2

)-verteilten Zufallsvariablen Y

ij

mit der Darstellung:

Es bedeuten:

− µ

j

das Mittelwert auf der j-ten Faktorstufe (geschätzt durch y

j

);

− µ eine Konstante (geschätzt durch das aus allen Stichprobenwerten berechnete Gesamtmittel

y

);

ij j ij

j

Y

ij

= µ + ε = µ + τ + ε

(3)

− τ

j

eine den Behandlungseffekt auf der j-ten Stufe zum Ausdruck bringende Konstante (geschätzt durch

yjy

und mit der

Normierung n

1

τ

1

+ n

2

τ

2

+ ... + n

k

τ

k

=0);

− ε

ij

den Versuchsfehler (für alle Wiederholungen und Faktorstufen unabhängig N(0, σ

2

)-verteilt); Schätzung der Fehlervarianz σ

2

durch:

=

=

=

− =

=

k

j

j j

k

j

j

SQE n s

n k N

N MQE SQE

1

2 1

) 1 (

und mit

• Hypothesen und Testgröße:

Globaltest:

H

0

: µ

1

= µ

2

= ... = µ

k

vs.

H

1

: wenigstens zwei der µ

j

unterscheiden sich

( )

=

− =

=

=

k

j

j j

s

SQA n y y

k MQF SQA MQE

TG MQA

1

2

1 , mit

TG

s

= Realisierung einer (bei Gültigkeit von H

0

) F-verteilten

Zufallsvariablenmit (Zählerfreiheitsgrad f

1

=k-1, Nennerfreiheitsgrad f

2

=N-k).

Zusammenfassung der relevanten Rechengrößen in der ANOVA-Tafel:

SQY = (n

1

-1)s

1

2

+(n

2

-1)s

2

2

+...+(n

2

-1)s

2 2

• Entscheidung mit dem P-Wert

1

:

P < α ⇒ H

0

ablehnen; dabei ist P=1-F(TG

s

) mit F

als Verteilungsfunktion der F-Verteilung mit f

1

=k-1, f

2

=N-k.

• Entscheidung mit dem Ablehnungsbereich:

H

0

wird abgelehnt, wenn TG

s

> F

k-1,N-k,1-α.

1 In R kann die ANOVA-Tafel und der P-Wert des F-Tests zum globalen Vergleich der Mittelwerte mit der Anweisung aov() berechnet werden.

(4)

F

k-1,N-k,1-α

bezeichnet das 1- α - Quantil der F-Verteilung mit den Freiheitsgraden f

1

=k-1, f

2

=N-k.

Beispiel 7.1 (ANOVA: Globaltest):

An vier verschiedenen Stellen eines Gewässers wurden die in der

folgenden Tabelle angeschriebenen Werte der Phosphatkonzentration Y (in mg/l) gemessen. Man prüfe auf 5%igem Testniveau, ob die mittlere Phosphatkonzentration von der Messstelle abhängt.

Lösung mit R:

> # Beispiel 7.1 (ANOVA: Globaltest)

> options(digits=5)

> y <- c(1.20, 0.75, 1.15, 0.80, 0.90, + 1.00, 0.85, 1.45, 1.25, 1.10, + 1.45, 1.60, 1.35, 1.50, 1.70,

+ 1.30, 1.20, 1.35, 1.50, 1.00) # Messmerkmal

> stelle <- rep((1:4), each=5); A <- factor(stelle) # Messstelle

> daten <- data.frame(y, A); daten y A

1 1.20 1 2 0.75 1 3 1.15 1 4 0.80 1 5 0.90 1 6 1.00 2 7 0.85 2 8 1.45 2 9 1.25 2 10 1.10 2 11 1.45 3 12 1.60 3 13 1.35 3 14 1.50 3 15 1.70 3 16 1.30 4 17 1.20 4 18 1.35 4 19 1.50 4 20 1.00 4

> k <- 4; N <- length(y)

(5)

> mw <- mean(y); mw # Gesamtmittel [1] 1.22

> nj <- aggregate(daten[,1], list(A), FUN=length); nj[,2]

[1] 5 5 5 5

> mwj <- aggregate(daten[,1], list(A), FUN=mean); mwj[,2]

[1] 0.96 1.13 1.52 1.27

> varj <- aggregate(daten[,1], list(A), FUN=var); varj[,2]

[1] 0.04175 0.05325 0.01825 0.03450

> tauj <- mwj[,2]-mw; tauj [1] -0.26 -0.09 0.30 0.05

> SQE <- sum((nj[,2]-1)*varj[,2]); MQE <- SQE/(N-k)

> print(cbind(SQE, MQE)) SQE MQE [1,] 0.591 0.036937

> # Globaltest H0: "alle Mittelwerte gleich" vs. H1: "... ungleich"

> # direkte Berechnung des P-Werts

> SQY <- (N-1)*var(y); SQA <- SQY-SQE; MQA <- SQA/(k-1)

> print(cbind(SQY, SQA, MQA), digits=6) SQY SQA MQA

[1,] 1.432 0.841 0.280333

> tgs <- MQA/MQE; q <- qf(0.95, k-1, N-k); P <- 1-pf(tgs, k-1, N-k)

> print(cbind(tgs, q, P)) tgs q P [1,] 7.5894 3.2389 0.0022348

> # Loesung mit R-Funktion aov():

> mod <- aov(formula=y ~ A, data=daten)

> summary(mod) # erzeugt ANOVA-Tafel

Df Sum Sq Mean Sq F value Pr(>F) A 3 0.841 0.2803 7.59 0.0022 **

Residuals 16 0.591 0.0369 ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> mod$fitted.values # erzeugt die Modellkomponente tauj

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0.96 0.96 0.96 0.96 0.96 1.13 1.13 1.13 1.13 1.13 1.52 1.52 1.52 1.52 1.52 16 17 18 19 20

1.27 1.27 1.27 1.27 1.27

> mod$residuals # erzeugt die Residuen

1 2 3 4 5 6 7 8 9 10 0.24 -0.21 0.19 -0.16 -0.06 -0.13 -0.28 0.32 0.12 -0.03 11 12 13 14 15 16 17 18 19 20 -0.07 0.08 -0.17 -0.02 0.18 0.03 -0.07 0.08 0.23 -0.27

Testentscheidung:

P = 0.22% H0 (Übereinstimmung der Stufenmittelwerte) ablehnen (d.h.

Konzentration hängt von der Messstelle ab).

Anmerkung:

Es ist zweckmäßig, die Abhängigkeit der Zielvariablen Y von der Faktorvariablen grafisch zu veranschaulichen (Boxplot,

Mittelwertdiagramm).

Beispiel 7.2 (ANOVA: Boxplot, Mittelwertdiagramm):

> # Beispiel 7.2 (Fortsetzung von Beispiel 1)

> # Grafische Darstellung der Abhängigkeit vom Faktor durch Boxplot

(6)

> par(cex.axis=1.3, cex.lab=1.3)

> boxplot(y ~ A, xlab = "Messstellen", ylab = "Y (Phosphatkonz.)", + main="Boxplot: Abhängigkeit der Zielvariablen vom Faktor")

1 2 3 4

0.81.01.21.41.6

Boxplot: Abhängigkeit der Zielvariablen vom Faktor

Messstellen

Y (Phosphatkonz.)

> # Mittelwertdiagramm mit 95%-Konfidenzintervallen

> library(gplots)

> dj <- qt(0.975, nj[,2]-1)*sqrt(varj[,2]/nj[,2]); dj # Länge der 95%-CI [1] 0.25371 0.28653 0.16774 0.23063

> plotmeans(y ~ A, xlab="Faktor A (Messstellen)", + ylab="Y (Phosphatkonz.)", pch=3,

+ n.label=T, lwd=1, lty=1, cex=1.3, barcol="black", barwidth=2, + main="Mittelwertdiagramm mit 95%-CI")

0.81.01.21.41.6

Mittelwertdiagramm mit 95%-CI

Faktor A (Messstellen)

Y (Phosphatkonz.)

1 2 3 4

n=5 n=5 n=5 n=5

(7)

7.2 Untersuchung der Modellvoraussetzungen Lernziel 7.2:

Die Voraussetzungen des Modells der einfaktoriellen ANOVA überpüfen können.

• Die Zielvariable ist auf jeder Faktorstufe normalverteilt.

Die 1-faktorielle ANOVA setzt voraus, dass die Fehlergrößen ε

ij

voneinander unabhängig variierende und N(0, σ

2

)-verteilte

Zufallsvariable sind. Es empfiehlt sich, die Variation der Fehlergrößen ε

ij

visuell an Hand eines mit den Residuen erstellten Normal-QQ- Plots zu überprüfen:

Beispiel 7.3 (ANOVA: Residualanalyse mit dem Normal-QQ-PLot):

> # Beispiel 7.3 (Fortsetzung von Beispiel 1)

> # Überprüfung der Residuen auf Normalverteilung (Normal-QQ-Plot)

> qqnorm(mod$residuals, main="Normal-QQ-Plot mit den Residuen", + xlab = "Quantile der N(0, 1) - Verteilung",

+ ylab = expression("Residuen "*e[i]), pch=18, frame.plot=F)

> qqline(mod$residuals, lwd=2)

-2 -1 0 1 2

-0.3-0.2-0.10.00.10.20.3

Normal-QQ-Plot mit den Residuen

Quantile der N(0, 1) - Verteilung Residuen ei

• Der Levene-Test zur Prüfung auf inhomogene Varianzen.

Diese Voraussetzung einer N(0, σ

2

)-verteilten Fehlergröße bedeutet

im Besonderen, dass die Normalverteilungen auf jeder Faktorstufe

dieselbe Fehlervarianz aufweisen (Varianzhomogenität).

(8)

Ablaufschema:

− Beobachtungsdaten und Modell: wie bei der 1-faktoriellen ANOVA

− Hypothesen und Testgröße:

H

0

: σ

1

2

= σ

2

2

= ... = σ

k

2

vs.

H

1

: wenigstens zwei der σ

j

2

unterscheiden sich

Beobachtungen Y

ij

auf der j-ten Faktorstufe werden durch die Beträge z

ij

=|e

ij

| der Residuen

eij =yijyj

ersetzt modifizierte Datentabelle

Versuchsbedingung (Faktorstufe) 1 2 ... j ... k Wiederholungen z

11

z

12

... z

1j

... z

1k

z

21

z

22

... z

2j

... z

2k

... ... ... ... ... ...

z

n1,1

z

n2,2

... z

nj,j

... z

nk,k

Anzahl n

1

n

2

... n

j

... n

k

z-Mittelwerte

z

1

z

2

... z

j

... z

k

z-Varianzen s

z12

s

z22

... s

zj2

... s

zk2

Wenn Varianzhomogenität vorliegt, stimmen die Mittelwerte der z- Stichproben bis auf zufallsbedingte Abweichungen überein.

Prüfung der Abweichungen im Rahmen einer einfaktoriellen ANOVA mit:

( ) ∑ ( )

=

=

− −

=

− −

=

=

k

j

j j k

j

zj j

s

z z k n

MQF s

k n z N

MQE

z MQE

z z MQF

TG

1

2 1

2

1 1

und 1 1

) (

mit ) (

) ) (

(

( z ist das aus allen z-Werten berechnete Gesamtmittel.)

− Entscheidung mit dem P-Wert

2

:

P < α ⇒ H

0

ablehnen; dabei ist P=1-F(TG

s

) mit F

als Verteilungsfunktion der F-Verteilung mit f

1

=k-1, f

2

=N-k.

− Entscheidung mit dem Ablehnungsbereich:

H

0

auf Testniveau α ablehnen, wenn TG

s

(z) > F

k-1,N-k,1-α.

2 Der P-Wert kann mit der R-Funktion leveneTest() im Paket „car“ berechnet bwerden.

(9)

Beispiel 7.4 (ANOVA: Levene-Test):

> # Beispiel 7.4 (Levene-Test)

> # Fortsetzung der Beispiele 7.1 bis 7.3

> options(digits=5)

> y <- c(1.20, 0.75, 1.15, 0.80, 0.90, + 1.00, 0.85, 1.45, 1.25, 1.10, + 1.45, 1.60, 1.35, 1.50, 1.70,

+ 1.30, 1.20, 1.35, 1.50, 1.00) # Messmerkmal

> stelle <- rep((1:4), each=5); A <- factor(stelle) # Messstelle

> daten <- data.frame(y, A)

> # Bestimmung der Residuen

> mody <- aov(y ~ A); eij <- residuals(mody)

> # Levene-Test

> # H0: "Stufenvarianzen stimmen überein" vs. "stimmen nicht überein"

> z <- abs(eij); datenz <- data.frame(z, A)

> # ANOVA mit absoluten Residuen

> modz <- aov(formula=z ~ A)

> zz <- summary(modz); print(zz, digits=5) # erzeugt ANOVA-Tafel Df Sum Sq Mean Sq F value Pr(>F)

A 3 0.01718 0.0057267 0.6469 0.5962 Residuals 16 0.14164 0.0088525

> # Lösung mit R-Funktion leveneTest()

> library(car)

> resz <- leveneTest(y ~ A, data=daten, center=mean)

> print(resz, digits=5)

Levene's Test for Homogeneity of Variance (center = mean) Df F value Pr(>F)

group 3 0.6469 0.5962 16

Testentscheidung:

P = 59.62% H0 (Übereinstimmung der Stufenvarianzen) kann nicht abgelehnt werden, d.h., die daten stehen nicht in Widerspruch zur Annahme der

Varianzhomogenität.

7.3 Paarweise Mittelwertvergleiche nach Tukey Lernziel 7.3:

Nach signifikantem Ausgang des Globaltests der einfaktoriellen ANOVA die Mittelwertpaare mit voneinander verschiedenen Mittelwerten mit dem HSD-Test von Tukey feststellen können.

3

Ausgangspunkt:

Einfaktorielle Versuchsanlage mit k>2 Stufen und n Wiederholungen auf jeder Stufe (N = kn =Gesamtumfang aller Wiederholungen.

Stufenmittelwerte: y

j

, MQE = Schätzwert für die Fehlervarianz σ

2

(aus ANOVA-Tafel).

3 HSD steht für „honestly significant different“ Den paarweisen Vergleich aller Mittelwerte mit dem HSD-Test kann man der R-Funktion TukeyHSD() ausführen.

(10)

Entscheidung mit Quantilen:

Stufenmittelwerte y

i

und y

j

sind verschieden, wenn die Bedingung

k

N n f

Q MQE d

y

yij > HSD = k,f,1α mit = −

erfüllt ist.

4

Mit diesem Entscheidungskriterium wird sicher gestellt,

dass das Gesamt-Irrtumsrisiko für alle paarweisen Mittelwertvergleiche das vorgegebene Testniveau α nicht überschreitet. Die Größe Q

k,f,1-α

ist das (1- α )-Quantil der sogenannten Verteilung der studentisierten Spannweite Q

k, N-k

.

5

Entscheidung mit dem P-Wert:

Um die P-Werte zu berechnen, bestimmt man die Teststatistiken

n MQE

y y TG

s i j

/

= −

und damit P=1-F(TG

s

); hier ist F die Verteilungsfunktion der

studentisierten Spannweite Q

k, N-k

. Die Gleichheit der Stufenmittelwerte wird abgelehnt, wenn P < α gilt.

Beispiel 7.5 (HSD-Test):

> # Beispiel 7.5 (HSD-Test)

> # Fortsetzung der Beispiele 7.1 bis 7.4

> options(digits=5)

> y <- c(1.20, 0.75, 1.15, 0.80, 0.90, + 1.00, 0.85, 1.45, 1.25, 1.10, + 1.45, 1.60, 1.35, 1.50, 1.70,

+ 1.30, 1.20, 1.35, 1.50, 1.00) # Messmerkmal

> stelle <- rep((1:4), each=5); A <- factor(stelle) # Messstelle

> daten <- data.frame(y, A)

> k <- 4; n <- 5; N <- n*k

> my <- mean(y); my # Gesamtmittel [1] 1.22

> nj <- aggregate(daten[,1], list(A), FUN=length)

> mj <- aggregate(daten[,1], list(A), FUN=mean)

> varj <- aggregate(daten[,1], list(A), FUN=var)

> SQE <- sum((nj[,2]-1)*varj[,2]); MQE <- SQE/(N-k)

> # Bestimmung der kritischen Differenz

> alpha <- 0.05; q <- qtukey(1-alpha, k, N-k)

> dHSD <- q*sqrt(MQE/n)

> print(cbind(MQE, q, dHSD)) MQE q dHSD [1,] 0.036937 4.0461 0.34776

> # CI, P-Werte

> dif21 <- abs(mj[2,2]-mj[1,2])

> dif31 <- abs(mj[3,2]-mj[1,2])

4 Wenn die Umfänge nj der Stichproben auf den Faktorstufen nicht übereinstimmen, ist n durch 2ni nj/(ni+nj) zu ersetzen.

5 Die Quantile und Werte der Verteilungsfunktion können in R mit der Funktion qtukey() bzw. ptukey() bestimmt werden.

(11)

> dif41 <- abs(mj[4,2]-mj[1,2])

> dif32 <- abs(mj[3,2]-mj[2,2])

> dif42 <- abs(mj[4,2]-mj[2,2])

> dif43 <- abs(mj[4,2]-mj[3,2])

> dif <- c(dif21, dif31, dif41, dif32, dif42, dif43)

> u <- dif-dHSD; o <- dif+dHSD

> tgs <- abs(dif)/sqrt(MQE/n); P <- 1-ptukey(tgs, k, N-k)

> print(cbind(dif, u, o, tgs, P))

dif u o tgs P [1,] 0.17 -0.177764 0.51776 1.9779 0.5180096 [2,] 0.56 0.212236 0.90776 6.5154 0.0014952 [3,] 0.31 -0.037764 0.65776 3.6067 0.0894856 [4,] 0.39 0.042236 0.73776 4.5375 0.0253584 [5,] 0.14 -0.207764 0.48776 1.6288 0.6642091 [6,] 0.25 -0.097764 0.59776 2.9086 0.2091959

>

> # Loesung mit der R-Funktion TukeyHSD()

> comp <- TukeyHSD(aov(y ~ A))

> print(comp, digits=6)

Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = y ~ A)

$A

diff lwr upr p adj 2-1 0.17 -0.177764 0.517764 0.518010 3-1 0.56 0.212236 0.907764 0.001495 4-1 0.31 -0.037764 0.657764 0.089486 3-2 0.39 0.042236 0.737764 0.025358 4-2 0.14 -0.207764 0.487764 0.664209 4-3 -0.25 -0.597764 0.097764 0.209196 Entscheidung:

Die Mittelwerte 1 und 2 sind vom Mittelwert 3 auf dem simultanen Testniveau 5% signifikant verschieden, da die entsprechenden P-Werte kleiner als 5%

sind.

7.4 Rangvarianzanalysen für unabhängige Stichproben Lernziel 7.4:

Mit dem H-Test von Kruskal und Wallis Lageunterschiede der Verteilungen einer Zielvariablen Y auf k > 2 Faktorstufen prüfen

können, wenn Y auf jeder Faktorstufe (bis auf die Lage) zwar identisch verteilt, aber nicht notwendigerweise normalverteilt ist.

Ablaufschema:

• Beobachtungsdaten:

wie bei der 1-faktoriellen ANOVA, d.h. Variable Y unter k Versuchsbedingungen (= Faktorstufen) wiederholt (an n

j

Untersuchungseinheiten auf der Faktorstufe j) gemessen k unabhängige Stichproben

rangskalierte Stichroben:

Es werden die Wiederholungen auf den k Faktorstufen zu einer

Stichprobe mit dem Umfang N=n

1

+n

2

+… +n

k

zusammengefasst und

(12)

nach aufsteigender Größe von 1 bis N durchnummeriert. Dabei werden gleiche Messwerte hintereinander angeschrieben. Jedem Messwert y

ij

wird seine Ordnungsnummer R

ij

als Rang zugeordnet.

Stimmen zwei oder mehrere Messwerte überein (man spricht dann von einer Bindung), erhält jeder dieser Messwerte das arithmetische Mittel der entsprechenden Ordnungsnummern als Rang zugewiesen.

Aufsummieren der Rangzahlen auf jeder Faktorstufe ergibt die Rangsummen R

j

.

• Modell und Hypothesen:

Y möge auf jeder Faktorstufe irgendeine stetige Verteilungsfunktion F

j

besitzen, wobei aber angenommen wird, dass alle F

j

bis auf ihre Lage gleich sind. Das Problem besteht nun darin, k stetige

Verteilungsfunktionen F

j

, die in der Form übereinstimmen, hinsichtlich ihrer Lage zu vergleichen. Die Lage der Verteilung denken wir uns durch ein geeignetes Lagemaß (wie z.B. Mittelwert oder Median) ausgedrückt. Wie bei der einfaktoriellen Varianzanalyse nehmen wir den Vergleich der Lagemaße zunächst im Rahmen eines Globaltests vor und prüfen die Nullhypothese H

0

, dass die Lagemaße der F

j

auf allen Faktorstufen gleich sind, gegen die Alternativhypothese H

1

, dass sich die Lagemaße auf wenigstens zwei Faktorstufen voneinander unterscheiden.

• Näherungsweise Testentscheidung

6

:

H

0

wird auf dem Signifikanzniveau α abgelehnt, wenn TG

s

>

=

+ + −

=

=

k

j j

j

s

N

n R N

H N TG

1 2

) 1 (

) 3 1 (

12

größer als das (1- α )-Quantil χ

2k-1,1-α

der χ

2

-Verteilung mit f=k-1 Freiheitsgraden ist.

Das Entscheidungskriterium mit dem P-Wert lautet:

H

0

ablehnen, wenn P < α ist; dabei ist P=1-F(TG

s

) mit F

als Verteilungsfunktion der χ

2

-Verteilung mit f=k-1.

Anmerkung:

Eine Korrektur der Testgröße ist bei Auftreten von Bindungen (d.h. 2 oder mehr übereinstimmenden Messwerten) vorzunehmen. Wir bezeichnen übereinstimmende Messwerte als eine Bindungsgruppe.

Es sei b die Anzahl der Bindungsgruppen, die wir uns von 1 bis b

6 Für die Anwendung der χ2-Approximation sollte k 4 und min(n1, n2, … , nk) 5 sein. In R wird der (approximative) H-Test mit der Anweisung kruskal.test() ausgeführt.

(13)

durchnummeriert denken. In der i-ten Bindungsgruppe mögen h

i

übereinstimmende Messwerte sein. Dann ist H zu ersetzen durch:

( )

=

− −

=

=

b

i

i i H

H

h N h

C N C

H H

1 3 3

*

1

1 mit

• Paarweise Mittelwertvergleiche

Nach signifikantem Ausgang des Globaltests können wie bei der einfaktoriellen Varianzanalyse a posteriori-Tests eingesetzt werden, um festzustellen, welche Faktorstufen sich hinsichtlich der mittleren Ränge unterscheiden. Es seien R

i

/n

i

und R

j

/n

j

die mittleren Ränge der Faktorstufen i bzw. j (j ≠ i). Die mittleren Ränge R

i

/n

i

und R

j

/n

j

sind auf dem Testniveau α signifikant verschieden, wenn





 +

= +

>

j i k

j j i

i n n

N j N

i d n R n

R 1 1

12 ) 1 ) (

, ( /

/

χ

2 1,1 α

gilt. Mit diesem (asymptotisch für größere N anwendbaren) Verfahren ist für alle möglichen Vergleiche zwischen je zwei Faktorstufen

sichergestellt, dass die vorgegebene GesamtIrrtumswahrschein- lichkeit α nicht überschritten wird. Als Bedingung für die

Anwendbarkeit des Verfahrens ist k ≥ 4 und n

j

≥ 5 für alle Faktorstufen voraus zu setzen.

Beispiel 7.6 (H-Test, a posteriori-Vergleiche):

> # Beispiel 7.6 (H-Test)

> # Daten: Beispiel 7.1

> options(digits=5)

> y <- c(1.20, 0.75, 1.15, 0.80, 0.90, + 1.00, 0.85, 1.45, 1.25, 1.10, + 1.45, 1.60, 1.35, 1.50, 1.70, + 1.30, 1.20, 1.35, 1.50, 1.00)

> A <- factor(rep((1:4), each=5))

> k <- 4; n <- 5; N <- n*k

> rg <- rank(y); daten <- data.frame(y, A, rg); daten y A rg

1 1.20 1 9.5 2 0.75 1 1.0 3 1.15 1 8.0 4 0.80 1 2.0 5 0.90 1 4.0 6 1.00 2 5.5 7 0.85 2 3.0 8 1.45 2 15.5 9 1.25 2 11.0 10 1.10 2 7.0 11 1.45 3 15.5 12 1.60 3 19.0 13 1.35 3 13.5 14 1.50 3 17.5 15 1.70 3 20.0 16 1.30 4 12.0

(14)

17 1.20 4 9.5 18 1.35 4 13.5 19 1.50 4 17.5 20 1.00 4 5.5

> rj <- aggregate(daten[,3], list(A), FUN=sum)[,2]; rm <- rj/n

> print(cbind(rj, rm)) # Rangsummen, mittlere Raenge rj rm

[1,] 24.5 4.9 [2,] 42.0 8.4 [3,] 85.5 17.1 [4,] 58.0 11.6

> H <- 12/N/(N+1)*sum(rj^2)/n-3*(N+1)

> # Bindungskorrektur

> g <- 5; h <- 2; C <- 1- 5*(h^3-h)/(N^3-N); Hs <- H/C

> print(cbind(C, Hs)) C Hs [1,] 0.99624 11.549

> # Globaltest

> q <- qchisq(0.95, k-1); P <- 1-pchisq(Hs, k-1)

> print(cbind(Hs, q, P)) Hs q P [1,] 11.549 7.8147 0.0090986

> # Globaltest mit der R-Funktion kruskal.test():

> modyA <- kruskal.test(y ~ A, data=daten); modyA Kruskal-Wallis rank sum test

data: y by A

Kruskal-Wallis chi-squared = 11.549, df = 3, p-value = 0.009099

> # A posteriori-Vergleiche

> drm12 <- abs(rm[1]-rm[2]); drm13 <- abs(rm[1]-rm[3])

> drm23 <- abs(rm[2]-rm[3]); drm <- c(drm12, drm13, drm23)

> dkrit <- sqrt(q*N*(N*1)/6/n)

> print(cbind(drm, dkrit)) drm dkrit

[1,] 3.5 10.208 [2,] 12.2 10.208 [3,] 8.7 10.208 Entscheidung:

Globaltest: Wegen P=0.91% < 5% ist H0 (keine Lageunterschiede der Verteilungen auf den Faktorstufen) auf dem 5%-Niveau abzulehnen.

A posteriori-Vergleiche: Auf dem 5%-Niveau gibt es nur zwischen den Faktorstufen 1 und 3 einen signifikanten Lageunterschied.

7.5 Übungsbeispiele

1. Im Rahmen einer Studie über die Lebensgemeinschaft des Makrozoobenthos in der Donau wurden östlich von Wien je sechs Proben an fünf Entnahmestellen quer über die Donau mit einem Sedimentgreifer entnommen (Stelle 3 liegt in der Flussmitte, die Stellen 2 und 1 sowie 4 und 5 liegen in 60-m-Abständen in

Richtung zum rechten bzw. linken Ufer). Die Auswertung der Proben ergab für die Großgruppe Diptera die in der folgenden Tabelle angeführten Besiedlungsdichten (Individuenanzahl pro m2).

a) Man prüfe auf dem Testniveau α =5%, ob sich die Entnahmestellen global hinsichtlich der mittleren Individuenanzahl unterscheiden. (Globaltest ist signifikant. Hinweis: Die Originaldaten erfüllen die bei der 1-faktoriellen

(15)

ANOVA vorausgesetzte Homogenität der Varianzen nicht; diese erreicht man durch Übergang zu transformierten Besiedlungsdichten, z.B. mit der 4. Wurzel aus den Besiedlungsdichten.)

b) Welches Resultat ergibt sich aus einem multiplen Vergleich?

Besiedlungsdichte in m-2

Stelle 1 Stelle 2 Stelle 3 Stelle 4 Stelle 5 Wieder-

holungen

5442 1763 3060 2259 647 649

497 587 15 478 938 1470

135 91 107 22 37 76

434 886 347 550 421 285

7304 7087 557 1471 3982 2365

2. Man vergleiche die Ca-Konzentration Y (in mg/ml) zwischen drei Lösungen. Die Messwerte sind: 50, 39, 35, 51, 57, 66, 48 (Lösung 1), 66, 68, 67, 43, 71, 54, 65 (Lösung 2) und 42, 34, 43, 41, 44, 56, 33 (Lösung 3).

a) Kann auf 5%igem Testniveau die Annahme gleicher Mittelwerte verworfen werden?

b) Ist die Annahme gleicher Varianzen gerechtfertigt?

c) Man erstelle ein Mittelwertdiagramm (mit den Stufenmittelwerten und den entsprechenden 95%-Konfidenzintervallen) sowie ein Normal-QQ-Plot mit allen Residuen.

d) Welche Mittelwerte sind auf dem vorgegebenen SIgnifikanzniveau voneinander verschieden?

3. Die folgende Daten geben den Ertrag (in t/ha) einer Getreidesorte (ERTRAG) auf verschieden gedüngten Böden (A = unbehandelt = Kontrolle, B = Strohdüngung, C = Stroh- u. PO4-Düngung, D = Stroh-, PO4- u. Kalkdüngung). Auf jeder

Faktorstufe liegen 10 Wiederholungen vor.

a) Man prüfe, ob die Bodenbeschaffenheit einen Einfluss auf den Ertrag besitzt (α = 5%).

b) Man vergleiche die Faktorstufen mit der Kontrolle (α = 5%).

4. Eine Lebensmittelfirma vertreibt Konserven mit Wurstsalat. Um eine angemessene Haltbarkeit zu gewährleisten, muss dem Produkt ein

Konservierungsmittel beigefügt werden. Drei verschiedene Subtanzen (Substanz A, B und C) kommen dafür in Betracht. Um zu prüfen, ob die Haltbarkeit ihres Produkts vom Konservierungsmittel abhängt, wurden die drei Substanzen in

A B C D

7,38 8,05 8,78 8,96

6,29 9,49 7,74 9,66

8,07 10,16 8,71 9,59

7,92 9,89 8,97 9,87

7,76 9,78 8,39 9,24

9,12 8,84 8,39 9,94

7,24 9,02 7,52 9,52

7,92 9,68 8,06 9,31

8,28 9,13 8,90 8,40

8,23 8,63 8,45 9,80

(16)

jeweils 8 Konserven beigegeben. Untenstehende Tabelle zeigt die Keimzahlen aus Proben der insgesamt 24 Konserven nach einwöchiger Lagerung.

Keimzahl/ A 5. 52 6. 46 7. 61 8. 58 9. 54 10. 53 11. 61 12. 58 Keimzahl/ B 13. 50 14. 60 15. 55 16. 58 17. 59 18. 65 19. 54 20. 60 Keimzahl/C 21. 58 22. 49 23. 55 24. 61 25. 65 26. 68 27. 60 28. 59

a) Prüfen Sie für jede Faktorenstufe auf 5%igem Testniveau, ob die Daten in Widerspruch zur Normalverteilungsannahme stehen!

b) Unterscheiden sich die drei Substanzen global hinsichtlich der mittleren Keimzahl? Beantworten Sie die Frage mittels eines geeigneten statistischen Testverfahrens (α = 5%)!

c) Untersuchen Sie die Homogenität der Varianzen (α = 5%)

Referenzen

ÄHNLICHE DOKUMENTE

gibt die post-hoc Tests für Gender (mit Region konstant) post-hoc t-tests.

beschreibt  meistens  eine  Eigenschaa  der

Ein

Bei linkssteilen Merkmalen hat tendenziell der rechte/obere Teil (rechter/oberer Teil der Box und rechter/oberer Whisker) eine gr¨ oßere Ausdehnung als der linke/untere Teil.

8.6 Der Rangkorrelationskoeffizient (nach SPEARMAN), Arbeitstabelle Seite 24. 8.7 Nichtlineare Beziehungsmuster, Arbeitstabelle

➢ Verwerfen der Hypothese, falls Daten außerhalb der Konfidenzregion. Oft statt vorheriger Wahl von  → Angabe

Methods and Applications of Linear Models; Regression and the Analysis of Variance, Wiley Series in Probability and Statistics, Wiley, N.Y..

Es wurden die anorganischen Phosphatwerte im Serum (mg/dl) eine Stunde nach einem Glukosetoleranztest bei übergewichtigen Personen mit Hyperinsulinämie, nicht- Hyperinsulinämie