9 Mittelwert- und Varianzvergleiche
Mittelwertvergleiche
N¨achste Anwendung:Vergleich der Mittelwerte zweiernormalverteilter ZufallsvariablenYA undYB
1 aufderselbenGrundgesamtheit durch Beobachtung von Realisationen (x1A,x1B), . . . ,(xnA,xnB) einer (gemeinsamen) einfachen Stichprobe
(X1A,X1B), . . . ,(XnA,XnB) zurzweidimensionalenZufallsvariablen (YA,YB), insbesondere von Realisationen vonYA undYB f¨urdieselbenElemente der Grundgesamtheit (
”verbundene Stichprobe“),
2 aufderselben oder unterschiedlichenGrundgesamtheit(en) durch Beobachtung von Realisationenx1A, . . . ,xnAA undx1B, . . . ,xnBB zu zwei unabh¨angigeneinfachen StichprobenX1A, . . . ,XnAA undX1B, . . . ,XnBB (m¨oglicherweise mitnA6=nB) zu den beiden ZufallsvariablenYAundYB. Anwendungsbeispiele f¨ur beide Fragestellungen:
1 Vergleich der Montagezeiten zweier unterschiedlicher Montageverfahren auf Grundlage von Zeitmessungen beider Verfahrenf¨ur dieselbe
(Stichproben-)Auswahl von Arbeitern.
2 Vergleich der in Eignungstests erreichten Punktzahlen von m¨annlichen und weiblichen Bewerbern (auf Basis zweier unabh¨angiger einfacher Stichproben).
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1
t-Differenzentest bei verbundener Stichprobe
Idee f¨ur Mittelwertvergleich bei verbundenen Stichproben:
I Ein Vergleich der Mittelwerte vonYAundYB kann anhand des Mittelwerts µ:= E(Y) der DifferenzY :=YA−YB erfolgen, denn mitµA:= E(YA) und µB := E(YB) gilt offensichtlichµ=µA−µB und damit:
µ <0 ⇐⇒ µA< µB µ= 0 ⇐⇒ µA=µB µ >0 ⇐⇒ µA> µB I Mitx1:=x1A−x1B, . . . ,xn:=xnA−xnB liegt eine Realisation einer einfachen
StichprobeX1:=X1A−X1B, . . . ,Xn:=XnA−XnB vom Umfangnzu Y =YA−YB vor.
I Dar¨uberhinaus gilt: Ist (YA,YB) gemeinsam (zweidimensional) normalverteilt, so ist auch die DifferenzY =YA−YB normalverteilt.
Es liegt also nahe, die gemeinsame Stichprobe zu (YA,YB) zu
”einer“
Stichprobe zuY =YA−YB zusammenzufassen und den bekanntent-Test f¨ur den Mittelwert einer (normalverteilten) Zufallsvariablen bei unbekannter Varianz auf der Grundlage der einfachen StichprobeX1, . . . ,Xn zuY durchzuf¨uhren.
Prinzipiell w¨are bei bekannter Varianz vonY =YA−YB auch ein entsprechender Gauß-Test durchf¨uhrbar; Anwendungen hierf¨ur sind aber selten.
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1
Zusammenfassung: t-Differenzentest
Anwendungs- exakt: (YA,YB) gemeinsam (zweidimensional) normalverteilt, voraussetzungen E(YA) =µA,E(YB) =µB sowie Varianzen/Kovarianz unbekannt
approx.: E(YA) =µA,E(YB) =µB,Var(YA),Var(YB) unbek.
(X1A,X1B), . . . ,(XnA,XnB) einfache Stichprobe zu (YA,YB) Nullhypothese H0:µA=µB H0:µA≤µB H0:µA≥µB
Gegenhypothese H1:µA6=µB H1:µA> µB H1:µA< µB
Teststatistik t= X
S
√n
Verteilung (H0) tf¨urµA=µB (n¨aherungsweise)t(n−1)-verteilt Ben¨otigte Gr¨oßen Xi =XiA−XiB f¨uri ∈ {1, . . . ,n}, X =1
n
n
X
i=1
Xi
S= v u u t
1 n−1
n
X
i=1
(Xi−X)2= v u u t
1 n−1
n
X
i=1
Xi2−nX2
!
Kritischer Bereich (−∞,−tn−1;1−α
2) (tn−1;1−α,∞) (−∞,−tn−1;1−α) zum Niveauα ∪(tn−1;1−α2,∞)
p-Wert 2·(1−Ft(n−1)(|t|)) 1−Ft(n−1)(t) Ft(n−1)(t)
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1
Beispiel: Montagezeiten von zwei Verfahren
Untersuchungsgegenstand: Ist ein neu vorgeschlagenes Montageverfahren besser (im Sinne einer im Mittel k¨urzeren BearbeitungsdauerYB) als das zur Zeit eingesetzte Montageverfahren (mit BearbeitungsdauerYA)?
Stichprobeninformation: Zeitmessungen der MontagedauernxiA f¨ur Verfahren AundxiB f¨ur VerfahrenB beidenselbenn= 7 Arbeitern:
Arbeiteri 1 2 3 4 5 6 7
xiA 64 71 68 66 73 62 70 xiB 60 66 66 69 63 57 62
Annahme: (YA,YB) gemeinsam normalverteilt, (X1A,X1B), . . . ,(XnA,XnB) einfache Stichprobe zu (YA,YB).
Gew¨unschtes Signifikanzniveau:α= 0.05
Geeigneter Test: Exaktert-Differenzentestf¨ur verbundene Stichproben
1 Hypothesen:
H0:µA≤µB gegen H1:µA > µB
2 Teststatistik:
t= X S
√nist unterH0t(n−1)-verteilt (f¨urµA=µB).
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1
3 Kritischer Bereich zum Niveauα= 0.05:
K = (tn−1;1−α,+∞) = (t6;0.95,+∞) = (1.943,+∞)
4 Berechnung der realisierten Teststatistik:
Arbeiter i 1 2 3 4 5 6 7
xiA 64 71 68 66 73 62 70 xiB 60 66 66 69 63 57 62 xi =xiA−xiB 4 5 2 −3 10 5 8 Mitx= 17P7
i=1xi = 4.4286 unds= q 1
7−1
P7
i=1(xi−x)2= 4.1975:
t= x s
√n=4.4286 4.1975
√
7 = 2.7914
5 Entscheidung:
t= 2.7914∈(1.943,+∞) =K ⇒ H0wird abgelehnt!
(p-Wert: 1−Ft(6)(t) = 1−Ft(6)(2.7914) = 1−0.9842 = 0.0158)
Der Test kommt also zur Entscheidung, dass das neue Montageverfahren eine im Mittel signifikant k¨urzere Montagedauer aufweist.
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Mittelwertvergleiche bei zwei unabh¨ angigen Stichproben
Liegen zwei unabh¨angige StichprobenX1A, . . . ,XnAA undX1B, . . . ,XnBB zu jeweils normalverteilten ZufallsvariablenYA undYB vor, kann eine
”Aggregation“ zu einer einzigen Stichprobe wie beim Vorliegen verbundener Stichproben so nicht durchgef¨uhrt werden.
Verglichen werden nun nicht mehr Beobachtungspaare, sondern die (getrennt) berechneten MittelwerteXA undXB der beiden Stichprobenrealisationen zuYA bzw.YB.
Wir setzen zun¨achst dieNormalverteilungsannahme f¨ur YA und YB voraus!
Die DifferenzXA−XB ist wegen der Unabh¨angigkeit der Stichproben dann offensichtlich normalverteilt mit ErwartungswertµA−µB (f¨urµA =µB gilt also gerade E(XA−XB) = 0) und Varianz
Var(XA−XB) = Var(XA) + Var(XB) = σA2 nA +σ2B
nB .
Sind die beteiligten Varianzen bekannt, kann zum Vergleich vonµA undµB somit unmittelbar ein exakter Gauß-Test konstruiert werden.
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Zusammenfassung: 2-Stichproben-Gauß-Test
bei bekannten Varianzen
Anwendungs- exakt:YA∼N(µA, σ2A),YB∼N(µB, σB2), σA2, σ2B bekannt voraussetzungen X1A, . . . ,XnAA einfache Stichprobe zuYA, unabh¨angig von
einfacher StichprobeX1B, . . . ,XnBB zuYB.
Nullhypothese H0:µA=µB H0:µA≤µB H0:µA≥µB
Gegenhypothese H1:µA6=µB H1:µA> µB H1:µA< µB
Teststatistik N= XA−XB
qσA2 nA +σnB2
B
Verteilung (H0) Nf¨urµA=µB N(0,1)-verteilt Ben¨otigte Gr¨oßen XA= n1
A
PnA
i=1XiA, XB= n1
B
PnB i=1XiB
Kritischer Bereich (−∞,−N1−α2) (N1−α,∞) (−∞,−N1−α)
zum Niveauα ∪(N1−α
2,∞)
p-Wert 2·(1−Φ(|N|)) 1−Φ(N) Φ(N)
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Sind die VarianzenσA2 undσ2B unbekannt, so ist zu unterscheiden, ob man wenigstensσ2A=σB2 annehmen kann oder nicht.
Im Fall ¨ubereinstimmender VarianzenσA2=σ2B wird diese mit Hilfe eines gewichteten MittelwertsS2der Stichprobenvarianzen
SY2A = 1 nA−1
nA
X
i=1
(XiA−XA)2 und SY2B = 1 nB −1
nB
X
j=1
(XjB−XB)2
in der Form
S2= (nA−1)SY2A+ (nB −1)SY2B
nA+nB−2 = PnA
i=1(XiA−XA)2+PnB
j=1(XjB−XB)2 nA+nB−2
gesch¨atzt, ein exaktert-Test ist damit konstruierbar.
F¨urnA=nB erh¨alt man die einfachere DarstellungS2=SY2A+SY2B
2 .
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Zusammenfassung: 2-Stichproben-t-Test
bei unbekannten, aber ¨ubereinstimmenden Varianzen
Anwendungs- exakt:YA∼N(µA, σ2A),YB∼N(µB, σB2), µA, µB, σA2=σ2B unbek.
voraussetzungen approx.: E(YA) =µA,E(YB) =µB,Var(YA) = Var(YB) unbekannt X1A, . . . ,XnAA einfache Stichprobe zuYA, unabh¨angig von
einfacher StichprobeX1B, . . . ,XnBB zuYB.
Nullhypothese H0:µA=µB H0:µA≤µB H0:µA≥µB
Gegenhypothese H1:µA6=µB H1:µA> µB H1:µA< µB
Teststatistik t= XA−XB
qS2 nA +Sn2
B
=XA−XB S
rnA·nB
nA+nB
Verteilung (H0) t f¨urµA=µB (n¨aherungsweise)t(nA+nB−2)-verteilt Ben¨otigte Gr¨oßen XA= n1
A
PnA
i=1XiA, XB= n1
B
PnB i=1XiB, S=
r
(nA−1)S2
Y A+(nB−1)S2 Y B nA+nB−2 =
r
PnA
i=1(XiA−XA)2+PnB
i=1(XiB−XB)2 nA+nB−2
Kritischer Bereich (−∞,−tn
A+nB−2;1−α
2) (tnA+nB−2;1−α,∞) (−∞,−tnA+nB−2;1−α) zum Niveauα ∪(tn
A+nB−2;1−α
2,∞)
p-Wert 2·(1−Ft(nA+nB−2)(|t|)) 1−Ft(nA+nB−2)(t) Ft(nA+nB−2)(t)
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Beispiel: Absatzwirkung einer Werbeaktion
Untersuchungsgegenstand: Hat eine spezielle Sonderwerbeaktion positiven Einfluss auf den mittleren Absatz?
Stichprobeninformation: Messung der prozentualen Absatz¨anderungen x1A, . . . ,x10A innA= 10 Superm¨arktenohneSonderwerbeaktion und x1B, . . . ,x5B innB = 5 Superm¨arktenmitSonderwerbeaktion.
Annahme: F¨ur prozentuale Absatz¨anderungenYA ohne bzw.YB mit Sonderwerbeaktion giltYA∼N(µA, σA2),YB∼N(µB, σB2), µA, µB, σ2A=σB2 unbekannt,X1A, . . . ,X10A einfache Stichprobe zuYA, unabh¨angig von einfacher StichprobeX1B, . . . ,X5B zuYB.
(Zwischen-)Ergebnisse aus Stichprobenrealisation:
xA= 6.5, xB = 8, sY2A = 20.25, sY2B = 23.04
⇒s= s
(nA−1)sY2A + (nB−1)sY2B nA+nB−2 =
r9·20.25 + 4·23.04
13 = 4.5944
Gew¨unschtes Signifikanzniveau:α= 0.05 Geeigneter Test:
2-Stichproben-t-Test bei ¨ubereinstimmenden, aber unbekannten Varianzen
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
1 Hypothesen:
H0:µA≥µB gegen H1:µA < µB
2 Teststatistik:
t= XA−XB S
r nA·nB
nA+nB ist unter H0t(nA+nB−2)-verteilt (f¨urµA =µB).
3 Kritischer Bereich zum Niveauα= 0.05:
K = (−∞,−tnA+nB−2;1−α) = (−∞,−t13;0.95) = (−∞,−1.771)
4 Berechnung der realisierten Teststatistik:
t= xA−xB s
rnA·nB nA+nB
= 6.5−8 4.5944
r 10·5
10 + 5 =−0.5961
5 Entscheidung:
t=−0.5961∈/ (−∞,−1.771) =K ⇒ H0wird nicht abgelehnt!
(p-Wert:Ft(13)(t) =Ft(13)(−0.5961) = 0.2807)
Der Test kommt also zur Entscheidung, dass eine positive Auswirkung der Sonderwerbeaktion auf die mittlere prozentuale Absatz¨anderung nicht best¨atigt werden kann.
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Sonderfall: Vergleich von Anteilswerten
Ein Sonderfall des (approximativen) 2-Stichproben-t-Test bei unbekannten, aber ¨ubereinstimmenden Varianzen liegt vor, wenn zwei Anteilswerte miteinander verglichen werden sollen.
Es gelte also speziellYA∼B(1,pA) undYB∼B(1,pB) f¨urpA∈(0,1) und pB ∈(0,1), außerdem seienX1A, . . . ,XnAA sowieX1B, . . . ,XnBB unabh¨angige einfache Stichproben vom UmfangnA zu YA bzw. vom UmfangnB zuYB. Zur ¨Uberpr¨ufung stehen die Hypothesenpaare:
H0:pA=pB H0:pA≤pB H0:pA≥pB
gegen H1:pA6=pB H1:pA>pB H1:pA<pB
F¨ur die Varianzen von YA undYB gilt bekanntlich Var(YA) =pA·(1−pA) bzw. Var(YB) =pB·(1−pB), d.h. die Varianzen sind zwar unbekannt, unter H0 — genauer f¨urpA=pB — jedoch gleich.
Mit den ¨ublichen SchreibweisenbpA:= n1
A
PnA
i=1XiA bzw.bpB := n1
B
PnB i=1XiB erh¨alt man f¨urS2in Abh¨angigkeit vonbpA undbpB die Darstellung:
S2=nA·bpA·(1−bpA) +nB·bpB·(1−bpB) nA+nB−2
Approximation vern¨unftig, falls 5≤nAbpA≤nA−5 und 5≤nBbpB ≤nB−5 .
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Zusammenfassung: 2-Stichproben-t-Test f¨ ur Anteilswerte
Anwendungs- approx.:YA∼B(1,pA),YB∼B(1,pB),pA,pB unbekannt voraussetzungen X1A, . . . ,XnAA einfache Stichprobe zuYA, unabh¨angig von
einfacher StichprobeX1B, . . . ,XnBB zuYB.
Nullhypothese H0:pA=pB H0:pA≤pB H0:pA≥pB
Gegenhypothese H1:pA6=pB H1:pA>pB H1:pA<pB
Teststatistik t= bpA−bpB
qS2 nA +Sn2
B
=bpA−bpB
S
rnA·nB
nA+nB
Verteilung (H0) tf¨urpA=pB n¨aherungsweiset(nA+nB−2)-verteilt (N¨aherung ok, falls 5≤nAbpA≤nA−5 und 5≤nBbpB≤nB−5) Ben¨otigte Gr¨oßen bpA= n1
A
PnA
i=1XiA, bpB= n1
B
PnB i=1XiB, S=
qnA·bpA·(1−bpA)+nB·bpB·(1−bpB) nA+nB−2
Kritischer Bereich (−∞,−tnA+nB−2;1−α
2) (tnA+nB−2;1−α,∞) (−∞,−tnA+nB−2;1−α) zum Niveauα ∪(tnA+nB−2;1−α
2,∞)
p-Wert 2·(1−Ft(nA+nB−2)(|t|)) 1−Ft(nA+nB−2)(t) Ft(nA+nB−2)(t)
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Beispiel: Vergleich von zwei Fehlerquoten
mit approximativem 2-Stichproben-t-Test f¨ur Anteilswerte
Untersuchungsgegenstand: Vergleich von Fehlerquoten zweier Sortiermaschinen
F¨ur einen automatisierten Sortiervorgang werden eine g¨unstige (A) sowie eine hochpreisige Maschine (B) angeboten. Es soll anhand von 2 (unabh¨angigen) Testl¨aufen mit jeweilsnA=nB = 1000 Sortiervorg¨angen ¨uberpr¨uft werden, ob die FehlerquotepA bei der g¨unstigen MaschineAh¨oher ist als die FehlerquotepB der hochpreisigen MaschineB.
Resultat der Testl¨aufe soll jeweils als Realisation einer einfachen Stichprobe aufgefasst werden k¨onnen.
Stichprobeninformation: Bei MaschineAtraten 29 Fehler auf, bei Maschine B 21 Fehler.
(Zwischen-) Ergebnisse aus Stichprobenrealisation:bpA =100029 = 0.029, bpB =100021 = 0.021,s=
q1000·0.029·(1−0.029)+1000·0.021·(1−0.021)
1000+1000−2 = 0.156
Gew¨unschtes Signifikanzniveauα= 0.05.
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
1 Hypothesen:
H0:pA≤pB gegen H1:pA >pB
2 Teststatistik:
t= bpA−bpB
S
rnA·nB
nA+nB
ist unterH0n¨aherungsweiset(nA+nB −2)-verteilt (f¨urpA=pB). N¨aherung ok, da 5≤29≤995 und 5≤21≤995.
3 Kritischer Bereich zum Niveauα= 0.05:
K = (tnA+nB−2;1−α,+∞) = (t1998;0.95,+∞) = (1.646,+∞)
4 Berechnung der realisierten Teststatistik:
t= bpA−bpB s
rnA·nB nA+nB
= 0.029−0.021 0.1562
r1000·1000
1000 + 1000 = 1.1452
5 Entscheidung:
t= 1.1452∈/(1.646,+∞) =K ⇒ H0wird nicht abgelehnt!
(p-Wert: 1−Ft(1998)(t) = 1−Ft(1998)(1.1452) = 1−0.8739 = 0.1261) Der Test kommt also zum Ergebnis, dass eine h¨ohere Fehlerquote der g¨unstigen Maschine nicht best¨atigt werden kann.
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2
Approximativer 2-Stichproben-Gauß-Test
f¨ur Mittelwertvergleiche, wenn Gleichheit der Varianzen ungewiss
Kann in der Situation des exakten 2-Stichproben-t-Test (YA undYB sind normalverteilt mit unbekannten Varianzen) auch unterH0 keine Gleichheit der Varianzen vorausgesetzt werden, m¨ussen andere Testverfahren verwendet werden, z.B. derWelch-Test(hier nicht besprochen).
Als approximativer Test l¨asst sich (zumindest bei hinreichend großen Stichprobenumf¨angen,
”Daumenregel“nA >30 undnB >30) auch eine leichte Modifikation des 2-Stichproben-Gauß-Tests aus Folie 187 verwenden.
Anstelle der (dort als bekannt vorausgesetzten) VarianzenσA2 undσ2B sind die erwartungstreuen Sch¨atzfunktionenSY2A undSY2B einzusetzen und der Test als approximativer Test durchzuf¨uhren.
Die Teststatistik nimmt damit die Gestalt N= XA−XB
r
S2
Y A
nA +S
2 Y B
nB
an und ist unterH0n¨aherungsweise standardnormalverteilt.