Nächste Anwendung: Vergleich der Mittelwerte zweier normalverteilter Zufallsvariablen Y A und Y B

(1)

9 Mittelwert- und Varianzvergleiche

Mittelwertvergleiche

N¨achste Anwendung:Vergleich der Mittelwerte zweiernormalverteilter ZufallsvariablenY^A undY^B

1 aufderselbenGrundgesamtheit durch Beobachtung von Realisationen (x₁^A,x₁^B), . . . ,(x_n^A,x_n^B) einer (gemeinsamen) einfachen Stichprobe

(X1Â,X1^B), . . . ,(XnÂ,Xn^B) zurzweidimensionalenZufallsvariablen (YÂ,Y^B), insbesondere von Realisationen vonYÂ undY^B fürdieselbenElemente der Grundgesamtheit (

”verbundene Stichprobe“),

2 aufderselben oder unterschiedlichenGrundgesamtheit(en) durch Beobachtung von Realisationenx1Â, . . . ,xnÂ_A undx1^B, . . . ,xn^B_B zu zwei unabhängigeneinfachen StichprobenX₁Â, . . . ,X_nÂ_A undX₁^B, . . . ,X_n^B_B (möglicherweise mitnA6=nB) zu den beiden ZufallsvariablenYÂundY^B. Anwendungsbeispiele für beide Fragestellungen:

1 Vergleich der Montagezeiten zweier unterschiedlicher Montageverfahren auf Grundlage von Zeitmessungen beider Verfahrenf¨ur dieselbe

(Stichproben-)Auswahl von Arbeitern.

2 Vergleich der in Eignungstests erreichten Punktzahlen von m¨annlichen und weiblichen Bewerbern (auf Basis zweier unabh¨angiger einfacher Stichproben).

(2)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1

t-Differenzentest bei verbundener Stichprobe

Idee f¨ur Mittelwertvergleich bei verbundenen Stichproben:

I Ein Vergleich der Mittelwerte vonYÂundY^B kann anhand des Mittelwerts µ:= E(Y) der DifferenzY :=YÂ−Y^B erfolgen, denn mitµA:= E(YÂ) und µB := E(Y^B) gilt offensichtlichµ=µA−µB und damit:

µ <0 ⇐⇒ µA< µB µ= 0 ⇐⇒ µA=µB µ >0 ⇐⇒ µA> µB I Mitx1:=x1^A−x1^B, . . . ,xn:=xn^A−xn^B liegt eine Realisation einer einfachen

StichprobeX1:=X₁Â−X₁^B, . . . ,Xn:=X_nÂ−X_n^B vom Umfangnzu Y =YÂ−Y^B vor.

I Darüberhinaus gilt: Ist (YÂ,Y^B) gemeinsam (zweidimensional) normalverteilt, so ist auch die DifferenzY =YÂ−Y^B normalverteilt.

Es liegt also nahe, die gemeinsame Stichprobe zu (Y^A,Y^B) zu

”einer“

Stichprobe zuY =YÂ−Y^B zusammenzufassen und den bekanntent-Test für den Mittelwert einer (normalverteilten) Zufallsvariablen bei unbekannter Varianz auf der Grundlage der einfachen StichprobeX₁, . . . ,X_n zuY durchzuführen.

Prinzipiell wäre bei bekannter Varianz vonY =YÂ−Y^B auch ein entsprechender Gauß-Test durchführbar; Anwendungen hierfür sind aber selten.

(3)

Zusammenfassung: t-Differenzentest

Anwendungs- exakt: (Y^A,Y^B) gemeinsam (zweidimensional) normalverteilt, voraussetzungen E(Y^A) =µA,E(Y^B) =µB sowie Varianzen/Kovarianz unbekannt

approx.: E(Y^A) =µA,E(Y^B) =µB,Var(Y^A),Var(Y^B) unbek.

(X₁Â,X₁^B), . . . ,(X_nÂ,X_n^B) einfache Stichprobe zu (YÂ,Y^B) Nullhypothese H0:µA=µB H0:µA≤µB H0:µA≥µB

Gegenhypothese H1:µA6=µB H1:µA> µB H1:µA< µB

Teststatistik t= X

S

√n

Verteilung (H0) tfürµA=µB (näherungsweise)t(n−1)-verteilt Benötigte Größen Xi =XiÂ−Xi^B füri ∈ {1, . . . ,n}, X =1

n

X

i=1

Xi

S= v u u t

1 n−1

n

X

i=1

(Xi−X)²= v u u t

1 n−1

n

X

i=1

X_i²−nX²

!

Kritischer Bereich (−∞,−tn−1;1−^α

2) (tn−1;1−α,∞) (−∞,−tn−1;1−α) zum Niveauα ∪(tn−1;1−^α₂,∞)

p-Wert 2·(1−Ft(n−1)(|t|)) 1−Ft(n−1)(t) Ft(n−1)(t)

(4)

Beispiel: Montagezeiten von zwei Verfahren

Untersuchungsgegenstand: Ist ein neu vorgeschlagenes Montageverfahren besser (im Sinne einer im Mittel k¨urzeren BearbeitungsdauerY^B) als das zur Zeit eingesetzte Montageverfahren (mit BearbeitungsdauerY^A)?

Stichprobeninformation: Zeitmessungen der Montagedauernx_iÂ für Verfahren Aundx_i^B für VerfahrenB beidenselbenn= 7 Arbeitern:

Arbeiteri 1 2 3 4 5 6 7

x_i^A 64 71 68 66 73 62 70 x_i^B 60 66 66 69 63 57 62

Annahme: (YÂ,Y^B) gemeinsam normalverteilt, (X₁Â,X₁^B), . . . ,(X_nÂ,X_n^B) einfache Stichprobe zu (YÂ,Y^B).

Gew¨unschtes Signifikanzniveau:α= 0.05

Geeigneter Test: Exaktert-Differenzentestf¨ur verbundene Stichproben

1 Hypothesen:

H0:µA≤µB gegen H1:µA > µB

2 Teststatistik:

t= X S

√nist unterH0t(n−1)-verteilt (f¨urµA=µB).

(5)

3 Kritischer Bereich zum Niveauα= 0.05:

K = (tn−1;1−α,+∞) = (t6;0.95,+∞) = (1.943,+∞)

4 Berechnung der realisierten Teststatistik:

Arbeiter i 1 2 3 4 5 6 7

x_i^A 64 71 68 66 73 62 70 x_i^B 60 66 66 69 63 57 62 xi =x_i^A−x_i^B 4 5 2 −3 10 5 8 Mitx= ¹₇P7

i=1xi = 4.4286 unds= q 1

7−1

P7

i=1(xi−x)²= 4.1975:

t= x s

√n=4.4286 4.1975

√

7 = 2.7914

5 Entscheidung:

t= 2.7914∈(1.943,+∞) =K ⇒ H₀wird abgelehnt!

(p-Wert: 1−F_t(6)(t) = 1−F_t(6)(2.7914) = 1−0.9842 = 0.0158)

Der Test kommt also zur Entscheidung, dass das neue Montageverfahren eine im Mittel signifikant k¨urzere Montagedauer aufweist.

(6)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Mittelwertvergleiche bei zwei unabh¨ angigen Stichproben

Liegen zwei unabhängige StichprobenX₁Â, . . . ,X_nÂ_A undX₁^B, . . . ,X_n^B_B zu jeweils normalverteilten ZufallsvariablenYÂ undY^B vor, kann eine

”Aggregation“ zu einer einzigen Stichprobe wie beim Vorliegen verbundener Stichproben so nicht durchgef¨uhrt werden.

Verglichen werden nun nicht mehr Beobachtungspaare, sondern die (getrennt) berechneten MittelwerteX^A undX^B der beiden Stichprobenrealisationen zuY^A bzw.Y^B.

Wir setzen zunächst dieNormalverteilungsannahme für YÂ und Y^B voraus!

Die DifferenzXÂ−X^B ist wegen der Unabhängigkeit der Stichproben dann offensichtlich normalverteilt mit ErwartungswertµA−µB (fürµA =µB gilt also gerade E(XÂ−X^B) = 0) und Varianz

Var(X^A−X^B) = Var(X^A) + Var(X^B) = σ_A² n_A +σ²_B

n_B .

Sind die beteiligten Varianzen bekannt, kann zum Vergleich vonµ_A undµ_B somit unmittelbar ein exakter Gauß-Test konstruiert werden.

(7)

Zusammenfassung: 2-Stichproben-Gauß-Test

bei bekannten Varianzen

Anwendungs- exakt:YÂ∼N(µA, σ²_A),Y^B∼N(µB, σ_B²), σ_A², σ²_B bekannt voraussetzungen X1Â, . . . ,XnÂ_A einfache Stichprobe zuYÂ, unabhängig von

einfacher StichprobeX₁^B, . . . ,X_n^B_B zuY^B.

Nullhypothese H0:µA=µB H0:µA≤µB H0:µA≥µB

Teststatistik N= X^A−X^B

qσ_A² n_A +^σ_n^B²

B

Verteilung (H0) NfürµA=µB N(0,1)-verteilt Benötigte Größen XÂ= _n¹

A

Pn_A

i=1Xi^A, X^B= _n¹

B

Pn_B i=1Xi^B

Kritischer Bereich (−∞,−N1−^α₂) (N1−α,∞) (−∞,−N1−α)

zum Niveauα ∪(N1−^α

2,∞)

p-Wert 2·(1−Φ(|N|)) 1−Φ(N) Φ(N)

(8)

Sind die Varianzenσ_A² undσ²_B unbekannt, so ist zu unterscheiden, ob man wenigstensσ²_A=σ_B² annehmen kann oder nicht.

Im Fall ¨ubereinstimmender Varianzenσ_A²=σ²_B wird diese mit Hilfe eines gewichteten MittelwertsS²der Stichprobenvarianzen

S_Y²A = 1 n_A−1

n_A

X

i=1

(X_i^A−X^A)² und S_Y²B = 1 n_B −1

n_B

X

j=1

(X_j^B−X^B)²

in der Form

S²= (nA−1)S_Y²A+ (nB −1)S_Y²B

nA+nB−2 = PnA

i=1(X_i^A−X^A)²+PnB

j=1(X_j^B−X^B)² nA+nB−2

gesch¨atzt, ein exaktert-Test ist damit konstruierbar.

F¨urnA=nB erh¨alt man die einfachere DarstellungS²=S_Y²A+S_Y²B

2 .

(9)

Zusammenfassung: 2-Stichproben-t-Test

bei unbekannten, aber ¨ubereinstimmenden Varianzen

Anwendungs- exakt:Y^A∼N(µA, σ²_A),Y^B∼N(µB, σ_B²), µA, µB, σ_A²=σ²_B unbek.

voraussetzungen approx.: E(YÂ) =µA,E(Y^B) =µB,Var(YÂ) = Var(Y^B) unbekannt X₁Â, . . . ,X_nÂ_A einfache Stichprobe zuYÂ, unabhängig von

einfacher StichprobeX₁^B, . . . ,X_n^B_B zuY^B.

Nullhypothese H0:µA=µB H0:µA≤µB H0:µA≥µB

Teststatistik t= X^A−X^B

qS² n_A +^S_n²

B

=X^A−X^B S

rnA·nB

nA+nB

Verteilung (H0) t fürµA=µB (näherungsweise)t(nA+nB−2)-verteilt Benötigte Größen XÂ= _n¹

A

Pn_A

i=1X_i^A, X^B= _n¹

B

Pn_B i=1X_i^B, S=

r

(n_A−1)S²

Y A+(n_B−1)S² Y B n_A+n_B−2 =

r

PnA

i=1(X_i^A−X^A)²+PnB

i=1(X_i^B−X^B)² n_A+n_B−2

Kritischer Bereich (−∞,−t_n

A+n_B−2;1−^α

2) (tn_A+n_B−2;1−α,∞) (−∞,−t_n_A_+n_B−2;1−α) zum Niveauα ∪(t_n

A+n_B−2;1−^α

2,∞)

p-Wert 2·(1−Ft(n_A+n_B−2)(|t|)) 1−Ft(n_A+n_B−2)(t) Ft(n_A+n_B−2)(t)

(10)

Beispiel: Absatzwirkung einer Werbeaktion

Untersuchungsgegenstand: Hat eine spezielle Sonderwerbeaktion positiven Einfluss auf den mittleren Absatz?

Stichprobeninformation: Messung der prozentualen Absatzänderungen x₁Â, . . . ,x₁₀Â inn_A= 10 SupermärktenohneSonderwerbeaktion und x₁^B, . . . ,x₅^B inn_B = 5 SupermärktenmitSonderwerbeaktion.

Annahme: Für prozentuale AbsatzänderungenYÂ ohne bzw.Y^B mit Sonderwerbeaktion giltYÂ∼N(µA, σ_A²),Y^B∼N(µB, σ_B²), µA, µB, σ²_A=σ_B² unbekannt,X₁Â, . . . ,X₁₀Â einfache Stichprobe zuYÂ, unabhängig von einfacher StichprobeX₁^B, . . . ,X₅^B zuY^B.

(Zwischen-)Ergebnisse aus Stichprobenrealisation:

x^A= 6.5, x^B = 8, s_Y²A = 20.25, s_Y²B = 23.04

⇒s= s

(n_A−1)s_Y²_A + (n_B−1)s_Y²_B nA+nB−2 =

r9·20.25 + 4·23.04

13 = 4.5944

Gew¨unschtes Signifikanzniveau:α= 0.05 Geeigneter Test:

2-Stichproben-t-Test bei ¨ubereinstimmenden, aber unbekannten Varianzen

(11)

1 Hypothesen:

H₀:µ_A≥µ_B gegen H₁:µ_A < µ_B

2 Teststatistik:

t= X^A−X^B S

r nA·nB

n_A+n_B ist unter H₀t(n_A+n_B−2)-verteilt (f¨urµ_A =µ_B).

K = (−∞,−tn_A+n_B−2;1−α) = (−∞,−t13;0.95) = (−∞,−1.771)

t= x^A−x^B s

rn_A·n_B nA+nB

= 6.5−8 4.5944

r 10·5

10 + 5 =−0.5961

5 Entscheidung:

t=−0.5961∈/ (−∞,−1.771) =K ⇒ H0wird nicht abgelehnt!

(p-Wert:F_t(13)(t) =F_t(13)(−0.5961) = 0.2807)

Der Test kommt also zur Entscheidung, dass eine positive Auswirkung der Sonderwerbeaktion auf die mittlere prozentuale Absatz¨anderung nicht best¨atigt werden kann.

(12)

Sonderfall: Vergleich von Anteilswerten

Ein Sonderfall des (approximativen) 2-Stichproben-t-Test bei unbekannten, aber ¨ubereinstimmenden Varianzen liegt vor, wenn zwei Anteilswerte miteinander verglichen werden sollen.

Es gelte also speziellYÂ∼B(1,pA) undY^B∼B(1,pB) fürpA∈(0,1) und pB ∈(0,1), außerdem seienX₁Â, . . . ,X_nÂ_A sowieX₁^B, . . . ,X_n^B_B unabhängige einfache Stichproben vom UmfangnA zu YÂ bzw. vom UmfangnB zuY^B. Zur Überprüfung stehen die Hypothesenpaare:

H0:pA=pB H0:pA≤pB H0:pA≥pB

gegen H1:pA6=pB H1:pA>pB H1:pA<pB

Für die Varianzen von YÂ undY^B gilt bekanntlich Var(YÂ) =pA·(1−pA) bzw. Var(Y^B) =pB·(1−pB), d.h. die Varianzen sind zwar unbekannt, unter H0 — genauer fürpA=pB — jedoch gleich.

Mit den ¨ublichen Schreibweisenbp_A:= _n¹

A

Pn_A

i=1X_i^A bzw.bp_B := _n¹

B

Pn_B i=1X_i^B erhält man fürS²in Abhängigkeit vonbpA undbpB die Darstellung:

S²=nA·bpA·(1−bpA) +nB·bpB·(1−bpB) nA+nB−2

Approximation vern¨unftig, falls 5≤n_Abp_A≤n_A−5 und 5≤n_Bbp_B ≤n_B−5 .

(13)

Zusammenfassung: 2-Stichproben-t-Test f¨ ur Anteilswerte

Anwendungs- approx.:YÂ∼B(1,pA),Y^B∼B(1,pB),pA,pB unbekannt voraussetzungen X1Â, . . . ,XnÂ_A einfache Stichprobe zuYÂ, unabhängig von

einfacher StichprobeX1^B, . . . ,Xn^B_B zuY^B.

Nullhypothese H0:pA=pB H0:pA≤pB H0:pA≥pB

Gegenhypothese H1:pA6=pB H1:pA>pB H1:pA<pB

Teststatistik t= bpA−bpB

qS² n_A +^S_n²

B

=bpA−bpB

S

rnA·nB

nA+nB

Verteilung (H0) tfürpA=pB näherungsweiset(nA+nB−2)-verteilt (Näherung ok, falls 5≤nAbpA≤nA−5 und 5≤nBbpB≤nB−5) Benötigte Größen bpA= _n¹

A

Pn_A

i=1X_i^A, bpB= _n¹

B

Pn_B i=1X_i^B, S=

qn_A·bp_A·(1−bp_A)+n_B·bp_B·(1−bp_B) n_A+n_B−2

Kritischer Bereich (−∞,−t_n_A_+n_B_−2;1−α

2) (tn_A+n_B−2;1−α,∞) (−∞,−tn_A+n_B−2;1−α) zum Niveauα ∪(t_n_A_+n_B_−2;1−α

2,∞)

p-Wert 2·(1−F_t(n_A_+n_B−2)(|t|)) 1−F_t(n_A_+n_B−2)(t) F_t(n_A_+n_B−2)(t)

(14)

Beispiel: Vergleich von zwei Fehlerquoten

mit approximativem 2-Stichproben-t-Test f¨ur Anteilswerte

Untersuchungsgegenstand: Vergleich von Fehlerquoten zweier Sortiermaschinen

Für einen automatisierten Sortiervorgang werden eine günstige (A) sowie eine hochpreisige Maschine (B) angeboten. Es soll anhand von 2 (unabhängigen) Testläufen mit jeweilsnA=nB = 1000 Sortiervorgängen überprüft werden, ob die FehlerquotepA bei der günstigen MaschineAhöher ist als die FehlerquotepB der hochpreisigen MaschineB.

Resultat der Testl¨aufe soll jeweils als Realisation einer einfachen Stichprobe aufgefasst werden k¨onnen.

Stichprobeninformation: Bei MaschineAtraten 29 Fehler auf, bei Maschine B 21 Fehler.

(Zwischen-) Ergebnisse aus Stichprobenrealisation:bpA =₁₀₀₀²⁹ = 0.029, bpB =₁₀₀₀²¹ = 0.021,s=

q1000·0.029·(1−0.029)+1000·0.021·(1−0.021)

1000+1000−2 = 0.156

Gew¨unschtes Signifikanzniveauα= 0.05.

(15)

1 Hypothesen:

H₀:p_A≤p_B gegen H₁:p_A >p_B

2 Teststatistik:

t= bpA−bpB

S

rnA·nB

nA+nB

ist unterH0näherungsweiset(nA+nB −2)-verteilt (fürpA=pB). Näherung ok, da 5≤29≤995 und 5≤21≤995.

K = (t_n_A_+n_B_−2;1−α,+∞) = (t_1998;0.95,+∞) = (1.646,+∞)

t= bp_A−bp_B s

rn_A·n_B nA+nB

= 0.029−0.021 0.1562

r1000·1000

1000 + 1000 = 1.1452

5 Entscheidung:

t= 1.1452∈/(1.646,+∞) =K ⇒ H0wird nicht abgelehnt!

(p-Wert: 1−F_t(1998)(t) = 1−F_t(1998)(1.1452) = 1−0.8739 = 0.1261) Der Test kommt also zum Ergebnis, dass eine höhere Fehlerquote der günstigen Maschine nicht bestätigt werden kann.

(16)

Approximativer 2-Stichproben-Gauß-Test

f¨ur Mittelwertvergleiche, wenn Gleichheit der Varianzen ungewiss

Kann in der Situation des exakten 2-Stichproben-t-Test (Y^A undY^B sind normalverteilt mit unbekannten Varianzen) auch unterH0 keine Gleichheit der Varianzen vorausgesetzt werden, m¨ussen andere Testverfahren verwendet werden, z.B. derWelch-Test(hier nicht besprochen).

Als approximativer Test l¨asst sich (zumindest bei hinreichend großen Stichprobenumf¨angen,

”Daumenregel“n_A >30 undn_B >30) auch eine leichte Modifikation des 2-Stichproben-Gauß-Tests aus Folie 187 verwenden.

Anstelle der (dort als bekannt vorausgesetzten) Varianzenσ_A² undσ²_B sind die erwartungstreuen Sch¨atzfunktionenS_Y²A undS_Y²B einzusetzen und der Test als approximativer Test durchzuf¨uhren.

Die Teststatistik nimmt damit die Gestalt N= X^A−X^B

r

S²

Y A

nA +^S

2 Y B

nB

an und ist unterH0n¨aherungsweise standardnormalverteilt.