• Keine Ergebnisse gefunden

Nächste Anwendung: Vergleich der Mittelwerte zweier normalverteilter Zufallsvariablen Y A und Y B

N/A
N/A
Protected

Academic year: 2022

Aktie "Nächste Anwendung: Vergleich der Mittelwerte zweier normalverteilter Zufallsvariablen Y A und Y B"

Copied!
16
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

9 Mittelwert- und Varianzvergleiche

Mittelwertvergleiche

N¨achste Anwendung:Vergleich der Mittelwerte zweiernormalverteilter ZufallsvariablenYA undYB

1 aufderselbenGrundgesamtheit durch Beobachtung von Realisationen (x1A,x1B), . . . ,(xnA,xnB) einer (gemeinsamen) einfachen Stichprobe

(X1A,X1B), . . . ,(XnA,XnB) zurzweidimensionalenZufallsvariablen (YA,YB), insbesondere von Realisationen vonYA undYB f¨urdieselbenElemente der Grundgesamtheit (

”verbundene Stichprobe“),

2 aufderselben oder unterschiedlichenGrundgesamtheit(en) durch Beobachtung von Realisationenx1A, . . . ,xnAA undx1B, . . . ,xnBB zu zwei unabh¨angigeneinfachen StichprobenX1A, . . . ,XnAA undX1B, . . . ,XnBB (m¨oglicherweise mitnA6=nB) zu den beiden ZufallsvariablenYAundYB. Anwendungsbeispiele f¨ur beide Fragestellungen:

1 Vergleich der Montagezeiten zweier unterschiedlicher Montageverfahren auf Grundlage von Zeitmessungen beider Verfahrenf¨ur dieselbe

(Stichproben-)Auswahl von Arbeitern.

2 Vergleich der in Eignungstests erreichten Punktzahlen von m¨annlichen und weiblichen Bewerbern (auf Basis zweier unabh¨angiger einfacher Stichproben).

(2)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1

t-Differenzentest bei verbundener Stichprobe

Idee f¨ur Mittelwertvergleich bei verbundenen Stichproben:

I Ein Vergleich der Mittelwerte vonYAundYB kann anhand des Mittelwerts µ:= E(Y) der DifferenzY :=YA−YB erfolgen, denn mitµA:= E(YA) und µB := E(YB) gilt offensichtlichµ=µA−µB und damit:

µ <0 ⇐⇒ µA< µB µ= 0 ⇐⇒ µAB µ >0 ⇐⇒ µA> µB I Mitx1:=x1A−x1B, . . . ,xn:=xnA−xnB liegt eine Realisation einer einfachen

StichprobeX1:=X1A−X1B, . . . ,Xn:=XnA−XnB vom Umfangnzu Y =YA−YB vor.

I Dar¨uberhinaus gilt: Ist (YA,YB) gemeinsam (zweidimensional) normalverteilt, so ist auch die DifferenzY =YA−YB normalverteilt.

Es liegt also nahe, die gemeinsame Stichprobe zu (YA,YB) zu

”einer“

Stichprobe zuY =YA−YB zusammenzufassen und den bekanntent-Test f¨ur den Mittelwert einer (normalverteilten) Zufallsvariablen bei unbekannter Varianz auf der Grundlage der einfachen StichprobeX1, . . . ,Xn zuY durchzuf¨uhren.

Prinzipiell w¨are bei bekannter Varianz vonY =YA−YB auch ein entsprechender Gauß-Test durchf¨uhrbar; Anwendungen hierf¨ur sind aber selten.

(3)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1

Zusammenfassung: t-Differenzentest

Anwendungs- exakt: (YA,YB) gemeinsam (zweidimensional) normalverteilt, voraussetzungen E(YA) =µA,E(YB) =µB sowie Varianzen/Kovarianz unbekannt

approx.: E(YA) =µA,E(YB) =µB,Var(YA),Var(YB) unbek.

(X1A,X1B), . . . ,(XnA,XnB) einfache Stichprobe zu (YA,YB) Nullhypothese H0AB H0A≤µB H0A≥µB

Gegenhypothese H1A6=µB H1A> µB H1A< µB

Teststatistik t= X

S

√n

Verteilung (H0) tf¨urµAB (n¨aherungsweise)t(n−1)-verteilt Ben¨otigte Gr¨oßen Xi =XiA−XiB f¨uri ∈ {1, . . . ,n}, X =1

n

n

X

i=1

Xi

S= v u u t

1 n−1

n

X

i=1

(Xi−X)2= v u u t

1 n−1

n

X

i=1

Xi2−nX2

!

Kritischer Bereich (−∞,−tn−1;1−α

2) (tn−1;1−α,∞) (−∞,−tn−1;1−α) zum Niveauα ∪(tn−1;1−α2,∞)

p-Wert 2·(1−Ft(n−1)(|t|)) 1−Ft(n−1)(t) Ft(n−1)(t)

(4)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1

Beispiel: Montagezeiten von zwei Verfahren

Untersuchungsgegenstand: Ist ein neu vorgeschlagenes Montageverfahren besser (im Sinne einer im Mittel k¨urzeren BearbeitungsdauerYB) als das zur Zeit eingesetzte Montageverfahren (mit BearbeitungsdauerYA)?

Stichprobeninformation: Zeitmessungen der MontagedauernxiA f¨ur Verfahren AundxiB f¨ur VerfahrenB beidenselbenn= 7 Arbeitern:

Arbeiteri 1 2 3 4 5 6 7

xiA 64 71 68 66 73 62 70 xiB 60 66 66 69 63 57 62

Annahme: (YA,YB) gemeinsam normalverteilt, (X1A,X1B), . . . ,(XnA,XnB) einfache Stichprobe zu (YA,YB).

Gew¨unschtes Signifikanzniveau:α= 0.05

Geeigneter Test: Exaktert-Differenzentestf¨ur verbundene Stichproben

1 Hypothesen:

H0A≤µB gegen H1A > µB

2 Teststatistik:

t= X S

√nist unterH0t(n−1)-verteilt (f¨urµAB).

(5)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei verbundenen Stichproben 9.1

3 Kritischer Bereich zum Niveauα= 0.05:

K = (tn−1;1−α,+∞) = (t6;0.95,+∞) = (1.943,+∞)

4 Berechnung der realisierten Teststatistik:

Arbeiter i 1 2 3 4 5 6 7

xiA 64 71 68 66 73 62 70 xiB 60 66 66 69 63 57 62 xi =xiA−xiB 4 5 2 −3 10 5 8 Mitx= 17P7

i=1xi = 4.4286 unds= q 1

7−1

P7

i=1(xi−x)2= 4.1975:

t= x s

√n=4.4286 4.1975

7 = 2.7914

5 Entscheidung:

t= 2.7914∈(1.943,+∞) =K ⇒ H0wird abgelehnt!

(p-Wert: 1−Ft(6)(t) = 1−Ft(6)(2.7914) = 1−0.9842 = 0.0158)

Der Test kommt also zur Entscheidung, dass das neue Montageverfahren eine im Mittel signifikant k¨urzere Montagedauer aufweist.

(6)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Mittelwertvergleiche bei zwei unabh¨ angigen Stichproben

Liegen zwei unabh¨angige StichprobenX1A, . . . ,XnAA undX1B, . . . ,XnBB zu jeweils normalverteilten ZufallsvariablenYA undYB vor, kann eine

”Aggregation“ zu einer einzigen Stichprobe wie beim Vorliegen verbundener Stichproben so nicht durchgef¨uhrt werden.

Verglichen werden nun nicht mehr Beobachtungspaare, sondern die (getrennt) berechneten MittelwerteXA undXB der beiden Stichprobenrealisationen zuYA bzw.YB.

Wir setzen zun¨achst dieNormalverteilungsannahme f¨ur YA und YB voraus!

Die DifferenzXA−XB ist wegen der Unabh¨angigkeit der Stichproben dann offensichtlich normalverteilt mit ErwartungswertµA−µB (f¨urµAB gilt also gerade E(XA−XB) = 0) und Varianz

Var(XA−XB) = Var(XA) + Var(XB) = σA2 nA2B

nB .

Sind die beteiligten Varianzen bekannt, kann zum Vergleich vonµA undµB somit unmittelbar ein exakter Gauß-Test konstruiert werden.

(7)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Zusammenfassung: 2-Stichproben-Gauß-Test

bei bekannten Varianzen

Anwendungs- exakt:YA∼N(µA, σ2A),YB∼N(µB, σB2), σA2, σ2B bekannt voraussetzungen X1A, . . . ,XnAA einfache Stichprobe zuYA, unabh¨angig von

einfacher StichprobeX1B, . . . ,XnBB zuYB.

Nullhypothese H0AB H0A≤µB H0A≥µB

Gegenhypothese H1A6=µB H1A> µB H1A< µB

Teststatistik N= XA−XB

qσA2 nA +σnB2

B

Verteilung (H0) Nf¨urµAB N(0,1)-verteilt Ben¨otigte Gr¨oßen XA= n1

A

PnA

i=1XiA, XB= n1

B

PnB i=1XiB

Kritischer Bereich (−∞,−N1−α2) (N1−α,∞) (−∞,−N1−α)

zum Niveauα ∪(N1−α

2,∞)

p-Wert 2·(1−Φ(|N|)) 1−Φ(N) Φ(N)

(8)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Sind die VarianzenσA2 undσ2B unbekannt, so ist zu unterscheiden, ob man wenigstensσ2AB2 annehmen kann oder nicht.

Im Fall ¨ubereinstimmender VarianzenσA22B wird diese mit Hilfe eines gewichteten MittelwertsS2der Stichprobenvarianzen

SY2A = 1 nA−1

nA

X

i=1

(XiA−XA)2 und SY2B = 1 nB −1

nB

X

j=1

(XjB−XB)2

in der Form

S2= (nA−1)SY2A+ (nB −1)SY2B

nA+nB−2 = PnA

i=1(XiA−XA)2+PnB

j=1(XjB−XB)2 nA+nB−2

gesch¨atzt, ein exaktert-Test ist damit konstruierbar.

F¨urnA=nB erh¨alt man die einfachere DarstellungS2=SY2A+SY2B

2 .

(9)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Zusammenfassung: 2-Stichproben-t-Test

bei unbekannten, aber ¨ubereinstimmenden Varianzen

Anwendungs- exakt:YA∼N(µA, σ2A),YB∼N(µB, σB2), µA, µB, σA22B unbek.

voraussetzungen approx.: E(YA) =µA,E(YB) =µB,Var(YA) = Var(YB) unbekannt X1A, . . . ,XnAA einfache Stichprobe zuYA, unabh¨angig von

einfacher StichprobeX1B, . . . ,XnBB zuYB.

Nullhypothese H0AB H0A≤µB H0A≥µB

Gegenhypothese H1A6=µB H1A> µB H1A< µB

Teststatistik t= XA−XB

qS2 nA +Sn2

B

=XA−XB S

rnA·nB

nA+nB

Verteilung (H0) t f¨urµAB (n¨aherungsweise)t(nA+nB−2)-verteilt Ben¨otigte Gr¨oßen XA= n1

A

PnA

i=1XiA, XB= n1

B

PnB i=1XiB, S=

r

(nA−1)S2

Y A+(nB−1)S2 Y B nA+nB−2 =

r

PnA

i=1(XiA−XA)2+PnB

i=1(XiB−XB)2 nA+nB−2

Kritischer Bereich (−∞,−tn

A+nB−2;1−α

2) (tnA+nB−2;1−α,∞) (−∞,−tnA+nB−2;1−α) zum Niveauα ∪(tn

A+nB−2;1−α

2,∞)

p-Wert 2·(1Ft(nA+nB−2)(|t|)) 1Ft(nA+nB−2)(t) Ft(nA+nB−2)(t)

(10)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Beispiel: Absatzwirkung einer Werbeaktion

Untersuchungsgegenstand: Hat eine spezielle Sonderwerbeaktion positiven Einfluss auf den mittleren Absatz?

Stichprobeninformation: Messung der prozentualen Absatz¨anderungen x1A, . . . ,x10A innA= 10 Superm¨arktenohneSonderwerbeaktion und x1B, . . . ,x5B innB = 5 Superm¨arktenmitSonderwerbeaktion.

Annahme: F¨ur prozentuale Absatz¨anderungenYA ohne bzw.YB mit Sonderwerbeaktion giltYA∼N(µA, σA2),YB∼N(µB, σB2), µA, µB, σ2AB2 unbekannt,X1A, . . . ,X10A einfache Stichprobe zuYA, unabh¨angig von einfacher StichprobeX1B, . . . ,X5B zuYB.

(Zwischen-)Ergebnisse aus Stichprobenrealisation:

xA= 6.5, xB = 8, sY2A = 20.25, sY2B = 23.04

⇒s= s

(nA−1)sY2A + (nB−1)sY2B nA+nB−2 =

r9·20.25 + 4·23.04

13 = 4.5944

Gew¨unschtes Signifikanzniveau:α= 0.05 Geeigneter Test:

2-Stichproben-t-Test bei ¨ubereinstimmenden, aber unbekannten Varianzen

(11)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

1 Hypothesen:

H0A≥µB gegen H1A < µB

2 Teststatistik:

t= XA−XB S

r nA·nB

nA+nB ist unter H0t(nA+nB−2)-verteilt (f¨urµAB).

3 Kritischer Bereich zum Niveauα= 0.05:

K = (−∞,−tnA+nB−2;1−α) = (−∞,−t13;0.95) = (−∞,−1.771)

4 Berechnung der realisierten Teststatistik:

t= xA−xB s

rnA·nB nA+nB

= 6.5−8 4.5944

r 10·5

10 + 5 =−0.5961

5 Entscheidung:

t=−0.5961∈/ (−∞,−1.771) =K ⇒ H0wird nicht abgelehnt!

(p-Wert:Ft(13)(t) =Ft(13)(−0.5961) = 0.2807)

Der Test kommt also zur Entscheidung, dass eine positive Auswirkung der Sonderwerbeaktion auf die mittlere prozentuale Absatz¨anderung nicht best¨atigt werden kann.

(12)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Sonderfall: Vergleich von Anteilswerten

Ein Sonderfall des (approximativen) 2-Stichproben-t-Test bei unbekannten, aber ¨ubereinstimmenden Varianzen liegt vor, wenn zwei Anteilswerte miteinander verglichen werden sollen.

Es gelte also speziellYA∼B(1,pA) undYB∼B(1,pB) f¨urpA∈(0,1) und pB ∈(0,1), außerdem seienX1A, . . . ,XnAA sowieX1B, . . . ,XnBB unabh¨angige einfache Stichproben vom UmfangnA zu YA bzw. vom UmfangnB zuYB. Zur ¨Uberpr¨ufung stehen die Hypothesenpaare:

H0:pA=pB H0:pA≤pB H0:pA≥pB

gegen H1:pA6=pB H1:pA>pB H1:pA<pB

F¨ur die Varianzen von YA undYB gilt bekanntlich Var(YA) =pA·(1−pA) bzw. Var(YB) =pB·(1−pB), d.h. die Varianzen sind zwar unbekannt, unter H0 — genauer f¨urpA=pB — jedoch gleich.

Mit den ¨ublichen SchreibweisenbpA:= n1

A

PnA

i=1XiA bzw.bpB := n1

B

PnB i=1XiB erh¨alt man f¨urS2in Abh¨angigkeit vonbpA undbpB die Darstellung:

S2=nA·bpA·(1−bpA) +nB·bpB·(1−bpB) nA+nB−2

Approximation vern¨unftig, falls 5≤nAbpA≤nA−5 und 5≤nBbpB ≤nB−5 .

(13)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Zusammenfassung: 2-Stichproben-t-Test f¨ ur Anteilswerte

Anwendungs- approx.:YA∼B(1,pA),YB∼B(1,pB),pA,pB unbekannt voraussetzungen X1A, . . . ,XnAA einfache Stichprobe zuYA, unabh¨angig von

einfacher StichprobeX1B, . . . ,XnBB zuYB.

Nullhypothese H0:pA=pB H0:pA≤pB H0:pA≥pB

Gegenhypothese H1:pA6=pB H1:pA>pB H1:pA<pB

Teststatistik t= bpA−bpB

qS2 nA +Sn2

B

=bpA−bpB

S

rnA·nB

nA+nB

Verteilung (H0) tf¨urpA=pB n¨aherungsweiset(nA+nB−2)-verteilt (N¨aherung ok, falls 5≤nAbpA≤nA−5 und 5≤nBbpB≤nB−5) Ben¨otigte Gr¨oßen bpA= n1

A

PnA

i=1XiA, bpB= n1

B

PnB i=1XiB, S=

qnA·bpA·(1−bpA)+nB·bpB·(1−bpB) nA+nB−2

Kritischer Bereich (−∞,−tnA+nB−2;1−α

2) (tnA+nB−2;1−α,∞) (−∞,−tnA+nB−2;1−α) zum Niveauα ∪(tnA+nB−2;1−α

2,∞)

p-Wert 2·(1Ft(nA+nB−2)(|t|)) 1Ft(nA+nB−2)(t) Ft(nA+nB−2)(t)

(14)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Beispiel: Vergleich von zwei Fehlerquoten

mit approximativem 2-Stichproben-t-Test f¨ur Anteilswerte

Untersuchungsgegenstand: Vergleich von Fehlerquoten zweier Sortiermaschinen

F¨ur einen automatisierten Sortiervorgang werden eine g¨unstige (A) sowie eine hochpreisige Maschine (B) angeboten. Es soll anhand von 2 (unabh¨angigen) Testl¨aufen mit jeweilsnA=nB = 1000 Sortiervorg¨angen ¨uberpr¨uft werden, ob die FehlerquotepA bei der g¨unstigen MaschineAh¨oher ist als die FehlerquotepB der hochpreisigen MaschineB.

Resultat der Testl¨aufe soll jeweils als Realisation einer einfachen Stichprobe aufgefasst werden k¨onnen.

Stichprobeninformation: Bei MaschineAtraten 29 Fehler auf, bei Maschine B 21 Fehler.

(Zwischen-) Ergebnisse aus Stichprobenrealisation:bpA =100029 = 0.029, bpB =100021 = 0.021,s=

q1000·0.029·(1−0.029)+1000·0.021·(1−0.021)

1000+1000−2 = 0.156

Gew¨unschtes Signifikanzniveauα= 0.05.

(15)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

1 Hypothesen:

H0:pA≤pB gegen H1:pA >pB

2 Teststatistik:

t= bpA−bpB

S

rnA·nB

nA+nB

ist unterH0n¨aherungsweiset(nA+nB −2)-verteilt (f¨urpA=pB). N¨aherung ok, da 5≤29≤995 und 5≤21≤995.

3 Kritischer Bereich zum Niveauα= 0.05:

K = (tnA+nB−2;1−α,+∞) = (t1998;0.95,+∞) = (1.646,+∞)

4 Berechnung der realisierten Teststatistik:

t= bpA−bpB s

rnA·nB nA+nB

= 0.029−0.021 0.1562

r1000·1000

1000 + 1000 = 1.1452

5 Entscheidung:

t= 1.1452∈/(1.646,+∞) =K ⇒ H0wird nicht abgelehnt!

(p-Wert: 1−Ft(1998)(t) = 1−Ft(1998)(1.1452) = 1−0.8739 = 0.1261) Der Test kommt also zum Ergebnis, dass eine h¨ohere Fehlerquote der g¨unstigen Maschine nicht best¨atigt werden kann.

(16)

9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabh¨angigen Stichproben 9.2

Approximativer 2-Stichproben-Gauß-Test

ur Mittelwertvergleiche, wenn Gleichheit der Varianzen ungewiss

Kann in der Situation des exakten 2-Stichproben-t-Test (YA undYB sind normalverteilt mit unbekannten Varianzen) auch unterH0 keine Gleichheit der Varianzen vorausgesetzt werden, m¨ussen andere Testverfahren verwendet werden, z.B. derWelch-Test(hier nicht besprochen).

Als approximativer Test l¨asst sich (zumindest bei hinreichend großen Stichprobenumf¨angen,

”Daumenregel“nA >30 undnB >30) auch eine leichte Modifikation des 2-Stichproben-Gauß-Tests aus Folie 187 verwenden.

Anstelle der (dort als bekannt vorausgesetzten) VarianzenσA2 undσ2B sind die erwartungstreuen Sch¨atzfunktionenSY2A undSY2B einzusetzen und der Test als approximativer Test durchzuf¨uhren.

Die Teststatistik nimmt damit die Gestalt N= XA−XB

r

S2

Y A

nA +S

2 Y B

nB

an und ist unterH0n¨aherungsweise standardnormalverteilt.

Referenzen

ÄHNLICHE DOKUMENTE

7.4.2 Pr¨ ufen der Gleichheit der Mittelwerte zweier unabh¨ angi- ger normalverteilter Zufallsvariablen...

Es wurden Sauerstoff- und Blutdruckinterventionen in 11 Patienten mit aSAB oder schwerem SHT durchgeführt und sowohl die Reaktionszeiten beider Sonden verglichen als

Die Datensätze für die Betrachtung der mittleren Anästhesie- wirkungszeit und damit der Dauer der Weichteilanästhesie zei- gen, dass Ubistesin™ mite eine Anästhesiewirkungszeit von

quer zu Grenzen der Versorgungseinrichtungen/-sektoren sowie Professionen across services; entlang des Betreuungsverlaufs over time quer zum Leistungserstellungsprozess hoch:

Grundsätzlich kann gesagt werden, dass rea- listische Messungen mit dem GF System durchgeführt werden können, wenn die Tiere möglichst jederzeit das System nutzen können und

• Fünf Patienten bemängelten, das Aufklärungsgespräch sei nicht ausführlich genug oder der Anästhesist in Eile gewesen. • Zwei Patienten hätten gerne mehr Information über

Dependent-means t-Test → Messwiederholungsdesign (gleiche Probanden) Auch Matched Pairs oder Paired Samples

– Independent-means t-Test → Gruppendesign (verschiedene Probanden) Auch Independent-Measures oder Independent Samples t-Test. – Dependent-means t-Test →