318
8 . T e st s
8.3WeitereBeispieleundBegriffe
aBeispielSchlafverl¨angerungNullhypothese:keinUnterschied
Xi∼Nh0,1.5i;Xiunabh¨angig
bAlternativen:(HA)µ:Xi∼Nhµ,1.5imitµ>0(einseitig).
Beobachtungenzusammenfassen!X
” Test-Statistik”U.
319
cVerwerfungsbereich?
U=X∼Nh0,1.5/10ifallsH0gilt.
T=X/ √0.15∼Nh0,1i−→ExtremeWerte:T≥1.64.
x=1.58,t=1.58/1.5=1.05<1.64.Verwerfung.Effektstatistischnachgewiesen.
3208.3
fModern:Statttmitczuvergleichen,k¨onnenwir
PhT>1.05i=PhX>1.58i=0.15ausrechnen.W.vonmindestenssoextremenWertenwiederbeobachtete.P-Wertp
t>1.64⇐⇒p<0.05
321
8.4
V o rg e h e n b e i e in e m st a t. T e st (R e ze p t)
Problemformulieren,inWorten.
NullhypotheseH0.Modellf¨urdieBeobachtungen.Oft:ParametrischeFamilie,H0legtParameterfest.InderRegelm
0¨ochtemanHgernewiderlegen. AlternativenHAwerdeninBetrachtziehen(einseitigoderzweiseitig)
Test-Statistik.VerteilungvonUunterAlternativensollm
−→Test-StatistikU=θ. b 00Oft:Parametertesten:H:θ=θ. verschiedenseinvonderVt.unterderNullhypothese(Macht!). ¨oglichststark
322
ArtdesExperimentes,Beobachtungs-Situation[a]
?Modellef¨ureineBeobachtung:
HHHHjNullhypothese[b]Alternativen[c]
?Test-Statistik[d](1) QQQQQQQQQQs )VerteilungderTest-StatistikunterderNullhypothese[e]
W.dichte
Niveau[f,j](2)
Verwerfungs-bereich[f](1)
323
eVerteilungF0hUivonUunterH0StandardisierteTest-StatistikT.
fKlassischeVariante:Verwerfungsbereichbestimmen.Willk
¨urlich:Niveauαw
¨ahlen.
” KritischerWert”,oftausTabelleoderDiagramm.
Bishierher:Test-Vorschrift
indenLehr-undNachschlageb¨uchernnachzulesen. ” fertigverpackt”
324
ArtdesExperimentes,Beobachtungs-Situation[a]
?Modellef¨ureineBeobachtung:
HHHHjNullhypothese[b]Alternativen[c]
?Test-Statistik[d](1) QQQQQQQQQs )VerteilungderTest-StatistikunterderNullhypothese[e]
Messwerte[h](3) 6 AusrechnendesWertesderTest-Statistik[h](3) 1 6 Nullhypotheseverworfen![i](3)
325
Beobachtungen−→Werttder(standard.)Test-StatistikT
iKlassisch:Entscheidung:Fallst∈K,wirddieNullhypotheseverworfen.
jModern:P-Wertbestimmen.Entscheidung:Fallsp<5%,wirddieNullhypotheseverworfen.
326
8.5
T e st s f¨u r 1 S tic h p ro b e o d e r 2 g e p a ar te
aProblem
0gleicheinemvorgegebenenWertµsein? KanneinbestimmterLageparameter(Erwartungswert,Median) ” eiineStichprobe”:X,i=1,2,...,n,unabh¨angig.
H0:µ=µ0.
µ0:physikalischeKonstante,chemischeKonzentration,Grenzwert.
327Problem
” zweigepaarteoderverbundeneStichproben”:
•BlutdruckvorundnachMedikamenten-Einnahme,
•Schlafl¨angebeizweiSchlafmitteln,
•Gr¨ossevonVaterundSohn(Beobachtungseinh=Fami-lie)
•AnzahlbeobachteterVerhaltenselementevonM
beiLichtundbeiDunkelheit. ¨ausen
” VerbundeneStichproben”
Xi=DifferenzderZielgr¨osseindenbeidenZust¨anden.(evtl.nachTransformation).Frage:Differenz
” im
wesentlichengleichnull”?H0:µ=0.
3288.5
dz-Test:besprochen.
H0:Xi∼Nhµ0,σ 20 i,i=1,...,n,unabh¨angig;dieVarianzσ 20 seibekannt
HA:Xi∼Nhµ,σ 20 i,i=1,...,n,unabh¨angig,mit(a)µ>µ0;(b)µ<µ0;(c)µ6=µ0
U:X= 1n Pni=1 Xi
F0hUi:X∼Nhµ0,σ 20 /ni K:Testgr¨ossestandarisieren:Z= X−µ0σ0/ √n ∼Nh0,1i
329 KritischeWertef¨urZ:(a)cso,dass1−Φhci=0.05⇒c=1.64;K={Z≥1.64}(b)cso,dassΦhci=0.05⇒c=−1.64;K={Z≤−1.64}(c)c1so,dass1−Φhc1i=0.025⇒c1=1.96;c0so,dassΦhc0i=0.025⇒c0=−c1;K={|Z|≥1.96}
KritischeWertef¨urstandardisierteTestgr¨osseunabh¨angigvonn,µ0,σ0.
BeispielReifen(nachLehn+Wegmann,1992).Vergleichvon2ProfilenaufWinterreifenbez
010Testfahrzeuge.σ=3ausfr¨uherenVersuchen. ¨ugl.Bremswirkung
330
iProfilAProfilBDifferenzVorzeichen144.544.90.4+255.054.8–0.2–352.555.63.1+450.255.25.0+545.355.610.3+646.147.71.6+752.153.00.9+850.549.1–1.4–950.652.31.7+1049.250.71.5+mittlereDifferenz2.29
z=2.29/(3/ √10)=2.41∈K:−→DieReifensortenunterscheidensichstatistischsignifikantinderL
¨angedesBremsweges.
331
fMeistens:NullhypotheseXi∼Nhµ0,σ 2i,unabh¨angig,
σunbekannt.NichteineeinzigeVerteilung,sondernalleNormalverteilungenmitErwartungswertµ0.
σ 2:St¨or-Parameter,nuisanceparameter.
σdurchdenSch
¨atzwertbσ=Sersetzen!
T= X−µ0S/ √n = X−µ0q1n(n−1) P(Xi−X) 2
332 8.5
gSschwanktzuf¨allig.Tnichtnormalverteilt.VerteilungvonTh¨angtnurvomStichprobenumfangnab.m=n−1
” Freiheitsgrade”.
VerteilungvonT:gr
¨ossereVarianzundlangschw
¨anziger.
1 3 715
−303 0 0.4 N fhti
tt-TestvonStudent.
333
iS/ √n:Sch
desarithmetischenMittelsX, 0¨atzungderStandard-Abweichungσ/n √
” Standardfehler”,standarderrorse.
jBeispielReifen:S 2=
19 (0.4−2.29) 2+(0.2−2.29) 2+...+(1.5−2.29) 2 =3.31 2,Standardfehlerse=3.31/ √10=1.048,t=2.29/1.048=2.18.
m=10−1.Krit.Wert2.26>|t|.H0nichtverworfen!
EinseitigerTest:KritischerWert1.83.Signifikant!Interpretation?
334 8.5
kVorzeichen-Test(oderZeichen-Test).Testgr¨osse=AnzahlBeobachtungengr
i0=AnzahlpositiveVorzeichenvonX−µ. 0¨osseralsµ lH0:Xi∼F0mitMedianµ0,unabh¨angig.
HA:Xi∼FmitMedianµ;(a)µ>µ0,(b)µ<µ0,(c)µ6=µ0.
U:U=Anzahl{i|Xi>µ0} F0hUi:P0hXi>µ0i=1/2,U∼Bhn,1/2i.
K:Tabelle!
mBeispielReifen:8positiveVorzeichenvonn=10.Tabelle:c0=1,c1=n−c0=9.NullhypothesedurchdenVorzeichentestnichtabgelehnt.
335
KeineNormalverteilungvorausgesetzt!Aber:Information
” verschenkt”.
Rangsummen-TestvonWilcoxonf¨urgepaarteStichprobenoderVorzeichen-Rangsummen-Test(signedranktest,one-sampleWilcoxontest).
H0:Xi∼F0,unabh.,F0stetigundsymmetrischbez.µ0
HA:Xi∼F,unabh¨angig,Fsymmetrischbez.(a)µ>µ0;(b)µ<µ0;(c)µ6=µ0.
336
U:NachfolgendemRezeptzubilden:1.BildeX ′i =Xi−µ0,streichedienegativenVorzeichen,bildedieR
i¨angeR.
Ri=rank D|X ′i | |X ′1 |,|X ′2 |,...,|X ′n | E.BeispielReifen:µ0=0,Xi−µ0DifferenzderBremswege.R
ii0iSeiV=1,fallsX−µ>0ist,V=0sonst. Beispiel:2+8+9+10+6+3+7+5=50. ii02.SummieredieR,f¨urdieX−µ>0 i¨angeR:2,1,8,9,10,6,3,4,7,5.
U += Pni=1 ViRi.Beispiel:u +=1·2+0·1+1·8+1·9+1·10+1·6+1· 3+0·4+1·7+1·5=50.U −= Pni=1 (1−Vi)Ri.U ++U −= Pni=1 Ri=n(n+1)/2.
337
0hUi:VerteilungvonU +oderU −h¨angtnichtvonrVerteilungFab(solangesiestetigist).
:Bisn=30ausTabelle:
)causderZeile” c,einseitig”;
K={U +≥n(n+1)/2−c}={U −≤c};
)causderZeile” c,einseitig”;K={U +≤c};
)c0ausderZeile” c0,zweiseitig”;
K={U +≤c0}∪{U +≥n(n+1)/2−c0}
={minhU +,U −i≤c0}.F
¨urgr
¨osseren:ApproximationdurchdieNormalvert.
338
n12345678910
c,einseitig----0235810c0,zweiseitig---02358
n11121314151617181920
c,einseitig13172125303541475360c0,zweiseitig10131721252934404653
n21222324252627282930
c,einseitig586573818998107116126137c0,zweiseitig67758391100110119130140151
339eispielReifen:u +=50,u −=5.abellenwertc0=8,n(n+1)/2−c0=47<u +(u −≤8).ullhypotheseverworfen.
istasymptotischnormalverteilt.
hU +i= n(n+1)4 ,varhU +i= n(n+1)(2n+1)24 Z += U +−EhU +ipvarhU +i = U +−n(n+1)/4pn(n+1)(2n+1)/24 ≈∼Nh0,1i
erwerfungsbereich(zweiseitig):|Z +|≥1.96.
340 8.5
qKeine(
Bindungen:R (Vert.vonT=bedingteVert.,gegebendieAnzahlNullen). i0Nullen(X=µ)weglassen. ” Bindungen”),ties)oderNullen!
¨angeaufteilen.Asymptot.N
Varianz. ¨aherungmitkorrig.
HerleitungderVerteilungvonU +:WieverteilensichdieVorzeichenaufdieR
−→VerteilungvonU. + 1/2. 10 JedeFolgevon10VorzeichenhatgleicheWahrscheinlichkeit 3.Zeilezuf¨allig,Bernoulli-vert. iv0110111111 i Vorzhxi–++–++++++ ′ i Rangh|x|i12345678910 ′ i |x|0.20.40.91.41.51.61.73.15.010.3 ′ 0¨ange,wennHgilt?
341
rTest-Statistiken,derenVerteilungnichtvoneinemkonkretenparametrischenModellf¨urdieBeobachtungenabh¨angt,unddieentsprechendenTestsnenntmannicht-parametrisch(oderverteilungsfrei).Rangtest.
Genaueres,AllgemeineresunterdenStichwortenRandomisierungs-TestsoderPermutations-Tests.
sWilcoxon-Testn¨utztabsoluteGr¨ossederpositivengegen¨uberdennegativenXi−µ0aus.Nullhypotheseist
” sch
F EswirdSymmetrievorausgesetzt. ¨arfer”alsbeimVorzeichnetest:
¨urDifferenzenderPaarebeiverbundenenStichpr.naheliegend.
tWelchenTestw
¨ahlen?
342
8.6
In te rp re ta tio n vo n T e st e rg e b n is se n
aVerwerfungderNullhypothese.Interpretation?(1)EinEffektistnachgewiesen,eine
(2)NullhypotheseaufandereWeiseverletzt: ” Alternative”istrichtig,
•DatenenthaltensystematischenFehler,
•Xisindnichtunabh¨angig,
•nichtnormalverteilt(beimt-Test),nichtsymmetrischverteilt(beimRangsummen-Test),nichtallegleichverteiltmedhXiiversch.beimVorz.t. ,(3)esistzuf¨alligdasunwahrscheinl.EreignisKeingetreten.
343
(3)istunvermeidbar.W.durchSignifikanzniveaukontrolliert.Manm
ii(D)X∼FmitMedianµ,sonstbeliebig→Vorzeichen-Test. Test. i(C)X∼Fsymmetrischumµ,sonstbel.→Rangsummen- 00i(B)X∼Nhµ,σi,σunbekannt→t-Test. 22 00i(A)X∼Nhµ,σi,σbekannt→z-Test. 22 Aberwie? ¨ochte(2)vermeiden,um(1)schliessenzuk¨onnen.
Unabh
i¨angigkeitderX.
3448.6
c•Annahme,dassdieNullhypotheseodereineAlternative
istVoraussetzungf¨urdieAnwendungdesTests. ” gilt”,
d•GesamteNullhypothesef¨uhrtzu
(soweitm AbweichungenvondenanderenAnnahmenwegdiskutieren ” statistischemWiderspruch”.
¨oglich
¨uberpr
¨ufen).
eTestsverwenden,diem
immerVorzeichen-TeststattRangsummen-Test. AlsoimmerRangsummen-Teststattt-oderz-Test, brauchen! ¨oglichstwenigeVoraussetzungen
345
fNein!Informationausn
Dieallzugrossz ¨utzen.Macht=W.f¨urFehler2.Art. bezahltmanmiteinemVerlustanMacht. ¨ugigeLockerungderVoraussetzungen
KonkreteEmpfehlungf¨urdasTesteneinesLageparameters:
•Rangsummen-TestvonWilcoxonanwenden,fallsVerteilungsymmetrischistwegen–theoretischen
–Vorwissen(fr –empirischenResultateningrossenDatens¨atzen, ¨uberlegungen(z.B.Differenzen),
¨uhereStudienmit
¨ahnlichenDaten);
•sonstVorzeichen-Testdurchf
¨uhren;
346
•t-Test(undz-Test)vermeiden.GewinnanMachtf¨urnormalverteilteBeob.minim.Wennnichtgenaunormalvert.,hatderRangsummen-Testmeistensgr
(Ausnahme:SehrkleineStichproben). ¨ossereMachtalsdert-Test
347
8.7
D e r P -W e rt
t fhti
t ∗ P-Wert
α=5%
c0
Signifikanz:Test-Statistikrechtsvonc0(∈K)⇐⇒P-Wertkleinerals5%–undumgekehrt.
P-Wert:verfeinertes
P=6%:knappnichtsignifikant,Nachdenken ” MassderSignifikanz”.
P=74%:keinHinweisaufAbweichungvonderNullhypothese. ” erlaubt”.
3488.7
dLiteratur,
¨altereKonvention:
P>0.05nichtsignifikant(n.s.)0.05≥P>0.01schwachsignifikant*0.01≥P>0.001starksignifikant**0.001≥Psehrstarksignifikant***
z=2.63 ∗∗.z=1.46(n.s.).
349
eHinweise:
•P-Wert=transformierteTest-StatistikmituniformerVert.
•MitP-Wertkannmaneinfacherentscheidenalsmitt.Computermussmehrarbeiten.
•Achtung:WegenFaulheitderProgrammiereroftunexakteTests!(AsymptotischeN
¨aherungauchbeikleinenStichproben!)
•P-WertausverschiedenenTests?!
•P-WertundWahrscheinlichkeit!
BITTENICHT! ” DieWahrscheinlichkeitf¨urdieNullhypotheseist10%.”
” DieIrrtums-Wahrscheinlichkeitist3%.”(auchnicht.)
350
•Beidiskretvert.TistderP-Wertauchdiskretverteilt.
010 0 1
01 0 1
xt F (X)F (PW)
351
8.8
V e rg le ic h vo n zw e i q u a n tit a tiv e n S tic h -
p ro b e n
EinigeFragestellungen:•UnterscheidensichPuppengewichtevonFliegen(dergl.Art),diesichingleichgrossenTierenverschiedenerWirtsartenentwickeln?
•HabenRaucherundNichtraucherunterschiedl.Blutdruck?
•UnterscheidensichSchneckenaufMager-&Fettwiesen?
•F
¨uhrtD
¨ungersorteAzuh¨oheremErtragalsD
Zielgr¨ossseYmessen. JeeineStichprobeauszweiverschiedenenGrundgesamtheiten. ¨ungerB?
3528.8 bUnterscheidungvongepaartenStichproben:Stichprobenumf¨angen1undn2k¨onnenf¨urunabh.Stichprobenverschiedensein;beigepaartenStichprobenimmergleichgross.
353Modell:Y1,1,Y1,2,...,Y1,n1 Y2,1,Y2,2,...,Y2,n2Y1,i∼F1,i=1,2,...,n1;
Y2,i∼F2,i=1,2,...,n2; Y1,1,Y1,2,...,Y1,n1 ,Y2,1,...,Y2,n2 alleunabh¨angig.
H0:F1=F2.AlleYhabengleicheVerteilung.
HA:F1undF2unterscheidensichdurcheineVerschiebungδ:F2hxi=F1hx−δiSpeziell:Y1,i∼Nhµ,σ 2iY2,i∼Nhµ+δ,σ 2i.
δinteressierenderParameter,µ,σSt¨or-Parameter.
e bδ=Y2,·−Y1,·=(Y2,1+...+Y2,n2 )/n2−(Y1,1+...+Y1,n1 )/n1
3548.8
fZwei-Stichproben-z-Test.BeispielMastochsen.2Futterartenvergleichen.Zielgr¨osse:mittlerew
EinseitigeAlternative. 0Erfahrung:SolcheGewichtszunahmen≈∼Nh...,(σ=1.8kg)i. 2 ¨ochentlicheGewichtszunahmein1Monat.
355
H0:Yk,i∼Nhµ,σ 20 i(i.i.d.);
HA:Y1,i∼Nhµ1,σ 20 i;Y2,i∼Nhµ1+δ,σ 20 ieinseitig:δ>0.
U:U=Y2,·−Y1,·
F0hUi:Yk,· ∼Nhµ,σ 20 /nk i,also
U=Y2,·−Y1,·∼N 0,σ 20
12(1)/n+1/n
Z= Y2,·−Y1,·pσ 20 (1/n1+1/n2) ∼Nh0,1i
K:einseitig:K={Z≥1.64}.
3568.8
hMastochsen:
” extensiv”2.72.71.13.01.93.03.83.80.31.91.9
” intensiv”6.55.48.13.50.53.86.84.99.56.24.1
y2,·−y1,·=5.39kg−2.37kg=3.02kg
z=3.02/ p1.8 2·2/11=3.93>1.64.Nullhypothese(wuchtig)verworfen.
(SinneinessolchenTests?Sch
¨atzproblem!)
357
it-Test.
H0:Yk,i∼Nhµ,σ 2i(i.i.d) HA :Y1,i∼Nhµ,σ 2i,Y2,i∼Nhµ+δ,σ 2i,
δ6=0(oderδ>0oderδ<0),unabh¨angig.
ManersetztinderstandardisiertenStatistikf¨urdenz-TestdieVarianzσ 20 durcheineSch
¨atzung,
bσ 2= 1n1+n2−2 n1X
i=1 (Y1,i−Y1,·) 2+ n2X
i=1 (Y2,i−Y2,·) 2 !
.t-Verteilungmitn1+n2−2Freiheitsgraden.
358 8.8
jTestmitwenigerVoraussetzungen!Rangsummen-TestvonWilcoxon,MannundWhitney,U-Test
H0:Yk,i ∼F(i.i.d);Fbel.Vert.
HA:Y1,i∼F1,Y2,i∼F2,F2hxi=F1hx−δi,δ6=0.
U:1.BestimmeRangRk,i bez
¨ugl.
ZweiseitigeFragestellung:T=minhT,Ti. (1)(2) 12(T+T=nn.) (1)(2) kk T=U−n(n+1)/2 (k)(k) 1212(U+U=(n+n)(n+n+1)/2.) (1)(2) i=1i=1 1,i2,i2.U=R(oderU=R) (1)(2)12nn ” vPP ereinigtenStichproben”
F0hUi:VerteilungvonT (k)h¨angtnurvonn1,n2ab.Grossen1,n2:AsymptotischeN
¨aherung.
K:Tabelle.
359
n21234567891011121314151617181920
–––––––––––––––––––––––––––0000111112222––––0112233445566778–––01234456789101111121314––012356789111213141517181920––123568101113141617192122242527––1356810121416182022242628303234–024681013151719222426293134363841–0247101215172023262831343739424548–0358111417202326293336394245485255–0369131619232630333740444751555862–14711141822262933374145495357616569–14812162024283337414550545963677276–15913172226313640455055596469747883–151014192429343944495459647075808590–161115212631374247535964707581869298–2611172228343945515763697581879399105–27121824303642485561677480869399106112–271319253238455258657278859299106113119–2814202734414855626976839098105112119127
360 8.8
kBeispielMastochsen.
Daten·10ext.311191919272730303838int.535384149546265688195
R¨ange P
ext.135557.57.59.59.5131379int.211131516171819202122174
u (1)=79undu (2)=174.(Kontrolle:u (1)+u (2)=22·23/2.)
t (1)=79−11·12/2=13,t (2)=174−11·12/2=108,
t=minht (1),t (2)i=13.
K={T≤30}.Nullhypothesewirdverworfen.
361
VergleichderStreuungen
GrafischerVergleichmitbox-plots.UnterschiedezwischendenMedianenvon2Gruppensignifikant?Kerben.Essollgelten:WennsichdieKerbenvonzweiKistennicht
−→ dannistderUnterschiedzwischendenGruppensignifikant. ¨uberschneiden,
” Notchedboxplots”,gekerbteKisten-Diagramme.
(Testregelnichtnachdem
¨ublichenSchema!)
362
0 20 40 60 80
12
Zuwachs
Behandlung