28
3 R a n d o m is ie ru n g s- T e st s
3.1
E in f¨u h re n d e s B e is p ie l
aHagel-Experiment:(
Verringertdas ” GrossversuchIV”imNapfgebiet1978-1983)
(Einfacheberlegungen,brauchennurKombinatorikundW.) ¨U mitSilberiodiddieHagelenergie? ” Impfen”vonpotenziellenHagelwolken
Zielgr¨osse:Hagelenergie,gemessenf¨urnWolken.ZweiGruppen:ca.n/2
” geimpft”,Rest
” Kontrolle”.
Yi:HagelenergiederWolkei Gi= n1fallsWolkeigeimpft,0sonst.Hoffnung:YimitGi=1fallentendenziellniedrigeraus.
293.1
bBeobachtet:
Yi=y ∗i 166722585501520461219Gi=g ∗i 11000110
g ∗i :ZufallsauswahlderzuimpfendenWolken.(InWirklichkeit216Wolken;davonwurden94geimpft.) StatistischerTest!H0:KeineWirkung.(−→Widerspruchsbeweis!)UngepaarterZwei-Stichproben-Problem.−→t-Test?KeineAnnahmen
i¨uberdieVerteilungderY!!
30 3.2
S ta tis tis c h e ¨U b e rle g u n g
aNullhypothese=Wahrscheinlichkeitsmodell.¨Ublich:Verteilungf¨urYi;Gi=g ∗i festvorgegeben.Randomisierungstests:Gizuf¨allig;Yi=y ∗i alsfestbetrachtet(Analyse
” bi edingtaufdiey”.) ∗
FallsdasImpfenkeinenEinflussaufdieHagelenergiehat,w
geimpftwordenw oderentsprechendirgendeineranderenAuswahl wenndieWolkenentspr.g=[0,1,0,0,1,1,0,1] (1) i ¨urdenwirdiegenaugleichenWerteyerhalten, ∗
¨aren.
31
Zufallsauswahl:JedeAuswahlvonn/2=4Elementenausn=8hatgleicheWahrscheinlichkeit
p= 84 −1= 170DamitistdieNullhypothesefestgelegt.
323.2 bTeststatistik:SollextremeWerteannehmen,wennAlternativegilt.Alternative:y ∗i mitg ∗i =1sindtendenziellkleiner.
Thg,y ∗i= 1n/2 X
i:gi=0 y ∗i − 1n/2 Xi:g
i=1 y ∗i = 2n Xi y ∗i (1−2gi).
cWieistTunterderNullhypotheseverteilt?
y ∗1 ,...,y ∗n gegeben−→≤ nn/2 m
¨oglicheWertef¨urT.
PhThG,y ∗i=ti= #{g|Thg,y ∗i=t}
nn/2
” Randomisierungs-Verteilung”
33
t
Wahrscheinlichkeit
−5000−3000−1000100030005000
0 / 70 5 / 70 10 / 70 15 / 70 20 / 70
Randomisierungs−Verteilung
t 3600380040004200440046004800
0 / 70 2 / 70 4 / 70 6 / 70 8 / 70
Randomisierungs−Vert., rechter Teil
343.2
dVerwerfungsbereich:α=5%extremsteWerte(sogenaualsm
Beispiel:{t|t≥4643.25}(einseitig). ¨oglich).
eExperiment:
Thg ∗,y ∗i= 14 (855+0+152+1219)
− 14 (16672+25+0+46)=−3629.25EffektindieunerwarteteRichtung!Nullhypothesenichtverworfen;Effektnichtnachgewiesen.(AuchnichtinumgekehrterRichtung.)
353.2
f
*
VoraussetzungdesTests:Unabh¨angigkeit
−→Randomisierung
¨uber76
” potentielleHageltage”
Davon33alsImpftageausgew
¨ahlt.AnzahlImpftagezuf¨allig.
−→AnalysebedingtaufAnzahlHageltagemitImpfung.Eingeschr
¨ankteRandomisierung.
g 7633 =36·10 20m
¨oglicheAuswahlen
−→SimulationderRandomisierungs-Verteilung.
36
3.3
T e st s f¨u r d a s Z w e i- S tic h p ro b e n -P ro b le m
aBeispiell¨asstsichleichtverallgemeinern:
bRandomisierungstestssindauchdannanwendbar,wenndieDurchf¨uhrungdesVersuchskeinenRandomisierungsschrittenth
¨alt.
Voraussetzungen,diedanngeltenm
•DieBeobachtungenm ¨ussen:
•unabh¨angigsein. 0¨ussenunterHgleichverteiltund
Dannstimmtdiegew
DieRandomisierungstestsbildenindiesemSinneden ¨ahlteIrrtumswahrscheinlichkeitαexakt.
(*Schw ” Goldstandard”unterdenstatistischenTests.
¨achereVoraussetzung:
” Austauschbarkeit”.)
373.3 cWennBeobachtungenzuf¨allig:Stichprobe[Y1,...,Yn]−→geordneteSt.Y[1] ,...,Y[n]oderempirischeVerteilungsfunktion bFn(s.Bootstrap)
Vert.derTeststatistik,bedingtauf bFn,=Randomisierungs-Vt.
BedingteW.einesFehlersersterArt,gegeben bFn,=α—f¨urjedeBedingung bFn,unddeshalbauchohneBedingung.
383.3
dBeliebigeTeststatistik.DifferenzderMittelwerteunrobust.
OptimaleTeststatistik?−→Machtf¨urdieAlternative(n)opt.!BrauchtbestimmteVerteilung(s-Familie)
−→optimaleTeststatistik(Likelihood-Ratio-Test)
eBeispiel:Logarithmus-Transformation,dannMittelwertsdifferenz(robustifiziert).
39
t l
Wahrscheinlichkeit
−2.5−1.5−0.50.51.01.52.02.5
0 / 70 5 / 70 10 / 70
Rand.Vert. für log. Werte
010203040506070
0 10 20 30 40 50 60 70
Rang(tg)
Rang(tg l)
g
Vergleich der Test−Statistiken
403.3
fRobustheit.WiesoeinerobusteTeststatistikverwenden,wennderTestauchohnediese
dieIrrtumswahrscheinlichkeitgenaueinh¨alt? ” Vorsichtsmassnahme”
gRangsummentestvonWilcoxon,MannundWhitney(U-Test),
Thg,yi= X
gi=1 Ri= X
i giRi,
Rechtrobust−→TestderWahlf¨urdas2-Stichpr.-ProblemVerteilungderTeststatistikunterH0wiegehabt.
h
*
Hagel-Experiment:KomplizierteTeststatistik,zweidimensional−→zweidim.Verwerfungsbereich.
41
3.4
E in e S tic h p ro b e o d e r z w e i v e rb u n d e n e
aBeispielTranquilizer.Zielgr¨osse:
9Patienten,vorundnachAnwendungdesTranqulizers. ” HamiltondepressionscalefactorIV”.
vorher(X (1)i )1.830.501.622.481.681.881.553.061.30nachher(X (2)i )0.8780.6470.5982.051.061.291.063.141.29 Abnahme(−Yi)0.952-0.1471.0220.430.620.590.49-0.080.01
423.4 bVerbundeneStichproben.DifferenzenYi=X (2)i −X (1)i symmetrischum0verteilt?
H0:F
i¨urjedesYist+und–-Vorzeichengleichwahrscheinlich.
Gi=Vorzeichen,|Yi|=” Yi”imZwei-Stichproben-Problem.F
istWahrsch.=1/2. n 1n¨urjedeVorzeichen-Konstellationg=[g,...,g] (ℓ)(ℓ)(ℓ)
433.4
cTeststatistikThg,zifestlegen,
gi=+1oder=−1,zi>0.Rand.-Vert.PhThG,zi=ti=#{g|Thg,zi=t}/2 n
•Thg,zi=(1/n) Pi gizi=aveihyiientsprichtdemt-Testf¨urgepaarteStichproben.
•Thg,zi=#{i:gi=1}:Vorzeichentest.
•Thg,zi= Pi:gi=1 Ri,Ri:Rangvonzi:Vorzeichen-Rangsummen-TestvonWilcoxon.
44 3.4
eBeispiel:
>wilcox.test(d.tranquilizer[,1],d.tranquilizer[,2],paired=TRUE)Wilcoxonsignedranktestdata:d.tranquilizer[,1]andd.tranquilizer[,2]V=40,p-value=0.03906alternativehypothesis:truemuisnotequalto0knappsignifikant.
Achtung:
Richtig:VergleichmitKontrollgruppeoderCrossover-Versuch. ” Vorher-Nachher-Vergleich”!
45
3.5
S c h
¨a tz u n g e n u n d V e rt ra u e n si n te rv a lle
aModell:Testfragewar:IstVerteilungsymmetrischum0?AllgemeineresModell:Verteilungsymmetrischumµ
⇔Yi−µsymmetrischum0.
Test:TeststatistikThg,y−µ1i.GrosseWerte=AbweichungvonH0:µ.
bDarausergibtsicheineSch
¨atzung:
bµ=argminµ hThg,y−µ1ii
463.5
cVorzeichen-Rangsummen-Test−→Hodges-Lehmann-Sch
hiBetrachteWalshaverages(X+X)/2. ¨atzer.
bµ=medh≤i h(Xh +Xi)/2i.
BeispielTranquilizer:45Walsh-Mittelwerte-0.1470,-0.1135,-0.0800,-0.0685,-0.0350,0.0100,...,1.022Medianbµ=0.46
47 3.5 d
*
Herleitung:X[k] k-t-kleinsterWert.X[k] >0,Zhk=(X[h] +X[k] )/2,h<kZhk<0,wenn|X[h] |>|X[k] |.#{Zhk<0}=#{h||X[h] |<|X[k] |}=R[k] −1 R[k] =#{h|Zhk>0,h≤k}.
X[k] <0=⇒Zhk<0,wennh<k.
Thg,zi= Pi:gi=1 Ri=#{[h,k]|Zhk>0,h≤k}
Nullhypotheseµ=µ0:Thg,zi= Pi:gi=1 Ri=#{[h,k]|Zhk>µ0,h≤k}
Testamwenigstensignifikant,wenndies= n(n+1)2 ist−→bµ=medianhZhk|h≤ki.
48 3.5
fVertrauensintervallf¨urVorzeichen-Rangsummen-Test:
GrenzendesAnn.bereichsvonT:cundc ′=n(n+1)/2+1−cVertrauensgrenzen=c-terundc ′-terWalsh-Mittelwert.
BeispielTranquilizer:c=6,c ′=40,Vertrauensintervall[0.01,0.786].
hAllgemeineTeststatistikThG,z ∗;µi:Betrachte
Qhβi=PhThG,z ∗;µi>Thg ∗,z ∗;µii−βSch
¨atzung=L
Vertrauensgrenzen=Nullstellenf¨ur ¨osungvonQhβ=0.5i=0.
Qhβ=0.025i=0undQhβ=0.975i=0.L
¨osbar!
49
3.6
K o rr e la tio n u n d R e g re ss io n
aKorrelationundeinfacheRegression.Xi,Yi(Xizuf¨alligoderfest)Nullhypothese:
Randomisierung= ” keinZusammenhang”
Wahrsch.jederPermutation=1/n!=1/(n(n−1)...2·1). ” Paarung”=PermutationvonY.
Teststatistik:
•gew
¨ohnlicheKorrelation,
•Rangkorrelation,
•robusteSch
¨atzungdesRegressions-Koeffizienten,...
503.6
bMultipleRegression:PermutationvonYf¨urTestderHypothese,dass
undderZielgr¨ossebesteht. ¨uberhauptkeinZusammenhangzwischendenEingangs-Variablen
cZeitreihen:Beobachtungenunabh¨angig?Randomisierung:Permutation.Testgr¨osse:z.B.ersteAutokorrelation.
dMultipleRegression:EinzelnerKoeffizient(odermehrere)
−→keinstriktrichtigesRandomisierungsmodell.
513.6
e
*
PermutationenundandereRandomisierungen.RegressionundKorrelation:Permutationen.BeizweiodermehrerenGruppen:Auswahlen.Permutationen:vielmehr;vielef¨uhrenzurgleichenGruppenzugeh¨origkeit−→gleicheRandomisierungs-Verteilung.
Hagelversuch:AnzahlpotentielleHageltagezuf¨allig,Anteilgeimpfterzuf¨allig.Randomisierungs-Verteilung:Auswahlenvon33aus76Tagen
−→bedingterTest,geg.dieAnzahlenImpf-undKontrolltage.
52
MerkpunkteRandomisierungs-Tests
•RandomisierungstestshaltendasNiveauexaktein,ohneVoraussetzungenandieVerteilung.(Unabh
¨angigkeitvonBeobachtungenvorausgesetzt.)
•DieTeststatistikkannbeliebigkompliziertsein.Wahlmit(informellen) ¨UberlegungenzurMacht.RobusteTeststatistik(z.B.ausR
¨angen)w
¨ahlen!
•Esk¨onnenauchVertrauensintervallekonstruiertwerden.