3 R a n d o m is ie ru n g s- T e st s

(1)

28

3 R a n d o m is ie ru n g s- T e st s

3.1

E in f¨u h re n d e s B e is p ie l

aHagel-Experiment:(

Verringertdas ” GrossversuchIV”imNapfgebiet1978-1983)

(Einfacheberlegungen,brauchennurKombinatorikundW.) ¨U mitSilberiodiddieHagelenergie? ” Impfen”vonpotenziellenHagelwolken

Zielgr¨osse:Hagelenergie,gemessenf¨urnWolken.ZweiGruppen:ca.n/2

” geimpft”,Rest

” Kontrolle”.

Yi:HagelenergiederWolkei Gi= n1fallsWolkeigeimpft,0sonst.Hoffnung:YimitGi=1fallentendenziellniedrigeraus.

(2)

293.1

bBeobachtet:

Yi=y ∗i 166722585501520461219Gi=g ∗i 11000110

g ∗i :ZufallsauswahlderzuimpfendenWolken.(InWirklichkeit216Wolken;davonwurden94geimpft.) StatistischerTest!H0:KeineWirkung.(−→Widerspruchsbeweis!)UngepaarterZwei-Stichproben-Problem.−→t-Test?KeineAnnahmen

i¨uberdieVerteilungderY!!

(3)

30 3.2

S ta tis tis c h e ¨U b e rle g u n g

aNullhypothese=Wahrscheinlichkeitsmodell.Üblich:VerteilungfürYi;Gi=g ∗i festvorgegeben.Randomisierungstests:Gizufällig;Yi=y ∗i alsfestbetrachtet(Analyse

” bi edingtaufdiey”.) ∗

FallsdasImpfenkeinenEinflussaufdieHagelenergiehat,w

geimpftwordenw oderentsprechendirgendeineranderenAuswahl wenndieWolkenentspr.g=[0,1,0,0,1,1,0,1] (1) i ¨urdenwirdiegenaugleichenWerteyerhalten, ∗

¨aren.

(4)

31

Zufallsauswahl:JedeAuswahlvonn/2=4Elementenausn=8hatgleicheWahrscheinlichkeit

p= 84 −1= 170DamitistdieNullhypothesefestgelegt.

(5)

323.2 bTeststatistik:SollextremeWerteannehmen,wennAlternativegilt.Alternative:y ∗i mitg ∗i =1sindtendenziellkleiner.

Thg,y ∗i= 1n/2 X

i:gi=0 y ∗i − 1n/2 Xⁱ^:^g

i=1 y ∗i = 2n X_i y ∗i (1−2gi).

cWieistTunterderNullhypotheseverteilt?

y ∗1 ,...,y ∗n gegeben−→≤ nn/2 m

¨oglicheWertef¨urT.

PhThG,y ∗i=ti= #{g|Thg,y ∗i=t}

nn/2

” Randomisierungs-Verteilung”

(6)

33

t

Wahrscheinlichkeit

−5000−3000−1000100030005000

0 / 70 5 / 70 10 / 70 15 / 70 20 / 70

Randomisierungs−Verteilung

t 3600380040004200440046004800

0 / 70 2 / 70 4 / 70 6 / 70 8 / 70

Randomisierungs−Vert., rechter Teil

(7)

343.2

dVerwerfungsbereich:α=5%extremsteWerte(sogenaualsm

Beispiel:{t|t≥4643.25}(einseitig). ¨oglich).

eExperiment:

Thg ∗,y ∗i= 14 (855+0+152+1219)

− 14 (16672+25+0+46)=−3629.25EffektindieunerwarteteRichtung!Nullhypothesenichtverworfen;Effektnichtnachgewiesen.(AuchnichtinumgekehrterRichtung.)

(8)

353.2

f

*

VoraussetzungdesTests:Unabh

¨angigkeit

−→Randomisierung

¨uber76

” potentielleHageltage”

Davon33alsImpftageausgew

¨ahlt.AnzahlImpftagezuf¨allig.

−→AnalysebedingtaufAnzahlHageltagemitImpfung.Eingeschr

¨ankteRandomisierung.

g 7633 =36·10 20m

¨oglicheAuswahlen

−→SimulationderRandomisierungs-Verteilung.

(9)

36

3.3

T e st s f¨u r d a s Z w e i- S tic h p ro b e n -P ro b le m

aBeispiell¨asstsichleichtverallgemeinern:

bRandomisierungstestssindauchdannanwendbar,wenndieDurchf¨uhrungdesVersuchskeinenRandomisierungsschrittenth

¨alt.

Voraussetzungen,diedanngeltenm

•DieBeobachtungenm ¨ussen:

•unabh¨angigsein. 0¨ussenunterHgleichverteiltund

Dannstimmtdiegew

DieRandomisierungstestsbildenindiesemSinneden ¨ahlteIrrtumswahrscheinlichkeitαexakt.

(*Schw ” Goldstandard”unterdenstatistischenTests.

¨achereVoraussetzung:

” Austauschbarkeit”.)

(10)

373.3 cWennBeobachtungenzuf¨allig:Stichprobe[Y1,...,Yn]−→geordneteSt.Y[1] ,...,Y[n]oderempirischeVerteilungsfunktion bFn(s.Bootstrap)

Vert.derTeststatistik,bedingtauf bFn,=Randomisierungs-Vt.

BedingteW.einesFehlersersterArt,gegeben bFn,=α—f¨urjedeBedingung bFn,unddeshalbauchohneBedingung.

(11)

383.3

dBeliebigeTeststatistik.DifferenzderMittelwerteunrobust.

OptimaleTeststatistik?−→Machtf¨urdieAlternative(n)opt.!BrauchtbestimmteVerteilung(s-Familie)

−→optimaleTeststatistik(Likelihood-Ratio-Test)

eBeispiel:Logarithmus-Transformation,dannMittelwertsdifferenz(robustifiziert).

(12)

39

t l

Wahrscheinlichkeit

−2.5−1.5−0.50.51.01.52.02.5

0 / 70 5 / 70 10 / 70

Rand.Vert. für log. Werte

010203040506070

0 10 20 30 40 50 60 70

Rang(tg)

Rang(^tg l)

g

Vergleich der Test−Statistiken

(13)

403.3

fRobustheit.WiesoeinerobusteTeststatistikverwenden,wennderTestauchohnediese

dieIrrtumswahrscheinlichkeitgenaueinh¨alt? ” Vorsichtsmassnahme”

gRangsummentestvonWilcoxon,MannundWhitney(U-Test),

Thg,yi= X

gi=1 Ri= X

i giRi,

Rechtrobust−→TestderWahlf¨urdas2-Stichpr.-ProblemVerteilungderTeststatistikunterH0wiegehabt.

h

*

Hagel-Experiment:KomplizierteTeststatistik,zweidimensional

−→zweidim.Verwerfungsbereich.

(14)

41

3.4

E in e S tic h p ro b e o d e r z w e i v e rb u n d e n e

aBeispielTranquilizer.Zielgr¨osse:

9Patienten,vorundnachAnwendungdesTranqulizers. ” HamiltondepressionscalefactorIV”.

vorher(X (1)i )1.830.501.622.481.681.881.553.061.30nachher(X (2)i )0.8780.6470.5982.051.061.291.063.141.29 Abnahme(−Yi)0.952-0.1471.0220.430.620.590.49-0.080.01

(15)

423.4 bVerbundeneStichproben.DifferenzenYi=X (2)i −X (1)i symmetrischum0verteilt?

H0:F

i¨urjedesYist+und–-Vorzeichengleichwahrscheinlich.

Gi=Vorzeichen,|Yi|=” Yi”imZwei-Stichproben-Problem.F

istWahrsch.=1/2. n 1n¨urjedeVorzeichen-Konstellationg=[g,...,g] (ℓ)(ℓ)(ℓ)

(16)

433.4

cTeststatistikThg,zifestlegen,

gi=+1oder=−1,zi>0.Rand.-Vert.PhThG,zi=ti=#{g|Thg,zi=t}/2 n

•Thg,zi=(1/n) Pi gizi=aveihyiientsprichtdemt-Testf¨urgepaarteStichproben.

•Thg,zi=#{i:gi=1}:Vorzeichentest.

•Thg,zi= Pi:gi=1 Ri,Ri:Rangvonzi:Vorzeichen-Rangsummen-TestvonWilcoxon.

(17)

44 3.4

eBeispiel:

>wilcox.test(d.tranquilizer[,1],d.tranquilizer[,2],paired=TRUE)Wilcoxonsignedranktestdata:d.tranquilizer[,1]andd.tranquilizer[,2]V=40,p-value=0.03906alternativehypothesis:truemuisnotequalto0knappsignifikant.

Achtung:

Richtig:VergleichmitKontrollgruppeoderCrossover-Versuch. ” Vorher-Nachher-Vergleich”!

(18)

45

3.5

S c h

¨a tz u n g e n u n d V e rt ra u e n si n te rv a lle

aModell:Testfragewar:IstVerteilungsymmetrischum0?AllgemeineresModell:Verteilungsymmetrischumµ

⇔Yi−µsymmetrischum0.

Test:TeststatistikThg,y−µ1i.GrosseWerte=AbweichungvonH0:µ.

bDarausergibtsicheineSch

¨atzung:

bµ=argminµ hThg,y−µ1ii

(19)

463.5

cVorzeichen-Rangsummen-Test−→Hodges-Lehmann-Sch

hiBetrachteWalshaverages(X+X)/2. ¨atzer.

bµ=medh≤i h(Xh +Xi)/2i.

BeispielTranquilizer:45Walsh-Mittelwerte-0.1470,-0.1135,-0.0800,-0.0685,-0.0350,0.0100,...,1.022Medianbµ=0.46

(20)

47 3.5 d

*

Herleitung:X[k] k-t-kleinsterWert.X[k] >0,Zhk=(X[h] +X[k] )/2,h<kZhk<0,wenn|X[h] |>|X[k] |.

#{Zhk<0}=#{h||X[h] |<|X[k] |}=R[k] −1 R[k] =#{h|Zhk>0,h≤k}.

X[k] <0=⇒Zhk<0,wennh<k.

Thg,zi= Pi:gi=1 Ri=#{[h,k]|Zhk>0,h≤k}

Nullhypotheseµ=µ0:Thg,zi= Pi:gi=1 Ri=#{[h,k]|Zhk>µ0,h≤k}

Testamwenigstensignifikant,wenndies= n(n+1)2 ist−→bµ=medianhZhk|h≤ki.

(21)

48 3.5

fVertrauensintervallf¨urVorzeichen-Rangsummen-Test:

GrenzendesAnn.bereichsvonT:cundc ′=n(n+1)/2+1−cVertrauensgrenzen=c-terundc ′-terWalsh-Mittelwert.

BeispielTranquilizer:c=6,c ′=40,Vertrauensintervall[0.01,0.786].

hAllgemeineTeststatistikThG,z ∗;µi:Betrachte

Qhβi=PhThG,z ∗;µi>Thg ∗,z ∗;µii−βSch

¨atzung=L

Vertrauensgrenzen=Nullstellenf¨ur ¨osungvonQhβ=0.5i=0.

Qhβ=0.025i=0undQhβ=0.975i=0.L

¨osbar!

(22)

49

3.6

K o rr e la tio n u n d R e g re ss io n

aKorrelationundeinfacheRegression.Xi,Yi(Xizuf¨alligoderfest)Nullhypothese:

Randomisierung= ” keinZusammenhang”

Wahrsch.jederPermutation=1/n!=1/(n(n−1)...2·1). ” Paarung”=PermutationvonY.

Teststatistik:

•gew

¨ohnlicheKorrelation,

•Rangkorrelation,

•robusteSch

¨atzungdesRegressions-Koeffizienten,...

(23)

503.6

bMultipleRegression:PermutationvonYf¨urTestderHypothese,dass

undderZielgr¨ossebesteht. ¨uberhauptkeinZusammenhangzwischendenEingangs-Variablen

cZeitreihen:Beobachtungenunabh¨angig?Randomisierung:Permutation.Testgr¨osse:z.B.ersteAutokorrelation.

dMultipleRegression:EinzelnerKoeffizient(odermehrere)

−→keinstriktrichtigesRandomisierungsmodell.

(24)

513.6

e

*

PermutationenundandereRandomisierungen.RegressionundKorrelation:Permutationen.BeizweiodermehrerenGruppen:Auswahlen.Permutationen:vielmehr;vielef¨uhrenzurgleichenGruppenzugeh¨origkeit

−→gleicheRandomisierungs-Verteilung.

Hagelversuch:AnzahlpotentielleHageltagezuf¨allig,Anteilgeimpfterzuf¨allig.Randomisierungs-Verteilung:Auswahlenvon33aus76Tagen

−→bedingterTest,geg.dieAnzahlenImpf-undKontrolltage.

(25)

52

MerkpunkteRandomisierungs-Tests

•RandomisierungstestshaltendasNiveauexaktein,ohneVoraussetzungenandieVerteilung.(Unabh

¨angigkeitvonBeobachtungenvorausgesetzt.)

•DieTeststatistikkannbeliebigkompliziertsein.Wahlmit(informellen) ¨UberlegungenzurMacht.RobusteTeststatistik(z.B.ausR

¨angen)w

¨ahlen!

•Esk¨onnenauchVertrauensintervallekonstruiertwerden.