S in n u n d U n si n n st a tis tis c h e r T e st s

(1)

363

8.9Macht

aBisher:H0vorausgesetzt.WahrscheinlichkeitennurunterdieserVoraussetzungberechnet.P (0) VerwerfenvonH0 =αJetzt:Alternativevoraussetzen.Fehler:H0nichtverwerfen.=Fehler2.ArtWahrscheinlichkeitberechnen!

BerechnungvonWahrscheinlichkeitensetztgenauspezifizierteHypothesevoraus!

P (A)hT6∈Ki=1−P (A)hT∈Ki=β (A).

(2)

364

1−β (A)=W.der

sollm ” richtigen”Entscheidung=Macht

¨oglichsthochsein.

(Aufgepasst:InmanchenB

dieMachtmitβbezeichnet.) ¨uchernwird

bKistderVerwerfungsbereich,hergeleitetausderVerteilungderTest-StatistikunterderNullhypotheseDerTest(dieEntscheidungsregel)bleibt.

(3)

3658.9

cBeispielMastochsen:2F

¨utterungsartenvergleichen.

0...d.h.,dassdieTestregelzurVerwerfungvonHf¨uhrt? richtigist,sichdurchdenVersuchstatistischnachweisenl¨asst? WiegrossistdieWahrscheinlichkeit,dassdieserEffekt,fallser ” Wahrer”Unterschiedδ=1.0kg/Woche(Vermutung).

(4)

366 Entscheidungsregel:H0verwerfen,fallsZ>1.64.

−→U=Z· p1.8 2·2/11=Z·0.77,also

Z>1.64−→U>1.64·0.77=1.26.

Vt.vonTunterHAmitδ=1.0kgist

U=Y2·−Y1·∼N δ,σ 20 1n1 + 1n2

=Nh1.0,0.77 2i

Macht1−β (A)=P (A)hU>1.26i

=1−Φ 1.26−10.77 =1−Φh0.34i=0.37

−→Wahrsch.eines

(statistischer ” erfolgreichenAusgangs”desVersuchs

=37%.(!) ” Beweis”einesEffektsgelungen)

(5)

367

01 Macht1−β VerteilungderTest-StatistikU...unterH0unterHA

-Verwerfungsbereich P P PP

α=5%

-

δ u f

(6)

3688.9

dOftkeineVermutungbetreffendEffektδ.

−→MachtalsFunktionvonδ.

n1=n2=n.H0verworfen,wennU>1.64·σ0 p2/nUnterHAgiltU∼N δ,σ 20 2/n

1−β (A)=P (A) DU>1.64·σ0 p2/n E

=1−Φ *1.64·σ0 p2/n−δ

σ0 p2/n +

=1−Φ 1.64− δσ0 pn/2 .

(7)

369

DieMachtnimmtzumit

undStichprobenumfangn. ” s0tandardisiertemEffekt”δ/σ

0.37 0.8

01 n1=n2=11 n1=n2=40 1−β

δ/σ00 1

Macht1−β (A)alsFunktionvonδheisstauchG

β,alsFunktionvonδheisstauchOperations-Charakteristik. (A) ¨utefunktion.

(8)

3708.9 eWiegrossmussnsein,damitbeiδ=1.0undσ0=1.8

1−β (A)=0.80wird?

1−Φ 1.64− 1.01.8 pn/2 =0.8=⇒

1.64−0.56 pn/2=−0.84

n=2· 2.480.56 2=39.2

Esbraucht(etwa)40TiereproGruppe.

−→Versuchsplanung,BerechnungdesStichprobenumfangs.

(9)

3718.9 f

*

Manmussσ0ungef¨ahrkennenundδfestlegen.Vorversuch?NichtparametrischerTest?

g

*

Macht(-funktion)alsQualit

OptimaleSch Optimieren!−→MathematischeStatistik. ¨atskriteriumzurWahleinesTests.

ätzungen−→TestgrössenfüroptimaleTests.

(10)

372

8.11

S in n u n d U n si n n st a tis tis c h e r T e st s

aFachzeitschriften:Mandarfnur

diestatistischaufdem5%-Niveausignifikantsind. ¨uberEffekteschreiben,

−→TestdientalsFiltergegenwildeSpekulationen.

Perversion:UntersucheFragen,f¨urdieeinsignifikantesErgebniserwartetwerdenkann–auchuninteressante...Statistikerunterst¨utzendiesenUnsinnnicht.RelevanzwichtigeralsSignifikanz!

(11)

373 8.11

bUnterschiedzwischen(statistischer)

(praktischer) ” Signifikanz”und

ZukleineundzugrosseStichproben! ” Relevanz”

MitgrossenStichprobenkannmanBagatelleffekte,dieeigentlichniemandeninteressieren,stolzals

” statistischsignifikant”nachweisenundpublizieren.

c

*

Konsequenz?StatistischeTestssindunsinnig!

−→Manm

0¨ussteH:θ≤Schwellenwertγpr

¨ufen!

Regelf¨urEntscheidungzwischenH0:θ≤γundH1:θ>γ.

(12)

3748.11

dWiesoTestsausf¨uhrlichbehandeln?

•FiltergegenwildeSpekulationen

•Grundlagef¨urdasVerst

Wahrscheinlichkeits-ModellenundempirischenDaten. ¨andnisderBeziehungzwischen

•Grundlagef¨urVertrauensintervall.

(13)

3758.11 e ¨Uberpr

iNullhypothese:x∼Nµ,σf¨urirgendeinµ,σ. 2 SindDatennormalverteilt?−→Test! ¨ufungvonAnnahmen

ManwillNullhypothesebeweisen!Dasgehtnicht.AllenfallswiederalsKonventionverwenden,gegendieAnwendungfalscherstatistischerMethoden.

Manm

¨usstenachweisen,dassAbweichungvonderAnnahme

” nochimungef¨ahrlichenBereich”ist.

(14)

376

WirwerdenehergrafischeMethodenf¨urdie ¨Uberpr

¨ufungvonAnnahmenverwenden.

RegelderArt

LieberimmerRangsummen-Test,da solltevermiedenwerden! fallsakzeptiert,verwendet-Test,sonstRangsummentest” ” Pr¨ufe,obnormalverteilt,

undnievielschlechteralst-Test ” meistens”besser

(15)

3778.11 f ¨Aquivalenz-TestsNachweis,dass2Medikamente(Messmethoden)gleichsind!BeweisderNullhypothese!?

Mankannnachweisen,dassderUnterschiedkleinerals∆0ist.Nullhypothese:|∆|≥∆0,Alternative:<∆0.Figur!−→F

(odersehrkleinesσ). 0Manbrauchtf¨urkleine∆sehrgrosseStichproben kannderVerwerfungsbereich=∅sein! ¨ureinvorgegebenesn

(16)

3788.11

gEntscheidungenBeiTestsspielenNull-undAlternativ-HypothesenichtdiegleicheRolle.

EinhaltungvonGrenzwerten,Qualit

ZweiParteienmitgegens ¨atskontrolle derNullhypothese. Unentschieden,fallsXim(zweiseitigen)Annahmebereich WelchesistdieNullhypothese?VerschiedeneWahl! ¨atzlichenInteressen.

(17)

379 8.11 hNeutraleFormulierung:Entscheidung,obµ<µ0oderµ>µ0EntscheidungsregelK X =0oder=1.

•2m

F 00(µ<µ,aberK=1)oder(µ>µ,aberK=0) ¨oglicheFehler:

¨urgegebenesµkannmanWahrsch.enberechnen.

•Fehlerk¨onnenverschiedenviel

” kosten”.

•Verallgemeinerungauf>2Entscheidungsm

¨oglichkeiten

−→Entscheidungs-Theorie,engverwandtmitDiskriminanzanalyse−→MultivariateStat.

(18)

3808.11

iSch

im(zweiseitigen)AnnahmebereichderNullhypothese. Grenzwerteingehalten?−→unentschieden,fallsX ¨oneFormulierungl¨ostdasProblemnicht!

Wannpassiertdas?WahresµnahebeimGrenzwertundnklein.

µistnieexakt=Grenzwert.Alsomussman

” einfach”ngrossgenugw

berfl ¨U ¨ahlen!

¨ussig,fallsµweitvomGrenzwertwegist.

(19)

381 8.11

jSequentielleTests

•W

¨ahlen(klein),wendeTestan.

•FallsErgebnisnichteindeutig,nochmalsnBeob.

•Wiederholen!(IrgendwannmussmaninderPraxisaufh

¨oren.)

−→Stichprobenumfangh¨angtvomErgebnisab.GrosserAufwandnur,wennn¨otig!

Achtung!

ver¨andertsich!−→KritischeWerteanpassen! resp.Wahrscheinlichkeitf¨urdiebeidenArtenvonFehlern ” Irrtumswahrscheinlichkeit”

(20)

382

MerkpunkteBedeutungvonstatistischenTests

•Eigentlichpr

war,umden(evtl.minimalen)Effektnachzuweisen. sondern,obderStichprobenumfangngrossgenug ¨ufenstatistischeTestskeineEffekte,

•DeshalbsindVertrauensintervallesinnvolleralsTests!

•Testszur ¨Uberpr

vonfraglichemWert. ¨ufungvonAnnahmensind

•GenauereFragestellungen:−→ ¨Aquivalenztests,sequen-tielleTests−→Entscheidungs-Theorie