363
8.9Macht
aBisher:H0vorausgesetzt.WahrscheinlichkeitennurunterdieserVoraussetzungberechnet.P (0) VerwerfenvonH0 =αJetzt:Alternativevoraussetzen.Fehler:H0nichtverwerfen.=Fehler2.ArtWahrscheinlichkeitberechnen!
BerechnungvonWahrscheinlichkeitensetztgenauspezifizierteHypothesevoraus!
P (A)hT6∈Ki=1−P (A)hT∈Ki=β (A).
364
1−β (A)=W.der
sollm ” richtigen”Entscheidung=Macht
¨oglichsthochsein.
(Aufgepasst:InmanchenB
dieMachtmitβbezeichnet.) ¨uchernwird
bKistderVerwerfungsbereich,hergeleitetausderVerteilungderTest-StatistikunterderNullhypotheseDerTest(dieEntscheidungsregel)bleibt.
3658.9
cBeispielMastochsen:2F
¨utterungsartenvergleichen.
0...d.h.,dassdieTestregelzurVerwerfungvonHf¨uhrt? richtigist,sichdurchdenVersuchstatistischnachweisenl¨asst? WiegrossistdieWahrscheinlichkeit,dassdieserEffekt,fallser ” Wahrer”Unterschiedδ=1.0kg/Woche(Vermutung).
366 Entscheidungsregel:H0verwerfen,fallsZ>1.64.
−→U=Z· p1.8 2·2/11=Z·0.77,also
Z>1.64−→U>1.64·0.77=1.26.
Vt.vonTunterHAmitδ=1.0kgist
U=Y2·−Y1·∼N δ,σ 20 1n1 + 1n2
=Nh1.0,0.77 2i
Macht1−β (A)=P (A)hU>1.26i
=1−Φ 1.26−10.77 =1−Φh0.34i=0.37
−→Wahrsch.eines
(statistischer ” erfolgreichenAusgangs”desVersuchs
=37%.(!) ” Beweis”einesEffektsgelungen)
367
01 Macht1−β VerteilungderTest-StatistikU...unterH0unterHA
-Verwerfungsbereich P P PP
α=5%
-
δ u f
3688.9
dOftkeineVermutungbetreffendEffektδ.
−→MachtalsFunktionvonδ.
n1=n2=n.H0verworfen,wennU>1.64·σ0 p2/nUnterHAgiltU∼N δ,σ 20 2/n
1−β (A)=P (A) DU>1.64·σ0 p2/n E
=1−Φ *1.64·σ0 p2/n−δ
σ0 p2/n +
=1−Φ 1.64− δσ0 pn/2 .
369
DieMachtnimmtzumit
undStichprobenumfangn. ” s0tandardisiertemEffekt”δ/σ
0.37 0.8
01 n1=n2=11 n1=n2=40 1−β
δ/σ00 1
Macht1−β (A)alsFunktionvonδheisstauchG
β,alsFunktionvonδheisstauchOperations-Charakteristik. (A) ¨utefunktion.
3708.9 eWiegrossmussnsein,damitbeiδ=1.0undσ0=1.8
1−β (A)=0.80wird?
1−Φ 1.64− 1.01.8 pn/2 =0.8=⇒
1.64−0.56 pn/2=−0.84
n=2· 2.480.56 2=39.2
Esbraucht(etwa)40TiereproGruppe.
−→Versuchsplanung,BerechnungdesStichprobenumfangs.
3718.9 f
*
Manmussσ0ungef¨ahrkennenundδfestlegen.Vorversuch?NichtparametrischerTest?g
*
Macht(-funktion)alsQualitOptimaleSch Optimieren!−→MathematischeStatistik. ¨atskriteriumzurWahleinesTests.
¨atzungen−→Testgr¨ossenf¨uroptimaleTests.
372
8.11
S in n u n d U n si n n st a tis tis c h e r T e st s
aFachzeitschriften:Mandarfnur
diestatistischaufdem5%-Niveausignifikantsind. ¨uberEffekteschreiben,
−→TestdientalsFiltergegenwildeSpekulationen.
Perversion:UntersucheFragen,f¨urdieeinsignifikantesErgebniserwartetwerdenkann–auchuninteressante...Statistikerunterst¨utzendiesenUnsinnnicht.RelevanzwichtigeralsSignifikanz!
373 8.11
bUnterschiedzwischen(statistischer)
(praktischer) ” Signifikanz”und
ZukleineundzugrosseStichproben! ” Relevanz”
MitgrossenStichprobenkannmanBagatelleffekte,dieeigentlichniemandeninteressieren,stolzals
” statistischsignifikant”nachweisenundpublizieren.
c
*
Konsequenz?StatistischeTestssindunsinnig!−→Manm
0¨ussteH:θ≤Schwellenwertγpr
¨ufen!
Regelf¨urEntscheidungzwischenH0:θ≤γundH1:θ>γ.
3748.11
dWiesoTestsausf¨uhrlichbehandeln?
•FiltergegenwildeSpekulationen
•Grundlagef¨urdasVerst
Wahrscheinlichkeits-ModellenundempirischenDaten. ¨andnisderBeziehungzwischen
•Grundlagef¨urVertrauensintervall.
3758.11 e ¨Uberpr
iNullhypothese:x∼Nµ,σf¨urirgendeinµ,σ. 2 SindDatennormalverteilt?−→Test! ¨ufungvonAnnahmen
ManwillNullhypothesebeweisen!Dasgehtnicht.AllenfallswiederalsKonventionverwenden,gegendieAnwendungfalscherstatistischerMethoden.
Manm
¨usstenachweisen,dassAbweichungvonderAnnahme
” nochimungef¨ahrlichenBereich”ist.
376
WirwerdenehergrafischeMethodenf¨urdie ¨Uberpr
¨ufungvonAnnahmenverwenden.
RegelderArt
LieberimmerRangsummen-Test,da solltevermiedenwerden! fallsakzeptiert,verwendet-Test,sonstRangsummentest” ” Pr¨ufe,obnormalverteilt,
undnievielschlechteralst-Test ” meistens”besser
3778.11 f ¨Aquivalenz-TestsNachweis,dass2Medikamente(Messmethoden)gleichsind!BeweisderNullhypothese!?
Mankannnachweisen,dassderUnterschiedkleinerals∆0ist.Nullhypothese:|∆|≥∆0,Alternative:<∆0.Figur!−→F
(odersehrkleinesσ). 0Manbrauchtf¨urkleine∆sehrgrosseStichproben kannderVerwerfungsbereich=∅sein! ¨ureinvorgegebenesn
3788.11
gEntscheidungenBeiTestsspielenNull-undAlternativ-HypothesenichtdiegleicheRolle.
EinhaltungvonGrenzwerten,Qualit
ZweiParteienmitgegens ¨atskontrolle derNullhypothese. Unentschieden,fallsXim(zweiseitigen)Annahmebereich WelchesistdieNullhypothese?VerschiedeneWahl! ¨atzlichenInteressen.
379 8.11 hNeutraleFormulierung:Entscheidung,obµ<µ0oderµ>µ0EntscheidungsregelK X =0oder=1.
•2m
F 00(µ<µ,aberK=1)oder(µ>µ,aberK=0) ¨oglicheFehler:
¨urgegebenesµkannmanWahrsch.enberechnen.
•Fehlerk¨onnenverschiedenviel
” kosten”.
•Verallgemeinerungauf>2Entscheidungsm
¨oglichkeiten
−→Entscheidungs-Theorie,engverwandtmitDiskriminanzanalyse−→MultivariateStat.
3808.11
iSch
im(zweiseitigen)AnnahmebereichderNullhypothese. Grenzwerteingehalten?−→unentschieden,fallsX ¨oneFormulierungl¨ostdasProblemnicht!
Wannpassiertdas?WahresµnahebeimGrenzwertundnklein.
µistnieexakt=Grenzwert.Alsomussman
” einfach”ngrossgenugw
berfl ¨U ¨ahlen!
¨ussig,fallsµweitvomGrenzwertwegist.
381 8.11
jSequentielleTests
•W
¨ahlen(klein),wendeTestan.
•FallsErgebnisnichteindeutig,nochmalsnBeob.
•Wiederholen!(IrgendwannmussmaninderPraxisaufh
¨oren.)
−→Stichprobenumfangh¨angtvomErgebnisab.GrosserAufwandnur,wennn¨otig!
Achtung!
ver¨andertsich!−→KritischeWerteanpassen! resp.Wahrscheinlichkeitf¨urdiebeidenArtenvonFehlern ” Irrtumswahrscheinlichkeit”
382
MerkpunkteBedeutungvonstatistischenTests
•Eigentlichpr
war,umden(evtl.minimalen)Effektnachzuweisen. sondern,obderStichprobenumfangngrossgenug ¨ufenstatistischeTestskeineEffekte,
•DeshalbsindVertrauensintervallesinnvolleralsTests!
•Testszur ¨Uberpr
vonfraglichemWert. ¨ufungvonAnnahmensind
•GenauereFragestellungen:−→ ¨Aquivalenztests,sequen-tielleTests−→Entscheidungs-Theorie