V o rg e h e n b e i e in e m st a t. T e st (R e ze p t)

(1)

318

8 . T e st s

8.3WeitereBeispieleundBegriffe

aBeispielSchlafverl¨angerungNullhypothese:keinUnterschied

Xi∼Nh0,1.5i;Xiunabh¨angig

bAlternativen:(HA)µ:Xi∼Nhµ,1.5imitµ>0(einseitig).

Beobachtungenzusammenfassen!X

” Test-Statistik”U.

(2)

319

cVerwerfungsbereich?

U=X∼Nh0,1.5/10ifallsH0gilt.

T=X/ √0.15∼Nh0,1i−→ExtremeWerte:T≥1.64.

x=1.58,t=1.58/1.5=1.05<1.64.Verwerfung.Effektstatistischnachgewiesen.

(3)

3208.3

fModern:Statttmitczuvergleichen,k¨onnenwir

PhT>1.05i=PhX>1.58i=0.15ausrechnen.W.vonmindestenssoextremenWertenwiederbeobachtete.P-Wertp

t>1.64⇐⇒p<0.05

(4)

321

8.4

V o rg e h e n b e i e in e m st a t. T e st (R e ze p t)

Problemformulieren,inWorten.

NullhypotheseH0.Modellf¨urdieBeobachtungen.Oft:ParametrischeFamilie,H0legtParameterfest.InderRegelm

0¨ochtemanHgernewiderlegen. AlternativenHAwerdeninBetrachtziehen(einseitigoderzweiseitig)

Test-Statistik.VerteilungvonUunterAlternativensollm

−→Test-StatistikU=θ. b 00Oft:Parametertesten:H:θ=θ. verschiedenseinvonderVt.unterderNullhypothese(Macht!). ¨oglichststark

(5)

322

ArtdesExperimentes,Beobachtungs-Situation[a]

?Modellef¨ureineBeobachtung:

HHHHjNullhypothese[b]Alternativen[c]

?Test-Statistik[d](1) QQQQQQQQQQs )VerteilungderTest-StatistikunterderNullhypothese[e]

W.dichte

Niveau[f,j](2)

Verwerfungs-bereich[f](1)

(6)

323

eVerteilungF0hUivonUunterH0StandardisierteTest-StatistikT.

fKlassischeVariante:Verwerfungsbereichbestimmen.Willk

¨urlich:Niveauαw

¨ahlen.

” KritischerWert”,oftausTabelleoderDiagramm.

Bishierher:Test-Vorschrift

indenLehr-undNachschlageb¨uchernnachzulesen. ” fertigverpackt”

(7)

324

ArtdesExperimentes,Beobachtungs-Situation[a]

?Modellef¨ureineBeobachtung:

HHHHjNullhypothese[b]Alternativen[c]

?Test-Statistik[d](1) QQQQQQQQQs )VerteilungderTest-StatistikunterderNullhypothese[e]

Messwerte[h](3) 6 AusrechnendesWertesderTest-Statistik[h](3) 1 6 Nullhypotheseverworfen![i](3)

(8)

325

Beobachtungen−→Werttder(standard.)Test-StatistikT

iKlassisch:Entscheidung:Fallst∈K,wirddieNullhypotheseverworfen.

jModern:P-Wertbestimmen.Entscheidung:Fallsp<5%,wirddieNullhypotheseverworfen.

(9)

326

8.5

T e st s f¨u r 1 S tic h p ro b e o d e r 2 g e p a ar te

aProblem

0gleicheinemvorgegebenenWertµsein? KanneinbestimmterLageparameter(Erwartungswert,Median) ” eiineStichprobe”:X,i=1,2,...,n,unabh¨angig.

H0:µ=µ0.

µ0:physikalischeKonstante,chemischeKonzentration,Grenzwert.

(10)

327Problem

” zweigepaarteoderverbundeneStichproben”:

•BlutdruckvorundnachMedikamenten-Einnahme,

•Schlafl¨angebeizweiSchlafmitteln,

•Gr¨ossevonVaterundSohn(Beobachtungseinh=Fami-lie)

•AnzahlbeobachteterVerhaltenselementevonM

beiLichtundbeiDunkelheit. ¨ausen

” VerbundeneStichproben”

Xi=DifferenzderZielgr¨osseindenbeidenZust¨anden.(evtl.nachTransformation).Frage:Differenz

” im

wesentlichengleichnull”?H0:µ=0.

(11)

3288.5

dz-Test:besprochen.

H0:Xi∼Nhµ0,σ 20 i,i=1,...,n,unabh¨angig;dieVarianzσ 20 seibekannt

HA:Xi∼Nhµ,σ 20 i,i=1,...,n,unabh¨angig,mit(a)µ>µ0;(b)µ<µ0;(c)µ6=µ0

U:X= 1n Pni=1 Xi

F0hUi:X∼Nhµ0,σ 20 /ni K:Testgr¨ossestandarisieren:Z= X−µ0σ0/ √n ∼Nh0,1i

(12)

329 KritischeWertef¨urZ:(a)cso,dass1−Φhci=0.05⇒c=1.64;K={Z≥1.64}(b)cso,dassΦhci=0.05⇒c=−1.64;K={Z≤−1.64}(c)c1so,dass1−Φhc1i=0.025⇒c1=1.96;c0so,dassΦhc0i=0.025⇒c0=−c1;K={|Z|≥1.96}

KritischeWertefürstandardisierteTestgrösseunabhängigvonn,µ0,σ0.

BeispielReifen(nachLehn+Wegmann,1992).Vergleichvon2ProfilenaufWinterreifenbez

010Testfahrzeuge.σ=3ausfr¨uherenVersuchen. ¨ugl.Bremswirkung

(13)

330

iProfilAProfilBDifferenzVorzeichen144.544.90.4+255.054.8–0.2–352.555.63.1+450.255.25.0+545.355.610.3+646.147.71.6+752.153.00.9+850.549.1–1.4–950.652.31.7+1049.250.71.5+mittlereDifferenz2.29

z=2.29/(3/ √10)=2.41∈K:−→DieReifensortenunterscheidensichstatistischsignifikantinderL

¨angedesBremsweges.

(14)

331

fMeistens:NullhypotheseXi∼Nhµ0,σ 2i,unabh¨angig,

σunbekannt.NichteineeinzigeVerteilung,sondernalleNormalverteilungenmitErwartungswertµ0.

σ 2:St¨or-Parameter,nuisanceparameter.

σdurchdenSch

¨atzwertbσ=Sersetzen!

T= X−µ0S/ √n = X−µ0q1n(n−1) P(Xi−X) 2

(15)

332 8.5

gSschwanktzuf¨allig.Tnichtnormalverteilt.VerteilungvonTh¨angtnurvomStichprobenumfangnab.m=n−1

” Freiheitsgrade”.

VerteilungvonT:gr

¨ossereVarianzundlangschw

¨anziger.

1 3 715

−303 0 0.4 N fhti

tt-TestvonStudent.

(16)

333

iS/ √n:Sch

desarithmetischenMittelsX, 0¨atzungderStandard-Abweichungσ/n √

” Standardfehler”,standarderrorse.

jBeispielReifen:S 2=

19 (0.4−2.29) 2+(0.2−2.29) 2+...+(1.5−2.29) 2 =3.31 2,Standardfehlerse=3.31/ √10=1.048,t=2.29/1.048=2.18.

m=10−1.Krit.Wert2.26>|t|.H0nichtverworfen!

EinseitigerTest:KritischerWert1.83.Signifikant!Interpretation?

(17)

334 8.5

kVorzeichen-Test(oderZeichen-Test).Testgr¨osse=AnzahlBeobachtungengr

i0=AnzahlpositiveVorzeichenvonX−µ. 0¨osseralsµ lH0:Xi∼F0mitMedianµ0,unabh¨angig.

HA:Xi∼FmitMedianµ;(a)µ>µ0,(b)µ<µ0,(c)µ6=µ0.

U:U=Anzahl{i|Xi>µ0} F0hUi:P0hXi>µ0i=1/2,U∼Bhn,1/2i.

K:Tabelle!

mBeispielReifen:8positiveVorzeichenvonn=10.Tabelle:c0=1,c1=n−c0=9.NullhypothesedurchdenVorzeichentestnichtabgelehnt.

(18)

335

KeineNormalverteilungvorausgesetzt!Aber:Information

” verschenkt”.

Rangsummen-TestvonWilcoxonf¨urgepaarteStichprobenoderVorzeichen-Rangsummen-Test(signedranktest,one-sampleWilcoxontest).

H0:Xi∼F0,unabh.,F0stetigundsymmetrischbez.µ0

HA:Xi∼F,unabh¨angig,Fsymmetrischbez.(a)µ>µ0;(b)µ<µ0;(c)µ6=µ0.

(19)

336

U:NachfolgendemRezeptzubilden:1.BildeX ′i =Xi−µ0,streichedienegativenVorzeichen,bildedieR

i¨angeR.

Ri=rank D|X ′i | |X ′1 |,|X ′2 |,...,|X ′n | E.BeispielReifen:µ0=0,Xi−µ0DifferenzderBremswege.R

ii0iSeiV=1,fallsX−µ>0ist,V=0sonst. Beispiel:2+8+9+10+6+3+7+5=50. ii02.SummieredieR,f¨urdieX−µ>0 i¨angeR:2,1,8,9,10,6,3,4,7,5.

U += Pni=1 ViRi.Beispiel:u +=1·2+0·1+1·8+1·9+1·10+1·6+1· 3+0·4+1·7+1·5=50.U −= Pni=1 (1−Vi)Ri.U ++U −= Pni=1 Ri=n(n+1)/2.

(20)

337

0hUi:VerteilungvonU +oderU −h¨angtnichtvonrVerteilungFab(solangesiestetigist).

:Bisn=30ausTabelle:

)causderZeile” c,einseitig”;

K={U +≥n(n+1)/2−c}={U −≤c};

)causderZeile” c,einseitig”;K={U +≤c};

)c0ausderZeile” c0,zweiseitig”;

K={U +≤c0}∪{U +≥n(n+1)/2−c0}

={minhU +,U −i≤c0}.F

¨urgr

¨osseren:ApproximationdurchdieNormalvert.

(21)

338

n12345678910

c,einseitig----0235810c0,zweiseitig---02358

n11121314151617181920

c,einseitig13172125303541475360c0,zweiseitig10131721252934404653

n21222324252627282930

c,einseitig586573818998107116126137c0,zweiseitig67758391100110119130140151

(22)

339eispielReifen:u +=50,u −=5.abellenwertc0=8,n(n+1)/2−c0=47<u +(u −≤8).ullhypotheseverworfen.

istasymptotischnormalverteilt.

hU +i= n(n+1)4 ,varhU +i= n(n+1)(2n+1)24 Z += U +−EhU +ipvarhU +i = U +−n(n+1)/4pn(n+1)(2n+1)/24 ≈∼Nh0,1i

erwerfungsbereich(zweiseitig):|Z +|≥1.96.

(23)

340 8.5

qKeine(

Bindungen:R (Vert.vonT=bedingteVert.,gegebendieAnzahlNullen). i0Nullen(X=µ)weglassen. ” Bindungen”),ties)oderNullen!

¨angeaufteilen.Asymptot.N

Varianz. ¨aherungmitkorrig.

HerleitungderVerteilungvonU +:WieverteilensichdieVorzeichenaufdieR

−→VerteilungvonU. + 1/2. 10 JedeFolgevon10VorzeichenhatgleicheWahrscheinlichkeit 3.Zeilezuf¨allig,Bernoulli-vert. iv0110111111 i Vorzhxi–++–++++++ ′ i Rangh|x|i12345678910 ′ i |x|0.20.40.91.41.51.61.73.15.010.3 ′ 0¨ange,wennHgilt?

(24)

341

rTest-Statistiken,derenVerteilungnichtvoneinemkonkretenparametrischenModellf¨urdieBeobachtungenabh¨angt,unddieentsprechendenTestsnenntmannicht-parametrisch(oderverteilungsfrei).Rangtest.

Genaueres,AllgemeineresunterdenStichwortenRandomisierungs-TestsoderPermutations-Tests.

sWilcoxon-TestnütztabsoluteGrössederpositivengegenüberdennegativenXi−µ0aus.Nullhypotheseist

” sch

F EswirdSymmetrievorausgesetzt. ¨arfer”alsbeimVorzeichnetest:

¨urDifferenzenderPaarebeiverbundenenStichpr.naheliegend.

tWelchenTestw

¨ahlen?

(25)

342

8.6

In te rp re ta tio n vo n T e st e rg e b n is se n

aVerwerfungderNullhypothese.Interpretation?(1)EinEffektistnachgewiesen,eine

(2)NullhypotheseaufandereWeiseverletzt: ” Alternative”istrichtig,

•DatenenthaltensystematischenFehler,

•Xisindnichtunabh¨angig,

•nichtnormalverteilt(beimt-Test),nichtsymmetrischverteilt(beimRangsummen-Test),nichtallegleichverteiltmedhXiiversch.beimVorz.t. ,(3)esistzuf¨alligdasunwahrscheinl.EreignisKeingetreten.

(26)

343

(3)istunvermeidbar.W.durchSignifikanzniveaukontrolliert.Manm

ii(D)X∼FmitMedianµ,sonstbeliebig→Vorzeichen-Test. Test. i(C)X∼Fsymmetrischumµ,sonstbel.→Rangsummen- 00i(B)X∼Nhµ,σi,σunbekannt→t-Test. 22 00i(A)X∼Nhµ,σi,σbekannt→z-Test. 22 Aberwie? ¨ochte(2)vermeiden,um(1)schliessenzuk¨onnen.

Unabh

i¨angigkeitderX.

(27)

3448.6

c•Annahme,dassdieNullhypotheseodereineAlternative

istVoraussetzungf¨urdieAnwendungdesTests. ” gilt”,

d•GesamteNullhypothesef¨uhrtzu

(soweitm AbweichungenvondenanderenAnnahmenwegdiskutieren ” statistischemWiderspruch”.

¨oglich

¨uberpr

¨ufen).

eTestsverwenden,diem

immerVorzeichen-TeststattRangsummen-Test. AlsoimmerRangsummen-Teststattt-oderz-Test, brauchen! ¨oglichstwenigeVoraussetzungen

(28)

345

fNein!Informationausn

Dieallzugrossz ützen.Macht=W.fürFehler2.Art. bezahltmanmiteinemVerlustanMacht. ügigeLockerungderVoraussetzungen

KonkreteEmpfehlungf¨urdasTesteneinesLageparameters:

•Rangsummen-TestvonWilcoxonanwenden,fallsVerteilungsymmetrischistwegen–theoretischen

–Vorwissen(fr –empirischenResultateningrossenDatens¨atzen, ¨uberlegungen(z.B.Differenzen),

¨uhereStudienmit

¨ahnlichenDaten);

•sonstVorzeichen-Testdurchf

¨uhren;

(29)

346

•t-Test(undz-Test)vermeiden.GewinnanMachtf¨urnormalverteilteBeob.minim.Wennnichtgenaunormalvert.,hatderRangsummen-Testmeistensgr

(Ausnahme:SehrkleineStichproben). ¨ossereMachtalsdert-Test

(30)

347

8.7

D e r P -W e rt

t fhti

t ∗ P-Wert

α=5%

c0

Signifikanz:Test-Statistikrechtsvonc0(∈K)⇐⇒P-Wertkleinerals5%–undumgekehrt.

P-Wert:verfeinertes

P=6%:knappnichtsignifikant,Nachdenken ” MassderSignifikanz”.

P=74%:keinHinweisaufAbweichungvonderNullhypothese. ” erlaubt”.

(31)

3488.7

dLiteratur,

¨altereKonvention:

P>0.05nichtsignifikant(n.s.)0.05≥P>0.01schwachsignifikant*0.01≥P>0.001starksignifikant**0.001≥Psehrstarksignifikant***

z=2.63 ∗∗.z=1.46(n.s.).

(32)

349

eHinweise:

•P-Wert=transformierteTest-StatistikmituniformerVert.

•MitP-Wertkannmaneinfacherentscheidenalsmitt.Computermussmehrarbeiten.

•Achtung:WegenFaulheitderProgrammiereroftunexakteTests!(AsymptotischeN

¨aherungauchbeikleinenStichproben!)

•P-WertausverschiedenenTests?!

•P-WertundWahrscheinlichkeit!

BITTENICHT! ” DieWahrscheinlichkeitf¨urdieNullhypotheseist10%.”

” DieIrrtums-Wahrscheinlichkeitist3%.”(auchnicht.)

(33)

350

•Beidiskretvert.TistderP-Wertauchdiskretverteilt.

010 0 1

01 0 1

xt F (X)F (PW)

(34)

351

8.8

V e rg le ic h vo n zw e i q u a n tit a tiv e n S tic h -

p ro b e n

EinigeFragestellungen:

•UnterscheidensichPuppengewichtevonFliegen(dergl.Art),diesichingleichgrossenTierenverschiedenerWirtsartenentwickeln?

•HabenRaucherundNichtraucherunterschiedl.Blutdruck?

•UnterscheidensichSchneckenaufMager-&Fettwiesen?

•F

¨uhrtD

¨ungersorteAzuh¨oheremErtragalsD

Zielgr¨ossseYmessen. JeeineStichprobeauszweiverschiedenenGrundgesamtheiten. ¨ungerB?

(35)

3528.8 bUnterscheidungvongepaartenStichproben:Stichprobenumfängen1undn2könnenfürunabh.Stichprobenverschiedensein;beigepaartenStichprobenimmergleichgross.

(36)

353Modell:Y1,1,Y1,2,...,Y1,n1 Y2,1,Y2,2,...,Y2,n2Y1,i∼F1,i=1,2,...,n1;

Y2,i∼F2,i=1,2,...,n2; Y1,1,Y1,2,...,Y1,n1 ,Y2,1,...,Y2,n2 alleunabh¨angig.

H0:F1=F2.AlleYhabengleicheVerteilung.

HA:F1undF2unterscheidensichdurcheineVerschiebungδ:F2hxi=F1hx−δiSpeziell:Y1,i∼Nhµ,σ 2iY2,i∼Nhµ+δ,σ 2i.

δinteressierenderParameter,µ,σSt¨or-Parameter.

e bδ=Y2,·−Y1,·=(Y2,1+...+Y2,n2 )/n2−(Y1,1+...+Y1,n1 )/n1

(37)

3548.8

fZwei-Stichproben-z-Test.BeispielMastochsen.2Futterartenvergleichen.Zielgr¨osse:mittlerew

EinseitigeAlternative. 0Erfahrung:SolcheGewichtszunahmen≈∼Nh...,(σ=1.8kg)i. 2 ¨ochentlicheGewichtszunahmein1Monat.

(38)

355

H0:Yk,i∼Nhµ,σ 20 i(i.i.d.);

HA:Y1,i∼Nhµ1,σ 20 i;Y2,i∼Nhµ1+δ,σ 20 ieinseitig:δ>0.

U:U=Y2,·−Y1,·

F0hUi:Yk,· ∼Nhµ,σ 20 /nk i,also

U=Y2,·−Y1,·∼N 0,σ 20

12(1)/n+1/n

Z= Y2,·−Y1,·pσ 20 (1/n1+1/n2) ∼Nh0,1i

K:einseitig:K={Z≥1.64}.

(39)

3568.8

hMastochsen:

” extensiv”2.72.71.13.01.93.03.83.80.31.91.9

” intensiv”6.55.48.13.50.53.86.84.99.56.24.1

y2,·−y1,·=5.39kg−2.37kg=3.02kg

z=3.02/ p1.8 2·2/11=3.93>1.64.Nullhypothese(wuchtig)verworfen.

(SinneinessolchenTests?Sch

¨atzproblem!)

(40)

357

it-Test.

H0:Yk,i∼Nhµ,σ 2i(i.i.d) HA :Y1,i∼Nhµ,σ 2i,Y2,i∼Nhµ+δ,σ 2i,

δ6=0(oderδ>0oderδ<0),unabh¨angig.

ManersetztinderstandardisiertenStatistikf¨urdenz-TestdieVarianzσ 20 durcheineSch

¨atzung,

bσ 2= 1n1+n2−2 n1X

i=1 (Y1,i−Y1,·) 2+ n2X

i=1 (Y2,i−Y2,·) 2 !

.t-Verteilungmitn1+n2−2Freiheitsgraden.

(41)

358 8.8

jTestmitwenigerVoraussetzungen!Rangsummen-TestvonWilcoxon,MannundWhitney,U-Test

H0:Yk,i ∼F(i.i.d);Fbel.Vert.

HA:Y1,i∼F1,Y2,i∼F2,F2hxi=F1hx−δi,δ6=0.

U:1.BestimmeRangRk,i bez

¨ugl.

ZweiseitigeFragestellung:T=minhT,Ti. (1)(2) 12(T+T=nn.) (1)(2) kk T=U−n(n+1)/2 (k)(k) 1212(U+U=(n+n)(n+n+1)/2.) (1)(2) i=1i=1 1,i2,i2.U=R(oderU=R) (1)(2)12nn ” vPP ereinigtenStichproben”

F0hUi:VerteilungvonT (k)h¨angtnurvonn1,n2ab.Grossen1,n2:AsymptotischeN

¨aherung.

K:Tabelle.

(42)

359

n21234567891011121314151617181920

–––––––––––––––––––––––––––0000111112222––––0112233445566778–––01234456789101111121314––012356789111213141517181920––123568101113141617192122242527––1356810121416182022242628303234–024681013151719222426293134363841–0247101215172023262831343739424548–0358111417202326293336394245485255–0369131619232630333740444751555862–14711141822262933374145495357616569–14812162024283337414550545963677276–15913172226313640455055596469747883–151014192429343944495459647075808590–161115212631374247535964707581869298–2611172228343945515763697581879399105–27121824303642485561677480869399106112–271319253238455258657278859299106113119–2814202734414855626976839098105112119127

(43)

360 8.8

kBeispielMastochsen.

Daten·10ext.311191919272730303838int.535384149546265688195

R¨ange P

ext.135557.57.59.59.5131379int.211131516171819202122174

u (1)=79undu (2)=174.(Kontrolle:u (1)+u (2)=22·23/2.)

t (1)=79−11·12/2=13,t (2)=174−11·12/2=108,

t=minht (1),t (2)i=13.

K={T≤30}.Nullhypothesewirdverworfen.

(44)

361

VergleichderStreuungen

GrafischerVergleichmitbox-plots.UnterschiedezwischendenMedianenvon2Gruppensignifikant?Kerben.Essollgelten:WennsichdieKerbenvonzweiKistennicht

−→ dannistderUnterschiedzwischendenGruppensignifikant. ¨uberschneiden,

” Notchedboxplots”,gekerbteKisten-Diagramme.

(Testregelnichtnachdem

¨ublichenSchema!)

(45)

362

0 20 40 60 80

12

Zuwachs

Behandlung