• Keine Ergebnisse gefunden

Statistik): Derstatistische Test

N/A
N/A
Protected

Academic year: 2021

Aktie "Statistik): Derstatistische Test "

Copied!
18
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

0

Derstatistische Test

EinRandomisierungstest

Werner Stahel,Semina

¨ u rf rStatistik

Probevo rlesungf

¨ urSch

¨ u ler,13.

Sept.2006

(2)

1

1. Statistik

Volksz

¨ ahlung,Erhebung vonvolkswirtschaftlich

oder

gesellschaftlichwichtigen

¨ ossen Gr

¨ O − →

ffentlicheStatistik Betriebswirtsch:Unternehmenserfolg, Arbeitszeiterfass’g

Wirtschaftsstatistik − →

Modellierung

desZufalls Wahrscheinlichk − →

eitsmo delle

Schliessende” ” Statistik

=

Zusammenhangzwischen Modellen

undDaten

Derwichtigste Begriffdes

Zusammenhangs(klass.

Statistik):

Derstatistische Test

.

Eineeinfach verst¨ a

ndl.Klasse vonT

ests:

Randomisierungstests

(3)

2

2. Einf¨uhrendes

Beispiel

Hagel-Experiment: a

” ( GrossversuchIV

”imNapfgebiet 1978-1983)

Verringert Impfen” ”

vonp otent.Hagelw

olken mitSilb

eriodid

dieHagelenergie?

Zielgr¨ osse: Hagelenergie,gemessen

¨ ur f Wolk n

en

Zwei Gruppen:

ca.

n/2

geimpft”

,Rest Kontrolle” ”

.

Y : i

Hagelenergieder Wolk

e

i

G

= i

n

fallsW 1

olke

geimpft, i sonst. 0

Hoffnung:

Y

mit i

G

=1 i

fallentendenziell niedrigeraus.

(4)

3

2.

Beobachtet: b Y

= i

i y

16672 25

855 0

152 0

46

1219 G

= i

i g

1 1

0 0

0 1

1 0

(InWirklichk eit216

Wolk en;davon

wurden94 geimpft.)

Hagelenergie zuf¨ a ” llig”

!!

Wirkungdes Impfens

imMittel ”

?

Mittelwert (arithmetischer

M.):

ungeimpft

556.50 4185.75 geimpft

Schadetdas Impfen?

(Mittelw

” ert geimpft”

ohne1.

Beobachtung:23.67 )

(5)

4

2.

Verl c

¨ asslicheAnt wort

” muss Zuf¨ alligkeit

derb eobachtetenW

olken einbeziehen

Wahrscheinlichk − →

eits-Mo dell!!

Grundideeeines d

statistischenT ests:

Wahrscheinlichk eitsmo

dellf

¨ u

” rdie Hypothese

” ,

dassdas Impfen

keine Wirkung

hat.

Wiegross

¨ onnendann k dieUnterschiede

zwischengeimpften undungeimpften

werden?

Modell f¨ u

” r reinzuf

¨ alligeUnterschiede

” .

Kannder beobachtete

Unterschiedso zustandek

ommen?

Wenn nein,schliessen

wirauf eineWirkung

desImpfens.

( Widerspruchsb − →

eweis!

)

(6)

5

2.

¨ A e

hnlicheSituationen Medizin:Wirkung

vonMedik amenten

Technik:

neuesV erfahren

Landwirtschaft:D

¨ u ngung,So

rte,...

Umwelt:

Schutzmassnahme

...

Vergleich − →

von2 Stichprob

en

(7)

6

3. Statistische

erlegung ¨ Ub

Nullhypothese a

=W ahrscheinlichkei

tsmodel l.

¨ U ( blichin

derStatistik:

Vert.

¨ ur f

Y

; i

G

= i

i g

festvo rgegeben.

Randomisierungstests:

G

zuf¨ allig; i

Y

= i

i y

alsfest betrachtet.

)

Grundidee:

Falls dasImpfen

keinen Einflussauf

dieHagelenergie hat,

h¨ a ttenwir

diegenau gleichenW

erte

i y

erhalten,

wenn dieW

olken entsprechend

(1) g , =[0

, 1 , 0 , 0 , 1 , 1 , 0 1]

(statt

(0) g , =[1

1, 0, 0, 0, 1, 1,

) 0]

oder entsprechend

irgendeineranderen Auswahl

geimpftw orden

w¨ a ren.

(8)

7

3.

Zufallsauswahl: b

JedeAusw ahlvon

2= n/

geimpftenW 4

olken aus

=8 n

hat(te)gleiche Wahrscheinlichk

eit

= p 8 4

1

1 = 70

Damitist dasW.mo

dellder Nullhypothese

festgelegt.

Wir c

hoffen” ” eigentlich,dass

dieNullhyp othese

nicht gilt,sondern

” eine Alternative”

.

” In welcher Richtung”

erwarten wirAb

weichungen?

Mittlere Hagelenergief

¨ urgeimpfte kleinerals

¨ urungeimpfte! f

(9)

8

Allgemein: Teststatistik sollextreme

Werte annehmen,

wenn Alternativegilt.

Vorschlag:

Differenzder Mittelwerte

¨ ur f

ungeimpfteund geimpfteW

olken:

T hG ,

y

= i 1

n/2 X

i:

G

=0 i

i y 1

n/

2 X

i:G

=1 i

i y .

Wieist d

unterder T

Nullhypothese verteilt?” ”

(Welcher f¨ ur Wert

kommt T

mitw elcherW.

heraus?)

1 y ,.

..

n ,y

gegeben

− →

n

n/2

m¨ oglicheW ertef

¨ ur . T

P hT hG,

y i ti =

# = {g

| T h g ,

y

= i t}

n n/

2

Randomisierungs-Verteilu ” ng”

(10)

9

t

Wahrscheinlichkeit

−5000

−3000

−1000 1000

3000 5000

0 / 705 / 7010 / 7015 / 7020 / 70

Randomisierungs−Verteilung t

3600 3800

4000 4200

4400 4600

4800

0 / 702 / 704 / 706 / 708 / 70

Randomisierungs−Vert., rechter Teil

Randomisierungs-Verteilung imBeispiel.

Links:ganze Verteilung,

rechts:

Verteilung derp

ositivenW erte(Ausschnitt

ausder Figurlinks)

(11)

10

3.

8 e

4

Werte =70

sindm

¨ oglich.Auch derextremste

¨ oglich istm keine − →

sicherenSchl

¨ usse m¨ oglich.

Konvention: DerEffekt

(desImpfens) giltals

nachgewieseno der

statistischsignifik ant,w

enndas beobachtete

Ergebnis

unwahrscheinlich ist,falls

dieNullhyp othesegilt.

Bestimmeeinen − →

Bereichvon extremen” ”

Werten

derT eststatistik–

so,dass seineW

ahrscheinlichkei t

unterder Nullhypothese

=5%

ist(o der1%

oder ...)

− →

Verw erfungsbereich

Beispiel:

{t

| t

4643.25}

.

(12)

11

3.

ImExp f

eriment:

T h

g

,y i 1 =

(855+ 4 0+

152+

1219)

1 (16672+ 4 25+

0+

46)

= 3629.25

Effektin dieunerw

artete Richtung!

Nullhypothese nichtverw

orfen;

Effektnicht nachgewiesen.

(Auchnicht inumgek

ehrterRichtung.)

BeliebigeT g

eststatistik.

Differenzder Mittelwerte

reagiertvo rallem

aufdie gr¨ ossteHagelenergie!

(=unrobust)

AndereM

¨ oglichkeit f¨ u

rgleiche Problemstellung:

Logarithmus-T ransformation,

dannMittelw ertsdifferenz.

(13)

12

l t

Wahrscheinlichkeit

−2.5

−2.0

−1.5

−1.0

−0.5 0.0

0.5 1.0

1.5 2.0

2.5

0 / 705 / 7010 / 70

Rand.Vert. für log. Werte

Randomisierungs-Verteilung f¨ur

dieMittelw erts-Differenzvon

logarithmier-

tenDaten imBeispiel

(14)

13

3.

Resultatdes h

Hagel-Experiments (216W

olken)

KeinEffekt. GenauereAnalyse:

ErsteRak etehat

positiven Effekt,

aber nachherk

ommtes eherschlimmer.

Gesch¨ atzterEffekt zeigtin

” die falsche”

Richtung,

aber (auch)

nichtsignifik ant!

(15)

14

4. Bemerkungenzu

Statistikund Mathematik

SchliessendeStatistik a

allgemein:

Modelle –auch

komplexe

¨ ur –f zuf¨ a ”

llige”

Ph¨ a nomene

mitDaten inV

erbindungb ringen.

Modelle aufGrund

vonDaten entwick

eln!

Beispiele: Wiewird

dasAuftreten vonPilzen

durchdas Wetter

be-

einflusst?

Kannman

Glukose imBlut

bestimmen ohneEinstich?

Sensoren aufder

Hautmessen Leitf¨ ahigkeit,

Temp., ...

R¨ uckschlussauf Glukose

gen¨ ugendgenau

&zuverl

¨ assig?

(16)

15

4.

Statistikist b

angewandte Mathematik.

Theorie:

Wahrscheinlichk eits-Theo

rie, math.Statistik

Anwendung:

Datenanalyse,Mo dell-Entwicklung,

Interpretation

Gefragt: SystematischesDenk

en,Kreativit

¨ at,Kommunik ation

ImStudium: Abstraktionzuerst,

Anwendung

¨ ater. sp

(17)

16

Merkpunkte SchliessendeStatistik:

StatistischerT est

Problem:

Datenzeigen Effekt(Unterschied

zw.Grupp en)

Kannder beob.

Effekt reinzuf ”

¨ allig zustandek

ommen?”

Vorgehen:

–W.-Mo dellf

¨ urdie Nullhypothese

kein ” Effekt”

,

–W ahlder

Test-Statistik (sollEffekt

messen),

–V erteilungder

Test-Statistik unterder

Nullhypothese,

” – signifikant

” ,w ennextremer

Wert beobachtet

wurde.

Keinexakter

Schluss(Bew eis)m

¨ oglich.

Konventionn

¨ otig,w

” as extrem”

heissensoll.

(18)

17

SchliessendeStatistik

stellt

Br¨ ucke zwischenMo

dellenund Daten

her.

Teil derangew

andten(

unreinen” ”

!)Mathematik.

www.stat.math.ethz.ch/~stahel/courses/resampling/

stat.ethz.ch People − →

Werner − →

Stahel homepage − →

Courses:Resampling-Metho − →

den

Referenzen

ÄHNLICHE DOKUMENTE

Experiment: Bei 17 V¨ ogeln wurde die L¨ ange des Schwerpunktsvektors sowohl bei blauem als auch bei gr¨ unem Licht bestimmt.. Trauerschn¨ apper: L¨ ange des Schwerpunktsvektors bei

Bei einer einelementigen Alternative (H 0 : µ = 0, H 1 : µ = m 1 ) kann man die Testmacht (oder Power) definieren als Pr H 1 (Nullhypothese wird abgelehnt).. Meistens geht es aber

Wir betrachten das als groben Unfug, denn die Gleichung (∗) folgt mit der ersten binomischen Formel unmittelbar aus (p+q) 2 = 1 2 und gilt daher immer, also auch, wenn sich

Dabei geht es weniger um Umweltprobleme im engeren Sinn und auch nicht um schwin- dende Ressourcen - die Verfügbarkeit von Kupfererzen gilt für viele Jahrzehnte

Zus¨atzlich lassen sich f¨ur die Fachabteilung Werkzeuge entwickeln, mit denen nicht nur in bekannter Weise der Gesch¨aftsprozess modelliert werden kann, sondern zus¨atzlich auch

[r]

Vorbestellungen haben aber für die Videospielindustrie unter anderem auch den Vorteil, dass der Erfolg eines Titels mitunter weit vor Veröffentlichung eingeschätzt werden kann

(Deskriptive Statistik, Wahrscheinlichkeitsdichte, stetige Verteilungen, z-Test, t-Test). –