0
Derstatistische Test
–
EinRandomisierungstest
Werner Stahel,Semina
¨ u rf rStatistik
Probevo rlesungf
¨ urSch
¨ u ler,13.
Sept.2006
1
1. Statistik
Volksz •
¨ ahlung,Erhebung vonvolkswirtschaftlich
oder
gesellschaftlichwichtigen
¨ ossen Gr
¨ O − →
ffentlicheStatistik Betriebswirtsch:Unternehmenserfolg, Arbeitszeiterfass’g
Wirtschaftsstatistik − →
Modellierung •
desZufalls Wahrscheinlichk − →
eitsmo delle
Schliessende” ” Statistik
=
Zusammenhangzwischen Modellen
undDaten
Derwichtigste Begriffdes
Zusammenhangs(klass.
Statistik):
Derstatistische Test
.
Eineeinfach verst¨ a
ndl.Klasse vonT
ests:
Randomisierungstests
2
2. Einf¨uhrendes
Beispiel
Hagel-Experiment: a
” ( GrossversuchIV
”imNapfgebiet 1978-1983)
Verringert Impfen” ”
vonp otent.Hagelw
olken mitSilb
eriodid
dieHagelenergie?
Zielgr¨ osse: Hagelenergie,gemessen
¨ ur f Wolk n
en
Zwei Gruppen:
ca.
” n/2
geimpft”
,Rest Kontrolle” ”
.
Y : i
Hagelenergieder Wolk
e
i
G
= i
n
fallsW 1
olke
geimpft, i sonst. 0
Hoffnung:
Y
mit i
G
=1 i
fallentendenziell niedrigeraus.
3
2.
Beobachtet: b Y
= i
∗ i y
16672 25
855 0
152 0
46
1219 G
= i
∗ i g
1 1
0 0
0 1
1 0
(InWirklichk eit216
Wolk en;davon
wurden94 geimpft.)
Hagelenergie zuf¨ a ” llig”
!!
Wirkungdes Impfens
imMittel ”
”
?
Mittelwert (arithmetischer
M.):
ungeimpft
556.50 4185.75 geimpft
Schadetdas Impfen?
(Mittelw
” ert geimpft”
ohne1.
Beobachtung:23.67 )
4
2.
Verl c
¨ asslicheAnt wort
” muss Zuf¨ alligkeit
”
derb eobachtetenW
olken einbeziehen
Wahrscheinlichk − →
eits-Mo dell!!
Grundideeeines d
statistischenT ests:
Wahrscheinlichk eitsmo
dellf
¨ u
” rdie Hypothese
” ,
dassdas Impfen
keine Wirkung
hat.
Wiegross
¨ onnendann k dieUnterschiede
zwischengeimpften undungeimpften
werden?
Modell f¨ u
” r reinzuf
¨ alligeUnterschiede
” .
Kannder beobachtete
Unterschiedso zustandek
ommen?
Wenn nein,schliessen
wirauf eineWirkung
desImpfens.
( Widerspruchsb − →
eweis!
)
5
2.
¨ A e
hnlicheSituationen Medizin:Wirkung •
vonMedik amenten
Technik: •
neuesV erfahren
Landwirtschaft:D •
¨ u ngung,So
rte,...
Umwelt: •
Schutzmassnahme
... •
Vergleich − →
von2 Stichprob
en
6
3. Statistische
erlegung ¨ Ub
Nullhypothese a
=W ahrscheinlichkei
tsmodel l.
¨ U ( blichin
derStatistik:
Vert.
¨ ur f
Y
; i
G
= i
∗ i g
festvo rgegeben.
Randomisierungstests:
G
zuf¨ allig; i
Y
= i
∗ i y
alsfest betrachtet.
)
Grundidee:
Falls dasImpfen
keinen Einflussauf
dieHagelenergie hat,
h¨ a ttenwir
diegenau gleichenW
erte
∗ i y
erhalten,
wenn dieW
olken entsprechend
(1) g , =[0
, 1 , 0 , 0 , 1 , 1 , 0 1]
(statt
(0) g , =[1
1, 0, 0, 0, 1, 1,
) 0]
oder entsprechend
irgendeineranderen Auswahl
geimpftw orden
w¨ a ren.
7
3.
Zufallsauswahl: b
JedeAusw ahlvon
2= n/
geimpftenW 4
olken aus
=8 n
hat(te)gleiche Wahrscheinlichk
eit
= p 8 4
−
1
1 = 70
Damitist dasW.mo
dellder Nullhypothese
festgelegt.
Wir c
hoffen” ” eigentlich,dass
dieNullhyp othese
nicht gilt,sondern
” eine Alternative”
.
” In welcher Richtung”
erwarten wirAb
weichungen?
Mittlere Hagelenergief
¨ urgeimpfte kleinerals
¨ urungeimpfte! f
8
Allgemein: Teststatistik sollextreme
Werte annehmen,
wenn Alternativegilt.
Vorschlag:
Differenzder Mittelwerte
¨ ur f
ungeimpfteund geimpfteW
olken:
T hG ,
∗ y
= i 1
n/2 X
i:
G
=0 i
∗ i y 1 −
n/
2 X
i:G
=1 i
∗ i y .
Wieist d
unterder T
Nullhypothese verteilt?” ”
(Welcher f¨ ur Wert
kommt T
mitw elcherW.
heraus?)
∗ 1 y ,.
..
∗ n ,y
gegeben
− →
n ≤
n/2
m¨ oglicheW ertef
¨ ur . T
P hT hG,
∗ y i ti =
# = {g
| T h g ,
∗ y
= i t}
n n/
2
Randomisierungs-Verteilu ” ng”
9
t
Wahrscheinlichkeit
−5000
−3000
−1000 1000
3000 5000
0 / 705 / 7010 / 7015 / 7020 / 70
Randomisierungs−Verteilung t
3600 3800
4000 4200
4400 4600
4800
0 / 702 / 704 / 706 / 708 / 70
Randomisierungs−Vert., rechter Teil
Randomisierungs-Verteilung imBeispiel.
Links:ganze Verteilung,
rechts:
Verteilung derp
ositivenW erte(Ausschnitt
ausder Figurlinks)
10
3.
8 e
4
Werte =70
sindm
¨ oglich.Auch derextremste
¨ oglich istm keine − →
sicherenSchl
¨ usse m¨ oglich.
Konvention: DerEffekt
(desImpfens) giltals
nachgewieseno der
statistischsignifik ant,w
enndas beobachtete
Ergebnis
unwahrscheinlich ist,falls
dieNullhyp othesegilt.
Bestimmeeinen − →
Bereichvon extremen” ”
Werten
derT eststatistik–
so,dass seineW
ahrscheinlichkei t
unterder Nullhypothese
=5%
ist(o der1%
oder ...)
” − →
Verw erfungsbereich
”
Beispiel:
{t
| t
≥ 4643.25}
.
11
3.
ImExp f
eriment:
T h
∗ g
∗ ,y i 1 =
(855+ 4 0+
152+
1219)
1 − (16672+ 4 25+
0+
46)
− = 3629.25
Effektin dieunerw
artete Richtung!
Nullhypothese nichtverw
orfen;
Effektnicht nachgewiesen.
(Auchnicht inumgek
ehrterRichtung.)
BeliebigeT g
eststatistik.
Differenzder Mittelwerte
reagiertvo rallem
aufdie gr¨ ossteHagelenergie!
(=unrobust)
AndereM
¨ oglichkeit f¨ u
rgleiche Problemstellung:
Logarithmus-T ransformation,
dannMittelw ertsdifferenz.
12
l t
Wahrscheinlichkeit
−2.5
−2.0
−1.5
−1.0
−0.5 0.0
0.5 1.0
1.5 2.0
2.5
0 / 705 / 7010 / 70
Rand.Vert. für log. Werte
Randomisierungs-Verteilung f¨ur
dieMittelw erts-Differenzvon
logarithmier-
tenDaten imBeispiel
13
3.
Resultatdes h
Hagel-Experiments (216W
olken)
KeinEffekt. GenauereAnalyse:
ErsteRak etehat
positiven Effekt,
aber nachherk
ommtes eherschlimmer.
Gesch¨ atzterEffekt zeigtin
” die falsche”
Richtung,
aber (auch)
nichtsignifik ant!
14
4. Bemerkungenzu
Statistikund Mathematik
SchliessendeStatistik a
allgemein:
Modelle –auch
komplexe
¨ ur –f zuf¨ a ”
llige”
Ph¨ a nomene
mitDaten inV
erbindungb ringen.
Modelle aufGrund
vonDaten entwick
eln!
Beispiele: Wiewird •
dasAuftreten vonPilzen
durchdas Wetter
be-
einflusst?
Kannman •
Glukose imBlut
bestimmen ohneEinstich?
Sensoren aufder
Hautmessen Leitf¨ ahigkeit,
Temp., ...
R¨ uckschlussauf Glukose
gen¨ ugendgenau
&zuverl
¨ assig?
15
4.
Statistikist b
angewandte Mathematik.
Theorie: •
Wahrscheinlichk eits-Theo
rie, math.Statistik
Anwendung: •
Datenanalyse,Mo dell-Entwicklung,
Interpretation
Gefragt: SystematischesDenk
en,Kreativit
¨ at,Kommunik ation
ImStudium: Abstraktionzuerst,
Anwendung
¨ ater. sp
16
Merkpunkte SchliessendeStatistik:
StatistischerT est
Problem: •
Datenzeigen Effekt(Unterschied
zw.Grupp en)
Kannder beob.
Effekt reinzuf ”
¨ allig zustandek
ommen?”
Vorgehen: •
–W.-Mo dellf
¨ urdie Nullhypothese
kein ” Effekt”
,
–W ahlder
Test-Statistik (sollEffekt
messen),
–V erteilungder
Test-Statistik unterder
Nullhypothese,
” – signifikant
” ,w ennextremer
Wert beobachtet
wurde.
Keinexakter •
Schluss(Bew eis)m
¨ oglich.
Konventionn
¨ otig,w
” as extrem”
heissensoll.
17
SchliessendeStatistik •
stellt
Br¨ ucke zwischenMo
dellenund Daten
her.
Teil derangew
andten(
unreinen” ”
!)Mathematik.
www.stat.math.ethz.ch/~stahel/courses/resampling/
stat.ethz.ch People − →
Werner − →
Stahel homepage − →
Courses:Resampling-Metho − →
den