TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN
MATHEMATIK UND STATISTIK
INFORMATIONS- UND DOKUMENTATIONSZENTRUM R.KRAFT
Statistik SS 00
Statistische Hypothesentests
Statistische Hypothesentests
Statistische Hypothesen
Null- und Alternativhypothese Testfehler
Test von Erwartungswerten
z-Test für den Mittelwert bei bekanntem F t-Test für den Mittelwert bei unbekanntem F
t-Test zum Mittelwertsvergleich zweier unabhängiger Stichproben bei unbekanntem Fx = Fy
t-Test zum Mittelwertsvergleich zweier verbundener Stichproben bei unbekanntem Fd
t-Test zum Mittelwertsvergleich zweier unabhängiger Stichproben bei unbekanntem Fx Fy (Welch-Test) z-Test zum Mittelwertsvergleich zweier unabhängiger
Stichproben bei bekanntem Fx und Fy
z-Test zum Mittelwertsvergleich zweier verbundener Stichproben bei bekanntem Fd
Test von Varianzen
P2-Test der Varianz
F-Test zum Vergleich zweier Varianzen
Analyse von Häufigkeiten und Kontingenztafeln
P2-Test zur Prüfung von Häufigkeiten bzw. Verteilungen P2-Test zur Prüfung auf Unabhängigkeit
P2-Test bei einer einfachen Zweiwegklassifikation
:0
Ablehnungs- bereich c
Nichtablehnungs- bereich
Ablehnungs- bereich c2
Nichtablehnungs- bereich Ablehnungs-
bereich
c1 :0
Statistische Hypothesen
Nullhypothese
z.B. H : µ = µ0 0 Alternativhypothese
z.B. H : µ < µ oder µ > µ1 0 0 einseitig H : µ 1 µ0 zweiseitig
Ablehnungsbereiche einseitig:
zweiseitig: X X
"
:0 c :1
$
Fehler bei statistischen Tests
Ausfall des Tests H richtig0 H falsch0
Nichtablehnung von H0
richtige Entschei- Fehler 2. Art
dung mit der mit der
Sicherheitswahr- Wahrscheinlichkeit scheinlichkeit
1 !" $
Ablehnung von H0
Fehler 1. Art richtige Entschei-
mit der dung mit der
Wahrscheinlichkeit Wahrscheinlichkeit
" 1 !$
": Fehler 1. Art, Risiko 1. Art, Signifikanzniveau
$: Fehler 2. Art, Risiko 2. Art
1 !$: Macht, Güte oder Power des Tests
Dichte von , Dichte von ,
falls H zutrifft0 falls H zutrifft1
t0xµ0 s/ n
x960.7 g, s46.5 g
t0xµ0 s/ n
960.71000.0 46.5/ 7
2.236 <1.943t6;0.95
t-Test für den Mittelwert bei unbekanntem F
Voraussetzung: Normalverteilung, F unbekannt Testgröße:
H :0 µ = µ0
H :1 Ablehnung von H , wenn
µ < µ0 t < !t µ > µ0 t > t µ µ0 |t | > t
0 0 n!1;1!"
0 n!1;1!"
0 n!1;1!"/2
Kopfgewicht von Chinakohl
Kopf i 1 2 3 4 5 6 7
Gewicht [g] 920 975 1030 910 955 925 1010
H : µ = 1000 g gegen H : µ < 1000 g auf 0 1 " = 5%
H wird auf dem Signifikanzniveau 0 " = 5% zugunsten von H1
abgelehnt. Zum Signifikanzniveau von 5% ist also statistisch gesichert, daß das Kopfgewicht kleiner als 1 kg ist.
z0xµ0 F/ n
U49.66 V, F0.5 V
z0UµU FU/ n
49.6650 0.5/ 10
2.15, also |z0|2.15 > 1.96u0.975
z-Test für den Mittelwert bei bekanntem F
Voraussetzung: Normalverteilung, F bekannt Testgröße:
H :0 µ = µ0
H :1 Ablehnung von H , wenn µ < µ0 z < !u
µ > µ0 z > u
µ µ0 |z | > u = 8
0 0 1!"
0 1!"
0 1!"/2 1!"
Justierung eines Voltmeters
i 1 2 3 4 5 6 7 8 9 10
U [V] 49.8 50.1 48.9 49.4 51.0 48.8 49.3 49.4 49.9 50.0 (laut Hersteller)
H : µ = 50 V gegen H : µ 0 U 1 U 50 V auf " = 5%
H wird auf dem Signifikanzniveau 0 " = 5% zugunsten von H1
abgelehnt. Zum Signifikanzniveau von 5% ist also statistisch gesichert, daß der mittlere Meßwert vom Sollwert abweicht.
t0 nxny(nxny2)
nxny @ xy
(nx1)sx2(ny1)sy2 t0 n@ xy
sx2sy2
für nxnyn
µx< µy µx> µy µx µy
t0<tn
x%ny&2;1&"
t0> tn
x%ny&2;1&"
|t0| > tn
x%ny&2;1&"/2
H697.3 g, sH36.8 g, N628.5 g, sN47.4 g
t0 n@ HN sH2sN2
8@ 697.3628.5 36.8247.42
3.24
t-Test zum Mittelwertsvergleich zweier unabhän- giger Stichproben bei unbekanntem F
x= F
yVoraussetzung: Normalvert., Unabh., Fx = Fy unbekannt Testgröße:
H :0 µ = µx y
H :1 Ablehnung von H , wenn0
Schweinemast
Protein mittlere tägliche Gewichtszunahme [g]
hoch Hi 715 683 664 659 660 762 720 715
niedrig Ni 684 655 657 531 638 601 611 651
H : µ = µ gegen H : µ > µ auf 0 H N 1 H N " = 1%
> 2.624 = t14;0.99 H wird auf 0 " = 1% zugunsten von H abgelehnt.1
t0 d sd/ n
d1.58 h, sd1.23 h
|t0|/0000 /0000 d sd/ n
1.58@ 10
1.23 4.06 > 3.25t9;0.005
t-Test zum Mittelwertsvergleich zweier verbunde- ner Stichproben bei unbekanntem F
dVoraussetzung: Normalvert., Abhäng., Fd unbekannt Testgröße:
H :0 µ = µ bzw. µ x y x! µ = µ = 0y d
H :1 Ablehnung von H , wenn
µ < µ bzw. µ < 0x y d t < !t µ > µ bzw. µ > 0x y d t > t µ x µ bzw. µ y d 0 |t | > t
0
0 n!1;1!"
0 n!1;1!"
0 n!1;1!"/2
Schlafmittel
Schlafverlängerung [h]
Ai 1.9 0.8 1.1 0.1 !0.1 4.4 5.5 1.6 4.6 3.4 B 0.7i !1.6 !0.2 !1.2 !0.1 3.4 3.7 0.8 0.0 2.0 d 1.2i 2.4 1.3 1.3 0.0 1.0 1.8 0.8 4.6 1.4
H : µ = µ bzw. µ = 0 gegen H : µ 0 A B d 1 A µ bzw. µ B d 0 auf " = 1%
H wird auf dem Signifikanzniveau 0 " = 1% zugunsten von H1 abgelehnt. Zum Signifikanzniveau von 1% ist also statistisch gesichert, daß sich die beiden Schlafmittel unterscheiden.
t0 xy sx2/nxsy2/ny
FG (sx2/nxsy2/ny)2
sx4/(nx2(nx1))sy4/(ny2(ny1)) FG(n1)@(sx2sy2)2
sx4sy4
für nxnyn
t-Test zum Mittelwertsvergleich zweier unabhän- giger Stichproben bei unbekannten und
verschiedenen F
xF
y(Welch-Test)
Voraussetzung: Normalvert., Unabh., Fx Fy unbekannt Testgröße:
Freiheitsgrade:
H :0 µ = µx y
H :1 Ablehnung von H , wenn
µ < µx y t < !t µ > µx y t > t µ x µy |t | > t
0
0 FG;1!"
0 FG;1!"
0 FG;1!"/2
Pilze
Two Sample T-Test and Confidence Interval Two sample T for Auster vs Braun
N Mean StDev SE Mean Auster 10 6.210 1.370 0.43 Braun 12 5.225 0.393 0.11
95% CI for mu Auster - mu Braun: ( -0.01, 1.98) T-Test mu Auster = mu Braun (vs not =):
T= 2.20 P=0.053 DF= 10
z0 xy F2x/nxF2y/ny
t0 d Fd/ n
z-Test zum Mittelwertsvergleich zweier unabhän- giger Stichproben bei bekanntem F
xund F
yVoraussetzung: Normalvert., Unabh., Fx und Fy bekannt Testgröße:
H :0 µ = µx y
H :1 Ablehnung von H , wenn µ < µx y z < !u
µ > µx y z > u
µ x µy |z | > u = 8
0
0 1!"
0 1!"
0 1!"/2 1!"
z-Test zum Mittelwertsvergleich zweier verbund- ener Stichproben bei bekanntem F
dVoraussetzung: Normalvert., Abhängk., Fd bekannt Testgröße:
H :0 µ = µ bzw. µ x y x! µ = µ = 0y d
H :1 Ablehnung von H , wenn
µ < µ bzw. µ < 0x y d z < !u µ > µ bzw. µ > 0x y d z > u
µ x µ bzw. µ y d 0 |z | > u = 8
0
0 1!"
0 1!"
0 1!"/2 1!"
P20(n1)@s2 F20
P20(nA1)@sA2 F2A
9@1.3702
12 16.89Ý16.92P29;0.95
P20(nB1)@sB2 F2B
11@0.3932
12 1.70 < 3.82P211;0.025
P
2-Test der Varianz
Voraussetzung: Normalverteilung Testgröße:
H :0 F = F
2 2
0
H :1 Ablehnung von H , wenn
F2 < F02 P < P F2 > F02 P > P
F2 F02 P > P oder P < P
0 02 2n!1;"
02 2n!1;1!"
0 n!1;1!"/2 0 n!1;"/2
2 2 2 2
Pilze
Austernpilze: s = 1.370, Braunkappen: s = 0.393A B H : 0 FA = 1 gegen H : 1 FA > 1 auf " = 5%
Nullhypothese kann auf 5% Signifikanzniveau nicht verworfen werden. p-Wert ist etwas größer als 5%.
H : 0 FB = 1 gegen H : 1 FB 1 auf " = 5%
H ist auf 5% Signifikanzniveau abzulehnen und H anzunehmen.0 1 Zum Signifikanzniveau von 5% ist also statistisch gesichert, daß die Standardabweichung verschieden von 1 ist. Der p-Wert ist kleiner als 0.2% (P211;0.001 = 1.83).
F0sx2 sy2
F0sA2 sB2
1.3702
0.393212.15 > 3.78F9,10;0.975> F9,11;0.975
F-Test zum Vergleich zweier Varianzen
Voraussetzung: Normalverteilung, Unabhängigkeit Testgröße:
H :0 Fx = Fy
2 2
H :1 Ablehnung von H , wenn
Fx2 < Fy2 F < F Fx2 > Fy2 F > F
Fx2 Fy2 F > F oder F > F
0 0 m!1,n!1;"
0 m!1,n!1;1!"
0 m!1,n!1;1!"/2 0 m!1,n!1;"/2
Pilze
Austernpilze: s = 1.370, Braunkappen: s = 0.393A B H : 0 FA = FB gegen H : 1 FA FB auf " = 5%
H ist auf 5% Signifikanzniveau abzulehnen.Die Streuungen sind0 also auf " = 5% signifikant verschieden.
P20j
r
i'1
(BiEi)2 Ei
(BiEi)2 Ei
P
2-Test zur Prüfung von Häufigkeiten
Testgröße:
H :0 X - F(x)
H :1 Ablehnung von H , wenn X ß F(x) P02 > P2r!k!1;1!" 0
Mendelsches Kreuzungsexperiment mit Erbsen
RrGg × RrGg
Gameten RG Rg rG rg
RG RRGG RRGg RrGG RrGg Rg RRGg Rrgg RrGg Rrgg rG RrGG RrGg rrGG rrGg rg RrGg Rrgg rrGg rrgg
Erbsen pi Bi Ei
rund,gelb 9/16 315 313 0.0162 rund, grün 3/16 108 104 0.1349 kantig, gelb 3/16 101 104 0.1013 kantig, grün 1/16 032 035 0.2176 556 556 0.4700
P02 = 0.47 ÝP23;0.99 = P24!0!1;1!0.01 = P2r!k!1;1!", p = 1.00 ! 0.07 = 0.93 Wegen des hohen p-Werts von 93% besteht Grund zu der An- nahme, daß das theoretische Spaltungsverhältnis auch zutrifft.
ÿ ÿ
ÿ ÿ ÿ ÿ
ÿ ÿ ÿ ÿ
ÿ ÿ
P20j
k
i'1 j
l
j'1
(BijEij)2
Eij n@ j
k
i'1 j
l
j'1
Bij2 Bi.@B.j1
P
2-Test zur Prüfung auf Unabhängigkeit
Kontingenztafel
2. Merkmal
1. Merkmal 1 2 j l 3
1 B B B B B
2 i k
11
B21 B B B B
Bi1 B B B B
Bk1 B B B B
12 22
i2
k2
1j 2j
ij
kj
1l 2l
il
kl
1.
2.
i.
k.
3 B.1 B.2 B.j B.l B = n..
Testgröße:
H :0 Unabhängigkeit
H :1 Ablehnung von H , wenn Abhängigkeit P02 > P2(k!1)(l!1);1!" 0
P20 n@(a@db@c)2 (ab)@(cd)@(ac)@(bd)
P20200@(20@805@95)2
115@85@25@175 5.92 > 3.84P21;0.95
P
2-Test bei einer einfachen Zweiwegklassifikation
Vierfeldertafel
2. Merkmal
1. Merkmal 1 2 3
1 a b a + b
2 c d c + d
3 a + c b + d n
Testgröße:
H :0 Unabhängigkeit
H :1 Ablehnung von H , wenn Abhängigkeit P02 > P21;1!" 0
Medikamente
Medikament ohne Erfolg mit Erfolg 3
A 20 095 115
B 05 080 085
3 25 175 200
Auf 5% Signifikanzniveau ist Medikament A verschieden von B.