Statistische Hypothesentests

(1)

T^ECHNISCHEUNIVERSITÄT M^ÜNCHEN-WEIHENSTEPHAN

MATHEMATIK UND S^TATISTIK

INFORMATIONS-^UNDDOKUMENTATIONSZENTRUM R.K^RAFT

Statistik SS 00

Statistische Hypothesentests

Statistische Hypothesen

Null- und Alternativhypothese Testfehler

Test von Erwartungswerten

z-Test für den Mittelwert bei bekanntem F t-Test für den Mittelwert bei unbekanntem F

t-Test zum Mittelwertsvergleich zweier unabhängiger Stichproben bei unbekanntem Fx = Fy

t-Test zum Mittelwertsvergleich zweier verbundener Stichproben bei unbekanntem Fd

t-Test zum Mittelwertsvergleich zweier unabhängiger Stichproben bei unbekanntem FxFy (Welch-Test) z-Test zum Mittelwertsvergleich zweier unabhängiger

Stichproben bei bekanntem Fx und Fy

z-Test zum Mittelwertsvergleich zweier verbundener Stichproben bei bekanntem Fd

Test von Varianzen

P²-Test der Varianz

F-Test zum Vergleich zweier Varianzen

Analyse von Häufigkeiten und Kontingenztafeln

P²-Test zur Prüfung von Häufigkeiten bzw. Verteilungen P²-Test zur Prüfung auf Unabhängigkeit

P²-Test bei einer einfachen Zweiwegklassifikation

(2)

:0

Ablehnungs- bereich c

Nichtablehnungs- bereich

Ablehnungs- bereich c2

Nichtablehnungs- bereich Ablehnungs-

bereich

c1 :₀

Statistische Hypothesen

Nullhypothese

z.B. H : µ = µ₀ ₀ Alternativhypothese

z.B. H : µ < µ oder µ > µ₁ ₀ ₀ einseitig H : µ 1 µ0 zweiseitig

Ablehnungsbereiche einseitig:

zweiseitig: X X

"

:₀ c :₁

$

Fehler bei statistischen Tests

Ausfall des Tests H richtig0 H falsch0

Nichtablehnung von H₀

richtige Entschei- Fehler 2. Art

dung mit der mit der

Sicherheitswahr- Wahrscheinlichkeit scheinlichkeit

1 !" $

Ablehnung von H0

Fehler 1. Art richtige Entschei-

mit der dung mit der

Wahrscheinlichkeit Wahrscheinlichkeit

" 1 !$

": Fehler 1. Art, Risiko 1. Art, Signifikanzniveau

$: Fehler 2. Art, Risiko 2. Art

1 !$: Macht, Güte oder Power des Tests

Dichte von , Dichte von ,

falls H zutrifft0 falls H zutrifft1

(3)

t₀xµ₀ s/ n

x960.7 g, s46.5 g

t₀xµ₀ s/ n

960.71000.0 46.5/ 7

2.236 <1.943t_6;0.95

t-Test für den Mittelwert bei unbekanntem F

Voraussetzung: Normalverteilung, F unbekannt Testgröße:

H :0 µ = µ0

H :1 Ablehnung von H , wenn

µ < µ₀ t < !t µ > µ₀ t > t µ µ0 |t | > t

0 0 n!1;1!"

0 n!1;1!"

0 n!1;1!"/2

Kopfgewicht von Chinakohl

Kopf i 1 2 3 4 5 6 7

Gewicht [g] 920 975 1030 910 955 925 1010

H : µ = 1000 g gegen H : µ < 1000 g auf 0 1 " = 5%

H wird auf dem Signifikanzniveau 0 " = 5% zugunsten von H1

abgelehnt. Zum Signifikanzniveau von 5% ist also statistisch gesichert, daß das Kopfgewicht kleiner als 1 kg ist.

z₀xµ₀ F/ n

U49.66 V, F0.5 V

z₀Uµ_U FU/ n

49.6650 0.5/ 10

2.15, also |z₀|2.15 > 1.96u_0.975

z-Test für den Mittelwert bei bekanntem F

Voraussetzung: Normalverteilung, F bekannt Testgröße:

H :0 µ = µ0

H :1 Ablehnung von H , wenn µ < µ₀ z < !u

µ > µ₀ z > u

µ µ0 |z | > u = 8

0 0 1!"

0 1!"

0 1!"/2 1!"

Justierung eines Voltmeters

i 1 2 3 4 5 6 7 8 9 10

U [V] 49.8 50.1 48.9 49.4 51.0 48.8 49.3 49.4 49.9 50.0 (laut Hersteller)

H : µ = 50 V gegen H : µ 0 U 1 U 50 V auf " = 5%

H wird auf dem Signifikanzniveau 0 " = 5% zugunsten von H1

abgelehnt. Zum Signifikanzniveau von 5% ist also statistisch gesichert, daß der mittlere Meßwert vom Sollwert abweicht.

(4)

t₀ n_xn_y(n_xn_y2)

n_xn_y @ xy

(n_x1)s_x²(n_y1)s_y² t₀ n@ xy

s_x²s_y²

für n_xn_yn

µ_x< µ_y µ_x> µ_y µ_xµ_y

t₀<t_n

x%n_y&2;1&"

t₀> t_n

x%n_y&2;1&"

|t₀| > t_n

x%n_y&2;1&"/2

H697.3 g, s_H36.8 g, N628.5 g, s_N47.4 g

t₀ n@ HN s_H²s_N²

8@ 697.3628.5 36.8²47.4²

3.24

t-Test zum Mittelwertsvergleich zweier unabhän- giger Stichproben bei unbekanntem F

x

= F

y

Voraussetzung: Normalvert., Unabh., Fx = Fy unbekannt Testgröße:

H :0 µ = µx y

H :₁ Ablehnung von H , wenn₀

Schweinemast

Protein mittlere tägliche Gewichtszunahme [g]

hoch Hi 715 683 664 659 660 762 720 715

niedrig N_i 684 655 657 531 638 601 611 651

H : µ = µ gegen H : µ > µ auf ₀ _H _N ₁ _H _N " = 1%

> 2.624 = t_14;0.99 H wird auf ₀ " = 1% zugunsten von H abgelehnt.₁

t₀ d s_d/ n

d1.58 h, s_d1.23 h

|t₀|/0000 /0000 d s_d/ n

1.58@ 10

1.23 4.06 > 3.25t_9;0.005

t-Test zum Mittelwertsvergleich zweier verbunde- ner Stichproben bei unbekanntem F

d

Voraussetzung: Normalvert., Abhäng., Fd unbekannt Testgröße:

H :0 µ = µ bzw. µ x y x! µ = µ = 0y d

H :₁ Ablehnung von H , wenn

µ < µ bzw. µ < 0x y d t < !t µ > µ bzw. µ > 0_x _y _d t > t µ x µ bzw. µ y d0 |t | > t

0

0 n!1;1!"

0 n!1;1!"

0 n!1;1!"/2

Schlafmittel

Schlafverlängerung [h]

A_i 1.9 0.8 1.1 0.1 !0.1 4.4 5.5 1.6 4.6 3.4 B 0.7_i !1.6 !0.2 !1.2 !0.1 3.4 3.7 0.8 0.0 2.0 d 1.2i 2.4 1.3 1.3 0.0 1.0 1.8 0.8 4.6 1.4

H : µ = µ bzw. µ = 0 gegen H : µ ₀ _A _B _d ₁ _A µ bzw. µ _B _d 0 auf " = 1%

H wird auf dem Signifikanzniveau ₀ " = 1% zugunsten von H₁ abgelehnt. Zum Signifikanzniveau von 1% ist also statistisch gesichert, daß sich die beiden Schlafmittel unterscheiden.

(5)

t₀ xy s_x²/n_xs_y²/n_y

FG (s_x²/n_xs_y²/n_y)²

s_x⁴/(n_x²(n_x1))s_y⁴/(n_y²(n_y1)) FG(n1)@(s_x²s_y²)²

s_x⁴s_y⁴

für n_xn_yn

t-Test zum Mittelwertsvergleich zweier unabhän- giger Stichproben bei unbekannten und

verschiedenen F

_x

F

_y

(Welch-Test)

Voraussetzung: Normalvert., Unabh., FxFy unbekannt Testgröße:

Freiheitsgrade:

H :0 µ = µx y

µ < µx y t < !t µ > µ_x _y t > t µ xµy |t | > t

0

0 FG;1!"

0 FG;1!"/2

Pilze

Two Sample T-Test and Confidence Interval Two sample T for Auster vs Braun

N Mean StDev SE Mean Auster 10 6.210 1.370 0.43 Braun 12 5.225 0.393 0.11

95% CI for mu Auster - mu Braun: ( -0.01, 1.98) T-Test mu Auster = mu Braun (vs not =):

T= 2.20 P=0.053 DF= 10

z₀ xy F²x/n_xF²y/n_y

t₀ d Fd/ n

z-Test zum Mittelwertsvergleich zweier unabhän- giger Stichproben bei bekanntem F

x

und F

y

Voraussetzung: Normalvert., Unabh., Fx und Fy bekannt Testgröße:

H :₀ µ = µ_x _y

H :₁ Ablehnung von H , wenn µ < µ_x _y z < !u

µ > µ_x _y z > u

µ xµy |z | > u = 8

0

0 1!"

0 1!"/2 1!"

z-Test zum Mittelwertsvergleich zweier verbund- ener Stichproben bei bekanntem F

d

Voraussetzung: Normalvert., Abhängk., F_d bekannt Testgröße:

H :0 µ = µ bzw. µ x y x! µ = µ = 0y d

µ < µ bzw. µ < 0x y d z < !u µ > µ bzw. µ > 0_x _y _d z > u

µ x µ bzw. µ y d0 |z | > u = 8

0

0 1!"

0 1!"/2 1!"

(6)

P²0(n1)@s² F²0

P²0(n_A1)@s_A² F²A

9@1.370²

1² 16.89Ý16.92P²9;0.95

P²0(n_B1)@s_B² F²B

11@0.393²

1² 1.70 < 3.82P²_11;0.025

P

²

-Test der Varianz

Voraussetzung: Normalverteilung Testgröße:

H :0 F = F

2 2

0

F² < F0² P < P F² > F0² P > P

F²F0² P > P oder P < P

0 02 2n!1;"

02 2n!1;1!"

0 n!1;1!"/2 0 n!1;"/2

2 2 2 2

Pilze

Austernpilze: s = 1.370, Braunkappen: s = 0.393_A _B H : 0 FA = 1 gegen H : 1 FA > 1 auf " = 5%

Nullhypothese kann auf 5% Signifikanzniveau nicht verworfen werden. p-Wert ist etwas größer als 5%.

H : ₀ F_B = 1 gegen H : ₁ F_B 1 auf " = 5%

H ist auf 5% Signifikanzniveau abzulehnen und H anzunehmen.₀ ₁ Zum Signifikanzniveau von 5% ist also statistisch gesichert, daß die Standardabweichung verschieden von 1 ist. Der p-Wert ist kleiner als 0.2% (P²_11;0.001 = 1.83).

F₀s_x² s_y²

F₀s_A² s_B²

1.370²

0.393²12.15 > 3.78F_9,10;0.975> F_9,11;0.975

F-Test zum Vergleich zweier Varianzen

Voraussetzung: Normalverteilung, Unabhängigkeit Testgröße:

H :0 Fx = Fy

2 2

H :1 Ablehnung von H , wenn

F_x² < F_y² F < F F_x² > F_y² F > F

F_x²F_y² F > F oder F > F

0 0 m!1,n!1;"

0 m!1,n!1;1!"

0 m!1,n!1;1!"/2 0 m!1,n!1;"/2

Pilze

Austernpilze: s = 1.370, Braunkappen: s = 0.393_A _B H : ₀ F_A = F_B gegen H : ₁ F_AF_B auf " = 5%

H ist auf 5% Signifikanzniveau abzulehnen.Die Streuungen sind₀ also auf " = 5% signifikant verschieden.

(7)

P²0j

r

i'1

(B_iE_i)² E_i

P

²

-Test zur Prüfung von Häufigkeiten

Testgröße:

H :₀ X - F(x)

H :1 Ablehnung von H , wenn X ß F(x) P02 > P2r!k!1;1!" ⁰

Mendelsches Kreuzungsexperiment mit Erbsen

RrGg × RrGg

Gameten RG Rg rG rg

RG RRGG RRGg RrGG RrGg Rg RRGg Rrgg RrGg Rrgg rG RrGG RrGg rrGG rrGg rg RrGg Rrgg rrGg rrgg

Erbsen p_i B_i E_i

rund,gelb 9/16 315 313 0.0162 rund, grün 3/16 108 104 0.1349 kantig, gelb 3/16 101 104 0.1013 kantig, grün 1/16 032 035 0.2176 556 556 0.4700

P₀2 = 0.47 ÝP2_3;0.99 = P24!0!1;1!0.01 = P2r!k!1;1!", p = 1.00 ! 0.07 = 0.93 Wegen des hohen p-Werts von 93% besteht Grund zu der An- nahme, daß das theoretische Spaltungsverhältnis auch zutrifft.

ÿ ÿ

ÿ ÿ ÿ ÿ

ÿ ÿ

P²0j

k

i'1 j

l

j'1

(B_ijE_ij)²

E_ij n@ j

k

i'1 j

l

j'1

B_ij² B_i.@B_.j1

P

²

-Test zur Prüfung auf Unabhängigkeit

Kontingenztafel

2. Merkmal

1. Merkmal 1 2 j l 3

1 B B B B B

2 i k

11

B₂₁ B B B B

B_i1 B B B B

Bk1 B B B B

12 22

i2

k2

1j 2j

ij

kj

1l 2l

il

kl

1.

2.

i.

k.

3 B_.1 B_.2 B_.j B_.l B = n_..

Testgröße:

H :₀ Unabhängigkeit

H :₁ Ablehnung von H , wenn Abhängigkeit P02 > P2(k!1)(l!1);1!" ⁰

(8)

P²0 n@(a@db@c)² (ab)@(cd)@(ac)@(bd)

P²0200@(20@805@95)²

115@85@25@175 5.92 > 3.84P²1;0.95

P

²

-Test bei einer einfachen Zweiwegklassifikation

Vierfeldertafel

2. Merkmal

1. Merkmal 1 2 3

1 a b a + b

2 c d c + d

3 a + c b + d n

Testgröße:

H :₀ Unabhängigkeit

H :₁ Ablehnung von H , wenn Abhängigkeit P02 > P21;1!" ⁰

Medikamente

Medikament ohne Erfolg mit Erfolg 3

A 20 095 115

B 05 080 085

3 25 175 200

Auf 5% Signifikanzniveau ist Medikament A verschieden von B.