Stichprobe Zufallsvariable

(1)

Numero, pondere et mensura Deus omnia condidit

Parameterschätzung

(2)

Population, Zufallsvariable, Stichprobe

Population

Stichprobe Zufallsvariable

X

x

eine "Realisierung” von X

(Beobachtung)

(3)

alle männlichen Rekruten der US Armee (Population)

die ersten 10 männlichen Wehrpflichtigen, die am 11. Mai 2004 das Rekrutierungsbüro der US Armee in Concord NH betreten

(Stichprobe)

BMI eines zu einem zufälligen Zeitpunkt in einem zufällig gewählten Rekrutierungsbüro anzutreffenden Rekruten

(Zufallsvariable)

(4)

Einige Konventionen

Zufallsvariable werden mit Großbuchstaben bezeichnet.

Mögliche Werte oder tatsächliche Beobachtungen

("Realisierungen") werden mit kleinen Buchstaben bezeichnet.

P(X≤x)

Wahrscheinlichkeit, dass der BMI eines zufällig ausgewählten Rekruten höchstens den Wert x annimmt

P(X>18)

Wahrscheinlichkeit, dass ein zufällig ausgewählter Rekrut nicht untergewichtig ist

P(24<X<30)

Wahrscheinlichkeit, dass ein zufällig ausgewählter Rekrut übergewichtig, aber nicht fettleibig ist

(5)

Schätzung aus Stichproben

Grundidee

Stichprobe Ziehen

Population Stichprobe

x

₁

,...,x

_n

Realisierungen Zufallsvariable

X

θ: Parameter

Daten Sammeln

Schätzer

) x ,..., x

ˆ (

n

θ

1 Schätzung

θ

ˆ Inferenz

Bilden

Schlussfolgerung

(6)

Parameter

π

Wahrscheinlichkeit

µ

Erwartungswert

σ

²

Varianz

Beobachtungen

0,0,1,1,0,1,...

1.23,4.81,7.55,...

12.4,19.6,20.4,...

x

₁

,...,x

_n

θ

Schätzer

Anteil

Stichprobenmittel

Stichprobenvarianz

) x ,..., x

(

₁ _n

θ )

ˆ = x µ

n / ˆ = k

π

2

s

ˆ = σ

Schätzung aus Stichproben

Grundidee

(7)

Werfen einer Münze

π: Wahrscheinlichkeit für Kopf

6 . 10 0

6 n

ˆ = k = = π

X: Anzahl Kopf in 10 Würfen X hat eine Bin(π,10) Verteilung

4

6 (1 )

210 )

6 X

(

P_π = = ⋅ π ⋅ − π ^0.00^0.0 ^0.2 ^0.4 ^0.6 ^0.8 ^1.0

0.05 0.10 0.15 0.20 0.25 0.30

π

(8)

Likelihood und Wahrscheinlichkeit

Die Likelihood eines Parameters, gegeben die Beobachtungen,

ist die Wahrscheinlichkeit der Beobachtungen, gegeben der Parameter.

) x X

( P )

x

| (

L θ =

_θ

=

(9)

Das Maximum-Likelihood-Prinzip

Auf der Basis von Beobachtungen wird ein Parameter durch dessen mutmaßlichsten Wert geschätzt, d.h.

durch den Wert, der die Wahrscheinlichkeit der Beobachtungen maximiert.

D.h. wird so gewählt, dass θ ˆ

) x

| (

L max

) x ˆ |

(

L θ =

_θ

θ

(10)

AB0-Blutgruppen

In einer Stichprobe von 75 Individuen aus einer bestimmten Population hatten 10 Personen die Blutgruppe B. Wie groß ist die Häufigkeit π der Blutgruppe B in dieser Population?

0.0 0.2 0.4 0.6 0.8 1.0

0.00 0.04 0.08 0.12 0.16

133

π

. 75 0

ˆ π = 10 =

65 10

11 (1 )

10 3

.

8 × ⋅ π ⋅ − π

(11)

Binomialverteilung

k n

k

( 1 )

k ) n

k

| (

L  ⋅ π ⋅ − π

⁻



 



=  π

) 1

log(

) k n

( )

log(

k const

)}

k

| ( L

log{ π = + ⋅ π + − ⋅ − π

1 0

k n

k )}

k

| ( L

log{ =

π

−

− −

= π δπ

π δ

n

= k π

n / ˆ = k

π ist der Maximum-Likelihood-Schätzer von π

Das Maximum-Likelihood-Prinzip

(12)

Suzette Charles Sharlene Wells Susan Akin Kellye Cash

Kaye Lani Rae Rafko Gretchen Carlson Debbye Turner Marjorie Vincent Kate Shindle

Nicole Johnson

Angela Perez Baraquio Katie Harman

1984 1985 1986 1987 1988 1989 1990 1991 1998 1999 2001 2002

17.7 18.2 16.8 17.6 18.8 19.1 17.9 17.8 20.2 19.6 20.3 19.5

Jahr Name BMI

Welchen Erwartungswert µ hat der BMI einer US

Schönheitskönigin?

? 6 . 18 x =

Liegt µ ungefähr bei

Weiblicher Body-Mass-Index (BMI)

(13)

Normalverteilung

ˆ

=

x

µ ist der Maximum-Likelihood-Schätzer von µ

2 i )2

x ( n

1 n i

1

e

2 ) 1

x ,..., x

| (

L

^σ

µ

− −

∏

= _σ _π ^⋅

= µ

∑

₌

⁻ ^µ

− σ

=

µ

₁ _n

1

₂ ⁿ_i ₁

( x

_i

)

²

const

)}

x ,..., x

| ( L log{

( ⁿ ^x ) ⁰

2 )}

x ,..., x

| ( L

log{

ⁿ

1

i i

2 n

1 ⋅ µ − =

− σ δµ =

µ

δ

∑

₌

∑

₌

⋅

=

µ ⁿ_i ₁ x_i n

1

Das Maximum-Likelihood-Prinzip

(14)

Schätzer als Zufallsvariable

Wegen der zufälligen Natur von Stichproben ist jeder Schätzer selbst eine Zufallsvariable mit

Erwartungswert E( ) und Varianz Var( ).

θ ˆ

ˆ ) ( Var θ

θ

ˆ ˆ θ

wird als "Standardfehler" von bezeichnet. ˆ θ

(15)

Seien X₁,...,X_n unabhängig und identisch verteilt mit E(X_i)=µ und Var(X_i)=σ^2.

Verteilung des Stichprobenmittels

µ

= µ

⋅

=

⋅

=



 



 ⋅

=

∑

₌

∑

₌

ⁿ

n ) 1

X ( n E

X 1 n

E 1 )

X (

E

ⁿ

1

i i

n 1

i i

n n n

) 1 X ( n Var

X 1 n

Var 1 )

X ( Var

2 2

2 n

1

i i

2 n

1

i i

= σ σ

⋅

=

⋅

=



 



 ⋅

=

∑

₌

∑

₌

n

Standardfehler:

σ

(16)

Genauigkeit bezieht sich auf die Differenz zwischen dem Erwartungswert eines Schätzers und dem wahren

Parameter.

Präzision bezieht sich auf die Varianz eines Schätzers.

genau präzise

genau nicht präzise

nicht genau präzise

nicht genau nicht präzise

Genauigkeit und Präzision

(17)

"Gute" Schätzer

Ein guter Schätzer ist unverzerrt: E ( θ ˆ ) = θ

"100% genau, d.h. er liefert im Durchschnitt den wahren Parameter"

konsistent: P (| ˆ θ

_n

− θ | > ε ) → 0

"liefert mit wachsendem Stichprobenumfang immer genauere und präzisere Schätzungen, die dem wahren Parameter zustreben"

"kein anderer unverzerrter (d.h. 100% genauer) Schätzer liefert präzisere Schätzungen”

effizient: Var ( ˆ θ )

^minimal

n

(18)

unverzerrt (100% genau)

konsistent (Genauigkeit und Präzision streben mit

wachsendem Umfang der Stichprobe 100% zu)

effizient (der präziseste

Schätzer unter allen 100%

genauen Schätzern)

"Gute" Schätzer

(19)

Maximum-Likelihood

Maximum-Likelihood-Schätzer sind generell konsistent

asymptotisch effizient

aber NICHT immer unverzerrt

"Gute" Schätzer

(20)

Wahrscheinlichkeit

n /

ˆ π = k ist ein unverzerrter Schätzer von π

X habe eine Bin(π,n) Verteilung

...

) 1

k ( k n

n ) 1

X ( n E

1 n

E X ˆ)

(

E ⁿ

0 k

k n

k ⋅ − π =

π

 ⋅







⋅ 

⋅

=

⋅

=



 



= 

π

∑

₌ ⁻

n ˆπ = k

π

= π

⋅

= n

n 1

Unverzerrte Schätzer

(21)

0.2 0.3 0.4 0.5 0.6 0.7 0.8

n=50 n=100 n=500

100 Wiederholungen : Anteil von Kopf unter n Würfen

π ˆ

Werfen einer Münze

(22)

Unverzerrte Schätzer

ˆ = x

µ ist ein unverzerrter Schätzer von µ

X₁,...,X_n seien identisch verteilt mit E(X_i)=µ

µ

= µ

⋅

=

⋅

=



 



 ⋅

=

µ

∑

₌

∑

₌ ⁿ

n ) 1

X ( n E

X 1 n

E 1 ˆ)

(

E ⁿ

1

i i

n 1

i i

∑

₌

⋅

=

µ ⁿ_i ₁ x_i n

x 1 ˆ

Erwartungswert

(23)

X_i: Augenzahl eines einzelnen Wurfs (i=1,...,n) X : durchschnittliche Augenzahl aus n Würfen

Würfelspiel

1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5

n=10 n=100 n=500

100 Wiederholungen

X

(24)

2

s

ˆ =

σ ist ein unverzerrter Schätzer von σ

²

...

) X X

1 ( n

E 1 ˆ )

(

E ⁿ

1 i

2 i

2  =



 



 ⋅ −

= −

σ

∑

₌

∑

₌ ⁻

− ⋅

=

σ² ² ⁿ_i ₁(x_i x)² 1

n s 1

ˆ

2 2

2

1) ]

X ( E [ ) 1 n

1 ( n

1 ⋅ − ⋅ − µ = σ

= −

X₁,...,X_n seien unabhängig und identisch verteilt mit Var(X_i)=σ²

Varianz

Unverzerrte Schätzer

(25)

Die (stetige) Gleichverteilung

a b

1

f(x) =

−

0

für a≤x≤b sonst

a b

1

−

2 a ) b

X (

E = +

12 ) a b ) (

X ( Var

− 2

=

(26)

Gleichverteilung

a=4, b=8 µ=6, σ²=1.33

5 10 15 20 25

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

s2

Stichprobenumfang (n)

100 Wiederholungen

(27)

Konsistente Schätzer

Ein Schätzer heißt "konsistent", wenn seine Genauigkeit und Präzision mit zunehmendem Stichprobenumfang

wachsen und jeweils gegen 100% streben.

0 )

ˆ | (|

P θ

_n

− θ > ε →

n

n /

ˆ π = k ist ein konsistenter Schätzer von π

2

s

ˆ =

σ ist ein konsistenter Schätzer von σ

²

ˆ = x

µ ist ein konsistenter Schätzer von µ

(28)

Effiziente Schätzer

Ein unverzerrter Schätzer heißt "effizient", wenn jeder andere unverzerrte Schätzer mehr streut.

n /

ˆ π = k ist ein effizienter Schätzer von π

2

s

ˆ =

σ ist meistens ein effizienter Schätzer von σ

²

ˆ )

(

Var θ minimal

ˆ = x

µ ist meistens ein effizienter Schätzer von µ

(29)

Für die meisten stetigen Zufallsvariablen gilt

0 ˆ ) (

P

θ = θ =

d.h. es ist unmöglich, dass ein Schätzer den wahren Parameter "auf den Kopf trifft".

Meistens ist es sinnvoller, θ durch ein Intervall zu schätzen, das θ mit einer gewissen "Sicherheit"

enthält.

Konfidenzintervall

(30)

Ein Konfidenzintervall ist eine Vorschrift, die einer Stichprobe x ein Intervall I(x) so zuordnet, dass für jeden möglichen Wert θ des zu schätzenden Parameters

gilt. Wurde die Stichprobe x erhoben und das Konfidenzintervall I(x) berechnet, so besteht ein Vertrauen 1-α, dass I(x) das wahre θ auch enthält.

α

−

≥

∈

θ

( x : θ I ( x )) 1 P

1-α heißt "Konfidenzniveau" (üblicherweise 0.95)

Konfidenzintervall

Definition

(31)

Konfidenzintervall

Aus dem Zentralen Grenzwertsatz folgt, dass

n X

σ

µ

−

Erwartungswert

für großes n eine N(0,1)-Verteilung hat.

95 . 0 )

96 . n 1

96 X . 1 (

P

≤ =

σ

µ

≤ −

−

95 . 0 n )

96 . 1 n X

96 . 1 X

(

P

− ⋅ σ ≤ µ ≤ + ⋅ σ =

(32)

96 n . 1

x

± ⋅ σ

markiert ein Intervall, das den wahren Erwartungswert mit Wahrscheinlichkeit 0.95 (d.h. in 95% aller unabhängigen

Wiederholungen des Experiments) enthalten wird.

µ

Konfidenzintervall

Erwartungswert

(33)

Suzette Charles Sharlene Wells Susan Akin Kellye Cash

Kaye Lani Rae Rafko Gretchen Carlson Debbye Turner Marjorie Vincent Kate Shindle

Nicole Johnson

Angela Perez Baraquio Katie Harman

1984 1985 1986 1987 1988 1989 1990 1991 1998 1999 2001 2002

17.7 18.2 16.8 17.6 18.8 19.1 17.9 17.8 20.2 19.6 20.3 19.5

Jahr Name BMI

95% Konfidenzintervall für den

Erwartungswert (Annahme: σ=1.2)

12 2 . 96 1

. 1 6

.

18 ± ⋅

(17.9,19.3)

oder

Weiblicher Body-Mass-Index (BMI)

(34)

1-α

α/2 α/2

z

_α_/2

z

_1-_α_/2

σ bekannt:

z n

x

± ₁₋_α_/₂ ⋅ σ

σ unbekannt:

n t s

x

± ₁₋_α_/₂_,_n₋₁ ⋅

wobei t_1-_α_/2,n-1 das Quantil einer t-Verteilung mit n-1

Freiheitsgraden ist.

Konfidenzintervall

Erwartungswert

(35)

Student t-Verteilung

William S. Gosset (1876-1937)

x

-4 -2 0 2 4

f(x)

0.0 0.1 0.2 0.3 0.4

1 Freiheitsgrad 2 Freiheitsgrade

3 Freiheitsgrade 500 Freiheitsgrade

(36)

Wie man bessere Schätzungen bekommt

) n X (

Var = σ

d.h. der Standardfehler des Stichprobenmittels sinkt mit wachsendem Stichprobenumfang.

z n x

:

KI

± ₁₋_α_/₂ ⋅ σ

n t s

x :

KI

± ₁₋_α_/₂_,_n₋₁ ⋅

d.h. die Breite eines Konfidenzintervalls verringert sich mit wachsendem Stichprobenumfang.

Erwartungswert

(37)

Die Breite eines Konfidenzintervalls steigt mit steigender Sicherheit.

z

_α_/2

z

_1-_α_/2

1-α steigt z_1-_α_/2 steigt W steigt

Wie man bessere Schätzungen bekommt

Erwartungswert

1-α

α/2 α/2

z n 2

W

= ⋅ ₁₋_α_/₂ ⋅ σ Breite W des KI:

(38)

Konfidenzintervall

Stichprobenumfang

z n 2

W = ⋅

₁₋_α _/₂

⋅ σ

2 2

/ 1

W z

n 2 





 

 ⋅ ⋅ σ

=

⁻^α

Wie viele Beobachtungen sind nötig, um den

Erwartungswert des männlichen BMI mit einem 95%

Konfidenzintervall von höchsten 2 kg/m² Breite zu schätzen (Annahme: BMI ist normalverteilt mit σ=2.5)?

01 . 2 24

5 . 2 96 . 1 n 2

2

=



 



 ⋅ ⋅

= Antwort:

(39)

Zusammenfassung

- Schätzen bezeichnet den wissenschaftlichen Vorgang des Erschließens von Populationsparametern aus Stichproben.

- Ein Schätzer ist eine mathematische Vorschrift für die Berechnung von Parameterschätzungen aus Daten.

- Schätzer wie z.B. das Stichprobenmittel sind selbst wieder Zufallsvariable, mit Erwartungswert und Varianz.

- Gute Schätzer sollten unverzerrt (genau), effizient (am präzisesten) und konsistent (zunehmend präzise) sein.

- Statt "Punktschätzungen" liefern Konfidenzintervalle Bereiche, die einen gesuchten Parameter mit bestimmter Sicherheit

enthalten.