Statistik I f¨ur Betriebswirte Vorlesung 13

(1)

Statistik I f¨ ur Betriebswirte Vorlesung 13

Dr. Andreas W¨ unsche

TU Bergakademie Freiberg Institut f¨ur Stochastik

8. Juli 2019

(2)

3.3 Parametersch¨ atzungen: Konfidenzsch¨ atzungen

I

Ein Nachteil von Punktsch¨ atzungen ist darin zu sehen, dass diese als Zufallsgr¨ oßen mit einer Verteilung mit einer positiven Varianz den

” wahren“ Wert des Parameters ϑ nur selten

” exakt treffen“. Bei stetigen Verteilungen, wie z.B. der Normalverteilung, geschieht dies sogar nur mit Wahrscheinlichkeit Null, da z.B. P X = µ

= 0 gilt.

I

Daher ist es h¨ aufig besser, einen ganzen Bereich (ein ganzes Intervall) als Sch¨ atzung anzubieten, dieser Bereich soll dann den unbekannten tats¨ achlichen Parameter mit hoher Wahrscheinlichkeit

¨

uberdecken.

I

Das Intervall I ist ein Konfidenzintervall (Vertrauensintervall) oder allgemeiner eine Konfidenzsch¨ atzung f¨ ur den Parameter ϑ zum Niveau 1 − α, wenn P(ϑ ∈ I ) ≥ 1 − α gilt.

I

Dabei wird eine Zahl 0 < α < 1 , ¨ ublicherweise nahe 0 , vorgegeben.

Sie gibt die Wahrscheinlichkeit an, mit der Fehlentscheidungen (der wahre Parameter wurde nicht ¨ uberdeckt) akzeptiert werden.

Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 2

(3)

Konfidenzintervalle

I

Wenn also f¨ ur 100 verschiedene Stichproben aus ein und derselben Grundgesamtheit f¨ ur ein und denselben Parameter jeweils ein Konfidenzintervall zum Niveau 1 − α bestimmt wird, werden im Mittel (1 − α) · 100 Intervalle den unbekannten Parameter

¨

uberdecken und α · 100 nicht. Ob das eine konkret berechnete Intervall den Parameter ¨ uberdeckt oder nicht, ist aber nicht entscheidbar.

I

Jeder Parameterwert aus dem Konfidenzintervall I kann als wahrer Parameterwert akzeptiert werden, allerdings mit einer

Irrtumswahrscheinlichkeit von α .

I

Ausgangspunkt zur Konstruktion eines Konfidenzintervalles f¨ ur einen Parameter ϑ ist meistens eine Sch¨ atzgr¨ oße f¨ ur eine

Punktsch¨ atzung ˆ ϑ . Dazu muss man jedoch die exakte (oder

asymptotische) Verteilung der Sch¨ atzfunktion oder einer geeigneten

abgeleiteten Stichprobenfunktion finden.

(4)

Konfidenzintervall f¨ ur µ falls X ∼ N(µ, σ ² ), σ ² bekannt

I

Wegen X ∼ N

µ, σ

²

n

gilt X − µ σ

√ n ∼ N(0, 1) .

I

Mit dem Quantil z

1−^α₂

zum Niveau 1 −

^α₂

der Standardnormalverteilung

d.h. Φ(z

1−^α

2

) = 1 − α 2

gilt dann P

−z

₁₋^α

2

≤ X − µ

σ

√ n ≤ z

1−^α

2

= 1 − α , P

X − σ

√ n z

1−^α

2

≤ µ ≤ X + σ

√ n z

1−^α

2

= 1 − α .

I

Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I

_µ

f¨ ur den Erwartungswert µ der Normalverteilung bei bekannter Varianz σ

²

zum Konfidenzniveau 1 − α

I

µ

=

X − σ

√ n z

1−^α

2

; X + σ

√ n z

1−^α

2

.

(5)

Zahlenbeispiel 3.5

I

Aufgabe: 10 W¨ agungen eines leichten Objektes (auf einer Apothekerwaage) ergaben (in mg):

10.3 10.1 10.4 9.9 10.2 9.6 10.0 10.2 10.3 10.0.

Die Waagengenauigkeit sei mit σ = 0.25 bekannt, die Messwerte k¨ onnen als normalverteilt angenommen werden.

Bestimmen Sie das konkrete Konfidenzintervall f¨ ur µ zur Irrtumswahrscheinlichkeit von 0.05 !

I

L¨ osung: α = 0.05 ⇒ 1 −

^α₂

= 0.975 ⇒ z

0.975

= 1.96, n = 10, x = 10.1 ⇒

I =

10.1 − 0.25

√ 10 · 1.96 ; 10.1 + 0.25

√ 10 · 1.96

,

I = [9.945 ; 10.255] .

(6)

Notwendiger Stichprobenumfang

I

Aus einer vorgegebenen ¨ Uberdeckungswahrscheinlichkeit 1 − α und einer vorgegebenen Intervalll¨ ange kann man den dazu notwendigen Stichprobenumfang ableiten.

I

In dem schon behandelten Fall eines Konfidenzintervalles f¨ ur den Erwartungswert µ einer normalverteilten Grundgesamtheit bei bekannter Varianz σ

²

betr¨ agt die halbe Intervalll¨ ange

d = σ

√ n z

1−^α

2

, folglich n ≥

z

1−^α₂

d

2

σ

²

.

I

Im W¨ agebeispiel 3.5 ergibt das f¨ ur α = 0.05 , d = 0.1 einen Wert von n = 24 .

I

In anderen Situationen h¨ angen h¨ aufig mehrere Gr¨ oßen in der Formel f¨ ur die Intervalll¨ ange von n ab, z.B. das vorkommende Quantil.

Dann kann man mit einem iterativen Vorgehen den notwendigen Stichprobenumfang bestimmen.

(7)

Allgemeine Wirkung von α und n

I

Allgemeine Wirkung der Irrtumswahrscheinlichkeit α : Je kleiner α ist, desto gr¨ oßer ist bei gegebenem n das

Konfidenzintervall, d.h. desto unsch¨ arfer wird ϑ lokalisiert, desto gr¨ oßer ist aber auch die ¨ Uberdeckungswahrscheinlichkeit.

I

Allgemeine Wirkung des Stichprobenumfangs n :

Je gr¨ oßer n ist, desto kleiner wird bei gegebenem α das

Konfidenzintervall, d.h. umso sch¨ arfer wird ϑ lokalisiert.

(8)

Statistische Pr¨ ufverteilungen

I

Zur Bestimmung von Konfidenzintervallen f¨ ur Parameter der

Normalverteilung und die sp¨ ater zu behandelnden statistischen Tests ben¨ otigt man Quantile von bestimmten Verteilungen, die mit der Normalverteilung zusammenh¨ angen und die man statistische Pr¨ ufverteilungen nennt. Dies sind

I

die χ

²

-Verteilung (Chi-Quadrat-Verteilung),

I

die t-Verteilung (Student-Verteilung) und

I

die F-Verteilung (Fisher-Verteilung).

I

In den nachfolgenden Folien zu den speziellen Pr¨ ufverteilungen seien deshalb X

1

, . . . , X

n

unabh¨ angige normalverteilte Zufallsgr¨ oßen mit jeweils Erwartungswert µ und Varianz σ

²

und

X = 1 n

n

X

i=1

X

i

,

S

²

= 1 n − 1

n

X

i=1

X

i

− X

2

.

(9)

Die χ ² -Verteilung (Chi-Quadrat-Verteilung) I

I

Parameter: m ∈ N (

” Anzahl der Freiheitsgrade“).

I

Es seien Z

1

, . . . , Z

m

unabh¨ angige und identisch standardnormal- verteilte Zufallsgr¨ oßen (Z

_i

i.i.d. mit Z

_i

∼ N(0, 1), i = 1, . . . , m).

Dann ist die Zufallsgr¨ oße X mit

X = Z

₁²

+ Z

₂²

+ . . . + Z

_m²

=

m

X

i=1

Z

_i²

χ

²

-verteilt mit m-Freiheitsgraden.

I

Bezeichnung: X ∼ χ

²_m

.

I

Es ist f¨ ur X

_i

∼ N(µ, σ

²

), u.i.v. (i.i.d.), 1

σ

²

n

X

i=1

(X

_i

− µ)

²

χ

²

− verteilt mit n Freiheitsgraden und 1

σ

²

n

X

i=1

X

_i

− X

2

χ

²

− verteilt mit n − 1 Freiheitsgraden.

(10)

Die χ ² -Verteilung (Chi-Quadrat-Verteilung) II

0 5 10 15

0.000.050.100.150.200.25

Dichtefunktionen: Chi−Quadrat−Verteilung

x

Freiheitsgrade:m=3 m=5 m=8

(11)

Die t-Verteilung (Student-Verteilung) I

I

Parameter: m ∈ N (

” Anzahl der Freiheitsgrade“).

I

Es seien Z und X unabh¨ angige Zufallsgr¨ oßen mit Z ∼ N(0, 1) (standardnomalverteilt) und X ∼ χ

²_m

(χ

²

-verteilt mit m Freiheitsgraden). Dann ist die Zufallsgr¨ oße Y mit

Y = Z q

X

m

t-verteilt mit m-Freiheitsgraden.

I

Bezeichnung: Y ∼ t

m

.

I

Es ist f¨ ur X

_i

∼ N(µ, σ

²

), u.i.v., S = v u u t

1 n − 1

n

X

i=1

X

_i

− X

2

√ n X − µ

S t − verteilt mit n − 1 Freiheitsgraden.

(12)

Die t-Verteilung (Student-Verteilung) II

−4 −2 0 2 4

0.00.10.20.30.4

Dichtefunktionen: t−Verteilung

x

Freiheitsgrade: m=1 m=5 m=100

(13)

Die F -Verteilung (Fisher-Verteilung) I

I

Parameter: m

₁

, m

₂

∈ N (

” Anzahl der Freiheitsgrade“).

I

Es seien X

₁

und X

₂

zwei unabh¨ angige χ

²

-verteilte Zufallsgr¨ oßen mit m

1

und m

2

Freiheitsgraden. Dann ist die Zufallsgr¨ oße Y mit

Y =

X1

m1

X2

m2

F -verteilt mit den beiden Freiheitsgraden m

₁

und m

₂

.

I

Bezeichnung: Y ∼ F

m1,m2

.

I

F¨ ur zwei unabh¨ angige normalverteilte Stichproben X

_1i

(X

_1i

∼ N(µ

₁

, σ

₁²

)) i = 1, . . . , n

₁

(ˆ σ

²₁

= S

₁²

) und X

2i

(X

2i

∼ N(µ

2

, σ

₂²

)) i = 1, . . . , n

2

(ˆ σ

²₂

= S

₂²

) ist

S

₁²

/σ

₁²

S

₂²

/σ

₂²

F -verteilt mit den Freiheitsgraden n

₁

− 1 und n

₂

− 1.

(14)

Die F -Verteilung (Fisher-Verteilung) II

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0.00.51.01.5

Dichtefunktionen: F−Verteilung

x

Freiheitsgrade: m₁=5, m₂=5 m₁=5, m₂=50 m₁=50, m₂=50

(15)

Konfidenzintervall f¨ ur µ falls X ∼ N(µ, σ ² ), σ ² unbekannt

I

Es ist f¨ ur X

i

∼ N(µ, σ

²

) , u.i.v., S = q

1

n−1

P

n

i=1

X

i

− X

2

√ n X − µ

S t − verteilt mit n − 1 Freiheitsgraden.

I

Mit dem Quantil t

_n−1;1−^α

2

zum Niveau 1 −

^α₂

der t-Verteilung mit n − 1 Freiheitsgraden gilt dann

P

−t

_n−1;1−^α

2

≤ √

n X − µ

S ≤ t

n−1;1−^α

2

= 1 − α , P

X − S

√ n t

_n−1;1−^α

2

≤ µ ≤ X + S

√ n t

_n−1;1−^α

2

= 1 − α .

I

Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I

_µ

f¨ ur den Erwartungswert µ der Normalverteilung bei unbekannter Varianz σ

²

zum Konfidenzniveau 1 − α

I

_µ

=

X − S

√ n t

_n−1;1−^α

2

; X + S

√ n t

_n−1;1−^α

2

.

(16)

Beispielaufgabe 3.6

I

Aufgabe: In einem Betrieb werden unter anderem gr¨ une Bohnen in Dosen abgef¨ ullt. Bei einer Stichprobe von 25 Dosen wurden folgende Abf¨ ullgewichte in g ermittelt:

173 , 176 , 172 , 176 , 175 , 174 , 172 , 173 , 173 , 178 , 176 , 177 , 175 , 176 , 173 , 172 , 175 , 174 , 172 , 174 , 173 , 177 , 176 , 174 , 174 . Es wird angenommen, dass es sich bei den Werten um Realisierungen einer normalverteilten Zufallsgr¨ oße handelt.

1. Bestimmen Sie einen Sch¨ atzer f¨ ur das mittlere Abf¨ ullgewicht µ ! 2. Geben Sie ein Konfidenzintervall zum Niveau 0.95 f¨ ur das

Durchschnittsgewicht an !

I

Gr¨ oßen zur L¨ osung:

x = 174.4, s = 1.756, s

²

= 3.083, n = 25, 1 − α

2 = 0.975, t

24;0.975

= 2.064.

(17)

Konfidenzintervall f¨ ur σ ² falls X ∼ N(µ, σ ² ), µ bekannt

I

Es ist f¨ ur X

_i

∼ N(µ, σ

²

) , u.i.v., S

^∗2

= 1 n

n

X

i=1

(X

_i

− µ)

²

,

nS

^∗2

σ

²

= 1

σ

²

n

X

i=1

(X

_i

− µ)

²

χ

²

− verteilt mit n Freiheitsgraden.

I

Mit den Quantilen χ

²_n;α 2

bzw. χ

²_n;1−α 2

zu den Niveaus

^α₂

bzw.

1 −

^α₂

der χ

²

-Verteilung mit n Freiheitsgraden gilt dann P

χ

²_n;^α

2

≤ nS

^∗2

σ

²

≤ χ

²_n;1−^α

2

= 1 − α , P nS

^∗2

χ

²_n;1−α 2

≤ σ

²

≤ nS

^∗2

χ

²_n;α 2

!

= 1 − α .

(18)

Konfidenzintervall f¨ ur σ ² falls X ∼ N(µ, σ ² ), µ bekannt

I

Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I

_σ²

f¨ ur die Varianz σ

²

der Normalverteilung bei bekanntem

Erwartungswert µ zum Konfidenzniveau 1 − α

I

_σ²

=

"

nS

^∗2

χ

²_n;1−α

2

; nS

^∗2

χ

²_n;α 2

# .

I

Das (zweiseitige) Konfidenzintervall I

_σ

f¨ ur die Standardabweichung σ der Normalverteilung bei bekanntem Erwartungswert µ zum Konfidenzniveau 1 − α erh¨ alt man daraus durch Berechnung der Quadratwurzeln:

I

σ

=

"s nS

^∗2

χ

²_n;1−α

2

;

s nS

^∗2

χ

²_n;α 2

# .

(19)

Konfidenzintervall f¨ ur σ ² falls X ∼ N(µ, σ ² ), µ unbekannt

I

Es ist f¨ ur X

_i

∼ N(µ, σ

²

) , u.i.v., S

²

= 1 n − 1

n−1

X

i=1

X

_i

− X

2

,

(n − 1)S

²

σ

²

= 1

σ

²

n

X

i=1

(X

_i

− X )

²

χ

²

− verteilt mit n − 1 Freiheitsgraden.

I

Mit den Quantilen χ

²_n−1;α

2

bzw. χ

²_n−1;1−α

2

zu den Niveaus

^α₂

bzw.

1 −

^α₂

der χ

²

-Verteilung mit n − 1 Freiheitsgraden gilt dann P

χ

²_n−1;^α

2

≤ (n − 1)S

²

σ

²

≤ χ

²_n−1;1−^α

2

= 1 − α , P (n − 1)S

²

χ

²_n−1;1−α 2

≤ σ

²

≤ (n − 1)S

²

χ

²_n−1;α

2

!

= 1 − α .

(20)

Konfidenzintervall f¨ ur σ ² falls X ∼ N(µ, σ ² ), µ unbekannt

I

Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I

_σ²

f¨ ur die Varianz σ

²

der Normalverteilung bei unbekanntem

Erwartungswert µ zum Konfidenzniveau 1 − α

I

_σ²

=

"

(n − 1)S

²

χ

²_n−1;1−α

2

; (n − 1)S

²

χ

²_n−1;α

2

# .

I

Das (zweiseitige) Konfidenzintervall I

_σ

f¨ ur die Standardabweichung σ der Normalverteilung bei unbekanntem Erwartungswert µ zum Konfidenzniveau 1 − α erh¨ alt man daraus durch Berechnung der Quadratwurzeln:

I

σ

=

"s

(n − 1)S

²

χ

²_n−1;1−α

2

;

s (n − 1)S

²

χ

²_n−1;α

2

# .

(21)

Einseitige Konfidenzintervalle

I

Einseitige Konfidenzintervalle, d.h. nur obere bzw. nur untere Konfidenzgrenzen, erh¨ alt man, indem man bei den zweiseitigen Konfidenzintervallen die entsprechende Grenze w¨ ahlt und bei den Quantilen

^α₂

durch α ersetzt. Die andere Grenze wird dann entsprechend der m¨ oglichen Werte des Parameters gew¨ ahlt, also z.B. −∞ als untere Grenze f¨ ur den Erwartungswert µ oder 0 als untere Grenze f¨ ur die Varianz σ

²

oder die Standardabweichung σ.

I

Oft verwendet werden einseitige Konfidenzintervalle mit oberer Konfidenzgrenze zur Intervallsch¨ atzung der Varianz σ

²

einer Normalverteilung; ist der Erwartungswert µ unbekannt, lautet das entsprechende Konfidenzintervall zum Konfidenzniveau 1 − α:

I

_σ²

=

"

0 ; (n − 1)S

²

χ

²_n−1;α

#

.

(22)

Beispiel Konfidenzintervall f¨ ur σ ²

I

Im W¨ agebeispiel 3.5 waren:

n = 10 , x = 10.1 , s

²

= 0.2357

²

= 0.0556 , die Werte werden als normalverteilt mit unbekanntem

Erwartungswert µ und unbekannter Varianz σ

²

angenommen.

I

Dann sind mit den Quantilen

χ

²_9;0.025

= 2.70 , χ

²_9;0.05

= 3.33 , χ

²_9;0.975

= 19.0 die Konfidenzintervalle zum Konfidenzniveau 1 − α = 0.95 :

I

zweiseitig f¨ ur σ

²

: I

_σ2

=

9 · 0.0556

19.0 ; 9 · 0.0556 2.70

= [0.0263 ; 0.1853] ;

I

zweiseitig f¨ ur σ : I

σ

= h√

0.0263 ; √ 0.1853 i

= [0.1622 ; 0.4305] ;

I

einseitig (oben) f¨ ur σ

²

: I

_σ2

=

0 ; 9 · 0.0556 3.33

= [0 ; 0.1503] ;

I

einseitig (oben) f¨ ur σ : I

σ

= h 0 ; √

0.1503 i

= [0 ; 0.3877] .

(23)

Asymptotische Konfidenzintervalle

I

Die Konfidenzintervalle f¨ ur den Erwartungswert bzw. die Varianz k¨ onnen als asymptotische Konfidenzintervalle auch f¨ ur

nicht-normalverteilte Merkmale (mit endlicher Varianz) genutzt werden, wenn der Stichprobenumfang n groß genug ist.

I

Dabei gen¨ ugt bei symmetrischen Verteilungen oft schon eine Anzahl von n ≈ 15 Stichprobenwerten, w¨ ahrend bei schiefen Verteilungen oft n ≈ 30 noch nicht ausreicht.

I

Auch eine unbekannte Wahrscheinlichkeit p kann mit Hilfe eines

solchen asymptotischen Konfidenzintervalls gesch¨ atzt werden.

(24)

Konfidenzintervall f¨ ur eine Wahrscheinlichkeit p

I

Aufgabe: Intervallsch¨ atzung der Wahrscheinlichkeit p eines Ereignisses A, also p = P (A).

I

X

_i

=

1, A tritt bei Beobachtung i ein,

0, A tritt bei Beobachtung i nicht ein, (i = 1, . . . , n).

I

Die Sch¨ atzgr¨ oße f¨ ur p ist die relative H¨ aufigkeit ˆ p = X , dabei ist die absolute H¨ aufigkeit X = nX binomialverteilt mit Parametern n und p.

I

Mit Hilfe des Grenzwertsatzes von Moivre-Laplace kann man ein asymptotisches Konfidenzintervall I = [G

_u

; G

_o

] zum

Konfidenzniveau 1 − α konstruieren.

I

Dieses kann f¨ ur große Stichprobenumf¨ ange n genutzt werden, als Faustregel gelten n p ˆ > 5 und n(1 − p) ˆ > 5.

(25)

Konfidenzintervall f¨ ur eine Wahrscheinlichkeit p

I

Mit dem Quantil z

1−^α

2

der Standardnormalverteilung zum Niveau 1 − α

2 erh¨ alt man G

u

= 1

n + z

₁₋² ^α

2

"

X + 1 2 z

₁₋² ^α

2

− z

1−^α

2

r X (n − X ) n + 1

4 z

₁₋² α 2

# ,

G

o

= 1 n + z

₁₋² α

2

"

X + 1 2 z

₁₋² ^α

2

+ z

1−^α₂

r X (n − X ) n + 1

4 z

₁₋² α 2

# .

I

Eine einseitige untere Konfidenzgrenze w¨ are dann z.B. gegeben durch

G

u

= 1 n + z

_1−α²

"

X + 1

2 z

_1−α²

− z

1−α

r X (n − X ) n + 1

4 z

_1−α²

#

.

(26)

Beispiel 3.7: Konfidenzintervall f¨ ur p

I

Aufgabe: Zur Sch¨ atzung des Ausschussanteils eines umfangreichen Lieferpostens werde diesem eine Stichprobe von 200 Teilen

entnommen. Dabei wurden 190 einwandfreie Teile festgestellt.

1. Geben Sie eine Sch¨ atzung f¨ ur den Ausschussanteil an.

2. Berechnen Sie ein Konfidenzintervall f¨ ur den Ausschussanteil zum Konfidenzniveau 1 − α = 0.95.

I

Gr¨ oßen zur L¨ osung:

n = 200, x =

₂₀₀¹⁰

= 0.05, absolute H¨ aufigkeit x = 10, 1 −

^α₂

= 0.975, z

_0.975

= 1.96 .

(27)

Klausur Statistik I f¨ ur Betriebswirte

I

Termin: Montag, 29. Juli 2019, 7:30 - 9:30 Uhr .

I

Raum:

I

Alte Mensa

I

Als Hilfsmittel zugelassen f¨ ur die Klausur sind Mitschriften, Ausdrucke, Formelsammlung, B¨ ucher, Taschenrechner (auch ein programmierbarer), usw., also alles außer Kommunikationsmittel.

I

Nicht zugelassen f¨ ur die Klausur sind Notebook, Tablet, Handy, Smartphone, Smartwatch, usw., also alle m¨ oglichen

Kommunikationsmittel.

I

Statistik I f¨ur Betriebswirte Vorlesung 13