Statistik I f¨ ur Betriebswirte Vorlesung 13
Dr. Andreas W¨ unsche
TU Bergakademie Freiberg Institut f¨ur Stochastik
8. Juli 2019
3.3 Parametersch¨ atzungen: Konfidenzsch¨ atzungen
I
Ein Nachteil von Punktsch¨ atzungen ist darin zu sehen, dass diese als Zufallsgr¨ oßen mit einer Verteilung mit einer positiven Varianz den
” wahren“ Wert des Parameters ϑ nur selten
” exakt treffen“. Bei stetigen Verteilungen, wie z.B. der Normalverteilung, geschieht dies sogar nur mit Wahrscheinlichkeit Null, da z.B. P X = µ
= 0 gilt.
I
Daher ist es h¨ aufig besser, einen ganzen Bereich (ein ganzes Intervall) als Sch¨ atzung anzubieten, dieser Bereich soll dann den unbekannten tats¨ achlichen Parameter mit hoher Wahrscheinlichkeit
¨
uberdecken.
I
Das Intervall I ist ein Konfidenzintervall (Vertrauensintervall) oder allgemeiner eine Konfidenzsch¨ atzung f¨ ur den Parameter ϑ zum Niveau 1 − α, wenn P(ϑ ∈ I ) ≥ 1 − α gilt.
I
Dabei wird eine Zahl 0 < α < 1 , ¨ ublicherweise nahe 0 , vorgegeben.
Sie gibt die Wahrscheinlichkeit an, mit der Fehlentscheidungen (der wahre Parameter wurde nicht ¨ uberdeckt) akzeptiert werden.
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 2
Konfidenzintervalle
I
Wenn also f¨ ur 100 verschiedene Stichproben aus ein und derselben Grundgesamtheit f¨ ur ein und denselben Parameter jeweils ein Konfidenzintervall zum Niveau 1 − α bestimmt wird, werden im Mittel (1 − α) · 100 Intervalle den unbekannten Parameter
¨
uberdecken und α · 100 nicht. Ob das eine konkret berechnete Intervall den Parameter ¨ uberdeckt oder nicht, ist aber nicht entscheidbar.
I
Jeder Parameterwert aus dem Konfidenzintervall I kann als wahrer Parameterwert akzeptiert werden, allerdings mit einer
Irrtumswahrscheinlichkeit von α .
I
Ausgangspunkt zur Konstruktion eines Konfidenzintervalles f¨ ur einen Parameter ϑ ist meistens eine Sch¨ atzgr¨ oße f¨ ur eine
Punktsch¨ atzung ˆ ϑ . Dazu muss man jedoch die exakte (oder
asymptotische) Verteilung der Sch¨ atzfunktion oder einer geeigneten
abgeleiteten Stichprobenfunktion finden.
Konfidenzintervall f¨ ur µ falls X ∼ N(µ, σ 2 ), σ 2 bekannt
I
Wegen X ∼ N
µ, σ
2n
gilt X − µ σ
√ n ∼ N(0, 1) .
I
Mit dem Quantil z
1−α2zum Niveau 1 −
α2der Standardnormalverteilung
d.h. Φ(z
1−α2
) = 1 − α 2
gilt dann P
−z
1−α2
≤ X − µ
σ
√ n ≤ z
1−α2
= 1 − α , P
X − σ
√ n z
1−α2
≤ µ ≤ X + σ
√ n z
1−α2
= 1 − α .
I
Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I
µf¨ ur den Erwartungswert µ der Normalverteilung bei bekannter Varianz σ
2zum Konfidenzniveau 1 − α
I
µ=
X − σ
√ n z
1−α2
; X + σ
√ n z
1−α2
.
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 4
Zahlenbeispiel 3.5
I
Aufgabe: 10 W¨ agungen eines leichten Objektes (auf einer Apothekerwaage) ergaben (in mg):
10.3 10.1 10.4 9.9 10.2 9.6 10.0 10.2 10.3 10.0.
Die Waagengenauigkeit sei mit σ = 0.25 bekannt, die Messwerte k¨ onnen als normalverteilt angenommen werden.
Bestimmen Sie das konkrete Konfidenzintervall f¨ ur µ zur Irrtumswahrscheinlichkeit von 0.05 !
I
L¨ osung: α = 0.05 ⇒ 1 −
α2= 0.975 ⇒ z
0.975= 1.96, n = 10, x = 10.1 ⇒
I =
10.1 − 0.25
√ 10 · 1.96 ; 10.1 + 0.25
√ 10 · 1.96
,
I = [9.945 ; 10.255] .
Notwendiger Stichprobenumfang
I
Aus einer vorgegebenen ¨ Uberdeckungswahrscheinlichkeit 1 − α und einer vorgegebenen Intervalll¨ ange kann man den dazu notwendigen Stichprobenumfang ableiten.
I
In dem schon behandelten Fall eines Konfidenzintervalles f¨ ur den Erwartungswert µ einer normalverteilten Grundgesamtheit bei bekannter Varianz σ
2betr¨ agt die halbe Intervalll¨ ange
d = σ
√ n z
1−α2
, folglich n ≥
z
1−α2d
2σ
2.
I
Im W¨ agebeispiel 3.5 ergibt das f¨ ur α = 0.05 , d = 0.1 einen Wert von n = 24 .
I
In anderen Situationen h¨ angen h¨ aufig mehrere Gr¨ oßen in der Formel f¨ ur die Intervalll¨ ange von n ab, z.B. das vorkommende Quantil.
Dann kann man mit einem iterativen Vorgehen den notwendigen Stichprobenumfang bestimmen.
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 6
Allgemeine Wirkung von α und n
I
Allgemeine Wirkung der Irrtumswahrscheinlichkeit α : Je kleiner α ist, desto gr¨ oßer ist bei gegebenem n das
Konfidenzintervall, d.h. desto unsch¨ arfer wird ϑ lokalisiert, desto gr¨ oßer ist aber auch die ¨ Uberdeckungswahrscheinlichkeit.
I
Allgemeine Wirkung des Stichprobenumfangs n :
Je gr¨ oßer n ist, desto kleiner wird bei gegebenem α das
Konfidenzintervall, d.h. umso sch¨ arfer wird ϑ lokalisiert.
Statistische Pr¨ ufverteilungen
I
Zur Bestimmung von Konfidenzintervallen f¨ ur Parameter der
Normalverteilung und die sp¨ ater zu behandelnden statistischen Tests ben¨ otigt man Quantile von bestimmten Verteilungen, die mit der Normalverteilung zusammenh¨ angen und die man statistische Pr¨ ufverteilungen nennt. Dies sind
I
die χ
2-Verteilung (Chi-Quadrat-Verteilung),
I
die t-Verteilung (Student-Verteilung) und
I
die F-Verteilung (Fisher-Verteilung).
I
In den nachfolgenden Folien zu den speziellen Pr¨ ufverteilungen seien deshalb X
1, . . . , X
nunabh¨ angige normalverteilte Zufallsgr¨ oßen mit jeweils Erwartungswert µ und Varianz σ
2und
X = 1 n
n
X
i=1
X
i,
S
2= 1 n − 1
n
X
i=1
X
i− X
2.
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 8
Die χ 2 -Verteilung (Chi-Quadrat-Verteilung) I
I
Parameter: m ∈ N (
” Anzahl der Freiheitsgrade“).
I
Es seien Z
1, . . . , Z
munabh¨ angige und identisch standardnormal- verteilte Zufallsgr¨ oßen (Z
ii.i.d. mit Z
i∼ N(0, 1), i = 1, . . . , m).
Dann ist die Zufallsgr¨ oße X mit
X = Z
12+ Z
22+ . . . + Z
m2=
m
X
i=1
Z
i2χ
2-verteilt mit m-Freiheitsgraden.
I
Bezeichnung: X ∼ χ
2m.
I
Es ist f¨ ur X
i∼ N(µ, σ
2), u.i.v. (i.i.d.), 1
σ
2n
X
i=1
(X
i− µ)
2χ
2− verteilt mit n Freiheitsgraden und 1
σ
2n
X
i=1
X
i− X
2χ
2− verteilt mit n − 1 Freiheitsgraden.
Die χ 2 -Verteilung (Chi-Quadrat-Verteilung) II
0 5 10 15
0.000.050.100.150.200.25
Dichtefunktionen: Chi−Quadrat−Verteilung
x
Freiheitsgrade:m=3 m=5 m=8
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 10
Die t-Verteilung (Student-Verteilung) I
I
Parameter: m ∈ N (
” Anzahl der Freiheitsgrade“).
I
Es seien Z und X unabh¨ angige Zufallsgr¨ oßen mit Z ∼ N(0, 1) (standardnomalverteilt) und X ∼ χ
2m(χ
2-verteilt mit m Freiheitsgraden). Dann ist die Zufallsgr¨ oße Y mit
Y = Z q
Xm
t-verteilt mit m-Freiheitsgraden.
I
Bezeichnung: Y ∼ t
m.
I
Es ist f¨ ur X
i∼ N(µ, σ
2), u.i.v., S = v u u t
1 n − 1
n
X
i=1
X
i− X
2√ n X − µ
S t − verteilt mit n − 1 Freiheitsgraden.
Die t-Verteilung (Student-Verteilung) II
−4 −2 0 2 4
0.00.10.20.30.4
Dichtefunktionen: t−Verteilung
x
Freiheitsgrade: m=1 m=5 m=100
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 12
Die F -Verteilung (Fisher-Verteilung) I
I
Parameter: m
1, m
2∈ N (
” Anzahl der Freiheitsgrade“).
I
Es seien X
1und X
2zwei unabh¨ angige χ
2-verteilte Zufallsgr¨ oßen mit m
1und m
2Freiheitsgraden. Dann ist die Zufallsgr¨ oße Y mit
Y =
X1
m1
X2
m2
F -verteilt mit den beiden Freiheitsgraden m
1und m
2.
I
Bezeichnung: Y ∼ F
m1,m2.
I
F¨ ur zwei unabh¨ angige normalverteilte Stichproben X
1i(X
1i∼ N(µ
1, σ
12)) i = 1, . . . , n
1(ˆ σ
21= S
12) und X
2i(X
2i∼ N(µ
2, σ
22)) i = 1, . . . , n
2(ˆ σ
22= S
22) ist
S
12/σ
12S
22/σ
22F -verteilt mit den Freiheitsgraden n
1− 1 und n
2− 1.
Die F -Verteilung (Fisher-Verteilung) II
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.51.01.5
Dichtefunktionen: F−Verteilung
x
Freiheitsgrade: m1=5, m2=5 m1=5, m2=50 m1=50, m2=50
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 14
Konfidenzintervall f¨ ur µ falls X ∼ N(µ, σ 2 ), σ 2 unbekannt
I
Es ist f¨ ur X
i∼ N(µ, σ
2) , u.i.v., S = q
1n−1
P
ni=1
X
i− X
2√ n X − µ
S t − verteilt mit n − 1 Freiheitsgraden.
I
Mit dem Quantil t
n−1;1−α2
zum Niveau 1 −
α2der t-Verteilung mit n − 1 Freiheitsgraden gilt dann
P
−t
n−1;1−α2
≤ √
n X − µ
S ≤ t
n−1;1−α2
= 1 − α , P
X − S
√ n t
n−1;1−α2
≤ µ ≤ X + S
√ n t
n−1;1−α2
= 1 − α .
I
Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I
µf¨ ur den Erwartungswert µ der Normalverteilung bei unbekannter Varianz σ
2zum Konfidenzniveau 1 − α
I
µ=
X − S
√ n t
n−1;1−α2
; X + S
√ n t
n−1;1−α2
.
Beispielaufgabe 3.6
I
Aufgabe: In einem Betrieb werden unter anderem gr¨ une Bohnen in Dosen abgef¨ ullt. Bei einer Stichprobe von 25 Dosen wurden folgende Abf¨ ullgewichte in g ermittelt:
173 , 176 , 172 , 176 , 175 , 174 , 172 , 173 , 173 , 178 , 176 , 177 , 175 , 176 , 173 , 172 , 175 , 174 , 172 , 174 , 173 , 177 , 176 , 174 , 174 . Es wird angenommen, dass es sich bei den Werten um Realisierungen einer normalverteilten Zufallsgr¨ oße handelt.
1. Bestimmen Sie einen Sch¨ atzer f¨ ur das mittlere Abf¨ ullgewicht µ ! 2. Geben Sie ein Konfidenzintervall zum Niveau 0.95 f¨ ur das
Durchschnittsgewicht an !
I
Gr¨ oßen zur L¨ osung:
x = 174.4, s = 1.756, s
2= 3.083, n = 25, 1 − α
2 = 0.975, t
24;0.975= 2.064.
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 16
Konfidenzintervall f¨ ur σ 2 falls X ∼ N(µ, σ 2 ), µ bekannt
I
Es ist f¨ ur X
i∼ N(µ, σ
2) , u.i.v., S
∗2= 1 n
n
X
i=1
(X
i− µ)
2,
nS
∗2σ
2= 1
σ
2n
X
i=1
(X
i− µ)
2χ
2− verteilt mit n Freiheitsgraden.
I
Mit den Quantilen χ
2n;α 2bzw. χ
2n;1−α 2zu den Niveaus
α2bzw.
1 −
α2der χ
2-Verteilung mit n Freiheitsgraden gilt dann P
χ
2n;α2
≤ nS
∗2σ
2≤ χ
2n;1−α2
= 1 − α , P nS
∗2χ
2n;1−α 2≤ σ
2≤ nS
∗2χ
2n;α 2!
= 1 − α .
Konfidenzintervall f¨ ur σ 2 falls X ∼ N(µ, σ 2 ), µ bekannt
I
Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I
σ2f¨ ur die Varianz σ
2der Normalverteilung bei bekanntem
Erwartungswert µ zum Konfidenzniveau 1 − α
I
σ2=
"
nS
∗2χ
2n;1−α2
; nS
∗2χ
2n;α 2# .
I
Das (zweiseitige) Konfidenzintervall I
σf¨ ur die Standardabweichung σ der Normalverteilung bei bekanntem Erwartungswert µ zum Konfidenzniveau 1 − α erh¨ alt man daraus durch Berechnung der Quadratwurzeln:
I
σ=
"s nS
∗2χ
2n;1−α2
;
s nS
∗2χ
2n;α 2# .
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 18
Konfidenzintervall f¨ ur σ 2 falls X ∼ N(µ, σ 2 ), µ unbekannt
I
Es ist f¨ ur X
i∼ N(µ, σ
2) , u.i.v., S
2= 1 n − 1
n−1
X
i=1
X
i− X
2,
(n − 1)S
2σ
2= 1
σ
2n
X
i=1
(X
i− X )
2χ
2− verteilt mit n − 1 Freiheitsgraden.
I
Mit den Quantilen χ
2n−1;α2
bzw. χ
2n−1;1−α2
zu den Niveaus
α2bzw.
1 −
α2der χ
2-Verteilung mit n − 1 Freiheitsgraden gilt dann P
χ
2n−1;α2
≤ (n − 1)S
2σ
2≤ χ
2n−1;1−α2
= 1 − α , P (n − 1)S
2χ
2n−1;1−α 2≤ σ
2≤ (n − 1)S
2χ
2n−1;α2
!
= 1 − α .
Konfidenzintervall f¨ ur σ 2 falls X ∼ N(µ, σ 2 ), µ unbekannt
I
Damit erh¨ alt man die Formel f¨ ur das (zweiseitige) Konfidenzintervall I
σ2f¨ ur die Varianz σ
2der Normalverteilung bei unbekanntem
Erwartungswert µ zum Konfidenzniveau 1 − α
I
σ2=
"
(n − 1)S
2χ
2n−1;1−α2
; (n − 1)S
2χ
2n−1;α2
# .
I
Das (zweiseitige) Konfidenzintervall I
σf¨ ur die Standardabweichung σ der Normalverteilung bei unbekanntem Erwartungswert µ zum Konfidenzniveau 1 − α erh¨ alt man daraus durch Berechnung der Quadratwurzeln:
I
σ=
"s
(n − 1)S
2χ
2n−1;1−α2
;
s (n − 1)S
2χ
2n−1;α2
# .
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 20
Einseitige Konfidenzintervalle
I
Einseitige Konfidenzintervalle, d.h. nur obere bzw. nur untere Konfidenzgrenzen, erh¨ alt man, indem man bei den zweiseitigen Konfidenzintervallen die entsprechende Grenze w¨ ahlt und bei den Quantilen
α2durch α ersetzt. Die andere Grenze wird dann entsprechend der m¨ oglichen Werte des Parameters gew¨ ahlt, also z.B. −∞ als untere Grenze f¨ ur den Erwartungswert µ oder 0 als untere Grenze f¨ ur die Varianz σ
2oder die Standardabweichung σ.
I
Oft verwendet werden einseitige Konfidenzintervalle mit oberer Konfidenzgrenze zur Intervallsch¨ atzung der Varianz σ
2einer Normalverteilung; ist der Erwartungswert µ unbekannt, lautet das entsprechende Konfidenzintervall zum Konfidenzniveau 1 − α:
I
σ2=
"
0 ; (n − 1)S
2χ
2n−1;α#
.
Beispiel Konfidenzintervall f¨ ur σ 2
I
Im W¨ agebeispiel 3.5 waren:
n = 10 , x = 10.1 , s
2= 0.2357
2= 0.0556 , die Werte werden als normalverteilt mit unbekanntem
Erwartungswert µ und unbekannter Varianz σ
2angenommen.
I
Dann sind mit den Quantilen
χ
29;0.025= 2.70 , χ
29;0.05= 3.33 , χ
29;0.975= 19.0 die Konfidenzintervalle zum Konfidenzniveau 1 − α = 0.95 :
I
zweiseitig f¨ ur σ
2: I
σ2=
9 · 0.0556
19.0 ; 9 · 0.0556 2.70
= [0.0263 ; 0.1853] ;
I
zweiseitig f¨ ur σ : I
σ= h√
0.0263 ; √ 0.1853 i
= [0.1622 ; 0.4305] ;
I
einseitig (oben) f¨ ur σ
2: I
σ2=
0 ; 9 · 0.0556 3.33
= [0 ; 0.1503] ;
I
einseitig (oben) f¨ ur σ : I
σ= h 0 ; √
0.1503 i
= [0 ; 0.3877] .
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 22
Asymptotische Konfidenzintervalle
I
Die Konfidenzintervalle f¨ ur den Erwartungswert bzw. die Varianz k¨ onnen als asymptotische Konfidenzintervalle auch f¨ ur
nicht-normalverteilte Merkmale (mit endlicher Varianz) genutzt werden, wenn der Stichprobenumfang n groß genug ist.
I
Dabei gen¨ ugt bei symmetrischen Verteilungen oft schon eine Anzahl von n ≈ 15 Stichprobenwerten, w¨ ahrend bei schiefen Verteilungen oft n ≈ 30 noch nicht ausreicht.
I
Auch eine unbekannte Wahrscheinlichkeit p kann mit Hilfe eines
solchen asymptotischen Konfidenzintervalls gesch¨ atzt werden.
Konfidenzintervall f¨ ur eine Wahrscheinlichkeit p
I
Aufgabe: Intervallsch¨ atzung der Wahrscheinlichkeit p eines Ereignisses A, also p = P (A).
I
X
i=
1, A tritt bei Beobachtung i ein,
0, A tritt bei Beobachtung i nicht ein, (i = 1, . . . , n).
I
Die Sch¨ atzgr¨ oße f¨ ur p ist die relative H¨ aufigkeit ˆ p = X , dabei ist die absolute H¨ aufigkeit X = nX binomialverteilt mit Parametern n und p.
I
Mit Hilfe des Grenzwertsatzes von Moivre-Laplace kann man ein asymptotisches Konfidenzintervall I = [G
u; G
o] zum
Konfidenzniveau 1 − α konstruieren.
I
Dieses kann f¨ ur große Stichprobenumf¨ ange n genutzt werden, als Faustregel gelten n p ˆ > 5 und n(1 − p) ˆ > 5.
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 24
Konfidenzintervall f¨ ur eine Wahrscheinlichkeit p
I
Mit dem Quantil z
1−α2
der Standardnormalverteilung zum Niveau 1 − α
2 erh¨ alt man G
u= 1
n + z
1−2 α2
"
X + 1 2 z
1−2 α2
− z
1−α2
r X (n − X ) n + 1
4 z
1−2 α 2# ,
G
o= 1 n + z
1−2 α2
"
X + 1 2 z
1−2 α2
+ z
1−α2r X (n − X ) n + 1
4 z
1−2 α 2# .
I
Eine einseitige untere Konfidenzgrenze w¨ are dann z.B. gegeben durch
G
u= 1 n + z
1−α2"
X + 1
2 z
1−α2− z
1−αr X (n − X ) n + 1
4 z
1−α2#
.
Beispiel 3.7: Konfidenzintervall f¨ ur p
I
Aufgabe: Zur Sch¨ atzung des Ausschussanteils eines umfangreichen Lieferpostens werde diesem eine Stichprobe von 200 Teilen
entnommen. Dabei wurden 190 einwandfreie Teile festgestellt.
1. Geben Sie eine Sch¨ atzung f¨ ur den Ausschussanteil an.
2. Berechnen Sie ein Konfidenzintervall f¨ ur den Ausschussanteil zum Konfidenzniveau 1 − α = 0.95.
I
Gr¨ oßen zur L¨ osung:
n = 200, x =
20010= 0.05, absolute H¨ aufigkeit x = 10, 1 −
α2= 0.975, z
0.975= 1.96 .
Dr. Andreas W¨unsche Statistik I f¨ur Betriebswirte Vorlesung 13 Version: 24. Juni 2019 26
Klausur Statistik I f¨ ur Betriebswirte
I
Termin: Montag, 29. Juli 2019, 7:30 - 9:30 Uhr .
I
Raum:
I
Alte Mensa
I
Als Hilfsmittel zugelassen f¨ ur die Klausur sind Mitschriften, Ausdrucke, Formelsammlung, B¨ ucher, Taschenrechner (auch ein programmierbarer), usw., also alles außer Kommunikationsmittel.
I
Nicht zugelassen f¨ ur die Klausur sind Notebook, Tablet, Handy, Smartphone, Smartwatch, usw., also alle m¨ oglichen
Kommunikationsmittel.
I