Statistik I f¨ur Betriebswirte Vorlesung 5
Dr. Andreas W¨unsche
TU Bergakademie Freiberg Institut f¨ur Stochastik
6. Mai 2019
1.7 Wichtige stetige Wahrscheinlichkeitsverteilungen
1.7.1 Normalverteilung (Gauß-Verteilung)
−5 0 5 10 15
0.000.020.040.060.080.100.12
Dichtefunktion
x
f(x)= 1 σ 2π e−(x−µ)
2 2σ2
mit µ =5,σ =3
∈ 2
Normalverteilung (Gauß-Verteilung)
I Zufallsgr¨oße X mit Dichtefunktion fX bzw. Verteilungsfunktion FX
fX(x) = 1
√2πσe−
(x−µ)2
2σ2 , FX(x) = 1
√2πσ Z x
−∞
e−
(t−µ)2
2σ2 dt, x ∈R.
−5 0 5 10 15
0.000.040.080.12
Dichtefunktion
x fX(x)= 1
σ2π e−(x−µ2σ2)2
mit µ =5,σ =3
−5 0 5 10 15
0.00.20.40.60.81.0
Verteilungsfunktion
x X~N(µ, σ2) mit µ =5,σ =3
FX(x)
I Bezeichnung: X ∼N(µ, σ2) .
Dichtefunktionen mit verschiedenen Erwartungswerten
−10 −5 0 5 10 15 20
0.000.020.040.060.080.100.12
Dichtefunktionen
x µ =0, σ =3
µ =5, σ =3 µ =10, σ =3 X~N(µ, σ2)
Die Dichtefunktion ist symmetrisch bez¨uglich der Geraden x=µ, deshalb gilt f¨ur den Median auchx0.5=µ.
Dichtefunktionen mit verschiedenen Varianzen
−10 −5 0 5 10 15 20
0.000.050.100.150.20
Dichtefunktionen
x µ =5, σ =2
µ =5, σ =3 µ =5, σ =5 X~N(µ, σ2)
Verschiedene Dichtefunktionen
−10 −5 0 5 10 15 20
0.000.050.100.150.20
Dichtefunktionen
x µ =5, σ =2
µ =1, σ =3 µ =9, σ =2.5 X~N(µ, σ2)
Standardnormalverteilung
I Die Zufallsgr¨oßeX iststandardnormalverteilt, fallsX normalverteilt ist mit µ=EX = 0 undσ2 =VarX = 1, d.h. X ∼N(0,1).
I Die Dichte- bzw. Verteilungsfunktion sind dann
φ(x) = 1
√ 2πe−x
2
2 bzw. Φ(x) = 1
√ 2π
Z x
−∞
e−t
2
2 dt, x ∈R.
I Ist die Zufallsgr¨oße X normalverteilt mit Erwartungswert µund Varianzσ2, dann ist die standardisierte Zufallsgr¨oße Z := X−µ standardnormalverteilt, d.h. normalverteilt mit Erwartungswert 0σ und Varianz 1.
Berechnung von Wahrscheinlichkeiten
I Geg.: X ∼N(µ, σ2) ,a<b.
I Ges.: P(a≤X ≤b) .
I Wegen Z = X −µ
σ ∼N(0,1) gilt
P(a≤X ≤b) = P
a−µ
σ ≤ X −µ
σ ≤ b−µ
σ
= P
a−µ
σ ≤Z ≤ b−µ σ
= Φ
b−µ σ
−Φ
a−µ σ
.
I Dabei ist Φdie Verteilungsfunktion der Standardnormalverteilung.
Berechnung von Wahrscheinlichkeiten II
I
P(a≤X ≤b) = Φ
b−µ σ
−Φ
a−µ σ
, P(a≤X) = 1−Φ
a−µ σ
, P(X ≤b) = Φ
b−µ σ
.
I Die Funktionswerte von Φ k¨onnen aus einer Tabelle (z.B. im Anhang der Formelsammlung zur Lehrveranstaltung) abgelesen werden oder z.B. mit einem Taschenrechner berechnet werden.
I F¨ur alle reellen Zahlen x gilt:
Φ(−x) = 1−Φ(x).
Rechenbeispiel 1.11
I Geg.: X ∼N(30,25) .
I Ges.: P(28≤X ≤35).
15 20 25 30 35 40 45
0.000.020.040.060.08
Dichtefunktion
x X~N(µ, σ2) mit µ =30,σ =5
Intervall symmetrisch zum Erwartungswert
I Geg.: X ∼N(µ, σ2) undc >0 .
I
P(µ−c ≤X ≤µ+c) = Φ
(µ+c)−µ σ
−Φ
(µ−c)−µ σ
= Φc σ
−Φ −c
σ
= Φ
c σ
− 1−Φ
c σ
= 2Φ c
σ
−1
I Beispiel.: 3σ-Regel: c = 3σ.
P(µ−3σ ≤X ≤µ+ 3σ) = 0.9974
k ·σ−Regeln f¨ur Normalverteilung
I Frage: Wie groß ist die Wahrscheinlichkeit daf¨ur, dass der Wert einer Zufallsgr¨oße X ∼N(µ, σ2) um nicht mehr als 3·σ vom Erwartungswert (
”Sollwert“) µabweicht ?
I Antwort:
P(µ−3σ ≤X ≤µ+ 3σ) = 2Φ 3σ
σ
−1
= 2Φ(3)−1
= 2·0.9987−1
= 0.9974
I
3σ−Regel: Innerhalb von µ±3σ liegen ca. 99.7% der Messwerte.
2σ−Regel: Innerhalb von µ±2σ liegen ca. 95.4% der Messwerte.
1σ−Regel: Innerhalb von µ±σ liegen ca. 68.3% der Messwerte.
Beispiel 1.12: 2σ−Intervall
Geg.: X ∼N(5,9), d.h.µ= 5 und σ= 3.
0.954 =P(µ−2σ≤X ≤µ+ 2σ) = P(5−2·3≤X ≤5 + 2·3)
= P(−1≤X ≤11)
0.000.020.040.060.080.100.12
Dichtefunktion
fX(x)= 1 σ2π e−(x−µ2σ2)2
mit µ =5,σ =3
0.954
Quantile der Standardnormalverteilung
I Die Quantilsfunktion ist die Umkehrfunktion (inverse Funktion) der Verteilungsfunktion.
I Dasp-Quantil der Standardnormalverteilungwird mit zp bezeichnet.
I Sei 0<p<1 eine Wahrscheinlichkeit undZ ∼N(0,1), dann ist:
P(Z <zp) = Φ(zp) =p =⇒ zp = Φ−1(p).
I Die Werte von zp k¨onnen aus einer Tabelle (z.B. im Anhang der Formelsammlung zur Lehrveranstaltung) abgelesen werden oder z.B. mit einem Taschenrechner berechnet werden.
I Es gilt:
zp =−z1−p I Beispiel:
z0.05 =−z0.95=−1.645.
Beispielaufgabe 1.13: vorgegebene Wahrscheinlichkeit
I Frage: In welchem Intervall I = [µ−c;µ+c] liegen im Mittel (z.B.) 90% der Messwerte f¨urX ∼N(µ, σ2) ?
I Ges.: c, so dass P(|X −µ| ≤c) = 0.9 .
I Lsg.:
0.9 = P(|X −µ| ≤c)
= P(µ−c ≤X ≤µ+c) = 2Φ c
σ
−1
⇒ Φ c
σ
= 0.9 + 1
2 = 0.95 c
σ = z0.95= 1.645 (0.95-Quantil) c = 1.645·σ .
I D.h., zwischen µ−1.645σ und µ+ 1.645σ liegen im Mittel 90% der Messwerte.
Beispielaufgabe 1.14 zum Additionssatz
I Additionssatz:
X1 ∼N(µ1, σ12) ,X2∼N(µ2, σ22) , unabh¨angig, a1,a2 ∈R
⇒ a1X1+a2X2 ∼N(a1µ1+a2µ2,a21σ12+a22σ22) .
I Geg.: Abf¨ullmenge in ml (pro Flasche): X ∼N(1000,100) Flaschenvolumen in ml: Y ∼N(1020,25)
I Ges.: Wahrscheinlichkeit, dass Flasche beim Abf¨ullen ¨uberl¨auft.
Zentraler Grenzwertsatz I
I Die Summe Sn=
n
P
i=1
Xi vonn unabh¨angigen N(µ, σ2)-verteilten Zufallsgr¨oßenX1, . . . ,Xn ist normalverteilt mit Erwartungswertnµ und Varianznσ2.
I N¨aherungsweise gilt eine ¨ahnliche Aussage auch f¨ur Zufallsgr¨oßen mit anderen Verteilungen.
I F¨ur unabh¨angige, identisch verteilte Zufallsgr¨oßenX1,X2, . . . mit EXi =µ,VarXi =σ2 >0 konvergiert die Verteilung der
standardisierten Summe gegen die Standardnormalverteilung, d.h. es gilt f¨ur z ∈R
P
Sn−ESn
√VarSn <z
=P
Sn−nµ
√
nσ2 <z
−−−→n→∞ Φ(z),
bzw. f¨ur großen gilt: P(S <x)≈Φ
x−nµ
√
.
Zentraler Grenzwertsatz II
I H¨aufig ergeben sich Zufallsgr¨oßen (z.B. Messfehler) durch (additive) Uberlagerung vieler kleiner stochastischer Einfl¨¨ usse. Der zentrale Grenzwertsatz bewirkt dann, dass man diese Gr¨oßen
(n¨aherungsweise) als normalverteilt ansehen kann.
I Spezialfall: Sind X1, ...,Xn identisch Bernoulli-verteilt, d.h.
Xi ∼Bin(1,p) , so gilt f¨ur die SummeSn∼Bin(n,p) und nach dem zentralen Grenzwertsatz gilt f¨ur z ∈R:
P Sn−np pnp(1−p) <z
!
−−−→n→∞ Φ(z)
bzw. f¨ur großen (np(1−p)>9) gilt P(Sn<x)≈Φ x−np
pnp(1−p)
!
(Satz von Moivre-Laplace).
Beispiel 1.15: Zentraler Grenzwertsatz I
I Eine Weinkellerei l¨adt 200 Kunden zur Weinverkostung ein.
Erfahrungsgem¨aß kommt es mit 60% der Kunden zu einem Verkaufsabschluss. Wie groß sind die Wahrscheinlichkeiten, dass genau 130 Kunden abschließen und dass mehr als 130 Kunden abschließen ?
I ZGX = Anzahl der Abschl¨usse ∼Bin(200,0.6)
⇒ E(X) = Var(X) =
I P(X = 130) = 200130
·0.6130·0.470= 0.0205
I P(X >130) =
200
P
k=131 200
k
·0.6k ·0.4200−k = 0.0639 .
Beispiel 1.15 Zentraler Grenzwertsatz II
I Approximation mittels Normalverteilung
P(X = 130) =P(129.5<X <130.5)
≈
I
P(X >130) = 1−P(X ≤130) = 1−P(X <130.5)
≈