Statistik I f¨ur Betriebswirte Vorlesung 5

(1)

Dr. Andreas W¨unsche

TU Bergakademie Freiberg Institut f¨ur Stochastik

6. Mai 2019

(2)

1.7 Wichtige stetige Wahrscheinlichkeitsverteilungen

1.7.1 Normalverteilung (Gauß-Verteilung)

−5 0 5 10 15

0.000.020.040.060.080.100.12

Dichtefunktion

x

f(^x)= 1 σ 2π e⁻⁽^x−µ⁾

2 2σ2

mit µ =5,σ =3

∈ ²

(3)

Normalverteilung (Gauß-Verteilung)

I Zufallsgr¨oße X mit Dichtefunktion fX bzw. Verteilungsfunktion FX

f_X(x) = 1

√2πσe⁻

(x−µ)2

2σ2 , F_X(x) = 1

√2πσ Z x

−∞

e⁻

(t−µ)2

2σ2 dt, x ∈R.

−5 0 5 10 15

0.000.040.080.12

Dichtefunktion

x fX(x)= 1

σ2π e⁻⁽^x−µ^2σ2⁾²

mit µ =5,σ =3

−5 0 5 10 15

0.00.20.40.60.81.0

Verteilungsfunktion

x X~N(µ, σ²) mit µ =5,σ =3

FX(^x)

I Bezeichnung: X ∼N(µ, σ²) .

(4)

Dichtefunktionen mit verschiedenen Erwartungswerten

−10 −5 0 5 10 15 20

0.000.020.040.060.080.100.12

Dichtefunktionen

x µ =0, σ =3

µ =5, σ =3 µ =10, σ =3 X~N(µ, σ²)

Die Dichtefunktion ist symmetrisch bez¨uglich der Geraden x=µ, deshalb gilt f¨ur den Median auchx_0.5=µ.

(5)

Dichtefunktionen mit verschiedenen Varianzen

−10 −5 0 5 10 15 20

0.000.050.100.150.20

x µ =5, σ =2

µ =5, σ =3 µ =5, σ =5 X~N(µ, σ²)

(6)

Verschiedene Dichtefunktionen

−10 −5 0 5 10 15 20

0.000.050.100.150.20

x µ =5, σ =2

µ =1, σ =3 µ =9, σ =2.5 X~N(µ, σ²)

(7)

Standardnormalverteilung

I Die Zufallsgr¨oßeX iststandardnormalverteilt, fallsX normalverteilt ist mit µ=EX = 0 undσ² =VarX = 1, d.h. X ∼N(0,1).

I Die Dichte- bzw. Verteilungsfunktion sind dann

φ(x) = 1

√ 2πe⁻^x

2

2 bzw. Φ(x) = 1

√ 2π

Z x

−∞

e⁻^t

2

2 dt, x ∈R.

I Ist die Zufallsgr¨oße X normalverteilt mit Erwartungswert µund Varianzσ², dann ist die standardisierte Zufallsgr¨oße Z := X−µ standardnormalverteilt, d.h. normalverteilt mit Erwartungswert 0σ und Varianz 1.

(8)

Berechnung von Wahrscheinlichkeiten

I Geg.: X ∼N(µ, σ²) ,a<b.

I Ges.: P(a≤X ≤b) .

I Wegen Z = X −µ

σ ∼N(0,1) gilt

P(a≤X ≤b) = P

a−µ

σ ≤ X −µ

σ ≤ b−µ

σ

= P

a−µ

σ ≤Z ≤ b−µ σ

= Φ

b−µ σ

−Φ

a−µ σ

.

I Dabei ist Φdie Verteilungsfunktion der Standardnormalverteilung.

(9)

Berechnung von Wahrscheinlichkeiten II

I

P(a≤X ≤b) = Φ

b−µ σ

−Φ

a−µ σ

, P(a≤X) = 1−Φ

a−µ σ

, P(X ≤b) = Φ

b−µ σ

.

I Die Funktionswerte von Φ k¨onnen aus einer Tabelle (z.B. im Anhang der Formelsammlung zur Lehrveranstaltung) abgelesen werden oder z.B. mit einem Taschenrechner berechnet werden.

I F¨ur alle reellen Zahlen x gilt:

Φ(−x) = 1−Φ(x).

(10)

Rechenbeispiel 1.11

I Geg.: X ∼N(30,25) .

I Ges.: P(28≤X ≤35).

15 20 25 30 35 40 45

0.000.020.040.060.08

Dichtefunktion

x X~N(µ, σ²) mit µ =30,σ =5

(11)

Intervall symmetrisch zum Erwartungswert

I Geg.: X ∼N(µ, σ²) undc >0 .

I

P(µ−c ≤X ≤µ+c) = Φ

(µ+c)−µ σ

−Φ

(µ−c)−µ σ

= Φc σ

−Φ −c

σ

= Φ

c σ

− 1−Φ

c σ

= 2Φ c

σ

−1

I Beispiel.: 3σ-Regel: c = 3σ.

P(µ−3σ ≤X ≤µ+ 3σ) = 0.9974

(12)

k ·σ−Regeln f¨ur Normalverteilung

I Frage: Wie groß ist die Wahrscheinlichkeit daf¨ur, dass der Wert einer Zufallsgr¨oße X ∼N(µ, σ²) um nicht mehr als 3·σ vom Erwartungswert (

”Sollwert“) µabweicht ?

I Antwort:

P(µ−3σ ≤X ≤µ+ 3σ) = 2Φ 3σ

σ

−1

= 2Φ(3)−1

= 2·0.9987−1

= 0.9974

I

3σ−Regel: Innerhalb von µ±3σ liegen ca. 99.7% der Messwerte.

2σ−Regel: Innerhalb von µ±2σ liegen ca. 95.4% der Messwerte.

1σ−Regel: Innerhalb von µ±σ liegen ca. 68.3% der Messwerte.

(13)

Beispiel 1.12: 2σ−Intervall

Geg.: X ∼N(5,9), d.h.µ= 5 und σ= 3.

0.954 =P(µ−2σ≤X ≤µ+ 2σ) = P(5−2·3≤X ≤5 + 2·3)

= P(−1≤X ≤11)

0.000.020.040.060.080.100.12

Dichtefunktion

fX(x)= 1 σ2π e⁻⁽^x−µ^2σ²⁾²

mit µ =5,σ =3

0.954

(14)

Quantile der Standardnormalverteilung

I Die Quantilsfunktion ist die Umkehrfunktion (inverse Funktion) der Verteilungsfunktion.

I Dasp-Quantil der Standardnormalverteilungwird mit zp bezeichnet.

I Sei 0<p<1 eine Wahrscheinlichkeit undZ ∼N(0,1), dann ist:

P(Z <zp) = Φ(zp) =p =⇒ zp = Φ⁻¹(p).

I Die Werte von zp k¨onnen aus einer Tabelle (z.B. im Anhang der Formelsammlung zur Lehrveranstaltung) abgelesen werden oder z.B. mit einem Taschenrechner berechnet werden.

I Es gilt:

zp =−z1−p I Beispiel:

z_0.05 =−z_0.95=−1.645.

(15)

Beispielaufgabe 1.13: vorgegebene Wahrscheinlichkeit

I Frage: In welchem Intervall I = [µ−c;µ+c] liegen im Mittel (z.B.) 90% der Messwerte f¨urX ∼N(µ, σ²) ?

I Ges.: c, so dass P(|X −µ| ≤c) = 0.9 .

I Lsg.:

0.9 = P(|X −µ| ≤c)

= P(µ−c ≤X ≤µ+c) = 2Φ c

σ

−1

⇒ Φ c

σ

= 0.9 + 1

2 = 0.95 c

σ = z_0.95= 1.645 (0.95-Quantil) c = 1.645·σ .

I D.h., zwischen µ−1.645σ und µ+ 1.645σ liegen im Mittel 90% der Messwerte.

(16)

Beispielaufgabe 1.14 zum Additionssatz

I Additionssatz:

X1 ∼N(µ1, σ₁²) ,X2∼N(µ2, σ²₂) , unabh¨angig, a1,a2 ∈R

⇒ a1X1+a2X2 ∼N(a1µ1+a2µ2,a²₁σ₁²+a²₂σ₂²) .

I Geg.: Abf¨ullmenge in ml (pro Flasche): X ∼N(1000,100) Flaschenvolumen in ml: Y ∼N(1020,25)

I Ges.: Wahrscheinlichkeit, dass Flasche beim Abfüllen überläuft.

(17)

Zentraler Grenzwertsatz I

I Die Summe Sn=

n

P

i=1

Xi vonn unabh¨angigen N(µ, σ²)-verteilten Zufallsgr¨oßenX₁, . . . ,X_n ist normalverteilt mit Erwartungswertnµ und Varianznσ².

I Näherungsweise gilt eine ähnliche Aussage auch für Zufallsgrößen mit anderen Verteilungen.

I Für unabhängige, identisch verteilte ZufallsgrößenX₁,X₂, . . . mit EXi =µ,VarXi =σ² >0 konvergiert die Verteilung der

standardisierten Summe gegen die Standardnormalverteilung, d.h. es gilt f¨ur z ∈R

P

Sn−ESn

√VarS_n <z

=P

Sn−nµ

√

nσ² <z

−−−→n→∞ Φ(z),

bzw. f¨ur großen gilt: P(S <x)≈Φ

x−nµ

√

.

(18)

Zentraler Grenzwertsatz II

I Häufig ergeben sich Zufallsgrößen (z.B. Messfehler) durch (additive) Uberlagerung vieler kleiner stochastischer Einfl¨¨ usse. Der zentrale Grenzwertsatz bewirkt dann, dass man diese Größen

(n¨aherungsweise) als normalverteilt ansehen kann.

I Spezialfall: Sind X₁, ...,X_n identisch Bernoulli-verteilt, d.h.

X_i ∼Bin(1,p) , so gilt f¨ur die SummeS_n∼Bin(n,p) und nach dem zentralen Grenzwertsatz gilt f¨ur z ∈R:

P S_n−np pnp(1−p) <z

!

−−−→n→∞ Φ(z)

bzw. f¨ur großen (np(1−p)>9) gilt P(S_n<x)≈Φ x−np

pnp(1−p)

!

(Satz von Moivre-Laplace).

(19)

Beispiel 1.15: Zentraler Grenzwertsatz I

I Eine Weinkellerei l¨adt 200 Kunden zur Weinverkostung ein.

Erfahrungsgem¨aß kommt es mit 60% der Kunden zu einem Verkaufsabschluss. Wie groß sind die Wahrscheinlichkeiten, dass genau 130 Kunden abschließen und dass mehr als 130 Kunden abschließen ?

I ZGX = Anzahl der Abschl¨usse ∼Bin(200,0.6)

⇒ E(X) = Var(X) =

I P(X = 130) = ²⁰⁰₁₃₀

·0.6¹³⁰·0.4⁷⁰= 0.0205

I P(X >130) =

200

P

k=131 200

k

·0.6^k ·0.4^200−k = 0.0639 .

(20)

Beispiel 1.15 Zentraler Grenzwertsatz II

I Approximation mittels Normalverteilung

P(X = 130) =P(129.5<X <130.5)

≈

I

P(X >130) = 1−P(X ≤130) = 1−P(X <130.5)

≈