VerteilungenKRAFT TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHANMATHEMATIK UND STATISTIKINFORMATIONS- UND DOKUMENTATIONSZENTRUMR.KRAFT
StatistikSS 00
V e rt e il ung e n
VerteilungenKRAFT
V e rt e il ung e n
Zu fa ll s v a ri a b le n und V e rt e il ung e n
Diskrete ZufallsvariablenStetige ZufallsvariablenFraktilen, Quantilen und Grenzen einer Verteilung
M a ß z a h le n e in e r V e rt e il ung
ErwartungswertVarianz und Standardabweichung
W ic h tig e V e rt e il ung e n
NormalverteilungLogarithmische NormalverteilungBinomial- oder Bernoulli-VerteilungPoisson-VerteilungHypergeometrische VerteilungExponentialverteilung
T sc h e b y sc h e ff sc h e U ng le ic hung
Z e n tr a le r G re n z w e rt sa tz
T es tv e rt e il ung e n
P-Verteilung 2t- oder Student-VerteilungF-Verteilung
0#y#10000kg/a
VerteilungenKRAFT
Zu fa ll s v a ri a b le n
EineZufallsvariableist eine Funktion, die jedem Elementar-ereignis aus dem Ergebnisraum S eine reelle Zahl zuordnet.
Diskrete Zufallsvariablen
Zufallsvariable X (Münze) mit den Realisationen: x = 0 (Kopf)1und x = 1 (Zahl). Andere Zuordnungen sind genauso möglich.2
Zufallsvariable Y (Würfel) mit Realisationen y = 1, y = 2, y = 3,123y = 4, y = 5, y = 6.456
Zufallsvariable Z (Ferkelzahl) mit der Anzahl der Ferkel pro SaualsRealisationen. Es interessiert z.B. die Wahrscheinlichkeit,daß eine Sau mehr als 10 Ferkel wirft.
Stetige Zufallsvariablen
Zufallsvariable X (Körpergröße von Studenten): X kann jedenWert aus einem bestimmten Intervall annehmen.
Zufallsvariable Y (Milchleistung von Kühen):
Zufallsvariable Z (Überlebenszeit von Ratten): Es interessiert z.B.die Wahrscheinlichkeit, daß eine Ratte höchstens 3 Tage über-lebt. x
ab a < X<bX<a b X<b I
VerteilungenKRAFT
V e rt e il ung s fun k tion
Verteilungsfunktion einer Zufallsvariablen X:
F(x) = P(X # x)
(!4 ... x]
P(a < X # b) = P(X # b) ! P(X # a) = F(b) ! F(a)
F(!4) = 0, F(+4) = 1
f(x)'P(X'x)' pifürx'xi(i'1,2,ÿ,n)
0sonst
F(x)'P(X#x)'jxix f(x) F(x)'P(X#x)'m x
f(t)dt P(a<X#b)'F(b)&F(a)'m b
a f(x)dx
f(x)'F (x) P(&4<X#%4)'F(%4)&F(&4)'F(%4)'m
f(x)dx'1
VerteilungenKRAFT
D isk re te Zu fa ll s v a ri a b le n
Wahrscheinlichkeitsfunktion
P(X = x) = pii
Verteilungsfunktion
S te tig e Zu fa ll s v a ri a b le n
Verteilungsfunktion
Dichtefunktion oder Wahrscheinlichkeitsdichte
Fläche zwischen f(x) und x-Achse von !4 bis +4 ist 1. 0.5 1.0
01 x f(x)
0.5 1.0
01 x F(x)
f(x)' 0.5fürx'0,1
0sonst F(x)' 0fürx<0
0.5für0#x<1
1fürx$1
f(x)
0 x F(x)
1/6 1/3 1/2 2/3 5/6 1
12345670 x1234567 1/6
VerteilungenKRAFT
M ün z w u rf
P(X = Kopf) = P(X = 0) = 0.5, P(X = Zahl) = P(X = 1) = 0.5
W ü rf e l
x f(x)
b - a 1
abx F(x)
ab 0.5 1
f(x)' 1b&a füra#x#b
0sonst F(x)' 0fürx<a
x&a
b&a füra#x#b
1fürx>b
x f(x)
x F(x)
0.5 1
VerteilungenKRAFT
R ec h teck - od e r G le ic h v e rt e il ung
N o rm a lv e rt e il ung
F(xK%)'F(x1)'m xK% f(x)dx'K%' K100 '1&"x f(x)
x F(x)
0.5 1
(100 -K)% =" K% = 1 -"
xK%x1 - xK%x1 - K%
x0.5
x f(x)
cK%0- cK% K% = 1 -"
"/2"/2
VerteilungenKRAFT
F rak til e n , Q u a n til e n und G re n z e n e in e r V e rt e il ung
K%-Fraktile, K%-Quantile oder K-te Perzentile
x-Wert, bei dem K% der Fläche zwischen der Wahrscheinlich-keitsdichte(oder der Wahrscheinlichkeitsfunktion) und der x-Achse erreicht werden
Grenzen (Symmetrie um 0)
E(X)'µ'j n
i1 xi@f(xi) µ'1@ 1
6 %2@ 1
6 %3@ 1
6 %4@ 1
6 %5@ 1
6 %6@ 1
6 ' 21
6 '3.5
E(X)'µ'm
x@f(x)dx
µ'm
xb&a dx' 1b&am b
a xdx' 1b&a @ b 2&a 2
2 ' (b%a)(b&a)
2(b&a) ' (a%b)
2
x f(x)
:
VerteilungenKRAFT
E rw a rt ung s w e rt od e r M itt e lw e rt
Diskrete Zufallsvariablen
Würfel:
Stetige Zufallsvariablen
Gleichverteilung:
Normalverteilung: Var(X)'F 2'j ni1 (xi&µ) 2@f(xi)
F 2'j 6
i1 (i&3.5) 2
6 ' 6.25%2.25%0.25%0.25%2.25%6.25
6 '2.92
F'F 2'2.92'1.71
Var(X)'F 2'm
(x&µ) 2@f(x)dx
F 2'm b
a x& a%b2 2
@ 1
b&a dx' (b&a) 2
12
x f(x)
: FF
VerteilungenKRAFT
V a ri a n z und S ta nd a rd a b w e ic hung
Diskrete Zufallsvariablen
Würfel:
Stetige Zufallsvariablen
Gleichverteilung:
Normalverteilung:
73006900650061005700530049004500410037003300 3020100
Milchleistung [kg/a]
absolute Häufigkeit
VerteilungenKRAFT
G a uß sc h e G lo cke n k u rv e
Histogramm mit Glockenkurve
Galton-Brett f(x)' 1F2B @e (xµ)2
22für&4<x<%4undF>0 F(x)' 1
F2B @m x
e (tµ)2
22dt
-4-3-2-10123-5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 f(x)
x F= 0.7
F= 1
F= 1.5:= -2:= 1 := 0
x: FF
:F-:F-2:F+2:F+3:F+:F-3 WendepunktWendepunkt
VerteilungenKRAFT
N o rm a lv e rt e il ung
Dichtefunktion
Verteilungsfunktion
µ = E(X):Erwartungswert oder MittelwertF = Var(X):Varianz 2
n(x)' 1
2B @e x22für&4<x<%4 M(x)' 1
2B @m x
e t22dt
(x)
0.5 1
x (x)nM
-3-2-10123 x-3-2-10123 0.1 0.2 0.3 0.4
VerteilungenKRAFT
S ta nd a rdno rm a lv e rt e il ung
µ = E(X) = 0F = Var(X) = 1 2
Dichtefunktion
Verteilungsfunktion X&µF
F(x)'M x&µ
F
P(a<X#b)'F(b)&F(a)'M b&µ
F &M a&µ
F
3 : FF
:F-:F-2:F+2:F+3:F+:F-3
u210-1-2-3 x
X'j n
i1 ki@Xiµ'j n
i1 ki@µiF 2'j n
i1 k 2i@F 2i
VerteilungenKRAFT
T ra n s fo rm a tion a u f S ta nd a rdno rm a lv a ri a b le
X - (µ,F)-n.v., dann ist - (0,1)-n.v. 22
A dd it ion s th e o re m d e r N o rm a lv e rt e il ung
Die Summe von n unabhängigen normalverteilten Zufallsvaria-blen ist wieder eine normalverteilte Zufallsvariable:
X (i = 1,2,...,n) - (µF)-n.v., dann istiii 2
- (µ F)-n.v. mit und 2
x:F-:F+: 68%
16%16%x:F+1.96: 95%
:F-1.96 2.5%2.5%
VerteilungenKRAFT
S p e z ie ll e F rak til e n und G re n z e n d e r N o rm a lv e rt e il ung
xM(!x)M(x)M(x)!M(!x)
0.0000.50000.50000.00001.0000.15870.84130.68261.6450.05000.95000.90001.9600.02500.97500.95002.0000.02280.97730.95452.3260.01000.99000.98002.5760.00500.99500.99003.0000.00130.99870.99743.0900.00100.99900.99803.2900.00050.99950.99904.0000.9999
1F-Bereich: P(µ!1F<X#µ+0F) = M(1)!M(!1) = 0.6826 .068%2F-Bereich: P(µ!2F<X#µ+2F) = M(2)!M(!2) = 0.9545 .095%3F-Bereich: P(µ!3F<X#µ+3F) = M(3)!M(!3) = 0.9974 > 099%4F-Bereich: P(µ!4F<X#µ+4F) = M(4)!M(!4) = 0.9999 . 100%
P(µ!1.960F<X#µ+1.960F) = 0.950 = 95.0%P(µ!2.576F<X#µ+2.576F) = 0.990 = 99.0%P(µ!3.290F<X#µ+3.290F) = 0.999 = 99.9% 70006000500040003000 0.0007
0.0006
0.0005
0.0004
0.0003
0.0002
0.0001
0.0000
Milchleistung [kg/a]
Dichte
VerteilungenKRAFT
M il c h le is tung
M - (5000,600)-n.v. 2
1F-Bereich: P(µ!1F#M#µ+0F)=P(4400#M#5600).68%2F-Bereich: P(µ!2F#M#µ+2F)=P(3800#M#6200).95%3F-Bereich: P(µ!3F#M#µ+3F)=P(3200#M#6800).99%
P(µ!1.960F#M#µ+1.960F)=P(3824#M#6176)=95.0%P(µ!2.576F#M#µ+2.576F)=P(3454#M#6546)=99.0%P(µ!3.290F#M#µ+3.290F)=P(3026#M#6974)=99.9%
P(M=6000)=0P(M<5000)=P(M#5000)=P(M>5000)=P(M$5000)=0.5P(M<6000)=F(6000)=M((6000!5000)/600)=M(1.67)=0.9525P(M>6200)=1!F(6200)=1!M(2)=1!0.9773=0.0227P(5000#M#6000)=F(6000)!F(5000)=0.9525!0.5=0.4525
P(M#c)=0.9]F(c)=M((c!5000)/600)=0.9]
](c!5000)/600=u=1.282]c=57690.95also P(M#5769)=90% und P(M>5769)=1-0.9=0.1=10%P(µ!c#M#µ+c)=0.9]F(µ+c)!F(µ!c)=0.9]
]M((µ+c!µ)/F)!M((µ!c!µ)/F)=M(c/F)!M(!c/F)=0.9]
]c/F=8=1.645Yc=1.645@600=9870.9also P(4013#M#5987)=90%
f(x)' loge
Fx2B @e (logxlog)2
22fürx>0
0fürx#0
F(x)' 1
F2B @m logx
e (tlog)2
22dtfürx>0
0fürx#0
109876543210 1.00.90.80.70.60.50.40.30.20.10.0
x
f(x), F(x)
F(x)
f(x)
VerteilungenKRAFT
Log a ri th m isc h e N o rm a lv e rt e il ung
X logarithmisch normalverteilt, wenn Y = log X normalverteiltY = log X- (log>,F)-n.v. 2
Dichte- und Verteilungsfunktion
86420
95% Confidence Interval for Mu
2.62.11.6
95% Confidence Interval for Median Variable: HMF
1.61115 1.42116 1.97769 Maximum 3rd Quartile Median 1st Quartile Minimum N Kurtosis Skewness Variance StDev Mean P-Value: A-Squared:
2.41885 1.94502 2.70856 9.41000 2.92250 1.87500 1.14000 0.27000 80 3.83100 1.73887 2.69648 1.64210 2.34312 0.000 3.085
95% Confidence Interval for Median 95% Confidence Interval for Sigma 95% Confidence Interval for Mu Anderson-Darling Normality Test Descriptive Statistics
2.001.250.50-0.25-1.00
95% Confidence Interval for Mu
0.90.80.70.60.5
95% Confidence Interval for Median Variable: ln HMF
0.47689 0.57918 0.48831 Maximum 3rd Quartile Median 1st Quartile Minimum N Kurtosis Skewness Variance StDev Mean P-Value: A-Squared:
0.88327 0.79267 0.78616 2.24177 1.07243 0.62861 0.13103 -1.30933 80 -4.7E-02 -1.4E-01 0.447854 0.669219 0.637234 0.913 0.180
95% Confidence Interval for Median 95% Confidence Interval for Sigma 95% Confidence Interval for Mu Anderson-Darling Normality Test Descriptive Statistics
VerteilungenKRAFT
H y d ro x y m e th y lf u rf u ro lg e h a lt v on H on ig
AA
A
AAAAAAAA
AAA
nk ' n!(n&k)!@k! P(n,k,p)' n
k @p k@q nk(k'0,1,2,...,n)
VerteilungenKRAFT
B e rnou lli sc h es Zu fa ll sex p e ri m e n t
2 Komplementäre Ereignisse: A (Erfolg) und (kein Erfolg) mitP(A) = p und P() = q = 1 ! p (also p + q = 1)
n-malige Durchführung eines Bernoullischen Zufallsexperimentsliefert Folge von n Ereignissen A oder ,
z.B. AAAA...AA (n mal)mit P(AAAA...AA) = p@p@p@q@p@q@...@q@q@p@p
Reihenfolge egalP(AA...A k mal und ... n!k mal) = p@q knk
Anordnungen mit Wahrscheinlichkeit p@q knk
Münzwurf
p = q = 0.5(symmetrische Münze)
Urne: a rote, b grüne Kugeln, Ziehen mit Zurücklegen
p = a / (a + b), q = b / (a + b) = 1 ! p
Toxizitätsprüfung an Laborratten
Mortalitätsratep = 0.1 = 10%Überlebensrateq = 0.9 = 90% = 1 ! p f(x)' P(n,x,p)' nx @p x@(1&p) nxfürx'0,1,2,ÿ,n
0sonst
F(x)' jtx f(t)fürx$0
0fürx<0
012345678910 0.0 0.1 0.2 0.3 0.4
x
f(x)
p = 0.1p = 0.9
p = 0.25p = 0.75
p = 0.5 n = 10
VerteilungenKRAFT
B e rnou lli - od e r B ino m ia lv e rt e il ung
Wahrscheinlichkeits- und Verteilungsfunktion
Erwartungswert und Varianz
E(X) = n @ p, Var(X) = n@ p @ q
P(2)'f(2)' 102 @0.1 2@0.9 8'45@0.01@0.43'0.19'19%
109876543210 1.00.90.80.70.60.50.40.30.20.10.0
x
f(x), F(x)
n = 10, p = 0.1
VerteilungenKRAFT
To x iz it ä ts p rü fung
10 Ratten, Mortalitätsrate 10%
xf(x) = P(X = x)F(x) = P(X
# x)
00.34870.348710.38740.736120.19370.929830.05740.987240.01120.998450.00150.999960.00011.0000
P(#2) = F(2) = f(0) + f(1) + f(2) = 0.35 + 0.39 + 0.19 = 0.93 = 93%P(<2) = f(0) + f(1) = F(1) = 0.35 + 0.39 = 0.74 = 74%P(>2) = 1 ! P(#2) = 1 ! 0.93 = 0.07 = 7%P($9) = P(9) + P(10) = 0.00 + 0.00 = 0 P(n,k,p)'P(k,8). 8 kk! @e
VerteilungenKRAFT
B ino m ia l- und P o iss on -V e rt e il ung
Bernoulli-Experiment: n groß, p sehr klein (seltenes Ereignis)
Mit 8 = n@p Approximation der Binomial- durch Poisson-Vertlg.: für n@p# 10 und n > 1500@p
Beispiele:
Radioaktiver Zerfall ("-Teilchen pro Zeitintervall)Druckfehler pro SeiteFahrzeuge pro ZeitintervallUnkrautsamen pro FlächeneinheitChromosomenaustausch in Zellen
B ino m ia l- , P o iss on - und N o rm a lv e rt e il ung
Binomialverteilung mit E(X) = n @ p, Var(X) = n @ p @ q
8 = n@p # 10 und n > 1500@p:Poissonverteilung mit E(X) = 8, Var(X) = 8
8$ 9:Normalverteilung mit E(X) = µ = 8 und Var(X) = F = 8 2
f(x)' P(x,8)' 8 xx! @e fürx'0,1,2,ÿ
0sonst
F(x)' e @jtx 8 tt! fürx$0
0fürx<0
1211109876543210 0.70.60.50.40.30.20.10.0
x
f(x)
lambda = 0.5
lambda = 1
lambda = 4
VerteilungenKRAFT
P o iss on -V e rt e il ung
Wahrscheinlichkeits- und Verteilungsfunktion
Erwartungswert und Varianz
E(X) = 8, Var(X) = 8 x'1.94,s 2'1.69
VerteilungenKRAFT
S c h a d sc h w e ll e n k on z e p t
Zählrahmen an 50 Stellen:
ProblemunkräuterHäufigkeit
006115212313402501601
Schadschwelle:
> 4 Unkräuter pro Zählrahmen
Modell:
Poisson-Modell mit 8 = 1.94
P(X# 4)= P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) == e@(1.94/0!+1.94/1!+1.94/2!+1.94/3!+1.94/4!) = -1.9401234
= 0.1437 @ (1 + 1.94 + 1.8818 + 1.2169 + 0.5902) == 0.9526 = 95.25%
P(X > 4)= 1 ! P(X # 4) = 1 ! 0.9526 = 0.0474 = 4.74%
Wahrscheinlichkeit, daß mehr als 4 Unkräuter vorkommen, istalso kleiner als 5%
Nn N1k @ N&N1n&k
P Nn
N1k ' N1k @ N&N1n&k
Nn
f(x)' P Nn
N1x ' N1x @ N&N1n&x
Nn fürx'0,1,2,ÿ,min(N1 ,n)
0sonst
E(X)'n@ N1N Var(X)'n@ N1N @1& N1N @ N&n
N&1
VerteilungenKRAFT
H y p e rg e o m e tr isc h e V e rt e il ung
Zufallsexperiment: Urne mit N Kugeln, davon sind N weiß und1N = N! N schwarz. Aus der Urne werden n Kugeln gezogen.21Gesucht ist die Wahrscheinlichkeit, genau k weiße zu ziehen.
mit Zurücklegen6Binomialverteilungohne Zurücklegen6Hypergeometrische Verteilung
MUGE: GUGE:
Wahrscheinlichkeitsfunktion
Erwartungswert und Varianz
, P(10w)' 1510 @ 50
2010 '0.016'1.6%
P(8w,2m)' 158 @ 52
20
10 '0.348'34.8%
P(5w,5m)' 155 @ 55
20
10 '0.016'1.6%
VerteilungenKRAFT
B io log ies tud e n te n
20 Biologiestudenten, davon 15 weiblich (w) und 5 männlich (m),10 Studenten zufällig ausgewählt
Wahrscheinlichkeit nur weibliche:
Wahrscheinlichkeit 8 weibliche und 2 männliche:
Wahrscheinlichkeit 5 weibliche und 5 männliche:
f(x)' 8@e xfürx$0,8>0
0fürx<0
F(x)' 1&8@e xfürx$0,8>0
0fürx<0
E(X)' 1 8 Var(X)' 1
8 2
543210 1.00.50.0
x
f(x), F(x)
f(x)F(x)
8= 1
VerteilungenKRAFT
E x pon e n tia lv e rt e il ung
Dichte- und Verteilungsfunktion
Erwartungswert und Varianz
, 137
55 137
56 0
1
1009080706050403020100 1.00.90.80.70.60.50.40.30.20.10.0
t [a]
F(t)
VerteilungenKRAFT
T sc h e rnob y l
Cs 6 Ba + e,t = 30 aH
Lebensdauer T (Zeit bis zum Zerfall) eines Cäsiumkerns ist expo-nentialverteilt nach f(t) = 8
@ e bzw. (t) = 1 eF! t
t
Halbwertszeit = Median: t = t = 30 aH0.5Zerfallskonstante 8: F(t) = 0.5 = 1 ! e, also 8 = 0.023 aH
30 a1
Erwartungswert: E(T) = 1/8 = 43 a
Wahrscheinlichkeit, daß Cäsiumkern höchstens 30 a überlebt:P(T# 30 a) = 50% = 0.5 = F(30 a) = 1 ! e 0.023 1/a 30 a
Wahrscheinlichkeit, daß Cäsiumkern höchstens 43 a überlebt:P(T
# 43 a) = (43 a) = 1 e = 1 0.37 = 0.63 = 63%F!! 0.023 1/a 43 a
Wahrscheinlichkeit, daß Cäsiumkern mindestens 100 a überlebt:P(T$ 100 a) = 1 ! F(100 a) = e = 0.10 = 10% 0.023 1/a 100 a
X'j n
i1 Xi
VerteilungenKRAFT
T sc h e b y sc h e ff sc h e U ng le ic hung
X beliebig verteilt mit E(X) = µ und Var(X) = F 0, dann gilt: 2
P(|X ! µ| < k@F) $ 1 ! 1/k oder P(|X ! µ| $ k@F) # 1/k 22
P(|X!µ|<2F) = 0.75 = 75% oder P(|X!µ|$2F) = 0.25 = 25%P(|X!µ|<3F) = 0.89 = 89% oder P(|X!µ|$3F) = 0.11 = 11%P(|X!µ|<4F) = 0.94 = 94% oder P(|X!µ|$4F) = 0.06 = 06%
Bei einer beliebigen Verteilung liegen also mindestens 75% allermöglichenRealisationen innerhalb des 2F-Bereichs, 89% in-nerhalb des 3F-Bereichs und 94% innerhalb des 4F-Bereichs.Oder anders herum: Höchstens 25% liegen außerhalb des 2F-Bereichs, 11% außerhalb des 3F-Bereichs und 6% außerhalbdes 4F-Bereichs.
Für spezielle Verteilungen kann man natürlich schärfere Aus-sagen formulieren, z.B. für die Normalverteilung:
P(|X!µ| $ 2F) = 0.0455P(|X!µ| $ 3F) = 0.0027P(|X!µ| $ 4F) = 0.0000
Z e n tr a le r G re n z w e rt sa tz
X (i = 1,2,...,n) mit E(X) = µ und Var(X) = F beliebig verteiltiiiii 2
- (nµ,nF)-n.v. für n64 (praktisch für n relativ groß) 2 403020100 0.20.10.0
x
f(x)
n = 1
n = 10
n = 20
F(x).M x&n
2n fürn64
VerteilungenKRAFT
PP -V e rt e il ung
2X, X, ..., X - (0,1)-normalverteilt, unabhängig12n 2
P = X + X + ... + X ist P-verteilt mit n Freiheitsgradenn12n 22222
µ = n, F = 2n 2
P für n 6 4 normalverteilt mit µ = n und F = 2n, alson 22
Fraktilen: P = P 22n;K%n;1
Tn ' X
Q/n
F 2' nn&2
543210-1-2-3-4-5 0.40.30.20.10.0
x
f(x)
4n =
n = 4
n = 1
VerteilungenKRAFT
t- od e r S tud e n t- V e rt e il ung
X - (0,1)-normalverteilt, Q -P-verteilt, unabhängig 22n
ist Student- oder t-verteilt mit n Freiheitsgraden
µ = 0,
T für n 64 normalverteilt mit µ = 0 und F = 1n 2
Fraktilen: t = tn;K%n;1 Fm,n' X 2/m
Y 2/n
µ' n
n&2 F 2' 2n 2(m%n&2)
m(n&2) 2(n&4)
543210 1.00.90.80.70.60.50.40.30.20.10.0
x
f(x)
m,n = 10,50
m,n = 10,10
m,n = 10,4
1Fm,n 'Fn,m
Fm,n;1' 1
Fn,m;
VerteilungenKRAFT
F -V e rt e il ung
X -P-verteilt, Y -P-verteilt 2222mn
ist F-verteilt mit m Zähler-, n Nennerfreiheitsgraden
,
F = T, 1,nn 2
Fraktilen: F = Fm,n;K%m,n;1