46
3 M o d e lle
3 .1 V e k to ri e lle Z u fa lls v a ri a b leaZufallsvariableundStichproben.ZurErinnerung:
Beobachtung
i
modelliertdurchZufallsvariableX
i∼ F
,oft∼ N h µ ,σ
2i
Daten
Beobachtungen
Haeufigkeit
−10123456789
0 1 2 3 4 5 6 7 8 9 10
Modell
X −10123456789
0.00 0.10 0.20 0.30
Dichte
47
jetztmultivariat!
0.640.680.720.760.800.600.640.680.720.760.80
0.35 0.40 0.45 0.50 0.55 0.60 0.65 log(Breite)
483.1
bZufallsvektor.
X = X
(1)X
(2)...X
(m) ,
Verteilung=gemeinsameVerteilungder
X
(1),X
(2),. .., X
(m). StichprobevonZufallsvektorenX
imitgleicherVerteilung,unabhängigvoneinander.
AlleDatenderStichprobe
− →
DatenmatrixX = " X
T1.. . X
Tn#
= X
(1)1X
(2)1.. . X
(m)1X
(1)2X
(2)2.. . X
(m)2... ... ...X
(1)nX
(2)n.. . X
(m)n .
X
isindSpaltenvektoren,obwohlsieZeilenderDatenmatrix
X
sind.49 Mittelwerte 1n
P ...
, 1n−1P ... − →
Erwartungswerteµ = E h X i = E h X
(1)i E h X
(2)i
...E h X
(m)i
Varianz
− →
Kovarianzmatrix|Σ = v a r h X i =
= v a r h X
(1)i c o v h X
(1),X
(2)i ... c o v h X
(1),X
(m)i c o v h X
(2),X
(1)i v a r h X
(2)i ... c o v h X
(2),X
(m)i
... ......
...c o v h X
(m),X
(1)i c o v h X
(m),X
(2)i ... v a r h X
(m)i
503.1
dKovarianzmatrixalsErwartungswert.
FüreinfacheZv.:
v a r h X i = E ( X − µ )
2= E h X
2i − µ
2.v a r h X i = E D X − µ X − µ
TE = E h X X
Ti − µ µ
T. ( X − µ ) ( X − µ )
Tisteinem × m
-Matrix!eLineareTransformationen.
Y = a + B X
.E h Y i = a + B E h X i
v a r h Y i = B v a r h X i B
T51
SummenvonunabhängigenZufallsvektoren.
E h X
1+ X
2i = E h X
1i + E h X
2i v a r h X
1+ X
2i = v a r h X
1i + v a r h X
2i
Mittelwert
X =
1nP
ni=1X
i.Wennµ = E h X
ii ,
|Σ = v a r h X
ii
:E h X i =
1nX
ni=1
E h X
ii = µ
v a r h X i =
1n 2X
ni=1
v a r h X
ii =
1n |Σ
52
3 .2 D ie m e h rd im e n s io n a le N o rm a lv e rt e ilu n g
aAllg.mehrdimensionaleVerteilung.
KumulativeVerteilungsfunktion
F h x i = P h X ≤ x i
.–Mehrdim.:F h x i = P h X ≤ x i = P h X
(1)≤ x
(1),X
(2)≤ x
(2),. .., X
(m)≤ x
(m)i .
Dichte:
f h x i
=AbleitungvonF
=∂
mF ∂ x
(1)∂ x
(2)... ∂ x
(m).Ereignis:
A
:X ∈ A
.Wsch.durchIntegrationderDichte:P hA i = R
u∈A
f h u i d u
(1)... d u
(m).F h x i = P h X
(1)≤ x
(1),. .., X
(m)≤ x
(m)i
= Z
u (1)≤x (1),...,u (m)≤x (m)
f h u i d u
(1)... d u
(m).
53
MehrdimensionaleStandard-Normalverteilung.
Z ∼ Φ
m⇐ ⇒ Z
(j)∼ Φ
1,
unabhängig.
f h z i = Y
mj=1
1 √ 2 π e x p h z
(j)2/ 2 i = (2 π )
−m/2e x p hk z k
2/ 2 i = e f hk z k
2i .
−202
−2 0 2
543.2
cLineartransformierterZufallsvektor.
Linearkombination
X = b
TZ − → ∼ N h 0 , P
jb
2ji = N h 0 , k b k
2i
Lin.transf.
Z
,X = µ + B Z − → E h X i = µ , v a r h X i = B B
TdMultivariateNormalverteilung.=Vt.von
X = µ + B Z
!− → X ∼ N
mh µ , B i
Problem:Sei
B
orthogonal.DannistX = B Z
standard-nv.− →
VerschiedeneParameter,B
undI
,mitgleicherVt.− →
Parameternichtidentifizierbar.GeeigneteParameter:Erw.wert
µ
undKovarianz-Matrix|Σ
. ZweiMatrizenB
undB
′mitgleichem|Σ
,alsoB B
T= B
′B
′T− → X = µ + B Z
undX = µ + B
′Z
gleichvert.,X ∼ N
mh µ ,
|Σ i
55 WelcheMatrizensindals|
Σ
brauchbar?Alle
m × m
-Matrizendiesymmetrischund„positivsemidefinit"sind,denndannexistiert
B
mitB B
T=
|Σ
. Dichte.Falls|Σ
nichtsingulärist,istdieDichtef h x i = c · e x p h ( x − µ )
T|Σ
−1( x − µ ) / 2 i c = (2 π )
m/2d e t h
|Σ i
1/2Dichtekonstantfür
( x − µ )
T|Σ
−1( x − µ )
=Konstante.− →
Ellipsoid.56
−202
−2 0 2
−20246
−2 0 2 4
57 SchätzungderParameter:
b µ = X
,undb
|Σ
.0.600.620.640.660.680.700.720.740.760.780.80
0.35 0.40 0.45 0.50 0.55 0.60 0.65
log(Länge)
log(Breite)
583.2
hLineareTransformation.
X ∼ N
mh µ ,
|Σ i − → Y = a + B X ∼ N
mh a + B µ , B
|Σ B
Ti
iStandardisierterZufallsvektor.
Z = B
−1( X − µ )
mitB B
T=
|Σ .
Wenn
X
normalverteilt,dannZ
standard-normalverteilt.59
jChiquadrat-Verteilung
=Vt.derSummevon
m
unabh.,quadriertenstandard-normalvert.Z
(j),U = X
mj=1
Z
(j)2= k Z k
2, Z ∼ Φ
m.
Dichte
f
mh u i =
12 m/2Γhm/2i· u
m/2−1e
−u/2.Γ
:Gamma-Funktion Mahalanobis-Distanz.X ∼ N h µ ,
|Σ i
d
2h X ,µ ;
|Σ i = k Z k
2= Z
TZ = ( X − µ )
TC
TC ( X − µ )
= ( X − µ )
T|Σ
−1( X − µ )
=quadrierteMahalanobis-Distanzvon
X
zuµ
.d
2h x ,µ ;
|Σ i =
konstant:gleicheDichte.d
2∼ χ
2m ,m
Freiheitsgrade603.2
lQ-Q-Diagramm.
0.00.51.01.52.02.53.03.5
0 1 2 3
theoretische Quantile
geordnete Mahalanobis−Distanzen
61 Randverteilungen.Gem.Vt.von
X − →
Vt.vonX
(j):RandverteilungAuch„mehrdimensionaleRänder"!
UnterteilteVektorenundMatrizen
a = a
[1]a
[2]= a
(1)... a
(p)a
(p+1)... a
(m)
C = C
[11]C
[12]C
[21]C
[22]= C
11... C
1pC
1,p+1... C
1m... ... C
p1... C
ppC
p,p+1... C
pmC
p+1,1... C
p+1,pC
p+1,p+1... C
p+1,m... ... C
m1... C
mpC
m,p+1... C
mm
623.2 n
X ∼ N
mh µ ,
|Σ i
X
[1]∼ N
pD µ
[1],
|Σ
[11]E .
oAnderemultivariateVerteilungen:...unbedeutend...
63
3 .3 T h e o re tis c h e R e s u lt a te fü r a n d e re G e b ie te
VerteilungdergeschätztenKoeffizientenindermultiplenlin.Regression.
Y = X β + E
E ∼ N
nh 0 ,σ
2I i b β = X
TX
−1X
TY
= X
TX
−1X
T( X β + E ) = β + C E
mitC = X
TX
−1X
Tv a r h b β i = C ( σ
2I ) C
T= σ
2· C C
T= σ
2· X
TX
−1X
T· X
X
TX
−1 T= σ
2· X
TX
−164
M e rk p u n k te M o d e lle
•
Zufallsvektoren− →
Dichte,Verteilungsfunktion,ErwartungswertKovarianzmatrix:
v a r h X i = E ( X − µ )( X − µ )
T•
LineareTransformationY = a + B X v a r h Y i = B v a r h X i B
T•
MultivariateNormalverteilungX ∼ N µ ,
|Σ
erzeugtdurchStandard-Nv.undlineareTransformationen