203
16 A usb lic k
16.1 Varianzanal yse ,Allg emeines Lineares Modell
aVarianzanalysemitfestenEffekten
1
1 1 1
2 22 2 3 3
3 34 44 4
Ertrag
300 400 500
1234K N = 1 N = 2 N = 3 N = 4
UnterkapitelderRegression...mitnützlichenVereinfachungenbVersuchsplanung.GeplanteVersucheermöglichenUrsachenforschungMöglichstwenigeVersuchefürmöglichstvielInformationOptimaleProduktionsbedingungenfinden
− →
responsesurfaces20416.1
cZufälligeEffekteRingversuch
Labor
Sr−89
5101520
40 50 60 70 80 90
57.7
dRepeatedMeasures,SplitPlotDesignsVerlaufskurven,SpaltanlageneZufälligeEffekteallgemeinfProgrammeSASR:
lme
nochunvollständigundanspruchsvoll205
16.2 Korrelier
teFehler ,Zeitreihen-Regression
Korrelier a
teF ehler
SequencePlot, Tests
AR-Modellfür b
Fehler
Y
=
i Tx
β
i+ E ,
iE
=
iαE +
i−1U
, i
U
unabhängig. i
Generaliz c
edLeast Squares
Korrelationen zwischen
E
’s i
bekannt Ver
− →
allg.Kl.Qu.
RäumlicheK d
orrelation
Korrelation zwischen
E
’s i
hängtv omAbstand
derBeobachtungsor teab
.
206
16.3 Multivariate
Regression
MehrdimensionaleNormalv a
erteilung
charak erisier
tdurch Erwar
tungsw erts- Vektor
undV arianz-
Matrix
∼N E
m
|
Σ µ,
−2 0
2
−202
0.65 0.70
0.75
0.40.50.6
207 16.3 MehrereZielg b
rössen,mehrere gewöhnliche
Regressionen
15 17 19 21
23 1.31.41.51.61.71.8
+ SST
+
+
+ +
+ +
+ + +
+ + +
+ + + +
+
+ + +
+ 0.2
0.4 0.6 0.8
1.0 1.31.41.51.61.71.8
l.Chlorophyll
+ +
+ + +
+ +
+ + +
+ +
+
+ +
+ + +
+ +
+ + 35.4
35.8 36.2
36.6 1.31.41.51.61.71.8
Salinity
+ +
+
+ +
+ + + + +
+ + +
+ + +
+ +
+ + +
+
−0.18
−0.12
−0.06
0.00 1.31.41.51.61.71.8
OxUtil
l.Angle
+ +
+
+ +
+ +
+ ++
+ + + +
+ +
+ +
+ +
+ +
15 17 19 21
23 0.450.500.550.600.65
+ +
+ +
+ +
+
+ + +
+ + +
+ + +
+ + + +
+ +
0.2 0.4 0.6 0.8
1.0 0.450.500.550.600.65
+ +
+ +
+ +
+
+ + +
+ +
+
+ +
+
++ + + + + 35.4
35.8 36.2
36.6 0.450.500.550.600.65
+ +
+ +
+ +
+ + + +
+ + +
+ + +
+++
+
+ +
−0.18
−0.12
−0.06
0.00 0.450.500.550.600.65
l.Length
+ +
+ +
+ +
+ + + +
+ + +
+ + +
+ + + + + +
15 17 19 21 23
0.790.810.830.85
+ +
+ +
+ + + +
+ + + +
+ +
+ +
+ + + + +
+ 0.2
0.4 0.6 0.8 1.0
0.790.810.830.85
+ +
+ + ++
+
+
+ + +
+
+ +
+ +
+
+ +
+ + + 35.4
35.8 36.2 36.6
0.790.810.830.85
+ +
+ +
+ + + +
+ + + +
+ + + +
+ + + + +
+
−0.18
−0.12
−0.06 0.00
0.790.810.830.85
rWidth
+ +
+ + + +
+ +
+
+ +
+
+ + + +
+ + +
+ + +
208 16.3 Modell c
T
Y
=
i Tx
β
i+
T
E
i
Schätzungder d
Koeffizienten
β
durch„univ ariate"
Regressionen.
Zusätzlich:Gesamttests e
füralle Zielgrössen
gleichzeitig
Einflusseines Regressors
/T erms
:alle
(j
β
)
=0
k209 16.3 Zusätzlich:K f
orrelierte Fehler
Kov
− →
arianzmatr ixder
Residuen
Par tielleK
orrelation:
Korr .der
(j
Y
,gegeben )
.
x
−0.15
−0.05 0.05
0.15 0.25
−0.10−0.050.000.050.10
Residuen v. l.Angle
+
+
+
+
+ +
+
+ + + +
+
+ +
+
+
+ +
+
+
+
+
−0.10
−0.05 0.00
0.05 0.10
−0.10−0.050.000.050.10
Residuen v. l.Length
Residuen v. l.Length
Residuen v. l.Length
−0.15
−0.05 0.05
0.15 0.25
−0.02−0.010.000.010.02
+
+
+
+ + +
+
+
+ + +
+
+ +
+ +
+ + +
+
+
+
−0.10
−0.05 0.00
0.05 0.10
−0.02−0.010.000.010.02
Residuen v. rWidth
+
+
+
+
+ +
+ +
+ + +
+
+ +
+ +
+ + +
+
+
+
210 16.3 Spektren,Functional g
DataAnalysis:
Kur ven alsEingangs-
od.Zielg rössen
1100 1300
1500 1700
1900 2100
2300 2500
−0.0060.0000.0060.0120.018
Wellenlänge
Spektrum, med−zentriert
211 16.3 Simultane h
Gleichungen Ökonometr
ie
Strukturgleichungs-Modelle i
undg rafische Modelle
Ganzes Netzv
onV ariab
lenmit Regressions-Zusammenhängen
Var iablen
sindn urteilw
eisebeobachtbar .
LatenteV ariab
le zurF orm
ulierung einesModells
Vgl.Geordnete Zielgr.,
Faktor analyse,Zustandsr
aum-(Zeitreihen-) Modelle
212
16.4 Nichtlineare
Regression
Modell a
Y
=
ih h x
;
ii θ + E
Par i
ameter .
θ
Methodikanalog b
zurlinearen Regression.
KleinsteQuadr ate
Näherung c
durchlineare Regression.
Iterativ erAlgor
ithmus .
Statistik:Standard-F ehlerder
gesch.P arameter
Tests
− →
,V ertr
auensint.
Schwierigk d
eiten:
Startw erte
,ungenaue Ver
trauensinter valle
Kunst
− →
derP arameter-T
ransf ormation
„Systemanalyse" e
Nichtlin.Reg r.mit
Differentialgleichungen.
Berechnung von
h h x
;
ii θ
braucht numer
ischeLösung
einesDiff .-gl.-systems
213
16.5 Nichtparametrisc
heRegression
„Glättung" a
MehrereDimensionen: b
zuw enigeBeobachtungen
General c
Additive Model
Einsatzin d
gewöhnlicher Regression
214
16.6 Überlebenszeiten,
zensier teZielgrössen
Ver a
teilungen: Exponential,W
eibull, Gamma,Lognor
mal
Ver b
teilungender logarithm.
Grösse:
Gumbel,Nor mal(ausser
Gamma)
Zensierte c
Grössen
Regression: d
Par
•
ametrisch mitW
eibull-V erteilung
OhneAnnahme
•
überdie Fehler-V
erteilung mit
Cox-Reg ression
215
Merkpunkte Regressionsmodelleim
Überblic k
Modellefür
•
eine kontin uierliche
Zielgrösse:
–lineare R.,Kl.Qu.
oderrob ust
–nichtlineare R.
–GLM mitGamma-V
erteilung, ...
–Über lebenszeiten:
parametr ischoder
Cox (mitz
ensierten Daten)
–nichtpar ametrische
R.(Glättung), general
additive model
–Zeitreihen-R.
–m ultivar
iateR.
–Str ukturgleichungsmodelle,g
rafische Modelle
Modellefür
•
andereZielg rössen:
– logistischeR.,
kumulativ eLogits
,m ultinomialeR.
–P oisson-R.(log-lineare
Modelle)
216
Schätzungen:
•
meistens„prob lemlos",da
programmier t
Robuste Var
ianten?
Tests:
meistensn urüber
asymptotischeV erteilung!
(o.k.?)
Simulation,
− →
„bootstrap"!
Robustheit?
Vorhersage:
•
Manbr auchtnicht
unbedingt
die„r ichtigen"T
erme .
Beurteilung derV
orhersagefehler (Abweichung
/F ehlklassifikation)
mitT rainings-Datensatz zuoptimistisch
Test-Datensatz,
− →
Kreuzvalidier ung
Modell-Entwicklung
•
jenach
Fragestellung undGrösse
desDatensatz es.
–A utomatisierte
Modellwahl
–Str ategieder
Datenanalyse!
– Fachwissen undKreativität
verw enden!
217
(Viel Vergnügen!
)