• Keine Ergebnisse gefunden

2. Zielführende Darstellung geostatischer Methoden

2.1. Räumliche Zufallsprozesse

Grundlage jedes geostatistischen Verfahrens ist die Annahme, daß die betrach-teten Meßwerte, also die pH-Werte, die Brusthöhendurchmesser oder die Jah-resniederschlagssummen, eine Stichprobe einer Realisation eines räumlichen Zufallsprozesses sind: BezeichnetS(N) ={snD,n=1, . . . ,N}die Menge, de-ren Elemente die Koordinaten derNOrte sind, an denen die Meßwerte

z(N)=n

z(s) :sS(N)o

(2.1.1) erhoben wurden, dann werden die Meßwerte als Stichprobe einer Realisation

z={z(s) :sD} (2.1.2)

des räumlichen Zufallsprozesses

Z={Z(s) :sD} (2.1.3)

über dem UntersuchungsgebietDoder als Realisation des überS(N)definierten Teils

Z(N)=n

Z(s) :sS(N)o

(2.1.4) des Prozesses 2.1.3 aufgefaßt. Olea (1999), S. 11 bezeichnet 2.1.2 allgemein als partielle Realisation.

Die Matrix der Koordinaten ist danns(N)=[s1, . . . ,sN]T,die geordnete Stich-probe

z=[z(s1), . . . ,z(sN)]T eine Realisation des Zufallsvektors

Z=[Z(s1), . . . ,Z(sN)]T. (2.1.5) Weiter nehmen wir an, daß der Prozeß{Z(s) :sD}sich in

Z(s)=µ(s)+ε(s)=

p

X

j=0

fj(s)βj+ε(s)=xT(s)β+ε(s) ∀sD,

zerlegen läßt (vergleiche Cressie (1991), S. 151), wobeix(s)=h

fo(s), . . . , fp(s)iT

einen Vektor beliebiger bekannter Funktionen,β = h

β0, . . . , βp

iT

einen Vektor (gewöhnlich) unbekannter Parameter bezeichnet.

Die Bestandteile des Prozesses sind also eine Erwartungswertfunktion E[Z(s)]=µ(s) =

p

X

j=0

fj(s)βj =xT(s)β ∀sD; (2.1.6) und ein Rest- oder Fehlerprozeß ε={ε(s) :sD}, dessen Erwartungswert 0 über ganzDist und von dem wir annehmen, daß er eine räumliche Abhängig-keit, also eine Kovarianzfunktion besitzt:

cov(ε(sn), ε(sm))=E[{ε(sn)−E[ε(sn)]}(ε(sm)−E[ε(sm)])]

=C(sn,sm) ∀sn,smD. (2.1.7) Dies ist, da für allesDgiltE[ε(s)]=0 undε(s)=Z(s)−E[Z(s)], nach Ripley (1981), S. 45 zugleich auch die Kovarianzfunktion des ProzessesZ:

cov(Z(sn),Z(sm))=E[{Z(sn)−E[Z(sn)]} {Z(sm)−E[Z(sm)]}]

=C(sn,sm) ∀sn,smD.

Dementsprechend kann der Zufallsvektor 2.1.5 zerlegt werden:

Z=+ε,

wobeiX(s) eineN×(p+1) Matrix mit Elementenxnj= fj−1(sn) undεn=ε(sn) ist. Der Erwartungswertvektor vonZist

µ=[E[Z(s1)], . . . ,E[Z(sN)]]T,

(C(sn,sm))n,m=1,...,N =Σ (2.1.8) ist Kovarianzmatrix sowohl des TeilprozessesZ(N)als auch des überS(N) defi-nierten Teils des Fehlerprozessesε, und

[cov(Z(s1),Z(s0)), . . . ,cov(Z(sN),Z(s0))]T =c (2.1.9) ist der Kovarianzvektor zwischen dem Teilprozeß an den Meßstellen und dem unbeobachteten Teilprozeß an einem Prognoseorts0.

Die verschiedenen linearen Krigingverfahren treffen unterschiedliche An-nahmen über die Erwartungswertfunktion 2.1.6, sie setzen aber alle voraus, daß die Kovarianzmatrix 2.1.8 und der Kovarianzvektor 2.1.9 - oder entspre-chende Matrizen des Semivariogrammes - bekannt sind.

Um die benötigten Kovarianzfunktionen ohne Meßwiederholungen aus den Daten schätzen zu können, nehmen wir an, daß der Prozeß ergodisch (verglei-che Cressie (1991), S. 53ff) und damit stationär im Sinne einer von mehreren möglichen Definitionen ist. Die Definition, daß der Erwartungswert 2.1.6 kon-stant über D und die Kovarianzfunktion 2.1.7 (und mit ihr 2.1.8 und 2.1.9) eine Funktion des Abstandsvektors zwischen zwei Orten, nicht aber deren absoluter Lage ist,

E[Z(s)]=µ ∀sD,

C(snsm)=C(h)≥0 ∀sn,smD,

2.1. Räumliche Zufallsprozesse wird in der Literatur (zum Beispiel bei Cressie (1991), S. 53) meist Schwache Stationarität oder Stationarität zweiter Ordnung des ProzessesZgenannt. Die Kovarianzfunktion muß positiv definit sein (vergleiche Cressie (1991), S. 68), woraus folgt, daß jede aus ihr bildbare KovarianzmatrixΣnichtnegativ definit1 ist. Die abgeschwächte Forderung, daß

E[Z(s)]=µ ∀sD, (2.1.10) und

γ(h)= 1

2var[Z(s)−Z(s+h)]≥0 ∀s,s+hD, (2.1.11) gilt, wird intrinsische Stationarität, die Funktionγ(h) Semivariogrammfunk-tion genannt. Ein schwach staSemivariogrammfunk-tionärer Prozeß ist immer auch intrinsisch statio-när, für Maße räumlicher Abhängigkeit gilt dannγ(h)=C(0)−C(h). Prozesse, deren Semivariogramm- oder Kovarianzfunktionen nur von der Länge des Vektors h, nicht aber seiner Richtung abhängen, werden isotrope Prozesse genannt.

2.1.1. Schätzung der räumlichen Abhängigkeit

Die räumliche Abhängigkeit eines Prozesses wird meist als Semivariogramm dargestellt. Chilès u. Delfiner (1999), S. 38 unterscheiden zwischen 2.1.11, dem Semivariogramm des ProzessesZ(2.1.3), und dem Semivariogramm der Stich-probez(N)(2.1.1),

γS(h)= 1 2|N(h)|

X

N(h)

{z(sn)−z(sm)}2.

Die Schätzung des Semivariogrammes des Prozesses erfolgt mit dem sich aus dem Semivariogramm der Stichprobe ergebenden Schätzer

ˆ

γ(h)= 1

2|N(h)|

X

N(h)

{Z(sn)−Z(sm)}2,

wobei N(h)={(sn,sm) :snsm=h; n,m=1, . . . ,N}alle Ortspaare sind, die den Abstandh aufweisen und |N(h)| ihre Anzahl bezeichnet (vergleiche Cressie (1991), S. 69). Journel u. Huijbregts (1978), S. 194 empfehlen, nur solche Paare zu betrachten, deren Abstand kleiner als die Hälfte des betrachteten Untersu-chungsgebietes ist.

Ist das Histogramm der Meßwerte sehr schief („long-tailed“), empfehlen Chilès u. Delfiner (1999), S. 142 die Verwendung robuster Semivariogramm-schätzer; Cressie (1991) widmet diesen das Kapitel 2.4.3, Chilès u. Delfiner

1Nach Harville (1997), S. 210 ist eine MatrixΣRn×nnichtnegativ definit, wenn sie xTΣx0 xRn

erfüllt.

cov(0)

rǫ c0

cp

c0

γ(h) cov(h) h

γ(h),cov(h)

Abbildung 2.1.:Gauß’sche Semivariogramm- und Kovarianzfunktion,cp be-zeichnet nach Cressie (1991), S. 61, 67 den partiellen Schwellenwert,c0den Nugget-Effekt und der Schwellenwert istcov(0)=cp+c0.

(1999) das Kapitel 2.2.5. Um eine genügend genaue Schätzung von γ(h) zu gewährleisten, empfehlen Journel u. Huijbregts (1978), S. 194|N(h)| ≥ 30,50.

Chilès u. Delfiner (1999), S. 38 empfiehlt |N(h)| ≥ 50, Olea (1999), S. 71 und Cressie (1991), S. 70 zitieren Journel u. Huijbregts (1978). Da kaum ein Daten-satz diese Anforderungen erfüllt, werden meist Abstandsvektorklassen gebil-det und Schätzer fürγberechnet. Werden beispielsweise die Abstandsvektor-klassen als{(l×h±h/2), l=0, . . . ,L}definiert, ergeben sichL+1 Schätzer

ˆ

γl(h)= 1 2|Nl(h)|

X

Nl(h)

{Z(sn)−Z(sm)}2,

Nl(h)=((sn,sm) :snsm∈(l×h±h/2); n,m=1, . . . ,N).

An die mit diesem Schätzer berechneten Schätzwerte wird eine bedingt ne-gativ definite Funktion angepaßt (Cressie (1991), Kapitel 2.5.2), um die räumli-che Abhängigkeit für beliebige Distanzen angeben zu können - Cressie (1991), Kapitel 2.6 diskutiert verschiedene Anpassungsmethoden, neben der rein vi-suellen Anpassung auch Kleinste Quadrate. Geeignete bedingt negativ definite Funktionen finden sich bei Chilès u. Delfiner (1999), Kapitel 2.5. Abbildung 2.1 zeigt die um ein Nuggetmodell

γ(h)=





c0; c0>0 wenn|h| >0, 0 wenn|h| =0

auch Nugget-Effekt genannt, erweiterte Gauß’sche Semivariogramm- und Kovarianzfunktion eines schwach stationären Prozesses, sie ist nach Hoeting u. a.

(2006), S. 88 ein Grenzfall des flexiblen Matern-Modelles.

Die Gauß’sche Semivariogrammfunktion wird von Chilès u. Delfiner (1999), S. 85 in ihrer Grundform mit

γ(h)=cp





1−exp





−h2 a20









2.1. Räumliche Zufallsprozesse angegeben. In dieser Formulierung entspricht rǫ, die effektive Reichweite, bei der eine asymptotische Semivariogrammfunktion etwa 95 Prozent ihres Schwellenwertes erreicht, √

3 · a0. Bei dieser und anderen asymptotischen Semivariogrammfunktionen haben daher verschiedene Autoren verschiedene Darstellungen der Grundform eingeführt, diese wurden in Softwarelösungen übernommen und führen in der Praxis zu unterschiedlichen Parametrisierun-gen eiParametrisierun-gentlich identischer Semivariogrammfunktionen.

2.1.2. Erwartungswertschätzung

Die in Kapitel 2.2.1 vorgestellten linearen Krigingprädiktoren benötigen eine bekannte (Einfaches Kriging) oder geschätzte (Gewöhnliches und Universelles Kriging) Erwartungswertfunktion.

Bei der Schätzung unterscheiden wir danach, ob die Erwartungswertfunk-tion konstant überD ist (2.1.10) oder nicht. Ist die Erwartungswertfunktion konstant, können wir Gewöhnliches Kriging anwenden; ist die Erwartungs-wertfunktion nicht konstant, können wir durch Universelles Kriging den Ein-fluß externer erklärender Variabler – bei der Interpolation der Jahresmittel-temperatur zum Beispiel könnten dies die Geländehöhe über NN und die geographischen Koordinaten sein – berücksichtigen.

Schätzung eines räumlich variablen Erwartungswertes

Istβund damit die Erwartungswertfunktion 2.1.6 des Prozesses unbekannt, ist nach Cressie (1991), S. 20f

βˆgls=

XTΣ−1X−1

XTΣ−1Z (2.1.12)

der beste lineare unverzerrte Schätzer fürβ. Somit ist ˆ

µgls(s)=xT(s) ˆβglssD (2.1.13) der beste lineare unverzerrte Schätzer für 2.1.6 und

varhβˆglsi

=Eβˆgls−β βˆgls−βT

=

XTΣ−1X−1

(2.1.14) die Varianz von 2.1.12 (vergleiche Cressie (1991), S. 21).

Schätzung eines konstanten Erwartungswertes

Ist die Erwartungswertfunktion konstant überD, so gilt in 2.1.6p=0∧ f0(s)= 1∧β0=µ. Daraus folgtxT(s)=x(s)=1,X=1,β=β0 =µund

ˆ

µ(s)=µˆ =

1TΣ−11−1

1TΣ−1Z=aTZsD (2.1.15) ist der beste lineare unverzerrte Schätzer fürµ. Die Summe der Gewichte aT ist

1TΣ−11−1

1TΣ−11=1,Eµˆ=Eh aTZi

=aTE[Z]=aTµ=µder

Erwartungs-wert2von ˆµund nach Olea (1999), S. 10, Lemma 2.4 ist Eh

ˆ µ−µ2i

=varµˆ= 1

1TΣ−11 (2.1.16) die Varianz3von ˆµ(eine genauere Darstellung der Umformung findet sich in Kapitel B.2).