• Keine Ergebnisse gefunden

Ein stochastisches Modell zur Beschreibung stündlichen Niederschlages

N/A
N/A
Protected

Academic year: 2022

Aktie "Ein stochastisches Modell zur Beschreibung stündlichen Niederschlages"

Copied!
225
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Dissertation

zur Erlangung des wirtschaftswissenschaftlichen Doktorgrades der wirtschaftswissenschaftlichen Fakultat

der Universitat Gottingen

vorgelegt von

Ulrike Ohlmer

aus Hildesheim

Gottingen, 1998

(2)

Tag der mundlichen Prufung: 11.12.1998

(3)

Abbildungsverzeichnis . . . vii

Tabellenverzeichnis . . . ix

Bezeichnungen . . . x

Abstract 1 1 Einleitung 3 2 Stochastische Modelle 7

1 Stochastische Modellierung von Niederschlag . . . 7

2 Poissonprozesse . . . 10

3 Markovketten . . . 12

4 Hidden{Markov{Modelle . . . 15

5 Alternierende Erneuerungsprozesse . . . 17

6 Erneuerungs{Cox{Markov{Prozesse . . . 19

7 Clustermodelle . . . 19

8 ARMA{ und DARMA{Modelle . . . 25

9 Stundlicher Niederschlag - Acremans einfaches Modell . . . 26

10 Punktprozesse in stetiger und Beobachtungen in diskreter Zeit . . . . 27

3 Der Datensatz 31

1 Auswahl eines Schwellenwertes . . . 34

2 Auswahl homogener Perioden . . . 38

3 Der Niederschlagsmengenproze . . . 41 ii

(4)

4 Taglicher Niederschlag 49

1 Der Ereignisproze . . . 49

2 Die Niederschlagsmengen an nassen Tagen . . . 56

3 Simulation . . . 60

4 Modellvalidation . . . 63

5 Ergebnisse . . . 64

5 Das Neyman{Scott{Modell 69

1 Denition und Eigenschaften . . . 70

2 Modellanpassung fur eine homogene Periode . . . 80

3 Saisonale und innertagliche Variation . . . 85

4 Glattung der Modellparameter { Set B4 . . . 89

5 Glattung der Modellparameter { Set B1 . . . 111

6 Berechnung der Modellparameter fur alle Stunden . . . 129

6 Modellvalidation 131

1 Simulation stundlichen Niederschlages . . . 131

2 Momente der simulierten Daten . . . 137

3 Extremer Niederschlag . . . 145

4 Verteilung der Niederschlagsmengen in nassen Stunden . . . 160

5 Verteilung der Runlangen . . . 163

6 Verteilung des Niederschlages an nassen Tagen . . . 168

7 Zusammenfassung . . . 173

7 Zusammenfassung 175

A Die Rohdaten 177

(5)

1 Der Ereignisproze . . . 183

2 Die Niederschlagsmengen an nassen Tagen . . . 185

3 Modellvalidation . . . 188

4 S-PLUS-Routinen . . . 191

C Das Neyman{Scott{Modell 197

1 Modellanpassung . . . 197

2 Simulation stundlichen Niederschlages . . . 203

3 Algorithmus zum Zahlen der Runlangen . . . 206

Literaturverzeichnis 211

(6)

2.1 Aufbau des Neyman{Scott{Clustermodelles . . . 22

3.1 Jahresniederschlagsmenge und - dauer . . . 32

3.2 Ereignismenge . . . 32

3.3 Ereignisdauer . . . 32

3.4 Cusum Charts . . . 34

3.5 Niederschlagsmengen an nassen Tagen . . . 37

3.6 Stationaritat der Beobachtungen . . . 39

3.7 Monatsniederschlag . . . 40

3.8 Regenereignisse . . . 41

3.9 Empirisches Ein-Stunden-Mittel . . . 44

3.10 Empirische Varianzen . . . 45

3.11 Empirische Varianzen . . . 45

3.12 Empirische Lag(1)-Autokorrelationen . . . 47

3.13 Empirische Lag(1)-Autokorrelationen . . . 47

3.14 Empirische Ubergangswahrscheinlichkeiten . . . 47

3.15 Empirische Ubergangswahrscheinlichkeiten . . . 47

3.16 Empirische Wahrscheinlichkeiten trockener Intervalle . . . 48

4.1 ACF des Ereignisprozesses . . . 50

4.2 Niederschlagsmengen an nassen Tagen . . . 58

4.3 Jahresniederschlag . . . 65

4.4 Monatsniederschlag . . . 66 v

(7)

4.6 Anzahl nasser Tage pro Monat . . . 66

4.7 Quantile der Niederschlagsmenge an nassen Tagen . . . 67

4.8 Taglicher Niederschlag - Clusterverhalten . . . 67

4.9 Taglicher Niederschlag - Clusterverhalten . . . 68

4.10 Taglicher Niederschlag - Clusterverhalten . . . 68

5.1

Skizze zur Kovarianzstruktur

. . . 72

5.2 Lag(1)-Autokorrelation als Funktion der Intervalldauer . . . 77

5.3 Lag(1)-Autokorrelation als Funktion von und . . . 78

5.4 (h) undWW(h) als Funktionen der Modellparameter . . . 78

5.5 (h) undWW(h) als Funktionen der Modellparameter . . . 79

5.6 Empirische Momente als Funktion der Intervalllange . . . 81

5.7 Empirische WahrscheinlichkeitD(h= 1) . . . 86

5.8 Periodogramm von | Set B4 . . . 91

5.9 Modellierung von | Set B4 . . . 92

5.10 Modellierung von | Set B4 . . . 93

5.11 Modellierung von | Set B4 . . . 100

5.12 Modellierung von | Set B4 . . . 100

5.13 Modellierung von | Set B4 . . . 102

5.14 Modellierung von | Set B1 . . . 117

5.15 Modellierung von | Set B1 . . . 118

5.16 Modellierung von | Set B1 . . . 119

5.17 Modellierung von | Set B1 . . . 119

5.18 Modellierung von | Set B1 . . . 119

6.1 Beobachtete und simulierte Momente:(1), (1) . . . 139

6.2 Beobachtete und simulierte Momente:(3), (6) . . . 140

6.3 Beobachtete und simulierte Momente:(12), (24) . . . 141

(8)

6.4 Beobachtete und simulierte Momente: (11), (31) . . . 141

6.5 Beobachtete und simulierte Momente: (61), (121) . . . 141

6.6 Beobachtete und simulierte Momente: (241), WW(1) . . . 142

6.7 Beobachtete und simulierte Momente:WW(3), WW(6) . . . 142

6.8 Beobachtete und simulierte Momente:WW(12), WW(24) . . . 142

6.9 Beobachtete und simulierte Momente:D D(24), (24) . . . 143

6.10 Jahresniederschlag . . . 143

6.11 Monatssniederschlag: Januar . . . 144

6.12 Monatssniederschlag: Juli . . . 144

6.13 1-Stunden-Maxima . . . 148

6.14 1-Stunden-Maxima . . . 149

6.15 6-Stunden-Maxima . . . 151

6.16 6-Stunden-Maxima . . . 153

6.17 24-Stunden-Maxima . . . 156

6.18 24-Stunden-Maxima . . . 157

6.19 24-Stunden-Maxima: Ausgewahlte Monate . . . 158

6.20 Niederschlagsmengen in nassen Stunden . . . 161

6.21 Niederschlagsmengen in nassen Stunden . . . 162

6.22 Niederschlagsmengen in nassen Stunden . . . 162

6.23 Nasse Runs . . . 165

6.24 Nasse Runs { Maximallangen . . . 166

6.25 Nasse Runs { Maximallangen . . . 167

6.26 Trockene Runs - Mindestlangen . . . 168

6.27 Trockene Runs - Mindestlangen . . . 169

6.28 Trockene Runs . . . 170

6.29 Trockene Runs - Klasseneinteilung . . . 171

6.30 Innertagliche Verteilung der Niederschlage an nassen Tagen . . . 172

B.1 Mittlerer Niederschlag an nassen Tagen . . . 187

(9)

3.1 Eigenschaften des Jahresniederschlages . . . 33

3.2 ACF der Niederschlagsmengen an nassen Tagen . . . 35

3.3 Auswirkung des Schwellenwertes . . . 38

3.4 Monatsniederschlag . . . 42

3.5 Niederschlagsereignisproze . . . 43

3.6 Empirische Momente des aggregierten Niederschlagsprozesses . . . 46

4.1 ACF des Ereignisprozesses . . . 50

4.2 Jahresniederschlag . . . 63

5.1 30-Tages-Perioden in der NSRP-Modellanpassung . . . 86

5.2 Parameterglattung: Set B4, . . . 98

5.3 Parameterglattung: . . . 99

5.4 Parameterglattung:, Set B4 . . . 101

5.5 Parameterglattung: Set B1, . . . 117

5.6 Parameterglattung: . . . 118

5.7 Parameterglattung:, Set B1 . . . 120

6.1 Erwartungswert und Varianzen . . . 138

6.2 Korrelationen . . . 139

6.3 Wahrscheinlichkeiten nasser und trockener Intervalle . . . 140

6.4 Jahres- und Monatsniederschlage . . . 143

6.5 1-Stunden-Maxima . . . 146 viii

(10)

6.6 1-Stunden-Maxima pro Set . . . 147

6.7 6-Stunden-Maxima . . . 150

6.8 24-Stunden-Maxima . . . 154

6.9 24-Stunden-Maxima pro Set . . . 155

6.10 Quantile der Niederschlages in nassen Stunden . . . 161

B.1 Modellierung der Ubergangswahrscheinlichkeiten . . . 184

B.2 Monats- und Jahresniederschlag . . . 188

B.3 Anzahl nasser Tage . . . 189

B.4 Niederschlag an nassen Tagen . . . 189

B.5 Niederschlag an nassen Tagen - Quantile . . . 190

(11)

ublichen Notation bezeichnet ^a den Schatzer eines Parametersa. Modelluberblick, Beschreibung des Datensatzes, taglicher Niederschlag

1( ) Indikatorfunktion.

x] grote ganza Zahl, die kleiner oder gleich x ist: x] = maxfz2 ZZ jzxg Ck Zustand des klimatologischen Prozesses an Tag k in einem Hidden-Markov-

Modell.

CV (X) Variationskoezient einer Zufallsvariablen X: CV (X) =pVarX= EX.

DE Dauer eines Regenereignisses

DEs(DE) Mittel bzw. emp. Standardabweichung von DE. DJ Gesamtniederschlagsdauer in einem Jahr

I(t) Dispersionsindex eines Punktprozesses: I(t) = V ar(N(t))= EN(t).

IE= YE=DE Ereignisintensitat

L0L1 Lange eines trockenen bzw. nassen Intervalles in einem alternierenden Erneuerungsproze.

N(t) Anzahl der Punkte im Intervall (0t] in stetiger Zeit:N(t) = N((0t]).

Nk Anzahl der Punkte bis inklusive des k-ten Zeitpunktes (diskrete Zeit) NR(t) Anzahl der Jahre n = 1:::N, in denen Tag t na ist: NR(t) =

P

N

n=11(Ztn= 1)

ND(t) Anzahl der Jahre n = 1:::N, in denen Tag t trocken ist: ND(t) =

P

N

n=11(Ztn= 0)

NRR(t) =PNn=11(Zt;1n= 1) 1(Ztn= 1)

NRRR(t) =PNn=11(Zt;2n= 1) 1(Zt;1n= 1) 1(Ztn= 1) NDRR(t) =PNn=11(Zt;2n= 0) 1(Zt;1n= 1) 1(Ztn= 1) NRDR(t) =PNn=11(Zt;2n= 1) 1(Zt;1n= 0) 1(Ztn= 1)

Rj Amplitude der j-ten Fourierfrequenz bei Anpassung einer Fouriersumme an Beob. x1:::xt.

S Residuenquadratsumme

Tn Wartezeit ab dem Zeitpunkt 0 auf den n-ten Punkt.

Un Verweildauer zwischen dem n;1-ten und dem n-ten Punkt.

Wtn(d) Niederschlagsmenge an Tag t in Jahr n, gegeben an Tag t fallt mehr als dmm Niederschlag.

Yt, Ytn Niederschlagsintensitat zur Zeit t (in Jahr n).

Yk Niederschlagsmenge an Tag k.

YE Niederschlagsmenge eines Regenereignisses YEs(YE) Mittel bzw. emp. Standardabweichung von YE.

YJ Jahresniederschlag

Zk(y) 0;1-Proze taglichen Niederschlages: Zk(y) = 1(Yk> y).

Zk(n) Zustand des Ereignisprozesses an Tag k an Station n (Hidden-Markov- Modell).

(12)

d Niederschlagsschwellenwert. Tag t ist na wenn Ytd

m(t) =EWtnbedingt erwartete Niederschlagsmenge an Tag t, gegeben, Tag t ist

^mt na.=PNn=1wtn=NtMittel der Niederschlagsmengen an nassen Tagen t.

j Phase der j-ten Fourierfrequenz !j.

t= EYtn Erwartungswert der Niederschlagsmenge an Tag t in Jahr n.

ij Ubergangswahrscheinlichkeiten einer Markovkette: ij= P(Zk= jjZk ;1= = ( ij) i).Matrix der Ubergangswahrscheinlichkeiten einer Markovkette.

!j j-te Fourierfrequenz bei Anpassung einer Fouriersumme an Beob. x1:::xT:

!j = 2 j=T.

Bei Betrachtung eines stationaren Prozesses sind

(h) := VarYi(h)

(hk) := CovYi(h)Yi+k(h)

(h) = EYi(h)

(hk) := CorYi(h) Yi+k(h) WW(h) := PYi(h)> 0jYi;1(h)> 0 D D(h) := PYi(h)= 0jYi;1(h)= 0 D(h) := (h) := P(Yi(h)= 0)

(13)

C: Clustergroe

D: Abstand zwischen Clusterzentrum und Zellstart

L: Zelldauer

X: Zellintensitat

: 1= ist der Erwartungswert des Abstandes zwischen einem Clusterzentrum und dem Start einer Zelle des Clusters

: := ;

: 1= ist der Erwartungswert der Zelldauer : Intensitatsrate des Prozesses der Clusterzentren : Erwartungswert der Clustergroe

: 1= ist die erwartete Intensitat einer Zelle

~ := log

~ := log

~ := log

~ := log(;1)

~ := log

fi = fi() Momente des Niederschlagsmengenprozesses unter dem Modell

^fi: empirischer Schatzer von fi

~fi: Wert von fi unter einem geglatteten Parameterset (B1 bzw. B4) P(D )(i) P(W)(i): Wahrscheinlichkeiten eines trockenen bzw. nassen i-Runs P(D )(k+): Wahrscheinlichkeit eines trockenen Runs der Mindestlange k P(W)(k;): Wahrscheinlichkeit eines nassen Runs der Maximallange k Sf k := T1 Ptp(ft;ftk)^j 2

^

f

t

j , in der Parameterglattung verwendete Residuenquadratsumme.

Sk in der Parameterglattung verwendete Res.summe, z.B. Sk :=Pt(^t;tk)2 Xn(h) ~Xn(h) Maximum des h-Stunden-Niederschlages in Jahr n der beobachteten bzw. der

simulierten Daten.

F: zur Modelluberprufung verwendete Second-Order-Eigenschaften

P: zur Modellanpassung verwendete Second-Order-Eigenschaften

Set B1 Parameter des Neyman{Scott{Modelles, durch Modellanpassung an alle im Ab- stand von 6 Stunden beginnenden 30-Tages-Perioden entstanden

Set B4 Parameter des Neyman{Scott{Modelles, durch separate Modellanpassung an alle 30-Tages-Perioden mit Start um 0h, 6h, 12h, 18h und anschlieendes Zu- sammensetzen der Parametersets im Reiverschluverfahren entstanden

(14)

Einleitung

Viele menschliche Aktivitaten werden durch Niederschlage beeinut. Niederschlage besitzen eine fundamentale Bedeutung in der Landwirtschaft, sie mussen in der Planung urbaner Kanalisationssysteme berucksichtigt werden, ebenso in der Aus- wahl geeigneter Deponiestandorte fur Hausmull oder fur radioaktiven Mull. Aber auch neuere Modelle fur das Panzenwachstum berucksichtigen in starkerem Ma- e Art und Auftreten von Niederschlagen. Als Input-Variable wird Niederschlag in Niederschlags{Abu{Modellen fur Wasserstande von Flussen verwendet, die wie- derum fur die Konstruktion von Hochwasserschutzeinrichtungen benotigt werden.

Die verheerenden Hochwasser in diesem Jahr in Osteuropa oder in Bangladesh ver- deutlichen die Notwendigkeit verlalicher Modelle fur hydrologische Zwecke.

Die Modellierung von Niederschlagen ist ein Grenzgebiet, auf dem sich Hydrolo- gie, Meteorologie und Physik uberschneiden. Da die Beschreibung eines so kom- plexen Phanomenes durch deterministische Gesetze nahezu unmoglich ist, ist der Versuch einer stochastischen Modellierung naheliegend. Klimatische Daten, insbe- sondere solche die Niederschlage betre ende, werden schon lange auf der ganzen Welt gesammelt. Entsprechend wurde schon fruh versucht, die stochastische Natur des Phanomenes Regen zu beschreiben. Quetelet untersucht in einer 1852 vero ent- lichten Arbeit die Folge trockener und nasser Tage in Brussel und bemerkt dabei das Phanomen der Persistenz: Die Wahrscheinlichkeit, an einem Tag Regen zu erhalten, ist nach einem vorangegangenen Regentag groer als an einem beliebigen Tag (Katz 1984]). Wunschenswert in der stochastischen Beschreibung von Niederschlagen ist, grundlegende physikalische Strukturen zu identizieren und diese mit Hilfe eines Modelles zu beschreiben.

Ein Modell in diesem Sinne ist ein Mechanismus, mit dem kunstliche Niederschlags- daten generiert werden konnen, deren Eigenschaften denen der beobachteten Serie gleichen. Die Komplexitat des Phanomenes 'Regen' verhindert im allgemeinen, da alle Eigenschaften der Daten korrekt reproduziert werden, wenn das Modell nur ei- ne begrenzte Anzahl von Parametern verwendet. Hier wird der in der statistischen Modellierung stets notwendige Kompromi zwischen einer geringen Anzahl an Mo- dellparameternund einer geringen Abweichungdes Modelles von den Beobachtungen evident. Unter Verwendung einer hinreichend groen Anzahl an Modellparametern

(15)

dieses Modell wird aber kaum einen anderen Satz an Beobachtungen, beispiels- weise Niederschlagsmessungen eines anderen Zeitraumes oder einer benachbarten Mestation, angemessen beschreiben konnen. Eine wichtige Aufgabe eines Modelles besteht also in der Betonung relevanter Eigenschaften und damit einhergehend der Glattung der Beobachtungen. Folglich legt der Anwendungszweck des Modelles fest, welche der Eigenschaften des beobachteten Phanomenes beonders exakt wiederzu- geben sind. Mogliche Schwerpunkte sind die Niederschlagsmengen auf monatlicher Basis, die zeitliche Verteilung der Niederschlage oder die stundlichen Niederschlags- mengen. Mit einem geeigneten Modell lassen sich dann auch Fragen beantworten, die fur Aufgaben des Hoch- und Tiefbaus und fur versicherungstechnische Zwecke relevant, aber theoretisch nur schwierig zu klaren sind, zum Beispiel: ,,Wie gro ist die Wahrscheinlichkeit, da ein Sturm mit mehr als 40mm/Std. Niederschlag einmal im Jahr auftritt?" Zur Beantwortung werden mit dem angepaten Modell hinrei- chend viele Daten generiert und das Vorkommen der relevanten Ereignisse gezahlt.

Da Beobachtungen beliebig vieler Jahre erzeugt werden konnen, sind die mit einem guten Modell erhaltenen Antworten verlalicher als die aus einer moglicherweise nur geringen Anzahl beobachteter Jahre abgeleiteten.

Niederschlage sind meistens ussig und werden dann gewohnlich als Regen bezeich- net sie konnen aber als Schnee oder Hagel auch fest sein. Tau und Nebel werden als Spurenniederschlag bezeichnet.Wir werden 'Niederschlag'und 'Regen' synonym ver- wenden | wodurch o enbar wird, da die vorliegende Arbeit an einem schneearmen Ort erstellt worden ist. Niederschlagsmessungen sind oft fehlerbehaftet. Beispiels- weise konnen Inhomogenitaten der Daten auftreten, wenn eine Mestation ortlich verlagert wird oder in ihrer naheren Umgebung Gebaude entstehen. Wird die Ablese- zeit verlegt, konnen systematische Fehler ebenso entstehen wie bei der Verwendung eines anderen Megerates. Bei stark windigem Wetter wird die Niederschlagsmen- ge haug unterschatzt, wenn die Mestation nicht extra geschutzt wird (Yang et al. 1998]). Weitere systematische Fehler konnen durch die Art des Aufzeichnens oder des Ablesens der Niederschlagsmengen entstehen: Die Beobachtungen werden in digitaler oder analoger Form aufgezeichnet. Megerate mit analogem Aufzeich- nen der Beobachtungen auf einer sich drehenden Karte konnen die Anzahl der Tage mit geringer Niederschlagsmenge unterschatzen, falls die Spur des Bleistiftes geringe Veranderungen verbirgt. Mussen die Niederschlagsmengen von einem Menschen ab- gelesen werden, lat sich zeigen, da Vielfache von 0.05 Inch (1.25 mm) wesentlich hauger notiert werden als andere Werte (Woolhiser1992]).Yang et al. 1998]

zeigen, da eine Verringerung des Abstandes des Megerates vom Boden zu signi- kant hoheren Niederschlagsmewertenfuhrt. Ebenso fuhrt Schnee zu verzerrten Mes- sungen, wenn das Megerat nicht mit einer Heizmechanik und einem Schneekreuz ausgestattet ist. Diese praktischen Probleme beeinussen auch die Modellauswahl:

Es ist nicht sinnvoll, mit einem komplizierten Modell Niederschlage exakt zu be- schreiben, wenn die Schatzer der Modellparameter sensibel auf geringe Anderungen der Beobachtungen reagieren.

Niederschlag ist sowohl ein zeitliches als auch ein raumliches Phanomen, daher sind zur Beschreibung beider Strukturen Konzepte aus dem Bereich der mehrdimensio- nalen Zufallsvariablen notwendig. Einige stochastische Prozesse, wie der Poissonpro-

(16)

ze, lassen sich auf hohere Dimensionen erweitern, doch generell ist diese Verallge- meinerung nicht leicht. Beispielsweise basieren die oft zur Beschreibung zeitlicher Phanomene verwendeten Markovprozesse auf der Existenz einer naturlichen Ord- nungsrelation der Indexmenge,die in hoherdimensionalen Raumen nicht gegeben ist.

Glucklicherweise lassen sich die raumlich-zeitlichen Strukturen von Niederschlagen besser durch Clusterprozesse als durch mehrdimensionale Markovprozesse beschrei- ben. In dieser Arbeit werden wir zwar nur die zeitlicheVerteilung von Niederschlagen modellieren, das ausgewahlte Modell sollte sich aber in zukunftigen Untersuchungen zu einem raumlich{zeitlichen Modell erweitern lassen. Diese Bemerkungen sollen die sich bei der Modellierung ergebenden Schwierigkeiten nur andeuten.

Es gibt zwar eine breite Vielfalt stochastischer Modelle zur Beschreibung von Nie- derschlag, die meisten sind aber auf Datensatze aus Amerika, Afrika oder Asien angewendet worden. Die meisten Publikationen uber Niederschlag in Europa bezie- hen sich auf Datensatze aus Grobritannien. Messungen aus Deutschland werden bisher selten betrachtet. Anzahlsmaig dominieren die Modelle fur taglich gemes- senen Niederschlag uber die fur stundlich gemessenen, was sich aus der langeren Tradition taglich notierter Niederschlage erklart. Die technischen Fortschritte in der Entwicklung von Regenmessern, die in stundlichem Abstand die gefallene Regen- menge notieren oder sogar die exakten Zeitpunkte des Anfangs und des Endes eines Regenschauers sowie dessen Niederschlagsmenge, und die daraus resultierenden Da- tensatze, geben der Erforschung von Modellen fur hochaufgelosten Niederschlag neue Impulse. Die in der letzten Zeit am haugsten verwendeten Modelle zur Beschrei- bung stundlichen Niederschlages sind zweifelsohne die auf Clusterprozessen basie- renden. Sie sind elegante und physikalisch interpretierbare Modelle, die auerdem exibel sind und mit denen leicht kunstliche Daten erzeugt werden konnen. Aller- dings sind ihre theoretischen Eigenschaften nur unter der Annahme von Stationaritat bekannt, so da sie im allgemeinen separat an die Beobachtungen unterschiedlicher Saisonen angepat werden, innerhalb derer die jahreszeitlichen Veranderungen als vernachlassigbar gering betrachtet werden.

In dieser Arbeit wird der in der Niederschlagsmodellierung am haugsten verwende- te Clusterproze, namlich der Neyman{Scott{Clusterproze mit Rechteckzellen, zu einem Proze verallgemeinert, der Saisonschwankungen erklart. Die Vorgehensweise wird an einem 27 Jahre umfassenden Datensatz hochaufgeloster Niederschlagsmes- sungen aus Stuttgart demonstriert. Die Modellparameter werden als stetige Funk- tionen der Zeit betrachtet. Das Ziel besteht darin, die saisonale Variation der ersten und zweiten Momente des Niederschlagsmengenprozesses, also insbesondere des Er- wartungswertes, der Varianz und der Autokorrelationsstruktur, korrekt wiederzuge- ben. Dabei mu die Struktur der Momente bei einer Veranderung der Lange des Zeitintervalles, uber das der Niederschlag aggregiert wird, erhalten bleiben.

In Kapitel 2 geben wir einfuhrend einen Uberblick uber haug in der Modellierung von Niederschlag verwendete Punktprozesse, der nicht den Anspruch erhebt, eine vollstandige Einfuhrung in die Theorie der stochastischen Prozesse zu sein. Dazu konsultiere man Bauer 1991] oder Cox und Isham 1979]. In Kapitel 3 wird der vorliegende Datensatz beschrieben, bevor in Kapitel 4 an die taglichen Nie- derschlagsmengen ein Markovkettenmodell angepat. In Kapitel 5 schlielich wird

(17)

derschlagsmengen angepat. Im abschlieenden Kapitel 6wird die Validation des angepaten Modelles auf der Basis kunstlich erzeugter Daten durchgefuhrt.

Die in dieser Arbeit verwendete Notation orientiert sich an der in der gangigen Literatur ublichen. Gelegentlich wird auf mehrfache Indizes oder neue Variablenbe- zeichnungen verzichtet, wenn der Sinn eindeutig aus dem Kontext hervorgeht, um die Notation nicht unnotig kompliziertzu gestalten. Literatur wird durch den Namen des/der VerfasserIn und die Jahreszahl der Vero entlichung in eckigen Klammern zitiert, so da eine Zuordnung des Themas der Referenz erleichtert wird. Die sta- tistische Auswertung ist mit S-PLUS (Version 3.3) durchgefuhrt worden. Program- miert wurde in C unter Verwendung des Borland- und des gnu-Compilers. S-PLUS ist ein umfangreiches Software-Paket, so da beispielsweise Mittelwertberechnun- gen, Modellanpasungen oder Fast-Fourier-Transformationen durch einfache Befehle durchgefuhrt werden. Zur Vereinfachung der Datenanalyse habe ich zahlreiche S- PLUS-Funktionen erstellt, die ich nicht aufgelistet habe, da sie aus der Abfolge S-PLUS-eigener Befehle bestehen. Fur einige zentrale Punkte der Arbeit wie die Modellanpassung oder die Simulation kunstlicher Daten erstellte Routinen werden mit ihrem Quellcode gegeben. Dertypewriter-Font markiert Computerbefehle.

(18)

Stochastische Modelle der

zeitlichen Struktur von

Niederschlag

1 Stochastische Modellierung von Niederschlag

Die meistender nachfolgenden Modelle dienen der Beschreibungder zeitlichenStruk- tur von Niederschlag an einem Ort. Niederschlag ist eine teils diskrete, teils stetige Zufallsvariable. Entweder es regnet oder es regnet nicht, dieser sogenannte Ereig- nisproze wird durch eine 0{1{Zufallsvariable beschrieben. Regnet es, so ist die Niederschlagsmenge eine stetige Gr oe. Die Folge der Niederschlagsmengen wird als Mengenproze bezeichnet.

Damit treten in nat urlicher Weise zwei Folgen von Zufallsvariablen auf: Die eine z ahlt, in welchen und wievielen der Beobachtungsintervalle es geregnet hat. Die andere verbindet mit jedem nassen Intervall eine bestimmte Niederschlagsmenge.

Sind die Niederschlagsmengen in nassen Zeitintervallen unabh angig, so k onnen bei- de Prozesse separat modelliert werden. Bei t aglich akkumulierten Messungen ist das meistens m oglich, bei einer st undlichen Zeitskala allerdings nicht.

Es bietet sich an, die erste Folge, n amlich den Ereignisproze, durch einen Punkt- proze zu beschreiben, weil Punktprozesse stochastische Z ahlmae sind. Sie z ahlen die H augkeit zuf alliger Ereignisse Z. Im folgenden werden wir Punktprozesse kurz einf uhren.

Sei (EB) ein mebarer Raum, auf dem sich das zuf allige Ph anomen ereignet. Wir denken zur Darstellung temporaler Niederschl age an IR oder r aumlich-zeitlichenNie- derschlages anIR3jeweils mit der borelschen-AlgebraBder halboenen Intervalle.

(1.1) Denition.

Ein stochastischer ProzeN ist ein

Punktproze

auf (EB) genau dann, wenn er die folgenden Eigenschaften besitzt:

1. N() = 0.

(19)

3. N (ni=1Ai) =Pni=1N(Ai) f ur je endlich viele, disjunkte Mengen A1::: An2

B.

In der Modellierung von Niederschlag wird der Punktproze die Anzahl der Regen- ereignisse beschreiben. Ein Ereignis mu noch deniert werden. Einerseits kann der Anfangszeitpunkt t eines Regenschauers ein Punkt des Prozesses N sein. Ande- rerseits ist dieser bei zeitdiskreter Messung nicht beobachtbar. Deshalb kann bei t aglicher Messung ein nasser Tag als Punkt des Prozesses N gez ahlt werden, un- abh angig von der tats achlichen Anzahl der Regenschauer an diesem Tag. Betrachten wir zun achst t aglichen Regen Ykk2IN, sei die an Tag k beobachtete Niederschlags- menge. Wir denieren eine neue Folge fZkgk2IN von Zufallsvariablen

(1.2)

Zk(d) = 1(Yk > d) k 2IN d2IR+

1() bezeichne die Indikatorfunktion. Ist Zk(d) = 1, wird Tag k als nasser Tag be- zeichnet,istZk(d) = 0, wird von einemtrockenen Tag gesprochen. Der Schwellenwert d bestimmt, ob ein Tag als na oder trocken bezeichnet wird. Er sollte so gew ahlt werden, da Inhomogenit aten der Daten verschwinden,ohne da ein zu groer Anteil der Niederschlagsmenge vernachl assigt wird. Buishand 1977] verwendet zur Mo- dellierung von Beobachtungen aus den Niederlanden einen Schwellenwertvon 0.3mm Niederschlag pro Tag, um Tau oder Nebel auszuschlieen.Green1964] verwendet f ur Beobachtungen aus Tel Aviv zun achst einen Schwellenwert von 0.1mm, merkt aber an, da die Dierenz in der Anzahl der Tage, an denen mehr als 0.0mm, aber weniger als 0.1mm Niederschlag gefallen sei, vernachl assigbar gering sei, so da er schlielich einen Schwellenwert von 0.0mm verwendet. Der Proze extremer Ereig- nisse, das sind Niederschlagsereignisse mit einer hohen Intensit at, wird ebenso aus dem Na-Trocken-Proze durch Ausd unnen (thinning) erhalten, also auch durch einen geeigneten Schwellenwert. Zucchini und Adamson 1989] betrachten bei- spielsweise einen Tag, an dem mehr als 30 mm Niederschlag fallen, als einen Sturm.

Wir werden auch Zk statt Zk(d) schreiben, wenn Eindeutigkeit gegeben ist.

Mit N(t) := N((0t]) wird die Anzahl der Punkte im halboenen Intervall (0t]

bezeichnet. Damit ist f ur beliebige Interalle (ab]2IR+

(1.3)

N((ab]) =Zab dN(z) :

Die zweite Bedingung in (1.1) stellt sicher, daN((ab]) stets wohldeniert ist. Von einem ordentlichen Punktproze sprechen wir, wenn multiple Punkte mit Wahr- scheinlichkeit null auftreten. Unter Verwendung des Landauschen Symbolso() be- deutet das:

(1.4) Denition.

Ein Punktproze heit

ordentlich

, wenn

PN((tt + ]) > 1=o() 8t 2IR+: 2

(20)

Im folgenden bezeichnen wir den Punktproze in stetiger Zeit mit N(t) und den Punktproze in diskreter zeit mit NK. Die Anzahl der nassen Tage bis zum n-ten Tag erhalten wir durch einfaches Aufsummieren:

(1.5)

Nn :=N((0n]) = Xn

k=1Zk(d)k2IN :

Bei der Modellierung des Ereignisprozesses sind unterschiedlicheBetrachtungsweisen m oglich:

1. Der beobachtete Punktproze repr asentiert alle Punkte des Ereignisprozesses.

2. Der beobachtete Punktproze repr asentiert eine gelterte Stichprobe des tat- s achlichen Ereignisprozesses, in dem mehrere Punkte innerhalb eines Interval- les auftreten k onnen, von denen aber nur einer registriert wird.

Gem a der ersten Interpretation erh alt ein Punkt die Bedeutung eines nassen Tages oder allgemein eines nassen Intervalles. Punkte werden damit nur an Zeitpunkten notiert, die ganzzahlige Vielfacheder L ange des Beobachtungsintervalles sind. Damit liegt ein Punktproze in diskreter Zeit vor. Wird trotzdem ein Proze in stetiger Zeit angepat, und werden die Parameter direkt aus den Beobachtungen gesch atzt, so sind die Parametersch atzer nicht erwartungstreu, vergl. Abschnitt 10. Insbesondere bei der Beurteilung des Clusterverhaltens des Prozesses werden Fehler begangen.

Mit den Auswirkungen der Diskretisierung haben sichFoufoula-Georgiou und Guttorp 1986] und Foufoula-Georgiou und Lettenmaier 1986] befat.

Sie haben gezeigt, da sogar bei Aggregation zu 15-min utigen Beobachtungen In- formation verloren wird.

Wird die zweiteInterpretation gew ahlt, k onnen die Parameterdes vermutetenPunkt- prozesses nicht direkt aus dem beobachteten Ereignisproze gesch atzt werden. In diesem Fall wird aus dem aggregierten Mengenproze auf den nicht beobachteten Ereignisproze in stetiger Zeit geschlossen, vergl. Rodriguez-Iturbe, Waymire und Gupta 1984]. Wird den Modellparametern physikalische Bedeutung beige- messen, sollte das resultierende Modell des Ereignisprozesses mit unterschiedlichen Zeiteinteilungen kompatibel sein.

Uber 24 Stunden aggregierte Beobachtungen werden als t aglicher Regen bezeichnet.

Die Wahl des Zeitpunktes, an dem ein neuer Tag in diesem Sinne beginnt, ist nicht unerheblich: Regnet es in einer Gegend gew ohnlich am fr uhen Morgen und wird die Niederschlagsmenge der letzten 24 Stunden erst am Abend abgelesen, kann ein Teil des Niederschlages schon verdunstet sein. Liegt hingegen der Ablesezeitpunkt vor dem Einsetzen der gr oten Hitze, aber nachdem es geregnet hat, so wird nur wenig verdunstet sein und die beobachteten Mengen werden regelm aig gr oer als im ersten Fall sein. Im folgenden werden zun achst t aglich, also diskret gemessene Daten betrachtet, Clusterprozesse und ARMA-Modelle werden auch auf st undliche Daten angewendet. Die Niederschlagsmenge an Tagk wird mit Yk bezeichnet, die 0- 1-VariableZk(d) beschreibt, ob an Tag k mindestens einmal geregnet hat und dabei

(21)

istNn = nk=1Zk. Die Wartezeit ab einem Zeitpunktt = 0 oder k = 0 auf den n-ten Punkt seiTn, die VerweildauerUn zwischen dem (n;1)-ten und demn-ten Punkt istUn=Tn;Tn;1,U1 =T1 beschreibt die Wartezeit auf den ersten Punkt.

2 Poissonprozesse

In einem station aren Proze wird man sinnvollerweise zun achst untersuchen, ob die Inkremente Nn;Nn;1 des Ereignisprozesses unabh angig sind. Sind die Zufallsva- riablenZk unabh angig und identisch verteilt mit P(Zk = 1) =p und P(Zk = 0) = q = 1;p, so ist Nn binomialverteilt mit Parameternn und p. Die Wahrscheinlich- keitsfunktion lautet also

(2.1)

P(Nn =k) =

n k

!

pkqn;k 0 k n :

Der Binomialproze ist in der Modellierung von Regenfall nur wenig verwendet wurden (auer von Foufoula-Georgiou und Lettenmaier 1986]), sein Ge- genst uck in stetiger Zeit, der Poissonproze, daf ur um so h auger. Zur Beschreibung des Ereignisprozesses t aglichen Regens werden haupts achlich Prozesse in stetiger Zeit, also mit stetigem Parameterraum, angepat, vermutlich wegen der gr oeren Auswahl an Prozessen mit weit entwickelter Theorie. Der Ubergang von einem dis- kreten zu einem stetigen Parameterraum erfolgt in kanonischer Weise durch Einbet- tung von ZZ IR. Liegen uber einen bestimmten Zeitraum aggregierte Daten vor, so entstehen keine Schwierigkeiten: Ein Ereignis an Tag k ist weiterhin ein Punkt Zk = 1. Allgemeinaber ist Regen kein nur einen Moment dauerndes Ereignis stetige Messungen verursachen deshalb uberabz ahlbar viele Punkte in einem abgeschlosse- nen Intervall, so da nicht mehr von einem Punktproze gesprochen werden kann.

Diese Schwierigkeit wird h aug umgangen, indem den Regenereignissen eine insi- gnikante L ange zugewiesen wird. Es ist auch m oglich, den Anfangszeitpunkt des Regens als Punkt des Z ahlprozesses zu betrachten. Um keine Information zu ver- lieren, sollte in diesem Fall mit jedem Punkt ein Zeiger assoziiert werden, der die Dauer des Regenschauers beschreibt.

Der Ubergang von einem diskreten Parameterraum zu einem stetigen Parameter- raum f uhrt bekanntlich vom Binomialproze zum Poissonproze. Der Poissonproze ist durch zuf allige Ereignisse charakterisiert, die sich unabh angig voneinander mit einer mittleren Rate ereignen. Wir denieren gem aBauer1991]:

(2.2) Denition.

Ein Punktproze N ist ein homogener

Poissonproze

zum Parameter > 0 genau dann, wenn gilt:

(a) Der Proze besitzt station are und unabh angige Zuw achse (N(t) ; N(s)), wobei f ur 0 s t st2IR+ gilt:

(22)

(N(t);N(s)) Po((t;s)) :

(b) Fast alle Pfade !7!N(t)(!) sind rechtsseitig stetige, isotone Funktionen mit Spr ungen der Gr oe 1.

(2.3) Denition.

Ein PunktprozefNtgt2IR+ wird als homogen bezeichnet, wenn die Parameter des Prozesses konstant sind.

(2.4) Bemerkung.

Ein homogener Poissonproze N mit Rate besitzt die fol- genden grundlegenden Eigenschaften:

(a) Die Erwartungswert-Zeit-Funktion EN(t) erf ullt EN(t) = t.

(b) Der Dispersionsindex I(t) = VarN(t)= EN(t) erf ullt: I(t) = 1.

(c) Das Nullwahrscheinlichkeitsfunktional P(N(A) = 0) bzw. P(N(t) = 0) f ur beliebige Intervalle A bzw. f ur (0t] erf ullt P(N(A) = 0) = exp(;jAj) bzw.

P(N(t) = 0) = exp(;t). Dabei bezeichnetjAj das Lebesgue-Ma von A.

(d) Die VerweildauernUn sind unabh angig und identisch exp()-verteilt mit Er- wartungswert EUn = 1=, n 2 IN. Insbesondere ist die Wartezeit auf den ersten Punkt genauso verteilt wie die Wartezeit zwischen zwei aufeinanderfol- genden Punkten.

(e) Der Variationskoezient der Verweildauern CV (Un) = pVarUn= EUn erf ullt CV (Un) = 1 n2IN.

Eine Erweiterung des Poissonprozesses erhalten wir, wenn wir die Ereignisrate = (s) als zeitabh angige, deterministische Funktion betrachten:

P(N(t) = n) = e;(t)(t)n=n! n2IN0 mit

(t) =Z t

0

(s)ds :

Dieser Proze wird als nichthomogener Poissonproze bezeichnet. Er ist ein Spezial- fall eines Punktprozesses, dessen Ereignisrate (Intensit atsrate) (t) nicht nur eine deterministische Funktion, sondern ein stochastischer Proze ist. Letztere Prozesse f uhrte Cox 1955 unter der Bezeichnung doppelt stochastische Poissonprozesse ein, heute werden sie jedoch meist nach ihrem Ernder als Cox-Prozesse bezeichnet.

Sei(t) ein nichtnegativer stochastischer Proze, t 0. Sei (A) = RA(u)du f ur mebare Mengen A sowie (t) = R0t(u)du, du bezeichne das Lebesgue-Ma auf IR.

(2.5) Denition.

Ein Punktproze N(t) ist ein

Cox-Proze

mit Intensit atspro- ze (t) > 0, wenn gilt:

(23)

N(An) bedingt unabh angig bei gegebenem .

(b) Die bedingte Verteilung von N(A), gegeben , ist f ur alle mebaren Mengen A poissonverteilt mit Parameter (A): 80 k 2ZZ

P(N(A) = kj) = exp(;(A))(A)k=k! :

Der Intensit atsproze kann als stochastischer klimatologischer Proze interpretiert werden, der die Neigung zu Regen beschreibt (Smith 1987]).

Bei einem Poissonproze mit Parameter ist die Folge der Wartezeiten zwischen zwei Ereignissen unabh angig identisch exponentialverteilt mit Erwartungswert 1=.

Wird nur angenommen, die Folge der Wartezeiten sei unabh angig und identisch verteilt, erhalten wir einen Erneuerungsproze und damit eine Verallgemeinerung des Poissonprozesses.

Wird der Ereignisproze t aglichen Regens als Poissonproze modelliert, wird den Punkten eine insignikante L ange zugewiesen. Tats achlich betr agt die durchschnitt- liche Dauer einer nassen Phase in dem dieser Arbeit zugrundeliegenden Datensatz aber etwa 100 Minuten, so da diese Annahme nicht sinnvoll ist.

Werden Niederschl age in stetiger Zeit aufgezeichnet und die Anfangszeitpunkte eines Regenschauers als Poissonproze modelliert,so kann leicht gleichzeitig die Dauer der Regenereignisse beschrieben werden. Wir gelangen zu

Poisson-Rechteckimpuls- modellen

. Sie sind markierte Punktprozesse, deren Punkte gem a einem Poisson- proze mit Rate auftreten. Ein Punkt zur Zeit Tn repr asentiert die Anfangszeit des n-ten Regenereignisses. Mit ihm wird ein Rechteckimpuls (tnin) verbunden,tn

mit die Dauer undin die Intensit at des Ereignisses. Intensit at bedeutet Regen pro Zeiteinheit und wird in mm/Tag] oder mm/Stunde] gemessen (vergl.Rodriguez- Iturbe et al. 1984], Bacchi et al. 1994]). Das einfachste Modell nimmt an, alle (tnin) seien unabh angig identisch verteilte Zufallsvariablen und tn und in seien ebenfalls unabh angig. Als Marginalverteilungen der tn und in werden h aug aus Gr unden der mathematischen Einfachheit Exponentialverteilungen gew ahlt. Rege- nereignisse mit hoher Intensit at werden so nicht angemessen beschrieben, da bei ihnen Intensit at und Dauer oft negativ korreliert sind. Bacchi et al. 1994] ver- wenden zur Beschreibung von Beobachtungen aus Norditalien (Valtellina, Milano, Firenze) eine bivariate Exponentialverteilung, bei der tn und in negativ korreliert sind. Die gesch atzte Korrelation betr agt r =;0:4.

Insbesondere bei extremen Ereignissen, die durch eine hohe Gesamtniederschlags- menge deniert werden, scheint die Annahme der Unabh angigkeit der Ereignisse voneinander gerechtfertigt zu sein, vergl.Bacchi. et al. 1994].

3 Markovketten

Die Annahme unabh angiger Inkremente des Z ahlprozesses bei t aglichem Nieder- schlag ist zur Beschreibung von Niederschlagsprozessen meistens unzutreend. Da-

(24)

Skizze zum Poisson-Rechteckimpulsmodell

Tn;1

in;1

tn;1

Tn

tn

in

Un

Tn: Startzeit des n-ten Ereignisses Un :=Tn;Tn;1 Wartezeit

mit werden wir zu Prozessen gef uhrt, in denen die Inkremente stochastisch abh angig sind. Die beliebteste Modikation ist die Annahme, die Folge derZk bilde einen Mar- kovproze mitdiskretemParameterraum,also eine Markovkette,und zwei m oglichen Zust anden 0 und 1. Wir betrachten ausschlielich Markovketten mit zwei Zust anden.

In einer Markovkette h angt die Wahrscheinlichkeit, an einem Tag k Regen zu beob- achten, nur vom Zustand des vorhergehenden Tages ab:

P(Zk =ijZk;1Zk;2:::) = P(Zk =ijZk;1):

Die Struktur einer Markovkette ist eindeutig durch die Matrix der Ubergangs- wahrscheinlichkeiten bestimmt,

:=

00 01 10 11

!

mit ij := P(Zk = jjZk;1 = i). Wir m ussen 01 und 11 sch atzen. Oenbar gilt 00+01= 1 und 10+11= 1, da mit Sicherheit einer der beiden Zust ande 0 oder 1 auf einen vorhergehenden Zustand folgt.

Diese Darstellung impliziert, da die Ubergangswahrscheinlichkeiten zeitinvariant sind, also ein homogener Proze im Sinne von (2.3) vorliegt. Sie impliziert auerdem Abh angigkeit nur vom letzten vorhergehenden Zeitpunkt. Eine Verallgemeinerung ist leicht m oglich: Mit = (k) ij(k) = P(Zk =jjZk;1 =i)k = 1:::K k onnen saisonale Schwankungen ber ucksichtigt werden. Es istk = 1:::K, wobei K = 365, wenn ein gesamtes Jahr beobachtet worden ist. Eine Markovkette h oherer Ordnung m2 wird durch

im:::i1i0(k) := P(Zk =i0jZk;1 =i1:::Zk;m =im)

beschrieben. Ist die Markovkette ein Punktproze, wie in unserem Fall t aglichen Regens, so gilt i0i1:::im 2 f01g. Die Wahrscheinlichkeiten im:::i1i0(k) m ussen oensichtliche Eigenschaften erf ullen wie z.B.

im:::i10(k) + im:::i11(k) = 1 f ur alle k = 1:::K ij2f01g:

(25)

^ij(k) := #fBeobachtete Tage k mit Zk;1 =i Zk =jg

#fBeobachtete Tage (k;1) mit Zk;1 =ig

sofern der Nenner ungleich null ist, sonst ist dieser Sch atzer nicht deniert. Damit ist die Anzahl der Ereignisse (Zk;1 =i Zk =j) in N beobachteten Jahren eine bi- nomialverteilte Zufallsvariable mit Erfolgswahrscheinlichkeitij(k). Die Anzahl der Versuche ist die Anzahl der Ereignisse (Zk;1 = i). Ohne zus atzliche Restriktionen ist die Sch atzung der Ubergangswahrscheinlichkeiten sinnlos, da zu jedem Datum zwei Parameter gesch atzt werden m ussen. Hier mu der Raum der Abbildungen

01 : f12:::Kg;!01] k 7;!01(k) 11 : f12:::Kg;!01] k 7;!01(k):

eingeschr ankt werden. Dazu bieten sich vielf altige M oglichkeiten, wie beispielswei- se Gl attung unter apriori bekannter Eigenschaften. Physikalisch plausibel sind nur Parameter, die sich im Zeitverlauf stetig und zyklisch andern mit einer Periode von einem Jahr. Daher ist eine Beschreibung durch eine Fouriersumme naheliegend. We- gen der Restriktion 0 < ij(k) < 1 bietet es sich an, nicht ij(k)k = 1:::K, sondern logit(ij(k)) durch eine Fouriersumme mit L < T Frequenzen zu modellie- ren, wobei

logit(ij(k)) = log

ij(k) 1;ij(k)

!

:

Weil die Binomialverteilung zur Exponentialfamiliegeh ort, stehen bei diesem Vorge- hen die Sch atzverfahren der verallgemeinertenlinearen Modelle (vergl.McCullagh

und Nelder1989]) zur Verf ugung. Die Anzahl K der anzupassenden Fourierfre- quenzen wird mit einem Modellauswahlkriterium bestimmt. Diese Vorgehensweise ist in Kapitel 4.1 ausf uhrlich beschrieben.Zucchini und Adamson 1984] haben t aglichen Regen in S udafrika auf diese Art modelliert,Stern und Coe1984] t agli- chen Regen in Jordanien und Tansania. Katz und Parlange1995] modellieren auch st undlichen Regen mit einer Markovkette 1. Ordnung. Mit der Auswahl der Ordnung der Markovkette haben sich u.a.Tong 1975] und Katz 1981] befat.

Eine Variante des Markovkettenmodelles haben Roldan und Woolhiser1982]

im Rahmen alternierender Erneuerungsprozesse (vergl. Abschnitt 5) betrachtet. Ei- ne weitere M oglichkeit, markovsche Abh angigkeitsstrukturen zu integrieren, besteht darin, die Folge der nassen und trockenen Tage als Bernoulli-Proze mit rando- misierter Erfolgswahrscheinlichkeit darzustellen, wobei die Folge der Erfolgswahr- scheinlichkeiten eine Markovkette bildet. Ein solcher Proze ist ein Hidden-Markov- Modell.

(26)

4 Hidden{Markov{Modelle

Das Analogon eines Cox-Prozesses in diskreter Zeit ist ein Bernoulli{Proze mit randomisierten Erfolgswahrscheinlichkeiten. In einem Hidden{Markov{Modell folgt ein nicht beobachtbarer Proze einer Markovkette mit endlichem Zustandsraum, w ahrend die Verteilung der Beobachtungen an einem beliebigem Zeitpunkt nur vom Zustand der Markovkette an diesem Zeitpunkt abh angt. Solche Modelle werden als Hidden{Markov{Modell bezeichnet.Zucchini und Guttorp1991] haben sie zur Beschreibung der zeitlich{r aumlichen Verteilung von t aglichem Niederschlag in den USA verwendet. In diesem Modell folgen die Zust ande eines nicht beobachtbaren klimatologischen Prozesses einer Markovkette. Sie bestimmen die Wahrscheinlich- keit, an einem Tag Niederschlag zu erhalten. Die r aumlich{zeitliche Verteilung des Niederschlages ist bedingt unabh angig bei gegebenem klimatologischem Proze.

Der klimatologische Proze fCkgk2IN sei eine station are Markovkette mit M m ogli- chen Zust anden und Ubergangswahrscheinlichkeiten

ij = P(Ck =jjCk;1 =i) ij = 1:::M:

Ck ist der Zustand des klimatologischen Prozesses an Tagk, der aber nicht beobach- tet werden kann. Der Ereignisproze sei fZk(n)gkn2IN, k = 1:::K n = 1:::N, wobei

Zk(n)=

( 1 es regnet an Tag k an Station n 0 sonst.

Die Wahrscheinlichkeit, an einem Tag Regen zu erhalten, ist damit f ur alle Sta- tionen gleich bei gegebenemCk. Um die Wahrscheinlichkeiten der m oglichen Wer- te Zk := (Zk(1):::Zk(N)) auf kompakte Weise zu beschreiben, verwenden Zucchi- ni und Guttorp die Dezimaldarstellung ~Zk der bin aren Zahl Zk, welche die Werte 012:::L = 2N ;1 annehmen kann. Die bedingte Wahrscheinlichkeiten

P( ~Zk =ljCk =m) = lm

k onnen jetzt als ((L + 1)M)-Matrix dargestellt werden.

Zucchini und Guttorp leiten Eigenschaften des so denierten Hidden{Markov{Pro- zesses her, unter anderem die Likelihood-Funktion von ~Zk, so da die Modellpa- rameter mit der Maximum-Likelihood-Methode gesch atzt werden k onnen, was ein Vorzug gegen uber vielen anderen Modellen ist. Hidden{Markov{Modelle und ihre Eigenschaften werden ausf uhrlich in MacDonald und Zucchini 1997] beschrie- ben.

Das Hidden{Markov{Modell kann physikalisch interpretiert werden, indem die Zu- st ande von Ck als ,,Tendenz zu Regen" betrachtet werden. Es schliet als Spezialf alle Markovkettenprozesse und Bernoulliprozesse ein. Wird nur eine Station betrachtet

(27)

Prozesses gleich, so liegt ein Bernoulliproze vor. Kann der klimatologische Proze zwei Zust ande annehmen, von denen der eine mit einem trockenen Tag, der andere mit einem nassen Tag assoziiert wird, liegt eine Markovkette vor. Letzteres bedeutet P(Zk = 1jCk = 1) = 1 P(Zk = 0jCk = 0) = 1. Eine Anpassung eines Hidden- Markov-Modelles an den in dieser Arbeit analysierten Datensatz f uhrte zu einem Hidden-Markov-Modell, das einer Markovkette sehr ahnlich war. Der zus atzliche kompliziertere theoretische Modellaufbau sowie die aufwendigere Modellanpassung waren f ur diesen Datensatz also nicht gerechtfertigt, weshalb die Ergebnisse der Modellanpassung nicht dargestellt werden.

Ein Nachteil des r aumlich-zeitlichen Modelles f ur n > 1 Stationen, auf den Zuc- chini und Guttorp 1991] hinweisen, besteht in der geforderten Unabh angigkeit der Stationen. F ur weit entfernte Stationen sei es einerseits nicht plausibel, eine ein- heitliche ,,Growetterlage" anzunehmen. Andererseits sei es unplausibel, f ur nahe gelegene Stationen Unabh angigkeit anzunehmen. Die Interpretation von fCkgk2IN

als klimatologischen Proze ist daher fragw urdig. Zucchini und Guttorp 1991]

geben Ausblicke auf m ogliche Erweiterungen des Modelles, die Kovariablen wie den Abstand einer Station zu anderen Stationen ber ucksichtigen k onnen.

Smith1987] entwickelt ein Modell zur Beschreibung t aglichen Regenfalles, das auf einer nichtbeobachteten Markovkettemitzwei Zust anden basiert, von denen der eine trockenes Wetter impliziert. Dieses Modell ber ucksichtigt saisonale Schwankungen verm oge zeitabh angiger Parameter. Smith bezeichnet es als

Markov-Bernoulli- Modell

. Im Markov{Bernoulli{Modell ist eine (nicht-homogene) Markovkette Ck, k 2IN, mit Zustandsraum f01g gegeben, die einen nicht beobachtbaren, klimato- logischen Proze beschreibt. Die Punkte Zkk 2 IN, des Prozesses sind Bernoulli{

Variablen mit randomisierter ErfolgswahrscheinlichkeitXk, wobei Xk :=p(k)Ck k2IN

mit einer Abbildung p : IN ;! 01]. Die Erfolgswahrscheinlichkeiten sind also 0 oder p(k). Das f uhrt zur folgenden Denition:

(4.1) Denition.

Der Punktproze fZkgk2IN ist ein

Markov-Bernoulli-Modell

mit Parameternpq0undq1, wenn f ur alle n2IN und alle (z1:::zn) mitzi 2f01g gilt:

P(ZK =zk:::Z1 =z1jXkk = 1:::K)

= YK

k=1 P(Zk =zkjXk)

= YK

k=1zkXk + (1;zk)(1;Xk) ]: Der Wert vonZk h angt also nur von Xk ab.

(28)

Sind die Parameter konstant im Zeitverlauf, ist dieses Modell der Spezialfall des Hidden-Markov-Modelles f ur eine Station, in dem Ck 2f01gf ur alle k und P(Zk = 1jCk = 0) = 0. In der Notation aus Zucchini und Guttorp 1991] ist

=

1 0

p(k) 1;p(k)

!

:

Die Parameter des Markov-Bernoulli-Modelles k onnen ebenfalls mit der Maximum- Likelihood-Methode gesch atzt werden (Smith 1987]). Eine wichtige Eigenschaft der Klasse der Markov-Bernoulli-Prozesse ist, da sie abgeschlossen unter zuf alligem Ausd unnen ist.

(4.2) Denition.

Eine

p-Ausdunnung

eines PunktprozessesfZkg ist ein Proze

~Zk :=XkZk

wobeifXkgk2IN ein Bernoulliproze mit Erfolgswahrscheinlichkeitp ist. Die Punkte vonZk werden also mit Wahrscheinlichkeitp in den Proze ~Zk ubernommen und mit Wahrscheinlichkeit 1;p ausgelassen. Die Einf uhrung eines Mindestniederschlags- wertes, ab dessen Uberschreitung ein Tag als na betrachtet wird oder durch die ein Sturm deniert wird, ist eine p-Ausd unnung.

Smith 1987] entwickelt aufbauend auf dem Markov-Bernoulli-Proze auch einen Clusterproze mit diskretem Parameterraum, vergl. Abschnitt 7.

5 Alternierende Erneuerungsprozesse

Erneuerungsprozesse legen das Augenmerk auf die Wartezeit zwischen zwei Ereig- nissen. Sind diese Wartezeiten unabh angig und identisch verteilte Zufallsvariablen, liegt ein Erneuerungsproze vor.

Eine Verallgemeinerung erhalten wir, wenn in einem station aren Proze zwei Arten von Ereignissen betrachtet werden, die abwechselnd aufeinanderfolgen. Die Warte- zeit von einem Ereignis bis zu einem Ereignis vom Typ 1 sei eine Zufallsvariable U, die bis zu einem Ereignis vom Typ 2 sei eine Zufallsvariable ~U. Sind die Folgen (Un)n2IN und ( ~Un)n2IN unabh angig voneinander und sind die Elemente beider Fol- gen unabh angig und identisch gem a F bzw. ~F verteilt, so sprechen wir von einem alternierenden Erneuerungsproze.

Bezogen auf die Modellierung t aglichen Regens denken wir uns ein Ereignis vom Typ 1 als den Beginn eines nassen Intervalles und ein Ereignis vom Typ 2 als den Beginn eines trockenen Intervalles. Bei t aglichem Regen wird ein trockenes Intervall der L ange n deniert als n aufeinanderfolgende trockene Tage, die an jeder Seite durch mindestens einen nassen Tag begrenzt werden. Ein nasses Intervall ist analog deniert.

(29)

von Roldan und Woolhiser 1982] zur Beschreibung der L ange trockener und nasser Intervalle verwendet worden. Die Arbeit Buishands ist die erste, in der Er- neuerungsprozesse erfolgreich an Beobachtungen aus klimatisch so unterschiedlichen Gegenden wie den Niederlanden, Agypten, Indien und dem Sudan angepat worden sind. Seine Arbeit ist zudem die ausf uhrlichste der drei genannten Arbeiten.

Die L ange der Intervalle modelliert Buishand mittels einer negativen Binomialver- teilung, die eine Verallgemeinerung der geometrischen Verteilung ist. Geometrisch verteilte Verweildauern treten beispielsweise in station aren Markovketten mit zwei m oglichen Zust anden f01g auf. Bezeichnet ij = P(Zk = jjZk;1 = i) die Uber- gangswahrscheinlichkeit von i zu j, so ist die L ange L0 eines trockenen Intervalles bedingt geometrisch verteilt mit Parameter 00 bei gegebenem erstem trockenem Tag Z1 = 0:

P(L0 =n)

= P(Zk+1 = 1Zk = 0:::Z1 = 0)

= P(Zk+1 = 1jZk = 0:::Z1 = 0) P(Zk = 0:::Z1 = 0)

= P(Zk+1 = 1jZk = 0) P(Zk = 0:::Z1 = 0)

=

= P(Zk+1 = 1jZk = 0) P(Zk = 0jZk;1 = 0)::: P(Z2 = 0jZ1 = 0)

= k00;101

= k00;1(1;00)

f ur n2IN. Analog ist die L ange L1 eines nassen Intervalles geometrisch verteilt mit Parameter11.

Da negativ binomialverteilte Zufallsvariable den Wert 0 annehmen k onnen, Inter- vall angen L aber stets strikt positiv sind, mu die negative Binomialverteilung in dieser Anwendung verschoben oder abgeschnitten werden. Mit ~L werde die neue Zufallsvariable bezeichnet. Es ergeben sich folgende Verteilungen:

1) Die verschobene negative Binomialverteilung:

P(L0 =n) = P(~L0 =n + 1) =

n + r n + 1

!

00r;1(1;00)n+1 wobei ~L0 negativ binomialverteilt ist undn > 0 .

2) Die abgeschnittene (truncated) negative Binomialverteilung P(L0 =n) = P(~L0 =nj~L0 1) =

n + r;1 n

!00r (1;00)n

1;00r r > 1 :

Referenzen

ÄHNLICHE DOKUMENTE

Achtung: sobald ein Axiom nicht erf¨ ullt ist, kann man schliessen, dass es sich nicht um einen Vektorraum handelt.

Wegen Eindeutigkeit von L¨ osungen des Anfangswertproblems kann eine L¨ osung dieser Gleichung nur in einem gegebenen Punkt t ∈ J verschwinden, wenn sie auch ¨ uberall ver-

(c) bestimme, wie viele Sekunden vor Beginn des Experiment der K¨ orper frei fallengelassen wurde, um die berechnete Anfangsgeschwindigkeit erreichen zu k¨ onnen.. Stelle

Zeigen Sie, dass die Anzahl der Rechenschritte des Cholesky-Verfahrens f¨ ur die Zer- legung einer n × n -Matrix f¨ ur große n etwa 1 6 n 3 Rechenschritte und n Wurzelop-

” 6“ bei einem bestimmten W¨ urfel zu sch¨ atzen, wurde 10-mal solange gew¨ urfelt, bis zum ersten Mal eine.. ” 6“ gefallen war, und die Anzahl der vorangegangenen (Fehl-)W¨

UBUNGSAUFGABEN ¨ Mathematik f¨ ur Wirtschaftsingenieure und -informatiker. SERIE 14

(a) Zuerst f¨ uhrte er den Strahl durch gleichm¨ aßige gekreuzte elektrische und magneti- sche Felder, E und B (gegenseitig und beide senkrecht zum Strahl) und justierte das

(b) Das Band werde nun von einer anf¨ anglichen L¨ ange L 0 und Temperatur T 0 auf adiabatische und reversible Weise auf eine finale L¨ ange L 1 gedehnt.. Berechnen Sie die