Zeitreihenanalyse
H.P. Nachtnebel
Institut für Wasserwirtschaft, Hydrologie und konstruktiver Wasserbau
Ziel
Aus der statistischen Analyse von Beobachtungen in der Zeit (Zeitreihen) lassen sich kennzeichnende Parameter ableiten, die für Bemessungen, den Betrieb von
wasserwirtschaftlichen Einrichtungen (Speichern,..), Prognosen herangezogen werden können
Sehr oft wird voraus gesetzt: Die Eigenschaften sind in Vergangenheit und Zukunft gleich (Stationärität)
zeitunabhängigem Mittelwert
zeitunabhängiger Streuung
zeitunabhängiger Kovarianz.
Methoden
Klassische Zeitreihenanalyse durch Schätzung der Komponenten X
T,X
Pund X
R ARMA, ARIMA, SARIMA Modelle
Nach Identifikation können durch Simulation
neue gleichwahrscheinliche Reihen generiert
werden
Definitionen und Anwendung
Definition Zeitreihe
• zeitliche Abfolge von Messwerten, deren Auftreten statistischen Gesetzmäßigkeiten unterliegt
Anwendung: Zeitreihenanalyse und -synthese
• Für die Dimensionierung, die Beurteilung der Zuverlässigkeit von Systemen und die Vorhersage werden ZR.A. und Simulationen angewandt
Art der Messwerte
• Kontinuierlich
Schreiber
• Diskret
Terminwerte
Mittelwerte einer Zeitspanne
) (t X
) ( i
i t
X
Darstellung: Ganglinien
kontinuierlich
diskret
Methodik
Zeitreihenanalyse
Zerlegung in wesentliche Anteile und quantitative Beschreibung
Trend …
Beispiel: Rückläufige Abflüsse südlich des Alpenhauptkamms
Periode ...
Beispiel: in Ö die Frühjahrshochwässer
Stochastischer Anteil …
) (t X
T) (t X
P) (t XR
) ( )
( )
( )
( t X t X T X t
X
T
P
RMethodik
Zweck der Zeitreihenanalyse
Ermittlung der einzelnen Anteile
Parametrisierung des Informationsgehaltes in einer Zeitreihe
Simulation (Generierung)
• Dann können Reihen generiert werden, die den gleichen Informationsgehalt (gleiche Auftrittswahrscheinlichkeit) wie beobachtete Reihe haben
Homogenität / Stationärität
Homogenität
• Unterteilung einer Reihe in Teilreihen
• Bestimmen der Parameter
Mittelwert
Varianz
Schiefe
• Parameter der Teilreihen weichen nicht signifikant
voneinander ab dieselbe Grundgesamtheit Homogen
Stationärität
• Mittelwerte von Teilabschnitten weichen nicht signifikant voneinander ab Stationärität 1. Ordnung
• Mittelwerte und Kovarianz von Teilabschnitten weichen nicht
Beispiel für Trendanalyse:
Extreme Niederschlagsereignisse in Wien
Zahl der Tage mit mehr als 30 mm Niederschlag in Wien Reihe 1961 - 2001
2
0 1
0 4
1
0 1 1
2 3
1 3
1 2
0 2
0 1
2
0 0 2
1 1 2
1
0 2
0 4
3
0
2 2 2 5
4
2 2
0 0
1 2 3 4 5 6
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Jahr
Tage
(Rudel, ZAMG 2002)
Ja !!!!
Beispiel für Trendanalyse:
Extreme Niederschlagsereignisse in Wien
Zahl der Tage mit mehr als 30 mm Niederschlag in Wien Reihe 1903 - 2001
3
2
1 2
3
1 2
3
1 5
1 3
44
00 22
3 3
0 2
4
2
1
0 2
4
2
1 1 2
1 3 3
4
22 5
22 3
0 11
00 44
0 22 2
11 3
5
0 2
0 1
0 4
1
0 11
2 3
1 3
1 2
0 2
0 1
2
00 2
1 1 2
1
0 2
0 4
3
0 22 2
5
4
2 2
0 0
1 2 3 4 5 6
1903 1905 1907 1909 1911 1913 1915 1917 1919 1921 1923 1925 1927 1929 1931 1933 1935 1937 1939 1941 1943 1945 1947 1949 1951 1953 1955 1957 1959 1961 1963 1965 1967 1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001
Jahr
Tage
Nein !!!!
Trends in Niederschlag und Abfluss
Moser et al., 2003
Annual precipitation
Abfluss
Schätzung Trendanteil X T (t) 1
Annahme
• Linearer Trend
Schätzung von A und B durch Regressionsrechnung XT(t)= A + B t
Trendanteil X T (t) 2
Annahme
• Nichtlineares Verhalten
Beispiel: Nachfragefunktion – zuerst stark ansteigend mit anschließender Sättigung
• Sprungstellen
X(t)
t
x
II*
2* )
( t A B t C t
X
T
Trends in der Streuung
Trendeliminierung
X‘(t) = X(t)-X
T(t) = X
P(t)+X
R(t)
Oder nicht parametrisch durch numerisches Differenzieren
X‘(t) = (X(t+1)-X(t))/1 bei linearem Trend
Periodische Komponente
Hintergrund der Periodizität
• Meist klimatische Faktoren
Tagesschwankungen von Abflussmengen
jährliche Schwankungen durch saisonale Klimabedingungen
zuvor wichtig ist Elimination des Trendanteils
Bestimmung des Periodenanteils
• bei bekannter Periodenlänge
Fourieranalyse
Mittelungsmethode
• bei unbekannten Periodenlänge
Autokorrelation
Fourieranalyse
Idee
• Approximation einer beliebigen Funktion durch eine Überlagerung von Sinus- und Cosinus-Funktionen
… Amplitude
… Frequenz
• Hier:
j … Frequenz
… Phase
Anwendung
• El Niño (längerfristiger Zyklus)
• Jahresgang
j
j D
C ,
T f j 1/
j
j
P
A A j t
t
X sin ) 2
(
0
C f t D f t
t
XP( ) j cos 2
* j * j sin 2
* j *Beispiel Fourieranalyse (Rechteck)
X(t)
t
Berechnung der Autokorrelation
Vergleich einer Reihe mit sich selbst
Autokorrelation
Definition
• Vergleich der Reihe mit sich selbst
• Feststellen von Zusammenhängen innerhalb der Reihe
Anwendung
Feststellung eines
periodischen Verhaltens
zB Jahresgang
Autokorrelationskoeffizient / Periodogramm
Autokorrelationskoeffizient:
Korrelationskoeffizient als Funktion der Verschiebung τ
Kann auch direkt aus den Fourierkomponenten berechnet werden
Periodogramm
Ablesen der Amplituden- quadrate bei den Frequenzen
Strichlierte Linie = Signifikanz- niveau
F²/2=
f f1 f2 f3 f4 f5 f6 fj
C f t D f t
t
XP( ) j cos 2
* j * j sin 2
* j *
1
2 2
1
2 2
*
* 2 cos
j
j j
i
j j
j
D C
f D
C r
Cj2D2j/2
05 . 0 ) ( 73 , 1
) (
4
Re
2 2
2 2 2
k P ist k
für
e C k C P
n C s
ihe zufälligen
einer Amplitude der
werte Erwartungs
k m
i x m
• XR(t) … Random = zufällige Größe
Ursache
• zumeist durch kurzfristige, zufällige Witterungserscheinungen
Überlegung
• Zeitreihenwert ist vom vorhergehenden Wert abhängig
• plus einer zufälligen Schwankung
• r1 … Autokorrelationskoeffizient
Stochastischer Anteil
) ( )
( )
( )
( )
''
(
t X t
X t
X t
X t
X
T
P
R) ( )
1 (
* )
(t r1 X t t
X R R
Zeitreihensynthese
Anwendung auf Zeitreihensynthese
• Bei gegebenen Parametern kann eine Zeitreihe generiert werden
• Parameter
Trendanteil A,B
Jahresgang C,D
Stochastischer Anteil r1, σε
• Die generierte Zeitreihe hat die gleiche statistische
Wahrscheinlichkeit wie die beobachtete Reihe, aber eine andere zeitliche Abfolge
• Trockenjahre / Nassjahre
• Man kann damit Wasserwirtschaftssysteme testen
Versorgungsanlagen
Speicher
Hochwasserrückhaltebecken …
Beispiel Simulation Zeitreihe
Speicherdimensionierung
Bemessung eines Speichers zum Ausgleich des Wasserdargebotes (Energieerzeugung, Wasserversorgung)
Ganglinie
Speicherdimensionierung
Bemessung eines Speichers zum Ausgleich des Wasserdargebotes (Energieerzeugung, Wasserversorgung)
Summenlinie Bedarf
Ganglinie
D1 S1 D2
S2
Speicherdimensionierung
S= Max(Abs(Si)) + Max(Abs(Di))
S
0= Max(Abs(Di))
Analyse einer beobachteten Zuflussganglinie
Simulation vieler Zuflussganglinien
S h(S)
S*=F(S)=.9
h(D)
D
Anwendung der Synthese
Simulation für Bemessungszwecke
Simulation zur Prüfung der Funktionsweise von Bauwerken
Simulation liefert keine neue Information, aber generiert Reihen, die gleich wahrscheinlich sind wie beobachtete Reihe
Es können daher Nassjahre, Trockenjahre,
Extremereignisse etc. in der Simulation auftreten
ARMA Modelle
Voraussetzung ist Stationärität
AR autoregressiv
MA Moving average
AR Modelle
AR-Prozess m.ter Ordnung
d.h. der Wert Xt ist sowohl von Xt-1 als auch Xt-i abhängig Mittelwerte von Xi und i sind Null
i ist reine Zufallszahl.
AR-Prozess 1. Ordnung
Woraus folgt, dass -1<1<1
i partieller Autokorrelationskoeffizient
bzw r Korrelationskoeffizient
AR(1) Modell
AR-Prozess 1.Ordnung kann angeschrieben
woraus folgt
d.h. AR(i) kann auch durch MA(n) beschrieben werden Ebenso kann MA(i) durch AR(n) beschrieben werden
AR(1) Modell
Vergleich zweier AR(1) Modelle
Einige Definitionen
isind partielle Autokorrelationskoeffizienten (PAK) diese drücken den Beitrag von X
ibzw. i zur
Gesamtkorrelation aus.
Nimmt man einen AR(2) an, dann sind
1und
2zu schätzen
kbzw. r
kdrückt die Gesamtkorrelation (GK) zwischen linker und rechter Seite aus, wobei sich der Index auf den zeitlichen Abstand (t links und t-k rechts) bezieht. r
iist ein Maß für die Erklärung der Varianz der linken Seite durch die rechte Gleichungsseite und r
iexistiert für
(unendlich) viele zeitliche Abstände
AR(2) Modell
F1 F2 F3 F4 Fk
Verallgemeinerung
Yule Walker Gleichungen
1
2
k
MA-Prozesse
Bei einem MA-Prozess hängt der aktuelle Xt-Wert ausschließlich von vorangegangen Zufallszahlen ab.
Für einen MA(1) Prozess gilt
woraus folgt
MA-Prozesse
Bei einem MA-Prozess hängt der aktuelle Xt-Wert ausschließlich von vorangegangen Zufallszahlen ab.
Für einen MA(1) Prozess gilt
woraus folgt
Xt
MA(2) Prozess
Die Gleichung für den MA(2) Prozess ist
Die Varianzen berechnen sich nach
MA(2) Prozess
Der Lösungsbereich für die Koeffizienten
Die Umrechnung in die Korrelationsfunktion ergibt
ARMA Modelle
Stellen eine Kombination von AR und MA Prozessen dar
Es ist zuerst der Grad (Ordnung) der einzelnen Anteile zu ermitteln: p für AR und q für MA
Dies erfolgt durch die Signifikanzprüfung der partiellen Autokorrelationskoeffizienten (PAK) und durch die
Autokorrelationsfunktion (AKF)
Hinweis auf Grad p: Für einen AR(1) Prozess sollte die AKF mir rk abklingen und nur 1 signifikant von Null verschieden sein. Für einen AR(2) Prozess sollten 1 und 2 signifikant von Null
verschieden sein.
Unter der Annahme (Hypothese) eines Prozesses der Ordnung p sind die Varianzen aller i (i>p) = 1/n, also mit 95% sollten sie
ARMA Modelle
Hinweis auf Grad q: Bei einem MA(1) Prozess sollte die PAKF langsam gegen Null gehen, während die AKF nur einen signifikanten Wert zeigt.
Ein allgemeines ARMA Modell hat folgende Form:
X
t–
1*X
t-1–
2*X
t-2….- =
t–
*
t-1–
2*
t-2-….-
ARMA (1,1) Prozess
X
t–
1*X
t-1=
t–
1*
t-1Die Kovarianzfunktionen lauten: Die AK i ergeben sich aus
ARMA(1,1)
Anwendung für Vorhersage
Das hydrologische Modell zeigt über längere Abschnitte
systematische Abweichungen zu den Beobachtungen
Anwendung für Vorhersage
Erweitertes Modellkonzept durch nachgeschaltete Korrektur
Annahme eines ARMA(1,1) Prozesses Konfidenzbereich
Instationäre Modelle
Zeitreihen weisen oft langfristigen Trend und zyklischen Trend auf
Allgemeine Beschreibung für ARIMA(p,d,q)
t
Anwendung ARIMA Modelle
Für kurz- und mittelfristige Vorhersagen
Pegel Mittersill (obere Salzach) Pegel Grieskirchen (Trattnach)
Ausgeprägter Jahresgang: Reihe ist mit zu differenzieren, da ein ausge- prägter zyklischer Trend
Diese Reihe weist de fakto kaum einen Jahresgang auf
Anwendung ARIMA
Braucht alle Yj und syj
Braucht A1, B1 und
Anwendung ARIMA Vorhersage
Anwendungsbeispiel
Auswertung von Monatswerten des Grundwasserstandes im
Marchfeld
Anwendungsbeispiel
Auswertung von Monatswerten des Grundwasserstandes im
Marchfeld
Transfermodelle
Verknüpfung zweier Zeitreihen X(t) und Y(t) durch Input-Output Modelle (I-O)
Es gibt Single Input –Single Outputmodelle (SISO) und Multiple Input-Single Outputmodelle (MISO)
z.B. wie verändert sich die Temperatur im Längsverlauf eines Flusses ? Wie breitet sich eine Schadstoffkonzentration aus ?
N-A Modell, wobei mehrere NS Stationen (Input) und eine Abflussstation (Output) verwendet werden
Transfermodelle
Beide (I und O) können eine interne Struktur haben und noch korreliert sein
Es ist das Modell zu identifizieren: r,s,b,u
Es sind r+s+u Koeffizienten zu schätzen
Für r=2,s=2,b=0, u=1 gilt
1 1
2 2
1 1
0 2
2 1
1
t t t t t t t
t Y Y X X X
Y
Transfermodelle Anwendung
Beobachtung Modell
Input: Pegelwerte Donau und laufend aktuelle Werte von Probstdorf
Kalman Filter
Lineares System
Unsicherheit in Beobachtungen
Unsicherheiten im Modell
Wenn neue Beobachtungen einlangen, dann das Modell updaten, aber unter Berücksichtigung des Messfehlers
Die Fehler in den Messungen und in den Modellrechnungen werden durch den Kalman-Filter getrennt berücksichtigt.
Als Ergebnis erhält man eine bestmögliche Ermittlung des weder aus der Modellsimulation noch aus der Messung zweifelsfrei
hervorgehenden Zustandes zu jedem Zeitpunkt.
Diese Schätzung ist zwar nicht exakt gleich dem wahren Zustand, jedoch genauer als die Modellrechnung und die Messung.
Anwendung Kalmanfilter
Das hydrologische Modell zeigt über längere Abschnitte
systematische Abweichungen zu den Beobachtungen
Anwendung Kalmanfilter
Anwendung Kalmanfilter
Einfache lineare Speicherkaskade
Anwendung Kalmanfilter
(Systemgleichungen)
Anwendung Kalmanfilter
Kalman Filter: Ergebnis
Zusammenfassung
Zeitreihenanalyse: Trend, Periode, stochastischer Anteil
ARMA, ARIMA, SARIMA Modelle
Transfermodelle
Kalmanfilter: lineares System
Es wird sowohl Mess- als auch Modellfehler
berücksichtigt (bei NV)
Parameterschätzung
Es gibt verschiedene Schätzverfahren für die Parameterermittlung
Momentenmethode
Maximum-Likelihood-Methode
Bayesschätzer (meist iterativ)
Schätzverfahren: Momentenschätzer
Gegeben sind n Beobachtungen x1, xi,…xn
Definition: Momente bezüglich a
Für a=0 und d=1 (1. Moment) folgt
Für a=x und d=2 (2. Moment) folgt
Für die Schiefe Cs und die Wölbung Ck gilt dann
bzw. für die erwartungstreue Schätzung aus einer Stichprobe
n
i
i n
i i
x n x
x M
n x x M
1
2 2
1 1
) 1 (
) 1 (
) 1 0 (
Schätzverfahren: Maximum Likelihood
Setzt die Kenntnis der Grundverteilung f(x) voraus
Beobachteter Wert xi hat die Auftrittswahrscheinlichkeit f(xi) dxi
Annahme: die Messwerte xi stammen aus der NV(,) dann ist die Wahrscheinlichkeit exakt diese Werte zu beobachten
Die Wahrscheinlichkeit ist von m und s abhängig und hat ein Maximum, wenn
Für den Fall einer NV gilt: