• Keine Ergebnisse gefunden

Aus der statistischen Analyse von Beobachtungen in der Zeit (Zeitreihen) lassen sich kennzeichnende Parameter ableiten, die für Bemessungen, den Betrieb von

N/A
N/A
Protected

Academic year: 2022

Aktie "Aus der statistischen Analyse von Beobachtungen in der Zeit (Zeitreihen) lassen sich kennzeichnende Parameter ableiten, die für Bemessungen, den Betrieb von "

Copied!
66
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Zeitreihenanalyse

H.P. Nachtnebel

Institut für Wasserwirtschaft, Hydrologie und konstruktiver Wasserbau

(2)

Ziel

Aus der statistischen Analyse von Beobachtungen in der Zeit (Zeitreihen) lassen sich kennzeichnende Parameter ableiten, die für Bemessungen, den Betrieb von

wasserwirtschaftlichen Einrichtungen (Speichern,..), Prognosen herangezogen werden können

Sehr oft wird voraus gesetzt: Die Eigenschaften sind in Vergangenheit und Zukunft gleich (Stationärität)

zeitunabhängigem Mittelwert

zeitunabhängiger Streuung

zeitunabhängiger Kovarianz.

(3)

Methoden

 Klassische Zeitreihenanalyse durch Schätzung der Komponenten X

T

,X

P

und X

R

 ARMA, ARIMA, SARIMA Modelle

 Nach Identifikation können durch Simulation

neue gleichwahrscheinliche Reihen generiert

werden

(4)

Definitionen und Anwendung

Definition Zeitreihe

zeitliche Abfolge von Messwerten, deren Auftreten statistischen Gesetzmäßigkeiten unterliegt

Anwendung: Zeitreihenanalyse und -synthese

Für die Dimensionierung, die Beurteilung der Zuverlässigkeit von Systemen und die Vorhersage werden ZR.A. und Simulationen angewandt

Art der Messwerte

Kontinuierlich

Schreiber

Diskret

Terminwerte

Mittelwerte einer Zeitspanne

) (t X

) ( i

i t

X

(5)

Darstellung: Ganglinien

kontinuierlich

diskret

(6)

Methodik

 Zeitreihenanalyse

Zerlegung in wesentliche Anteile und quantitative Beschreibung

Trend …

Beispiel: Rückläufige Abflüsse südlich des Alpenhauptkamms

Periode ...

Beispiel: in Ö die Frühjahrshochwässer

Stochastischer Anteil …

) (t X

T

) (t X

P

) (t XR

) ( )

( )

( )

( t X t X T X t

X

T

P

R

(7)

Methodik

 Zweck der Zeitreihenanalyse

Ermittlung der einzelnen Anteile

Parametrisierung des Informationsgehaltes in einer Zeitreihe

 Simulation (Generierung)

• Dann können Reihen generiert werden, die den gleichen Informationsgehalt (gleiche Auftrittswahrscheinlichkeit) wie beobachtete Reihe haben

(8)

Homogenität / Stationärität

 Homogenität

• Unterteilung einer Reihe in Teilreihen

• Bestimmen der Parameter

Mittelwert

Varianz

Schiefe

• Parameter der Teilreihen weichen nicht signifikant

voneinander ab  dieselbe Grundgesamtheit  Homogen

 Stationärität

• Mittelwerte von Teilabschnitten weichen nicht signifikant voneinander ab  Stationärität 1. Ordnung

• Mittelwerte und Kovarianz von Teilabschnitten weichen nicht

(9)

Beispiel für Trendanalyse:

Extreme Niederschlagsereignisse in Wien

Zahl der Tage mit mehr als 30 mm Niederschlag in Wien Reihe 1961 - 2001

2

0 1

0 4

1

0 1 1

2 3

1 3

1 2

0 2

0 1

2

0 0 2

1 1 2

1

0 2

0 4

3

0

2 2 2 5

4

2 2

0 0

1 2 3 4 5 6

1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

Jahr

Tage

(Rudel, ZAMG 2002)

Ja !!!!

(10)

Beispiel für Trendanalyse:

Extreme Niederschlagsereignisse in Wien

Zahl der Tage mit mehr als 30 mm Niederschlag in Wien Reihe 1903 - 2001

3

2

1 2

3

1 2

3

1 5

1 3

44

00 22

3 3

0 2

4

2

1

0 2

4

2

1 1 2

1 3 3

4

22 5

22 3

0 11

00 44

0 22 2

11 3

5

0 2

0 1

0 4

1

0 11

2 3

1 3

1 2

0 2

0 1

2

00 2

1 1 2

1

0 2

0 4

3

0 22 2

5

4

2 2

0 0

1 2 3 4 5 6

1903 1905 1907 1909 1911 1913 1915 1917 1919 1921 1923 1925 1927 1929 1931 1933 1935 1937 1939 1941 1943 1945 1947 1949 1951 1953 1955 1957 1959 1961 1963 1965 1967 1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001

Jahr

Tage

Nein !!!!

(11)

Trends in Niederschlag und Abfluss

Moser et al., 2003

Annual precipitation

Abfluss

(12)

Schätzung Trendanteil X T (t) 1

 Annahme

• Linearer Trend

Schätzung von A und B durch Regressionsrechnung XT(t)= A + B t

(13)

Trendanteil X T (t) 2

 Annahme

• Nichtlineares Verhalten

Beispiel: Nachfragefunktion – zuerst stark ansteigend mit anschließender Sättigung

• Sprungstellen

X(t)

t

x

II

*

2

* )

( t A B t C t

X

T

  

(14)

Trends in der Streuung

(15)

Trendeliminierung

 X‘(t) = X(t)-X

T

(t) = X

P

(t)+X

R

(t)

 Oder nicht parametrisch durch numerisches Differenzieren

 X‘(t) = (X(t+1)-X(t))/1 bei linearem Trend

(16)

Periodische Komponente

 Hintergrund der Periodizität

• Meist klimatische Faktoren

Tagesschwankungen von Abflussmengen

jährliche Schwankungen durch saisonale Klimabedingungen

zuvor wichtig ist Elimination des Trendanteils

 Bestimmung des Periodenanteils

• bei bekannter Periodenlänge

Fourieranalyse

Mittelungsmethode

• bei unbekannten Periodenlänge

Autokorrelation

(17)

Fourieranalyse

Idee

Approximation einer beliebigen Funktion durch eine Überlagerung von Sinus- und Cosinus-Funktionen

… Amplitude

… Frequenz

Hier:

j … Frequenz



… Phase

Anwendung

El Niño (längerfristiger Zyklus)

Jahresgang

j

j D

C ,

T f j 1/

j

j

P

A A j t

t

X    sin    ) 2

(

0

   

 

C f t D f t

t

XP( ) j cos 2

* j * j sin 2

* j *

(18)

Beispiel Fourieranalyse (Rechteck)

X(t)

t

(19)

Berechnung der Autokorrelation

 Vergleich einer Reihe mit sich selbst

(20)

Autokorrelation

 Definition

• Vergleich der Reihe mit sich selbst

• Feststellen von Zusammenhängen innerhalb der Reihe

Anwendung

Feststellung eines

periodischen Verhaltens

zB Jahresgang

(21)

Autokorrelationskoeffizient / Periodogramm

Autokorrelationskoeffizient:

Korrelationskoeffizient als Funktion der Verschiebung τ

Kann auch direkt aus den Fourierkomponenten berechnet werden

Periodogramm

Ablesen der Amplituden- quadrate bei den Frequenzen

Strichlierte Linie = Signifikanz- niveau

F²/2=

f f1 f2 f3 f4 f5 f6 fj

   

 

C f t D f t

t

XP( ) j cos 2

* j * j sin 2

* j *

 

 

1

2 2

1

2 2

*

* 2 cos

j

j j

i

j j

j

D C

f D

C r

Cj2D2j/2

05 . 0 ) ( 73 , 1

) (

4

Re

2 2

2 2 2

k P ist k

für

e C k C P

n C s

ihe zufälligen

einer Amplitude der

werte Erwartungs

k m

i x m

(22)

• XR(t) … Random = zufällige Größe

 Ursache

• zumeist durch kurzfristige, zufällige Witterungserscheinungen

 Überlegung

• Zeitreihenwert ist vom vorhergehenden Wert abhängig

• plus einer zufälligen Schwankung

• r1 … Autokorrelationskoeffizient

Stochastischer Anteil

) ( )

( )

( )

( )

''

(

t X t

X t

X t

X t

X  

T

P

R

) ( )

1 (

* )

(t r1 X t t

X RR  

(23)

Zeitreihensynthese

 Anwendung auf Zeitreihensynthese

• Bei gegebenen Parametern kann eine Zeitreihe generiert werden

• Parameter

Trendanteil A,B

Jahresgang C,D

Stochastischer Anteil r1, σε

• Die generierte Zeitreihe hat die gleiche statistische

Wahrscheinlichkeit wie die beobachtete Reihe, aber eine andere zeitliche Abfolge

• Trockenjahre / Nassjahre

• Man kann damit Wasserwirtschaftssysteme testen

Versorgungsanlagen

Speicher

Hochwasserrückhaltebecken …

(24)

Beispiel Simulation Zeitreihe

(25)

Speicherdimensionierung

Bemessung eines Speichers zum Ausgleich des Wasserdargebotes (Energieerzeugung, Wasserversorgung)

Ganglinie

(26)

Speicherdimensionierung

Bemessung eines Speichers zum Ausgleich des Wasserdargebotes (Energieerzeugung, Wasserversorgung)

Summenlinie Bedarf

Ganglinie

D1 S1 D2

S2

(27)

Speicherdimensionierung

 S= Max(Abs(Si)) + Max(Abs(Di))

 S

0

= Max(Abs(Di))

 Analyse einer beobachteten Zuflussganglinie

 Simulation vieler Zuflussganglinien

S h(S)

S*=F(S)=.9

h(D)

D

(28)

Anwendung der Synthese

 Simulation für Bemessungszwecke

 Simulation zur Prüfung der Funktionsweise von Bauwerken

 Simulation liefert keine neue Information, aber generiert Reihen, die gleich wahrscheinlich sind wie beobachtete Reihe

 Es können daher Nassjahre, Trockenjahre,

Extremereignisse etc. in der Simulation auftreten

(29)

ARMA Modelle

 Voraussetzung ist Stationärität

 AR autoregressiv

 MA Moving average

(30)

AR Modelle

AR-Prozess m.ter Ordnung

d.h. der Wert Xt ist sowohl von Xt-1 als auch Xt-i abhängig Mittelwerte von Xi und i sind Null

i ist reine Zufallszahl.

AR-Prozess 1. Ordnung

Woraus folgt, dass -1<1<1

i partieller Autokorrelationskoeffizient

bzw r Korrelationskoeffizient

(31)

AR(1) Modell

AR-Prozess 1.Ordnung kann angeschrieben

woraus folgt

d.h. AR(i) kann auch durch MA(n) beschrieben werden Ebenso kann MA(i) durch AR(n) beschrieben werden

(32)

AR(1) Modell

Vergleich zweier AR(1) Modelle

(33)

Einige Definitionen

i

sind partielle Autokorrelationskoeffizienten (PAK) diese drücken den Beitrag von X

i

bzw. i zur

Gesamtkorrelation aus.

Nimmt man einen AR(2) an, dann sind 

1

und 

2

zu schätzen

k

bzw. r

k

drückt die Gesamtkorrelation (GK) zwischen linker und rechter Seite aus, wobei sich der Index auf den zeitlichen Abstand (t links und t-k rechts) bezieht. r

i

ist ein Maß für die Erklärung der Varianz der linken Seite durch die rechte Gleichungsseite und r

i

existiert für

(unendlich) viele zeitliche Abstände

(34)

AR(2) Modell

(35)

F1 F2 F3 F4 Fk

Verallgemeinerung

 Yule Walker Gleichungen

1

2

k

(36)

MA-Prozesse

Bei einem MA-Prozess hängt der aktuelle Xt-Wert ausschließlich von vorangegangen Zufallszahlen ab.

Für einen MA(1) Prozess gilt

woraus folgt

(37)

MA-Prozesse

Bei einem MA-Prozess hängt der aktuelle Xt-Wert ausschließlich von vorangegangen Zufallszahlen ab.

Für einen MA(1) Prozess gilt

woraus folgt

Xt

(38)

MA(2) Prozess

Die Gleichung für den MA(2) Prozess ist

Die Varianzen berechnen sich nach

(39)

MA(2) Prozess

Der Lösungsbereich für die Koeffizienten

Die Umrechnung in die Korrelationsfunktion ergibt

(40)

ARMA Modelle

Stellen eine Kombination von AR und MA Prozessen dar

Es ist zuerst der Grad (Ordnung) der einzelnen Anteile zu ermitteln: p für AR und q für MA

Dies erfolgt durch die Signifikanzprüfung der partiellen Autokorrelationskoeffizienten (PAK) und durch die

Autokorrelationsfunktion (AKF)

Hinweis auf Grad p: Für einen AR(1) Prozess sollte die AKF mir rk abklingen und nur 1 signifikant von Null verschieden sein. Für einen AR(2) Prozess sollten 1 und 2 signifikant von Null

verschieden sein.

Unter der Annahme (Hypothese) eines Prozesses der Ordnung p sind die Varianzen aller i (i>p) = 1/n, also mit 95% sollten sie

(41)

ARMA Modelle

 Hinweis auf Grad q: Bei einem MA(1) Prozess sollte die PAKF langsam gegen Null gehen, während die AKF nur einen signifikanten Wert zeigt.

 Ein allgemeines ARMA Modell hat folgende Form:

X

t

–

1

*X

t-1

–

2

*X

t-2

….- =

t

–

*

t-1

–

2

*

t-2

-….-

(42)

ARMA (1,1) Prozess

X

t

–

1

*X

t-1

=

t

–

1

*

t-1

Die Kovarianzfunktionen lauten: Die AK i ergeben sich aus

(43)

ARMA(1,1)

(44)

Anwendung für Vorhersage

 Das hydrologische Modell zeigt über längere Abschnitte

systematische Abweichungen zu den Beobachtungen

(45)

Anwendung für Vorhersage

Erweitertes Modellkonzept durch nachgeschaltete Korrektur

Annahme eines ARMA(1,1) Prozesses Konfidenzbereich

(46)

Instationäre Modelle

 Zeitreihen weisen oft langfristigen Trend und zyklischen Trend auf

 Allgemeine Beschreibung für ARIMA(p,d,q)

t

(47)

Anwendung ARIMA Modelle

 Für kurz- und mittelfristige Vorhersagen

Pegel Mittersill (obere Salzach) Pegel Grieskirchen (Trattnach)

Ausgeprägter Jahresgang: Reihe ist mit zu differenzieren, da ein ausge- prägter zyklischer Trend

Diese Reihe weist de fakto kaum einen Jahresgang auf

(48)

Anwendung ARIMA

Braucht alle Yj und syj

Braucht A1, B1 und 

(49)

Anwendung ARIMA Vorhersage

(50)

Anwendungsbeispiel

Auswertung von Monatswerten des Grundwasserstandes im

Marchfeld

(51)

Anwendungsbeispiel

Auswertung von Monatswerten des Grundwasserstandes im

Marchfeld

(52)

Transfermodelle

Verknüpfung zweier Zeitreihen X(t) und Y(t) durch Input-Output Modelle (I-O)

Es gibt Single Input –Single Outputmodelle (SISO) und Multiple Input-Single Outputmodelle (MISO)

z.B. wie verändert sich die Temperatur im Längsverlauf eines Flusses ? Wie breitet sich eine Schadstoffkonzentration aus ?

N-A Modell, wobei mehrere NS Stationen (Input) und eine Abflussstation (Output) verwendet werden

(53)

Transfermodelle

Beide (I und O) können eine interne Struktur haben und noch korreliert sein

Es ist das Modell zu identifizieren: r,s,b,u

Es sind r+s+u Koeffizienten zu schätzen

Für r=2,s=2,b=0, u=1 gilt

1 1

2 2

1 1

0 2

2 1

1

t t t t t t t

t Y Y X X X

Y       

(54)

Transfermodelle Anwendung

Beobachtung Modell

Input: Pegelwerte Donau und laufend aktuelle Werte von Probstdorf

(55)

Kalman Filter

Lineares System

Unsicherheit in Beobachtungen

Unsicherheiten im Modell

Wenn neue Beobachtungen einlangen, dann das Modell updaten, aber unter Berücksichtigung des Messfehlers

Die Fehler in den Messungen und in den Modellrechnungen werden durch den Kalman-Filter getrennt berücksichtigt.

Als Ergebnis erhält man eine bestmögliche Ermittlung des weder aus der Modellsimulation noch aus der Messung zweifelsfrei

hervorgehenden Zustandes zu jedem Zeitpunkt.

Diese Schätzung ist zwar nicht exakt gleich dem wahren Zustand, jedoch genauer als die Modellrechnung und die Messung.

(56)

Anwendung Kalmanfilter

 Das hydrologische Modell zeigt über längere Abschnitte

systematische Abweichungen zu den Beobachtungen

(57)

Anwendung Kalmanfilter

(58)

Anwendung Kalmanfilter

Einfache lineare Speicherkaskade

(59)

Anwendung Kalmanfilter

(Systemgleichungen)

(60)

Anwendung Kalmanfilter

(61)

Kalman Filter: Ergebnis

(62)

Zusammenfassung

 Zeitreihenanalyse: Trend, Periode, stochastischer Anteil

 ARMA, ARIMA, SARIMA Modelle

 Transfermodelle

 Kalmanfilter: lineares System

Es wird sowohl Mess- als auch Modellfehler

berücksichtigt (bei NV)

(63)

Parameterschätzung

 Es gibt verschiedene Schätzverfahren für die Parameterermittlung

Momentenmethode

Maximum-Likelihood-Methode

Bayesschätzer (meist iterativ)

(64)

Schätzverfahren: Momentenschätzer

Gegeben sind n Beobachtungen x1, xi,…xn

Definition: Momente bezüglich a

Für a=0 und d=1 (1. Moment) folgt

Für a=x und d=2 (2. Moment) folgt

Für die Schiefe Cs und die Wölbung Ck gilt dann

bzw. für die erwartungstreue Schätzung aus einer Stichprobe

n

i

i n

i i

x n x

x M

n x x M

1

2 2

1 1

) 1 (

) 1 (

) 1 0 (

(65)

Schätzverfahren: Maximum Likelihood

Setzt die Kenntnis der Grundverteilung f(x) voraus

Beobachteter Wert xi hat die Auftrittswahrscheinlichkeit f(xi) dxi

Annahme: die Messwerte xi stammen aus der NV(,) dann ist die Wahrscheinlichkeit exakt diese Werte zu beobachten

Die Wahrscheinlichkeit ist von m und s abhängig und hat ein Maximum, wenn

Für den Fall einer NV gilt:

) ,

(  

2

L

(66)

Vergleich der Schätzverfahren

 Momentenmethode ist einfach und immer direkt anwendbar

 Fehler in Parameterschätzung bei höheren Momenten und bei schiefen Verteilungen

 Likelihoodmethode liefert zuverlässigere

Schätzung bei schiefen Verteilungen und bei

kleineren Stichproben

Referenzen

ÄHNLICHE DOKUMENTE

Als wichtigste Hindernisse der sprachlichen Ver- englischung schälen sich heraus: (1) Das Vorhandensein von Sprachinseln; (2) das Alter der Gruppe, das (a) die

Mathematische Methoden zur Analyse von Zeitreihen komplexer Systeme.

Beim Meßprozeß ¨uberlagerte sich dem Signal ein farbiges Beobachtungsrauschen. Nutze alle Deine Kenntnisse, um dieses Rauschen

Verbinde die zusammen passenden Elemente oder kreise sie in der gleichen Farbe ein... Wo findest Du die gleiche Reihe

[r]

Für Nahrungsergänzungs- mittel reicht eine Anzeige beim Bundesamt für Verbraucherschutz und Lebensmittelsicherheit.. Protina ging mit seinen Basica®-Produkten aber einen

material konnen wir nur den Korrelationskoeffizienten zwischen den Haufigkeitszahlen berechnen, nicht aber jenen zwischen den Storungen, denn die Grosse der letzteren ist uns

Die Beurteilung der Maschinenfähigkeit stützt sich hauptsächlich auf die beiden Kennwerte C m und C mk. Die Forderung ist hoch. Jedoch wird ein „Gut“­Anteil von 99,73 % heute in