• Keine Ergebnisse gefunden

4.1. Begriffserklärung

4.1 Begriffserklärung

Die Bedeutung von Modell und Daten ist je nach Kontext und Autor sehr unter-schiedlich. Daher werden zunächst die Begrifflichkeiten dieser Arbeit geklärt.

• Daten, Messdaten: Aufgezeichnete Werte von Anlagen, die durch Sensoren ge-messen werden

• Modell: Mathematische Abbildung eines Systems oder eines Vorgangs

• Ausgang, Ausgangsgröße: Größe, die mit einem Modell beschrieben wird

• Eingang, Eingangsgröße: Größe, die in ein Modell einfließt und den Ausgang beeinflusst

4. Konzepte der datenbasierten Modellierung In dieser Arbeit wird ein polynomialer Ansatz mit Monomen als Basisfunktionen verfolgt, da sich nach dem Satz von Taylor (Satz 3.16) und der Taylorschen Formel (Satz 3.18) jede hinreichend differenzierbare Funktion durch ein Polynom approxi-mieren lässt. Mit diesen Ansatz wird die Spaltenanzahl n der Modellmatrix A(e) durch die Anzahl der Eingängene und den maximalen Polynomgrad d der Monome bestimmt. Mit Hilfe der Kombinatorik für das ungeordnete Ziehen mit Zurücklegen lässt sie sich berechnen durch

n =d

i=0

(ne+i−1 i

)

=

(ne+d d

)

(4.1) (vgl. Steger [69]). Mit der Notation für einen Multiindex aus Definition 3.17 ergibt sich somit die ModellmatrixA(e) zu

A(e) =

eβ11 · · · eβ1n ... ...

eβm1 · · · eβmn

, wobei βi ∈Nn0e mit |βi|=dfür alle i= 1, . . . , n gilt.

Es handelt sich hierbei um einen statischen Ansatz, d. h. es gibt keine ausgezeichnete Zeitkomponente. Die Zeit kann als ein Datenwert mit aufgenommen werden, aber sie spielt keine besondere Rolle. Dadurch besitzen die Modelle keinen inneren Zustand und werten Daten entsprechend des Wertes und unabhängig von der Reihenfolge aus.

Daher erzeugt die Häufigkeit, mit der eine Datenzeile in den Messdaten auftaucht, eine Gewichtung. Je häufiger sie vorkommt, desto stärker wird sie bei der Erzeugung des Modells berücksichtigt.

Bevor jedoch eine Identifikation der Modellparameter durchgeführt wird, werden die Daten auf das IntervallI0 = [−1,1] affin-linear transformiert, um eine bessere nume-rische Stabilität zu erreichen und eine Vergleichbarkeit der Eingänge untereinander zu gewährleisten. Die Transformation ist unter anderem auch wichtig für die Mo-dellreduktion, welche in Abschnitt 4.3 erläutert wird. Zuvor werden mögliche weitere Basisfunktionen aufgeführt.

4.2.1 Orthogonale Polynome als Basisfunktionen

Die Idee, Monome als Basisfunktionen zu verwenden, basiert auf dem Satz von Taylor (Satz 3.18), der die theoretische Grundlage für die Approximation von Funktionen durch Polynome bildet. Ein großer Vorteil der Monome liegt in ihrer einfachen Imple-mentierung. Außerdem liefern sie bereits sehr gute Ergebnisse (vgl. Abschnitt 6.1).

Der Vollständigkeit halber werden hier einige andere Möglichkeiten vorgestellt. Dazu gehören unter anderem orthogonale oder -normale Systeme. Ihre Vorteile liegen in der direkten Berechnung der Koeffizienten. Klassische Funktionalanalysis zeigt, dass sich für die Suche nach einer Linearkombination für eine Funktionf die Koeffizienten c1, . . . , cnP bezüglich der orthogonalen Funktionen ϕ1, . . . , ϕnP, nP ∈ N, durch die

4.2.1. Orthogonale Polynome als Basisfunktionen

Formel

cj = ⟨f, ϕjL2

ϕj, ϕjL2

, j = 1, . . . , nP

berechnet werden (vgl. Björck [7]). Dabei steht

f1, f2L2 :=mP

i=1f1(yi)f2(yiωi

für das Skalarprodukt von zwei reellwertigen Funktionen f1 und f2, die auf den Punkten yi, . . . , ymP definiert sind, mit den positiven Gewichten ˆω1, . . . ,ωˆmP. Eine QR-Zerlegung wie im Falle der Monome ist somit nicht mehr notwendig und die Berechnung der Koeffizienten liegt in der Größenordnung von O(nPmP). Die Be-rechnungsdauer der Funktionsauswertung an den Punkten yi hängt vom gewählten orthogonalen System ab. Es werden hier nur einige Beispiele genannt. In Chihara [22], Golub und Meurant [42] und Nevai [57] lassen sich folgende und weitere Beispiele von orthogonalen Polynomen finden.

• Die trigonometrischen Funktionen cos(ky) und sin(ky) fürk ∈N mit der kon-stanten Funktion 1 stellen ein orthonormales System in L2(0,2π) dar und ih-re Koeffizienten lassen sich durch die Fourierkoeffizienten darstellen (vgl. Ab-schnitt 3.3). Die Entwicklung einer Funktion mit dem oben genannten System wird auch als Fourierreihenentwicklung bezeichnet. Sie ist nach Satz 3.20 nur auf 2π-periodischen Funktionen anwendbar, was im Allgemeinen nicht für alle Ausgänge angenommen werden kann.

• Polynome Gk, die aus dem Gram-Schmidtschen Orthogonalisierungsverfahren entstehen, benötigen für ihre Berechnung ein äquidistantes Gitter, welches im Allgemeinen in einem Datensatz mit handschriftlich vermerkten Werten nicht gegeben ist. Zur Lösung könnte ein Interpolationsverfahren verwendet werden.

• Legendre Polynome Pk sind orthogonal auf [−1,1] und durch -1 und 1 nach unten beziehungsweise nach oben beschränkt. Sie stellen einen Spezialfall der Polynome aus dem Gram-Schmidtschen Orthogonalisierungsverfahren dar und werden ebenfalls durch folgende Drei-Term-Rekursion beschrieben:

P0(y) = 1, P1(y) =y, (k+ 1)Pk+1(y) = (2k+ 1)yPk(y)−kPk−1(y)

• Tschebyschew Polynome erster ArtTk sind ebenfalls orthogonal auf [−1,1] und durch −1 und 1 beschränkt. Sie werden beschrieben durch

Tk(y) = cos(karccos(y)) oder äquivalent durch die Drei-Term-Rekursion

T0(y) = 1, T1(y) =y, Tk+1(y) = 2yTk(y)−Tk−1(y).

4. Konzepte der datenbasierten Modellierung Die oben genannten Polynome sind bezüglich der Gewichtung ˆω = 1 orthogonal.

Zu anderen Gewichten gibt es auch orthogonale Polynome wie die Hermiteschen Polynome. Sie sind orthogonal bezüglich ˆω(y) = ey2 und können bei Problemen angewendet werden, bei denen die Menge um die Null stärker gewichtet wird, damit Ausreißer das Ergebnis weniger verzerren. Sie werden hier aber nicht weiter erläutert, womit der Exkurs über orthogonale Polynome endet.

4.2.2 Update

Bisher wurde beschrieben, wie Modelle aus einer gegebenen Datenmenge erzeugt werden. Als nächstes wird betrachtet, wie ein vorhandenes Modell auf wachsenden Datenmengen angepasst wird. Dafür wurden in Abschnitt 3.1.2 die Givensrotatio-nen eingeführt. Die Matrizen der Gestalt (3.9) entsprechen dem jetzigen Szenario.

Ein Modell ist bereits berechnet worden und die Dreiecksmatrix R sowie die trans-formierte rechte Seite b liegen vor. Zu dieser Matrix und dem Vektor wird jeweils eine neue Zeile rneu und bneu hinzufügt, welche die neuen Daten beinhalten. Mittels Givensrotationen beziehungsweise schnellen Givensrotationen wird ein auf die neuen Daten angepasstes Modell zur Laufzeit berechnet.

Diese Anpassung wird auch fortlaufend durchgeführt. Dabei ist es unter Umständen sinnvoll, die neuen Daten stärker zu gewichten als die alten Daten, da sich die Anlage mit der Zeit verändert, sei es durch Alterung oder Verschmutzung und Reinigung.

Daher wird eine Vergessensrate ω ∈ [0,1] eingeführt. Die Dreiecksmatrix und die rechte Seite werden damit multipliziert, d. h. anstelle von

minx

( R

rneu

)

x

( b bneu

)

wird

minx

(ωR

rneu

)

x

(ωb bneu

)

betrachtet. Durch das wiederholte Anpassen des Modells wird der ursprüngliche An-teil kleiner. Beim k-ten Anpassen, k ∈N, wird folgendes Problem betrachtet

minx

ωkR ω(k1)rneu(1)

...

ωrneu(k1) r(k)neu

x

ωkb ωk1b(1)neu

...

ωb(kneu1) b(k)neu

.

Bei der Wahl von ω ist jedoch Vorsicht geboten, da bei einem zu kleinen Wert die Datenhistorie zu schnell vergessen wird. Das Modell lernt sich auf das momentane Szenario an, beachtet jedoch alle anderen vorherigen nicht mehr. Bei einer zu hohen Wahl erfolgen die Adaptionen wiederum zu langsam, so dass eine verhältnismäßig lange Übergangszeit entsteht, in der die Modelle noch nicht angepasst sind. Allge-mein gilt, dass die Vergessensrate dem gewünschten Vorhersagehorizont angepasst wird, d. h. kleines ω bei kurzen und großes ω bei langen Horizonten.