Sherman-Morrison-Woodbury Ansätze - Numerik großer nichtlinearer Systeme

Sherman-Morrison-Woodbury-Formel ihre Gültigkeit und (259) ist daher tunlichst als Al-gorithmus zur Lösung des gestörten Gleichungssystemes

(A+V SW^T)y=b zu lesen, wenn ein Löser „A⁻¹“ für das ungestörte System

Ax=b zur Verfügung steht¹⁷⁷

Eine solche algorithmische Lesart der Sherman-Morrison-Woodbury-Formel könnte etwa wie folgt aussehen

y= z }| {x

A⁻¹b− z }| {X

A⁻¹V (S⁻¹+W^T z }| {X

A⁻¹V

| {z }

)⁻¹

z }| {d

W^T z }| {x

A⁻¹b

| {z }

und zur folgenden Rechenvorschrift führen

Algorithmus 4.13 (Sherman-Morrison-Woodbury-Algorithmus; Variante 1) Ax=b; ein Gleichungssystem lösen!

AX =V; k Gleichungssysteme lösen!

Z :=W^TX;

d:=W^Tx;

(S⁻¹ +Z)r =d; ein Gleichungssystem lösen!

y:=x−Xr.

Andere Varianten, die von speziellen Gegebenheiten Gebrauch machen (vgl. das einleitende Beispiel) sind denkbar. Liegt fürA z.B. eineLR-Zerlegung vor, so kann die Sherman-Mor-rison-Formel z.B. wie folgt verwirklicht werden:

(A=LR vorgelegt)

Algorithmus 4.14 (Sherman-Morrison-Woodbury-Algorithmus, Variante 2) Ax=b; ein Gleichungssystem lösen!

LX⁽¹⁾ =V; k Dreieckssysteme lösen!

R^TX⁽²⁾ =W; k Dreieckssysteme lösen!

Z :=X⁽²⁾^TX⁽¹⁾; d:=W^Tx;

(S⁻¹ +Z)r =d; ein Gleichungssystem lösen!

c:=X⁽¹⁾r;

Rw=c; ein Dreieckssystem lösen!

y:=x−w;

177Die Penetranz, mit der hier wieder auf dem Verbot der inversen Matrix herumgetrampelt wird, erklärt sich aus einer ebensolchen Penetranz, mit der eine doch recht große Anzahl (sonst eigentlich ganz intelligent erscheinender) Anwender numerischer Verfahren (und das schließt auch (sogenannte) Mathematikerleider

5 Iterative Verfahren zur Lösung großer Linearer Syste-me

Iterative Verfahren zur Lösung linearer Gleichungssysteme

Ax=b, A∈R^(n,n), b ∈Rⁿ gegeben, x∈Rⁿ gesucht. (261) hatten wir schon im Abschnitt 3.1.3 als Anwendung des Banachschen Fixpunktsatzes dis-kutiert. Diese Iterationen waren speziell Iterationen der Form

xⁿ⁺¹ = Φ(xⁿ), n ∈N

gewesen, bei denen der nächste Iterationsvektor mit einer festen Verfahrensfunktion Φ : Rⁿ −→ Rⁿ nur aus dem aktuellen Iterationsvektor xⁿ berechnet wird, und bei dem die Lösungen von (261) Fixpunkte vonΦsind. Diese Verfahren nennt man „stationäre Verfah-ren‘ “.

Es gibt auch „nichtstationäre Iterationen“. Hier kann sich die Iterationsfunktion von Schritt zu Schritt ändern

xⁿ⁺¹ = Φ_n(xⁿ), n ∈N.

Es kann die Iteration hier etwa nicht nur vom letzten Iterationswert abhängen sondern von mehreren. So kann die Iteration aus ihrem konkreten Verlauf „lernen“.

Wir können in diesem Abschnitt nur einige weitere Ideen der Verfahren vorstellen, denn mit der Schilderung des aktuellen Forschungsstandes zu iterativen Verfahren¹⁷⁸ für lineare Gleichungssysteme ließen sich ohne Probleme fünf und mehr schöne dicke Bücher füllen, wie z.B. [DMY], [BEA],[YS], [AG], [OA], [HAVDV].

Um die Frage, wann solche Iterationsverfahren direkten Methoden vorzuziehen sind, haben wir uns oben elegant herumgedrückt, indem wir sie lieber gar nicht erst aufgeworfen haben.

So verfahren auch die meisten anderen Autoren. Einige der „Verfechter iterativer Methoden“

versteigen sich zwar zu der Behauptung, iterative Methoden seien stets anzuwenden, wenn die Systemmatrix groß und dünnbesetzt sei. Dies ist so aber nicht haltbar.

Leider kann man dem Anwender der numerischen Mathematik wohl (noch?) keine einfache Anleitung an die Hand geben.

Überhuber fasst in seinem Buch [UEB] seine Erfahrungen in der folgenden Tabelle zusam-men.

direkte Verfahren iterative Verfahren Genauigkeit nicht beeinﬂussbar wählbar

Rechenaufwand vorhersagbar meist nicht vorhersagbar aber oft kleiner neue rechte Seite rasch keine Zeitersparnis

Speicherbedarf größer kleiner

Startwert-Vorgabe nicht erforderlich meist vorteilhaft Algorithmus Parameter nicht erforderlich müssen gesetzt werden Black-box-Verwendung möglich oft nicht möglich

Rubustheit ja nein

Bethke und Voss (vgl [BV]) haben eine MATLAB-Umgebung bereitgestellt, mit der der potentielle Benutzer erstens einsehen kann, dass ein klare (überall geltende) Aussage nicht machbar ist, mit der er aber auch testen kann, welche der bis 2003 verfügbaren Verfahren

178Die Forschung kann hier auf gar keinen Fall als irgendwie abgeschlossen bezeichnet werden. Die Lei-stung iterativer Verfahren ist bislang noch alles andere als wirklich zufriedenstellend.

für seine Problemklasse angemessen erscheint.

Dabei können (siehe [BV]) manchmal schon überraschende Ergebnisse herauskommen.

Wenn man die Ausführungen von Überhuber noch ein wenig ergänzen und vertiefen will, so sind vermutlich die folgenden Aussagen als normative Ideen geeignet.

Iterative Verfahrungen werden angewandt, wenn

1. eine direkte Lösung aus Speicherplatzgründen nicht durchführbar ist, 2. die Matrix eine für eine iterative Lösung besonders geeignete Struktur hat, 3. eine (sehr) gute Näherung für die Lösung existiert

4. ein direkter Löser für eine in einer Norm von der aktuellen Systemmatrix nur leicht abweichende Matrix vorhanden ist

5. iterative Löser schneller sind als direkte Löser

Hierzu sind zunächst einige allgemeine Kommentare angebracht

Ad 1. Es kann natürlich leicht vorkommen, dass trotz raﬃnierter Speichertechniken die Elemente der LR-Zerlegung einer Matrix nicht mehr speicherbar sind, die Multipli-kation eines Vektors mit der Systemmatrix aber ganz unproblematisch ist¹⁷⁹. Wenn dann direkte Verfahren, die Teile der Matrix und ihrer Zerlegungen auf externe Zwi-schenspeicher legen, auch nicht mehr anwendbar sind, wird man alternativ versuchen, mit iterativen Verfahren Erfolg zu haben.

Wenn man sich auf iterative Verfahren einlässt, weiß man i.a nicht, welches der zig existierenden Verfahren man nehmen soll, man weiß i.a. nicht, wie schnell es konver-giert, ja, man weiß i.a. noch nicht einmal, ob es überhaupt konvergiert.

Ad 2. Man hat heute schon eine Reihe von Anwendungsgebieten identiﬁziert, deren Glei-chungssysteme für iterative Verfahren gut geeignet sind. Insbesondere sind dies die elliptischen partiellen Diﬀerentialgleichungen, deren Diskretisierungen auf Matrizen führen, die mit speziell angepassten Iterationsverfahren viel schneller lösbar sind als mit direkten Lösern. Die Matrix A von Seite 29 braucht man bei iterativer Anwen-dung z.B. überhaupt nicht zu speichern, weil die Multiplikation mit A vollständig mit dem Diﬀerenzenstern (51) zu bewältigen ist. Außerdem werden hier problemspe-ziﬁsche Iterationsverfahren (siehe unten z.B. Mehrgitter-Verfahren) eingesetzt.

Ad 3. Wenn schon eine sehr gute Näherung für die Lösung bekannt ist¹⁸⁰, liegt es na-he, die „kleinen Fehler“, die die Näherung noch hat, mit einem Iterationsverfahren auszumerzen. Da direkte Verfahren keine Lösungsnäherung arbeitssparend einsetzen können, sind sie in solch einer Situation erst einmal im Nachteil.

Ad 4. Wenn ein Löser A˜⁻¹ für eine Matrix A˜ vorhanden ist¹⁸¹ , die A recht nahe kommt

∥A−A˜∥ ≤ε ( klein ).

Dann ist

xⁿ⁺¹ :=xⁿ−A˜⁻¹(Axⁿ−b)

179Man wird sehen, dass die meisten heute verwendeten iterativen Verfahren die Systemmatrix im We-sentlichen nur durch ihre multiplikative Anwendung auf einen Vektor in’s Spiel bringen.

180Gelegenheiten hierfür sprechen wir noch an.

− −

eine Iteration, deren Iterationsmatrix¹⁸²

M :=I−A˜⁻¹A= ˜A⁻¹(A−A)˜ wegen

∥M∥ ≤ ∥A˜⁻¹∥ · ∥A−A˜∥ ≤ ∥A˜⁻¹∥ ·ε bei moderat großem ∥A˜⁻¹∥ einen kleinen Spektralradius hat.

Ad 5. Hierzu ist nichts zu sagen. Wenn man diese Information hat, verwendet man na-türlich iterative Verfahren.

Eine Situation, die die unter 3. und 4. beschriebenen Gegebenheiten vereint, ﬁndet man bei der sogenannten „Nachiteration‘ “.

Algorithmus 5.1 (Nachiteration) Ein lineares Gleichungssystem

Ax=b

werde durch eine Gauss-Elimination gbearbeitet, die am Ende eine recht ordentliche Lö-sungsapproximation x⁰ liefert sowie eine approximative LR-Zerlegung

A ≈LR

mit normierter unterer Dreiecksmatrix L und rechter oberer Dreiecksmatrix R.

Bei exakter Rechnung wäre x⁰ die Lösung und A das Produkt von L und R. Tatsächlich ist bei der Ausführung auf dem Rechner zu erwarten, dass x⁰ ̸=x und LR ̸= A. Es wird aber andererseits auch zu erwarten sein, dassx⁰ eine gute Näherung der Lösungx ist und der Lösungsprozess R⁻¹L⁻¹ eine gute Approximation von A⁻¹. MitA˜⁻¹ =R⁻¹L⁻¹ lautet die Nachiteration also

xⁿ⁺¹ :=xⁿ−R⁻¹L⁻¹(Ax⁰−b), n≥0.

Zu sehr guten Ergebnisse gelangt man, wenn man das sogenannte „Residuum“ Ax⁰−b mit erhöhter Rechnergenauigkeit berechnet.

Beispiel 5.2 (Nachiteration)

Führt man den Gauss-Algorithmus (mit LR-Zerlegung) für das System Ax=b für







2 −1 0 0 0 0 0

−1 2 −1 0 0 0 0

0 −1 2 −1 0 0 0

0 0 −1 2 −1 0 0

0 0 0 −1 2 −1 0

0 0 0 0 −1 2 −1

0 0 0 0 0 −1 2







und b= (1,1,1,1,1,1,1)^T

mit zweistelliger Dezimalgleitpunktarithmetik aus, so ergibt sich als Approximation für die korrekte Lösung

x= (3.5000,6.0000,7.5000,8.0000,7.5000,6.0000,3.5000)^T

182Vgl. Seite 43

die ziemlich falsche Näherung

x⁰ = (4.0000,7.0000,8.0000,8.0000,7.0000,5.0000,2.5000)^T mit den approximativen L- und R-Matrizen

Lˆ =







1.0000 0 0 0 0 0 0

−0.5000 1.0000 0 0 0 0 0

0 −0.7000 1.0000 0 0 0 0

0 0 −0.8000 1.0000 0 0 0

0 0 0 −0.8000 1.0000 0 0

0 0 0 0 −0.8000 1.0000 0

0 0 0 0 0 −0.8000 1.0000







und

Rˆ =







2.0000 −1.0000 0 0 0 0 0

0 1.5000 −1.0000 0 0 0 0

0 0 1.3000 −1.0000 0 0 0

0 0 0 1.2000 −1.0000 0 0

0 0 0 0 1.2000 −1.0000 0

0 0 0 0 0 1.2000 −1.0000

0 0 0 0 0 0 1.2000





 .

Ganz oﬀensichtlich ist

Lˆ·Rˆ =







2.0000 −1.0000 0 0 0 0 0

−1.0000 2.0000 −1.0000 0 0 0 0

0 −1.0500 2.0000 −1.0000 0 0 0

0 0 −1.0400 2.0000 −1.0000 0 0

0 0 0 −0.9600 2.0000 −1.0000 0

0 0 0 0 −0.9600 2.0000 −1.0000

0 0 0 0 0 −0.9600 2.0000







nicht gleichA. Führen wir mit diesen fehlerhaften MatrizenLˆundRˆ nun die Nachiteration aus

x^k+1 =x^k−Rˆ⁻¹Lˆ⁻¹(Ax^k−b), k ≥0, so ergeben sich folgende Iterationsvektoren

x¹ =





 3.4464 5.8928 7.3393 7.8410 7.3693 5.8911 3.4277





 , x² =





 3.5027 6.0053 7.5080 8.0050 7.4953 5.9922 3.4941





 , x³ =





 3.4996 5.9993 7.4989 7.9989 7.4992 5.9993 3.4995







mit konsekutiven Fehlern E(k) = ∥x^k−x∥2 in der 2-Norm

E = [1.936,0.3156,0.1559 10⁻¹,0.2080 10⁻²,0.1013 10⁻³,0.1375 10⁻⁴,0.6654 10⁻⁶,0.9051 10⁻⁷, . . . und einer Folge von Verbesserungsfaktoren V_n+1; =E_n+1/E_n

Im Dokument Numerik großer nichtlinearer Systeme (Seite 173-179)