7 Lineare Gleichungssysteme - Einf¨uhrung in die Numerische Mathematik f¨ur Chemiker

7.1 Motivation

Lineare Gleichungssysteme sehen auf den ersten Blick trivial einfach aus, ihre L¨osung ist aber Kernst¨uck sehr vieler Numerikan-wendungen, weil sowohl Diskretisierungen (Gitter, finite Elemente, usw.) als auch Basisfunktionsdarstellungen vieler Differenti-algleichungen letztlich lineare Gleichungssysteme liefern. Das Paradebeispiel ist numerische Str¨omungsmechanik (computational fluid dynamics, CFD) mit unz¨ahligen Anwendungsgebieten in den Natur- und Ingenieurwissenschaften (Umstr¨omung von Ro-torbl¨attern, Tragfl¨ugeln, Schiffsr¨umpfen, usw.; Wetter-, Klima- und Ozeansimulationen; Verbrennungsvorg¨ange in Automotoren, Flugzeug- und Raketentriebwerken, usw.). Gelegentlich wird das auch in der Chemie bzw. Molek¨ulphysik wichtig:

Chemische Reaktionen A + B→C + D k¨onnen als “Streuprozeß” beschrieben werden: In der Reaktanden-Asymptote (Entfernung A-B → ∞ und Zeit t → −∞) sind die Zust¨ande des Systems

”A und B“ durch einen Hamiltonoperator ˆH₀ beschreibbar. Bei vorw¨artslaufender Zeit ttreffen Teilchen A und B zur Zeit t = 0 aufeinander und reagieren mit einer gewissen Wahrscheinlichkeit zu C und D. Dabei ist der reagierende Komplex durch einen Hamiltonoperator ˆH gegeben. Bei t → ∞ sind die Produkte C und D wieder

”unendlich“ weit voneinander entfernt. Im Experiment kann man typischerweise in der Asymptote t → −∞ die Reaktanden mit einer gewissen Verteilung ¨uber wenige Quantenzust¨ande kontrolliert pr¨aparieren und dann in der Asymptote t→ ∞ die Verteilung ¨uber die Produkt-Quantenzust¨ande detektieren, hat aber keinen direkten Zugang zum Reaktionsgeschehen um t= 0.

In der Streutheorie betrachten wir daher die zu l¨osende Schr¨odingergleichung

HˆΨ = EΨ (137)

f¨ur die Gesamtsituation, sowie eine bereits gel¨oste Schr¨odingergleichung

Hˆ₀Ψ₀ = EΨ₀ (138)

f¨ur die Eduktasymptote t → −∞. Dabei sei

Hˆ = ˆH₀ +V , Ψ = Ψ₀ +χ (139)

Einsetzen von Gl. 139 in Gl. 137 liefert

( ˆH₀ +V)(Ψ₀ +χ) = E(Ψ₀ +χ) (140)

Unter Verwendung von Gl. 138 wird daraus:

( ˆH −Eˆ1)χ = −VΨ₀ (141)

F¨ur eine gegebene Streu-Gesamtenergie E ist der Operator auf der linken Seite bekannt; aufgrund der L¨osung von Gl. 138 ist die rechte Seite auch bekannt. Gesucht ist der Wellenfunktionsanteil χ, der den eigentlichen Streuvorgang im Wechselwirkungsgebiet wiedergibt und diesen Bereich mit den Edukt- und Produktasymptoten verbindet. Aus dessen Projektion auf die Produktzust¨ande kann man die Reaktionswahrscheinlichkeiten einzelner Eduktzust¨ande in einzelne Produktzust¨ande berechnen, und daraus wieder durch geeignete Summationen/Integrationen die Reaktionsgeschwindigkeitskonstante k(T).

Gl. 141 kann abgek¨urzt geschrieben werden als

Aχˆ = −VΨ₀ (142)

Verwenden wir einen geeigneten Satz von Basisfunktionen {φ_i}, k¨onnen wir sowohl Ψ₀ als auch χ in diese Basis entwickeln χ = X

x_iφ_i , Ψ₀ = X

a_iφ_i (143)

und diese Entwicklungen in Gl. 142 einsetzen:

x_iAφˆ _i = −X

a_iV φ_i (144)

Multiplikation dieser Gleichung von links mit hφ_j| liefert X

x_ihφ_j|A|φˆ _ii = −X

a_ihφ_j|V|φ_ii (145)

Alle Integrale k¨onnen berechnet werden und liefern jeweils eine Zahl f¨ur jede Indexkombination i und j. Auf der rechten Seite die Entwicklungskoeffizienten {a_i} bekannt, also kann dort die Summe ¨uber i ausgef¨uhrt werden und wir erhalten:

A_jix_i = b_j (146)

Dies ist die j-te Zeile der folgenden Matrix-Vektor-Gleichung

A~x =~b (147)

Dabei ist die Matrix A auf der linken Seite und der Vektor~b auf der rechten Seite bekannt; gesucht wird der Vektor ~x. Es handelt sich um ein lineares Gleichungssystem.

7.2 Allgemeines

Ein lineares Gleichungssystem besteht aus M Gleichungen mit linearen Termen aus N Unbekannten und N ×M Koeffizienten.

Einzelne Terme ohne Unbekannte kann man auf der rechten Seite zusammenfassen:

a₁₁x₁ +a₁₂x₂ +· · ·+a_1Nx_N = b₁ (148)

• mehrere rechte Seiten~b_i bei gleicher Matrix A:

A~x₁ =~b₁ , A~x₂ =~b₂ , . . . AX = B (154)

Z.B. ein Streuproblem mit mehreren Anfangsbedingungen.

• Wenn diese~b_i die Spalten der Einheitsmatrix1 sind, dann sind wegen AA⁻¹ = 1 die zu jedem igeh¨orenden L¨osungsvektoren

x_i die Spalten von A⁻¹ ⇒ Matrixinversion

Formal w¨urde Multiplikation von Gl. 153 von links mit A⁻¹ direkt die L¨osung liefern:

A⁻¹A~x = A⁻¹~b ⇒ ~x = A⁻¹~b (155)

Dies wird in der numerischen Praxis nie so gemacht, weil die Matrixinversion nach obigem Schema so aufwendig ist wie eine N-malige L¨osung des Gleichungssystems Gl. 153 und nach anderen Schemata die numerisch ung¨unstige Berechnung von Deter-minanten ben¨otigt.

Tats¨achlich kann man in der Praxis eine scheinbar n¨otige Matrixinversion ~x = A⁻¹~b h¨aufig durch eine L¨osung des entsprechenden linearen Gleichungssystems A~x =~b ersetzen. Alternativ kann man die obige Idee verwenden (Gl. 154 mit B = 1).

7.3 Kleines Matrix-Nomenklatur-Lexikon: A_M_oN quadratisch: M = N

rechteckig: M 6= N

diagonal, tridiagonal, band-diagonal, block-diagonal

schwach besetzt, d¨unn besetzt (sparse):

Dreiecksmatrix: Hier abgek¨urzt: Obere/untere 4-Matrix

symmetrisch (hermitesch/selbstadjungiert): A= A^T (A = A^† = (A^T)^∗)

• Alle Eigenwerte reell

• Eigenvektoren bilden vollst¨andiges Orthonormalsystem positiv definit:

• Symmetrische (hermitesche) Matrizen mit positiven Eigenwerten

• Haben immer ein Inverses positiv semi-definit:

• Neben positiven Eigenwerten auch der Eigenwert 0 erlaubt

orthogonal (unit¨ar): A^† = A⁻¹

• Die Spaltenvektoren bilden ein Orthonormalsystem

• Bei A~v bleibt die Norm von ~v erhalten: kA~vk = k~vk normal: AA^† = A^†A

• Die Eigenvektoren bilden ein vollst¨andiges Orthonormalsystem

• unit¨ar diagonalisierbar: A = UDU^†, mit D = diag{λ_i}

• Bei reellen Matrizen sind alle symmetrischen und alle orthogonalen Matrizen normal singul¨ar:

• Linear abh¨angige Zeilen (oder Spalten), det(A) = 0 regul¨ar: det(A) 6= 0, invertierbar.

7.4 L¨osbarkeit

A_M_oN~x_N =~b_M. (156)

Inhomogene Systeme:~b 6=~0

• M = N

eindeutige L¨osung, wenn A nicht singul¨ar: det(A) 6= 0.

Wenn det(A) = 0, dann – Keine L¨osung, oder

– Ein- oder mehrfach unendliche L¨osungsmannigfaltigkeit, d.h. eine oder mehrere Unbekannte x_i bleiben unbestimmt.

• M < N: Unterbestimmt

(effektiv auch der Fall, wenn det(A) = 0)

Singularit¨aten von A analysierbar und L¨osungsmannigfaltigkeit bestimmbar mit Singul¨arwertzerlegung (singular value de-composition, SVD, s.u.)

• M > N: ¨Uberbestimmt

Und letztlich widerspr¨uchlich! (wenn nicht, dann r¨uckf¨uhrbar auf M ≤ N)

M¨ogliche “Kompromiß-L¨osung” durch lineare Regression finden (Minimierung der Fehler mit least squares); ggf. auch wieder mit SVD machbar.

7.5 Konditionierung

(Herleitungen z.T. in Henrik Larssons Numerikskript WS15/16)

• Der relative Fehler in ~x ist bei der L¨osung von A~x =~b proportional zur Kondition der Matrix A.

cond(A) ≡ kA⁻¹kkAk (157)

Vorsicht: Durch die n¨otige Matrixinversion ist die Konditionsberechnung aufwendiger als die L¨osung des linearen Gleichungs-systems mit nachfolgender Berechnung des sog. Residuums ~r =~b−A~x

• Mit der euklidischen (2er-)Norm gilt:

cond(A)₂ = kA⁻¹k₂kAk₂ = s

λ_max λ_min

. (158)

Je gr¨oßer also das Verh¨altnis zwischen gr¨oßtem und kleinstem Eigenwert λ, desto gr¨oßer auch die Kondition.

• F¨ur eine gute Kondition auf dem Computer muss mit der Maschinengenauigkeit _mach gelten:

cond(A)_mach 1 (159)

Mit t-stelligen real-Zahlen und einer Kondition von cond(A) ≈ 10^α kann ein Gleichungssystem daher nur mit einer Genau-igkeit von t−α −1 Dezimalstellen gel¨ost werden (bezogen auf die betragsgr¨oßte Komponente).

7.6 Gaußsches Eliminationsverfahren

• Wichtig: Der L¨osungsvektor ~x bleibt unver¨andert, wenn beliebige Zeilen des Gleichungssystems vertauscht werden, oder wenn von einer Zeile das Vielfache einer anderen Zeile subtrahiert wird.

• Idee: Bringe das System auf 4-Form

A₁₁x₁ +A₁₂x₂ +· · ·+A_1Nx_N = b₁ (160) 0 + ˜A₂₂x₂ +· · ·+ ˜A_2Nx_N = ˜b₂ (161)

...

0 + ˜A_{M N}x_N = ˜b_M (162)

• Beispiel: Um A_i1x₁ in Zeile 2 bis M zu eliminieren, muss von allen Eintr¨agen ab Spalte 2 _A^Aⁱ¹

11A_1j subtrahiert werden. A₁₁ nennt man dann Pivotelement und _A^Aⁱ¹

11 Multiplikator.

• Wichtig f¨ur numerische Stabilit¨at: Zeilen werden so vertauscht, dass immer der Eintrag mit dem gr¨oßten absoluten Wert Pivotelement wird. Dies nennt man teilweise Pivotierung (Spaltenpivotierung).

• Algorithmus f¨ur A_N_o_N~x_N =~b_N:

p ← 1, . . . , N B Speicherung der Permutationen

f¨ur Spalten k = 1, . . . , N −1 :

i_max ←max(|A_ik|, i= k, . . . , N) wenn |A_i_max_k| < dann

Matrix ist Singul¨ar; Abbruch.

wenn ende

Vertausche kte Zeile mit i_maxter Zeile B Spaltenpivotierung

Vertausche p_k und p_i_max f¨ur Zeilen i = k + 1, . . . , N :

d ← _A^A^ik

f¨ur Spalten j = k+ 1, . . . , N : A_ij ← A_ij −A_kj ×d f¨ur ende

A_ik ←0 B Unteres 4 wird Null

b_i ←b_i −b_k ×d f¨ur ende

f¨ur ende

• Vollst¨andige Pivotierung (Zeilen- und Spaltentausch) auch m¨oglich, aber aufw¨andiger und in der Praxis oft nicht n¨otig.

• Beachte: A und~b werden ¨uberschrieben.

• Anschließend R¨uckw¨artssubstitution zur Berechnung von ~x:

f¨ur i = N, . . . ,1 : s ← b_i

f¨ur j = i+ 1, . . . , N : s ←s−A_ijx_j f¨ur ende

x_i ← _A^s

f¨ur ende

• Zuletzt Beachtung der Permutation: ~x ←~x(~p).

• Algorithmus skaliert mit O(N³), R¨uckw¨artssubstitution nur mit O(N²).

(Deswegen ist die Erweiterung auf den sog. Gauß-Jordan-Algorithmus, bei dem man A mit ganz analogen Operationen nicht auf Dreiecks-, sondern auf Diagonalform bringt und sich dadurch die R¨uckw¨artssubstitution spart, zwar didaktisch interessant, aber f¨ur die Praxis irrelevant.)

7.6.1 Beispiel: Notwendigkeit von Pivotierung

• Gegeben sei

10⁻⁴x1 +x2 = 1, (163)

x₁ +x₂ = 2, (164)

⇒ x₁ = 10⁴

9999, x₂ = 9998

9999, cond(A) = 2.6 (165)

• Mit einer Mantissenl¨ange von 3 Dezimalstellen ergibt sich:

x₁ ≈ 0.100×10¹, (166)

x₂ ≈ 0.100×10¹. (167)

• Ohne Pivotierung berechnet sich das Gleichungssystem nach

0.100×10⁻³x₁ + 0.100×10¹x₂ = 0.100×10¹ 1.Zeile

0.100×10¹x₁ + 0.100×10¹x₂ = 0.200×10¹ 2.Zeile (168) MultiplikatorA₂₁

A11

= 0.100×10¹

0.100×10⁻³ = 0.100×10⁵ (169)

Anderung der zweiten Zeile:¨

y(0.100×10¹ −0.100×10⁵ ×0.100×10⁻³)x₁ + (0.100×10¹ −0.100×10⁵ ×0.100×10¹)x₂

= 0.200×10¹ −0.100×10⁵ ×0.100×10¹ (170)

Ver¨andertes Gleichungssystem (mit Rundungsfehlern in A22 und b2):

⇒ 0.100×10⁻³x₁ + 0.100×10¹x₂ = 0.100×10¹ 1.Zeile

−0.100×10⁵x₂ = −0.100×10⁵ 2.Zeile (171)

L¨osung nach R¨uckw¨artssubstitution:

x₂ = 0.100×10¹ (172)

x1 = 0.000. (173)

• x₁ ist offensichtlich falsch! F¨ur eine Mantissenl¨ange von drei ist das L¨osen schlecht konditioniert. (Pivotierung ist aber fast immer n¨otig, auch bei sehr viel gr¨oßeren Mantissenl¨angen, da A durchaus auch Nullen enthalten kann, ohne dass die Matrix singul¨ar ist.)

• Fehlerursache: In Gl. 169 wird aus einem kleinen Pivotelement ein großer Multiplikator, der bei der Berechnung der modi-fizierten 2.Zeile (von Gl. 170 zu Gl. 171) zu Rundungsfehlern/Weghebeph¨anomenen f¨uhrt (bei der Differenzbildung in A₂₂ und b₂ sind 10⁵ und 10¹ wegen der nur dreistelligen Mantisse nicht in derselben Zehnerpotenz darstellbar).

• Mit Pivotierung (Vertauschung der Reihenfolge der Gleichungen):

0.100×10¹x₁ + 0.100×10¹x₂ = 0.200×10¹ 1.Zeile

0.100×10⁻³x₁ + 0.100×10¹x₂ = 0.100×10¹ 2.Zeile (174) Multiplikator 0.100×10⁻³

0.100×10¹ = 0.100×10⁻³ (175)

⇒ 0.100×10¹x₁ + 0.100×10¹x₂ = 0.200×10¹ 1.Zeile

0.100×10¹x₂ = 0.100×10¹ 2.Zeile (176)

⇒ x2 = 0.100×10¹ (177)

x₁ = 0.100×10¹ (178)

• Die Pivotierung ist also essentiell. Damit ergeben sich kleinere Multiplikatoren und damit im weiteren Verlauf Zahlen mit einer ¨ahnlichen Gr¨oßenordnung ⇒ kein/vermindertes Weghebeph¨anomen.

7.7 LU-Zerlegung

• Problem beim Gauß-Verfahren: Es muß bei gleicher MatrixA aber neuen rechten Seiten~b_i erneut angewandt werden. Oftmals l¨ost man aber mehrere Gleichungssysteme mit derselben Koeffizientenmatrix A, f¨ur zahlreiche rechte Seiten~b_i.

• Daher besser: Finde ein Verfahren, welches A so variiert, dass Gleichungssysteme einfacher gel¨ost werden k¨onnen.

• Ein Gauß-Eliminationsschritt s mit Multiplikatoren l_ik = _A^A^ik

kk ergibt sich letztlich durch Multiplikation mit der sogenannten Frobenius-Matrix

Das Inverse von L_s ergibt sich durch Vorzeichenwechsel der l_ik.

• Wiederholte Anwendung f¨uhrt zur oberen 4-Matrix, was dem Endprodukt der Gauß-Elimination entspricht:

L_N₋₁. . .L₁A =

• A muß entsprechend erhalten werden, wenn man in umgekehrter Reihenfolge L⁻¹_s auf Uanwendet. Das Produkt der Inversen von L_s f¨uhrt zu einer unteren Dreiecksmatrix mit Einsen auf der Diagonalen:

L⁻¹₁ . . .L⁻¹_N−1 =

• Dies ist die LU-Zerlegung (lower/upper triangular matrix; im Deutschen: LR-Zerlegung).

• L¨osung von Gleichungssystemen mittels Vorw¨arts- und R¨uckw¨artssubstitution:

A~x = b, (183)

⇔L U~x

|{z}

=~b, (184)

L~z =~b, L¨osung per Vorw¨artssubstitution, (185) U~x = ~z, L¨osung per R¨uckw¨artssubstitution. (186)

• Wenn die Diagonale von L nicht abgespeichert wird, kann sowohl L als auch U in A gespeichert werden (in place).

• Mit teilweiser Pivotierung l¨asst sich schreiben:

PA = LU, (187)

A = P⁻¹LU = ˜LU. (188)

P ist die Permutationsmatrix (als Vektor speicherbar!). ˜L ist keine 4-Matrix.

• Crout-Algorithmus mit teilweiser Pivotierung und in-place-Speicherung:

p ← 1, . . . , N B Speicherung der Permutationen

f¨ur Spalten k = 1, . . . , N −1 :

i_max ←max(|A_ik|, i= k, . . . , N) wenn |A_i_max_k| < dann

Matrix ist Singul¨ar; Abbruch.

wenn ende

Vertausche kte Spalte mit i_maxter Spalte Vertausche p_k und p_i_max

f¨ur Zeilen i = k + 1, . . . , N : A_ik ← _A^A^ik

kk B Uberschreibe¨ A_ik mit l_ik

f¨ur Spalten j = k+ 1, . . . , N : A_ij ← A_ij −A_kj ×A_ik f¨ur ende

f¨ur ende f¨ur ende

• Wie Gauß-Verfahren, nur daß die Multiplikatoren im unteren 4 gespeichert werden. (Und wie beim Gauß-Verfahren ist dies nur der (hier: LU-)Zerlegungsteil; dazu kommen noch die Substitutionsschritte Gl. 185 und 186.)

7.8 Cholesky-Zerlegung

• F¨ur symmetrische, positiv definite Matrizen A gilt 1. ∀~x ∈ R^N : ~x^TA~x > 0,

2. Alle Eigenwerte sind positiv,

3. Alle Diagonalelemente sind positiv,

4. max_ij |A_ij| = max_i|A_ii| (nur Diagonalpivotierung n¨otig!),

5. Bei jeder Gauß-Elimination ohne Pivotsuche ist die Restmatrix wiederum positiv definit.

• Letzte Eigenschaft l¨asst sich wie folgt zeigen:

A =

Multiplikation von A⁽¹⁾ von rechts mit L^T₁ eliminiert ~z_T: L₁AL^T₁ =

A₁₁ ~0^T

~0 B⁽¹⁾

. (191)

Eine ¨Ahnlichkeitstransformation L₁AL^T₁ ¨andert nicht die Positiv-Definitheit. Also muss B⁽¹⁾ auch positiv definit sein.

• Fortsetzung der Multiplikation mit L_s wie in Gl. 191 f¨uhrt zur LDL-Zerlegung (die auch f¨ur nicht positiv-definite, aber symmetrische Matrizen funktioniert):

• Wurzelziehung der Diagonalmatrix f¨uhrt zur Cholesky-Zerlegung

A = LD¹²D¹²L^T = CC^T. (194)

(Dies ist wegen der Wurzelziehung nur f¨ur positiv definite Matrizen m¨oglich (D ist positiv definit)).

• Der Algorithmus ergibt sich ¨uber:



• Also lautet der Algorithmus:

f¨ur Spalten k= 1, . . . , N :

wenn A_kk < dann B Beachte: Kein Betrag

Matrix ist nicht positiv-definit; Abbruch.

wenn ende C_kk =√

A_kk

f¨ur Zeilen i=k+ 1, . . . , N : Cik = _C^A^ik

f¨ur Spaltenkk j =k+ 1, . . . , i : B Beachte: Schleife geht nur bisi

A_ij ←A_ij −C_ikC_jk f¨ur ende

f¨ur ende f¨ur ende

• Da die letzte Schleife nur bis i geht und keine Pivotierung ben¨otigt wird, ist der Algorithmus mindestens doppelt so schnell wie LU-Zerlegung.

• Da A symmetrisch und C eine 4-Matrix ist, gibt es kompakte Speicherformen, die die Matrix jeweils als Vektor der L¨ange N(N + 1)/2 speichert.

7.8.1 Anwendungsbeispiele

Die Cholesky-Zerlegung ist von sehr großer Bedeutung und wird f¨ur viele Probleme angewandt. Zwei sehr h¨aufige werden kurz vorgestellt.

Verallgemeinerte Eigenwertprobleme

• Neben dem typischen Eigenwertproblem (L¨osung per Diagonalisierung von H)

HX = diag(~e)X, H^† = H (198)

kommt sehr h¨aufig das verallgemeinerte Eigenwertproblem

HX = diag(~e)SX, (199)

mit einer symmetrischen, positiv definiten Matrix S vor.

• folgende L¨osungsidee nicht sinnvoll, da S⁻¹H nicht mehr hermitesch ist:

[S⁻¹H]X = diag(~e)X (200)

• Besser: per Cholesky-Zerlegung von S in ein normales Eigenwertproblem ¨uberf¨uhren:

S = CC^†,(Cholesky) (201)

y HX = diag(~e)CC^†X, (202)

⇒ C⁻¹HX = diag(~e)C^†X, (203)

⇔C⁻¹H([C^†]⁻¹

| {z }

H˜

C^†)X = diag(~e)C^†X, (204)

y H˜X˜ = diag(~e) ˜X, (205)

H˜ = C⁻¹H[C⁻¹]^†, (206)

X˜ = C^†X. (207)

• H˜ ist eine ¨Ahnlichkeitstransformation von H und damit erhalten sich sowohl die Hermitizit¨at als auch die Eigenwerte.

• Am Ende: R¨ucktransformation per X = [C^†]⁻¹X.˜

• Cholesky-Zerlegung und Invertierung von C problemlos m¨oglich, sofern S numerisch positiv definit ist (keine zu große Kondition). (Die Invertierung kann aber auch durch L¨osung von CA = B umgangen werden.)

Orthogonalisierung

• Finde mit positiv definiter Matrix S eine Matrix Y, sodaß

X^†X = S, (208)

X_orth = XY, (209)

⇒X^†_orthX_orth = 1, (210)

• L¨osung wieder per Cholesky-Zerlegung:

S = C^†C,(Cholesky) (211)

y X^†X = C^†C, (212)

⇒[C^†]⁻¹X^†X = C, (213)

⇒ [C^†]⁻¹X^†XC⁻¹ = 1, (214)

⇔ [XC⁻¹]^†XC⁻¹ = 1, (215)

⇒X_orth = XC⁻¹. (216)

• Diese (

”kanonische“) Orthogonalisierung ist identisch zur Gram-Schmidt-Orthogonalisierung.

7.9 Nachiteration

• Das Erreichen von hoher Genauigkeit ist f¨ur lineare Gleichungssysteme mit schlecht konditionierten Matrizen schwierig. Eine Nachbesserung der erhaltenen L¨osung ist aber durch Nachiteration (iterative refinement) sehr einfach m¨oglich, wennA oder

~b nicht schon mit Fehlern behaftet sind und die Kondition von A nicht zu groß ist.

• Gegeben sei A~x =~b mit der mit Rundungsfehlern behafteten L¨osung ~x⁽⁰⁾.

• Der Residuenvektor/das Residuum ist definiert durch

~r⁽⁰⁾ =~b−A~x⁽⁰⁾ = A(~x−~x⁽⁰⁾) =A∆~x⁽⁰⁾. (217)

• ∆~x⁽⁰⁾ ist die Korrektur zu ~x⁽⁰⁾:

~x⁽¹⁾ = ~x⁽⁰⁾ + ∆~x⁽⁰⁾, (218)

mit ~x⁽¹⁾ als verbesserte L¨osung.

• ∆~x⁽⁰⁾ kann durch L¨osen des Gleichungssystems in Gl. 217 berechnet werden:

A∆~x⁽⁰⁾ = ~r⁽⁰⁾. (219)

• Dieses Verfahren kann iterativ bis zur gew¨unschten Genauigkeitsverbesserung durchgef¨uhrt werden.

• Da die Faktorisierung von A schon gegeben ist, hat dieses Verfahren nur einen Aufwand von O(N²) und ist damit im Verh¨altnis zum Gesamtaufwand der Faktorisierung deutlich geringer.

7.10 Iterative Verfahren

• In vielen Anwendungen (z.B. L¨osung von partiellen Differentialgleichungen) sind die erhaltenen Matrizen sehr groß (N ∼ 10⁶– 10⁹), aber schwach besetzt/sparse.

• Die gesamte Matrix kann dann nicht abgespeichert werden, sehr wohl aber alle Elemente, die nichtverschwindend sind.

• Klassische Algorithmen sind f¨ur solche Matrizen nicht zu gebrauchen, da sich dort das Muster der Besetztheit ¨andert und die Matrix andauernd ver¨andert wird.

• Besser: Iterative Verfahren, welche nur Matrix-Vektor-Multiplikationen verwenden. Um ein Matrix-Vektor-Produkt A~b =~c effizient durchf¨uhren zu k¨onnen, reicht es zur Berechnung jedes einzelnen Elements c_i, nur die eine, jeweils zugeh¨orige Zeile von A im Speicher zu halten.

• Es gibt hierf¨ur eine F¨ulle von Algorithmen (Gauß-Seidel, SOR, etc.). Hier nur Besprechung von conjugate gradient.

7.10.1 Conjugate Gradient

• Siehe Abschnitt 6.3.3 zur Minimierung.

Dort wurde f(~x) =~c^T~x+ ¹₂~x^TH~x minimiert, was effektiv die L¨osung des Gleichungssystems H~x = −~c ist.

• vgl. Gl. 129 mit Gl. 217: statt den Gradienten ∇f(~x) zu minimieren, bis er Null wird, minimieren wir hier das Residuum

r =~b −A~x, mit einem weitestgehend analogen Algorithmus, der wieder iterativ ist.

• Pro Iteration braucht es nur eine Matrix-Vektor-Multiplikation.

• Theoretisch braucht der Algorithmus N Schritte f¨ur eine N oN-Matrix.

• Allerdings ist die numerische Konvergenz schon nach wenigen ∼ 10−100 Schritten erreicht. Dies h¨angt aber sehr von der Kondition von A ab!

• Erweiterung auf nicht-symmetrisch-positiv-definite Matrizen ergibt das BiCG-Verfahren (biconjugate gradient). Weitere Variationen sind vorhanden.

7.10.2 Pr¨akonditionierung

• Iterative Verfahren konvergieren nur schnell, wenn die Kondition der Matrix klein ist.

• Verringerung der Konvergenz durch einen Vorkonditionierer M⁻¹, der n¨aherungsweise dem Inversen von A entspricht (oder eine entsprechende Funktion, welche Gleichungssysteme f¨ur M l¨ost).

• Anstelle von A~x =~b wird also gel¨ost:

M⁻¹A~x = M⁻¹~b, (220)

⇔M⁻¹(A~x−~b) = 0 (221)

• Im obigen Algorithmus wird M⁻¹ auf die Residuen ~r angewandt.

• Da Rundungsfehler auftreten k¨onnen, ist die Polak-Ribi`ere-Korrektur wieder zu empfehlen (Gl. 132).

• Die Wahl geeigneter Pr¨akonditionierer ist schwierig: Das Gleichungssystem M~y =~b soll schnell gel¨ost werden und M nicht viel Arbeitsspeicher belegen, aber dennoch die Kondition sehr stark verringern.

• M¨ogliche Wahlen

– Jacobi-Konditionierung: M ist eine Diagonalmatrix mit den Diagonaleintr¨agen von A (sinnvoll f¨ur diagonal dominante Matrizen).

– Sog. unvollst¨andige Cholesky-Zerlegung f¨ur schwachbesetzte Matrizen, welche dasselbe Besetzungsmuster von A f¨ur die Dreiecksmatrix annimmt.

– L¨osung einer einfacheren Differentialgleichung, etc.

• Pr¨akonditionierung und die Suche nach einem guten Konditionierer lohnt sich h¨aufig, ist aber keine exakte Wissenschaft. . .

Im Dokument Einf¨uhrung in die Numerische Mathematik f¨ur Chemiker (Seite 90-113)