2. Direkte Verfahren zur L¨ osung

(1)

2. Direkte Verfahren zur L¨ osung

linearer Gleichungssysteme

(2)

Einleitung (1)

Eine zentrale Rolle bei numerischen Berechnungen spielen lineare Glei- chungssysteme

• Es sind die am h¨aufigsten auftretenden numerischen Probleme

• Anwendungsgebiete sind z.B.

* fast alle naturwissenschaftlich-technischen Problemstellungen vom Wetterbericht bis zur W¨armeentwicklung auf einer Koch- platte oder der Planung der Leiterbahnen auf Mikrochips,

* Bildverarbeitung oder z.B Beleuchtungsprobleme in der Com- putergrafik,

* wirtschaftlichen Fragestellungen wie Versicherungskosten oder B¨orsenkursvorhersage.

(3)

Einleitung (2)

L¨osungsverfahren

• Die direkten Verfahren liefern eine mit Rundungsfehlern behaftete L¨osung nach endlich vielen Schritten.

• Die iterativen Verfahren beginnen mit einer Anfangsnäherung und produzieren eine verbesserte Näherungslösung nach endlich vielen Schritten.

• Falls m¨oglich wird das Problem mit einem direkten Verfahren berechnet und anschließend werden die Rundungsfehler mit einem iterativen Verfahren verringert.

(4)

Einleitung (3)

Problemstellung: Berechne den Vektor x = (x₁, x₂, . . . x_n) aus

a_1,1x₁ + a_1,2x₂ + · · ·a_1,nx_n = b₁ a₂_,₁x₁ + a₂_,₂x₂ + · · ·a₂_,nx_n = b₂

·

a_n,₁x₁ + a_n,₂x₂ + · · ·a_n,nx_n = b_n

oder in Matrix-Schreibweise

Ax = b

Bemerkung: Vektoren werden hier ohne Vektorpfeil geschrieben

(5)

Einleitung (4)

• Es existieren entweder keine, eine oder unendlich viele L¨osungen.

• Das Gleichungssystem hat eine L¨osung, wenn die Inverse Matrix A⁻¹ zu A existiert.

• Die L¨osung kann mit Hilfe von A⁻¹: A⁻¹Ax = A⁻¹b = x.

• Dieses ist der Fall, wenn die Matrix nicht singul¨ar ist, d.h. die Determinante ungleich Null ist (Leibniz-Formel)

detA = ^X

π∈S_n

(sign_π)a₁_,π₍₁₎a₂_,π₍₂₎. . . a_n,π₍_n₎.

* π(1), . . . π(n) bedeutet eine Permutation der Zahlen 1 bis n.

* sign_π ist der Vorzeichen der Permutation

* ^P_π∈S_n bedeutet die Summe ¨uber alle Permutationen

• Es wird im folgenden vorausgesetzt, dass die Matrizen nicht sin-

(6)

Gauß-Verfahren (1)

Das Gauß-Eliminationsverfahren ist bekannt aus der Mathema- tikvorlesung

Dieses direkte L¨osungsverfahren bringt das Gleichungssystem in Drei- ecksform und berechnet den L¨osungsvektor.

Schulbeispiel

E₁ : x₁ + x₂ + 3x₄ = 4 E₂ : − x₂ − x₃ − 5x₄ = −7 E₃ : − 4x₂ − x₃ − 7x₄ = −15 E₄ : 3x₂ + 3x₃ + 2x₄ = 8

(7)

Gauß-Verfahren (2)

Matrix A:

A =







1 1 0 3

0 −1 −1 −5 0 −4 −1 −7

0 3 3 2







,

Determinante:

detA = a₁_,₁ ∗ a₂_,₂ ∗ a₃_,₃ ∗ a₄_,₄ − a₁_,₁ ∗ a₂_,₂ ∗ a₃_,₄ ∗ a₄_,₃

− a_1,1 ∗ a_2,3 ∗ a_3,2 ∗ a_4,4 + a_1,1 ∗ a_2,3 ∗ a_3,4 ∗ a_4,2 + a_1,1 ∗ a_2,4 ∗ a_3,2 ∗ a_4,3 − a_1,1 ∗ a_2,4 ∗ a_3,3 ∗ a_4,2

= 2 − 21 − 8 + 21 + 60 − 15 = 39

(8)

Gauß-Verfahren (3)

Erlaubte Transformationen zur L¨osung des Gleichungssystems

• Multiplizieren einer Zeile (Gleichung) mit einer Zahl verschieden von Null

• Addieren eines Vielfachen einer Zeile zu einer anderen Zeile

• Vertauschen von Zeilen (Gleichungen) bzw. Spalten (Unbekann- ten, entspricht Umnummerierung)

Mit Hilfe der Transformationen reduziere Gleichungssystem auf ein Dreieckssystem.

(9)

Gauß-Verfahren (4)

• Durchlaufe alle Zeilen.

• Bei jeder Zeile j unterhalb der aktuellen Zeile i ersetzt die Ele- menten durch

Zeile j → Zeile j - Zeile i ·(a_j,i/a_i,i)

• Ersetze b_j ebenfalls durch b_j → b_j − b_i · a_j,i/a_i,i

• Dieser Schritt ¨andert den L¨osungsvektor nicht!

• Es f¨uhrt dazu, dass alle Elemente der i-ten Spalte unterhalb der i-ten Zeile zu Null werden.

a_j,i = a_j,i − a_i,i · (a_j,i/a_i,i) = 0 f¨ur j > i

(10)

Gauß-Verfahren (5)

Reihe i

Spalte i Reihe j

0 a

j,i

(11)

Gauß-Verfahren (6)

Zweite Spalte des Schulbeispiels:







1 1 0 3

0 −1 −1 −5 0 −4 −1 −7

0 3 3 2







·







x₁ x₂ x₃ x₄







=







4

−7

−15 8







·

a_3,i = a_3,i − a_3,2/a_2,2 · a_2,i b₃ = b₃ − a_3,2/a_2,2 · b₂ a₄_,i = a₄_,i − a₄_,₂/a₂_,₂ · a₂_,i b₄ = b₄ − a₄_,₂/a₂_,₂ · b₂

(12)

Gauß-Verfahren (7)

Allgemein:

1. Die Matrix A ¨andert sich mit jedem Eliminationsschritt 2. Starte mit der Ursprungsmatrix A⁽¹⁾ = A

3. Führe die nachfolgenden Schritte für alle Zeilen k = 1, . . . , n−1 zur Berechnung einer veränderten Matrix A⁽^k⁺¹⁾ aus A⁽^k⁾ durch, die in der Spalte unter dem Diagonalelement a_k,k nur Nullen stehen hat

4. Berechnet die Zahlen l_i,k aus dem Quotienten der Elemente a^(k)_i,k und a^(k)_k,k nach

l_i,k = a⁽_i,k^k⁾ a^(k)_k,k

, i = k + 1, . . . , n

(13)

Gauß-Verfahren (8)

5. Bestimme die ver¨anderte Matrizen A^(k+1) = a⁽_i,j^k⁺¹⁾, die sich aus dem k-ten Schritt des Gauß-Verfahrens ergibt durch

a^(k+1)_i,j =







a^(k)_i,j − l_i,ka^(k)_k,j , i = k + 1, . . . , n; j = k, . . . , n a⁽_i,j^k⁾ sonst

6. Verändere die Vektor b^(k)_i zu b^(k+1)_i , so dass der Ergebnisvektor unverändert bleibt, gemäß

b⁽_i^k⁺¹⁾ =







b^(k)_i − l_i,kb^(k)_k , i = k + 1, . . . , n b^(k)_i sonst

(14)

Gauß-Verfahren (9)

C-Code

// for each row "k" except the last for (k=0; k<n-1; k++) {

// step through subsequent rows "i"

for (i=k+1; i<n; i++)

l[i][k] = a[i][k]/a[k][k];

// step through subsequent rows "i"

for (i=k+1; i<n; i++) {

// step through subsequents cols "j" of "i"

for (j=k; j<n; j++)

// modified n-k-1 elements of row "i"

a[i][j] = a[i][j] - l[i][k]*a[k][j];

// modify right side

b[i] = b[i] - l[i][k]*b[k];}}

F¨ur j = k gilt

a[i][k] = a[i][k] - (a[i][k]/a[k][k]) * a[k][k] = 0;

d.h. die Spalte a[i][k] mit i>k wird auf 0 gesetzt.

(15)

Gauß-Verfahren (10)

Schulbeispiel wird zu

E₁ : x₁ + x₂ + 3x₄ = 4

E₂ : − x₂ − x₃ − 5x₄ = −7

E₃ : 3x₃ + 13x₄ = 13

E₄ : − 13x₄ = −13

oder allgemein







a₁_,₁ a₁_,₂ · · · a₁_,n a₂_,₂ · · · a₂_,n

. . . ...

a_n,n







·







x₁ x₂ ...

x_n







=







b₁ b₂ ...

b_n







·

(16)

Gauß-Verfahren (11)

Ein Dreieckssystem ist leicht zu l¨osen. Aus E₄: x₄ = 1

x₄ einsetzten in E₃:

3x₃ + 13 = 13 → x₃ = 0 x₃, x₄ einsetzten in E₂:

−x₂ − 5 = −7 → x₂ = 2 x₂, x₃, x₄ einsetzten in E₁:

x₁ + 2 + 3 = 4 → x₁ = −1

(17)

Gauß-Verfahren (12)

Allgemein: Ausgehend von einer Dreiecksmatrix A gilt x_n = 1

a_n,n · b_n x_n−₁ = 1

a_n−1,n−1 · b_n−₁ − a_n−₁_,nx_n, · · · bzw.

x_k = 1 a_k,k ·



b_k −

n X j=k+1

a_k,jx_j





f¨ur k = n, . . . , 1.

Wichtig: Die Diagonalelemente a_kk, die Pivotelemente m¨ussen 6= 0 sein bzw.

det(A) = a₁₁ · a₂₂ · . . . · a_nn 6= 0.

(18)

Gauß-Verfahren (13)

Ordnung des Gauß-Algorithmus

• Eliminationsschritt: Es müssen für k = n,· · · ,1 neue Werte für k² Matrixeinträge berechnet werden, insgesamt

n X k=1

k² = n(n + 1)(2n + 1)/6 ≈ n³/3

• L¨osung des Dreiecks-Gleichungssystem: Es m¨ussen zur Berech- nung der k-ten Unbekannten k Terme zusammengefasst werden, insgesamt

n X k=1

k = n(n + 1)/2 ≈ n²/2

• Ordnung insgesamt O(n³).

(19)

Pivotsuche (1)

Problem:

1. Die “Pivotelemente” a⁽_k,k^k⁾ k¨onnen in jedem Schritt gleich Null sein.

2. Ist das Pivotelemente a^(k)_k,k viel kleiner als a^(k)_i,k , wird l_i,k = ^a

(k) i,k

a^(k)_k,k

sehr groß und Rundungsfehler zerst¨oren die L¨osung Beispiel:

• Berechne mit 4-stelliger Gleitpunktarithmetik





−10⁻⁵ 1 ^

 ·





x₁ ^

 =





1 ^

·

(20)

Pivotsuche (2)

• L¨osung mit Gauß-Algorithmus:





−10⁻⁵ 1 1

2 1 0



 →





−10⁻⁵ 1 1

0 200000 200000





mit der L¨osung x = (0,1)

• Berechne das gleiche System mit vorheriger Vertauschung der Zei- len 1 und 2:





2 1 0

−10⁻⁵ 1 1



 →





2 1 0 0 1 1





mit der L¨osung x = (−0.5,1)

• Exakte L¨osung: x = (−0.4999975. . . ,0.999995 . . .)

(21)

Pivotsuche (3)

Ausweg aus beiden Problemen:

1. Spaltenpivotsuche:

Bestimme das betragsm¨aßig gr¨oßte Element a^(k)_r,k , k ≤ r ≤ n und vertausche Zeile r mit Zeile k und b⁽_r^k⁾ mit b⁽_k^k⁾, falls r 6= k.

2. Zeilenpivotsuche:

Bestimme das betragsmäßig größte Element a⁽_k,r^k⁾, k ≤ r ≤ n und vertausche Spalte r mit Spalte k, falls r 6= k. Dies entspricht einer Umnummerierung des Lösungsvektors.

3. Totalpivotsuche:

Das ist die Kombination aus Zeilen- und Spaltenpivotsuche.

(22)

Pivotsuche (4)

Algorithmus f¨ur Spaltenpivotsuche:

for k = 1 to n − 1 do

bestimme s mit |a_s,k| = max{|a_i,k|, i = k, . . . , n}

vertausche Zeilen s und k von A.

· · ·

Praxis: Die Zeilen werden nicht vertauscht, sondern ¨uber einen In- dexvektor angesprochen oder die Zeiger auf die Zeilen “umgeh¨angt”, um Speicherzugriffe und eventuell Kommunikation zu sparen.

(23)

Pivotsuche (5)

Algorithmus mit Indexvektor:

Indexvektor ind(i) = i, i = 1, . . . , n for k = 1 to n − 1 do

bestimme s mit |a_ind₍_s₎_,k| = max{|a_ind₍_i₎_,k|, i = k, . . . , n}

vertausche ind(s) mit ind(k)

· · ·

for i = k + 1 to n do for j = k to n do

a_ind(i),j = a_ind(i),j − l_ind(i),ka_ind(k),j

· · ·

In C einfach a[k] ↔ a[s]

Es gibt viele L¨osungen im Netz, z.B. unter

(24)

Kondition einer Matrix (1)

Der Einfachheit halber sei A exakt gegeben Ungenaue Eingabe in B: ∆b

Ungenaue Ausgabe in x: ∆x Zu berechnen: ||∆_x||/||x_||

Aus Ax = b folgt A(x + ∆x) = b + ∆b oder A∆x = ∆b und aus

||∆_x|| = ||A⁻¹∆_{b|| ≤ ||A}⁻¹_{|| · ||}∆_b||

||b|| = ||Ax|| ≤ ||A||||x||

folgt

||∆x||

||x|| ≤ ||A⁻¹|| · ||A|| · ||∆b||

||b||

κ(A) = ||A⁻¹|| · ||A|| muss klein sein. Was ist unter ||A|| zu verstehen?

(25)

Kondition einer Matrix (2)

Vektornorm: Unterschiedliche Definitionen von Normen sind m¨oglich.

• 1-Norm:

||x||₁ =

n X i=1

|x_i|

• 2-Norm oder euklidische Norm:

||x||₂ =

v u u t

n X i=1

x²_i

• ∞-Norm:

||x||_∞ = max

i=1,...n |x_i|

Analog für Matrizen, über Spaltensumme, Spektralradius bzw. Zeilen- summe. Diese Größen sollten vor der Lösung des Systems berechnet

(26)

Kondition einer Matrix (3)

Analog ohne Beweise:

• 1-Norm, Spaltennorm:

||A||₁ = max

j=1,...n n X i=1

|a_i,j|

• 2-Norm, Spektralnorm:

||A||₂ = max_x₆₌₀||Ax_||

||x_|| ⁼

q

ρ(A^TA)

• ∞-Norm, Zeilensummennorm:

||A||_∞ = max

i=1,...n n X j=1

||a_i,j||

Gauß-Elimination mit Pivotsuche gilt als numerisch stabil!

(27)

LU (LR)-Zerlegung (1)

Die Matrix A l¨asst sich als Produkt zweier Dreiecksmatrizen schreiben:

A = LU

Das Verfahren wird als LU-Zerlegung bezeichnet und entspricht der Gauß-Elimination. Es gilt

L =







1 0 0 · · · 0 l₂_,₁ 1 0 · · · 0 l_3,1 l_3,2 1 · · · 0 ... ... ... ... ...

l_n,₁ l_n,₂ l_n,₃ · · · 1







U =







a⁽_1,1ⁿ⁾ a⁽_1,2ⁿ⁾ a⁽_1,3ⁿ⁾ · · · a⁽_1,nⁿ⁾ 0 a⁽ⁿ⁾₂_,₂ a⁽ⁿ⁾₂_,₃ · · · a⁽ⁿ⁾₂_,n 0 0 a⁽ⁿ⁾_2,3 · · · a⁽ⁿ⁾_2,n ... ... . . . ... ...

0 0 0 · · · a⁽ⁿ⁾_n,n







(28)

LU-Zerlegung (2)

Ohne Beweis: Die Matrixeintr¨age l_i,j von L sind die Gewichte der Gauß-Elimination und Einsen auf der Diagonalen.

Unser Schulbeispiel:







1 0 0 0 0 1 0 0 0 4 1 0 0 −3 0 1







·







1 1 0 3

0 −1 −1 −5

0 0 3 13

0 0 0 −13







=







1 1 0 3

0 −1 −1 −5 0 −4 −1 −7

0 3 3 2







.

(29)

LU-Zerlegung (3)

Vorteil:

Ist A einmal zerlegt, lässt sich das System Ax = b für alle b schnell lösen, ohne das noch einmal eine Gauß-Elimination durchgeführt werden muss.

Ax = LUx = b

L¨ose zuerst Ly = b und anschließend Ux = y. Beides sind Probleme mit Dreiecksmatrizen und damit von der Ordnung

O(n²).

(30)

HPL

Der HPL-Benchmark der TOP500 Liste für die weltweit leis- tungsfähigsten Rechner ist Lösung eines linearen Gleichungs- systems über eine LU-Zerlegung mit Spaltenpivotsuche.

1. Das Programm ist mit MPI (siehe Masterveranstaltung Parallel Computing) geschrieben.

2. Es fasst zur Beschleunigung, d.h. zur Optimierung des Speicher- zugriffs mehrere Spalten in Bl¨ocken zusammen.

3. Es verwendet BLAS Bibliotheksfunktionen (Basic Linear Algebra Subprograms).

(31)

Cholesky-Zerlegung

F¨ur sogenannte symmetrische und positiv definite Matrizen, also Ma- trizen, f¨ur die gilt

A^T = A und x^TAx > 0

gibt es eine rechts-obere Dreiecksmatrix R mit r_ii < 0 und A = R^TR

Der zugeh¨orige Algorithmus ist ca. doppelt so schnell wie die Gauß- Elimination.

Solche Matrizen kommen in der Praxis sehr h¨aufig vor, z.B. bei im Bereich der Computergraphik.

(32)

QR-Zerlegung (1)

Bei der QR-Zerlegung A = QR handelt es sich um eine Zerlegung in 2 Matrizen, von denen eine eine sogenannte orthogonale Matrix ist, also Q⁻¹ = Q^T und die andere eine rechts-obere Dreiecksmatrix R Vorteil:

• Die Gauß-Elimination bzw. LR-Zerlegung kann die Kondition der Matrix stark ¨andern, so dass es trotz Pivot-Suche zu hohen Run- dungsfehlern kommen kann.

• Die QR-Zerlegung kann auch auf nicht-quadratische Matrizen an- gewandt werden, so wie sie bei Ausgleichsrechnungen vorkommen.

• Es lassen sich ¨uber die QR-Zerlegung die Eigenwerte der Matrix berechnen.

(33)

QR-Zerlegung (1)

Nachteil:

• Das Verfahren ist aufw¨andiger als die LR-Zerlegung

Ist das System einmal zerlegt

Ax = QRx = b_,

dann l¨ose zuerst Qy = b ¨uber y = Q⁻¹b = Q^Tb und anschließend Rx = y. Beides sind Probleme von der Ordnung

O(n²).

(34)

Beispiel einer großen Matrix: Das Radiosity-Verfahren (1)

• Globales Beleuchtungsmodell

• Berechnung der diffus abgestrahlten Energie zwischen Objekten einer Szene

• Energieerhaltung: Summen der abgestrahlten und aufgenommenen Energien sind gleich

• Lichtquellen sind auch Objekte der Szene

Das entstehende Gleichungssystem wird aus Zeitgr¨unden meist iterativ und nicht mit dem Gauß-Verfahren gel¨ost.

siehe http://de.wikipedia.org/wiki/Radiosity_(Computergrafik)

(35)

Beispiel: Radiosity-Verfahren (2)

• N Objekte in einer Szene Gr¨oße Bedeutung

A_i Oberfl¨ache von Objekt i

B_i Von i abgestrahlte Leistung/Oberfl¨ache F_i,j Formfaktor: Anteil, der von B_i auf A_j trifft E_i von i erzeugte Strahlungsleistung/Fl¨ache R_i Reflektionskoeffizient von i

• Gesamte Strahlungsleistung von Objekt j, die das Objekt i trifft ist damit B_jA_jF_j,i

• Gesamte abgestrahlte Energie pro Oberfl¨ache ist die Summe aus der erzeugten und der reflektierten Energie.

(36)

Beispiel: Radiosity-Verfahren (3)

• Energiebilanz:

B_i = E_i +

n X j=1,j6=i

R_i(B_jA_jF_j,i)/A_i

• Der Lichtweg ist umkehrbar → F_j,iA_j = F_i,jA_i

• Es findet keine Absorption statt → F_i,i = 0

• Energiebilanz:

B_i = E_i +

n X j=1

R_i(B_jA_jF_j,i)/A_i

• Gleichungssystem:

E_i =

n X j=1

(δ_i,j − R_iF_i,j)B_j oder Matrix: A_i,j = δ_i,j − R_iF_i,j

(37)

Erg¨ anzung: Eigenwerte (1)

Ein Gleichungssystem hat eine eindeutige L¨osung, wenn die Matrix A nicht singul¨ar ist, d.h. A⁻¹ existiert. Dies ist der Fall, wenn

• die Determinante ungleich Null oder

• alle Eigenwerte der Matrix ungleich Null sind.

Eine n×n Matrix A f¨uhrt bei Multiplikation mit einem Vektor x diesen in einen Vektor y ¨uber. Sind x und y parallel ist x ein Eigenvektor von A zum Eigenwert λ

Ax = y = λx

(38)

Eigenwerte (2)

Die Eigenwerte k¨onnen bestimmt werden ¨uber das charakteristische Polynom, da (A − λI)x = 0

P(λ) = det(A − λI) = det







a_1,1 − λ a_1,2 · · · a_1,n a_2,1 a_2,2 − λ · · · a_2,n

... . . . ...

a_n,1 a_n,n − λ







= 0,

wobei I die Einheitsmatrix ist.

• x ist nur bis auf eine Konstante definiert

• Die Eigenwerte k¨onnen komplex sein

• Die Matrix (A − λI) ist singul¨ar

(39)

Eigenwerte (3)

Eigenwerte und Eigenvektoren haben vielf¨altige Anwendungen in z.B.

• Physik (Schwingungen, Drehungen, Quantenmechanik)

• Maschinenbau (Festigkeitslehre und Knicklasten),

• Biologie und Wirtschaftswissenschaften (Entwicklung eines biolo- gischen bzw. wirtschaftlichen Systems ¨uber Wahrscheinlichkeits- matrizen bzw. Markov-Ketten),

• Bildbearbeitung, z.B. Objektausrichtung

• PageRank einer Homepage als Eigenvektor der Google-Matrix

• Regelungstechnik und vielem mehr,

(40)

Eigenwerte (4)

Drei einfache L¨osungsans¨atze:

• Bei kleinen Systemen kann die Eigenwertgleichung direkt berechnet werden.

• Große Systeme sind meist symmetrisch, d.h. A = A^T. Dann existieren verschiedene schnelle Verfahren zur Berechnung der Eigen- werte ¨uber die QR-Zerlegung.

• Wird nur eine wesentliche Eigenschaft ben¨otigt, z.B. der gr¨oßte Eigenwert, kann dieser leicht durch die Potenzmethode bestimmt werden.

(41)

Eigenwerte (5)

Potenzmethode:

• Voraussetzung (normalerweise g¨ultig): Alle Eigenvektoren sind linear unabh¨angig.

• Dann l¨asst sich ein beliebiger Vektor x schreiben als x =

n X j=1

a_jv⁽^j⁾

• Annahme: Die Eigenvektoren v^(j) gehören zu den der Größe nach sortierten Eigenwerten |λ₁| > |λ₂|. . . ≥ |λ_j| ≥ . . . ≥ |λ_n| ≥ 0 und der größte Eigenwert kommt nur einmal vor.

• Dann gilt

Ax =

n

X a_jAv⁽^j⁾ =

n

X a_jλ_jv⁽^j⁾

(42)

Eigenwerte (6)

Dieser Ausdruck wird nun immer wieder mit A multipliziert:

A²x =

n X j=1

a_jA²v^(j) =

n X j=1

a_jλ²_jv^(j)

A^kx =

n X j=1

a_jA^kv^(j) =

n X j=1

a_jλ^k_jv^(j)

= λ^k₁

n X j=1

a_jλ^k_j

λ^k₁v⁽^j⁾

k→∞lim A^kx = lim

k→∞λ^k₁a₁v⁽¹⁾

Daraus kann der gr¨oßte Eigenwert mit dem zugeh¨origen Eigenvektor gewonnen werden.