bei vier Prozessoren erh¨alt beispielsweise jeder Prozessorpn{2q2 Freiheitsgrade.) Die Indexmenge aller Frei- heitsgrade bezeichnen wir mitI, die des ProzesseskmitIk

(1)

Parallele L ¨osung großer Gleichungssysteme, Wintersemester 2012/13 Aufgabenblatt 3 Prof. Dr. Peter Bastian, Pavel Hron, Ole Klein Abgabe 16. November 2012 IWR, Universit¨at Heidelberg

U¨BUNG6 DIE PARALLELERICHARDSON-ITERATION

Wir m ¨ochten das GleichungssystemAxbmit der Richardson-Iteration x^p^k ¹^qx^p^k^q ωpbAx^p^k^qq

l ¨osen. Die MatrixAsei die Steifigkeitsmatrix einerP¹-Diskretisierung der Poissongleichung auf dem Einheitsquadrat. Dabei verwenden wir ein strukturiertes Dreiecksgitter mit N n² Freiheitsgra- den (Dabei bezeichnetndie Anzahl der Freiheitsgrade auf einer Horizontalen oder Vertikalen des Gitters).

Um die Berechnung zu beschleunigen, m öchten wir die Iteration parallel durchf ühren. Daf ür unterteilen wir das Einheitsquadrat inpkleinere Quadrate und verteilen die Freiheitsgrade in die- sen Untergebieten auf p Prozessoren. (Dabei nehmen wir an, das p eine Quadratzahl ist; bei vier Prozessoren erhält beispielsweise jeder Prozessorpn{2q² Freiheitsgrade.) Die Indexmenge aller Frei- heitsgrade bezeichnen wir mitI, die des ProzesseskmitI_k. Jeder Prozessor speichert die zu seinen Freiheitsgraden geh örigen Einträge vonx^p^k^qund die relevanten Zeilen vonA.

Eine Iteration des parallelen Verfahrens besteht nun aus folgenden Schritten:

• Kommunikation der von den Nachbarprozessoren ben ¨otigten Eintr¨age vonx^p^k^q

• Berechnung vonx^p^k ¹^q

1. Beschreiben Sie die IndexmengenI_kund geben Sie an, mit welchen Prozessoren der Prozessor kwelche Eintr¨age vonx^p^k^qkommunizieren muss.

2. Die Rechenzeit f ür eine beliebige arithmetische Operation (Addition, Subtraktion oder Multi- plikation) betraget_op, die Zeit zur Übertragung eines Bytes an einen anderen Prozessor t_byte, und die Zeit, um eine Nachricht aufzusetzen, seit_msg. Geben Sie eine Formel f ür die Gesamt- rechenzeit f ür eine Iteration aufp Knoten an. Die Einträge vonx^p^k^q seien mit doppelter Ge- nauigkeit gespeichert, so dass jeder Eintrag 8 Byte belegt. (Die Formel soll nur asymptotisch korrekt sein; beispielsweise muss nicht gesondert ber ücksichtigt werden, dass die Matrixzeilen zu Randknoten weniger Einträge haben.)

3. Geben Sie tabellarisch den Speedup des parallelen Verfahrens bei folgenden Parametern an:

t_op2ns t_byte20ns t_msg5000ns

nP t1024,4096u pP t1,4,16,256,4096u

12 Punkte

(2)

U¨BUNG7 GEBIETZERLEGUNG

SieΩR^dein Lipschitz-Gebiet (offen, zusammenh¨angend und beschr¨ankt) und seif PH¹pΩq gegeben. Das homogene Poisson-Problem lautet

∆upxq fpxq @xPΩ

upxq 0 @xP BΩ (1)

SeiΩ₁,Ω₂ eine Gebietzerlegung des GebietesΩ:

ΩΩ1YΩ2, Ω1XΩ2∅, Γ BΩ1X BΩ2, µpBΩiq ¡0,

und BΩi sind Lipschitz-stetig. Dann ist das Problem (1) dem folgenden Problem (im schwachem Sinne) equivalent, fallsf regul¨ar genug ist:

∆u1pxq fpxq @xPΩ1

u₁pxq 0 @xP BΩ₁zΓ u₁pxq u₂pxq @xPΓ Bu1pxq

Bn1

Bu2pxq

Bn2 @xPΓ

∆u2pxq fpxq @xPΩ2

u₂pxq 0 @xP BΩ₂zΓ

(2)

Reicht die Regularit¨at der Funktionf, d.h.f PH¹pΩq?

Hinweis:

Betrachten Sie das Poisson-Problem auf dem GebietΩ p1,1q d²u

dx² 2δ up1q up1q 0

woδdie Dirac-Delta-Funktion ist. Finden Sie die eindeutige schwache L ¨osung und untersuchen Sie die Bedingungen auf dem ¨UbergangΓin (2).

4 Punkte

U¨BUNG8 PARALLELEBERECHNUNG DERL²-NORM MITDUNE

In dieser Aufgabe soll die Berechnung derL²-Norm aus Aufgabe 1 parallelisiert werden. Dazu sollen Sie mehrere Prozesse über einen Teil des Gebietes integrieren und die Ergebnisse nachher aufsum- mieren. Die n ötigen Teile des Interfaces wurden in der Übung vorgestellt. Zusätzlich ist die Klas- seCollectiveCommunicationn ützlich – schauen Sie sich am besten die Online-Dokumentation dieser Klasse an. Den im Konstruktoraufruf ben ötigten MPI-Communicator erhalten Sie mit der getCommunicator()-Methode derMPIHelper-Instanz.

Um DUNE auf dem eigenen Rechner mit Unterst ützung paralleler Programmierung zu kompi- lieren, m üssen Sie eine MPI-Bibliothek installiert haben, beispielseweise OpenMPI. In allen Linux- Distributionen gibt es fertige Pakete daf ür. Außerdem m üssen alle Pakete mittels

dune-common/bin/dunecontrol --configure-opts="--enable-parallel" all neu kompiliert werden. Auf den Rechnern im CIP-Pool ist DUNE bereits

”parallel“ kompiliert.

4 Punkte