Dezentrale Anwendungen: Operationen auf verteilten Daten

(1)

Dimitri Samorukov

Dezentrale Anwendungen

Operationen auf verteilten Daten

Dissertation

Informatik

(2)

Dezentrale Anwendungen:

Operationen auf verteilten Daten

Dimitri Samorukov

April 2020

(3)

(4)

Dezentrale Anwendungen:

Operationen auf verteilten Daten

Dissertation zur Erlangung des akademischen Grades DOKTOR-INGENIEUR

der Fakultät für Mathematik und Informatik der FernUniversität

in Hagen

vorgelegt von

Dimitri Samorukov aus Porta Westfalica

Hagen, April 2020

(5)

Diese Stelle m¨ochte ich dazu nutzen, um meinen Dank an Personen aus meiner Umgebung auszusprechen, die mich all die Jahre begleitet haben.

In erster Linie geht mein Dank an Prof. Dr.-Ing. habil. Dr. h.c. Herwig Unger.

Er ist ein großartiger, harter und ebenso fairer Betreuer. Er hat daf¨ur gesorgt, dass ich das Beste aus mir herausholen konnte. Auch danke ich Dr.-Ing. habil.

Mario Kubek. Er hat mich durch seine Arbeit und Diskussion zu neuen Denk- weisen angestiftet. Des weiteren danke ich allen Beteiligten der Forschungs- gruppe, um die dezentrale Suchmaschine WebEngine und allen Mitgliedern des Lehrgebiet Kommunikationsnetze der Fernuni Hagen, f¨ur die Schaffung einer produktiven Arbeitsumgebung.

Der weitere Dank geht an Prof. Dr. Thomas Böhme und Prof. Dr. Dr. Wolfgang A. Halang für ihre fruchtbaren Diskussionen und Anregungen. Diese ließen mich über den Tellerrand meiner eigenen Umgebung blicken.

Mein besonderer Dank geht schließlich an meine Frau Olga. Sie ist f¨ur mich, wie kein Anderer, eine St¨utze gewesen.

(6)

Inhaltsverzeichnis

1 Einleitung 12

1.1 Motivation . . . 13

1.2 Der Beitrag dieser Arbeit . . . 16

1.3 Aufbau der Arbeit . . . 17

2 Stand der Technik 19 2.1 Klassische P2P-Netze . . . 21

2.1.1 Reduzierung der Kommunikationskosten . . . 22

2.1.2 Methoden des Lastenausgleichs . . . 27

2.1.3 Reduzierung der Latenzen . . . 28

2.1.4 Gestaltung der Operationen . . . 29

2.2 Grid- und Cloud-Computing . . . 32

2.2.1 Methoden des Lastenausgleich . . . 33

2.2.2 Reduzierung der Kommunikationskosten . . . 39

2.3 Kritik am Stand der Technik . . . 41

3 Das System 44 3.1 Peers . . . 44

3.1.1 Community . . . 44

3.1.2 Aufbau . . . 45

3.1.3 Kommunikation zwischen Peers . . . 45

3.2 Dezentrale Anwendung . . . 47

3.2.1 Verwaltungsstruktur der Anwendung . . . 47

3.2.2 Kommunikation innerhalb der Anwendung . . . 48

3.2.3 Operationen der Anwendung . . . 48

3.3 Das formale Model . . . 49

3.3.1 Peers . . . 49

(7)

3.3.2 Verwaltungsstruktur . . . 50

3.3.3 Abbildung von G_v auf G_p . . . 51

3.3.4 Lokale Sicht von Peer k_p aufG_v und G_p . . . 51

3.3.5 Operationen auf der Verwaltungsstruktur . . . 52

3.3.6 Weitere Zusammenh¨ange . . . 53

3.4 Modellierungen der Kommunikation . . . 54

3.4.1 Kommunikationsressourcen mit Latenzen und Bandbreiten . . . . 56

3.4.2 Verf¨ugbare Kommunikationsressourcen einer cp . . . 57

3.4.3 Ben¨otigte Kommunikationsressourcen einer c_v . . . 62

3.4.4 Verbindungsg¨ute g_v mit Latenz und Bandbreite . . . 67

3.4.5 Operationen und ihre Dauer Tov . . . 73

3.5 Problemdarstellung . . . 76

3.5.1 Formale Problemdarstellung . . . 78

4 Platzierung der Daten 80 4.1 Bewertung und Einordnung des Problems . . . 80

4.2 Anwendung des Sintflut-Algorithmus . . . 83

4.2.1 Einblick in Sintflut-Algorithmus . . . 83

4.2.2 Eingabeparameter . . . 85

4.2.3 Verschiebe-Richtung und Knotengewicht . . . 87

4.2.4 Generierung der initialen L¨osung . . . 89

4.2.5 Umsetzung des Manipulationsschritts . . . 91

4.2.6 Einbettung in den Sintflut-Algorithmus . . . 95

4.3 Zusammenfassung . . . 98

5 Peer-Ressourcen 99 5.1 Ressourcen-Variabilit¨at . . . 100

5.2 Multidimensionalit¨at der Ressourcen . . . 102

5.3 Zusammenfassung . . . 104

6 Verifikation 105 6.1 Hypothesen . . . 105

6.1.1 Entscheidungsgrundlage f¨ur Hypothesen . . . 105

6.1.2 Betrachtete Topologien . . . 107

(8)

Inhaltsverzeichnis

6.1.3 Zuf¨allige L¨osungsfunktion . . . 108

6.1.4 Zusammenfassung . . . 109

6.2 Aufbau der Simulationen . . . 110

6.2.1 Simulation des lokalen Peer-Verhaltens . . . 110

6.2.2 Simulation des globalen Anwendungsverhaltens . . . 119

6.3 Durchf¨uhrung der Experimente . . . 133

6.3.1 Lokales Peer-Verhalten . . . 134

6.3.2 Globales Anwendungsverhalten . . . 139

6.4 Diskussion und Bewertung der Ergebnisse . . . 142

6.4.1 Lokales Peer-Verhalten . . . 142

6.4.2 Globales Anwendungsverhalten . . . 146

7 Zusammenfassung und Ausblick 148 7.1 Zusammenfassung . . . 148

7.2 Ausblick . . . 149

A Anhang 151 A.1 Nachweise der Hypothesen des lokalen Verhaltens des Peers . . . . 151

A.1.1 Lokale Korrektheit: graphische Ergebnisse . . . 151

A.1.2 Lokale Korrektheit: Kumulierte Verl¨aufe . . . 156

A.1.3 Lokale Verkehr-Adaptierbarkeit . . . 158

A.2 Nachweise der Hypothesen des globalen Anwendungsverhaltens . . 160

A.2.1 Ausf¨uhrungsdauer der Operationen . . . 160

A.2.2 Gemessene Knotenlokalit¨aten . . . 164

(9)

Symbolverzeichnis

G_p Community der Peers als ungerichteter, vollst¨andiger Graph, definiert durchG_p = (Kp, C_p),C_p=K_p×K_p, mit K_p=k_p¹, ...k^N_p als Menge alle Peers in der Community.

k_p Ein Peer des Netzwerks G_p, definiert durch bereitgestellte R^b_p und aktuell frei verf¨ugbare Ressourcen R_p. k_p = (R^b_p, R_p).

R^b_p Insgesamt bereitgestellte Ressourcen f¨ur die Anwendung durch den Operator eines Peers.

R_p Aktuell frei verf¨ugbare Ressourcen f¨ur die Anwendung auf einem Peer.

cp Verbindung zwischen zwei Peers, gekennzeichnet durch ihre verf¨ugbaren Kommunikationsressourcen g_p.

g_p Verf¨ugbare Kommunikationsressourcen einer Peer-Verbindungc_p. G_v Graph der Verwaltungsstruktur, definiert durchG_v = (Kv, C_v),

C_p ⊆K_v×K_v, mit K_v=k_v¹, ...k_v^N.

k_v Ein Knoten innerhalb der Verwaltungsstruktur G_v.

R_v Menge der ben¨otigtenk_p-Ressourcen f¨ur einen Knoten k_v. c_v Inter-Struktur-Verbindung zwischen Knotenk_v im Graph G_v,

definiert durch ihreVerbindungsg¨ute g_v und ben¨otigte Kommunikationsressourcen V_in^v.

V_in^v Ben¨otigte Kommunikationsressourcen der Verbindungcv, korrespondiert zu den bereitgestellten Ressourcen g_p einer Peer-Verbindungc_p.

g_v Verbindungsg¨ute der Inter-Struktur-Verbindung c_v, ein

Optimierungskriterium. Beschreibt in wie weit die ben¨otigten Kommunikationsressourcen V_in^v aktuell zur Verf¨ugung stehen.

(10)

Inhaltsverzeichnis

Z_m Menge aller m¨oglichen Knotenzuordnungen z_m von K_v zu K_p. z_m Eine Knotenzuordnungen von KnotenK_v zu Peers K_p, entspricht

der Abbildung Φ :Kv →Kp.

Φ Abbildung der Knoten Kv auf Peers Kp, definiert durch Φ :K_v →K_p.

G^p_v Partition von GraphG_v bei der alle Knoten k_v dem lokalen Peer zugeordnet sind.

G^loc_v Partition von GraphG_v die ein Peer aus seiner, lokalen Sicht kennt. Es ist die PartitionG^pv, erweitert um Knoten kv auf anderen Peers mit direkter Verbindung zu Knoten ausG^p_v. G^loc_p Die N achbarschaf teines Peers, also der Teil von G_p zu dem er

¨uberG^loc_v verbunden ist.

K_p^loc Menge der Peers aus G^loc_p . K_v^loc Menge der Knotenk_v aus G^loc_v .

Φ^loc Abbildung der Knoten K_v^loc auf Knoten K_p^loc aus der lokalen Peer-Sicht.

Z_m^loc Entsprechend der Abbildung Φ^loc representiert Z_m^loc die Menge der m¨oglichen Knotenzuordnungen aus der lokalen Peer-Sicht.

Ov Eine Operationen auf der Verwaltungsstruktur Gv. Es gilt O_v ∈O_ges.

O_ges Menge aller Operationen auf der Verwaltungsstruktur G_v. P_ov Routing-Pfad einer Operation ¨uber die KnotenK_v als geordnete

Menge.

L_ov Gr¨oße einer Operation O_v in [bit].

T_ov Dauer in [s] des Laufs einer Operation O_v uber den Routing-Pfad¨ P_ov.

(11)

V_tr Bereitgestellte Kommunikationsressourcen einer c_p als Ubertragungsgeschwindigkeit [bit/s].¨

T_delay Bereitgestellte Kommunikationsressourcen einer cp als Latenz in [s].

T_v Ben¨otigte Kommunikationsressourcen einerc_v als Sendeperiode in [s].

N_v Ben¨otigte Kommunikationsressourcen einerc_v als Paketgr¨oße in [bit], die mit der Periode Tv verschickt werden.

T_send Versanddauer eines Pakets ¨uber cp, siehe Formel 3.1.

Nest Mindestanzahl der verschickten Pakete von jeder cv, f¨ur die Sch¨atzung vong_v, Formel 3.5.

t_block Zeit in [s],um die ein zu verschickendes Paket über c_p, auf Grund der belegten Verbindung seine gewünschte Periode überschreitet, Formel 3.5.

V_in^v Durchschnittliches Verkehrsaufkommen auf einer Verbindungc_v, Formel 4.1.

W_k_v Knotengewicht vom Knotenkv, Formel 4.2.

V_k^peer

v Peer-Verkehrsaufkommen, gesch¨atzte Verkehrsmenge vom lokalen Peer in richtung verbundenem Peer, Formel 4.3.

p(kv) Wahrscheinlichkeit für einen Knotenk_v für die Verschiebung gewählt zu werden, Formel 4.4.

O Fitnesswert einer gefundenen Zuweisung z ∈Z_m^loc als Entscheidungsgrundlage f¨ur die L¨osungssuche, Formel 4.7.

OS Schwelle des Fitnesswerts der Sintflut-L¨osungssuche, siehe Kapitel 4.2.6 und die Formel 4.8.

O_rnd Durchschnittliche Fitness der Lösungen bei Simulationen mit zufälligerLösungsfunktion. Siehe Kapitel 6.2.1.

(12)

Inhaltsverzeichnis

O_init Durchschnittliche Fitness der initialen L¨osung bei Simulationen mit optimierter L¨osungsfunktion. Siehe Kapitel 6.2.1.

Oopt Durchschnittliche Fitness der finalen L¨osung bei Simulationen mit optimierterL¨osungsfunktion. Siehe Kapitel 6.2.1.

O_init Normierung von O_init aufO_rnd. Siehe Kapitel 6.2.1.

O_opt Normierung von O_opt auf O_rnd. Siehe Kapitel 6.2.1.

T^Rand Durchschnittliche Ausf¨uhrungsdauer von Operationen bei

Simulationen mit zuf¨alligerL¨osungsfunktion. Siehe Kapitel 6.2.2.

Tôpt Durchschnittliche Ausführungsdauer von Operationen bei Simulationen mit optimierterLösungsfunktion. Siehe Kapitel 6.2.2.

T_allocôpt Durchschnittliche Ausführungsdauer von Operationen bei Simulationen mit optimierterLösungsfunktion und gemessenem Verkehrsaufkommen. Siehe Kapitel 6.2.2.

T^opt Normierung von T^opt auf T^Rand. Siehe Kapitel 6.2.2.

T_alloc^opt Normierung von T_alloc^opt auf T^Rand. Siehe Kapitel 6.2.2.

(13)

Die notwendige Hardware für die Verarbeitung der Daten hat in den letzten 80 Jahren enorme Entwicklungen gemacht. Diese ging von teuren, zentralisierten Großrechnern über den privaten Rechner für jeden Haushalt bis hin zur Massenware, wie mobile Telefonie oder einfache Temperatur-Sensoren. Mit der Leistungsfähigkeit und der Verbreitung nahm die Heterogenität der Hardware eben so zu. Es gibt weiterhin leistungsstarke Hardware (Großrechner, Cloud), während am anderen Skalenende Einfachstrechner vorherrschen.

Mit der Verbreitung der Hardware wurde die Notwendigkeit deren Vernetzung erkannt. Produzierte Daten mussten effektiv ausgetauscht werden. Nicht jeder Datenproduzent ist in der Lage, diese auch zu verarbeiten. Nicht jeder Daten- verarbeiter besitzt die Daten. So, im Falle des einfachen Temperatur-Sensors, ist dieser weder in der Lage seine eigenen Daten langfristig zu speichern, noch effektiv mit dieser Datenmenge zu arbeiten. Durch die Vernetzung erh¨alt er jedoch Zugriff auf andere Hardware, deren Speicher- und Prozessorressourcen die erzeugten Daten verarbeiten und speichern k¨onnen.

Wer ist den nun der Empfänger dieser Sensordaten? Ist es ein einzelner Groß- rechner, der genug Ressourcen besitzt um diese Daten langfristig zu speichern und ebenfalls zu verarbeiten, aber der nun die gesamte Gewalt über die Da- ten besitzt? Solche zentralisierten Systeme wurden schon früh als nachteilhaft empfunden. Die Besitzerinstanz kann bösartig, unzuverlässig bzw. überlastet sein, so dass die Daten nicht erreichbar oder verfälscht sind. Daher wird eine Community von Rechnern, in einem dezentralen Peer-to-Peer-Netzwerk (P2P) als bessere Alternative zum zentralisierten Ansatz gesehen.

Die Anzahl der Daten steigt weiter an, genau so wie die Anzahl und Hete- rogenit¨at der Hardware, die diese Daten bereitstellt bzw. konsumieren will.

(14)

1.1 Motivation

Diese Arbeit beschäftigt sich mit der Frage der effizienten Bereitstellung und dem Zugriff auf die Daten in dezentraler Weise, so dass die Heterogenität der vielfältigen Hardware durch die P2P-Community sinnvoll ausgenutzt wird.

1.1 Motivation

Eine P2P-Community besteht aus einer Menge von Hardware-Knoten, die ihre bestehenden Ressourcen wie Prozessorzeit, Speicherplatz, Ein-/Ausgabe- Peripherie einer dezentralen Anwendung zur Verf¨ugung stellen. Jeder Peer dieser Community kennt einen oder mehrere weitere Peers. Der Ressourcen-Beitrag eines Peers ist eine freiwillige Leistung. Sein Betrag unterscheidet sich von Peer zu Peer und unterliegt zeitlichen Schwankungen.

Diverse, aktuell existierende Anwendungen sind dezentral aufgebaut und erfordern für ihre Funktion eine vorhandene P2P-Community. Erwähnenswert hierbei sind die dezentralen Websuchen und soziale Netzwerke, Linked Data - Initiative und digitale Währungen. Diese Beispiele werden genauer beleuchtet.

Die dezentralen Websuchen ([46] ,[47], [21], [8]) stellen eine Alternative zu den kommerziellen und zentralisierten Ans¨atzen der Websuche-Anwendungen.

Der erstellte Datensatz hierbei besteht aus Klassifizierungsdaten des WWW.

Die Benutzer können der entsprechenden Community beitreten und erlauben der Anwendung die Nutzung der Ressourcen ihrer Peers. Die einzelnen Peers sind in der Verantwortung das WWW zu durchsuchen und die Ergebnisse der Webseiten-Klassifizierung in den global gehaltenen, für alle Peer sichtbaren Datensatz zu integrieren. Sucht nun ein Benutzer bestimmte Inhalte im WWW, so wird umgekehrt der global gehaltene Datensatz nach Einträgen, entsprechend den Suchkriterien durchsucht. Hierbei gibt es keine zentrale Instanz die über die Menge der Suchergebnisse oder deren Ranking [61] entscheidet.

Soziale Netzwerke, in ihrer dezentralen Ausprägung [15], geben dem Nutzer die volle Kontrolle über seine Daten. Die konkrete Realisierung unterscheidet sich jedoch von Umsetzung zu Umsetzung. Während Diaspora [17] alle Daten des Benutzers auf seinem lokalen Peer beibehält, erzeugt DECENT [34] einen

(15)

verteilten Datensatz (DHT, blockchain), der die Personeninformationen ver- schl¨usselt speichert. In jedem Fall existiert bei diesen Anwendungen immer ein Datensatz, der die Daten der Anwendung repr¨asentiert, aber dennoch dezentral gehalten wird.

Die Linked Data-Initiativen [25] bilden einen global verteilten Datensatz in der Community, basierend auf dem Symantic-Web-Ansatz. Einzelne, hauptsächlich wissenschaftliche Einrichtungen, stellen ihre Datenteile im globalen Datensatz bereit, diese müssen jedoch zu ähnlichen Daten verlinkt werden. Die Datenteile verbleiben auf eigenen Peers der Einrichtung. Ähnlich wie im WWW, besteht hier das Problem der Inhaltssuche. Es existieren sowohl zentralisierte als auch dezentrale Ansätze. Die vorhandene Peer-Community stellt Inhalte bereit, ist aber auch in der Lage Ressourcen für dezentrale Ansätze beizusteuern.

Auch digitale Währungen stellen eine dezentraler Anwendung dar. Das Ziel dieser Anwendung ist die Pflege und sichere Haltung eines verteilten Log- buchs mit Besitzinformationen. Dieses Logbuch ist ein dezentral gehaltener Datensatz. Der Kern der Anwendung ist die Zusage, dass einmal gespeicherte Einträge des Logbuchs im nach-hinein nicht mehr verändert werden können.

In ursprünglichen Versionen wurde der Datensatz durch vollständige Replika- tionen ([57]) zwischen Peers geteilt. Da der Datensatz auf mehrere Hundert GB anwuchs, waren nur wenige Peers bereit, entsprechend viele Ressourcen bereitzustellen und so schrumpfte die Community auf wenige Peers, die nun großen Einfluss in der Anwendung bekamen. Daher wurden Ansätze wie IOTA [63] entwickelt, die den großen, über mehrere Peers replizierten Datensatz, in kleineren, miteinander verknüpften Einheiten über die Peer-Community verteilen. Die Anforderungen an einen Peer wurden reduziert, dies vergrößert die Community, was den Einfluss böswilliger Peers reduziert.

Dieser verteilte Datensatz (auch Verwaltungsstruktur) stellt besondere Heraus- forderungen an die Anwendung, im einzelnen sind es:

• höhere Anfälligkeit gegenüber Datenverlust aufgrund ungeregelter Peer- Abwanderung

(16)

1.1 Motivation

• steigende Reaktionszeiten der Anwendung gegen¨uber einer zentralisierten L¨osung

• Ressourcenverantwortlichkeit: die Anwendung steht nun selbst vor der Aufgabe genügend Ressourcen für die Community einzusammeln anstatt, wie im zentralisierten Ansatz, von ihrer Verfügbarkeit auszugehen.

Die Peer-Abwanderung wurde bereits im Zusammenhang mit P2P-File-Sharing Netzwerken untersucht [77]. Diese Untersuchungen ergaben, dass nur wenige zuverlässige Peers im Vergleich zu unzuverlässigen existieren. Der Einfluss eines Peer-Fehlers kann reduziert werden indem Redundanzverfahren eingeführt werden. Eine redundante Datenhaltung bei unzuverlässigen Peers ist eine hohe Hürde. Die Entscheidung, die Ressourcen eines Peers zu verwenden, benötigt Kriterien und Verfahren, um aus der Masse der unzuverlässigen Peers, die zuverlässigen zu identifizieren. Eine Abwägung zwischen Peerwahl- und Redundanzverfahren muss die Anwendung für sich treffen.

Eine ungeregelte Peer-Abwanderung bedeutet einen Abbruch von laufen Opera- tionen der Anwendung und/oder Datenverlust. Die Notwendigkeit von erneuter Ausführung von Operationen erhöht ebenfalls ihre Reaktionszeit. Wobei die Reaktionszeiten auch durch weitere Faktoren beeinflusst werden. Operationen, die einige Teile des verteilten Datensatzes benötigen, sind gezwungen, für den Abschluss über mehrere Peers ihre Anfragen zu stellen. Hierbei spielen die Bandbreiten der Peer-Verbindungen, verfügbare Prozessor-Ressourcen und die Anzahl zu überbrückender Peers die wesentlichen Rollen. Auch hier kann die vorausschauende Wahl der Community-Teilnehmer Abhilfe schaffen, in dem nur gut verbundene Peers mit vielen Ressourcen-Reserven in die Community aufgenommen werden. Die Nutzung nur weniger Peers erhöht jedoch wieder den Einfluss vom einzelnen Peer. Es ist, aus zwei bereits genanten Gründen, nicht wünschenswert: a) wegen bösartigem Einfluss auf den Datensatz und Operationen und b) höherem Risiko für Datenverlust.

Es ist in der Verantwortlichkeit der Anwendung genügend Ressourcen anzusam- meln und ihre Community möglichst dezentral zu gestalten. Dafür muss diese Anreize schaffen. Die Peers müssen einen Vorteil dabei sehen, der Community anzugehören. Ist der Peer einmal der Community beigetreten, darf dieser durch

(17)

die Anwendung ebenfalls nicht missbraucht werden. Eine nicht ausreichende Ressourcen-Menge f¨uhrt zu steigenden Reaktionszeiten und im Extremfall zum Datenverlust. Dies reduziert wiederum die Akzeptanz der Anwendung beim Benutzer.

Die Akzeptanz der dezentralen Anwendungen leidet an oberen Herausforderun- gen. Die Benutzer erhalten nicht ihre gewohnten Reaktionszeiten der Anwen- dung, die Entwickler der Anwendung stehen vor ganz neuen Herausforderungen im Vergleich zu zentralisierten Ansätzen. Die Motivation dieser Arbeit ist es nun Verfahren zu entwickeln, um die Konkurrenzfähigkeit von dezentralen zu zentralisierten Anwendungen zu erhöhen. Für den Benutzer sollte es am Ende transparent sein, ob er gerade mit einer dezentralen oder zentralisierten Anwen- dung interagiert. Die Peers der Community werden durch die Anwendung nicht uberlastet, die Anwendung hat jedoch genügend Ressourcen zur Verfügung und¨ kann ihren Datensatz sicher in der Peer-Community halten.

1.2 Der Beitrag dieser Arbeit

Der Beitrag dieser Arbeit geht auf die vorher genanten Herausforderungen, im dezentralen Umfeld, ein.

Es wird die Reduzierung der Reaktionszeiten der Anwendung, bei paralleler Verbesserung der Ressourcenverf¨ugbarkeit adressiert. Wobei hier von einer Verwaltungsstruktur ausgegangen wird, deren Teile zwischen Peers verschoben werden k¨onnen.

Es werden Verfahren f¨ur folgende Fragestellungen geliefert:

• wie k¨onnen die Antwortzeiten der Anwendung verbessert werden und die vorhandenen Peer-Ressourcen besser genutzt werden

• wie kann die Ressourcenverf¨ugbarkeit in der P2P-Community insgesamt erh¨oht werden.

(18)

1.3 Aufbau der Arbeit

Es wird angenommen, dass die strikte Einhaltung der zugesagten Peer- Ressourcen, die Wahrscheinlichkeit für den längeren Verbleib eines Peers in der Community erhöht. Dies vereinfacht die Ressourcenverantwortlichkeit der dezentralen Anwendung.

1.3 Aufbau der Arbeit

Es folgen insgesamt weitere 6 Kapitel. An dieser Stelle soll dem Leser ein Uberblick ¨uber die gesamte Arbeit gegeben werden.¨

Das nachfolgende Kapitel 2 gibt einen umfassenden ¨Uberblick ¨uber die aktuellen Methoden der Antwortzeit-Verbesserung von verteilten Anwendungen.

Insbesondere werden solche Felder wie Cloud- und Grid-Computing, klassische P2P-Netzwerke aber auch verteilte Datenbanken untersucht. Es werden auch einige wichtige Begriffe erl¨autert, die sich in diesem Umfeld manifestiert haben und auch im Rest dieser Arbeit eine Rolle spielen. Das Kapitel wird mit Kritik am Stand der Technik abgeschlossen.

Das Kapitel 3 definiert das betrachtete System. Im ersten Teil findet eine sinngem¨aße Beschreibung des Systems der hier betrachteten verteilten Anwendung.

Daraufhin folgt eine, mehr formale Beschreibung der Teilnehmer des Models.

Im Einzelnen ist hier die Rede von Peers, mit ihren bereitgestellten Rechen- und Netzwerkressourcen, sowie von der Anwendung, die diese bereitgestellten Ressourcen f¨ur sich und ihre Verwaltungsstruktur ben¨otigt. Im weiteren Teil des Kapitels folgen Modelle der Kommunikation zwischen den Peers und innerhalb der Anwendung.

Die Definitionen aus Kapitel 3 erlauben es nun, das im Kapitel 1.2 angespro- chene Problem der Antwortzeitoptimierung, formal anzugeben. Dieses findet im Kapitel 3.5 statt. Auch hier folgt erst eine sinngem¨aße Beschreibung, bevor die formale Darstellung gegeben wird.

Im Kapitel 4 wird eine L¨osung f¨ur die Antwortzeitoptimierung gegeben. Die Verwaltungsstruktur wird als ein Graph modelliert. Damit reduziert sich das

(19)

Problem, auf ein Problem der Graph-Partitionierung mit gewichteten Kanten.

Wobei jedoch hier die Kantengewichte dynamisch sind. Schon das einfache Problem der Graph-Partitionierung ist als NP-Vollständig bekannt. Daher wird hierbei für die Lösung, auf den heuristischen Sintflut-Algorithmus gesetzt. So beginnt das Kapitel 4 mit einer Bewertung des Problems. Daraufhin werden die Eckpunkte des Sintflut-Algorithmus beleuchtet, bevor dann in den letzten Abschnitten die Adaption der Sintflut-Suche auf das hier vorliegende Problem beschrieben wird.

Die gefundene L¨osung funktioniert nur, wenn die Peer-Ressourcen als skalarer Wert dargestellt werden und diese nur in diskreten Schritten von festgelegte Schrittweite vom Peer angeboten und von der Anwendung konsumiert werden.

Dezentrale Anwendungen k¨onnen jedoch mehr als eine Peer-Ressource ben¨otigen und diese wird in kontinuierlichen Werten verbraucht. Im Kapitel 5 wird nun gezeigt, wie diese mehrdimensionale, kontinuierliche Ressourcen-Definition auf eine skalare, diskreten Darstellung reduziert werden kann.

Kapitel 6 hat zwei Zielsetzungen. Das erste ist die Verifikation des gewünschten Peer-Verhaltens. Das zweite ist der Nachweis, dass das erreichte Peer-Verhalten tatsächlich aus der globalen Sicht der verteilten Anwendung vorteilhaft ist. Im ersten Fall wird ein Peer betrachtet, der nur eine begrenzte Sicht auf seine Nach- barschaft besitzt und versucht sein Verhalten bezüglich dieser Nachbarschaft zu optimieren. Im zweiten Fall wird untersucht ob das gemeinsame, optimierte Verhalten der einzelnen Peers tatsächlich für die Optimierung der Antwortzeit von Operationen geeignet ist.

Zuletzt findet im Kapitel 7 eine abschließende Betrachtung statt, mit nach- folgendem Ausblick auf Aufgabengebiete, die sich aus dieser Arbeit ergeben haben.

(20)

2 Stand der Technik

Die dezentralen Anwendungen grenzen das betrachtete Umfeld ein. Dezentrale Anwendungen basieren entweder auf einem P2P-Netz oder Grid- bzw. Cloud- Computing. Es wird ein Überblick über die Methoden gegeben, die in jeweiligem Umfeld den Stand der Technik bilden. Der Fokus liegt hierbei auf der Reduktion der Antwortzeiten der Anwendung. Die Antwortzeit der Anwendung ist im wesentlichen geprägt von benötigten Kommunikationskosten ( Übertragungszeiten im Netzwerk), erforderlichen Prozessorressourcen (Ausführungszeiten) und den entstandenen Wartezeiten (z.B. durch ausgelasteten Prozessor in den Ubertragungspuffern) jeder ausgeführten Operation.¨

Mit klassischen Peer-to-Peer-Netzen sind Netzwerke gemeint, die sich innerhalb vom Internet gebildet haben. Diese Netze nutzen die IP-basierten Transport- schichten wie TCP bzw. UDP. Die oft genannten Vertreter hierbei sind Gnutella [67], Napster [72], freenet [11]. Ein P2P-Netzwerk besteht aus einzelnen Peers, die einige andere Peers des Netzwerks kennen. Diese Verbindungen, zusam- men mit den Peers, bilden das P2P-Netzwerk. Dieses Netzwerk ¨uberlagert das darunterliegende Netzwerk (Internet), daher ist an dieser Stelle oft von einem Overlay-Netzwerk die Rede. Als Teilnehmer des P2P-Netzwerks stellen die Peers ihre Ressourcen der Anwendung bereit. Dies sind in erster Linie der lokale Speicher, Prozessor-Zeit aber auch lokale Dateien. Peers treten spontan dem Netzwerk bei und verlassen dieses oft ohne ordentliche Abmeldung. Diese spontane Ab- und Zuwanderung muss als inh¨arente Eigenschaft eines jeden P2P-Netzwerks angesehen werden [77].

Dezentrale Anwendungen setzen auf P2P-Netzwerken auf. Die ersten dezentralen Anwendungen dienten dem Musiktausch(z.B.Napster [72]), andere dem Dateitausch (Gnutella [67]), wiederum andere kombinierten den Dateitausch mit Anonymisierungseigenschaften (freenet [11]). Es gibt jedoch auch Beispiele

(21)

für verteiltes Rechnen wie das Seti@Home - Projekt [36] , digitale Währungen (IOTA [63]) oder dezentralen Websuchen ([46] ,[47]). Bezeichnend für diese Anwendungen ist der Datensatz, auf dem diese Arbeiten. Dieser wird als Ver- waltungsstruktur bezeichnet.

So durchsuchen die dezentralen Web-Suchen das Web und generieren für die gefundenen Dokumente eine kompakte Beschreibung (den Index). Diese Be- schreibung wird im P2P-Netz der Anwendung gespeichert. Führt ein Benutzer eine Suche aus, so wird dieser Datensatz durchsucht und passende Dokumente bzw. Links zurückgegeben. Beispiele für solche Anwendungen sind gegeben in [8], [48]. Damit bildet diese Beschreibung die Verwaltungsstruktur der An- wendung. Weitere Beispiele der dezentralen Dokumentsuche sind gegeben in [46] [47]. Hierbei bilden die einzelnen Co-Occurrence-Graphen, die Knoten der Verwaltungsstruktur und die Menge aller Co-Occurrence-Graphen bildet die Verwaltungsstruktur. Im Fall von IOTA [63] sind es die gespeicherten Transak- tionen, in Form des gerichteten, azyklischen Graphen. So lässt sich bei jeder dezentralen Anwendung eine Verwaltungsstruktur identifizieren.

Grid-Umgebungen wurden schon sehr früh eingesetzt, um komplexe, langwierige Berechnungen in einem Zusammenschluss von mehreren, oft gleichwertigen Rechnern bzw. Prozessoren, auszuführen. Prägnant für dieses Umfeld ist auch die Gleichwertigkeit von Kommunikationskosten zwischen allen Prozessoren.

Neuerdings werden solche Umgebungen auch als Cloud bezeichnet. Wobei Cloud - Umgebungen explizit dafür ausgelegt wurden, die Rechenzeit als Dienstleistung (ähnlich wie Strom) zu verkaufen, während Grid-Computing mehr geschlossener Natur ist [23], wobei die Nutzung auf eine Organisation begrenzt ist. Beide stehen jedoch vor dem Problem der Verbesserung der Antwortzeit von eingelas- teten Operationen (engl. Tasks). Die Verfügbarkeit der Ressourcen muss hier nicht berücksichtigt werden, da es nur einen Betreiber der Anlage gibt, der sich um Verfügbarkeit von Ressourcen kümmert.

Die Ressourcenverfügbarkeit in den P2P-Netzwerken ist eins der Unterschiede zu zuverlässigen Grid-Computing-Umgebungen. In Letzteren kann eine An- wendung den Ausfall einer Ressource als Ausnahme betrachten, während dies bei P2P als Normalfall gilt. Des weiteren bildet die Heterogenität der Peers,

(22)

2.1 Klassische P2P-Netze

bez¨uglich ihrer Verbindungsgeschwindigkeit und bereitgestellter Ressourcen [67], ein weiteres Unterscheidungskriterium zu Grid-Computing-Umgebungen. Das Overlay bildet einen weiteren Unterschied zu Grid-Computing-Umgebungen.

Bevor ein Peer dem P2P-Netzwerk beitreten kann, muss dieser erst eine, evtl.

komplizierte Anmelde-Prozedur ausführen und sich erst in das Overlay einrei- hen. Im Gegensatz zu Grid-Umgebungen ist die Kommunikation zwischen den P2P-Teilnehmern nur über die Overlay-Verbindungen möglich.

2.1 Klassische P2P-Netze

Die dezentralen Anwendungen basieren auf Operationen. Diese starten auf einem Peer, besuchen mehrere und kehren dann, mit dem Ergebnis zum Aufrufer zurück. Je nach Ausprägung können es einfache Broad-Cast-Nachrichten im P2P-Overlay sein, oder jedoch an einzelne Peers gerichtete Nachrichten, die einem vorgegeben Pfad im Overlay folgen. Bezüglich der Optimierungen von Operationen innerhalb der dezentralen Anwendung, sind in den P2P-Netzen folgende Methoden gängig:

• das Overlay des P2P-Netzwerks wird entsprechend aufgebaut, dass Ope- rationen m¨oglichst kleine Kommunikationskosten erzeugen

• faire Lastverteilung zwischen Peers, so dass Operationen m¨oglichst ohne Wartezeit die Prozessorressourcen nutzen k¨onnen

• Nutzung von latenzbasierten Adressen, so dass Operationen nur Peers nutzen, die schnell erreicht werden k¨onnen

• direkte Optimierung von Operationen. Am Beispiel der Linked-Data w¨are es die Reduktion der ben¨otigten Kommunikationsmenge und Prozessorzeit durch die Gestaltung der Operation.

Diese Methoden werden in den folgenden Kapiteln genauer beleuchtet.

(23)

2.1.1 Reduzierung der Kommunikationskosten

Ein Overlay-Netzwerk kann die notwendigen Kommunikationskosten einer Operation, durch ein effektives Routing der Operationen, wesentlich beeinflussen.

In diesem Abschnitt werden die Overlay-Netzwerke der g¨angigen P2P-Systeme untersucht.

Die Peers sind auf die Dienste des Internet angewiesen. Da das Internet aus unterschiedlichen verbundenen Einzelnetzen besteht, sind nicht alle, für den Betrieb des P2P-Netzes benötigten Dienste, verfügbar. So verbieten die Provider ein internetweites Broadcast oder entspricht das Routing der IP-Pakete, nicht den notwendigen Anforderungen. Daher bilden die P2P-Netzwerke ihr eigenes, uberlagertes Netzwerk, in dem nur die Teilnehmer des P2P-Netzes vorkommen.¨ Dieses überlagerte Netzwerk (engl. Overlay) besitzt seine eigene, an die Zwecke des jeweiligen dezentralen Anwendung angepasste, Topologie [10]. Bilden die Knoten im Internet noch ein vollständig verbundenen Graphen, so wandelt das Overlay die Topologie zu einem Ring, Baum, Small World [52],[7] etc. . Beim Betreten des P2P-Netzwerks sucht jeder neuer Peer seine Nachbarn und reiht sich so, in das existierende Overlay ein. Hierzu muss der Peer jedoch zumindest einen, existierenden Teilnehmer des P2P-Netzwerks, kennen bzw.

finden. Hierfür werden die sogn. ’bootstrapping nodes’ verwendet, die eine feste, statische IP-Adresse verwenden, oder es werden die DNS-Dienste des Internet eingesetzt. Damit lösen neue Peers vorhandene Teilnehmer über ihren Domänen-Namen auf.

Ein Beispiel eines Overlay-Netzwerks ist im Bild 2.1 dargestellt. Hier sind alle Rechner über ein einfaches, lokales Netzwerk verbunden. Jeder Rechner kann jeden anderen erreichen. Einige Rechner sind jedoch Teil einer dezentraler Anwendung. Die hierfür ausgewählte Rechner kommunizieren bevorzugt nur mit speziellen Rechnern, die in der Logik der Anwendung ihre Nachbarn sind.

Damit bilden diese Rechner, f¨ur die Anwendung ein eigenes Netzwerk, das Overlay.

(24)

Abbildung 2.1: Beispiel eines Overlay-Netzwerks, eingebettet im einfachen Ethernet-Netzwerk

Die Topologie des Overlays bildet ein wesentliches Unterscheidungsmerkmal der P2P-Netzwerke untereinander. Sie lässt sich grob in strukturiert und un- strukturiert einteilen. Bei strukturierten P2P-Netzen wie CAN [66], Chord [76], Tapestry [87] und Pastry [68] geht es in erster Linie darum, das Routing zu den gesuchten Inhalten bzw. Knoten zu optimieren. So setzt CAN [66] auf eine Zonenaufteilung des kartesischen Adressraums. Chord [76] bedient sich einer Ringtopologie, mit einigen Links zu weit entfernten Peers. Tapestry [87] und Pastry [68] setzen auf einen aufwendigen Routingalgorithmus, in der Absicht den gesuchten Knoten oder einen seiner Nachbarn, möglichst schnell zu erreichen. In allen Fällen wird die Zieladresse, als Maß der Entfernung genommen.

Bei unstrukturierten Netzwerken wie Freenet [11], Gnutella [5] werden die Routings dynamisch, zu Laufzeit aufgebaut. In vielen F¨allen entstehen dabei Small-World-Netzwerke [42].

Die Zentralisierung ist ein weiteres Unterscheidungsmerkmal. Die P2P-Netze lassen sich grob unterteilen in zentralisiert, dezentral und hybrid. Bei dezentralen P2P-Netzwerken sind alle Peers absolut gleichberechtigt. Typische Beispiele hierfür sind freenet [11] und Gnutella[72]. Bei zentralisierter Lösung existieren im P2P-Netz Peers, die exklusiv spezielle Aufgaben ausführen können. Beispiel

(25)

hierfür ist das Napster-Projekt [72]. Hierbei melden sich die einzelnen Peers an einem Superpeer an. Alle Suchanfragen laufen über die Superpeers. Bei hybriden Lösungen erfüllen Superpeers zusätzlich noch Aufgaben von einfachen Peers.

Der Aufbau des Overlays hatte immer den Zweck, die Dienste des P2P- Netzwerks zu erlauben bzw. weiter zu optimieren. Der wichtigste Dienst ist die Informationsr¨uckgewinnung (engl. Information Retrieval (IR)). Ein Benutzer sucht im P2P Inhalte, Dokumente bzw. Peers, die diese Dokumente anbieten.

Das Gnutella-Overlay [5] ist eine unstrukturierte Topologe, die sich nicht an Inhalten der Peers orientiert. Der Benutzer ist gezwungen einen Broadcast uber das Overlay abzusetzen. Der Nachteil vom Broadcast, in einem Netzwerk¨ unbekannter Gr¨oße, ist die unvorhersagbare Dauer und die Unzuverl¨assigkeit der Ergebnisse. Der Benutzer weiß nie, ob alle relevanten Peers erreicht wurden.

Der weitere Nachteil ist das Fluten des Netzwerks. Ripeanu [67] identifizierte 95% des Verkehrs in Gnutella als laufende Suchanfragen.

Weitere Entwicklungen in diesem Bereich haben st¨arker die Inhalte der Do- kumente der Peers in den Aufbau des Overlay-Netzwerks einbezogen. Damit bestimmten die Inhalte eines Peers seine Platzierung im Overlay-Netzwerk.

Je ähnlicher die Inhalte der bereitgestellten Dokumente waren, desto näher wurden die Peers zueinander im Overlay platziert. Damit musste der Dienst der Informationsrückgewinnung aus der Suchanfrage des Benutzers, eine Adresse im Overlay-Netzwerk berechnen. Lediglich der Peer an der Adresse bzw. in seiner Nachbarschaft kamen als Suchziele in Frage. Die Vertreter dieser Methode bilden typischerweise ein Overlay der strukturierten Topologie (Ring, Baum, Gitter).

So bildet Chord [76] einen ringförmigen Overlay, mit einigen Abkürzungen (Fingers). Den Peers wird ein Adressbereich zugeordnet, welcher am besten ihren Inhalten entspricht. Hierfür müssen die Peers beim Betreten des Overlays, einen Hash-Wert über ihre Inhalte bilden. Für eine Suchanfrage in diesem Netz muss aus den Suchbegriffen ein Hash-Wert gebildet werden. Die Suchoperation fängt an einem bel. Peer an und navigiert zu dem Abschnitt des Rings, der

(26)

den wenigsten Abstand zu dem Hash-Wert der Suchanfrage hat. Weit entfernte Bereiche k¨onnen mittels Abk¨urzungen schnell erreicht werden.

CAN (content-addressable network) [66] bildet einen mehrdimensionalen, kartesischen Raum anstatt des Rings. Die Peers sind verantwortlich für die Pflege von einem Raum-Ausschnitt. Dieser Raum-Ausschnitt wird jedem Peers beim Betreten des Netzwerks zugewiesen. Knoten, die ihre Dateien anbieten wollen, generieren eine Adresse im CAN (z.B. Hash-Wert über den Dateinamen) für jedes Dokument und platzieren einen Link an der entsprechenden Adresse im CAN-Raum. CAN definiert damit Operationen get (Datei-Download), put (Platzierung von Dokument-Links) und lookup (Suchoperation). Alle Opera- tionen benutzen den mehrdimensionalen kartesischen Raum für das Routing innerhalb des CAN-Netzwerks.

Bekannte Protokolle sind ebenfalls Tapestry [87] und Pastry [68], beide basieren auf Plaxton [62]. Plaxton [62] definiert ein Overlay zwischen den Peers welches uber Peers verteilte, baumartige Verweise als Pfade zu den Dokumenten enthält.¨ Alle Peers besitzen eine zufällig gewählte Id. Soll ein Dokument in diesem Netzwerk platziert werden, so wird aus dem Dokument eine Hash-Summe berechnet. Das Dokument bzw. Link auf das Dokument wird auf einem Wurzel- Peer platziert, welcher den kleinsten Abstand seiner Id zu der Hash-Summe des Dokuments besitzt. Ausgehend von dem Wurzel-Peer wird ein virtueller, balancierter Dokumenten-Baum von Knoten über andere Peers verteilt (ein Konten pro Peer). Es gibt genau einen Dokumenten-Baum pro Dokument. Es können auch mehrere Kopien des Dokuments über die Peers verteilt werden, jede Kopie ist jedoch Teil des über die Peers gespannten Dokumenten-Baums. Der Sinn hiervon ist es, eine Route zu dem Dokument im P2P-Netzwerk zu gestalten, damit die Such-Operation a) mit Hilfe des Baums schneller an das gesuchte Dokument geleitet werden und b) unterwegs auch auf Kopien des Dokuments trifft, damit das Durchsuchen des Baums bis zum Wurzel-Peer überflüssig wird.

Tapestry [87] und Pastry [68] adaptieren Plaxton [62] f¨ur Herausforderungen im dynamischen Umfeld, wo Peers der Ab - und Zuwanderung unterliegen.

Weitere L¨osung f¨ur inhaltsbasierten Overlay bietet Neuser [58] an. In seiner Arbeit hat jeder Peer eine Adresse im zweidimensionalen, euklidschen Raum.

(27)

Der Peer kennt alle seine direkten Nachbarn im Raum und einige entfernte Peers, damit ist es eine Small-World-Topologie (siehe [42]). ¨Andern sich die Inhalte des Peers, so platziert sich dieser im Overlay neu. Nach physikalischen Analogien der Ladungsanziehung und -abstoßung ziehen sich Peers mit ¨ahnlichen Dokumenten an und stoßen sich ab bei sehr unterschiedlichen Dokumenten.

Bei der Durchquerung des Adressraums, rekonfiguriert der Peer ständig seine Verbindungen im Overlay. Verbindungen zu entfernten Peers werden zufällig gelöscht, durchquerte Peers, die nicht mehr direkte Nachbarn sind, werden zu entfernten Nachbarn. Eine Operation, die ähnliche Dokumente sucht, benötigt somit nur die direkten Nachbarn eines Peers, um weitere, ähnliche Dokumente zu finden. Entfernte Peers sind nur dann von Interesse, wenn der aktuelle Peer zu weit von Suchkriterien entfernt ist.

Freenet [11] erstellt ein unstrukturiertes Overlay und setzt dabei massiv auf Replikation der Dokumente. Das Hauptanliegen des Freenet ist die komplette Anonymität der Benutzer. Es soll von außen nicht erkennbar sein, wer ein Dokument in das Netzwerk platziert hat und wer darauf zugegriffen hat. Dazu wird ein Dokument bei der Platzierung in das Netzwerk zerteilt und über mehrere Peers verteilt. Teile des Dokuments liegen mehrfach verteilt, über verschiedene Peers. Je öfter auf ein Dokument zugegriffen wird, desto öfter werden seine Teile im Netzwerk repliziert. Die Zugriffe auf beliebte Dokumente sind daher schneller. Unbeliebte, selten benutzte Dokumente, verschwinden nach und nach aus dem Netz. Jeder Peer speichert Teile seiner gelesenen Dokumente lokal. Da der Speicherplatz begrenzt ist, löscht jeder Peer selten genutzte Teile der Dokumente. Damit implementiert Freenet neben der Such-/

Platzierungs-Operationen eine Vergessen-Operation.

Alle besprochenen Overlays (Chord [76], CAN [66], Tapestry [87] und Pastry [68], Plaxton [62], Freenet [11]) versuchen die Kosten der Informationsrückgewinnung zu minimieren. Einige, wie Plaxton [62], berücksichtigt ebenfalls die lokal genutzten Ressourcen der Peers. Die Minimierung der Kosten für Informa- tionsrückgewinnung wird entweder durch ein optimaleres Routing zwischen den Peers oder Replikationen erreicht. Im ersten Fall muss die Suchoperation weniger Peers besuchen, da das Overlay entsprechend strukturiert ist. Bei Replikationen, wie bei Plaxton [62], werden mehrere Kopien des Dokuments im

(28)

Overlay platziert, so dass die Suchoperation dadurch schneller abgeschlossen werden kann. Freenet [11] arbeitet ebenfalls mit Replikationen, dieser optimiert insbesondere Suchoperationen f¨ur beliebte Dokumente. Insgesamt l¨asst sich diese Art der Optimierung als Reduzierung der Anzahl von zu besuchenden Peers umschreiben.

2.1.2 Methoden des Lastenausgleichs

Weitere Ans¨atze der Optimierung der Operationen setzen auf eine faire Lastver- teilung zwischen den beteiligten Knoten. Die Idee dahinter: ist jeder beteiligte Peer etwa gleich belastet, so reduziert dies die Antwortzeit der Operationen, denn keine der ankommenden Operationen muss auf frei-werdende Ressour- cen warten. Im P2P-Umfeld wird hier von virtuellen Servern gesprochen ([65]

,[84],[88],[64],[82]).

Ein virtueller Server abstrahiert einen Peer, die verwalteten Regionen des P2P-Overlays werden nicht mehr fest einem Peer zugeordnet, sondern einem virtuellen Server. Die Zuständigkeitsbereiche im Overlay der virtuellen Server können klein gewählt werden, so dass ein Peer mehrere virtuelle Server halten kann. Dies führt nun zu der Möglichkeit virtuelle Server zwischen Peers zu verschieben, d.h. die Overlay-Zuständigkeitsbereiche können zwischen Peers wandern.

So schlägt Bienkowski [2], für den Lastausgleich zwischen Peers, einen vollständig dezentralen Algorithmus vor. Wobei hier periodisch die Overlay- Zuständigkeitsbereiche für alle Peers, im gesamten Netzwerk neu verteilt werden, mit dem Ziel jedem Peer die gleiche Länge vom Overlay-Zuständigkeitsbereich zuzuweisen.

Ein ähnlicher Ansatz wird auch durch Vu [82] favorisiert. Hier werden die globalen Lastinformationen durch jeden Peer gepflegt. Hierfür wird das gesamte Overlay in nicht-überlappende Gruppen strukturiert. Die Peers halten damit nur die Last-Informationen der ihnen bekannten bzw. verbundenen Gruppen.

(29)

Vu [82] nutzt diese, um nun die Last zwischen den Peers so zu verschieben, dass die Auslastung der Peers sich ausgleicht.

Qiao [64] besch¨aftigt sich ebenso mit dem Lastausgleich in den P2P-Netzwerken.

In seiner Arbeit [64] werden Methoden des Lastausgleichs, bekannt aus dem Grid-Computing-Umfeld, auf die P2P-Netzwerke übertragen. Hier wird der Gradientenfeld-Ansatz (siehe 2.2.1) verfolgt, so dass die Peers lediglich die Lastinformationen seiner lokalen Nachbarschaft kennen müssen und keine globalen Lastinformationen benötigen. Auch hier wird das Ziel verfolgt, die durchschnittliche Antwortzeit der Anwendung zu verbessern, indem die Peer- Belastung systemweit angeglichen wird.

2.1.3 Reduzierung der Latenzen

Die vorhergehenden Verfahren haben entweder das Overlay so optimiert, dass die Operationen schneller zum gewünschten Inhalt navigiert haben oder die durchschnittliche Peerbelastung so reduziert, dass jeder Peer annähernd gleich ausgelastet war. Damit erhoffte man ebenfalls die Antwortzeit der Operationen zu verbessern. Beides, die Overlay-Gestaltung und die Lastausgleichsprozeduren, erfordern jedoch einen nicht zu vernachlässigbaren Rechen- und Kommunikati- onsaufwand.

Der Kommunikationsaufwand wird beeinflusst a) durch die verf¨ugbare Band- breite und b) durch die Signallaufzeit (Latenz). Beides beeinflusst die RTT ¹ zwischen zwei Peers. Gelingt es diese zu reduzieren, k¨onnen weitere Verbesse- rungen der Antwortzeiten von Operationen erreicht werden.

Dieses Problem wurde durch Dabek [14] in Vivaldi angegangen. Dabek [14]

schl¨agt ein Adressierungssystem der Peers im Overlay vor, so dass aus den Adressen auf die Antwortzeit zwischen zwei Peers geschlossen werden kann.

Haben zwei Peers einen großen Abstand in dem Adressierungssystem, so haben diese auch eine hohe Round-Trip-Time. Damit muss keine Messung der Bandbreite etc. stattfinden. Allein die Kenntnis der Adresse ist ausreichend.

1Round-Trip-Time: Signallaufzeit von Quelle zu Senke und zur¨uck

(30)

Die Ergebnisse der Arbeit sind a) eine einfache, dreidimensionale, euklidische Adresse (mit Höhe), die es erlaubt auf die RTT zu schließen und b) die RTT hängt in erste Linie von dem geographischen Abstand der Peers ab, jedoch wird die Erde nicht vom Internet-Kern umschlossen. Mit dieser Definition kann nun ein Peer immer den Peer, mit dem kleinsten Abstand aus Vivaldi-Adressraum wählen, um so die Operationsdauer zu minimieren.

2.1.4 Gestaltung der Operationen

In vorhergehenden Kapiteln wurden die Operationsoptimierungen durch entsprechende Overlay-Topologien, Lastausgleichsmethoden und Latenzreduzie- rung, durch entsprechende Adress-Gestaltung des Overlays, beleuchtet. Weitere Möglichkeiten für Optimierungen befinden sich innerhalb der dezentralen An- wendung. Hierbei werden die Operationen so ausgeprägt, dass diese aus der Kenntnis oder Schätzung der vorliegenden Daten, ihre Ausführungsdauern reduzieren können. Auf Basis der P2P-Netzwerke wurde die sogn. Linked Open Data-Initiative entwickelt. Diese stellt einen großen Datensatz dezentral, aber zugängig für Abfragen durch Benutzer bereit. Repräsentativ für viele dezentrale Anwendungen, werden die Optimierungen von Operationen in Linked Open Data-Initiative untersucht.

Folgendes Beispiel ist charakteristisch für die Linked Open Data-Initiative. Es existieren große Datensätze von entschlüsselten Krebsgenomen. Auch wenn diese öffentlich zugängig sind, ist deren Auswertung jedoch für Außenstehende kaum möglich, aufgrund vom proprietären Datenformat [69]. Mit Hilfe von Linked Data werden diese Datensätze a) der Allgemeinheit im einfachen Format zur Verfügung gestellt und b) mit anderen Datensätzen in Beziehung gesetzt.

In diesem konkreten Beispiel ([69]) findet eine Verlinkung mit Publikationen statt, die auf entsprechende Krebsgenome-Daten zugreifen.

Die wesentlichen Elemente der Linked Open Data sind a) die Verlinkung der Daten [31] und b) eine Abfragesprache [30] f¨ur die Daten. Die Verlinkung basiert auf RDF (Resource Description Framework), in unterschiedlichen Darstellungs- sprachen (oft als XML). Ein RDF-Knoten besteht aus einem Tripel aus Subjekt,

(31)

Prädikat und Objekt. Es stellt zwei Ressourcen (Subjekt und Objekt) miteinander in Beziehung (Prädikat). Folgend dem oberen Krebsgenome-Beispiel ist damit folgende Aussage möglich: ”Genom A”(Subjekt) ”wird erwähnt in”(Prädikat) ”Dokument Z”(Objekt). Die Ressourcen werden durch URIs (Uni- form Resource Identifier) beschrieben. Dadurch ist eine rechnerübergreifende Verlinkung der Daten möglich. RDF-Knoten werden dezentral, von mehreren Benutzern verwaltet, daher ist es möglich, dass für ein Objekt mehrere solche Beschreibungen existieren. So kann eine Person mehrere RDF-Knoten in Lin- ked Open Data besitzen, angelegt durch seinen Arbeitgeber, seine Schule, die staatlichen Organe, usw.. .

SPARQL stellt eine Abfragesprache für die Linked Open Data dar. Mit dieser kann ein Benutzer Abfragen auf den Daten formulieren. Folgend dem oberen Beispiel : Bestimme alle Dokumente, die das Genom Z erwähnen (SELECT Document WHERE {Document mentions Genom A}). Die typischen Schritte der Abarbeitung der Anfrage sind die Zusammenstellung der Angefragten Ressourcen, Filterung und Zusammenfassung der Ergebnisse und eventuelles Ranking. RDF und SPARQL stellen Grundlagen für die Operationen auf den Linked Open Data.

Wie auch in anderen verteilten Systemen, leiden die Operationen hierbei unter mangelnder zeitlicher Effizienz. Die Abfrageoperationen stehen vor dem Problem einer effizienten Suche von Daten, verteilt über viele Ressourcen auf vielen Rechnern. Neben der unbekannten Datenmenge und Anzahl der betroffenen Rechner, spielen hier auch die Kommunikationseigenschaften eine wesentliche Rolle. Die Kommunikationseigenschaften der Rechner können nicht beeinflusst werden. Es kann jedoch die Operation an sich optimiert werden indem a) nur auf lokale, vorher gesammelte Daten zugegriffen wird oder b) durch Optimierung der Ausführung der SPARQL - Anweisung [79] indem die Anzahl der befragten, entfernten Rechner minimiert wird. Zwischen diesem beiden Extrema existieren diverse Abstufungen mit hybriden Lösungen, die einen minimalen lokalen Index der entfernten Rechner aufbauen. Im zweiten Fall bleibt die Aktualität der Daten besser gewährleistet, während im ersten Fall oft bessere Effizienz erreicht wird. Vor einem ähnlichen Problem stehen auch die Suchmaschinen des World Wide Web. Der Zugang zu entfernten Ressourcen ist immer ineffizienter als der

(32)

lokale Zugriff. Daher erstellen die WWW-Suchmaschinen ein lokales Abbild des WWW, ein Index, welches effektiv zugängig ist und für die Benutzerabfragen eingesetzt wird. Bessere Aktualität der Daten gewährleisten jedoch dezentrale WWW-Suchmaschinen ([46],[21]). Es folgen einige konkrete Arbeiten aus dem Umfeld von Linked Open Data.

Cheng und Qu[6] entwickelten eine zentralisierte Suchmaschine für RDF-Knoten für Linked Open Data. Sie sammelt alle gültigen RDF-Knoten durch zyklischen Abfragen von bekannten Quellen, folgt den im RDF-Knoten angegebenen Ressourcen und speichern deren virtuelle Dokumente (d.h. eine Beschreibung des Inhalts des RDFs). Der Benutzer kann nun mit Hilfe von Stichwörtern nach RDF-Knoten, in komplett zentralisierter Art über eine Web-Oberfläche, suchen.

Hierbei wird nicht die SPARQL- Abfragesyntax eingesetzt, sondern lediglich reine Stichwortsuche.

Schwarte [74] setzt in seiner Lösung FedX auf eine direkte Abfrage der Quel- len zur SPARQL-Abarbeitung. Es wird ein Verfahren beschrieben, um die SPARQL-Anfrage so zu verarbeiten und gruppieren, dass die Anzahl der Zu- griffe auf entfernte Rechner minimiert wird. Damit wird die zeitliche Effizienz der Anfrageverarbeitung verbessert. Auf den lokalen Systemen steht eine Liste aller möglichen Quellen mit RDF-Objekten zur Verfügung. Zu jeder SPARQL- Anfrage wird aus dieser Liste eine Untermenge von Quellen gebildet, die dem Endergebnis beitragen können. Dazu wird jede Quelle im Vorfeld einzeln angefragt. Im Zweiten Schritt wird die gestellte SPARQL-Anfrage ausgeführt. Dazu wird eine heuristisch basierte Abfragereihenfolge der Quellen festgelegt. Damit werden Mehrfach-Anfragen einer Quelle durch eine gruppierte Einzelabfrage ersetzt.

Umbrich [79] setzt in in seiner Arbeit auf einen hybriden Ansatz, indem die Abarbeitung der SPARQL-Anfrage erst die lokal gehaltenen Daten inspiziert und daraufhin Entscheidung f¨ur den Zugriff auf die entfernten Ressourcen trifft. Die betroffenen Ressourcen werden hier von der anfragenden Instanz einzeln angefragt und verarbeitet. Das Ergebnis der SPARQL-Anfrage wird am Ende, aus den gelesenen Ressourcen, zusammengestellt. D.h. die entfernten Rechner sind nicht in der Lage Teile der SPARQL-Anfrage vorzuverarbeiten

(33)

und somit nur die relevanten Teilergebnisse zur¨uckzugeben. Die lokal gehaltenen Daten beschreiben die Ressourcen von bekannten Quellen. Diese basieren auf sog. multidimensionalen Histogrammen. Damit wird eine Wahrscheinlichkeit angegeben, mit der eine bestimmte Ressource auf dem Zielrechner enthalten ist.

Für die Vorhersage der SPARQL-Ausführungzeit setzt Hasan [26] auf eine ma- schinelle Klassifikation der SPARQL-Anfrage. Damit versetzt er den Benutzer in die Lage, mit Hilfe der vergangenen Anfragen, auf die Ausführungszeit der aktuellen Anfrage zu schließen. Damit ist zumindest eine manuelle Anpassung der SPARQL-Anfrage möglich, vor der eigentlichen Ausführung. Joshi [37]

präsentiert in seiner Arbeit ein Verfahren, welches die SPARQL-Abfragen da- hingehen optimiert, dass die Strukturen der angefragten Quellen berücksichtigt werden und die SPARQL-Anfrage des Benutzers auf die konkreten Formate der Quellen angepasst wird. Dadurch wird der Benutzer davon entlastet, den genau- en Kontext der RDF-Einträge der Quelle zu kennen und bekommt dennoch gute Ergebnisse zu seiner Anfrage. Damit sind, neben der Performance der Abfragen, auch die Formate der verlinkten Ressourcen hinter den RDF-Objekten eine weitere Herausforderung. Einige Arbeiten (Karataev [38]) beschäftigen sich mit diesem Problem der sogn. Datenintegration.

2.2 Grid- und Cloud-Computing

Die Grid-Umgebungen gehen davon aus, dass es im System mehrere Tasks und Prozessoren gibt. Das Problem hierbei ist die Platzierung einer Task innerhalb des Grids (Zuweisung zu einem Prozessor), so dass diese m¨oglichst schnell, ohne Unterbrechungen abgearbeitet werden kann.

Für den reinen Lastausgleich wird davon ausgegangen, dass die Task alles notwendige für ihre Ausführung auf dem Prozessor vorfindet. Tasks haben keine Abhängigkeiten zu anderen Tasks, d.h. diese können atomar, für sich selbst ausgeführt werden. Die Verfahren des Lastausgleichs können einerseits nach Zentralität (zentral, dezentral), andererseits nach Dynamik (dynamisch,

(34)

2.2 Grid- und Cloud-Computing

statisch) unterschieden werden. Die Zentralität legt fest, ob es eine zentrale Instanz gibt, die für jede Task die Entscheidung über die Zuweisung zu einem Prozessor übernimmt. Die Dynamik entscheidet darüber, ob die Reihenfolge und Ressourcenbedarf der ankommenden Tasks bekannt ist und daher vorher geplant werden kann (statisch) oder eine dynamische Zuweisung bei unbekanntem Ressourcenbedarf stattfinden muss.

Einige Autoren haben jedoch auch erkannt, dass die Tasks nicht immer un- abhängig voneinander agieren können und die häufige Verschiebung von Tasks zwischen Prozessoren ihre Ausführungszeit negativ beeinflusst. Damit müssen auch hierbei entstehenden Kommunikationskosten in Betracht gezogen werden.

Die folgenden zwei Abschnitte widmen sich nun den Themen a) des Lastaus- gleich bei atomaren Tasks und b) Reduzierung der Kommunikationskosten w¨ahrend der Ausf¨uhrung der Task.

2.2.1 Methoden des Lastenausgleich

Zentralisierte Ansätze der Lastverteilung sind für dezentrale Anwendungen, mit ständig wechselnden, heterogenen Community-Teilnehmern nur schwer umsetzbar. Kein Teilnehmer der Community kann von einer vollständigen und aktuellen Datenbasis der Community-Teilnehmern und ihrer Ressourcen ausgehen. Daher sind hier dezentrale Methoden der Last-Verteilung vom hohem Interesse. Hierbei nutzt jeder Teilnehmer nur einen Ausschnitt der global verfügbaren Daten. Physikalische und biologische Systeme der Natur basieren auf diesen Gedanken. Frühere Forschung hat diese Ansätze untersucht und in technische Lösungen überführt.

Physikalisch inspirierte Methoden

Die physikalisch inspirierten Methoden ahmen die bekannten Ph¨anomene bei thermodynamischem oder mechanischem Ungleichgewicht nach. Die physikali-

(35)

schen Systeme versuchen die Ungleichgewichte immer auszugleichen, entweder durch Wärmefluss, Körperbewegung oder auf molekularer Ebene, durch Diffu- sion. Das Bild 2.2 stellt die Diffusion in Flüssigkeiten dar. Ein neu hinzugekom- mener Stoff verursacht zunächst ein Ungleichgewicht der Teilchen-Verteilung in der Flüssigkeit. Auf Grund der Brownschen Bewegung aller Teilchen in der Flüssigkeit, stellt sich nach einer Zeit eine Gleichverteilung aller Teilchen in der Flüssigkeit wieder ein. Das Ungleichgewicht bei Grid-Umgebungen ergibt sich aus unterschiedlicher Prozessor-Auslastung. Es werden einige konkrete Verfah- ren aus diesem Umfeld besprochen. Alle haben das Ziel die Prozessorbelastungen anzugleichen und ein Gleichgewicht herzustellen.

Abbildung 2.2: Diffusion in Fl¨ussigkeiten, Quelle: [80]

Hu und Blake [33] definierten eine Methode für hybriden Ansatz (mit zentralisierten dynamischen/statischen Elementen) für Lastausgleich, bei einer Anwendung der Finite-Element-Berechnung(PDE). Damit muss eine Last, be- stehend aus einem Graphen von Finiten-Elementen, auf einen Graphen von Prozessoren so verteilt werden, dass jeder Prozessor etwa ähnliche Anzahl von Finiten-Elementen erhält. Die initiale Aufteilung der Finiten-Elemente findet statisch statt, nach bekannten Methoden für Graph-Partitionierung [40].

W¨ahrend der Simulation wird der PDE-Graph ungleichm¨aßig verfeinert, d.h.

die Anzahl der PDE-Knoten steigt an einigen Stellen an und dies führt zur ungleicher Prozessorbelastung. Eine erneute Re-Partitionierung des gesamten PDE-Graphen ist kostspielig, da die neue Lösung eine Neuplatzierung aller PDE-Knoten erforderlich machen wird. Hu und Blake [33] schlagen hierfür

(36)

ein zentralisiertes, dynamisches Task-Zuweisungsverfahren vor, basierend auf der Diffusion. Ein hoch belasteter (heißer) Prozessor gibt seine Last an unter- belastete (kühlere), benachbarte Prozessoren ab. Die Last wird somit auf die benachbarte, kühlere Prozessoren abgeleitet, ähnlich wie bei der Tempera- turkompensation in Festkörpern. Ziel hierbei ist es, die Last der Prozessoren anzugleichen, bei gleichzeitiger Minimierung der Migrationen-Anzahl der PDE- Knoten. Interessant an dieser Problemstellung ist der Aufbau der Last, der PDE-Graph. Dieser entspricht im Grundsatz der Verwaltungsstruktur, wie bei dezentralen Anwendungen, betrachtet in dieser Arbeit. Da jedoch hierbei eine zentralisierte Lösung umgesetzt wurde, ist diese, im dezentralem Umfeld ohne Anpassungen, nicht einsetzbar. Die initiale Partitionierung vom PDE-Graph, als auch spätere Verschiebe-Entscheidungen der Knoten auf neue Prozessoren, werden zentral mit der globalen Sichtweise getroffen. Dieser Ansatz lässt sich jedoch in einer dezentralen Weise umsetzen, was auch durch den folgenden Gradientenfeld-Ansatz bewiesen wird.

Lin and Keller[49] entwickelten ein vollständig dezentrales, dynamisches Modell der Taskzuweisung zum Prozessor. Ähnlich dem Wärmefluss in Stoffen, fließen hier Tasks von überlasteten zu unterlasteten Prozessoren. Hierzu wird ein Gradientenfeld über die vorhandenen Prozessoren gebildet, basierend auf dem Lastzustand der Prozessoren. Die Lastzustände unterscheiden zwischen leicht, moderat und schwer. Den aktuellen Zustand meldet jeder Prozessor an seine Nachbarn. Wobei hier keine Beschränkungen an die Verschaltung bzw. Topologie der Prozessoren gestellt werden. Damit ist jeder Prozessor in der Lage die Richtung des unter-lasteten Prozessors zu bestimmen. Das Gradientenfeld ist somit eine verteilte Routing-Tabelle für Tasks, die vom überlasteten Prozessor in Richtung unter-lasteten Prozessors fließen. Diese Lösung betrachtet die Tasks ebenfalls als atomar, d.h. diese finden alle benötigten Ressourcen vor Ort, an jedem Prozessor und benötigen keine Kommunikation zu anderen Tasks. Im Gegensatz zu typischen Grid-Umgebungen, wird hier auch vom heterogenem Umfeld ausgegangen. D.h. die Prozessoren können unterschiedliche Anzahl an Ressourcen vorhalten.

Ein weiterer physikalisch-inspirierter Ansatz wurde durch Heiss and Schmitz [28] entwickelt. Dieser ist ebenfalls dynamisch und dezentral, basiert jedoch

(37)

auf Kräften, wie diese bei physikalischen Systemen auftreten. Auf jede Task des Systems wirken drei wesentliche Kräfte ein. Zum einen die anziehende Kommunikationskraft. Diese tritt zwischen zwei Tasks auf, wenn diese miteinander kommunizieren müssen. Diese Kraft ist proportional zur ausgetauschten Datenmenge. Eine weitere ist die Lastausgleichskraft, diese wirkt auf eine Task wenn die Potentiale der benachbarten Prozessoren unterschiedlich sind.

Als Potential wird hier die Menge der freien Ressourcen des Prozessors angenommen. Befindet sich eine Task auf einem überlasteten Prozessor (niedriges Potential), so wird diese von einem unterlasteten Prozessor(hohes Potential) angezogen. Die dritte ist die Dämpfungskraft. Diese wirkt auf eine Task von ihrem aktuellen Prozessor ein. Hierdurch wird Task an einer Migration zum benachbarten Prozessor gehindert. Damit wirkt die Dämpfungskraft entgegen- gesetzt der Kommunikationskraft und der Lastausgleichskraft. Hierdurch wird ein Oszillieren der Tasks zwischen Prozessoren verhindert. Heiss and Schmitz [28] setzen nicht nur auf Dezentralität, sondern berücksichtigen auch die Kom- munikationskosten zwischen den Tasks. Der jeweilige Prozessor muss lediglich die Lastinformationen mit seinen direkten Nachbarn austauschen. Es wird keine zentrale Instanz für die Organisation des Lastausgleichs benötigt.

Biologisch inspirierte Methoden

Mit Schwarm-Intelligenz wird das Verhalten von dezentralen, selbst- organisierenden Einheiten bezeichnet, die in der Summe das Optimum f¨ur die Gruppe erreicht. Obwohl jede Einheit wenigen, trivialen Regeln folgt, wird in der Gesamtheit jedoch ein ¨außerst komplexes Verhalten bewirkt (siehe Con- way’s Game of Life). Eric Bonabeau hat in seinem Buch ’Swarm intelligence’

[3] viele Beispiele für erfolgreiche, selbst-organisierende, dezentrale Systeme gebracht. Ameisen, Wespen, Bienen haben für sich selbst einfache Regeln entwickelt, die im Einzelfall trivial sind, in der Summe angewendet helfen jedoch der gesamten Kolonie (dem Schwarm) zu überleben. So hinterlassen Ameisen eine Duftspur zur Nahrungsquelle. Duftspur verliert mit der Zeit an Intensität. Folgen weitere Ameisen dieser Spur, wird diese erneuert und dadurch intensiver. Ist ein Pfad lang und entsprechend selten erneuert, wird

(38)

dieser von wenigen Ameisen benutzt. Sie weichen auf intensiver markierte Pfade aus. Dieses Vorgehen sorgt dafür, dass die Ameisen nach und nach den kürzesten Pfad zur Nahrungsquelle finden. Mit AntSim ¹ als Werkzeug lassen sich Ameisen-Kolonien bei der Futtersuche simulieren. Siehe hierzu das Bild 2.3. Hierbei sieht man einen Algorithmus, der nach dem oberen Muster arbeitet. Dieser findet in einer vollständig dezentralen Weise einen Weg durch das Hindernis zur Futterquelle. Mit dem Schritt 0 werden hier die Ameisen aus dem Nest entlassen. Diese beginnen ihre Umgebung zu erkunden. Nach ca. 3126 Simulationsschritten ist eine stabile Duftspur vorhanden, so dass die meisten Ameisen dieser zur Futterquelle folgen. Einige neuere Arbeiten auf dem Gebiet der Lastbalancierung für Grid-Computing haben auf diesen bzw.

¨ahnlichen Ideen aufgesetzt.

(a) Schritt 0 (b) Schritt 9 (c) Schritt 546

(d) Schritt 3126

Abbildung 2.3: AntSim-Simulation einer Ameisenkolonie

1AntSim v1.1,Quelle: http://www.nightlab.ch/antsim.php (2019)

(39)

Wenn Ameisen Objekte gleichmäßig verteilen wollen, so verhält sich jede einzelne nach folgendem Muster: a) wenn sie kein Objekt trägt, wandert sie zufällig herum, bis sie auf ein Objekt trifft und es aufnimmt; b) wenn eine Ameise ein Objekt trägt, lässt sie es erst fallen, nachdem sie ’für eine Weile’ zufällig herumgelaufen ist, ohne auf andere Objekte zu treffen. Dieses Prinzip wird durch Messor [56] angewendet, um im Grid-Computing-Umfeld die beteiligten Prozessoren gleichmäßig auszulasten. Hierzu wird eine Aufgabe in mehrere un- abhängige, atomare Tasks zerteilt und auf einem initialen Prozessor platziert. In diesem Netzwerk existieren mehrere Ameisen, die ständig über die Prozessoren wandern. Trifft eine Ameise auf einen überlasteten Prozessor, so merkt sie sich dessen Adresse und setzt ihre Wanderung fort, bis ein unterlasteter Prozessor gefunden wird. Die Wanderung der Ameisen geschieht hier nicht ganz zufällig.

Vielmehr sammelt jede Ameise auf ihrem Weg die Lastinformationen einzelner Prozessoren und hinterlässt ihre gesammelten Daten in den Prozessoren für andere Ameisen, als eine Art Duftspur zu unter- oder überlasteten Prozessoren.

Ob nun ein Knoten als ¨uber-oder unterlastet eingestuft wird, wird anhand der vorher gesammelten Lastinformationen entschieden.

Die ameisenbasierte Taskzuweisung in Messor [56] hat den Nachteil, dass die Ameisen lange leben und daher ein Kommunikationsaufwand besteht, auch wenn keiner der Prozessoren überlastet ist. Salehi [70] löst das Problem indem die Lebensdauer der Ameisen begrenzt wird bzw. die Anzahl der im System vorhandenen Ameisen an den Überlast-Zustand angepasst wird. Wenn viele Prozessoren überlastet sind, werden mehr Ameisen erzeugt. Die Lebenszeit der Ameise hängt ab von der Anzahl durchgeführter Migrationen zwischen den Prozessoren. Diese bestimmt essentiell die Anzahl lebendiger Ameisen und somit die Menge der Kommunikation im Netzwerk. Salehi [70] zeigt ein Verfahren, das die Lebenszeit der Ameise begrenzt, bei dennoch fairen Taskzu- teilung. Wie auch bei Messor [56], sammeln die Ameisen die Lastzustände der besuchten Prozessoren. Beim Besuch eines überlasteten Prozessors kann die Ameise ein Zuweisungsziel für die Tasks des überlasteten Prozessors vorschlagen.

Treffen sich zwei Ameisen auf einem Prozessor so, im Gegensatz zu Messor, findet der Austausch der Lastinformationen direkt statt. Damit bekommt jede Ameise einen größeren Überblick über den Gesamt-Lastzustand des Grids, mit

(40)

gleichzeitig reduziertem Kommunikationsaufwand.

Aber nicht nur das Verhalten von Insekten, sondern auch epidemische Ans¨atze wurden untersucht. Hierbei handelt es sich um Verfahren, die der Ausbreitung von Krankheiten in einer Individuen-Gruppe nachempfunden sind. Menon [55]

schl¨agt ein weiteres dynamisches, dezentrales Verfahren der Task-Zuweisung zum Ausgleich der Prozessorauslastungen, in einer festen Grid-Umgebung vor.

In einer statischen Grid-Umgebung (Großrechner) müssen Tasks so zugeordnet werden, dass alle Prozessoren annähernd gleich ausgelastet sind. Die überladenen Prozessoren führen die Zuweisung eigenständig aus. Hierzu benötigen sie die Adressen von unterlasteten Prozessoren. Dafür verteilen die unterlasteten Pro- zessoren ihren Lastzustand und Adresse im gesamten Grid, mit dem Ziel, dass jeder überlastete Prozessor mind. einen unterlasteten Prozessor kennt. Für die Verteilung der Lastinformationen wählen die Prozessorenf zufällige Prozessoren aus dem Grid-System und infizieren diese mit ihren Lastinformationen. Die Infi- zierten wiederum infizierten weitere Prozessoren. Mit dem Ziel die überlasteten Prozessoren zuerst mit neuen Lastinformationen zu versorgen, werden für die Weiterleitung der Lastinformationen nicht die lokal bekannten, unterlasteten Prozessoren verwendet. Ebenso wie die Verteilung der Lastinformationen, wird die Taskzuweisung stochastisch durchgeführt. Der überlastete Prozessor weist mit der höchsten Wahrscheinlichkeit dem Prozessor, mit der niedrigsten Last seine Tasks zu. Auch Menon [55] geht in seiner Arbeit von atomaren Tasks aus, jedoch sind sie auf Ergebnisse anderer Tasks für die Fertigstellung angewiesen.

Die platzierten Tasks repr¨asentieren Teile einer großen Aufgabe. Die Tasks sind hierarchisch strukturiert und kommunizieren nur mit ihren Eltern- oder Kinder-Tasks.

2.2.2 Reduzierung der Kommunikationskosten

Die hierarchische Task-Strukturierung ist anscheinend in der Lage die Kom- munikationsaufw¨ande zwischen den Tasks deutlich zu reduzieren. Hasanov [27] zeigt ein Verfahren, wie aus der Anwender-Sicht die Tasks sich hierarchisch strukturieren lassen. Im Umfeld des Grid-Computing wird MPI [32]