• Keine Ergebnisse gefunden

Die Visualisierung der PageRank-Berechnung

Im Dokument Der PageRank-Algorithmus (Seite 83-88)

6. DIE VISUALISIERUNG DES PAGERANK-ALGORITHMUS IN EINEM JAVA APPLET

6.1. I MPLEMENTIERUNG

6.1.4. Die Visualisierung der PageRank-Berechnung

Wurde ein Graph fertig konstruiert, kann die Visualisierung durch den „Start-Button“

gestartet werden.

6.1.4.1. Die Wahl der Parameter vor der Visualisierung

Bevor mit der tatsächlichen Visualisierung der PageRank-Berechnung begonnen werden kann, müssen zuerst die Parameter für diese ausgewählt werden.

Abbildung 19: Auswahl der Parameter vor der Visualisierung im Applet

Wie in Abbildung 19 ersichtlich, müssen sowohl die Anzahl der Durchläufe, als auch die Normalisierungsfaktor c gewählt werden. Letzterer wird standardmäßig mit 0.85 voreingestellt [PAGE_2], kann jedoch mittels Schieberegler auch verändert werden.

Die Anzahl der Durchläufe gibt an, wie oft der PageRank jedes Knoten im Graphen berechnet wird. Je höher die Anzahl der Durchläufe ist, desto genauer wird der PageRank berechnet. In diesem Applet muss die Anzahl der Durchläufe zwischen 1 und 30 liegen, da für jene Graphen, welche in diesem Applet dargestellt werden können, meist nach nur wenigen Durchläufen der PageRank exakt berechnet wurde und sich nicht mehr verändert.

Anzumerken ist, dass bei der Berechnung der PageRanks das Dangling Links Problem ausgeklammert wird und dessen „negativen Effekte“ (siehe dazu Kapitel 3.3.1) daher auftreten können.

Nach der Wahl der Parameter kann die Visualisierung beginnen.

Abbildung 20: Visualisierung der PageRank-Berechnung

In Abbildung 20 ist eine gerade laufende Visualisierung zu sehen. In dem obersten Panel werden nochmals die vorher gewählten Parameter (Normalisierungsfaktor c und die

Anzahl der Durchläufe) angezeigt. Rechts werden der Name und die ID der Seite angezeigt, von der gerade der PageRank berechnet wird. Darunter findet sich der Algorithmus für die Visualisierung. Dieser besteht aus 6 Schritten:

1. Neue Seite auswählen

Es wird eine neue Webseite ausgewählt, für die der PageRank berechnet wird. Diese wird grafisch hervorgehoben indem der Knoten im Graphen orange umrandet wird (siehe Knoten Site2 in Abbildung 20).

2. Gleichung aufstellen

Es wird die Gleichung für die Berechnung des PageRank der aktuellen Webseite aufgestellt. Diese Gleichung wird ebenfalls rechts im Fenster, unter dem Algorithmus für die Visualisierung, angezeigt. Sie hat stets folgende Form:

PR(IDU) = (1 – c) + c * ( ))

IDU entspricht dabei der ID der aktuellen Webseite. Die Variable c steht für den Normalisierungsfaktor. IDV1, IDV2 bis IDVn geben die ID von auf die aktuelle Webseite zeigenden Knoten an. NV1,NV2 bis NVn sind die Anzahl der Links auf den Webseiten IDV1 und IDV2.

Beispielsweise wäre dies für die Webseite „Site2“ in Abbildung 20:

PR(N1) = (1 - c) + c * )

Als zusätzliche visuelle Betonung werden die oberen Teile der Brüche in der Gleichung in der Farbe des Knoten dargestellt. Genaueres zu den Farben der Knoten findet sich in der Beschreibung des nächsten Schritts.

Sollte eine Webseite keine verwandten Knoten haben, d.h. gibt es keine Webseite, auf der sich ein Link zu der aktuellen Webseite befindet, werden die folgenden beiden Schritte „Verwandte Seiten markieren“ und „In die Gleichung einsetzen“ ausgelassen.

Die Gleichung wird daher sofort in folgender Form angezeigt:

PR(IDu) = (1 - c) + c * 0

Somit hat diese Webseite stets den Normalisierungsfaktor c als PageRank.

3. Verwandte Seiten markieren

Dabei werden alle Webseiten markiert, die einen Link auf die aktuelle Webseite enthalten. Die geschieht jeweils in der Farbe des Knoten:

Vor der Visualisierung wird jedem Knoten eine bestimmte Farbe zufällig aus einem Pool von 6 Farben zugeordnet. Diese Farbe bleibt während der gesamten Visualisierung konstant und soll dabei helfen, die Referenzen auf die aktuelle Webseite besser visuell wahrnehmen zu können.

Weiters wird in diesem Schritt auch eine kleine Zelle oberhalb jedes auf die aktuelle Webseite zeigenden Knoten angezeigt. Diese ist ebenfalls in der Farbe des Knoten gehalten und zeigt den PageRank dieses Knotens an (siehe Abbildung 20 bei den Knoten Site1, Site5 und Site7).

4. In die Gleichung einsetzen

In diesem Schritt des Algorithmus zur Visualisierung werden die Werte für den Normalisierungsfaktor c und die PageRanks jener Knoten, die einen Link auf die aktuelle Webseite haben, in die Gleichung eingesetzt.

Danach hat die Gleichung z.B.: für die Webseite „Site2“ in Abbildung 20 folgende Form:

Die Werte für die PageRanks der verwandten Seiten in dieser Gleichung erklären sich dadurch, dass alle Webseiten mit PageRank 1.0 initialisiert werden, sich die

Berechnung im ersten Durchlauf befindet, und der PageRank für die Webseite „Site1“

bereits berechnet wurde.

5. PageRank anzeigen

Nachdem in die Gleichung nun vollständig eingesetzt wurde, kann der PageRank für die aktuelle Webseite berechnet werden. Dieser wird dann unter der Gleichung angezeigt.

6. Markierungen löschen

Alle Markierungen im Graphen werden nun wieder gelöscht. Die aktuelle Webseite wird dabei in Abhängigkeit des gerade errechneten PageRanks skaliert. Damit die Skalierung für besonders große und kleine PageRanks die Darstellung des Knoten der Webseite jedoch nicht zu sehr verzerrt, werden die Länge und Breite des Knoten mit der Wurzel des PageRank multipliziert. Für einen PageRank von 0.15 würde die Bedeuten, dass sich der Knoten auf 0.15%, also etwa 38%, der ursprünglichen Größe verringert. Da der PageRank einer Webseite nie weniger als 0.15 betragen kann, ist die minimale Größe auch 38% der Standardgröße eines Knotens. Eine Begrenzung der maximalen Größe eines Knotens wurde nicht eingeführt, da die Vergrößerung eines Knotens auf den maximal denkbaren PageRank kein Problem darstellt.

Die Skalierung erfolgt immer auf die Größe des Knoten, die er vor Beginn der Berechnung hatte. Damit bleibt die Skalierung stets einheitlich für alle Knoten des Graphen.

Die einzelnen Schritte des Algorithmus der Visualisierung werden ebenfalls durch eine Farbgebung unterstrichen. So wird der Text bereits absolvierter Schritte grün eingefärbt.

Der Text jenes Schritts, in dem sich die Visualisierung gerade befindet, wird orange

Werden die beiden Schritte „Verwandte Seiten markieren“ und „In die Gleichung einsetzen“ ausgelassen (siehe Beschreibung des Schritts 2 „Gleichung aufstellen“), wird der Text dieser beiden Schritte grau eingefärbt.

Links unten im Visualisierungsfenster wird die Anzahl der bereits absolvierten Iterationen der Berechnung angezeigt. Wenn alle Iterationen abgeschlossen sind, wird der rechts unten im Visualisierungsfenster befindliche Button „PageRank Tabelle anzeigen“ aktiviert.

Mit diesem kann ein Dialog geöffnet werden, der die IDs, Namen und PageRanks aller Webseiten des Graphen enthält:

Abbildung 21: Tabelle der berechneten PageRanks im Applet

Durch einen Klick auf die Überschrift einer Spalte, kann nach der ID, dem Namen oder dem PageRank sowohl aufsteigend als auch absteigend sortiert werden.

Im Dokument Der PageRank-Algorithmus (Seite 83-88)