Darstellung der Routen - Visuelle Analyse von E-mail-Verkehr

Eine E-mail erreicht ihren Zielhost, indem sie vom Starthost ¨uber einen oder mehrere Mailser-ver weitergeleitet wird. Die Position eines solchen MailserMailser-vers wird hierbei als Knoten v ∈V eines ungerichteten Graphen G = (V, E) modelliert. Die Kante e ={v₁, v₂};e ∈E;v₁, v₂ ∈V stellt eine Teilstrecke der E-mail Route r dar. Eine Route sei definiert als r := (e₁, e₂, ..., e_n), wobei n die Anzahl der Teilstrecken von r ist.R sei die Menge der Routen.

Ist die Lokalit¨at eines Knoten v₂ ∈V einer Route r= ({v₁, v₂},{v₂, v₃}) nicht feststellbar, so werden die zu v2 adjazenten Kanten {v1, v2} und {v2, v3} aus r gel¨oscht und statt dessen die Kante {v₁, v₃} eingef¨ugt. Ist die Lokalit¨at eines Start- oder Endknotens nicht definiert, so wird nur die adjazente Kante gel¨oscht. Der Fall, dass eine Lokalit¨at nicht feststellbar ist, tritt erstens ein, wenn der Hostname eines Mailservers vom DNS-Server nicht aufgel¨ost wer-den kann. Zweitens kann es passieren, dass die Datenbank einer IP-Adresse keine Lokalit¨at zuweisen kann.

Jeder Kante e ={v₁, v₂} wird ein Gewicht w(e) zugewiesen, das der Anzahl an Routen r⁰ aus R_e, R_e⊂R entspricht.R_e sei definiert als ∀r⁰ ∈R :e∈r⁰. Daher gilt: w(e) = |R_e|.

Besteht eine Kante e = {v₁, v₂} aus zwei unterschiedlichen Knoten v₁ und v₂, so wird sie als Linie zwischen der Projektion der beiden Knoten, Π(v₁) und Π(v₂), auf dem Bildschirm dargestellt. Kanten e⁰ ={v1, v1} werden als kleine Quadrate dargestellt, da Linien der L¨ange 0 nicht auf dem Bildschirm erscheinen.

Die Anwendung der Normalisierungs-Funktion auf das Gewicht w(e) einer Kante e resultiert in einem Wert a=f_x(w(e)). Durch eine lineare Funktion c(a) erh¨alt man nun den Index der entsprechenden Farbe im Colormap.

Abbildung 2.17: Alle Routen Abbildung 2.18: Routen, die mindestens 10 mal frequentiert wur-den

Auf Routen ¨uber die Datumsgrenze wurde verzichtet, da diese durch die verwendeten Kar-tenprojektionen sehr schwer verfolgbar sind. Durch Verwendung von KarKar-tenprojektionen, wie beispielsweise der Hammer-Aitoff Projektion, wird die Weltkugel als Ellipse dargestellt.

Auf-grund der rechteckigen Beschaffenheit von Anwendungsfenstern entstehen an den Ecken des Fensters Bereiche, die nicht zur Darstellung der Projektion verwendet werden. Wird nun eine Route ¨uber die Datumsgrenze eingezeichnet, so verl¨auft sie vom Startknoten bis zur Außenkan-te der Ellipse und auf der anderen SeiAußenkan-te von der AußenkanAußenkan-te der Ellipse hin zum ZielknoAußenkan-ten. Im Bereich zwischen Fenster und Ellipse d¨urften jedoch keine Linien eingezeichnet werden. Der Einfachheit halber werden die Routen ¨uber die Datumsgrenze als direkte Verbindungslinie zweier Knoten dargestellt. Im konkreten Anwendungsfall entstanden dadurch wenige st¨orende Uberlagerungen.¨

Der Einsatz von Line Shortening (vgl. Abbildung 2.2, Seite 8; [BEW95]) w¨are durchaus sinnvoll bei Darstellungen mit sehr viel ¨Uberlagerungen. Die Problematik wurde jedoch gel¨ost, indem Routen mit geringer Bedeutung durch den Benutzer ausgeblendet werden k¨onnen.

Ausblenden der Routen mit geringem Verkehr

Der ¨Ubersichtlichkeit halber lassen sich ¨uber ,,-” Routen mit geringem Verkehr sequentiell aus-blenden und ¨uber ,,+” wieder einblenden. Durch diese Interaktion kann der Benutzer selbst entscheiden, ob er alle Routen betrachten will, oder nur diejenigen mit einem von ihm selbst festgelegten Mindestverkehr. Vergleiche hierzu Abbildungen 2.17 und 2.18 auf Seite 25.

2.3.4 Rasterung

Das sequentielle Zeichnen aller Einzelrouten macht wenig Sinn, da alle Routen die gleiche Wertigkeit h¨atten und gleiche Teilstrecken ¨uberlagert werden w¨urden. Des Weiteren sind f¨ur den Betrachter zwei Routen, deren Koordinaten der Start- und Endknoten nur um wenige Sekunden voneinander differenzieren, nicht unterscheidbar.

Abbildung 2.19: Rasterung mit Aufl¨osung von 1× 1 Grad

Zur L¨osung dieses Problems wurde eine Rasterung eingef¨uhrt, welche die Menge aller m¨ ogli-cher Knoten auf IG 3 [−180,180]×[−90,90] ∈ IG eingeschr¨ankt (vgl. Abbildung 2.19, Seite 27). Hierbei treten allerdings Probleme im Detailbereich auf, da Knoten nun in Bereichen der Landkarte erscheinen, in denen keine Landmasse eingezeichnet ist. Zudem k¨onnen Knoten durch die Rasterung im Nachbarland erscheinen.

Eine adaptive Ver¨anderung der Rasterung je nach gew¨ahltem Zoombereich w¨are ebenso denkbar, ist jedoch mit Rechenaufwand verbunden. F¨ur den Betrachter k¨onnte es verwirrend sein, wenn er beispielsweise eine blaue Route heranzoomt und im Zoombereich statt der blauen Route drei gr¨une Routen erscheinen.

Bei der Spam-Visualisierung wurde bewusst eine semantische Rasterung auf L¨anderebene eingef¨uhrt. Diese Rasterung fasst alle Kanten des Graphen zusammen, welche als Start- und Endknoten die gleichen L¨ander haben. So k¨onnen Schlußfolgerungen auf die Ursprungsl¨ander des Spams gemacht werden. Vergleiche hierzu Abbildung 2.23 auf Seite 32.

2.3.5 Zoom

,,If the user sees an interesting pattern in the visualization window, a drag-and drop interface is available to drill-down to get details, explore context and take actions if neccessary. This provides an intuitive way of converting spatial information into detailed informations (...)” (Zitat entnommen aus [KNTK99])

Nach diesem Prinzip habe ich die Zoom-Funktion implementiert. Der Benutzer hat jederzeit die M¨oglichkeit, ¨uber eine Mausinteraktion einen Detailbereich der Visualisierung auszuw¨ahlen (vgl. Abbildung 2.20, Seite 28). ¨Uber die mittlere Maustaste kann er wieder aus dem Detail-bereich herauszoomen.

Abbildung 2.20: Zoom

Um den vom Benutzer ausgew¨ahlten Detailbereich anzuzeigen, m¨ussen zweierlei Transfor-mationen auf den 2D-Punkten ausgef¨uhrt werden (vgl. [FvFH96], Seite 201):

P⁰ = T +P Translation P⁰⁰ = S · P⁰ Skalierung

Der Bildbereich ist so festgelegt, dass der Punkt P = (0|0) in der Mitte des Bildschirms dargestellt wird. Somit ergibt sich die Translation aus der Negierung der Koordinaten des Zoombereichmittelpunkts.

W¨ahlt man beispielsweise den Bereich (8|48) × (12|52), welcher in etwa Deutschland in der Equirectangular-Projektion entspricht, ¨uber eine Mausinteraktion aus, so ergibt sich die Translation T aus den folgenden Berechnungen:

x_{M itte} = (8 + 12)÷2 = 10 (1) yM itte = (48 + 52)÷2 = 50 (2)

T =

−10

−50

(3)

Der Einfachheit halber sei der Bildbereich in diesem Rechenbeispiel auf die maximalen Ko-ordinatenwerte festgelegt, d.h. der x-Bereich variiert von -180 bis +180 und der y-Bereich von -90 bis +90. In der Implementierung wurde der vertikale Wertebereich etwas vergr¨oßert, um die Gr¨oße des Anwendungsfensters voll auszusch¨opfen und unerw¨unschte Verzerrungen zu vermeiden.

Die Skalierung errechnet sich aus dem kleineren Verh¨altnis der x- und y-Bildbereichen (Glei-chungen (6) und (7)) zu den entsprechenden Zoombereichen (Glei(Glei-chungen (4) und (5)). Somit wird garantiert, dass mindestens der ausgew¨ahlte Zoombereich auf dem Bildschirm sichtbar wird.

Somit kann f¨ur jeden Punkt P ein Bildpunkt P⁰⁰ errechnet werden:

P⁰⁰ =S · (P +T) =

Um einen Mehrfachzoom zu erm¨oglichen, m¨ussen die Translation und die Skalierung zwi-schengespeichert werden, da sie zur Berechnung des Zoomes im Zoombereich erneut ben¨otigt werden.

Im Dokument Visuelle Analyse von E-mail-Verkehr (Seite 26-31)