• Keine Ergebnisse gefunden

Regul¨ are E-mails

Im Dokument Visuelle Analyse von E-mail-Verkehr (Seite 33-46)

Es wurden 20 197 mails eines wissenschaftlichen Mitarbeiters untersucht. Diese 20 197 E-mail splitten sich wiederum in 41278 Teilrouten auf, die detailliert untersucht werden. Hierbei ist klar zu stellen, dass nicht jede reale E-mail Route aufgesplittet werden konnte.

Auff¨allig an diesen E-mails war, dass die am st¨arksten frequentierte Route eine Punktroute in Konstanz war (vlg. Abbildung 2.22, Seite 32). Dies bedeutet, dass sehr viel E-mail Verkehr von Konstanz nach Konstanz gesendet wurde. Daf¨ur gibt es zweierlei Erkl¨arungen. Zum einen l¨auft viel E-mail Verkehr innerhalb des Lehrstuhls oder der Universit¨at ab und zum anderen k¨onnen ein oder mehrere Forwarder innerhalb der Universit¨at aktiv sein.

Unter den 41278 Teilrouten waren bei einer 1×1 Grad-Rasterung 538 geographisch unter-schiedliche Routen feststellbar. Bei einer semantischen Rasterung auf L¨anderebene hingegen nur noch 161.

Herausstechend war bei der Analyse des regul¨aren E-mail Verkehrs, dass die Teilroute Deutschland - Deutschland 83,59 % des Verkehrsaufkommens ausmachte (siehe Tabelle 2.1 auf Seite 33). Es ist anzunehmen, dass ein Großteil dieser Teilrouten auch ohne Forwarder

pflegen, so z.B. der Kontakt zu den Studenten, anderen Mitarbeitern der Universit¨at und Ko-operationspartnern in Deutschland.

Die Route mit dem zweitmeisten Verkehrsaufkommen befindet sich innerhalb der USA und ist mit 9,31 % wesentlich bedeutender als die Route von der USA nach Deutschland mit ledig-lich 3,72 %. Hieraus entsteht die Vermutung, dass die E-mails von der USA nach Deutschland im Schnitt erst 212 mal weitergeleitet werden, bevor sie die USA verlassen. Bevor man jedoch voreilige Schl¨usse zieht, sollte in Betracht gezogen werden, dass die GeoIP-Datenbank (vgl.

[GeoIP03]) ca. 1,3 Milliarden IP-Adressen den USA zugeordnet hat. Als n¨achsth¨aufigstes Land wurden Japan jedoch nur 105 Millionen IP-Adressen zugeordnet.

Die vierth¨aufigste Route ist von der Schweiz in die Schweiz. Seltsam finde ich auch hier, dass im Schnitt jede E-mail von der Schweiz nach Deutschland 3,93 mal innerhalb der Schweiz weitergeleitet wird, bevor sie nach Deutschland gelangt. Dieser Berechnung liegt die Annahme zugrunde, dass E-mails von der Schweiz direkt nach Deutschland weitergeleitet werden und nicht ¨uber Amerika nach Deutschland gelangen.

Der Verkehr der weiteren L¨ander-Routen erschien mir zu gering, um ihn n¨aher zu untersu-chen und Folgerungen daraus abzuleiten. Dem interessierten Leser m¨ochte ich diese Routen jedoch nicht vorenthalten.

Rang Land1 Land2 Anzahl Anteil Teilrouten

1. Deutschland Deutschland 34505 83,59 %

2. USA USA 3842 9,31 %

3. USA Deutschland 1535 3,72 %

4. Schweiz Schweiz 471 1,14 %

5. Schweiz Deutschland 120 0,29 %

6. China Deutschland 60 0,15 %

7. Finnland Deutschland 56 0,14 %

8. Frankreich Frankreich 51 0,12 %

9. Kanada Deutschland 30 0,07 %

10. Großbritannien Deutschland 30 0,07 %

11. Schweden Deutschland 29 0,07 %

12. Großbritannien Großbritannien 29 0,07 %

13. S¨udkorea Deutschland 28 0,07 %

14. Frankreich USA 27 0,07 %

15. Osterreich¨ Deutschland 27 0,07 %

16. Brasilien Deutschland 26 0,06 %

17. Schweden Schweden 26 0,06 %

18. Kanada Kanada 25 0,06 %

19. Großbritannien USA 21 0,05 %

20. USA Osterreich¨ 21 0,05 %

Tabelle 2.1: Teilrouten der regul¨aren E-mails

Die visuelle Detailanalyse der Deutschlandrouten (siehe Abbildung 2.20, Seite (28) ergab

fol-gende Teilrouten, geordnet nach Verkehrsaufkommen: Konstanz - Konstanz, Hamburg - Ham-burg, Karlsruhe - Bremen, Karlsruhe - Konstanz, Karlsruhe - HamHam-burg, M¨unchen - M¨unchen, Leipzig/Halle - Hamburg, Frankfurt - Bremen.

2.4.2 Spam

Es wurden 408 Werbe-E-mails untersucht (siehe Abbildung 2.23, Seite 32), deren Routen sich in 1734 identifizierbare Teilrouten aufsplitten. Die Analyse ergab, dass 116 unterschiedliche Teilrouten benutzt wurden.

Rang Land1 Land2 Anzahl Anteil Teilrouten 1. Deutschland Deutschland 1115 64,30 %

2. USA Deutschland 109 6,29 %

3. China Deutschland 80 4,61 %

4. USA USA 72 4,15 %

5. S¨udkorea Deutschland 38 2,19 %

6. USA China 24 1,38 %

7. Brasilien Deutschland 19 1,10 %

8. Holland Deutschland 19 1,10 %

9. S¨udafrika Deutschland 16 0,92 %

10. Mexiko Deutschland 15 0,87 %

11. USA Korea 13 0,75 %

12. Italien Deutschland 11 0,63 %

13. Spanien Deutschland 10 0,58 %

14. USA Mexiko 9 0,52 %

15. Kanada Deutschland 8 0,46 %

16. Taiwan Deutschland 7 0,40 %

18. Brasilien USA 6 0,35 %

19. Großbritannien Deutschland 5 0,29 %

20. USA Taiwan 4 0,23 %

Tabelle 2.2: Teilrouten der Spam-E-mails

Der Anteil der Deutschland - Deutschland Routen liegt dieses Mal bei 64,30 % (vgl. Tabelle 2.2, Seite 34). Das sind 19,29 % weniger als in den regul¨aren E-mails. Die USA - Deutschland Route schneidet mit 6,29 % vergleichbar mit den 3,72 % der gleichen Routen in den normalen E-mails ab. Ebenso die USA - USA Route mit 4,15 % (9,31%).

Sehr auff¨allig hingegen ist die China - Deutschland Route (4,61 %), die sich von der gleichen Routen der regul¨aren E-mails (0,15 %) um den Faktor 30,7 unterscheidet. Ebenso die S¨ udko-rea - Deutschland Route (2,19 % / 0,07 %), deren H¨aufigkeit um den Faktor 31,3 erh¨oht ist.

In ¨ahnlicher Weise verhalten sich die Routen Brasilien - Deutschland, Holland - Deutschland, S¨udafrika - Deutschland und Mexiko - Deutschland.

Eine weitere Eigenheit der Spam-E-mails ist, dass rund 1,38 % des gemessenen

Verkehrsauf-mit Ziel Deutschland einen Umweg von mehr als 15 000 Kilometern und ist daher in den nor-malen E-mails sehr rar frequentiert. Gleiches gilt f¨ur die Route USA - Korea - Deutschland.

Schlußfolgerungen

Aus der Analyse der E-mails geht hervor, dass die untersuchten Spam E-mails im Durchschnitt mehrere Teilrouten aufweisen als normale E-mails: Faktor 4,25 versus Faktor 2,04.

Des Weiteren fiel die deutlich erh¨ohte Nutzungsfrequenz der Routen China-Deutschland, S¨udkorea-Deutschland, Brasilien-Deutschland, Holland-Deutschland, S¨udafrika-Deutschland und Mexiko-Deutschland auf. Es w¨are jedoch falsch, E-mails aus diesen Ursprungsl¨andern generell als Spam auszusortieren, da auch normale E-mails ¨uber diese Routen verlaufen.

Sehr große geographische Umwege traten bei den Strecken USA-China-Deutschland sowie USA-Korea-Deutschland auf und deuten mit großer Wahrscheinlichkeit auf Spamrouten hin.

2.5 Evaluierung

2.5.1 Effektivit¨ at

Unter Effektivit¨at versteht man, ob der Benutzer alle relevanten Informationen erfassen kann.

Hierzu kann gesagt werden, dass beim Start der Visualisierung erst einmal alle verf¨ugbaren Routen auf der Weltkarte eingeblendet werden. Der Benutzer bestimmt den Grad der Aus-blendung selbst ¨uber Interaktion mit dem System.

Etwas problematisch ist hingegen die ¨Uberlagerung der Routen. Denjenigen Routen mit viel Verkehr wird eine h¨ohere Priorit¨at einger¨aumt. Sie werden ¨uber die anderen Routen gezeichnet.

Das ¨Uberlagerungsproblem wurde teilweise gel¨ost, indem der Benutzer die M¨oglichkeit be-sitzt, sequentiell die unwichtigen Routen auszublenden und indem er zwischen den Karten-projektionen umschalten kann. Betrachtet man beispielsweise die Routen von Amerika nach Deutschland, so stellt man fest, dass die Routen der amerikanischen Westk¨uste sich mit denje-nigen von der Ostk¨uste ¨uberlagern. Schaltet man nun von der Hammer-Aitoff Projektion zur Albers Equal-Area Conic Projektion um, so ¨uberschneiden sie sich weniger (siehe Abbildungen 2.24 und 2.25).

Abbildung 2.24: Amerika-Routen, Hammer-Aitoff Projektion

Abbildung 2.25: Amerika-Routen, Albers Equal-Area Conic Projekti-on

Die geographische Position der einzelnen Mailserver wurde analog auf die visuelle Varia-ble Position ¨ubertragen. Die erzeugten Weltkarten stellen f¨ur den Benutzer ein bekanntes Werkzeug dar und werden intuitiv und schnell aufgenommen. Die Visualisierung ist dadurch wesentlich aussagekr¨aftiger als eine Auflistung der Koordinaten der wichtigen Routen.

Hilfreich w¨aren jedoch Beschriftungen zu einzelnen Lokalit¨aten. Beispielsweise k¨onnte ¨uber einen Mouse-Over-Effekt an demjenigen Knoten, ¨uber dem sich die Maus befindet, ein Label zu der Lokalit¨at des Knotens angezeigt werden. Dies w¨urde die Identifizierung der Knoten in exotischen L¨andern erleichtern.

F¨ur den unge¨ubten Betrachter kann das logarithmische Mapping und das Wurzelmapping anfangs zu Verwirrung sorgen, da lineare Skalen weitaus verbreiteter sind. Durch Interaktion steht dem Benutzer jedoch die M¨oglichkeit offen, ein lineares Mapping auszuw¨ahlen.

2.5.2 Genauigkeit

Die geographische Zuordnung erscheint auf den ersten Blick als unproblematisch, da laut dem Hersteller Maxmind Inc. der GeoIP-Datenbank 95 % der IP-Adressen geographisch richtig zugeordnet werden.

Hierbei muss jedoch ber¨ucksichtigt werden, dass bei der Analyse der E-mails nicht nur aktu-elle E-mails untersucht werden, sondern teilweise sehr alte E-mails. Die im KapitelAnwendung untersuchten regul¨aren E-mails haben ein Alter von bis zu drei Jahren aufgewiesen.

Aufgrund der Information von Maxmind, dass sich ca. ein Prozent der Datenbank jeden Monat ¨andert, habe ich eine Formel zur Berechnung der Genauigkeit der geographischen Zu-ordnung in Abh¨angigkeit vom Alter der E-mail aufgestellt:

accuracy(t) = 95%∗0.9912t

t : Zeitdifferenz in Jahren zwischen dem Stand der Datenbank und dem Alter der Daten

Im konkreten Anwendungsfall bedeutet dies, dass die einzelnen Zuordnungen der Mailserver nach drei Jahren nur noch zu 74 % korrekt sind (siehe Tabelle 2.3). Besteht eine drei Jahre alte E-mail Route aus durchschnittlich drei Hops, so stimmt diese Route lediglich mit einer Wahrscheinlichkeit von p= 0,74633 = 0,4157.

t 1 Jahr 2 Jahre 3 Jahre 4 Jahre 5 Jahre 10 Jahre accuracy(t) 84,20% 74,63% 66,15% 58,64% 51,97% 28,44%

Tabelle 2.3: Genauigkeit der geographischen Zuordnung in Abh¨angigkeit von der Zeit Aus diesem Grund schlage ich die Einf¨uhrung einer zeitabh¨angigen Datenbank vor. Die einfachste Realisierung dieser Datenbank best¨ande aus der Kombination der monatlichen Up-dates der Datenbank. Je nach Alter der E-mail m¨ussten dann in der entsprechen historischen Datenbank die geographischen Zuordnungen der einzelnen Mailserver-IPs nachgefragt werden.

Hierdurch k¨onnte die Fehlerwahrscheinlichkeit einer E-mail mit drei Hops von palt = 0,4157 auf pneu = (accuracy(121))3 = 0,8319 verringert werden.

Die Visualisierung selbst betreffend bestimmt der Benutzer das sogenannte ,,Level of De-tail”, indem er den Zoom verwendet. Dadurch wird ein Teilbereich der Daten vergr¨oßert.

Ferner variiert der Benutzer das ,,Level of Detail”, indem er Routen mit geringem Verkehr

sequentiell ausblendet.

Als Kompromiss hingegen ist die statische Rasterung mit einem 1×1 Grad Raster zu sehen.

W¨urde das Raster je nach Detaillierungsgrad ver¨andert werden, so w¨urden die Informationen im Zoombereich genauer dargestellt werden. Es kann jedoch sehr verwirrend f¨ur den Betrach-ter sein, wenn die Routen sich durch die Zoomansicht farblich und geographisch ver¨andern w¨urden.

2.5.3 L¨ ugenfaktor

Unter dem L¨ugenfaktor ist der Quotienten aus der Gr¨oße eines visuellen Effekts und der Gr¨oße des Effekts innerhalb der Daten zu verstehen. Er ist ein Maß zur Beurteilung des Wahrheits-gehalts von Visualisierungen.

Aufgrund der geographischen Anordnung der Linien entstehen visuelle Effekte, die falsch interpretiert werden k¨onnen. Beispielsweise spannt eine Route von Brasilien nach Japan sich uber den ganz Bildbereich, eine Routen von Konstanz nach Z¨¨ urich hingegen nur ¨uber einen sehr kleinen Teilbereich des Bildschirms. Die Tatsache, dass die Japan-Brasilien Route we-sentlich auff¨alliger ist, hat jedoch nichts mit deren tats¨achlicher Relevanz zu tun.

Eine M¨oglichkeit, diesen L¨ugenfaktor auszuschalten, ist ein Rasterdisplay wie von Becker, Eick und Wilks vorgeschlagen (vgl. [BEW95]). Dabei geht jedoch die intuitive geographische Anordnung verloren. Des Weiteren muss man sich auf eine sehr eingeschr¨ankte Auswahl von Koordinaten oder L¨andern beschr¨anken und verliert somit interessante Detailinformationen.

2.5.4 Effizienz

Die Visualisierung ist insofern effizient, da der Benutzer sehr schnell die Hauptrouten der E-mail identifizieren kann. Die geographische Repr¨asentation erm¨oglicht im Vergleich zur rein statistischen Auswertung schneller eine exaktere Vorstellung von den Daten zu bekommen.

Da Karten im allt¨aglichen Gebrauch verwendet werden, kann davon ausgegangen werden, dass der Benutzer im Gebrauch von Karten ge¨ubt ist und auf etwas Bekanntes zur¨ uckgegrif-fen werden kann. Dieses Zur¨uckgreifen erspart die Einarbeitungszeit in noch nicht bekannte Visualisierungs- und Darstellungskonzepte.

Ebenso gilt eine Linie als Verbindung zweier Punkte auf der Karte als ein bekanntes Kon-zept. Die Analogie hierzu ist eine Straßenkarte, bei der als Linien dargestellte Strecken einzelne St¨adte verbinden.

Zur Darstellung der Frequentierung einer Strecke wurden zwei visuelle Variablen kombi-niert. Zum einen die Helligkeit und zum anderen der Farbwert. Helle Routen bedeuten wenig E-mail-Verkehrsaufkommen auf der Route, wohingegen kr¨aftige dunkle Routen viel Verkehrs-aufkommen verdeutlichen sollen.

2.5.5 ¨ Asthetik

Bei der Wahl der Projektionen und der farblichen Gestaltung wurde besonders viel Wert auf Asthetik gelegt, da ansprechend gestaltete Visualisierungen mehr Aufmerksamkeit auf sich¨ ziehen.

Unter den Projektionen wurden die Mollweide und die Hammer-Aitoff Projektionen gew¨ahlt, da sie die Erde als eine Ellipse darstellen. Diese Form gilt als ¨asthetisch. Im Gegensatz dazu erscheint die nicht verwendete Eckert I Projektion aufgrund ihrer unnat¨urlichen sechseckigen Form eher un¨asthetisch.

Die Cosinusodial-Projektion hingegen wirkt durch ihre geschwungene Form und die Kon-traste zwischen den Rundungen und den beiden spitzen Polen sehr interessant und zieht die Aufmerksamkteit auf sich. Leider geht durch die spitze Form viel Platz f¨ur die Darstellung der L¨ander verloren.

In der Mitte der runden Albers Equal-Area Conic Projektion befindet sich der Nordpol, die einzelnen L¨ander befinden sich rund herum angeordnet. Hierbei handelt es sich um eine ungewohnte Perspektive auf die Erde, die ebenfalls Interesse beim Betrachter weckt.

Um die Visualisierung farblich interessant zu gestalten, wurde bewusst ein starker Kontrast zwischen Hintergrund und Vordergrund erzeugt. Die Weltkarte, welche sich im Hintergrund der Visualisierung befindet, ist ganz in Graut¨onen gehalten, die L¨ander etwas dunkler als die Meere. In Kontrast hierzu stehen die farbigen E-mail Routen, deren unterschiedliche Farben auch untereinander interessant wirkende Kontraste bilden.

2.5.6 Anpassbarkeit

Die entwickelte Visualisierung eignet sich sehr gut zur Darstellung des Netzwerkverkehrs, da dieser eine verallgemeinerte Form des E-mail-Verkehrs ist. Ebenso k¨onnen beliebige netzwerk-artige Strukturen mit geographischen Referenzen durch die Visualisierung dargestellt werden.

3.1 Zusammenfassung

Durch eine Aufarbeitung und Visualisierung der Daten zu den E-mail Routen wurde versucht, dem Betrachter in m¨oglichst unverf¨alschter Weise die Herkunft der E-mails, als auch die meist-genutzen Routen zu verdeutlichen.

Um eine m¨oglichst gute Visualisierung zu erreichen, wurden mehrere Arbeiten zur geogra-phischen Visualisierung von Netzwerkverkehr betrachtet sowie ein kommerzielles Produkt zur visuellen Nachverfolgung von E-mails.

Im Anschluß daran wurden die vorhandenen Daten aufbereitet. Hierbei wurde das Post-fach eines IMAP E-mail Servers nach Informationen, welche geographisch nachverfolgbar sind, gescannt. Durch Einsatz einer Datenbank wurden nun die geographischen Wege der E-mails herausgefunden und eine Visualisierung entwickelt.

Das entwickelte System kann ohne Probleme ¨uber 10 000 E-mail Routen darstellen, indem es Routen mit ¨ahnlichen geographischen Ausgangs- und Endknoten zusammenfasst und durch Helligkeit und Farbe die Nutzungsfrequenz der Route visuell darstellt.

Um eine hohe ¨Asthetik und Anschaulichkeit der Visualisierung zu erm¨oglichen, wurden verschiedene Kartenprojektionen eingesetzt. Sie stellen die Erdkugel in anschaulichen Projek-tionen auf dem zweidimensionalen Bildschirm dar.

Zur Erh¨ohung der M¨achtigkeit der Visualisierung wurde viel Wert auf Benutzerinteraktionen gelegt. Der Benutzer kann auf interaktive Art und Weise die Daten erkunden. Beispielsweise erm¨oglicht der Zoom das Vergr¨oßern eines Teilausschnitts der Weltkarte. Des weiteren hat der Benutzer die M¨oglichkeit, zwischen linearer, logarithmischer und Wurzelskala die farbliche Klassifizierung zu manipulieren.

Zur alternativen Darstellung der USA-Deutschland Routen wurde die Albers-Projektion mit Standardparallelen β1 = β2 = 12π verwendet. Durch die Wahl dieser Projektions-Parameter verteilen sich die USA-Routen ¨uber Gr¨onland und den Nordpol (vgl. Abbildungen 2.24 und 2.25 auf Seite 36. Die gegenseitige ¨Uberlagerung der Routen wird somit deutlich verringert.

Außerdem wurde durch den CartoDraw-Algorithmus ein Kartogramm (vgl. Abbildung 2.21, Seite 30) erstellt, welches die Weltkarte nach der Gr¨oße des E-mail-Aufkommens verzerrt.

3.2 Ausblick

Generell bietet der Datenbestand und auch die entwickelte Visualisierung eine gute Ausgangs-basis, um weitere interessante Eigenheiten der E-mail Routen zu erforschen. Hierbei denke ich an Verlaufsvisualisierung von E-mail Verkehr, die Richtung des Verkehrs, das Alter und die Validit¨at der E-mail Routen als auch an Volumen-Visualisierungen nach E-mail Gr¨oße.

Verlaufsvisualisierungen des E-mail Verkehrs ¨uber mehrere Jahr hinweg k¨onnten auf Un-genauigkeiten der Daten oder auf Ver¨anderungen der Kommunikationsstrukturen der Person hinweisen, an welche die E-mails addressiert sind. Eine Realisierung stelle ich mir hierbei in Form eines Videos vor.

Die Richtung des Verkehrs w¨are f¨ur die Spam Routen sehr interessant. Es wurde festgestellt, dass es eine Route von den USA nach China gibt, eine Route von China nach Deutschland und eine Route von den USA nach Deutschland. Es ist jedoch lediglich bekannt, dass alle Rou-ten in Deutschland terminieren, da sich hier die Lokalit¨at des untersuchten E-mail Account befindet. Ob die Routen jetzt von China in die USA oder von den USA nach China verlaufen, w¨are ein interessantes Detail, das enth¨ullen w¨urde, ob wirklich viele Spam-Server in China stehen, oder ob es sich hierbei nur um Mail-Server handelt, die Werbemails weiterleiten wie auch jeder normale Mail-Server.

Wie im Unterkapitel zur Evaluierung der Visualisierung gezeigt wurde, ist die Wahrschein-lichkeit, dass eine einem Mailserver zugeordnete Lokalit¨at nicht mehr der urspr¨unglichen Lo-kalit¨at entspricht, relativ hoch, sobald die Daten mehrere Jahre alt sind. Zur Untersuchung dieses Effekts w¨are es angebracht, das Alter und somit die Validit¨at der jeweiligen E-mail Rou-te darzusRou-tellen, um etwaigen Fehlschl¨ussen der E-mail Routen Visualisierung zu verhindern.

Aus technischer Sicht w¨are eine Darstellung der Gr¨oße der E-mails von Interesse, weil eine E-mail mit großem Anhang weitaus mehr Leitungskapazit¨aten in Anspruch nimmt, als tau-sende E-mails ohne Anh¨ange. Hierzu k¨onnte man die Dateigr¨oße jeder einzelnen E-mail aus der Gr¨oße der eigentlichen Mail und der Anhangsgr¨oße berechnen. Die Kantengewichte des Graphen enspr¨achen nun der Summe der Einzelgewichte der entspechenden E-mails.

Um abschließend auf die Entwicklung von Spam-Filtern ¨uber geographische Informationen der Routen hinzuweisen, m¨ochte ich hier anmerken, dass lediglich 408 Spam-Routen eines ein-zigen E-mail Accounts untersucht wurden. Diese stellen sicherlich keine repr¨asentative Stich-probe aller Spam E-mails dar, zum einen wegen der geringen Anzahl und zum anderen wegen der Erhebung aus einem einzigen E-mail Account. Daher w¨are es f¨ur nachfolgende Arbeiten interessant, genauere Untersuchungen einer großen Anzahl von Spam E-mails von unterschied-lichen E-mail Accounts durchzuf¨uhren.

3.3 Danksagung

Hiermit m¨ochte ich mich ganz herzlich bei meinem Betreuer w¨ahrend des Projektpraktikums und der Bachelorarbeit, Herrn Christian Panse, bedanken. Seine Ratschl¨age und Ermutigun-gen haben mir immer weitergeholfen.

Ebenso m¨ochte ich mich bei Herrn Prof. Dr. Daniel A. Keim f¨ur die M¨oglichkeit bedanken, an seinem Lehrstuhl interessante Projekte und Arbeiten durchzuf¨uhren.

2.1 Inbound Traffic des NSFNET T1 Backbones, September 1991 (vgl. [CP92]) . . 7

2.2 Visualisierung von Netzwerk-Verkehr mit Seenet (vgl. [BEW95]) . . . 8

2.3 VisualRoute von Visualware [Visw03] . . . 9

2.4 UML-Klassendiagramm des E-Mail Filters . . . 11

2.5 Auszug aus dem Header einer E-mail . . . 12

2.6 Darstellung von 16.800 E-mail Routen mit logarithmischem Color Mapping . . 15

2.7 HSI- und HSV-Modell, entnommen aus [Kei95], Seite 97 . . . 16

2.8 HSI-Colormap mit Wurzel-Skala, Schwarz-Weiß-Ansicht . . . 17

2.9 HSV-Colormap mit Logarithmischer Skala, Schwarz-Weiß-Ansicht . . . 17

2.10 Projektionsarten, entnommen aus Guszlev: Map Projections (vgl. [Gus03]) . . 18

2.11 Equirectangular Projektion . . . 20

2.12 Hammer-Aitoff Projektion . . . 21

2.13 Mollweide Projektion . . . 22

2.14 Cosinusodial Projektion . . . 23

2.15 Albers Equal-Area Conic Projektion mit β12 = 12π . . . 23

2.16 Lambert Cylindrical Projektion . . . 24

2.17 Alle Routen . . . 25

2.18 Routen, die mindestens 10 mal frequentiert wurden . . . 25

2.19 Rasterung mit Aufl¨osung von 1 × 1 Grad . . . 27

2.20 Zoom . . . 28

2.21 Kartogramm-Zoom mit Routen-Frequenz gr¨oßer drei und logarithmischer Farbs-kalierung . . . 30

2.22 Visualisierung regul¨arer E-mails . . . 32

2.23 Spam-Visualisierung auf L¨anderebene . . . 32

2.24 Amerika-Routen, Hammer-Aitoff Projektion . . . 36

2.25 Amerika-Routen, Albers Equal-Area Conic Projektion . . . 36

[BEW95] Becker, Richard A., Stephen Eick und Allan R. Wilks: Visualizing Network Data. In: IEEE Transactions on Visualization and Computer Graphics, Volume 1 Seiten 16–28, 1995.

[Ber82] Bertin: Graphische Darstellungen und die graphische Weiterverarbeitung der Information. de Gruyter, Berlin, New York 1982.

[CP92] Cox, Donna und , Robert Patterson: NCSA: Visualization Study of the NSFNET, Februar 1992. NCSA. http://archive.ncsa.uiuc.edu/SCMS/

DigLib/text/technology/Visualization-Study-NSFNET-Cox.html.

[EW93] Eick, Stephen G. und Graham J. Wilks: Navigating Large Networks with Hierarchies. In: Proc. IEEE Conf. Visualization, Seiten 204–210, 1993.

[FvFH96] Foley, James. D., Andries van Dam, Steven K. Feiner und John F.

Hughes:Computer Graphic Principles and Practice. Addison-Wesley, 2nd Auf-lage, 1996.

[GeoIP03] GeoIP Database, Stand Juni 2003. Maxmind LCC. http://www.maxmind.com [Gus03] Guszlev, Antal: Map Projections, Juni 2003. http://lazarus.elte.hu/

~guszlev/vet/

[Kei95] Keim, D.: Visual Support for Query Specification and Data Mining System.

Shaker-Verlag, 1995.

[Ker03] Kernen, David J.: Mail::IMAPClient Perlmodul, Stand Juni 2003, Release 2.2.8. The Kernen Group Inc. http://search.cpan.org/author/DJKERNEN/

Mail-IMAPClient/

[KNTK99] Koutsofios, E., R. Truscott, S. North und D. Keim: Visualizing large-scale telecommunication networks and services. In:Proc. IEEE Visualization ’99, Seiten 457-461,1999. http://www.research.att.com/areas/visualization/

papers_videos/papers/1999kntk.pdf.

[KNP03] Keim, Daniel A.,Stephen C. NorthundChristian Panse:CartoDraw: A Fast Algorithm for Generating Contiguous Cartograms. Trans. on Visualization and Computer Graphics, Dez 2003. Information Visualization Research Group, AT&T Laboratories, Florham Park.

[Kri03] Krim, Jonathan: Spam’s Cost To Business Escalates - Bulk E-Mail Threa-tens Communication Arteries. Washington Post, 13. M¨arz 2003. http://www.

[Kri03] Krim, Jonathan: Spam’s Cost To Business Escalates - Bulk E-Mail Threa-tens Communication Arteries. Washington Post, 13. M¨arz 2003. http://www.

Im Dokument Visuelle Analyse von E-mail-Verkehr (Seite 33-46)