Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/1
Oberseminar
Informationsvisualisierung
Grundlegende Gesichtspunkte
Grundlagen
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/2
3-Stufen-Modell
3 Stufen der Information
Elementare Stufe - die Informationen werden direkt in visuelle Attribute überführt.
Mittlere Stufe - die elementaren Informationen werden abstrahiert dargestellt, d.h. wesentliche Erkenntnisse über die Daten werden illustriert.
Obere Stufe - Gesamtheit aller in den Daten erkennbaren Informationen wird visuell präsentiert, Entscheidungsfindung möglich.
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/3
Elementare Stufe
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/4
Mittlere Stufe Mittlere Stufe (1)
Mittlere Stufe (2)
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/7
Hintergründe
Die Definitionen der politisch motivierten Gewalt und der einzelnen zu unterscheidenden
Tätergruppen und Straftaten geht auf eine Tagung der Innenministerkonferenz vom 10.05.2001 zurück.
(Vgl.
http://dipbt.bundestag.de/dip21/btd/17/019/1701928.pdf.) Die Statistiken des letzten ausgewerteten Jahres 2016 mit Erläuterungen findet man unter
https://www.bmi.bund.de/SharedDocs/kurzmeldunge n/DE/2017/04/vorstellung-pks-pmk.html.
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/8
Obere Stufe
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/9
http://www.visual-literacy.org/periodic_table/periodic_table.html
Qualität von Visualisierungen
Die Qualität einer Visualisierung definiert sich durch den Grad, in dem die bildliche Darstellung das kommunikative Ziel der Präsentation erreicht.
Beschreibung: Wahrgenommene zu vermittelter Information je Zeiteinheit
Abhängigkeiten: Charakteristika und Eigen- schaften der Basisdaten, Bearbeitungsziel bzw.
Aufgabenstellung, Eigenschaften des Darstel- lungsmediums, Wahrnehmungskapazitäten und Erfahrungen des Betrachters.
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/10
Expressivität
Die Expressivitätoder Ausdrucksfähigkeiteiner visuellen Darstellung ist deren Eigenschaft, nurdie in den Daten enthaltenen Informationen möglichst unverfälscht wiederzugeben.
Je nach gegebenen Daten und Verwendungszweck sind verschiedene Darstellungsarten unterschied- lich expressiv, man muss gezielt auswählen.
erster Schritt der Visualisierung
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/11
Beispiel
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/12
Oberseminar Informationsvisualisierung Michael Frank
HTWK-Leipzig, 2018
Seefahrt, Mercatorprojektion
Die Mercatorprojektion
Trug ein Seemann seinen Kurs als gerade Linie auf der Plattkarte eines großen Gebietes mit gleichen Abständen von Längen- und Breitengraden ein, kam es zu großen Irrtümern. Der portugiesische Wissenschaftler Pedro Nunes wies 1537 nach, dass sich eine gerade Kurslinie oder Loxodrome auf einer solchen Plattkarte, wenn diese auf einen Globus übertragen wird, spiralförmig einem Pol nähert ohne ihn zu erreichen. Eigene astronomische Beobachtungen und Karten differierten also stark, speziell den Kurs der Schiffe betreffend.
Die Lösung dieses Problems gelang Gerhard Mercator 1569, als er seine 1,31 m x 2,08 m große Weltkarte zum Gebrauch der Seefahrerkonstruierte. Er verwendete die nach ihm benannte Mercator-Projektion. Die Karte besaß vom Äquator ausgehend wachsende Breitengrade. Es handelte sich um eine Zylinderprojektion, bei der ein zylindrisch aufgerolltes Kartenblatt der Weltkugel am Äquator anlag. Das Verfahren erlaubte dem Seemann erstmals weit auseinander liegende Punkte durch eine gerade Linie zu verbinden, die alle Längengrade im gleichen Winkel schnitt. Die Karte war winkeltreu anstatt flächentreu. Kurse konnten zuverlässig abgelesen werden, während die Bestimmung von Entfernungen fehlerbehaftet war. Die Mercatorprojektion ist das bis heute übliche Verfahren zur Erstellung von Seekarten. 12.04.2018/13
http://de.wikipedia.org/wiki/Kartennetzentwurf
Mercatorprojektion
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/14
Wie navigiert man an den Polen?
http://de.wikipedia.org/wiki/Mercator-Projektion
Effektivität
DieEffektivität einer visuellen Darstellung ist die optimale Ausnutzung der visuellen Fähigkeiten des Betrachters und der charakteristischen Eigenschaften des Ausgabegeräts,
wobei die Zielsetzung und der Anwendungskontext berücksichtigt werden müssen.
Die Suche nach der effektivsten Form ist schwer.
zweiter Schritt der Visualisierung, Teil 1
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/15
Beispiel
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/16
3D-Druck für Sehbehinderte
https://touch-mapper.org/de/
Bestellen von Karten für 35 Euro am Computer
3D Touch Surface Display
Consumer Electronics Show 2018,
„Best of Innovation“ Award, Kategorie
„Fahrzeug Audio/Video“
Dreidimensionale Display-Oberfläche sorgt für verbesserte Sicherheit und besseres Nutzererlebnis.
Die 3D-Oberfläche erlaubt höhere Gestaltungsfreiheit und Individualität im Cockpit-Design.
Haptische Führung, Verringerung der Ablenkung des Fahrers.
https://www.continental-corporation.com/de/presse/pressemitteilungen/2018-01-04-3d-touch-display-118120 https://www.continental-automotive.com/en-gl/Passenger-Cars/Interior/Display-Systems/3D-touch-Surface-Display
Kaufkraft
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/19
Baumunfälle
Baumunfälle waren auch 2015 immer noch die häufigste Einzelursache von tödlichen Verkehrsunfällen in Deutschland (17 Prozent). Einige Bundesländer wiesen sogar noch wesentlich höhere Anteile auf.
In Brandenburg starben 39 Prozent der bei Verkehrsunfällen Getöteten bei Baumunfällen, in Niedersachsen waren es 31 Prozent und in Mecklenburg-Vorpommern waren es 27 Prozent. Insgesamt starben 2015 603 Menschen bei Baumunfällen.
Damit haben seit 1995, dem Jahr der Einführung der
"Baumunfallstatistik", über 26.900 Menschen ihr Leben durch Baumunfälle verloren.
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/20
Baumunfälle
Was ist ein effektiver Schutz davor?
https://udv.de/de/strasse/landstrasse/baumunfaelle
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/21
Effektivität:
• Leitzeichen in Kurven
• Leitplanken
• Überholverbot
• Blitzer
Angemessenheit
Die Angemessenheit einer visuellen Darstellung ist die Charakterisierung des Verhältnisses zwischen Aufwand und Nutzen im Sinne von Kosten und Zielerreichung.
Dabei wird der Visualisierungsprozess mit Herstellung und Präsentation betrachtet.
zweiter Schritt der Visualisierung, Teil 2
Wechselwirkungen existieren oft
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/22
Beispiel ...
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/23
octo_pied_building Wien
Pyöngyang, Kim Il Sung
Beispiel: Macht
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/24
Das Denkmal in Pyöngyang wurde 2011 verändert. Kim Jong Il trägt jetzt einen Militärparka.
Allerdings gab es diese Form der Darstellung bereits anderswo im Land.
Leipzig, Graffiti
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/25
Visualisierungspipeline
Visualisierung als Prozess kann als linearer Grund- prozess mit iterativen Schrittwiederholungen begriffen werden:
Visualisierungspipeline oder Datenpipeline (nach Chr. Tominski) – mit Bearbeitungsschritten und Datenzuständen
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/26
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/27
Visualisierungspipeline
Alternativ kann man auch prozessorientierter über die Pipeline sprechen:
Clemens Arnold, „Visualisierung multidimensionaler statistischer Daten im Web“, Diplomarbeit, FH Hagenberg, Juni 2003.
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/28
1. Schritt
Aufbereitung der Rohdaten zu regularisierten Ausgangsdaten
- Vervollständigung oder Reduzierung der Datenmenge, evtl. Datenauswahl(en) - Interpolation fehlender Werte mit
Fehlerabschätzung
- Ggf. Digitalisierung der Daten
2. Schritt
Filterung der Daten
- Fehlerkorrektur, Extraktion von Werten nach Kriterien (z.B. Bandbreite festlegen)
- Bestimmung von Eigenschaften der Datenmenge mit statistischen oder analytischen Methoden - Ergebnis sind die aufbereiteten Daten - Evtl. Datenauswahl(en)
3. Schritt (wichtig)
Mapping der Daten
- Festlegung der Art der visuellen Präsentation generell und im Detail, Datenauswahl(en) - Überführung der aufbereiteten abstrakten Daten
in Geometriedaten nach der Darstellungsidee - Große Bandbreite von Möglichkeiten, die
Expressivität und Effektivität der Darstellung zu beeinflussen
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/31
4. Schritt
Bildgenerierung (Rendering)
- Erzeugung der Bilder aus den Daten nach festgelegtem Verfahren mit festgelegten grafischen Attributen, ggf. selektiv mit Auswahl - Festlegung des Datenformats, ob animiert oder
still, ob abstrahiert oder realitätsnah, Festlegung anderer Merkmale
- Evtl. Generierung von Interaktionsmöglichkeiten und Zustandsübergängen
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/32
Realisierungswege
Ideen der Verteilung der Arbeit in der Pipeline, vom Autor zum Betrachter
• Der Autor führt alle Schritte selbst durch.
• Der Autor erzeugt das Geometriemodell der Daten, der Betrachter dann die Bilder.
• Der Autor liefert nur die Rohdaten, der Betrachter nutzt fertige Geometriemodelle und erzeugt Visualisierungen seiner Wahl.
• Der Autor erzeugt Geometriemodelle in Interaktion mit dem Betrachter, der diese nutzt.
Cloudy Big Data …
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/33 Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/34
Herausforderung Datenmenge
Wie kann man effektiv Datenmengen auswerten und visualisieren, wenn diese sehr groß werden und in Echtzeit zu verarbeiten sind?
• Simulation 1 Mio. Atome: 7 GB/ Schritt
• Steuerung von Satelliten: TB/ Tag
• Magnet-Resonanz-Bilder: 16 MB/ Schichtbild
• Scans mit Laser: 2 Mio. Punkte / Minute
• DNS-Sequenzierung: 2 TB pro Patient / 200 GB nach Vorverarbeitung
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/35
Herausforderung Datendimension
Drei Dimensionen
• Visualisierung von Volumen (Abbildung von 3D- Daten zu 2D-Screens)
• 3D-Darstellungen oder 3D-Animationen im Modell Multiple Dimensionen
• Gleichzeitige Behandlung von Datenmerkmalen unterschiedlichster Art in Visualisierungen
• Schwierig ist oft die Verdeutlichung der Abhängigkeiten zwischen Datenmerkmalen
• Wechsel der Ansichten / Dimensionsauswahl
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/36
Herausforderung Datentypen
Strukturierte versus unstrukturierte Daten
• Unstrukturierte Daten – schwer zu verwalten
• Datenvorverarbeitung ist dann aufwändig Skalare, Vektor- und Tensordaten
• Diskretisiert, numerisch
• Unterschiedliche Skalen, Dimensionen Nicht-numerische Daten
• Aufzählungen, z.B. Wochentage
• Kategoriedaten, z.B Namen von Tieren
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/37
Herausforderung Darstellung
Eindeutigkeit der Darstellung, Verständlichkeit
• Farben, Hervorhebungen, Transparenzen, Animationen, Texturen, Symbole
Zu große Datenmenge für zu kleine Displays
• Zu viele Fallunterscheidungen, Gesichtspunkte
• Zu viele Variablen je sinnvoller Visualisierung Notwendigkeit der Hervorhebung einzelner
Variablen
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/38
Herausforderung Interaktivität
Die Visualisierung ist oft interaktiv zu präsentieren
• Interaktionen bei Echtzeitvisualisierungen, d.h.
Präsentation sog. virtueller Umgebungen
• Darstellung multipler Perspektiven der
gegebenen Datenmenge, Wechsel zwischen den Ansichten
• Parameterwahl beim Nutzer, Vielfalt der Ansichten, Filterungen der Daten
Herausforderung Usability
Was kann der Nutzer sehen und wahrnehmen?
• Mittel der bildlichen Darstellung
• Metaphern, Strukturen, Wiedererkennungswert Was kann der Nutzer (richtig) interpretieren?
• Verwendete Darstellungsmittel wie Diagramme, Tree Maps, 3D-Modelle, ...
• Interaktive „Fahrten“ durch Darstellungen, Skalierungen, Ausschnittbildungen, ...
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/39 Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/40
Jacob van Ruisdael -Landscape with a mill-run and ruins -Google Art Project
Erklärungen zu alten Gemälden
Baum
Der Baum ist ein Symbol für immer neue Lebenskraft, Wachstum und Segen.
Wachsen, Grünen und Früchte deuten auf das Leben hin, das Abfallen der Blätter auf Sterben und Tod. Aus diesem Grund ist der Baum auch ein Symbol der Auferstehung, des Sieges über den Tod.
Das Kreuz, aus dem die Hoffnung auf neues Leben erwächst, wird oftmals als Baum dargestellt.
http://www.christliche-symbole.de/christliche-symbole-1/baum/
Erklärungen zu alten Gemälden
Mühle
Die Mühle ist ein künstlerisches Sinnbild des Mittelalters und der frühen Neuzeit. Sie zeigt die
„Wesensverwandlung“ des Kornes zu Mehl in der heiligen Mühle, also die Erneuerung des göttlichen Bundes vom Alten auf das Neue Testament.
Die Umkehrung des Symbols ist die anrüchige Mühle, die auf Verderbtheit und Sündhaftigkeit hinweist.
https://de.wikipedia.org/wiki/M%C3%BChle_(Symbol)
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/43
Jacob van Ruisdael -Landscape with a mill-run and ruins -Google Art Project
Nützlichkeit
Fünf Faktoren, die die Nützlichkeit von Visualisierungen beeinflussen (5T-Environment nach [Mann, Reiterer 2000]):
1. Zielgruppe von Nutzern: Z.B. persönliche Unterschiede in der Wahrnehmung und Verarbeitung von Informatio- nen (räumliches Denken, Abstraktionsvermögen) 2. Arbeitsaufgaben: Z.B. Wissenschaftler – beobachten,
feststellen, suchen, Information extrahieren, fusionieren verschiedener Quellen, Schema finden, Information in das Schema kodieren, organisieren, vergleichen, simulieren, entscheiden, verteilen
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/44
Nützlichkeit
3. Datentyp, Datenmenge: Z.B. Text oder Zahlen, Datenhierarchie, Anzahl von Dokumenten oder Datensammlungen
4. Technische Möglichkeiten: Z.B. Größe des Monitors, Speichergröße, Prozessorleistung, verfügbare Eingabe- und Ausgabegeräte, Netzanbindung
5. Training: Finden der richtigen Balance zwischen Lernaufwand und Effektivität, zwischen Einfachheit und Mächtigkeit. Langzeitnutzen muss mit Trainingsaufwand ins Verhältnis gebracht werden.
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/45
BEISPIEL
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/46
Klimadaten visualisieren
ftp://ftp.ncdc.noaa.gov/pub/data/uscrn/products/hourl y02(z.B. Dateien für 2015, weil vollständig) Jede Datei im Verzeichnis ist eine Klimadaten-
sammlung einer Stadt / Messstation und einer Jahreszahl im CSV-Format.
Die Datenstruktur steht in der Datei README.txt.
Ziel ist die Visualisierung geeigneter Selektionen von Klimadaten, flexibel für alle Städte programmiert.
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/47
Filtering zu aufbereiteten Daten
In der CSV-Datei hat jeder Datensatz eine feste Länge von 241 Bytes, total ~2 MB.
Es gibt ein festes Spaltenformat = Datenartformat je Datensatz in der CSV-Datei.
Der Separator im Datensatz ist das Leerzeichen, aber auch führende Nullen der Messwerte werden zu Leerzeichen.
Einige Datenfelder sind systematisch überall leer.
Der mit „3“ angegebene Marker für fehlerhafte Messungen ist überall eine „4“, sonst „-9999.0“.
Es gibt spontan fehlende Messwerte in den Reihen.
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/48
Beispiel Datensatz
Texas, Port Aransas, ein Datensatz von 2011:
23906 201101010100201012311900 2.404 -96.82 28.30 17.6 17.9 18.5 17.6 0.0 0 0 0 0 0 0 17.3 0 18.3 0 16.9 0 59 0 -9999.0 -9999.0 -9999.0 -9999.0 -9999.0 -9999.0 -9999.0 -9999.0 -9999.0 -9999.0 Es gibt 6598 Datensätze in dieser Datei für den
Zeitraum 01.01.2011 01:00 Uhr UCT bis 02.10.2011 22:00 Uhr UCT.
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/49
CSV-Schema erfassen
Die Daten lassen sich in Gruppen gliedern:
• Feste Angaben zur Station
• Zeitstempel
• Temperatur
• Niederschlag
• Sonnenscheindauer
• Oberflächentemperatur
• Relative Feuchtigkeit
• Bodenwerte (Feuchtigkeit und Temperatur)
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/50
CSV-Schema erfassen
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/51 Coordinated Universal Time
CSV-Schema erfassen
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/52
CSV-Schema erfassen Datenarten Mapping
Festlegungen:
Es sollen die Temperaturen visualisiert werden.
Auswahl des Samplings, d.h. des Datenrasters und des Zeitraums. Normalisierung der Daten.
Auswahl der Diagrammart, der Skalierungen, der Visualisierungsmerkmale.
Auswahl der Darstellungstechnologien (z.B. Web, XML+SVG), Umsetzen der Daten in XML-Datei.
Visualisierungen (Bsp.)
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/55
Red Dog Mine, Alaska 162.9° W, 68.03° N
Michael Frank HTWK-Leipzig, 2018
Oberseminar Informationsvisualisierung
12.04.2018/56
Quellen
• Heidrun Schumann, Wolfgang Müller, „Visualisierung. Grundlagen und allgemeine Methoden.“, Springer-Verlag, Berlin, 2000.
• Kurs „Information Visualization“, Xiaoqiang Wang, Frühjahr 2011, http://people.sc.fsu.edu/~wwang3/course/
• B. Collins, Data Visualization - has it all been seen before?, In:
R. A. Earnshaw, D. Watson (eds.), Animation and Scientific Visualization: Tools and Applications, Academic Press, London - San Diego, 1993.
• Highlights und Lowlights der Grafikgeschichte:
http://www.datavis.ca/gallery/
• R. Spence, „Information Visualization. Design for Interaction“, Prentice Hall, London, 2007; Bilder zum Buch online.
• Kurs „Information Visualization“, LMU München, Dr. Thorsten Büring, WS 2007/2008
Michael Frank
HTWK-Leipzig, 2018 Oberseminar
Informationsvisualisierung 12.04.2018/57
Vielen Dank für Ihre Aufmerksamkeit – bis demnächst.