Konrad‐ Z use‐Zentrum
f I f h k
für I nformationstechnik
B erlin
Kundenprojekt „XML-Technologien“ p j g
Vorstellung
des Kunden und des Kunden und der Aufgabe
ld h lf l Susanne Gottwald
gottwald@zib.de
Thoralf Klein
thoralf.klein@zib.de
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
2
D ZIB d d KOBV
( ), [g , ]@ 5
Das ZIB und der KOBV
• Arbeitsgruppe Wissenschaftliche Information
▫ Außeruniversitäre Forschungseinrichtung Außeruniversitäre Forschungseinrichtung
K ti Bibli th k b d B li B d b
• Kooperativer Bibliotheksverbund Berlin‐Brandenburg
▫ Bibliotheks‐Service
▫ Aufgabe: Ausbau der bibliothekarischen
Informationsinfrastruktur, Entwicklung neuer Dienstleistungen
▫ Zentrale befindet sich am ZIB Zentrale befindet sich am ZIB
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
3
OAI PMH
( ), [g , ]@ 5
OAI-PMH
• Open Archives Initiative – Metadata Harvesting
• Ziel: bessere Auffindbarkeit von Publikationen im Ziel: bessere Auffindbarkeit von Publikationen im Web durch freie Verfügbarkeit von Metadaten
• Anwender:
▫ www.arXiv.org: ePrints aus Mathematik, Informatik, …
▫ www.kobv.de: Hosting für TU‐Berlin, SLB Potsdam, ... g , ,
Syntax im XML Format
• Syntax im XML‐Format
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
4
( ), [g , ]@ 5
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
5
( ), [g , ]@ 5
http://en wikipedia org/wiki/Tag cloud
http://en.wikipedia.org/wiki/Tag_cloud
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
6
( ), [g , ]@ 5
http://manyeyes.alphaworks.ibm.com/manyeyes/
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
7
D dl
( ), [g , ]@ 5
Datengrundlage
• KOBV Repositories:
▫ Ca. 20.000 Metadatensätze
▫ Hier erhältlich: www.zib.de/gottwald/oai‐pmh‐data.tgz
▫ Mögliche Relationen:
Co‐Autorenschaft
Klassifikationen (MSC, DDC)
Titelähnlichkeit ( ordnet ahoo boss )
Titelähnlichkeit (wordnet, yahoo boss…)
Mehr Daten zum Ausprobieren:
• Mehr Daten zum Ausprobieren:
▫ Ca. 600.000 Datensätze von http://www.ArXiv.org
▫ Ca 720 000 Datensätze von http://CiteSeerX ist psu edu
▫ Ca. 720.000 Datensätze von http://CiteSeerX.ist.psu.edu
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
8
A f b
( ), [g , ]@ 5
Aufgabe
• Visualisierung der vorhandenen Daten oder
• Visualisierung von Suchanfragen oder Visualisierung von Suchanfragen oder
• dynamisches Browsen in den Daten
Viel Spielraum – Überrascht uns!
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
9
V b
( ), [g , ]@ 5
Vorgaben
• Eingabe: Daten als OAI‐PMH
• Ausgabe: Visualisierung per Webapplikation Daten Ausgabe: Visualisierung per Webapplikation, Daten und Relationen persistent in einer XML‐DB
• Mögliche Technologien:
▫ SVG
▫ GraphViz p
▫ XHTML
▫▫ …
18.05.2010 Konrad-Zuse-Zentrum Berlin (ZIB), [gottwald, thoralf.klein]@zib.de
10
K k
( ), [g , ]@ 5