DIE ÖSTERREICHISCHE BIBLIOTHEKENVERBUND UND SERVICE GMBH
Linked (Open) Data im OBV?
Roland Lukesch | roland.lukesch@obvsg.at Verena Schaffner | verena.schaffner@obvsg.at
Österreichischer Bibliothekartag 2015 | Wien
Slot 6.1: Integrated Library Systems: open and shut
Web 1.0 – Web 2.0 – Web 3.0
http://www.moreyne.com/web-3-0-the-semantic-web/
Web 3.0 = Semantic Web
– Erweiterung des World Wide Webs
– Bedeutung von Informationen auch für Maschinen verwertbar machen – neue Ära der maschinellen Datenverarbeitung des Internets
„A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities.”
Berners-Lee 2001
Linked Data als Grundlage des Semantic Web
Internet Linked Data
„Netz von Dokumenten“ „Netz von Daten“
Verlinkung von Dokumenten Verlinkung von Daten
für Menschen lesbar und interpretierbar für Maschinen interpretierbar und verarbeitbar
untypisierte Links typisierte Links
Linked Data – Prinzipien
• Benutze URIs, um Entitäten zu identifizieren
• Verwende HTTP-URIs, so dass diese nachgeschlagen werden können
• wenn eine URI nachgeschlagen wird, sollen nützliche Informationen in Semantic-Web-Standards (RDF, SPARQL) bereitgestellt werden
• Einfügen von Links zu anderen URIs, sodass weitere Entitäten
entdeckt werden können
Linked Data – Beispiel
Warum Linked Data?
… für Kultureinrichtungen
• größere Sichtbarkeit und Reichweite der Daten
• leichterer Zugang / Einbindung
• neue Dienste /
Anwendungskontexte
• Interoperabilität mit anderen Communities
• mehr Arbeitsteilung / Nachnutzung
Hartmann/Schaffner 2015, Folie 12
Linked Open Data
http://www.w3.org/DesignIssues/LinkedData.html
AG Linked Data
Antrag an die Verbundvollversammlung im April 2012:
„Die Arbeitsgruppe soll zunächst einmal mögliche strategische Ziele im Umgang mit Linked Data an den österreichischen wissenschaftlichen Bibliotheken
identifizieren und ausarbeiten. […]“
6 gute Gründe, warum das Bibliothekswesen sich mit dem Semantic Web beschäftigen sollte:
1. weil es sonst andere tun
2. um nicht im unguten Sinne museal zu werden
3. weil zumindest Bibliotheken nach Einführung von RDA gar nicht mehr anders können!
4. weil Kultureinrichtungen auf Basis des Semantic Web ihren Benutzern attraktive und neuartige Funktionen anbieten können
5. weil sie einen spezifischen Beitrag zum Semantic Web leisten können
6. damit sie auch in Zukunft überhaupt noch wahr- und ernstgenommen werden, und zwar als Teile von ‚Wissensarchitekturen‘.“
Erste Erkenntnisse – 2012/2013
• Linked Data und Linked Open Data
• Open Data Strategien der Nationalbibliotheken
• Konkrete Projekte in europäischen Nationalbibliotheken
• Bibliothekarische Standards und Gremien
• Firmenpolitik (OCLC und Ex Libris)
• Implementierungsszenarien und Anwendungsfälle in Österreich Empfehlung
„Während Linked Open Data-Prinzipien bereits in Form von Nutzung bestehender externer Datenquellen (z.B. Wikipedia-Tab in Primo) eingesetzt werden, besteht bezüglich Veröffentlichung der Verbunddaten noch Entscheidungsbedarf. Eine entsprechende Debatte wurde in Österreich noch nicht in ausreichender Intensität geführt, weswegen die Arbeitsgruppe folgende Empfehlungen ausspricht:
Das nächste Ziel der Arbeitsgruppe ist die Entscheidungsvorbereitung über die Veröffentlichung der Verbunddaten unter einer freien Lizenz. Dazu bedarf es weiterer, intensiver Diskussionen aller betroffenen Parteien, die durch die Arbeitsgruppe moderiert werden können.“
Arbeitsschwerpunkte 2013/2014 – LOD nicht ohne O!
Durchführung von zwei Umfragen
National
• Zielgruppe: Mitglieder des Österr. Bibliothekenverbundes
• Frage nach institutioneller Position zum Thema „Offene Bibliotheksdaten“ / Linked Open Data
International
• Zielgruppe: Bibliotheken & vergleichbare Institutionen
• Frage nach Motivation, Aufwand und Erfahrungen für/mit Linked-Open-Data- Angebot
Ergebnisse
siehe: http://www.odok.at/dokumente/2014/odok/ODOK_2014_Praesentation_Goldfarb.pdf
Arbeitsschwerpunkte 2013/2014 – LOD nicht ohne O!
ODOK 2014: Open (?) Library Data
Organisation eines Programmblocks
• Drei Gastvorträge
• Stefanie Rühle (SUB Göttingen):
Ein Datenmodell - verschiedene Anwendungen: EDM in der Deutschen Digitalen Bibliothek
• Sylvia Petrovic-Majer (Open Knowledge Foundation Österreich, Wien):
Wieviel Vision vertragen wir? - Wissen, Transparenz und Teilhabe als Ziele der Open Knowledge Foundation
• Joachim Losehand (Wien): Urheberrecht und Open Data
• Präsentation der Umfrageergebnisse
• Podiumsdiskussion
Wege zu LOD:
Implementierungsszenarien im OBV
Datenabzüge („Dumps“)
• Publikation von Rohdaten
• Veröffentlichung des Google-Dumps
• Publikation von RDF-Dumps
Echtzeit-Abfragen
• SPARQL-Endpoint
• Bereitstellung über Primo
Wege zu LOD
Publikation von Rohdaten
Bereitstellung der Aleph-Rohdaten ohne weitere Konversion
• ASEQ
• Aleph-Publishing-Format (XML)
Vorteil
• Schnell und billig
Nachteile
• Standards nur im Bibliotheksbereich bekannt, dabei viele deutschsprachige / österreichische Besonderheiten
• Folglich kaum Nachnutzung zu erwarten
Wege zu LOD
Veröffentlichung des Google-Dumps
Derzeit
• Regelmäßige Bereitstellung eines Aleph-Exports für Google durch OBVSG
• Format: von Google vorgegeben (an Dublin Core angelehnt)
• Bisher keine Integration in Google-Services
Möglich
• Freie Lizenz
• Öffentlicher Zugriff auf Server
Vorteil
• Schnell und billig
Nachteil
• Kein standardisiertes Format
• Niedriger Detailgrad der Daten
Wege zu LOD
Publikation von RDF-Dumps
Ziele
• Bereitstellung bibliothekarischer Daten (Titel, Bestände, Normdaten)
• in einem standardisierten, maschinenlesbaren Format
• auf einem öffentlich zugänglichen Server
• unter einer freien Lizenz
Grundsätzlicher Ablauf
• Datenabzug von Aleph
• Konversion in RDF
• Bereitstellung
Wege zu LOD: Publikation von RDF-Dumps
Orientierung an Lösung des hbz
• Aleph als Verbundsystem
• Ähnliches Internformat
• Standards
• Nachnutzung von Software
Umsetzung im hbz
• Datenabzug im Aleph-Publishing-Format (XML)
• Konvertierung mit Metafacture
• Orientierung an Empfehlungen der DINI AG KIM zur RDF-Repräsentation von Titeldaten
• Veröffentlichung unter Creative Commons CC Zero-Lizenz
Wege zu LOD: Publikation von RDF-Dumps
Mögliche Umsetzung im OBV
• Denkbar als Dienst der OBVSG
• Für ausgewählte Verbundbibliotheken
Notwendige Umsetzungsschritte
• Aufbau einer Arbeitsumgebung
• Analyse und Anpassung der hbz-Konversionsroutinen
• Überführung in Regelbetrieb
• Regelmäßige Anpassung der Konversionsroutinen
• Wartung der Infrastruktur
Vorteile
• Nachnutzung der hbz-Lösung und etwaiger Weiterentwicklungen
• Standardisiertes Datenmodell und Vokabular potentiell leichte Nachnutzung
Nachteile
• Findbarkeit von Beständen nicht unmittelbar verbessert
Wege zu LOD
SPARQL-Endpoint
• RDF-Daten werden in Triple-Store eingebracht
• Können über das Internet mit SPARQL abgefragt werden
• Abfragesprache: Protocol and RDF Query Language
• Mögliche Weiterführung eines RDF-Dumps
Vorteile
• Komplexe Abfragen und Datenanalysen sind möglich
• Zugriff in Echtzeit
Nachteile
• Keine Implementierung im deutschsprachigen Bibliotheksbereich
• Große Anforderungen an technische Infrastruktur
• Zusatznutzen gegenüber RDF-Dump ungewiss
Wege zu LOD
Bereitstellung über Primo
• Derzeit in einer Beta-Version vorhanden
• Abfrage über REST-API
• Ausgabe in JSON-LD
Vorteile
• Umwandlung der PNX-Datensätze in JSON-LD passiert on the fly sind aktuell
• Zugriff in Echtzeit
Nachteile
• Konfigurierbarkeit unklar
• Permalink / AC-Nummer fehlt zur Zeit
Wie geht es weiter?
Technisch gibt es viele Wege
Gefragt sind nun allerdings bibliothekspolitische Entscheidungen
Danke für Ihre Aufmerksamkeit!
Roland Lukesch | roland.lukesch@obvsg.at | 01 4035158-48 Verena Schaffner | verena.schaffner@obvsg.at | 01 4035158-60