Linked (Open) Data im OBV?

(1)

DIE ÖSTERREICHISCHE BIBLIOTHEKENVERBUND UND SERVICE GMBH

Linked (Open) Data im OBV?

Roland Lukesch | roland.lukesch@obvsg.at Verena Schaffner | verena.schaffner@obvsg.at

Österreichischer Bibliothekartag 2015 | Wien

Slot 6.1: Integrated Library Systems: open and shut

(2)

Web 1.0 – Web 2.0 – Web 3.0

http://www.moreyne.com/web-3-0-the-semantic-web/

(3)

Web 3.0 = Semantic Web

– Erweiterung des World Wide Webs

– Bedeutung von Informationen auch für Maschinen verwertbar machen – neue Ära der maschinellen Datenverarbeitung des Internets

„A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities.”

Berners-Lee 2001

(4)

Linked Data als Grundlage des Semantic Web

Internet Linked Data

„Netz von Dokumenten“ „Netz von Daten“

Verlinkung von Dokumenten Verlinkung von Daten

für Menschen lesbar und interpretierbar für Maschinen interpretierbar und verarbeitbar

untypisierte Links typisierte Links

(5)

Linked Data – Prinzipien

• Benutze URIs, um Entitäten zu identifizieren

• Verwende HTTP-URIs, so dass diese nachgeschlagen werden können

• wenn eine URI nachgeschlagen wird, sollen nützliche Informationen in Semantic-Web-Standards (RDF, SPARQL) bereitgestellt werden

• Einfügen von Links zu anderen URIs, sodass weitere Entitäten

entdeckt werden können

(6)

Linked Data – Beispiel

(7)

Warum Linked Data?

… für Kultureinrichtungen

• größere Sichtbarkeit und Reichweite der Daten

• leichterer Zugang / Einbindung

• neue Dienste /

Anwendungskontexte

• Interoperabilität mit anderen Communities

• mehr Arbeitsteilung / Nachnutzung

Hartmann/Schaffner 2015, Folie 12

(8)

Linked Open Data

http://www.w3.org/DesignIssues/LinkedData.html

(9)

AG Linked Data

Antrag an die Verbundvollversammlung im April 2012:

„Die Arbeitsgruppe soll zunächst einmal mögliche strategische Ziele im Umgang mit Linked Data an den österreichischen wissenschaftlichen Bibliotheken

identifizieren und ausarbeiten. […]“

6 gute Gründe, warum das Bibliothekswesen sich mit dem Semantic Web beschäftigen sollte:

1. weil es sonst andere tun

2. um nicht im unguten Sinne museal zu werden

3. weil zumindest Bibliotheken nach Einführung von RDA gar nicht mehr anders können!

4. weil Kultureinrichtungen auf Basis des Semantic Web ihren Benutzern attraktive und neuartige Funktionen anbieten können

5. weil sie einen spezifischen Beitrag zum Semantic Web leisten können

6. damit sie auch in Zukunft überhaupt noch wahr- und ernstgenommen werden, und zwar als Teile von ‚Wissensarchitekturen‘.“

(10)

Erste Erkenntnisse – 2012/2013

• Linked Data und Linked Open Data

• Open Data Strategien der Nationalbibliotheken

• Konkrete Projekte in europäischen Nationalbibliotheken

• Bibliothekarische Standards und Gremien

• Firmenpolitik (OCLC und Ex Libris)

• Implementierungsszenarien und Anwendungsfälle in Österreich Empfehlung

„Während Linked Open Data-Prinzipien bereits in Form von Nutzung bestehender externer Datenquellen (z.B. Wikipedia-Tab in Primo) eingesetzt werden, besteht bezüglich Veröffentlichung der Verbunddaten noch Entscheidungsbedarf. Eine entsprechende Debatte wurde in Österreich noch nicht in ausreichender Intensität geführt, weswegen die Arbeitsgruppe folgende Empfehlungen ausspricht:

Das nächste Ziel der Arbeitsgruppe ist die Entscheidungsvorbereitung über die Veröffentlichung der Verbunddaten unter einer freien Lizenz. Dazu bedarf es weiterer, intensiver Diskussionen aller betroffenen Parteien, die durch die Arbeitsgruppe moderiert werden können.“

(11)

Arbeitsschwerpunkte 2013/2014 – LOD nicht ohne O!

Durchführung von zwei Umfragen

National

• Zielgruppe: Mitglieder des Österr. Bibliothekenverbundes

• Frage nach institutioneller Position zum Thema „Offene Bibliotheksdaten“ / Linked Open Data

International

• Zielgruppe: Bibliotheken & vergleichbare Institutionen

• Frage nach Motivation, Aufwand und Erfahrungen für/mit Linked-Open-Data- Angebot

Ergebnisse

siehe: http://www.odok.at/dokumente/2014/odok/ODOK_2014_Praesentation_Goldfarb.pdf

(12)

Arbeitsschwerpunkte 2013/2014 – LOD nicht ohne O!

ODOK 2014: Open (?) Library Data

Organisation eines Programmblocks

• Drei Gastvorträge

• Stefanie Rühle (SUB Göttingen):

Ein Datenmodell - verschiedene Anwendungen: EDM in der Deutschen Digitalen Bibliothek

• Sylvia Petrovic-Majer (Open Knowledge Foundation Österreich, Wien):

Wieviel Vision vertragen wir? - Wissen, Transparenz und Teilhabe als Ziele der Open Knowledge Foundation

• Joachim Losehand (Wien): Urheberrecht und Open Data

• Präsentation der Umfrageergebnisse

• Podiumsdiskussion

(13)

Wege zu LOD:

Implementierungsszenarien im OBV

Datenabzüge („Dumps“)

• Publikation von Rohdaten

• Veröffentlichung des Google-Dumps

• Publikation von RDF-Dumps

Echtzeit-Abfragen

• SPARQL-Endpoint

• Bereitstellung über Primo

(14)

Wege zu LOD

Publikation von Rohdaten

Bereitstellung der Aleph-Rohdaten ohne weitere Konversion

• ASEQ

• Aleph-Publishing-Format (XML)

Vorteil

• Schnell und billig

Nachteile

• Standards nur im Bibliotheksbereich bekannt, dabei viele deutschsprachige / österreichische Besonderheiten

• Folglich kaum Nachnutzung zu erwarten

(15)

Wege zu LOD

Veröffentlichung des Google-Dumps

Derzeit

• Regelmäßige Bereitstellung eines Aleph-Exports für Google durch OBVSG

• Format: von Google vorgegeben (an Dublin Core angelehnt)

• Bisher keine Integration in Google-Services

Möglich

• Freie Lizenz

• Öffentlicher Zugriff auf Server

Vorteil

• Schnell und billig

Nachteil

• Kein standardisiertes Format

• Niedriger Detailgrad der Daten

(16)

Wege zu LOD

Publikation von RDF-Dumps

Ziele

• Bereitstellung bibliothekarischer Daten (Titel, Bestände, Normdaten)

• in einem standardisierten, maschinenlesbaren Format

• auf einem öffentlich zugänglichen Server

• unter einer freien Lizenz

Grundsätzlicher Ablauf

• Datenabzug von Aleph

• Konversion in RDF

• Bereitstellung

(17)

Wege zu LOD: Publikation von RDF-Dumps

Orientierung an Lösung des hbz

• Aleph als Verbundsystem

• Ähnliches Internformat

• Standards

• Nachnutzung von Software

Umsetzung im hbz

• Datenabzug im Aleph-Publishing-Format (XML)

• Konvertierung mit Metafacture

• Orientierung an Empfehlungen der DINI AG KIM zur RDF-Repräsentation von Titeldaten

• Veröffentlichung unter Creative Commons CC Zero-Lizenz

(18)

Wege zu LOD: Publikation von RDF-Dumps

Mögliche Umsetzung im OBV

• Denkbar als Dienst der OBVSG

• Für ausgewählte Verbundbibliotheken

Notwendige Umsetzungsschritte

• Aufbau einer Arbeitsumgebung

• Analyse und Anpassung der hbz-Konversionsroutinen

• Überführung in Regelbetrieb

• Regelmäßige Anpassung der Konversionsroutinen

• Wartung der Infrastruktur

Vorteile

• Nachnutzung der hbz-Lösung und etwaiger Weiterentwicklungen

• Standardisiertes Datenmodell und Vokabular potentiell leichte Nachnutzung

Nachteile

• Findbarkeit von Beständen nicht unmittelbar verbessert

(19)

Wege zu LOD

SPARQL-Endpoint

• RDF-Daten werden in Triple-Store eingebracht

• Können über das Internet mit SPARQL abgefragt werden

• Abfragesprache: Protocol and RDF Query Language

• Mögliche Weiterführung eines RDF-Dumps

Vorteile

• Komplexe Abfragen und Datenanalysen sind möglich

• Zugriff in Echtzeit

Nachteile

• Keine Implementierung im deutschsprachigen Bibliotheksbereich

• Große Anforderungen an technische Infrastruktur

• Zusatznutzen gegenüber RDF-Dump ungewiss

(20)

Wege zu LOD

Bereitstellung über Primo

• Derzeit in einer Beta-Version vorhanden

• Abfrage über REST-API

• Ausgabe in JSON-LD

Vorteile

• Umwandlung der PNX-Datensätze in JSON-LD passiert on the fly sind aktuell

• Zugriff in Echtzeit

Nachteile

• Konfigurierbarkeit unklar

• Permalink / AC-Nummer fehlt zur Zeit

(21)

Wie geht es weiter?

Technisch gibt es viele Wege

Gefragt sind nun allerdings bibliothekspolitische Entscheidungen

(22)

Danke für Ihre Aufmerksamkeit!

Roland Lukesch | roland.lukesch@obvsg.at | 01 4035158-48 Verena Schaffner | verena.schaffner@obvsg.at | 01 4035158-60