• Keine Ergebnisse gefunden

Seminar Gesellschaftliche Strukturen im digitalen Wandel Vortrag Linked Data in der Universitätsbibliothek Leipzig Franz Teichmann

N/A
N/A
Protected

Academic year: 2022

Aktie "Seminar Gesellschaftliche Strukturen im digitalen Wandel Vortrag Linked Data in der Universitätsbibliothek Leipzig Franz Teichmann"

Copied!
25
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Seminar Gesellschaftliche Strukturen im digitalen Wandel

Vortrag Linked Data in der Universitätsbibliothek Leipzig

Franz Teichmann

1

1Universität Leipzig

04.11.2014

(2)

Inhalt

1 Dateninfrastruktur der Universitätsbibliothek Leipzig

Datentypen

Ausgangszustand Problemstellung

2 praktische Lösung

Begriffserklärungen Linked Data Prinzipien

Datentransformationen und Integration neues System

3 Diskussion

(3)

Dateninfrastruktur der Universitätsbibliothek Leipzig

Bibliotheken seit jeher Quelle akademischen Wissens historisch gewachsene Informationssammlung

stetige Wartung, Aufbereitung dadurch sehr hohe Qualität

vollständig indizierte Sammlung verschiedener Medien lokal verfügbar (Bestands- und Leihexemplare)

langsame Erweiterung auf digitales Angebot

meist nur Online-Katalog

beschränkt auf einfache Suchen, indirekter Zugang

notwendig: Ausbau der Informations-Dienstleitung mit neuen

technischen Möglichkeiten

(4)

Dateninfrastruktur der Universitätsbibliothek Leipzig

Bibliotheken seit jeher Quelle akademischen Wissens historisch gewachsene Informationssammlung

stetige Wartung, Aufbereitung dadurch sehr hohe Qualität

vollständig indizierte Sammlung verschiedener Medien lokal verfügbar (Bestands- und Leihexemplare)

langsame Erweiterung auf digitales Angebot

meist nur Online-Katalog

beschränkt auf einfache Suchen, indirekter Zugang

notwendig: Ausbau der Informations-Dienstleitung mit neuen

technischen Möglichkeiten

(5)

Dateninfrastruktur der Universitätsbibliothek Leipzig

Bibliotheken seit jeher Quelle akademischen Wissens historisch gewachsene Informationssammlung

stetige Wartung, Aufbereitung dadurch sehr hohe Qualität

vollständig indizierte Sammlung verschiedener Medien lokal verfügbar (Bestands- und Leihexemplare)

langsame Erweiterung auf digitales Angebot

meist nur Online-Katalog

beschränkt auf einfache Suchen, indirekter Zugang

notwendig: Ausbau der Informations-Dienstleitung mit neuen

technischen Möglichkeiten

(6)

Datentypen in der UB Leipzig

Titeldaten

Titel Autor ISBN, PPN

Exemplardaten

Barcode Signatur RFID

Stammdaten

Standorte, Öffnungszeiten

Normdaten

z.B. abweichende Schreibweisen

(7)

Lokales System

(8)

Erklärungen zu Datenformaten 1/2

Titeldaten im Format MARC21

Machine-Readable Cataloging

feldorientiertes Format, ISO 2709

digitale Repräsentation von Karteikarten durch Binärverkettung Wegweisersymbole trennen Datenfelder und ermöglichen Navigation

Standard im Datenaustausch zwischen Bibliotheken in den 60er Jahren von der Library of Congress entwickelt

010 tag Library of Congress Control Number (LCCN) 020 tag (ISBN)

100 tag Name des Autors 245 tag Informationen zum Titel

260 tag zusätzliche Informationen zur Publikation 300 tag Beschreibung des Buches

650 tag Fachgebiet

Tabelle:meistverwendete MARC21 Tags

(9)

Erklärungen zu Datenformaten 1/2

Titeldaten im Format MARC21

Machine-Readable Cataloging

feldorientiertes Format, ISO 2709

digitale Repräsentation von Karteikarten durch Binärverkettung Wegweisersymbole trennen Datenfelder und ermöglichen Navigation Standard im Datenaustausch zwischen Bibliotheken

in den 60er Jahren von der Library of Congress entwickelt 010 tag Library of Congress Control Number (LCCN) 020 tag (ISBN)

100 tag Name des Autors 245 tag Informationen zum Titel

260 tag zusätzliche Informationen zur Publikation 300 tag Beschreibung des Buches

650 tag Fachgebiet

Tabelle:meistverwendete MARC21 Tags

(10)

Erklärungen zu Datenformaten 2/2

Exemplardaten

Daten eingefügt in Libero-Server-System interne Datenhaltung nicht transparent

Funktionen unbekannt, Mitarbeiter entwickelten über Jahre Schnittstelle nach außen

Abfrage einzelner Datensätze über resource_id möglich

Indikator für vorhandene Exemplare in der UB Leipzig in Subfeld der Titeldaten

Stammdaten

von Mitarbeitern der UB Leipzig in XML getippt

beeindruckend fehlerfrei und problemlos in viele Formate konvertierbar

Normdaten

von der deutschen Nationalbibliothek (GND) in RDF angeboten

(11)

Erklärungen zu Datenformaten 2/2

Exemplardaten

Daten eingefügt in Libero-Server-System interne Datenhaltung nicht transparent

Funktionen unbekannt, Mitarbeiter entwickelten über Jahre Schnittstelle nach außen

Abfrage einzelner Datensätze über resource_id möglich

Indikator für vorhandene Exemplare in der UB Leipzig in Subfeld der Titeldaten

Stammdaten

von Mitarbeitern der UB Leipzig in XML getippt

beeindruckend fehlerfrei und problemlos in viele Formate konvertierbar

Normdaten

von der deutschen Nationalbibliothek (GND) in RDF angeboten

(12)

Problemstellung

Finden eines "gemeinsamen Nenners"

dynamisches Überführen aller Daten in einheitliches Format

Erweiterbarkeit

effiziente Suche erforderlich

Konzeption einer nutzerfreundlichen Schnittstelle nach außen

Tests und Rollout des Systems

(13)

praktische Lösung

Beibehalten der grundlegenden Infrastruktur RDF als gewähltes einheitliches Format Linked Data als Technologie der Wahl

Daten konzeptionell kompatibel, auch zu anderen Quellen (vorgegeben)

gewünschte Funktionalität gute Referenzen

Entwurf, Planung einer neuen Präsentationsschicht

Tests und Rollout des Systems

(14)

Begriffserklärungen

XML

Extensible Markup Language

hierarchisch strukturierte Daten in Textform menschenlesbar, lizenzfrei, plattformunabhängig

RDF

Resource Description Framework Datensätze in Form simpler Aussagen Subjekt-Prädikat-Objekt "Bob knows Fred"

Verkettung zu Wissensgraphen, darstellbar in vielen Formaten (Serialisierungen), z.B. XML

URI

Uniform Resource Identifier: Zeichenkette zur eindeutigen Identifizierung von Ressourcen

Untermenge: Uniform Resource Locator (URL)

Benennung über primären Zugriffsmechanismus (http,ftp)

(15)

Begriffserklärungen

XML

Extensible Markup Language

hierarchisch strukturierte Daten in Textform menschenlesbar, lizenzfrei, plattformunabhängig

RDF

Resource Description Framework Datensätze in Form simpler Aussagen Subjekt-Prädikat-Objekt "Bob knows Fred"

Verkettung zu Wissensgraphen, darstellbar in vielen Formaten (Serialisierungen), z.B. XML

URI

Uniform Resource Identifier: Zeichenkette zur eindeutigen Identifizierung von Ressourcen

Untermenge: Uniform Resource Locator (URL)

Benennung über primären Zugriffsmechanismus (http,ftp)

(16)

Begriffserklärungen

XML

Extensible Markup Language

hierarchisch strukturierte Daten in Textform menschenlesbar, lizenzfrei, plattformunabhängig

RDF

Resource Description Framework Datensätze in Form simpler Aussagen Subjekt-Prädikat-Objekt "Bob knows Fred"

Verkettung zu Wissensgraphen, darstellbar in vielen Formaten (Serialisierungen), z.B. XML

URI

Uniform Resource Identifier: Zeichenkette zur eindeutigen Identifizierung von Ressourcen

Untermenge: Uniform Resource Locator (URL)

Benennung über primären Zugriffsmechanismus (http,ftp)

(17)

Beispiel

XML

http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml

RDF

@prefix dbr: <http://dbpedia.org/resource/> .

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema> .

@prefix dbp: <http://dbpedia.org/property/> . dbr:Leipzig rdfs:label "Leipzig"@de .

dbr:Leipzig dbp:hasMayor dbr:Burkhard_Jung . dbr:Leipzig dbp:locatedIn dbr:Saxony,

dbr:Germany.

(18)

Linked Data Prinzipien

nach Tim Berners Lee, 2009:

http://www.w3.org/DesignIssues/LinkedData.html Verwendung von URIs als Bezeichner für alle Ressourcen

ermöglicht Unterscheidung und eindeutige Bestimmung von Entitäten gilt auch für Prädikate

Verwendung von HTTP als Schema

die URI ist damit eine URL und kann in jedem Webbrowser eingegeben werden

Dereferenzierung

Unterscheidung zwischen Ressource selbst und Website über Ressource

Einhaltung gewisser Standards bei der Dereferenzierung von

HTTP-URIs

gemeint ist Rückgabe von RDF-XML beim Nachschlagen einer Ressource

sinnvolle Informationen über die Ressource

Darstellung von Zusammenhängen zwischen Ressourcen

sinnvoller Grad der Vernetzung innerhalb der Wissensbasis Vernetzung mit anderen Wissensbasen z.B. mit owl:sameAs

(19)

Linked Data Prinzipien

nach Tim Berners Lee, 2009:

http://www.w3.org/DesignIssues/LinkedData.html Verwendung von URIs als Bezeichner für alle Ressourcen

ermöglicht Unterscheidung und eindeutige Bestimmung von Entitäten gilt auch für Prädikate

Verwendung von HTTP als Schema

die URI ist damit eine URL und kann in jedem Webbrowser eingegeben werden

Dereferenzierung

Unterscheidung zwischen Ressource selbst und Website über Ressource

Einhaltung gewisser Standards bei der Dereferenzierung von HTTP-URIs

gemeint ist Rückgabe von RDF-XML beim Nachschlagen einer Ressource

sinnvolle Informationen über die Ressource

Darstellung von Zusammenhängen zwischen Ressourcen

sinnvoller Grad der Vernetzung innerhalb der Wissensbasis Vernetzung mit anderen Wissensbasen z.B. mit owl:sameAs

(20)

Linked Data Prinzipien

nach Tim Berners Lee, 2009:

http://www.w3.org/DesignIssues/LinkedData.html Verwendung von URIs als Bezeichner für alle Ressourcen

ermöglicht Unterscheidung und eindeutige Bestimmung von Entitäten gilt auch für Prädikate

Verwendung von HTTP als Schema

die URI ist damit eine URL und kann in jedem Webbrowser eingegeben werden

Dereferenzierung

Unterscheidung zwischen Ressource selbst und Website über Ressource

Einhaltung gewisser Standards bei der Dereferenzierung von

HTTP-URIs

gemeint ist Rückgabe von RDF-XML beim Nachschlagen einer Ressource

sinnvolle Informationen über die Ressource

Darstellung von Zusammenhängen zwischen Ressourcen

sinnvoller Grad der Vernetzung innerhalb der Wissensbasis Vernetzung mit anderen Wissensbasen z.B. mit owl:sameAs

(21)

Linked Data Prinzipien

nach Tim Berners Lee, 2009:

http://www.w3.org/DesignIssues/LinkedData.html Verwendung von URIs als Bezeichner für alle Ressourcen

ermöglicht Unterscheidung und eindeutige Bestimmung von Entitäten gilt auch für Prädikate

Verwendung von HTTP als Schema

die URI ist damit eine URL und kann in jedem Webbrowser eingegeben werden

Dereferenzierung

Unterscheidung zwischen Ressource selbst und Website über Ressource

Einhaltung gewisser Standards bei der Dereferenzierung von

HTTP-URIs

gemeint ist Rückgabe von RDF-XML beim Nachschlagen einer Ressource

sinnvolle Informationen über die Ressource

Darstellung von Zusammenhängen zwischen Ressourcen

sinnvoller Grad der Vernetzung innerhalb der Wissensbasis

(22)

Datentransformationen und Integration

Titeldaten

extrahieren des ursprünglichen MARC21-Blob aus der Datenbank parsing nach XML mithilfe von regulären Ausdrücken (Leitfaden GND) Transformation nach RDF mit Script der Library of Congress

Exemplardaten

Abfrage und Transformation (kompatible Formate) Verlinkung mit Titeldaten

(23)

Stand der Umsetzung

(24)

Diskussion

Würden Sie das neue Angebot der UB Leipzig nutzen?

Wie schätzen Sie die praktische Relevanz der Funktionalitätserweiterung ein?

Welche Funktionalität fehlt bisher?

(25)

Diskussion

Bibliothek der Moderne und modernes Urheberrecht

Ansichtsexemplare

digitale Leseräume mit Zugangsbeschränkung

Unterscheidung zwischen digitaler und physischer Präsenz in der Bibliothek

Referenzen

ÄHNLICHE DOKUMENTE

Linked Data, Microformats, RDFa, Microdata..

Linked Data, Microformats, RDFa, Microdata..

Linked Data, Microformats, RDFa, Microdata.. Markus Luczak-Rösch Freie Universität Berlin Institut

Linked Data, Microformats, RDFa, Microdata.. Markus Luczak-Rösch Freie Universität Berlin Institut

We have presented a layered architecture for question answering over linked data that relies on an ordered processing pipeline consisting of the following steps: an inverted

In einer bürgerlichen Gesellschaft mit Privatsphäre und Durchgriffs- verbot als hohen kulturellen Werten kann nicht die Transparenz der Positionen, sondern nur die Transparenz

„Während Linked Open Data-Prinzipien bereits in Form von Nutzung bestehender externer Datenquellen (z.B. Wikipedia-Tab in Primo) eingesetzt werden, besteht bezüglich

c. Zugriff via Datenbankabfrage mit der RDF-Abfragesprache SPARQL Diese Zugriffsmöglichkeit bietet die größte Flexibilität für Anwende- rInnen der Daten. Über die