DIE ÖSTERREICHISCHE BIBLIOTHEKENVERBUND UND SERVICE GMBH
Katalog-Anreicherung mit eDOC im Österreichischen Bibliothekenverbund
V. Babitchev – J. Brandauer
Verbundtag 2006 – UB Salzburg – 17. Mai 2006
Übersicht
Übersicht
Kataloganreicherung wozu?
Was machen die anderen?
Projekte / Methoden in den Verbundbibliotheken
eDOC-Lösung
eDOC-Architektur-Übersicht
Weiterentwicklung
Demo
Kataloganreicherung wozu?
Katalog-Anreicherung wozu?
In Zeiten von Amazon und Google sind Benutzer es gewohnt, Zugriffe auf eine Vielzahl von Informationen zu einem Medium zu erhalten
Catalogue Enrichment
bringt Zusatzinformationen, die dem Benutzer sowohl Orientierungs- als auch Entscheidungshilfe bei der Literaturauswahl bieten
bringt eine vertiefte Erschliessung des Bibliotheksbestandes
bringt eine erhebliche Verbesserung der Recherchequalität - Null-Treffer werden reduziert
bedeutet somit eine wesentliche Qualitätsverbesserung des Bibliotheksangebots
Was machen die anderen? - 1
Beispiel Deutschland - hbz
hbz - Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen [180.000]
In Kooperation mit Bibliotheken aus Nordrhein-Westphalen wird die Digitalisierung der Inhaltsverzeichnisse von Monographien realisiert
Speicherung der Daten auf hbz-Medienserver [DigiTool]
Zugang über Verbunddatenbank und Dreiländerkatalog
01.08. – 31.12.2005: 180.000 Inhaltsverzeichnisse aus den Fachbereichen
Wirtschafts- und Sozialwissenschaften (120.000) [USB Köln]
Medizin (60.000) [ZB MED]
01.01.2006 –
Fortsetzung des Projekts mit weiteren Bibliotheken – auch retrospektiv!
Ziel: Alle Neuzugänge des Verbundes sollen gescannt werden!
http://suchen.hbz-nrw.de/dreilaender/
Was machen die anderen? - 2
Beispiel Deutschland - BSZ
BSZ – Bibliotheksservice-Zentrum Baden-Württemberg [71.000]
SWBplus – Kooperative Kataloganreicherung
Das BSZ bietet Bibliotheken einen einfachen, zentral koordinierten Workflow zur Erfassung von Zusatzinformationen – TOCs, Verlagsinfos, Abstracts, Cover, Rezensionen etc.
Bibliotheken scannen nach fachlicher Auswahl
automatisierte Übermittlung an das BSZ
Zentrale Texterkennung und computerlinguistische Bearbeitung
Export der Daten in die lokalen OPACs
Zusätzliche Integration von Daten weiterer Anbieter - Library of Congress, DDB, Buchhändler und Verlage
Austausch der Daten mit anderen Verbünden http://www.bsz-bw.de/SWBplus/
Was machen die anderen? - 3
Beispiel Schweiz
NEBIS – Netzerk von Bibliotheken und Informationsstellen in der Schweiz [50.000]
Für mehr als 50.000 Bücher sind im NEBIS-Katalog über die Link-Verknüpfung
"Abstract / Index" zusätzliche Informationen verfügbar
Zusammenfassungen, Inhaltsverzeichnisse oder Angaben über Autoren
Texte, die die Verlage Wiley und Springer zur Verfügung stellen
Daten, die in Eigenproduktion generiert werden http://www.nebis.ch/index.html
Projekte / Methoden in den Verbundbibliotheken - 1
Projekte / Methoden in den Verbundbibliotheken
Methode Scanning - Standard-Methode der Projektteilnehmer
UBI: Erster Einsatz im Jahr 2000
UBG: 2005/2006: Neben TOC werden auch Umschlagbilder und Klappentexte geliefert Lieferung der Objekte in elektronischer Form
WUW: Über 1000 Abstracts der Dissertationen 1990-2001 wurden als txt-Dateien geliefert
Objekte liegen auf lokalem Server
TUW: 2006: Lieferung der Links (URLs) zu allen Volltext-Dissertationen > 400 Objekte von Verlagen
ZBM / VUW: Erster Test mit TOCs und Umschlagbildern von Verlagen
- Über 1000 Objekte wurden mit Verbundtiteln (nach Abgleich) verlinkt
Projekte / Methoden in den Verbundbibliotheken - 2
Sonderprojekte
Sonderprojekte mit ONB ONB-ANNO
Erster Versuch der OBVSG geschlossene Zeitschriften-Aufsätze nicht im Verbundkatalog sondern in eDOC zu speichern
Metadaten (BIB) werden von externem Aleph-System (ONB07) ‚geharvestet‘
Externer Link führt zu Volltext des Artikels
Aufsätze der Zeitschrift ‚Zeitgeschichte‘: 827 Dokumente ONB-IVSCAN
OBVSG verlinkt Titel des Sammelwerks (ACC01) mit Image des Inhaltsverzeichnisses auf ONB-Server
OBVSG erzeugt aus den einzelnen Aufsatz-Rekords Inhaltsverzeichnisse im HTML-DC- Format zur eDOC-Indexierung
Bis jetzt wurden in 4 Lieferungen
- 32.000 Datensätze in den Verbundkatalog geladen
eDOC-Lösung - 1
1 Grundsätzliches Verfahren
Der zentrale Verbundkatalog mit Datenreplikation bietet die ideale Voraussetzung für eine gemeinsame Nutzung der Anreicherungsdaten
eDOC ist eine externe, eng an den Verbundkatalog gekoppelte Anwendung, die neue Funktionen bietet
Täglicher Transfer der von den Bibliotheken vorbereiteten / gescannten Objekte auf den eDOC-Server
Verarbeitung der Daten und automatische Verlinkung mit dem Verbundkatalog unter Bildung von stabilen Standard-URLs (Basis: Verbund-ID)
Update der lokalen Kataloge
Aktualisierung der Suchmaschinen-Indizes (Swish-e) und der eDOC-Web-Sichten
eDOC-Lösung - 2
2 Objektverarbeitung / Objektspeicherung
Seit der Einführung von eDOC im November 2000 wurde die Anwendung laufend an die Bedürfnisse der Anwender angepasst und repräsentiert nun eine robuste und zuverlässige Lösung
Metadaten und Objekt-Sammlung
- Batch-Client / Verbundkatalog – einfach und effizient, meist verwendet - externe Datenquellen (Nicht-Verbundkatalog – ‚Aleph-Daten-Container‘
- ÖNB ANNO-A, Seibersdorf Diss.-DB-Daten, Verlegerdaten
Zentrale Datenhaltung in RDBMS Repository
- digitale Objekte können auch ausserhalb von eDoc gehalten werden
Objektverarbeitung unter Berücksichtigung der ‚Local Ownership‘
Optimale Zusammenarbeit zwischen Datenbank und Suchmaschine - ‚each does what it can do best‘
Flexible Gestaltung der Suchmaschinen-Indizes
- verschiedene Indexe können parallel durchsucht werden
eDOC-Lösung - 3
3 Indexierung / Recherche
Swish-e unterstützt die Recherche in strukturierten (z.B. bibliographischen) als auch unstrukturierten Daten (Volltexte, Abstracts etc.)
Strukturierte Daten
Indexierung der bibliographischen Daten analog den Verbunddaten Titel – Autor – Schlagwörter – Jahr
Indexierung administrativer Daten zur Bildung lokaler Sichten Produzent – Nutzer – Collection etc.
Unstrukturierte Daten
Volltext-Indexierung
Abstracts – Inhaltsverzeichnisse – Volltexte – Klappentexte etc.
Die Suche in strukturieten und unstrukturieten Daten ist frei kombinierbar!
eDOC-Lösung - 4. Architektur-Übersicht
Verbundkatalog ACC01
Daten-Quellen
eDOC Repository – Meta- und Objekt-Daten / MySQL Batch-Client / Remote Access / Direkt Laden
Indexe der Swish-e-Suchmaschine
eDOC Bestände der Verbunddatenbank
Daten-Sammlung
Lokaler OPAC C Simultane Recherche:
- lokaler OPAC - lokale - eDOC Sicht
Ergebnis der Verbundrecherche mit Links zur dig.
Objekten in eDOC
Daten-Haltung
Indexierung
Scans extern
ACC01 Objekte
BIB (Meta) ACC01
extern Aleph extern
Verleger
ACC01
Bibl. A Bibl. B Bibl. C
Diss. DB IV-SCAN ANNO-A
eDOC Gesamt-Suche
eDOC-Web- Sichten
Lokaler Externe Objekte
eDOC-Lösung - 5
4 Statistik - Teilnehmer
Am eDOC-Unternehmen der OBVSG nehmen mit Stand Mai 2006 folgende 8(9) Einrichtungen teil
Scanning – Datenlieferung über eDOC-Batchclient
Oberösterreichische Landesbibliothek
Universitätsbibliothek der Universität für Bodenkultur Wien
Universitätsbibliothek der Montanuniversität Leoben
Universitätsbibliothek der Technischen Universität Wien
Universitätsbibliothek Graz
Universitätsbibliothek Innsbruck
Universitätsbibliothek der Wirtschaftsuniversität Wien
Universitätsbibliothek der Medizinischen Universität Wien IVSCAN - Lieferung fertiger Katalogisate
Österreichische Nationalbibliothek
eDOC-Lösung - 6
5 Statistik - Objekte
Stand Mai 2006: 62.692 Objekte
36 Titelseiten
81 Aggregate (Inhaltsverzeichnisse)
180 Rezensionen
427 Volltexte
530 Klappentexte
1.486 Umschlagbilder
13.102 Inhaltsverzeichnisse
46.066 Abstracts
784 ONB-ANNO
Anzahl Objekt-Typ
Weiterentwicklung - 1
Weiterentwicklung: Datenanreicherung
Mitarbeit weiterer Einrichtungen
Integration von Verleger-Daten
Zusammenarbeit der Verbünde
Weiterentwicklung: Recherche
Suche in Verbund und eDOC über eine gemeinsame ‚Suchmaschine‘
Weiterentwicklung - 2
Zusammenarbeit der Verbünde
Arbeitsgruppe Kataloganreicherung
Eingerichtet auf Anregung / Beschluss der AG der Verbundsysteme 1. Sitzung am 22.02. in Köln – Teilnahme aller Verbünde
Basis
Vereinbarung zwischen hbz und GBV zum KOOPERATIVEN SCANNEN
- Zusammenführung der TOC-Datenvon Monographien in einer zentralen Referenz- Datenbank
- hbz: DigiTool
- Zentrale TOC-Datenhaltung für Zeitschriftenaufsätze im GBV
- Dieser Vereinbarung können sich weitere Verbünde anschliessen!
Workflow
- ftp-Lieferung von Metadaten an das hbz – Laden auf den Medienserver - hbz-Medienserver mit Recherche-Schnittstelle auf Basis Z39.50 sowie OAI
Datentausch
- auf Basis der Gegenseitigkeit - 40 Cent pro genutzter Scan-Datei
Demo
Kurze Demonstration ausgewählter Beispiele