• Keine Ergebnisse gefunden

Interview Staatsbibliothek zu Berlin, Preußischer Kulturbesitz

9. ANLAGEN

9.9. Interviewtranskripte

9.9.2. Interview Staatsbibliothek zu Berlin, Preußischer Kulturbesitz

Staatsbibliothek zu Berlin, Preußischer Kulturbesitz - Thorsten Siegmann/Renate Müller 19.06.2019

If-2. Digitalisierung.

If-2.1. Werden bestimmte externe Standards zur Digitalisierung in Ihrer Einrichtung angewandt (z.B. die DFG-Praxisregeln zur Digitalisierung) oder folgt man hausinternen Richtlinien?

Sowohl als auch. Die DFG-Standards sind auf jeden Fall die maßgebliche Leitlinie für die Digitalisierung, werden seit Anfang an angewandt und definieren für uns auch den Mindeststandard. Diese Funktion ist ganz wichtig. Wir gehen also auf keinen Fall, selbst wenn ein Projekt nicht DFG-gefördert ist, unter diese Anforderungen. Sie garantieren uns einen Standard, dass wir mit anderen Einrichtungen vergleichbar sind, einen Mindeststandard haben und eine gewissen Interoperabilität der Daten vorliegt. Zudem bilden sie eine Sicherheit, die erzeugten Digitalisate soweit machbar über lange Zeit zu präsentieren und mindestens über den DFG-Viewer sichtbar zu halten, wodurch die Verbreitung und Sichtbarkeit garantiert ist.

Wir gehen aber auch über die DFG-Richtlinien hinaus. Z.B. haben wir bei vielen Projekten für jedes Projekt eigene Projektrichtlinien beim Scannen, in denen wir bestimmte Feinheiten festlegen. Das kann, je nachdem, was gescannt wird, eine Erhöhung der Auflösung sein, aber auch Anforderungen wie bestimmte Bestände mit oder ohne Rand scannen oder ob man den Buchschnitt mitscannt oder nicht. Da sind die DFG-Richtlinien ja erstmal offen, daher wird sowas in den Projektrichtlinien festgelegt, je nachdem, was sich für die Objekte anbietet.

Darüber hinaus versuchen wir mehr und mehr die Metamorfoze-Guidlines bzw. den ISO 19264-1-Standard zu berücksichtigen, also ein gewisses technisches Mindestmaß an die Abbildungsqualität der Scanner sicherzustellen. Das ist nicht in den DFG-Standards festleget, aber wichtig, damit man die Originalgetreue des Werkes möglichst gut erfassen und perspektivisch nachweisen kann, diese zu garantieren.

Wenn wir nicht nur die Images betrachten, dann haben wir auch selbstgewählte Standards für die Strukturdatenerfassung. Diese werden projektspezifisch ausgewählt von gar nichts bis hin zu feinstens strukturierter Erfassung, wo auch eine Auswahl an projektspezifischen Benennungen zur Verfügung steht. Das ist aber der einzige Bereich der Erfassung, in dem Standards für die Digitalisierung festgelegt sind. Für den Nachweis gelten bei uns die selben Standards, die wir für die Katalogisierung anwenden.

If-2.2. Welche Standards gelten konkret für die Erzeugung von Master-Bilddigitalisaten (z.B. DPI-Anzahl, Farbtiefe, Farbraum, Format, ...).

Minimalanforderungen sind mindestens 300 dpi, 24 Bit Farbtiefe, Farbraum RGB, Masterformat ist unkomprimiertes TIFF.

Von da aus kann man natürlich in bestimmten Fällen nach oben abweichen. Bspw. hat unsere Mittelformatkamera in der Fotostelle 16 Bit Farbtiefe, die dpi-Anzahl wechselt je nach Projekt, mal 300, mal 600, mal 400 dpi. Es wird immer eine TIFF-Datei erzeugt, im Rahmen von DoD können jedoch auch JPEG oder PDF ausgegeben werden.

Wenn von Microfilmen digitalisiert wird, z.B. in der Zeitungsdigitalisierung, ist der Farbraum eine Graustufenaufnahme oder Bitmap, wenn die Vorlage nichts anderes erlaubt bzw. nichts anderes hergibt.

If-2.3. Wie viele Digitalisate bieten Sie insgesamt an?

Aktuell (Stand 19.06.2019) befinden sich 154.159 Werke in den Digitalisierten Sammlungen. Wir zählen dabei die Goobi-Vorgänge, wobei ein Vorgang sowohl ein umfassendes Werk mit vierstelliger Seitenzahl als auch ein einseitig beschriebener Brief sein kann. Wenn man die Images zählt haben wir ca. 20 Mio. Dateien.

If-2.4. Wie viele Objekte werden pro Jahr ungefähr neu digitalisiert?

Im letzten Jahr hatten wir 1,4 Mio. Images an den Scannern sowie 600.000 Images über den Microrollfilm-Scanner, haben also die Zahl von 2 Mio. erreicht. Dies liegt aber an dem Zeitschriften-, also Rollfilm-Projekt, in der Regel sind wir zwischen 1,0 und 1,5 Mio.

Images, die an den Scannern produziert werden. An Vorgängen wechselt das immer sehr stark, meistens aber im Bereich zwischen 10.000 und 15.000 Vorgängen.

If-2.5. Befinden sich Born Digitals in Ihrer Sammlung?

In der digitalen Sammlung nicht, in diesen wird nur dargestellt, was das Digi-Zentrum wirklich herstellt. Ansonsten haben wir solchen Material natürlich im Haus, aber nicht in dieser Infrastruktur, sondern diese werden in eigenen Repositorien gespeichert. In Zukunft ist geplant, diese zwar auch über eine OAI-Schnittstelle anzubieten, aber nicht in die digitale Sammlung zu überführen. Das heißt, man findet Born Digitals im Katalog, aber nicht unter den digitalen Angeboten unter digital.staatsbibliothek-berlin.de.

If-2.6. Findet die Digitalisierung im Haus oder durch Dienstleister statt?

- Wenn im Haus digitalisiert wird: Wie viele Mitarbeiter sind mit der Digitalisierung beschäftigt?

Wir digitalisieren wenn irgendwie möglich immer im Haus. Früher, als es das Digitalisierungszentrum noch nicht gab, wurden auch externe Dienstleister beauftragt, davon geht man aus Bestandsschonungsgründen aber immer weiter zurück, zumal sich auch die Tendenz zeigt, dass die Bestände immer spezieller werden. Wir kommen immer mehr und mehr zu handschriftlichen Materialien oder Nachlässen in der Digitalisierung.

Dies ist prinzipiell kein Hindernis, aber eine Vorsichtsmaßnahme, dass wir die Digitalisierung lieber wenn möglich im Haus durchführen. Wir haben aber auch Fälle, bei denen wir nicht die technische Ausstattung haben. Hier wird dann eine Ausschreibung vorbereitet und ein Dienstleister beauftragt. Das stellt aber nur einen minimalen Teil der Digitalisierung dar.

Im Digitalisierungszentrum (Abteilung II F Referat 3) direkt arbeiten immer zwischen 20 und 25 Personen. Der gesamte Digitalisierungsprozess bildet sich aber über das gesamte Haus ab, wenn man auch die Kollegen in den Abteilungen mitzählt, die die Bestände vorbereiten, erschließen, Strukturdaten vergeben, in der Datenverwaltung arbeiten etc.

dann kommt man auf über 100. Natürlich sind dabei nicht alle in Vollzeit mit der Digitalisierung beschäftigt, aber sie sind beteiligt.

If-2.7. Gibt es Maßnahmen, um Doppeldigitalisierungen von Objekten zu vermeiden?

- Finden Absprachen mit anderen Gedächtniseinrichtungen statt, um hier bereits digital vorliegende Werke nicht erneut zu digitalisieren?

Ja. Zum einen beim Fall DoD. Hier gibt es immer zuerst eine Prüfung, ob das Digitalisat bereits vorhanden ist oder ob es eventuell in anderen, naheliegenden Bibliotheken bereits vorhanden ist. In diesem Fall würden wir im Katalog dann darauf verweisen, damit sich die Frage im Optimalfall nur einmal stellt. Dabei haben wir aber eine strikte Auswahl, jedes Digitalisat ist auch nicht gut genug. Die Kollegen in der Benutzungsabteilung haben vor einigen Jahren mal eine kleine Rangliste erstellt, welche Anbieter gute, zuverlässige, vollständige Digitalisate bietet. Für den Fall, dass ein Digitalisat uns nicht gut genug erscheint, würden wir dann wahrscheinlich doch neu digitalisieren.

Zum andern kennzeichnen wir unseren Bestand, der digitalisiert ist, so dass man punktuell feststellen könnte, dass ein Werk bereits digital vorliegt, da dann bereits ein Digitalisierungsvermerk im Band enthalten ist.

In den Großprojekten wie VD 16, 17, 18 gab es auch Phasen, in denen man bestimmte Bestandsgruppen bestimmten Bibliotheken zugeteilt hat. Man versucht eben, Doppeldigitalisierung zu vermeiden und einen effizienten Mitteleinsatz zu garantieren.

Auf der anderen Seite merkt man aber auch, dass dies nicht immer möglich ist. Im Digitalisierungsprojekt zum Ersten Weltkrieg bspw. waren auf Grund des bevorstehenden Jahrestages zeitgleich zahlreiche Digitalisierungsprojekte aktiv, die unabhängig voneinander entstanden sind und erst während der Laufzeit aufeinander aufmerksam wurde. So ergab sich z.B., dass sich die Digitalisierungsprojekte der DNB und der Staatsbibliothek teilweise in den Beständen überschnitten. Ein nachträglicher Abgleich hätte hier dann jedoch einen zu hohen Aufwand bedeutet. Der selbe Effekt entstand, als die Massendigitalisierung richtig fahrt aufnahm. Anfangs hatte die einzelnen Institutionen nur auf ihren Bestand geschaut und als dann richtig produziert wurde und die Vorakzessionen der bibliographischen Daten akribisch durchgeführt wurden, da entdeckte man mehr und mehr, dass die Überschneidungen groß waren. Wir merkten z.B. in einem Projekt, dass viele der geplanten Objekte bereits digital in anderen Häusern vorlagen, dadurch schmolz der eigenen geplante Bestand zusammen, ermöglichte uns aber so, ganz anderen Bestand, hier sogar Zeitungsbestand, für diesen Fachbereich heranzuziehen, der in anderen Häusern nicht so vollständig vorhanden war.

Wir haben natürlich auch Auswahlkriterien für Digitalisierungsprojekten und eines dieser Kriterien ist die Unikalität, was ja schon per se eine Doppeldigitalisierung vermeiden hilft.

Wir digitalisieren natürlich nicht nur unikales, es ist aber eines der Kriterien, welches die Priorität von Beständen für die Digitalisierung recht hoch setzt.

If-3. Dokumentation, Metadaten, Erschließungsstandards.

If-3.1. Welche Metadaten werden bei der Digitalisierung erfasst?

Unsere Digitalisate werden alle vollständig in unserem Katalog katalogisiert. Wenn es darin nach heutigen Maßstäben schlechte Aufnahmen gibt, dann würden wir diese zum Wohle des Printexemplars und zum Wohle des Digitalisates noch verbessern, wenn es

die großen Datenmengen zulassen. Die vollständigste Erschließung ist immer in unserem Katalogisierungssystem. Eine Auswahl der wichtigsten bibliographischen Daten lässt sich per Knopfdruck in Goobi übernehmen und hier mit weiteren Daten anreichern. Ein Datum, was wir in Goobi anreichern, ist z.B. die digitale Kollektion. Hier haben wir Digitalisate nach fachlichen Gesichtspunkten zusammengefasst. Ein weiteres Merkmal hier wäre die digitale Serie, früher der Gesamttitel der Sekundärausgabe, hier kreieren wir für solche Projektzusammenhänge einen „Titel“, der dann auch in die Metadaten übernommen wird, aber eigentlich kein bibliographisches Datum ist. Hinzu kommt auch eine URL sowie eine Anreicherung der Strukturdaten in Goobi. Seit einiger Zeit hat sich die Staatsbibliothek zudem nicht nur auf urheberrechtsfreies Material kapriziert, sondern will auch sehen, wie man mit rechtebehaftetem Material zurechtkommt. Vor dem Hintergrund der vergriffenen Werke, die ja jetzt eine gesetzliche Regelung erfahren haben, möchten wir da auch mitmachen, wenn auch nicht in großem Stil, da das Aufgabe anderer Bibliotheken ist.

Aber wir haben mehr und mehr Werke, die man uns überlässt, die nicht rechtefrei sind, wo aber Rechteverhandlungen stattfinden und das muss natürlich in irgendeiner Weise dokumentiert werden. Rechtestatements sind dabei weder für die Katalogdaten noch für die Übernahme in Goobi ein einfaches Thema.

Was noch hinzu kommt wären in den Images TIFF-Metadaten: Der Erzeuger (Staatsbibliothek), der eingesetzte Scanner und die verwendete Software zum Erzeugen sowie Bearbeiten der Scans. Hinzu kommen Informationen zum eingebetteten Farbprofil, zum Copyright sowie teilweise eine kurze Beschreibung. Natürlich könnte man das perspektivisch noch ausbauen, aber erstmal ist es ein guter Standard.

If-3.2. Stehen alle erfassten Metadaten dem Nutzer frei zur Verfügung?

- Wenn nein: Welche nicht?

Ja, vollkommen. So ist unser Verständnis, dass sämtliche Daten vollkommen uneingeschränkt nachgenutzt werden können.

Im übrigen ist auch das, was wir im Digitalisierungszentrum digitalisieren und in die digitale Bibliothek überführen gemeinfrei und seit einiger Zeit auch in den Digitalisaten als gemeinfrei gekennzeichnet.

If-3.3. Nach welchen Metadatenschemata werden die Digitalisate beschrieben?

Nach METS/MODS.

If-3.4. Nach welchen Erschließungsstandards werden die Daten beschrieben? Kommen Normdaten zum Einsatz?

Ja, Normdaten kommen unbedingt zum Einsatz, aber eben nur im Katalogisierungssystem. Die Normdaten, ebenso die Verlinkungen, nehmen wir aus technischen Gründen nicht in die Metadaten mit. Das müssten wir händisch übertragen und das schaffen wir einfach nicht. Wir träumen davon, in einer neuen Version die Daten neu zu prozessieren und dann zumindest die ID aus dem CBS für die GND zu übernehmen. Im Katalogisierungssystem wird aber ordentlich katalogisiert und da ist das Level unser normales Katalogisierungslevel inklusive Normdaten.

If-3.5. Wird wenn möglich auch der Volltext erschlossen?

- Wenn ja, in welchem Format wird dieser gespeichert?

Wenn möglich kann man vollherzlich mit ja beantworten. Es kommt vor, aber es ist bisher noch nicht so, dass wir eine OCR-Strecke betreiben oder systematisch mit einem Dienstleister zusammenarbeiten. Wann immer es bisher möglich war wurden aber einzelne Projekte auch im größeren Umfang volltexterschlossen. Das Thema OCR ist für uns aktuell, wie wir dahin kommen, dass wir zeitnah nach der Digitalisierung in den Sammlungen Volltext präsentieren können. Wir können sie zwar schon präsentieren, aber noch nicht systematisch erzeugen.

Welches Format dabei genutzt wird, lässt sich noch nicht sagen. Bisher speichern wir in ALTO-XML, einige Handschriften vielleicht in TEI. FineReader wird zwar auch vorgehalten, aber in den Metadaten findet man bisher wie gesagt ALTO.

If-4. Veröffentlichung.

If-4.1. Unter welchen Lizenzen sind die Digitalisate zugänglich?

- Welche Lizenz wird favorisiert? Warum?

Im Standardfall erfolgt die Kennzeichnung als gemeinfrei über Public Domain. Hinzu kommen drei weitere Fälle: alle Creative Commons Varianten, ein In-Copyright-Hinweis sowie konkret verhandelte Lizenzen, die benannt und in den Akten dokumentiert werden.

Wir führen aber auch Verhandlungen, um Public Domain zu erreichen. Die Kollegen sind schon darum bemüht es so einrichten zu können, dass man uns Public Domain einräumt.

Public Domain hat den Vorteil, dass jeder Nutzer das machen kann, wozu er das Digitalisat braucht. Lange Zeit hatten wir eine Creative Commons Lizenz, die jedoch eine kommerzielle Nutzung ausgeschlossen hat, was dazu führte, dass Dienste wie Wikipedia diese Digitalisate nicht verwenden durfte, was nicht im Sinne der Bibliothek ist. Man muss dass im Gesamtgefüge der Stiftung betrachten, in der ja auch Museen sind, in denen diese Diskussion ganz anders geführt wird. Während Bibliotheken bei der Frage relativ offen sind und die Meinung vertreten, dass die Digitalisierung nicht die erforderliche Schöpfungshöhe mit sich bringt, um bei einem gemeinfreien Werk einen neuen Schutz zu rechtfertigen, sieht man dies in Museen teilweise anders. Hier sind die Aufnahmeverfahren andere und individueller, aber es bestehen auch andere Interessen als in Bibliotheken. Stiftungsintern konnten wir uns so aufteilen, dass die Bibliothek so arbeitet, wie sie es für richtig hält und die Museen ihren Weg gehen.

Wenn man den Aspekt der Metadaten betrachtet, dann ist das auch anders als in Museen. Während unsere Metadaten und Katalogdaten frei sind, kann in Museen eine Autorenschaft für die Metadaten beansprucht werden. Hier vertritt man die Meinung, dass ein Objekt ohne die Metadaten überhaupt nicht zu verstehen ist, während die Metadaten in Bibliotheken traditionell ein Mittel sind, um die Objekte aufzufinden.

Zwischenfrage: Mit der Public Domain verschwindet ja auch die Namensnennung. Ist dies durch die Staatsbibliothek bewusst gewählt?

Da gab es auch diverse Diskussionen. Die Marke Staatsbibliothek verschwindet ja dadurch. Aber alle möglichen Markierungen, wie z.B. Wasserzeichen, sind sinnlos. Alles, was wir reinrechen, kann jeder wieder rausrechnen, also können wir es gleich sein lassen.

Außerdem ist es ja gemeingut, was wir produzieren. Hier gibt es aber auch ganz unterschiedliche Standpunkte, die teilweise pragmatisch, teilweise prinzipiell sind und viel mit der persönlichen Identifikation mit der Arbeit zu tun haben.

[Herr Siegmann] Ich persönlich finde es durchaus aus institutioneller Sicht an manchen Stellen hilfreich, Images zu kennzeichnen. Nicht, um irgendwelche Rechte zu sichern, sondern da es ein gutes Werbemittel ist. Die französische Gallica macht es z.B. so, indem sich unter dem Bild ein einfacher weißer Streifen mit dem Hinweis Gallica.fr befindet. Und ich habe schon vielfach Präsentationen gesehen, in denen dieser Streifen nicht entfernt worden ist und man sah daher gleich, dass das Objekt aus der Gallica stammt. Ich finde das persönlich nett, aber das ist nicht die Hausleitlinie.

If-5. Interoperabilität und Schnittstellen, Portale.

If-5.1. Können die Metadaten über maschinenlesbare Schnittstellen geharvestet werden?

- Wenn ja, welche Schnittstellen werden angeboten?

Ja, einmal selbstverständlich über das Katalogisierungssystem über die SRU-Schnittstelle des GBV. Wir selber bieten unsere Daten auch über die OAI-Schnittstelle an, dazu muss man aber sagen, dass wir die OAI-Schnittstelle noch nicht bewerben. Wer damit umgehen kann, findet die Schnittstelle aber und kann sie gut nutzen. IIIF ist als Schnittstelle auch schon in die Digitalen Sammlungen integriert, wird aber auch noch nicht beworben.

If-5.2. Werden die Digitalisate auch in andere Angebote oder Portale (z.B. die Deutsche Digitale Bibliothek/Europeana) eingespielt?

- Wenn ja, in welche Portale spielen Sie die Daten ein? Warum gerade in diese Portale?

- Wenn nein, warum nicht?

Wir haben mit der Digitalisierung von Drucken angefangen und diese sind an das ZVDD übertragen. Das funktionierte und funktioniert noch immer gut.

Mit dem Europeana-Projekt zum Ersten Weltkrieg ging die Verpflichtung einher, die Daten bis zum Projektabschluss in der Europeana zu präsentieren. Die einfache Antwort ist daher ja, die Daten werden bereitgestellt und können über OAI geharvestet und präsentiert werden. In der Praxis ist dies jedoch extrem komplex. Die Metadaten sind nicht über alle Objekte vollständig einheitlich, einige Daten sind mal vorhanden, mal nicht.

Besonders bei mehrbändigen Werkten etc. wird dies dann besonders komplex und führt in der Praxis oft nicht ohne weiteres zum gewünschten Ergebnis. Nichtsdestotrotz gibt es einen (nicht vollständigen) Datenabzug der StaBi in der Europeana und der DDB. In der Theorie sollte es so sein, dass die DDB regelmäßig unsere Daten über OAI harvestet, aktualisiert, präsentiert und sie dann über ein Aggregatorennetzwerk an die Europeana weitergibt. Das funktioniert aus vielen Gründen nicht so, wie es sollte, was aber nicht unbedingt an der Europeana oder der DDB liegt, sondern es sind einfach extrem komplexe Vorgänge, die auch technisch sehr aufwändig sind. Und dadurch ist die theoretische Wirklichkeit nicht vollständig mit der Praxis deckungsgleich.

Neben den Schwierigkeiten beim Metadatenmanagement gibt es aber auch organisatorische Schwierigkeiten gerade bei der DDB. Die DDB hatte ein Datenmodell

und eine Möglichkeit, Daten in einer Pilotphase aufzunehmen. Nach dem Ende dieser wurden die Weichen umgestellt und man musste sich umorientieren und seit dem stehen wir in der DDB ein bisschen in den Warteschlage. Aber wir haben am Haus einen Kollegen, der sich mit dem Mapping zur DDB beschäftigt. Bei der Europeana sind wir auch in so einer Schleife. Wir hatten zwar einen direkten Zugang zur Europeana, diese war aber auch organisatorisch im Umbruch, da man das Parallelprojekt TEL, The European Library, übernahm, welches eher auf Forschungs- und Nationalbibliotheken ausgerichtet war und die Aufgabe des Harvestings hatte. Wir kamen mit unserer Produktion genau in diese Umbruchphase, konnten die Daten also nicht mehr über TEL harvesten lassen, aber das Harvesting durch die DDB und über diese in die Europeana funktioniert nicht.

Im Grunde sind die Europeana und die DDB vor allem dann nützlich, wenn sie komplexe Metadaten sorgfältig und korrekt abbilden. Dieser Aufwand ist aber kaum zu stemmen, weshalb es vielfach Einrichtungen (nicht wir) gibt, die ein vereinfachtes, hoch standardisiertes Metadatenset (Dublin Core) hinschicken, welches vernünftig angezeigt wird, in dem Funktionen aber nur noch eingeschränkt nützlich sind.

If-7. Organisatorisches.

If-7.1. Welche Fördereinrichtungen (DFG, BMBF, EU, Land Berlin, ...) unterstützen Ihre Einrichtung?

Wir haben für Digitalisierungsprojekte sowohl bei der DFG, dem BMBF und der BKM und der EU Mittel bekommen, über das EFRE-Projekt wurden auch aus dem Land Berlin Gelder zugewiesen.

Das funktioniert dann so, dass es eine Ausschreibung gibt, wir bewerben uns mit geeigneten Inhalten und werden im besten Falle ausgewählt. Das hat oft geklappt, ist aber kein totaler Automatismus.

Die StaBi selber ist eine Bundeseinrichtung, die auf Basis des Stiftungsgesetzes eine Bund-Länder-Finanzierung hat, aus der ein Haushalt entsteht, der die tägliche Arbeit finanziert.

If-7.2. Besteht die Möglichkeit, neue Funktionen in das System der digitalen Angebote zu integrieren?

- Wenn ja, wie oft geschieht dies?

Ja. Eine neue Funktion war z.B., dass die OCR eingebunden und sichtbar gemacht wurde. Aber sowas ist mit viel Aufwand verbunden, da wir es über unsere IT-Abteilung

Ja. Eine neue Funktion war z.B., dass die OCR eingebunden und sichtbar gemacht wurde. Aber sowas ist mit viel Aufwand verbunden, da wir es über unsere IT-Abteilung