• Keine Ergebnisse gefunden

nestor-Studien

Im Dokument nestor-materialien 14 (Seite 19-24)

2.1  Existierende Studien

2.1.1  nestor-Studien

nestor-materialien 3: Vergleich bestehender Archivierungssysteme [Bor05]

Das Ziel dieser Studie war es, eine Basis für die Bewertung und Auswahl von Archivierungssystemen zu schaffen. Folgende Punkte zählen dabei zu den Inhalten:

ƒ Zusammenfassung der Angebote

ƒ Funktionalität

ƒ Systemarchitektur (vgl. OAIS)

ƒ Beschreibung Inhalt (digitale Objekte)

ƒ Frage nach der Notwendigkeit spezieller Applikationsumgebungen

ƒ Ingest-Verfahren

ƒ Metadaten (technisch, inhaltlich, rechtlich, administrativ), deren Generierung sowie Standards

ƒ Technologien

ƒ Sicherheit: Gewährleistung Integrität und Authentizität der Daten

ƒ Benutzerschnittstelle: Kosten/ Rechte

ƒ Langzeitaspekt

ƒ Schnittstellen zu anderen Systemen

ƒ Dokumentation

ƒ Kosten

ƒ Vergleichskriterien

In dieser Studie wurde festgestellt, dass eine dynamische Entwicklung vorherrscht. Es existiert eine Vielzahl von Produkten, die verwendet werden. Die Anforderungen entstammen verschiedenen 9

10 Vertrauenswürdige und abgesicherte Langzeitarchivierung multimedialer Inhalte Anwendungsbereichen und weisen unterschiedliche Lösungsansätze auf. Es wurde ein Kriterien-katalog für eine Produktbewertung aufgestellt, um so ein Rating und letztendlich ein Ranking durch-zuführen. Es erfolgt eine ausschließliche Betrachtung „reiner“ Archivierungssysteme, bei der die Archivierung an sich Kernaufgabe ist. Ausgeschlossen sind:

ƒ Reine Entwicklungswerkzeuge

ƒ Anwendungsneutrale Grundsysteme

ƒ Produkte, bei denen die Archivierung nur die Teilfunktion einer umfassenden spezialisierten Anwendung darstellt

Bezüglich der Abdeckung des Langzeitaspekts, wurde festgestellt, dass bis auf wenige Ausnahmen, keine expliziten Mechanismen vorhanden oder Vorkehrungen getroffen sind, um die Inhalte auf lange Zeit zu erhalten und dass für Langzeitarchivierung anerkannte Techniken fehlen.

In Bezug auf die Archivierung, den Archivierungsbegriff und die Kriterien wurden folgende zwei Aspekte festgestellt:

ƒ Es herrschen eine sehr breite Interpretation, unterschiedliche Begrifflichkeiten, divergierende Entwurfsziele mit wenig Bezug zu konzeptionellen Modellen wie OAIS vor.

ƒ Probleme treten bei der Erstellung von Anforderungen und Systemen zur Archivierung auf, begründet durch:

• Technologienahe Kriterien: Nennung der Lösungen ohne konzeptionelle Einordnung

• Unterschiedliche Begrifflichkeiten

• Mangelnde Allgemeingültigkeit

• Vernachlässigung nicht-funktionaler Aspekte wie Aufwand für laufenden Betrieb oder Qualität des Produkte

In der Studie wurden die folgenden Aspekte bzgl. OAIS-Referenzmodell (Open Archival Information System) festgehalten:

ƒ Das OAIS-Referenzmodell dient zur Erfassung der Kernfunktionalität eines Archivierungs-systems.

ƒ Das OAIS-Referenzmodell beschreibt eine als Archiv zu bezeichnende Organisation aus Menschen und Systemen, welche die Verantwortlichkeit übernommen hat, Information zu erhalten und sie für eine bestimmte Zielgruppe (Designated Community) verfügbar zu machen.

ƒ Das OAIS-Referenzmodell ist keine Spezifikation eines Entwurfs oder Implementierung, tatsächliche Implementierungen können die Funktionalität anders gruppieren oder aufbrechen.

ƒ Das OAIS-Referenzmodell beschreibt weiterhin Funktionalitäten, die sich nicht auf software-mäßige Implementierungen beziehen, wie Bestandserhaltungsplanung (Preservation Planning).

ƒ Im OAIS-Referenzmodell fehlen Systemmerkmale, die für eine Bewertung einer konkreten Implementierung nötig sind (z.B. Kosten).

Bezüglich des Langzeitaspekts sind in der Studie weiterhin folgende Aussagen getroffen worden: Bis-herige Methoden bzw. bisBis-herige konkrete Datenmodelle zur Langzeitarchivierung lassen sich nicht aus OAIS ableiten. Eine Migration (Zugriff, Transformation, Rekonstruierung) des Inhalts und seiner Organisation erfolgt aus den bisherigen Systemen bzw. Systemstrukturen. Es wurden Standards und Produkte betrachtet, die den Langzeitarchivierungsaspekt nicht direkt ansprechen. Funktionale, auf Langzeitarchivierung bezogene, inhaltsorientierte Systemeigenschaften sind:

ƒ Objekte, Objektorganisation

ƒ Metadaten, Metadatenorganisation

ƒ Organisation Objekte – Metadaten

ƒ Sicherung der Integrität dieser Organisation

2. Grundlagen 11 Nicht-funktionale Kriterien dagegen sind:

ƒ Aufwand

ƒ Qualität: Sicherstellung der Verfügbarkeit des Systems und insbesondere hinsichtlich Langzeitarchivierungsaspekten Sicherstellung der Verfügbarkeit der Inhalte

• Funktionale Kriterien (Technik)

• Migrierbarkeit der Inhalte in neue Systeme (Technik)

• Hohe Verbreitung und Nutzerzahl verbunden mit der entsprechend wertvollen Daten-menge (Organisation)

Es ist eine Tendenz zur Modularisierung und zur logischen und physischen Verteilung der Systeme zu vermerken, um so einen ortsunabhängigen Zugang zu ermöglichen. Konzepte zur Unterstützung von Langzeitarchivierungsaspekten sind wenig vorhanden. Diese sind unter anderem:

ƒ Dateiformatregistrierung

ƒ Handlesysteme zur persistenten Identifikation

ƒ Übernahme von Konventionen (Standards) im Bereich der Metadaten

ƒ Konvertierung in bestimmte Ablageformate

ƒ Migrationsunterstützung z.B. durch einfach zu interpretierende Exportformate

ƒ Beschreibung des Kontextes der technischen Nutzung z.B. durch Archivierung der Softwareanteile der Abspielumgebung

ƒ Universal Virtual Computer (UVC)

Die Überlebensfähigkeit eines Systems und seiner Inhalte ist abhängig von seinen Systemmerkmalen.

So ist die Leistungsfähigkeit bisheriger Modelle unterschiedlich in Bezug auf die Flexibilität zur Organisation von Objekten und Metadaten und Festschreibung der Organisation. Ausgewiesene Schwachpunkte, die in der Studie benannt wurden sind:

ƒ Flache oder starre Objekthierarchien

ƒ Fehlende Definierbarkeit der Semantik der Objektbeziehungen

ƒ Eingeschränkte Metadatenmodelle (fehlende Elemente zur Beschreibung von Repräsentations-information, eingeschränkte Zuordenbarkeit zu Objekten)

ƒ Unkontrolliertes Vokabular für Metadatenelemente und deren Werte nestor-materialien 5: Perspektiven der Langzeitarchivierung [Coy06]

Das Ziel dieser Studie war es, Empfehlungen für eine Langzeitarchivierung von digitalen multi-medialen Artefakten zusammenzustellen. Folgende Punkte zählen dabei als Empfehlungszusammen-fassung zu den Inhalten:

ƒ Es existieren keine gesicherten Strategien für die langfristige (über 100 Jahre) Speicherung und Nutzung multimedialer, digitaler Daten.

ƒ Förderung „proaktiver“ Erzeugung von Daten.

ƒ Zukünftig sind keine dauerhaften Speichermedien vorhanden aufgrund der verkürzten Haltbarkeit.

ƒ Bestandserhaltung digitaler Objekte als dynamischer Prozess der Speicherung.

ƒ Kostenfaktor Umkopieren und Umkodieren zur Anpassung an neue Geräte und Systeme muss berücksichtigt werden.

ƒ Pflege von Metadaten von entscheidender Bedeutung

ƒ Technische und organisatorische Sicherung der Authentizität und Integrität digitaler Objekte ist notwendig.

ƒ Vorzug von rechtlich fixierten und vollständig offen gelegten Standards.

12 Vertrauenswürdige und abgesicherte Langzeitarchivierung multimedialer Inhalte

ƒ Geeignete Backup-Strategien zur Datensicherung wenn mögl. auf technisch verschiedene Speichermedien, auch analog

ƒ Entwicklung von Emulatorprogrammen

ƒ Trennung und Verteilung von Datensammlung und Datenspeicherung/ Datensicherung

ƒ Bei verteilten Systemen und Netzzugriffen Speicherung bei vertrauenswürdigen Dritten

ƒ Beachtung rechtlicher Regelungen

Anforderungen, Herausforderungen und Perspektiven:

ƒ Perspektive besteht in der Bereitstellung der Materialien im Netz

ƒ DVD und CD als Trägermedien sind nur Übergangslösungen Der digitale Bestand:

ƒ Ziel ist eine vollständige Migration der digitalen Materialien in den nicht mehr orts-gebundenen Netzzugriff – abhängig von den Aufgaben und Lizenzen als Intranet oder als Internetangebot.

ƒ Unterscheidung zwischen selbsterstelltem und nach Vorgaben fremderstelltem Material.

Selbsterstellte Materialien sind in Bezug auf die künftige Verwendung nach ent-sprechenden Standards auf geeigneten Speichermedien mit präzisen Metadaten herstellbar und einsetzbar.

Fremderstellte Materialien brauchen übergreifende Austauschformate, wobei offene und freie Standards und eine gemeinsame, möglichst standardisierte, Metadatenstruktur eine entscheidende Rolle spielen.

ƒ Es sollen keine Medientypen bei der Bestandserschließung, Bereitstellung und Sicherung aus-geschlossen sein/ werden.

ƒ Organisation digitaler Materialien: Wie sind sie gespeichert? Bitströme

ƒ Unterscheidung der digitalen Backup-Strategien: Lokal oder vernetzt mit qualitativ gleich-wertigen, technischen Kopien.

ƒ Sicherung der Integrität und Authentizität:

• Unveränderter Erhalt des Sammelguts, Schutz vor illegalen Manipulationen, Sicherung der Urheberschaft und Unversehrtheit.

• Es besteht eine hohe Gefahr der Manipulierbarkeit da spurlose Veränderungen einfach durchzuführen sind.

• Entwicklung und Anwendung angemessener Bestandssicherungsstrategien.

ƒ Rechtliche Verpflichtungen (Kopierschutz und Urheberschaft, Signaturgesetz) beachten und integrieren.

ƒ Handhabbare und kostengünstige Durchsetzung.

Speichermedien und Speichermaterialien für multimediale Artefakte bezeichnen die eingesetzten materiellen Trägermedien. Diese gibt es in verschiedenen Ausprägungen:

ƒ Papierspeicher und Ausdrucke: Unbrauchbar für multimediale Datenbestände.

ƒ Microfilm und Computer Output on Microfilm: Sind als analoge Speicherlösungen nicht ge-eignet für multimediale Datenbestände, nur als spezielle Lösung für die Archivierung statischer Daten (Texte), kein digitaler Zugriff und keine Erschließung.

ƒ Rosetta Stone: Nicht alle digitalen Formate können abgebildet werden. Bieten keine Sicherungsmöglichkeit für programmgestützte, interaktive, dynamische Medien.

ƒ Optische Plattenspeicher wie CD-ROM, CD-R(W), Magnetplatten und Magnetbänder: Zählen zum Kernbestand der multimedialen Speichermedien, wobei deren Haltbarkeit problematisch sind.

ƒ Iridium-CD-Datenspeicher: Keine praktischen Einsätze bisher.

2. Grundlagen 13

ƒ Magnetische Plattenspeicher: Dominierende Speichertechnik.

ƒ Magnetbänder: Generell gut geeignet, eingeschränkt jedoch durch die sequentielle Zugriffs-technik.

ƒ Direktzugriffsspeicher-Halbleiterspeicher (Flash-Speicher, MRAM): Potential für eine Verwendung besteht.

ƒ Holografische Speicher: Ungewiss.

ƒ Das Netz als Speicher: Zukunft mit regelmäßigem Umkopieren als notwendige Forderung der Bestandserhaltung.

„Leider bietet Umkopieren keine hinreichende Bestandserhaltungsstrategie. Trotz der recht be-schränkten Lebenszeit technischer Digitalspeicher mit der Folge unlesbarer Medien scheint die Wahr-scheinlichkeit größer, dass Daten durch technologische Alterung, also veraltete Geräte und Software, verloren gehen werden.“

Formate:

ƒ Technische Speicherformate, logische Formate, algorithmisierte Formate

ƒ Metadaten

ƒ Texte

ƒ Daten, Datenbanken, Tabellenkalkulationsprogramme

ƒ Programme

ƒ Formatierte Texte (MS Word, RTF, TeX)

ƒ PDF

ƒ HTML, SGML, XML

ƒ Schriften

ƒ Grafik, CAD

ƒ Fotos, Bilder

ƒ Video

ƒ Audio (Musiknotationen, Tonaufnahmen, gesprochene Sprache)

ƒ Kompressionstechniken

ƒ Spiele und anderes interaktives Material

ƒ Multimedia (SMIL - Synchronized Multimedia Integration Language)

ƒ Metadaten (Dublin Core – Semantische Minimaldaten) Metadatenformat

ƒ Semantic Web

Emulation zur langfristigen Bereitstellung von komplexen Multimediadokumenten und Programmen:

ƒ Langfristige Bereitstellung originaler Geräte und Software

ƒ „Einfrieren“ einer bestimmten technischen Entwicklungsstufe für spätere Nutzung gescheitert

ƒ Bestandserhaltung durch Emulatoren

ƒ Grenzen bei der Nachbildung proprietärer Betriebssysteme ohne Kenntnis des Quelltextes oder ohne rechtliche Nutzungsmöglichkeit evtl. vorhandener Programmtexte

ƒ Emulation durch Einzug einer virtuellen Abstraktionsebene, wo ein Rechner in Softwareform angeboten wird, der selbst auf unterschiedlichen Geräte- und Betriebssystemplattformen implementiert ist, z.B. Java Virtual Machine (JVM), Loires Universal Virtual Machine (UVM)

ƒ Problem: Emulatorkonzepte nicht standardisiert

Migrationspfade zur Bestandssicherung: Organisation, Zeithorizont, strategische Aspekte:

14 Vertrauenswürdige und abgesicherte Langzeitarchivierung multimedialer Inhalte

ƒ Analoge Wandlungen zur Bestandserhaltung – analoges Speichern digitaler Dokumente

• Computerausdruck keine Speicherung multimedialer Daten

• COM (Computer Output on Microfilm): durchaus eine Variante von dauerhaftem Bestand, aber dennoch gänzlich ungeeignet für Multimedia-Bestandserhaltung, da interaktive Elemente zur Navigation oder zu anderen Zwecken mit analogem Material nicht oder nur mit völlig unverhältnismäßigem Aufwand realisiert bzw. simuliert werden können.

ƒ Digitale Wandlungen analoger Objekte zur Bestandserhaltung

• Komprimierte Speicherung digitaler Objekte

• Einsetzbarkeit unter dem langfristigen Aspekt mehrfacher Umkodierung

• Referenzen müssen frei zugänglich sein

ƒ Digital-digitale Migrationen

• Digitale Speichermedien sind technologisch und physikalisch gefährdet.

• Strategie des Umkopierens

• Verwendung stabiler, langfristiger verfügbarer Speicherformate, aber Veralterung verhältnismäßig schnell; es empfiehlt sich Umkodierung

• Gefahr des unbemerkten Verlusts

• Permanente und aktive Pflege des Bestands

„Realistisch gesehen wird der Migrationspfad hin zur digitalen Speicherung umfassend beschritten werden. Die Probleme der langfristigen Speicherung und Bereitstellung sind für Textdokumente und einfache Grafiken lösbar. Für multimediale Dokumente und alle Dokumente, die programmierte Aktivität verlangen, sind weitere Forschungs- und Entwicklungsarbeiten nötig – aber es gibt für multi-mediale Artefakte keine brauchbaren Alternativlösungen im nicht-digitalen Bereich.“

nestor materialien 8: Kriterienkatalog vertrauenswürdige digitale Langzeitarchive (nestor – Arbeitsgruppe „Vertrauenswürdige Archive –Zertifizierung“) [Nes06]

Das Ziel des Kriterienkatalogs war es, Anforderungen an vertrauenswürdige digitale Langzeitarchive festzulegen bezogen auf:

ƒ A: Organisatorischer Rahmen

ƒ B: Umgang mit Objekten

ƒ C: Infrastruktur und Sicherheit

Der Abschnitt C „Infrastruktur und Sicherheit“ ist dabei sehr kurz gehalten.

Der Kriterienkatalog spiegelt ein offenes Vorgehen als Grundlage für eine Allgemeingültigkeit, eine Praxistauglichkeit und eine breite Akzeptanz der Ergebnisse wieder. Der Katalog dient zur Identifizierung von Kriterien für die Bewertung der Vertrauenswürdigkeit eines digitalen Langzeit-archivs in organisatorischer und technischer Hinsicht, dies in engem Kontakt mit unterschiedlichsten

„Gedächtnisorganisationen“ und Produzenten, sowie weiteren Betroffenen und Experten. Es ist damit ein fundiertes, abgestimmtes und praxisgerechtes Hilfsmittel zur Erlangung und Darstellung von Vertrauenswürdigkeit im Kontext von Langzeitarchiven geschaffen. So kann der Nachweis der Vertrauenswürdigkeit durch eine Zertifizierung im Rahmen eines national und international standardisierten Verfahrens erlangt werden.

Im Dokument nestor-materialien 14 (Seite 19-24)