Schutz vor digitaler Amnesie
Das TIMBUS Projekt – Langzeitarchivierung digitaler Prozesse
Angela Dappert, Digital Preservation Coalition Daniel Draws, SQS Software Quality Systems AG
iqnite
24 April 2012, Düsseldorf
Überblick - Langzeitarchivierung digitaler Prozesse
Motivation Ziele
Allgemeine Erhaltungsstrategien
Metadaten als Grundlage der Archivierung Der Aufgabenbereich entfaltet sich
TIMBUS
Ein Beispiel der Prozessarchivierung
Motivation
Allgegenwärtige digitale Informationen - wertvolle und oft einmalige kulturelle,
wissenschaftliche und wirtschaftliche Güter Flüchtigkeit
Veränderliche Formen und Nutzungsarten
Kurzlebigkeit vieler Dateiformate
Technische Überholung von Software und Hardware, und anderer Teile der Computerumgebung
Veränderte Rahmenbedingungen Alterung elektronische Datenträger
Erhaltung der Konkurrenzfähigkeit in
Kultur, Bildung, Wissenschaft und Wirtschaft
Archivierungsrisiken
Unkontrolliertes Wachstum Neue Version
Verlust Substanzzerfall
Kein Support
Obsoleszenz Dateisystem
Betriebssystem
Software Hardware Datenträger
Benutzer Neue Bedürfnisse
Dateiformat
Inhalt
Repräsentationsinformation Beschädigung
Bits
Motivation
Allgegenwärtige digitale Informationen - wertvolle und oft einmalige kulturelle,
wissenschaftliche und wirtschaftliche Güter Flüchtigkeit
Veränderliche Formen und Nutzungsarten
Kurzlebigkeit vieler Dateiformate
Technische Überholung von Software und Hardware, und anderer Teile der Computerumgebung
Veränderte Rahmenbedingungen Alterung elektronische Datenträger
Erhaltung der Konkurrenzfähigkeit in
Kultur, Bildung, Wissenschaft und Wirtschaft
Motivation
Ziel
Dauerhafte Verfügbarkeit
Verfügbarkeit in unregelmäβigen und längeren Abständen
Über die tagtägliche Nutzniessung hinaus (Jahrzehnte, Jahrhunderte)
Sektoren
Bibliotheken (national, Hochschulwesen), Archive, Museen
Gesetzlich regulierte Industriesektoren
Authentifizierung Formatunterstützung Datenträgerverwaltung
Sichere Speicherung Repräsentation
Metadaten Bestandhaltung
Ziele der Langzeitarchivierung
In Anlehnung an Priscilla Caplan
Verfügbarkeit
Objekt Identifikation Verständlichkeit Datenkonsistenz Verwendbarkeit Funktionsfähigkeit
Authentizität
Erhaltungsstrategien
Zusätzlich zu
Backups
Spiegelung auf verteilten Systemen / Redundanz Diversität eingesetzter Speichertechnik
Systemsicherheit Standards
...
Erhaltungsstrategien
Medienmigration
(Physischer Erhalt der Datenobjekte)
irtualisierung
(Logischer Erhalt der Computerumgebung)
Erhaltungsstrategien
Medienmigration
(Physischer Erhalt der Datenobjekte) Computermuseum
(Physischer Erhalt der Computerumgebung)
(Logischer Erhalt der Computerumgebung)
Erhaltungsstrategien
Medienmigration
(Physischer Erhalt der Datenobjekte) Computermuseum
(Physischer Erhalt der Computerumgebung) Migration (Logischer Erhalt der Datenobjekte)
Virtualisierung
(Logischer Erhalt der Computerumgebung)
Erhaltungsstrategien
Medienmigration
(Physischer Erhalt der Datenobjekte) Computermuseum
(Physischer Erhalt der Computerumgebung) Migration (Logischer Erhalt der Datenobjekte)
Emulation
(Logischer Erhalt der Computerumgebung) Virtualisierung
(Logischer Erhalt der Computerumgebung)
Erhaltungsstrategien
Medienmigration
(Physischer Erhalt der Datenobjekte) Computermuseum
(Physischer Erhalt der Computerumgebung) Migration (Logischer Erhalt der Datenobjekte)
Emulation
(Logischer Erhalt der Computerumgebung) Virtualisierung
(Logischer Erhalt der Computerumgebung)
Referenzmodell für Archiv-
informationssysteme
OAIS - Open Archival Information System ISO 14721
Referenzmodell für Archivinformationssysteme
Unabhängig von Datenformaten oder Systemarchitekturen
anwendbar und skalierbar für eine Vielzahl von Institutionen und Benutzerbedürfnisse
Definiert
3 Informationspakete
Datenmodell
Metadaten als Grundlage der Archivierung
Daten,
die Informationen über andere Daten enthalten
z.B. Bibliotheks- kataloge, digitale Bild- informationen
Metadaten zur Langzeitarchivierung definiert durch
die Zielen der Langzeitarchivierung
Metadaten als Grundlage der Archivierung
Digitale Güter
archivfähig machen
Zugang für und Nutzung durch Benutzergruppen
Submission Information Package (SIP)
Archival Information Package (AIP)
Dissemination Information Package (DIP)
Meta-
informationen
Metadaten als Grundlage der Archivierung
Submission Information Package (SIP)
Archival Information Package (AIP)
Dissemination Information Package (DIP)
Meta-
informationen
Inhaltliche Informationen (Content Information)
Informationen zur Verpackung
(Packaging Information) Informationen zur
Beschreibung der Aufbewahrungsform
(Preservation Description Information )
Ursprungsdaten Repräsentations information Provenienz Kontext
Beziehungen Informationen zur
Stabilisierung
Langlebigkeit
Der Aufgabenbereich entfaltet sich
Digitale Langzeitarchivierung Digitale Langzeitarchivierung
Business Continuity Management
Daten
Semantik
Repräsentations information
Software
Hardware Services
Dateien
Motivation für Prozessarchivierung
Industrie
Das TIMBUS Konsortium
Digital Preservation Coalition + Mitglieder (UK)
INESC – ID (Portugal)
Karlsruher Institut für Technologie (Deutschland)
Laboratório de Instrumentação e
Física Experimental de Partículas (Portugal)
Laboratório Nacional de Engenharia Civil (Portugal)
Münster University (Deutschland)
Forschungl-
SAP – Projektkoordinator (NI, CH)
Intel (Irland)
Software Quality Systems (Deutschland)
Forschung &
Entwicklung
• Methoden
• Architektur
• Werkzeuge
Anwendungsfälle
• Services & Systeme für die
Langzeitarchivierung
• Hoch- und Tiefbau
• Wissenschaft &
Hochenergiephysik
Vermarktung
•
Erschließung
•
Verbreitung
&Training
Projektstruktur
Komponenten
Intelligent Enterprise Risk Management
Service Dependency Analysis
Business Process Context Capture
Rechtliches Lifecycle Management
Prozessvirtualisierung und Speicherung (verteilter, voneinander abhängiger Dienste)
Validierung der archivierten Geschäftsprozesse
Reaktivierung des Prozesses Integration mit dem Testbed
Expediency /PlanningExecution /Preservationation ment
e ss e u n d S ta n d a rd s fu r d ie le L a n g z e it a rc h iv ie ru n g v o n e ss e n
liertesTest Bedri sa ti o n e rh e it ri sa ti o n
Ein Beispiel der Prozessarchivierung:
Datei Migration im Archivprozess
Über- nahme
Qualitäts- sicherung
Migrations format
Migrations
tool Migration
Auto.
Qualitäts- sicherung
Qualitäts- sicherung von Hand
Speiche-
rung Originale
löschen Zugriff
Auto.
Qualitäts- sicherung
Qualitäts- sicherung von Hand
Speiche-
rung Originale
löschen Zugriff
Ein Beispiel der Prozessarchivierung:
Datei Migrationen
Über- nahme
Qualitäts- sicherung
Migrations format
Migrations
tool Migration
Ungenügend Qualitäts-
sicherung
Migrations SW fehlerhaft
Eingeschränkte SW
Funktionalität Defekte
Datei
Schlecht gewählte Konfiguration
Format Verlustbe-
haftetes Format
Enterprise Risk Management
Enterprise Risk Management
Auto.
Qualitäts- sicherung
Qualitäts- sicherung von Hand
Speiche-
rung Originale
löschen Zugriff
Ein Beispiel der Prozessarchivierung:
Datei Migrationen
Über- nahme
Qualitäts- sicherung
Migrations format
Migrations
tool Migration
System Dependency Analysis System Dependency Analysis
Prozess-, Software-,
Hardwareabhängigkeiten
Ungenügend Qualitäts-
sicherung
Migrations SW fehlerhaft
Eingeschränkte SW
Funktionalität Defekte
Datei
Schlecht gewählte Konfiguration
Format Verlustbe-
haftetes Format
Zugriffs-SW fehlerhaft fehler
Manuelle Handhabungs-
fehler Ungenügend
Qualitäts-
sicherung Bitverfall Dateisystem-
fehler
Über-
nahme Qualitäts-sicherung
Migrations format
Migrations
tool Migration
Auto.
Qualitäts- sicherung
Qualitäts- sicherung von Hand
Speiche-
rung Originale
löschen Zugriff
Ein Beispiel der Prozessarchivierung:
Datei Migrationen
Business Process Context Capture Business Process Context Capture
BS spec DS spec Firmenpolitik
Geschäftliche Erfordernisse
Logs Akteure + Kenntnisse
Prozess spec
Stichprobenahme Stichproben
Testmethoden
Reaktion auf Fehler Prozesse and Logs Qualitätskriterien
Ungenügend Qualitäts-
sicherung
Migrations SW fehlerhaft
Eingeschränkte SW
Funktionalität Defekte
Datei
Schlecht gewählte Konfiguration
Format Verlustbe-
haftetes Format
Auto.
Qualitäts- sicherung
Qualitäts- sicherung von Hand
Speiche-
rung Originale
löschen Zugriff
Ein Beispiel der Prozessarchivierung:
Datei Migrationen
SW Rechtstitel, Lizenzen
Gewerblicher
Rechtsschutz Datenschutz
Über- nahme
Qualitäts- sicherung
Migrations format
Migrations
tool Migration
Legalities Lifecycle Management
Legalities Lifecycle Management
Zugriffs-SW fehlerhaft fehler
Manuelle Handhabungs-
fehler Ungenügend
Qualitäts-
sicherung Bitverfall Dateisystem-
fehler Ungenügend
Qualitäts- sicherung
Migrations SW fehlerhaft
Eingeschränkte SW
Funktionalität Defekte
Datei
Schlecht gewählte Konfiguration
Format Verlustbe-
haftetes Format
Komponenten
Intelligent Enterprise Risk Management
Service Dependency Analysis
Business Process Context Capture
Rechtliches Lifecycle Management
Prozessvirtualisierung und Speicherung (verteilter, voneinander abhängiger Dienste)
Validierung der archivierten Geschäftsprozesse
Reaktivierung des Prozesses Integration mit dem Testbed
Expediency /PlanningExecution /Preservationation ment