• Keine Ergebnisse gefunden

Master Thesis UNIGIS-Jahrgang 2006 Kommunikation von Metadaten - Analyse der Extensions nach ISO 19115 und ISO 19139

N/A
N/A
Protected

Academic year: 2022

Aktie "Master Thesis UNIGIS-Jahrgang 2006 Kommunikation von Metadaten - Analyse der Extensions nach ISO 19115 und ISO 19139"

Copied!
64
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Universität Salzburg UNIGIS

Betreuer Prof. Dr. Josef Strobel

Master Thesis UNIGIS-Jahrgang 2006

Kommunikation von Metadaten

- Analyse der Extensions nach ISO 19115 und ISO 19139

Vorgelegt von Mustafa Candir Merziger Str. 5 40476 Düsseldorf

Teilnehmer-ID u1264

(2)

Eigenständigkeitserklärung

Ich versichere, diese Master Thesis ohne fremde Hilfe und ohne Verwendung anderer als der angeführten Quellen angefertigt zu haben, und dass die Arbeit in gleicher oder ähnlicher Form noch keiner anderen Prüfungsbehörde vorgelegen hat.

Alle Ausführungen der Arbeit, die wörtlich oder sinngemäß übernommen wurden sind entsprechend gekennzeichnet.

Mustafa Candir

Düsseldorf, 31.08.2008

(3)

Zusammenfassung

Die von der ISO 19115 vordefinierte Menge von Geometadatenstrukturen erhebt keinen Anspruch auf Vollständigkeit und reicht in der Praxis nicht für alle Anwendungsfälle aus. Sie definiert jedoch eine Methodik, um die vorhandenen Geometadatenstrukturen individuell zu erweitern. Dies Erweiterungen heißen in der Fachsprache Extensions und sind Teil eines Metadaten-Profils, das neben der Extension eine Mindestmenge von Geometadatenstrukturen des Standards ISO 19115, die Kerndaten (Core Data) enthält.

Vor dem Hintergrund der wachsenden Bedeutung von Geodateninfrastrukturen und den zunehmenden Bemühungen Geodaten über das Internet nutzbar zu machen, gewinnt der Umgang mit Profilen an Bedeutung. Diese Arbeit untersucht, inwieweit das durch ISO 19115 (bzw. die konkrete Ausprägung ISO 19139) vorgegebene Regelwerk garantiert, dass harmonisierte Profile entstehen, die redundanzfreie, eindeutige und widerspruchsfreie Geometadatenstrukturen zur Verfügung stellen.

Insbesondere durch die technischen Vorgaben von der ISO 19139 wird eine

einheitliche Umsetzung der Erweiterungen des Standards 19115 stark begünstigt, so dass eine weitgehende Harmonisierung bereits jetzt erfolgt. Lediglich in

designmäßigen Randbereichen kann es zu Redundanz kommen. Wenn

Erweiterungen zurückhaltend vorgenommen werden und großes Augenmerk auf die Wiederverwendung bestehender Metadatenstrukturen des Standards gelegt wird, entsteht bei Erweiterungen, die dicht am Vorbild von ISO 19139 liegen, nur geringes Potential für Probleme. Eine Harmonisierung scheint somit schon weitgehend erfolgt zu sein.

Stichwörter:

ISO 19115, ISO 19139, Metadaten, Profil, Erweiterung (Extension)

(4)

Inhaltsverzeichnis

Abbildungsverzeichnis ... 5

Tabellenverzeichnis ... 6

Abkürzungsverzeichnis... 7

1 Aufgabenstellung und Vorgehensweise ...8

1.1 Einleitung ... 8

1.2 Aufgabenstellung ... 9

1.3 Vorgehensweise ... 12

1.4 Begriffsbestimmung und Notationen ... 12

1.4.1 Allgemein ... 13

1.4.2 Unified Modeling Language (UML) ... 14

1.4.3 Zusammenhang zwischen den ISO- und UML-Begriffen ... 17

1.4.4 Extensible Markup Language (XML) ... 17

2 Metadaten ...19

2.1 Allgemein ... 19

2.2 Die Nutzungsebenen von Metadaten... 20

2.2.1 Metadaten zur Ermittlung ... 21

2.2.2 Metadaten zur Erkundung... 21

2.2.3 Metadaten zur Verwertung... 21

2.3 Bezugsniveau ... 22

3 Metadatenstandards ...22

3.1 Nutzen von Metadatenstandards ... 22

3.2 Verbreitete Standards ... 23

3.2.1 Dublin Core Metadata Standard ... 23

3.2.2 Content Standard for Digital Geospatial Metadata... 26

3.2.3 ISO 19115... 29

3.2.4 Entitäten der Kerndaten des Metadatenmodells ... 31

3.2.4.1 Core Metadata ... 34

3.2.4.2 Profile ... 35

3.2.4.3 Erweiterungen (Extensions) ... 37

4 Der Umgang mit Profilen ...38

5 Untersuchung der Methodik zur Erstellung von Extensions ...41

5.1 Methodik zur Erstellung einer Extension ... 41

(5)

5.2 ISO 19139 – die technische Spezifikation ... 47

5.3 Untersuchung der Encoding Rules für die Extension aus ISO 19115 ... 48

5.3.1 Neue Sektionen ... 48

5.3.2 Neue Codelists erzeugen ... 48

5.3.3 Neue Codelist-Elemente... 51

5.3.4 Neue Metadatenelemente... 51

5.3.5 Neue Entität ... 52

5.3.6 Restriktivere Domain/Obligation für bestehende Elemente ... 54

5.4 Beurteilung der Anwendbarkeit... 54

6 Fazit...54

Glossar ... 57

Literaturverzeichnis ... 62

(6)

Abbildungsverzeichnis

Abbildung 1: Wirtschaftsbeitrag öffentlicher Informationen (EU, 1999) ...8

Abbildung 2: Dreieck CSW-Client-Datenserver ...10

Abbildung 3: Metadaten, Daten, Services ...11

Abbildung 4: UML-Notation für Klassenbeziehungen und Rollen ...14

Abbildung 5: Vererbung von Klassen...17

Abbildung 6: Ausschnitt aus einer XML-Datei ...18

Abbildung 7: XML-Element mit Attributen ...18

Abbildung 8: Nutzungsebenen von Metadaten...20

Abbildung 9: Metadatenkategorien des FGDC...27

Abbildung 10: Umfassendes Metadatenprofil...30

Abbildung 11: Individuelles Profil ...30

Abbildung 12: Umfassendes Metadatenmodell der ISO 19115 ...34

Abbildung 13: Beispiele für Metadatenprofile...39

Abbildung 14: Kleinstes ISO-konformes Profil ...40

Abbildung 15: ISO-19115-Kann-Bestandteile eines Profils ...40

Abbildung 16: Extensions von Profilen ...40

Abbildung 17: Methodik zur Erstellung einer Extension...42

Abbildung 18: Raute-(Diamant)-Vererbung ...53

(7)

Tabellenverzeichnis

Tabelle 1: Kardinalitäten von UML-Assoziationen ...16

Tabelle 2: ISO- und UML-Terminologie ...17

Tabelle 3: Die 6 Ws der Ermittlung von Daten...21

Tabelle 4: Metadatenattribute des Dublin Core Metadata Standards...25

Tabelle 5: Projekte, die Dublin Core Metadaten verwenden ...26

Tabelle 6: Metadaten des CSDGM ...27

Tabelle 7: Datentyp und Verpflichtungsgrad eines neuen Metadatenelements ...33

Tabelle 8: Packages und Entitäten in ISO 19115 ...34

Tabelle 9: Kernmetadaten (Core Data) für gegrafische Datenmengen ...35

Tabelle 10: Extension – Einführung neuer Elemente...42

Tabelle 11: Extension - Anpassung bestehender Elemente ...43

Tabelle 12: Dokumentation der Extension...47

Tabelle 13: Codelist-Tabelleneintrag im Codelist-Katalog ...49

Tabelle 14: Codelist-Tabelle zu Tabelle 13 ...49

Tabelle 15: Codelist mit neuer Spalte ...50

Tabelle 16: Codelist-Katalogeeintrag für neue Spalte ...50

Tabelle 17: Codelist für Sprachunterstützung...50

Tabelle 18: Codelist-Katalogeeintrag für Sprachunterstützung ...51

(8)

Abkürzungsverzeichnis

CSDGM Content Standard for Digital Geospatial Metadata CSW Catalogue Service Web

DCMI Dublin Core Metadata Initiative FGDC Federal Geographic Data Committee GDI Geodateninfrastruktur, auch GI angekürzt

GI siehe GDI

GIS Geoinformationssystem

gmd Geographic Meta Data Extensible Markup Language ISO International Organisation for Standardisation OGC Open Geospatial Consortium

UML Unified Modelling Language URL Uniform Resource Locator W3C World Wide Web Consortium XML Extensible Markup Language

(9)

1 Aufgabenstellung und Vorgehensweise 1.1 Einleitung

Geodaten können als "die Ressource des 21. Jahrhunderts" (AMSTEIN 2004, Folie 3, Hervorhebung von mir) angesehen werden und der effiziente Umgang mit ihnen wird immer wichtiger. Nach AMSTEIN sind Geoinformationen heutzutage ein erstrangiges Wirtschaftsgut und er stellt fest, dass etwa 60 - 80% aller

Entscheidungen, seien sie nun politisch, wirtschaftlich oder privat, räumlichen Bezug haben.

Im Alltag begegnet uns die Sammlung von Geoinformationen z.B. im Supermarkt, wenn uns der Kassierer oder die Kassiererin an der Kasse nach unserer Postleitzahl befragt. Über die Postleitzahlensammlung kann das Einzugsgebiet der Kunden ermittelt werden, um so effektive über die Verteilung von Prospekten zu werben. Es kann aber auch festgestellt werden, dass aus einem nahen Gebiet nur wenig Kunden in den Supermarkt kommen und nach den Ursachen dafür geforscht werden.

Für den öffentlichen Sektor schätzt die EUROPÄISCHE KOMMISSION (2000, S.

6) den Wert, der in ihm verfügbaren Informationen (öffentliche Informationen) auf etwas 68 Mrd. EUR/Jahr. Öffentlichen Informationen kommt somit innerhalb der Europäischen Union nahezu die Bedeutung etablierter Industriezweigen, wie Recht, Druckwesen oder Textilien zu (S. 9-10). Allein auf die geografischen

Informationsindustrien entfällt dabei mit 35,8 Mrd. EUR ein Anteil von 52%.

Abbildung 1: Wirtschaftsbeitrag öffentlicher Informationen (EU, 1999)

(10)

Der effiziente Umgang mit Daten erhält somit einen hohen Stellenwert und auf nationaler Ebene laufen Bestrebungen durch die Schaffung von

Geodateninfrastrukturen (GDIs), die IMOBERDORF (2007, S. 2) mit den klassischen Infrastrukturen für Transport, Versorgung und Telekommunikation vergleicht, einen Zugang zu Informationen zu schaffen, sowie ihre Verwaltung und Pflege zu planen.

Innerhalb einer GDI kommt Metadaten (Daten über Daten) eine besondere

Bedeutung zu, da diese zum einen zusätzliche Informationen über vorliegende Daten enthalten, zum anderen jedoch den Zugriff auf die Daten erst ermöglichen.

Metadaten bilden somit die Schnittstelle des Datentransfers und machen die Daten erst verfügbar und interpretierbar. Um überhaupt miteinander "Sprechen" zu können müssen Datenanbieter und Datennachfrage sich jedoch zunächst auf eine

gemeinsame "Sprache" festlegen und im Bereich der Metadaten liegt diese "Sprache"

in Form der Standards ISO 19115 und ISO 19139 vor, die den Aufbau von

Metadaten festlegen. Das besondere dabei ist, dass auch diese künstliche "Sprache", lebendig ist und sich innerhalb eines vorgegeben Rahmens "Dialekte" entwickeln können, die die Kommunikation erschweren. Um den Umgang mit diesen

"Dialekten", in der Sprache der ISO-Standards "Profil" genannt, wird es im Folgenden gehen.

1.2 Aufgabenstellung

Die Zugreifbarkeit von Geodaten ist für Anbieter und Nutzer ein zentrales Thema.

Um möglichst viele Interessenten zu erreichen, sind die Anbieter bestrebt, ihre

"Ware" über Kataloge anzubieten, wobei die Katalog nicht die Daten selbst, sondern die Beschreibung der Daten (Metadaten) enthalten.

Diese Aufgabe ist mit der eines Versandhandels vergleichbar, der Waren verschiedener Anbieter über einen zentralen elektronischen Katalog im Internet anbietet und den Zugriff auf die Warenbeschreibungen über ein Inhalts- oder Stichwortverzeichnis, bzw. eine Suchmaske erlaubt. So könnte der Käufer eines Blumenversandhandels an kletternden, weißen Duftrosen bis 100 EUR interessiert sein und über eine entsprechende Suchmaske mit Eingabemöglichkeiten für den Pflanzentyp (hier: Rose), die Pflanzeneigenschaften (hier: kletternd), Farbe (hier:

weiß) und Preise (hier: bis 100 EUR) eine Liste der Anbieter der gewünschten Rosen erhalten. Auch wenn es in dem hier behandelten Bereich nicht um dingliche Güter

(11)

wie Rosen, sondern um die "weiche" Ware Geodaten geht, treten auch hier zwischen Ware und Interessenten Katalogdienste (Web Catalog Services, CSW), die als Vermittler im elektronischen Datenaustausch fungieren. Das Lexikon des

Geoinformatik-Services der Universität Rostock ordnet den Web Catalog Service dem Themengebiet Internetsysteme zu und versteht darunter: "Eine von der OGC definierte Implementationsspezifikation zur Recherche nach GI-Diensten und Geodaten."1

Ein Katalogdienst bietet also die Möglichkeit Informationen über Geoanwendungen, -dienste und –(meta)daten in einer Geodateninfrastruktur (GI oder auch GDI) über das Internet bekannt zu machen. Die Verwaltung der Geometadaten richtet sich nach ISO 19115 und ISO 19119. Der Zugriff auf die Daten erfolgt über das Push- oder Pull-Prinzip (Harvesting), die Pflege der Daten über Fortführung (Transaction).

Die folgende Abbildung zeigt das Kommunikationsdreieck CSW-Client-Datenserver.

Discovery Service

Daten- server CSW

ISO 19115 ISO 19119

Client Meta- daten

HTML

Datensatz Datenanfrage referenziert

XML ISO 19139 Internet

Abbildung 2: Dreieck CSW-Client-Datenserver

Der Client (Geodatennachfrager) fragt über das Internet beim Discovery Service des CSW in HTML Informationen über Daten an. Der CSW greift über Geometadaten

(12)

auf Geodatenserver zu und liefert das Ergebnis in XML entsprechend ISO 19139 an den Client zurück.

Mit diesen Informationen stellt der Client anschließend eine Datenanfrage an den Geodatenserver und bekommt die gewünschten Datensätze zurückgeliefert. Die Zentralisierung der Metadaten bedeutet also nicht automatisch die Zentralisierung der Daten.

Der ursprünglich auf statische Daten angewendete Begriff Metadaten hat spätestens mit dem Internet in den Bereich von Services und Dienstleistungen Einzug gefunden, so dass das klassische Bild von Metadaten nun auch auf Services bzw.

Dienstleistungen ausdehnt ist.

Metadaten

Daten

Services

Abbildung 3: Metadaten, Daten, Services

Im Zusammenhang mit Katalogdiensten tritt der Aspekt des Auffindens von Geometadatensätzen in den Vordergrund. STROBL (1995) weist in diesem Zusammenhang darauf hin, dass vor allem strukturelle und navigatorische

Metainformationen bedeutsam sind, denn schließlich möchte der Geodatennutzer wissen, woher er die ihn interessierenden Geodaten erhalten kann. Auf diese speziellen Probleme, die sich aus der Trennung der Metadaten von den Daten

ergeben, kann hier nicht näher eingegangen werden. Der interessierte Leser sei daher direkt auf STROBL (1995) verwiesen.

Geodaten-Katalogdienste bieten die Geodaten vieler Anbieter an und dies stellt die Dienste vor die Herausforderung, unterschiedlichste Metadaten zu verwalten und zu pflegen. Vereinbarungen über Kommunikationsschnittstellen und den generellen

(13)

In den letzten Jahren sind verschiedene Standards entstanden, die Ordnung in die Welt der Geometadaten bringen sollen. Einer dieser Standards ist ISO 19115

"Geographic information – Metadata".

Genau hier setzt diese Arbeit an. Sie untersucht, ob die Freiräume zur Erstellung eigener ISO-19115-konformer Metadatenprofile einer Harmonisierung bedürfen, damit Katalogdienste effektiv mit ihnen arbeiten können.

Es ist nicht Gegenstand dieser Thesis zu prüfen, ob ein Katalogdienst prinzipiell mit allen vordefinierten Entitäten und Elemente aus dem Standard ISO 19115 umgehen kann. Dies wird im Folgenden vorausgesetzt. Es soll lediglich untersucht werden, ob die Methodik zur Erstellung eigener Profile garantiert, dass die Erweiterungen für die Katalogdienste handhabbar bleiben.

1.3 Vorgehensweise

Grundlage für diese Arbeit sind die folgenden Standards:

- ISO 19115: ISO-Standard für "Geographic information – Metadata".

- ISO 19139: ISO-Standard für "Geographic information – Metadata – XML schema implementation".

Sie gehören zur Gruppe der ISO-19100er-Standards, die sich mit Geoinformation und Geodaten befassen.

Um die oben aufgeworfenen Frage nach dem Bedarf für Harmonisierung zu beantworten, wird die Methodik zum Erstellen von Erweiterungen (ISO/FDIS 19115:2003(E), Annex F) und der Standard bzgl. der technischen Umsetzung

(ISO/TS 19139:2005(E)) analysiert werden. Die einzelnen Schritte auf dem Weg zur Erweiterung werden kritisch durchleuchtet.

1.4 Begriffsbestimmung und Notationen

Die für das Verständnis dieser Arbeit zentralen Begriffe und Notationen sollen hier kurz erläutert werden. Ergänzend steht weiter hinten ein Glossar zur Verfügung, in dem zusätzliche Begriffe nachgeschlagen werden können. Der Vollständigkeit halber enthält dieses Glossar auch die hier erläuterten Begriffe.

Es werden ausschließlich Begriffe aufgeführt, die hier verwendet werden. Begriffe in Zitaten oder in aus der Literatur übernommenen Abbildungen und Tabellen, mit

(14)

Da diese Arbeit im wesentlichen auf englischen Quellen, wie den ISO-Standards, basiert, werden neben den deutschen Begriffen auch die englischen in Klammern mit angegeben.

1.4.1 Allgemein

Die Definition der folgenden Begriffe ist mitsamt den Anmerkungen und Beispielen ISO/FDIS 19115:2003(E), Kapitel 4 "Terms and Definitions" entnommen.

Datentyp (Data Type)

Festlegung eines Wertebereichs mit zugehörigen Operationen, die für die Werte des Wertebereichs erlaubt sind.

Beispiele:

Integer, Real, Boolean, String, Date oder GM_Point.

Anmerkung:

Ein Datentyp wird durch einen Begriff, z.B. Integer identifiziert.

Datenmenge (Datenset)

Identifizierbare Sammlung von Daten.

Anmerkung: Eine Datenmenge kann eine kleinere Menge von Daten sein, die durch Bedingungen wie räumliche Ausdehnung oder Featuretyp begrenzt, physikalisch jedoch Bestandteil einer umfassenderen Datenmenge ist.

Theoretisch kann eine Datenmenge aus einem einzigen Feature oder einem Feature- attribut innerhalb einer umfassenden Datenmenge bestehen. Eine gedruckte Karte oder ein Diagramm kann als Datenmenge angesehen werden.

Metadaten (Metadata) Daten über Daten.

Metadatenelement (Metadata Element) Metadatum. Einzelne Metadatenheinheit Anmerkung:

- Metadatenelemente sind innerhalb einer Metadatenentität eindeutig.

- In der UML-Terminologie (siehe Abschnitt 1.4.2 Unified Modeling Language (UML)) entsprechen sie einem Attribut.

(15)

Metadatenentität (Metadata Entity)

Menge von Metadatenelementen, die den gleichen Datenaspekt beschreibt.

Anmerkung:

- Kann aus einer oder mehreren Metadatenentitäten bestehen.

- In der UML-Terminologie (siehe Abschnitt 1.4.2 Unified Modeling Language (UML)) entspricht sie einer Klasse.

Metadatensektion (Metadata Section)

Teilmenge von Metadaten, die aus einer Sammlung ähnlicher Metadatenentitäten und Metadatenelementen besteht.

Anmerkung:

In der UML-Terminologie (siehe Abschnitt 1.4.2 Unified Modeling Language (UML)) entspricht sie einem Package.

1.4.2 Unified Modeling Language (UML)

Innerhalb der UML-Notation gibt es spezielle Darstellungsweisen für Beziehungen zwischen Klassen. Diese sind in der folgenden Abbildung dargestellt und werden kurz erläutert. Die Kästchen stellen dabei Klassen dar und die Beschriftungen K-1 und K-2 sollen verdeutlichen, dass es sich um verschiedene Klassen handelt. Die Art der Beziehung zwischen den Klassen wird durch die Verbinder (Pfeile)

gekennzeichnet.

K-1 K-1 K-1

K-2 K-2 K-2

K-1 K-2

K-1 K-2K-2

Aggregation Komposition Generalisierung Abhängigkeit

K-2

K-1 K-2

K-1 K-2

K-1 K-2

K-1 Assoziation

(16)

Assoziation (Association)

Eine Assoziation zwischen Klassen wird durch eine einfache Linie gekennzeichnet.

Sie steht für eine allgemeine Beziehung zwischen zwei eigenständigen Klassen.

Aggregation (Aggregation)

Eine Aggregation beschreibt eine Beziehung zwischen Klassen, bei der eine Klasse.

Teil der anderen ist, ohne dass die "Teil"-Klasse jedoch ihre eigenständig verliert.

Kennzeichen der Aggregation in der UML-Notation ist eine ungefüllte Raute. In Abbildung 4: „UML-Notation für Klassenbeziehungen“ gibt die Notation an, dass K- 1 Teil der Klasse K-2 ist.

Komposition (Composition)

Eine Komposition beschreibt wie die Aggregation eine Beziehung zwischen einem Ganzen und seinen Teilen, wobei die Komposition jedoch stärker als die

Aggregation ist, weil die Teil-Klasse nicht eigenständig bestehen kann und an die Klasse gebunden ist, zu der sie gehört. Die Komposition wird durch eine gefüllte Raute dargestellt und Abbildung 4: „UML-Notation für Klassenbeziehungen“ stellt eine Komposition dar, bei der K-1 ein Teil der Klasse K-2 ist.

Generalisierung (Generalization)

Eine Generalisierung stellt eine "erbt von" Beziehung dar und in dem oben in Abbildung 4: „UML-Notation für Klassenbeziehungen“ dargestellten Beispiel erbt K-1 von K-2. K-1 verfügt über seine eigenen Eigenschaften und bekommt zusätzlich die von K-2 hinzu. Die Generalisierung wird durch eine geschlossene, nicht-gefüllte Pfeilspitze an der Seite des Vererbenden gekennzeichnet.

Abhängigkeit (Dependency)

Eine Abhängigkeit ist eine Beziehung zwischen einer abhängigen und einer

unabhängigen Klasse. In der UML-Notation wird diese durch eine gestrichelte Linie

(17)

mit offener Pfeilspitze gekennzeichnet. Die Spitze des Pfeils befindet sich auf der Seite der unabhängigen Klasse.

Rollen (Roles)

In Assoziation, die eine Richtung haben, können den beteiligten Klassen Rollen zugewiesen werden. Diese sind in der untersten Klassenbeziehung der Abbildung 4:

„UML-Notation für Klassenbeziehungen“ dargestellt.

Kardinalitäten von Assoziation

Assoziationen bestehen nicht nur zwischen zwei Klassen und so verfügt die UML- Notation über die Möglichkeit, die Kardinalität von Assoziationen anzugeben. Sie wird an der Seite der entsprechenden Klasse zumeist über dem Verbinder

angebracht.

Die folgende Tabelle zeigt die möglichen Kardinalitäten:

Kardinalität Darstellung

1 Genau eine

0..* Keine oder mehrere 0..1 Optional (keine oder eine) 1..* Eine oder mehrere

n Spezielle Anzahl

Tabelle 1: Kardinalitäten von UML-Assoziationen

Vererbung von Klassen (Class Inheritance)

Die oben in Abbildung 4: „UML-Notation für Klassenbeziehungen“ dargestellte Generalisierung ist eine spezielle Form der Vererbung, bei der eine Klasse von einer anderen erbt. Prinzipiell ist jedoch das Erben von beliebig vielen Klassen möglich.

Das zeigt die folgenden Abbildung. In ihr vererbt Klasse K-1 an die Klassen K-2, K- 3 bis K-n.

(18)

K-1 K-1 K-1 K-1

K-2 K-3

...

K-n

Abbildung 5: Vererbung von Klassen

1.4.3 Zusammenhang zwischen den ISO- und UML-Begriffen

Im Abschnitt 1.4.1 „Allgemein“ hatte sich gezeigt, dass die Begriffe der ISO-Welt nicht mit denen der UML-Welt übereinstimmen. Da die Trennung und das korrekte Verständnis der Begriffe zum Verständnis dieser Arbeit von zentraler Bedeutung sind, soll die folgende Tabellen den Zusammenhang noch einmal zusammenfassen.

UML ISO

Paket (Package) Sektion (Section)

Allgemeine Klasse (Generalized Class)

Entität (Entity) Spezielle Klasse (Specified Class) Entität (Entity)

Klasse (Class) Entität (Entity)

Attribute (Attribute) Metadatenelement (Metadata Element)

Assoziation (Association) Element Tabelle 2: ISO- und UML-Terminologie

1.4.4 Extensible Markup Language (XML)

XML ist eine Auszeichnungssprache (Markup Language), die es erlaubt, hierarchisch strukturierte Daten als Textdateien darzustellen. Extensible bedeutet, dass die

Sprache erweitert werden kann und die Erweiterbarkeit bezieht sich dabei auf die Strukturelemente (XML-Elemente), deren Namen frei wählbar sind. In dem XML- Beispiel unten sind <liste>, <titel>, <eintrag>, <name> und <eintragstext> solche Strukturelemente.

(19)

...

<liste>

<titel>Übersicht über die ISO-Normen</titel>

<eintrag>

<name>ISO 19115</name>

<eintragstext>Die Norm ISO 19115 ...</eintragstext>

</eintrag>

<eintrag>

<name>ISO 19139</name>

<eintragstext>Die Norm ISO 19139...</eintragstext>

</eintrag>

...

</liste>

...

Abbildung 6: Ausschnitt aus einer XML-Datei

Elemente mit Inhalt (z.B.<titel>IS0-Norm-Verzeichis</titel>) besitzen eine Beginn- (<titel>) und eine Endkennung (</titel>), die auch Tags (engl. für Marke) genannt werden. Der Inhalt sind die eigentlichen Daten, in Bezug auf den Titel hier: Übersicht über die ISO-Normen.

XML-Elemente können Attribute besitzen. Attribute sind Paare, die aus

Schlüsselwort und Wert bestehen und wie folgt aufgebaut sind: Attributname =

"Attributwert". In dem obigen Beispiel könnte der Titel zum Beispiel um die Attribute Autor (autor) und Erstellungsdatum (datum) ergänzt werden:

...

<titel autor="Karl Heinz" datum="01.01.2008">

Übersicht über die ISO-Normen

</titel>

...

Abbildung 7: XML-Element mit Attributen

(20)

2 Metadaten 2.1 Allgemein

Allgemein bezeichnen Metadaten zunächst einmal Daten, die andere Daten

beschreiben, also Daten über Daten. Im Bereich Geoinformatik ist dies nicht anders.

Das Lexikon des Geoinformatik-Services der Universität Rostock schreibt über Metadaten konkreter folgendes:

"Von der griech. Vorsilbe meta = inmitten, zwischen, hinter, nach. Bezeichnet in

Datenbanken und ähnlichen Systemen zum Management von gespeicherten Nutzdaten (z.B.

beim Dokumentenmanagement) die systeminternen Daten, die zur Verwaltung der eigentlichen Nutzdaten verwendet werden (Daten über Daten). Beispiele sind Identifizierungsnummern für Dateien und Datensätze, Zugriffsrechte (Lese und

Schreibrechte), Datum und Uhrzeit der Erzeugung/Änderung von Datei/Datensatz und der genaue Speicherort. Die genaue Struktur der Metadaten ist von dem konkreten

Anwendungszweck abhängig. Metadaten und die eigentlichen Daten müssen nicht immer in den gleichen Speichersystemen abgelegt sein. Je nach Anwendung kann es sinnvoll sein, die Metadaten schnell verfügbar zu haben und die Nutzdaten dezentral auf Hintergrundspeichern zu halten, z.B. in langfristigen Archiven auf magnetooptischen Speichermedien.

Metadaten in GIS beschreiben Eigenschaften, Definition, Herkunft, Gültigkeit, Genauigkeit, Einsatz- und Nutzungsmöglichkeiten etc. von Datensätzen auf unterschiedlichen

Aggregationsebenen. Unentbehrlich für Dokumentation, Transfer und längerfristige Wertsicherung v.a. auch räumlicher Daten. Die ISO 19115 definiert umfangreich Metadaten."2

Diese Erläuterung weißt darauf hin, dass die Struktur der Metadaten nicht

allgemeingültig ist, sondern vom Anwendungszweck abhängt. Innerhalb von ISO 19115 wird dem durch Erweiterbarkeit Rechnung getragen (siehe dazu ISO/FDIS 19115:2003(E), Annex F).

KREMERS und KRASEMANN (1996, S. 11) thematisieren das Problem der Grenzziehung, das nicht von sich aus gegeben ist, sondern auch ebenfalls durch den Kontext bzw. den Anwendungszweck der Daten möglich wird. Die Definition von Metadaten ist demnach ein Problem der Sichtweise bzw. Fragestellung. Ob konkrete Daten also Daten oder Metadaten sind hängt vom Kontext ab und so kann es sein, dass dieselben Daten in einem Fall einfach "nur" Daten sind, in einem anderen jedoch Metadaten.

Die Struktur und auch die generelle Einordnung von Daten als Metadaten hängt also vom Anwendungszweck ab. Im Rahmen dieser Arbeit bewegen wir uns konkret im Kontext der Katalogdienste, die Metadaten verschiedener Geodatenanbieter sammeln

2 Geoinformatik-Service (2008), Stichwort: "Metadaten",

(21)

und Geodatensuchenden zur Verfügung stellen. Der Datensuchende möchte dabei vor allem beurteilen können, ob die gefundenen Daten auch den gesuchten

entsprechen, in welcher Qualität sie vorliegen und wie auf diese zugegriffen werden kann. Neben diesen generellen Fragen sind im GIS-Bereich zusätzliche

Informationen zum Datenformat, dem Koordinatensystem und Angaben über die Datenaktualität bzw. den Aktualisierungszyklus von Interesse.

Den Datensuchenden stehen die Datenanbieter gegenüber, für die Daten ein wichtiges Wirtschaftsgut sind. Für sie ist die Dokumentation und Pflege ihres Datenbestandes von enormer Bedeutung, da es gilt Datenleichen und –redundanzen zu vermeiden, die zu Zeit- und Kapitalverlust führen. Ohne eine gewissenhafte Dokumentation lassen sich Daten langfristig nicht sinnvoll nutzen. Teil der

Dokumentation sind dabei auch die Metadaten, die mit den Referenzdaten zusammen eine Einheit bilden. Aus diesem Grund betrachtet STROBL (1995) Metadaten als integralen Bestandteil beim Neu-Entwurf einer Datenbasis im GIS-Kontext und schlägt vor, dies zukünftig besser zu berücksichtigen.

2.2 Die Nutzungsebenen von Metadaten

In den folgenden Abschnitten sollen die verschiedenen Nutzungsebenen von Metadaten kurz erläutert werden. Es handelt sich um Ermittlung, Erkundung und Verwertung.

ermitteln

verwerten erkunden

Abbildung 8: Nutzungsebenen von Metadaten Quelle: TAYLOR (2004), S. 26.

(22)

Die drei Ebenen stellen aus der Sicht des Datensuchenden unterschiedliche Einsprungpunkte in die Metadatennutzung dar.

2.2.1 Metadaten zur Ermittlung

Metadaten sollen dem Datensuchenden eine Mindestmenge an Informationen über Art und Inhalt der beschriebenen Daten vermitteln. Es soll durch sie möglich sein, einen ersten Eindruck über die dahinter liegenden Daten zu erhalten. Der

Datensuchende ist an den Antworten auf die sechs "W-Fragen" interessiert: Was?, Warum?, Wann?, Wo?, Wer? und Wie?

Was? Frage nach dem Namen und der thematischen Beschreibung der Daten.

Warum? Frage nach dem Entstehungsgrund der Daten.

Wann? Frage nach dem Entstehungsdatum der Daten.

Wo? Fragen nach den Koordinaten, dem Namen oder Gebietsnamen auf den sich die Daten beziehen.

Wer? Frage nach Urheber der Daten.

Wie? Frage nach den Mitteln und Methoden, mit denen die Daten erhoben bzw. erstellt wurden und nach der Zugriffsmöglichkeit.

Tabelle 3: Die 6 Ws der Ermittlung von Daten

2.2.2 Metadaten zur Erkundung

Im Anschluss an die Ermittlung dienen die Metadaten der genaueren Untersuchung der referenzierten Daten auf ihre Eignung hinsichtlich einer bestimmten

Fragestellung. Details und Vorgaben, die sich aus der Fragestellung ergeben, müssen auf Attributebene überprüft werden. Beispielsweise müssten Informationen über die Datenorganisation der Datenobjekte, Raster/Vektor, Beschreibungen, Qualitative Aussagen über die Daten, Kontakdaten etc vorliegen.. Da hier bereits die Art verbindliche Evaluierung auf eine Nutzungseignung der Daten erfolgt müssen Informationen technisch korrekt und detailliert vorliegen. Letztendlich fällt der Interessent aufgrund dieser Informationen die Entscheidung über Erwerb der Daten.

2.2.3 Metadaten zur Verwertung

Hier liefern die Metadaten Informationen über die Art und Weise der direkten Nutzung der Daten. Beispielsweise über den Zugang via ftp, CD-Direktversand oder

(23)

Onlinezugriff über Web-Browser usw. Des weiteren müssen Angaben über Hard-und Softwareanforderungen oder Beschreibung eventuellen Preprocessing zur Nutzung der Daten vorliegen. Auch gehören Informationen zur Anwendung der Ressource innerhalb des Geoprocessing zu dieser Metadatenebene.

2.3 Bezugsniveau

Üblicherweise sollte man davon ausgehen, dass eine Metadateninstanz genau einem Datenobjekt zugeordnet ist, wobei noch zu klären ist, was genau ein Datenobjekt sein kann. STROBL (1995) gliedert folgende Aggregationsebenen auf, wobei er betont, dass nicht immer eine Differenzierung aller dieser Ebenen sinnvoll ist:

- Einzelpunkt: Koordinatentupel

- Geometrisches Primitiv: als kleinste Einheit, z.B. Punkt oder Linie

- Objekt: aus Primitiven zusammengesetzt

- Klasse: Menge von Objekten mit gemeinsamen semantischen Eigenschaften

- Thema: 1-n Klassen räumlicher Objekte

- Räumliche Datenbasis: Sammlung von Themen.

Prinzipiell sollen Metadaten auf dem Niveau ausgewiesen werden, auf dem sie in differenzierter Form vorliegen. Liegen laut STROBL (1995) Verknüpfungen von Metadaten und Bezugsobjekten vor, so ist eine Bezugnahme zwischen diesen Ebenen nur umständlich möglich. Ein objektorientierter Zugang könne diese

Verknüpfungsproblematik auflösen. Jede Abstraktionsebene hat dann

Metainformationen, die auch für diejenigen Bezugsobjekte Gültigkeit besitzt, die dieser Ebene untergeordnet sind. Dadurch kann bei fehlender Information auf einer Ebene evtl. die Metadatenebene oberhalb betrachtet werden

(Generalisierungsprinzip).

3 Metadatenstandards

3.1 Nutzen von Metadatenstandards

Geodaten sind mit ihrer vielschichtigen und komplexen Struktur ohne passende Metainformationen nicht einfach aus sich selbst heraus interpretierbar. Die

Metainformationen müssen zwischen unterschiedlichen Dienstleistern (z.B. zwischen

(24)

vielleicht Geodaten von verschiedenen Anbieter vergleichen, um für ihn die geeignetsten herauszufinden. Dazu muss er dieMöglichkeit haben, Metadaten miteinander zu vergleichen. Es ist sinnvoll, dies softwareunterstützt vorzunehmen.

Ohne Vereinbarungen über Inhalt, Struktur bzw. Format, sprich einen Standard, lässt sich dieses Unterfangen jedoch nicht vernünftig realisieren.

Betroffen von einem Wunsch nach einer Norm sind nach STROBL (1995) sind folgende Aspekte:

- Die Beschreibung der Geodaten (vom Datenanbieter)

- Das Format für Speicherung (technische Struktur, Datentypen, Wertebereiche)

- Das Format für für den Datentransfer

Die Vorteile der Nutzung von Metadatenstandards liegen auf der Hand:

- Eine höhe Vergleichbarkeit der Metadaten durch Kompatibilität und Transparenz

- Das einhalten der Standards ermöglicht Kontinuität

- Ein hoher semantischer Abdeckungsgrad des Metadatensets (da der Standard aus dem Konsens einer Community entsteht)

- Transparenz des Entstehungs- und Wartungsprozess

- Interoperabilität über Systemgrenzen hinweg

Mit dem Einsatz und der Verbreitung von Metadatenstandards wird eine wichtige Basis für die Interoperabilität von Datenressourcen geschaffen (NEBERT 2004, S.

26).

3.2 Verbreitete Standards

Es gibt inzwischen recht viele Metadatenstandards auf dem Markt. Sie entstanden durch die verschiedenen Anforderungen und Anwendungsfälle unterschiedlicher Communities. Manche Ansätze legen den Schwerpunkt auf das „Ermitteln“, andere auf das „Erkunden“, wieder andere versuchen alle Bereiche gleichermaßen,

sozusagen universell, abzudecken.

3.2.1 Dublin Core Metadata Standard

Einer der bekannteren Standards, der auch im Kontext dieser Arbeit Relevanz hat, ist der Dublin Core Metadatenstandard aus dem Jahre 1995, der von der Online

Computer Library Center und dem National Center for Supercomputing am Rande einer WWW-Konferenz (OCLC/NCSA Metadata Workshop) in Chicago/Dublin

(25)

(daher der Name „Dublin“) initiiert wurde. Die Teilnehmer der Initiative hatten sich das Ziel gesetzt, die Erschließung von Web-Ressourcen durch ein Minimalset von Metadaten zu unterstützen. Damit sollte ein einfacher Standard zur Erleichterung der Suche nach Informationen im Web geschaffen werden.

Im Grunde handelt es sich bei diesem Standard um eine Sammlung von beschreibenden Attributen zu Online-Ressourcen, (vornehmlich textbasierte Ressourcen) für die Suche im WWW. Daher lässt sich das Set, ausgehend von diesem Schwerpunkt, der Anwendungsebene „Ermitteln“ zuordnen.

Bei der Auswahl der Elemente bemühte man sich diese mit möglichst einfachen und intuitiven Namen zu versehen, da man davon ausging, dass die Mehrzahl der Nutzer im Web nicht Spezialisten sondern Laien sind. Die Elemente orientieren sich

überwiegend an typischen Metadaten zu Papierdokumenten (Bibliothekswesen) und beschreiben direkte Eigenschaften der Daten selbst. Das Set ist bewusst einfach gehalten. Es soll gewährleisten, dass die Verwendung und Realisierung einfach zu implementieren ist und eine einfache Indizierung der Metadaten zulässt.

Heute besteht das von der Dublin Core Metadata Initiative (DCMI) gepflegte Set aus einer kleinen Menge von Termen bzw. Attributen, sowie einer fixen Anzahl von Elementen, die in 2 Stufen gliedern: Simple und Qualified(mit einigen Attributen mehr). Im Folgenden werden die als Dublin Core Metadaten bekannten Attribute der Simple-Stufe, bestehend aus den 15 Kernattributen, beschrieben.

Obwohl die Anzahl der Elemente im Dublin Core Metadaten auf 15 fixiert wurde möchte man sich die Erweiterbarkeit nicht verbauen und damit Kataloge, die diesen Set realisieren, auch mit unbekannten Elemente umgehen können.

Wo möglich werden Formatempfehlungen ausgesprochen, so dass beispielsweise für Elemente wie language, date, Format usw. die mit Werten aus international

anerkannten Normen gefüllt werden.

Beispiele:

- Language: nach ISO639, ISO 3166

- Date: nach ISO 8601

- Format: Internet Media Type

(26)

Name Beschreibung

contributor Referenz auf die Person, die Organisation oder den Service, die zur Erzeugung und Pflege des Inhalts der Ressource beigetragen hat oder beiträgt.

coverage Beschreibung des Gültigkeitsbereichs der Ressource.

Möglichst durch räumlich/örtliche oder zeitliche Angaben.

Empfohlen werden Bezeichner aus einem TGN (Thesaurus of Geographic Names).

creator Referenz auf die Person bzw. Organisation, die für Erzeugung der Ressource verantwortlich ist.

date Ein Zeitpunkt oder eine Zeitspanne im Lebenszyklus der beschriebenen Ressource. Empfohlen ist ein Format nach ISO 8601.

description Freitext zur Beschreibung des Inhalt der Ressource.

format Datenformat, Ausmaße der Ressource.

identifier Eindeutige Referenz zur Ressource innerhalb des gültigen Kontext.

language Sprache des Inhalts der Ressource. Empfohlen ist eine Form nach RFC 1766. Zwei Zeichen für den Sprachcode nach ISO 639 und optional zwei weitere Zeichen, die den Ländercode nach ISO 3166 enthalten, zum Beispiel „en-uk“.

publisher Referenz auf die Person bzw. Organisation(Verleger, Herausgeber), die für die Veröffentlichung der Ressource verantwortlich ist.

relation Referenz auf eine andere Ressource, zu der das aktuell beschriebene Dokument in relevanter Beziehung steht.

rights Beschreibung der Rechteverhältnisse zur beschriebenen Ressource, z.B. durch eine URL zum Rechtinhaber.

source Referenz auf die Quelle/Ressource von der diese aktuell beschriebene Ressource abgeleitet ist.

subject Beschreibung für das Thema der Ressource mittels sprechender Schlüsselwörter, Phrasen oder sogenannter Klassifikationscodes.

title Titel der Ressource unter dem sie bekannt ist.

type Beschreibt den Kontext der Ressource. Empfohlen wird ein Kürzel aus dem Dublin Core Types DCT1. Zum Beispiel:

„Text“, „Image“.

Tabelle 4: Metadatenattribute des Dublin Core Metadata Standards Einige Projekte die Dublin Core Metadaten verwenden:

Projekt Internet-Präsenz ADAM: Art, Design, Architecture &

Media Information Gateway

http://adam.ac.uk/

Arts and Humanities Data Service http://ahds.ac.uk/

(27)

Librarian's Index to the Internet

A Mathematics Preprint Index http://www.dstc.edu.au/DC4/roland/

Metadata Server of the SUB Göettingen http://www2.sub.uni-goettingen.de Nordic Metadata Project http://linnea.helsinki.fi/meta/

Tabelle 5: Projekte, die Dublin Core Metadaten verwenden

Quelle: http://www.dlib.org/dlib/june97/metadata/06weibel.html (15.09.2007)

3.2.2 Content Standard for Digital Geospatial Metadata

Ein Standard, der alle drei Anwendungsebenen abdeckt ist, der Content Standard for Digital Geospatial Metadata (CSDGM). Es stammt von der US-amerikanischen Koordinierungsstelle für nationale Geodateninfrastrukturen, dem Federal Geographic Data Committee (FGDC). Der Standard wurde erstmalig im Jahr 1994 als US-

Federal-Metadata-Standard verabschiedet und 1998 in einer überarbeiteten Version vorgelegt. Alle staatlichen Stellen wurden angewiesen, für die Dokumentation von räumlichen Daten diesen Standard zu verwenden. Eines der herausragenden

Merkmale dieses Standards ist die Möglichkeit, auf Grundlage des CSDGM eigene Anpassungen (Profiles) bzw. Erweiterungen (Extensions) vorzunehmen. Somit ist eine Schnittstelle gegeben, um standardkonforme Metadatensets zu erstellen, die den Anforderungen der Community genügen. Es existieren diverse Anpassungen des CSDGM-Basismodells für spezielle Bereiche.

Ein kleines Schaubild veranschaulicht die obersten Kategorien des Metadatensets:

(28)

Abbildung 9: Metadatenkategorien des FGDC

Quelle: <http://www.fgdc.gov/csdgmgraphical/index.html> (13.09.2007)

"Content Standard for Digital Geospatial Metadata", Version 2 - 1998.

(FGDC-STD-001 June 1998)

Name Beschreibung Identification Information Allgemeine Informationen über die Daten Data Quality Information Angaben über die Qualität der Daten Spatial Data Organization

Information

Informationen über die Art und Weise der Datenorganisation im Datenset

Spatial Reference Information Angaben über das Koordinatensystem der Daten Entity and Attribute Information Informationen über die Entitäten(-typen),

Domains der Atttribute etc.

Distribution Information Angaben über den Vertreiber und Erwerbsmodalitäten

Metadata Reference Information Angaben über Aktualität und Hersteller Tabelle 6: Metadaten des CSDGM

(29)

Obwohl für räumliche Daten entwickelt, findet der Standard auch in anderen

Bereichen, wie z.B. der Beschreibung biologischer Daten Anwendung. Auch jenseits der US-Grenzen wurde dieser Standard angenommen. Die Firma ESRI, eines der marktführenden Unternehmen im Bereich GIS-Software, entwickelte ihre

hauseigenes Metadatenprofil auf Basis des FGDC Standards und verhalf, begünstigt durch ihr etabliertes ArcGIS-System, zur weiteren Verbreitung dieses Standards.

Interessanterweise ist das FGDC auch einer der aktiven Kontributoren von ISO- 19115. Zur Zeit erarbeitet das FGDC ein US-Profil des internationalen Metadata Standard ISO 19115 aus, das den CSDGM mit dem ISO 19115 harmonisieren soll (FGDC 2008). Somit wird die Version 3 des CSDGM ein Realisierung des ISO- 19115-Profils (DANKO, REICH und ENLOE 2000).

(30)

3.2.3 ISO 19115

ISO 19115 beschreibt über 400 Metadaten-Entitäten, von denen etwa 50 das sogenannte Core Model bilden. Entitäten aus dem Core Model müssen von jedem Anbieter in ihrem Metadatenkatalog unterstützt werden und sie bieten einen Mindestsatz an Metainformationen. Der Mindestsatz basiert auf den bereits

etablierten Dublin-Core-Metadatenstandard. Darüber hinaus können die Anbieter aus den über 400 Entitäten des ISO-19115 Standards ihren Bedürfnissen entsprechend eine Teilmenge (Profil) nutzen, um ihre Metadaten zu organisieren. So können basierend auf diesen Entitäten unterschiedlichste Metadatensets zusammengestellt werden. Die noch abstrakte Form der Spezifikation ISO 19115 wird durch eine weitere Spezifikation, die "Application Specification ISO 19139", in eine konkrete Struktur als XML-Schema umgesetzt.

Beim Katalogsserver laufen alle Stricke innerhalb des Problemszenarios ein. Er muss in der Lage sein, mit den unterschiedlichen Metadatenprofilen umzugehen, sein Metadatenrepository aktuell halten und möglichst effizient darauf zugreifen.

Transaktionsfunktionen, die wir auch aus den klassischen

Datenbankverwaltungssystemen kennen wie z.B. Discovery (Selektion), Transaction (Editing: INSERT, UPDATE, DELETE) sollen dem Datenanbieter ermöglichen, Metadaten über die Webschnittstelle ferngesteuert dem Katalogserver zu übergeben.

Die Profile sollen den Bedürfnissen unterschiedlichster Communities gerecht werden. Der Kernsatz (Core Metadata) bildet ein minimales und obligatorisches Metadatenmodell, das jedes ISO-19115-konforme Profil abbilden muss.

Zusammen mit den restlichen Entitäten bildet der Core das umfassende

Metadatenprofil (comprehensive model), das direkt verwendet werden kann, jedoch auch an individuelle Bedürfnisse angepasst werden kann. Eine Anpassung muss mindestens den Core beinhalten und kann darüber hinaus weitere Entitäten des ISO 19115 enthalten, oder um neue Entitäten ergänzt werden. Die neuen Entitäten dürfen dabei nicht willkürlich erstellt werden, sondern müssen bestimmten Vorgaben entsprechen, die ebenfalls im Standard ISO 19115 definiert sind und ISO- Konformität garantieren sollen. Einzelheiten dazu finden sich weiter unten im Abschnitt 5.1 "Methodik zur Erstellung einer Extension". Die individuell

zusammengestellten Mengen von Entitäten werden Profile genannt. Die folgenden

(31)

Abbildungen sollen die Begriffe Core, umfassendes Metadatenprofil (comprehensive model) und individuelles Profil noch einmal veranschaulichen.

In Abbildung 10: „Umfassendes Metadatenprofil“ stellt der blaue Kreis die Gesamtheit der Metadaten des Standards ISO 19115 dar. Der grüne mit Core beschriftete Kreis stellt den Kernsatz des Metadaten des ISO 19115 dar.

Core ISO 19115

Abbildung 10: Umfassendes Metadatenprofil Die folgende Abbildung zeigt in dem dick umrandeten ovalen Bereich ein

individuelles Profil. Es umfasst den Core (grün), einen Teil der Entitäten der ISO 19115 (blauer Bereich im Oval) und darüber hinausgehenden individuelle Entitäten (weißer Bereich im Oval).

Core Core ISO 19115

Profil

Abbildung 11: Individuelles Profil

Zur Beschreibung der Objektklassen und der Relationen zwischen ihnen, bedient sich der Standard der Unified Modelling Language (UML), so dass Informationen

durchgehend in Form von UML-Diagrammen vorzufinden sind.

Der Standard umfasst insgesamt 14 UML-kodierte Packages, die ihrerseits eine oder mehrere Entitäten (UML-Klassen) enthalten können. Entitäten und Packages stellen Hüllen bzw. Abstraktionen von Begrifflichkeiten aus der realen Welt dar. Die diskreten Attribute (einer Entität) heißen in diesem Zusammenhang Elemente.

(32)

3.2.4 Entitäten der Kerndaten des Metadatenmodells

In diesem Abschnitt werden die zentralen Entitäten des ISO-19115-

Metadatenmodells vorgestellt. Im folgenden Abschnitt werden die Begriffe Entität und Klasse synonym verwendet.

MD_Metadata: Die Entität, die einen Metadatensatz abbildet. Sie enthält sowohl mandatory als auch optionale Elemente und verweist auf mindestens eine

MD_Identifikation. Die nachfolgenden Entitäten werden von dieser Entität referenziert.

MD_Identification: Enthält Informationen, um die Daten eindeutig zu identifizieren. Es ist die einzige Entität, die ein MD_Metadata auf jeden Fall referenzieren muss. Sie enthält weitere Erkennungsinformationen zum Datensatz, wie Citation (Zitierung), Abstract (Kurzfassung), Purpose (Verwendungszweck), Credit, Status und Kontaktangaben. Je nach Anwendungsfall wird sie als eine abgeleitete spezielle Entität z.B. MD_DataIndentification (für Daten) oder MD_ServiceIdentification (für Services) verwendet. Diese Entität setzt sich aus weiteren Entitäten zusammen, wie z.B. MD_Format, MD_Usage, MD_Keywords.

MD_Constraints: Enthält Angaben über gesetzliche oder sicherheitstechnische Restriktion (Authorizierung, Zugriffschutz) zu dem Datensatz.

DQ_DataQuality: Enthält Informationen über die Datenqualität. Diese Entität verwendet u.a. die abstrakte Basisklasse DQ_Element, welche konkretisiert werden kann mit den Subklassen: DQ_ThematicAccuracy (thematische Genauigkeit), DQ_TemporalAccuracy (zeitliche Genauigkeit), DQ_PositionalAccuracy,

DQ_LogicalConsistency, DQ_Completeness. Auch diese Klassen sind ableitbar, so dass weitere konkrete Qualitätsaussagen möglich sein können. Des weiteren enthält sie über die Entität LI_Lineage Aussagen zu Herkunft und Herstellungsprozess der Daten.

MD_MaintenanceInformation: Enthält Aktualisierungsinformationen bezüglich Umfang und Häufigkeit.

(33)

MD_SpatialRepresentation: Realisiert Rasterdaten (MD_GridSpatial- Representation) oder Vektordaten (MD_VectorSpatialRepresentation).

MD_ReferenceSystem: Diese Entität liefert Informationen über das räumliche und das zeitliche Bezugssystem. Konkrete Ausprägung über Subclassing möglich z.B.

über die Entität MD_CRS, die ihrerseits aus MD_ProjectionsParameters und MD_Ellipsoidparameters zusammengesetzt ist.

MD_ContentInformation: Enthält durch Subclassing Informationen über den eventuell verwendeten Feature Catalog (subclass: MD_FeatureCatalogueDescription) und/oder den Inhalt eines Coverage Dataset (subclass: MD_CoverageDescription).

MD_CoverageDescription kann zu MD_ImageDescription spezialisiert werden.

MD_PortrayalCatalogueReference: Referenziert auf den Anzeigekatalog, der vom Datensatz verwendet wird.

MD_Distribution: Diese Entität enthält Informationen über den Distributor und zum Erwerb der zugehörigen Daten. Sie besteht aus Formatangaben (MD_Format),

Distributor (MD_Distributor), Medium (MD_Medium) und Verkaufsmodalitäten (MD_StandardOrderProcess) zum Datensatz.

MD_MetadataExtensionInformation: Diese Entität enthält Informationen über Erweiterungen, hier Metadatenelemente (MD_ExtendedElementInformation), die nicht in der ISO 19115 enthalten sind. Das folgende Regelwerk spezifiziert den Datentyp und Verpflichtungsgrad eines neuen Metadatenelements:

Wenn Dann MD_ExtendedElementInformation.dataType <>

"codelistElement" oder "enumeration" oder

"codeListeElement"

"obligaton",

"maximumOccurence",

"domainValue" mandatory MD_ExtendedElementInformation.dataType "domainCode" Element ist

(34)

"codelistElement" mandatory MD_ExtendedElementInformation.obligation =

"conditional"

"condition" Element ist mandatory

Tabelle 7: Datentyp und Verpflichtungsgrad eines neuen Metadatenelements

MD_ApplicationSchemaInformation: Informationen zur Erzeugerapplikation des Datensatzes.

EX_Extent: Beschreibt die räumliche (EX_GeographicExtent), zeitliche (EX_TemporalExtent) und vertikale Ausdehnung (EX_VerticalExtent) der referenzierten Entität. Es hat die optionalen Rollen "geographicElement",

"temporalElement", "verticalElement" und ein "description"-Element, von denen mindestens eines sinnvoll belegt sein soll.

CI_Citation: CI_Citation und CI_ResponsibleParty bildet ein Package. Sie enthalten Angaben über die Quelle der Ressource.

CI_ResponsibleParty: Enthält die Verantwortlichen (Name, Position, Organisation, Adresse) für die Ressource.

Die folgende Tabelle zeigt den Zusammenhang zwischen Packages und Entitäten:

Package Entität Metadata entity set information MD_Metadata

Identification information MD_Identification Constraint information MD_Constraints Data quality information DQ_DataQuality

Maintenance information MD_MaintenanceInformation Spatial representation information MD_SpatialRepresentation Reference system information MD_ReferenceSystem Content information MD_ContentInformation

Portrayal catalogue information MD_PortrayalCatalogueReference Distribution information MD_Distribution

Metadata extension information MD_MetadataExtensionInformation

(35)

Extent information EX_Extent Citation and responsible party

information

CI_Citation

CI_ResponsibleParty Tabelle 8: Packages und Entitäten in ISO 19115

Detaillierte Informationen zu den Packages finden sich im Annex A von ISO/FDIS 19115:2003(E).

Abbildung 12: Umfassendes Metadatenmodell der ISO 19115 Quelle: ISO/FDIS 19115:2003(E), Abschnitt: Template for comments and secretariat observations, Figure E.1 "Comprehensive dataset metadata profile", S. 67.

3.2.4.1 Core Metadata

Das bereits erwähnte Minimalset von Metadatenelementen dient dazu notwendige Informationen zur Identifikation des Datensatzes zu führen. Beantwortet werden die typischen W-Fragen. Die folgende Tabelle gibt Aufschluss über diese Elemente.

Einige sind obligatorisch (M), andere „empfohlen“(O) und weitere nur unter

(36)

Dataset title (M)

(MD_Metadata > MD_DataIdentification.citation >

CI_Citation.title)

Spatial representation type (O) (MD_Metadata >

MD_DataIdentification.spatialRepresentationType) Dataset reference date (M)

(MD_Metadata > MD_DataIdentification.citation >

CI_Citation.date)

Reference system (O)

(MD_Metadata > MD_ReferenceSystem)

Dataset responsible party (O)

(MD_Metadata > MD_DataIdentification.pointOfContact

>

CI_ResponsibleParty)

Lineage (O)

(MD_Metadata > DQ_DataQuality.lineage > LI_Lineage)

Geographic location of the dataset (by four coordinates or by geographic identifier) (C)

(MD_Metadata > MD_DataIdentification.extent >

EX_Extent

> EX_GeographicExtent > EX_GeographicBoundingBox or EX_GeographicDescription)

On-line resource (O) (MD_Metadata > MD_Distribution >

MD_DigitalTransferOption.onLine > CI_OnlineResource)

Dataset language (M)

(MD_Metadata > MD_DataIdentification.language)

Metadata file identifier (O) (MD_Metadata.fileIdentifier) Dataset character set (C)

(MD_Metadata > MD_DataIdentification.characterSet)

Metadata standard name (O) (MD_Metadata.metadataStandardName) Dataset topic category (M)

(MD_Metadata > MD_DataIdentification.topicCategory)

Metadata standard version (O) (MD_Metadata.metadataStandardVersion) Spatial resolution of the dataset (O)

(MD_Metadata >

MD_DataIdentification.spatialResolution >

MD_Resolution.equivalentScale or MD_Resolution.distance)

Metadata language (C) (MD_Metadata.language)

Abstract describing the dataset (M) (MD_Metadata > MD_DataIdentification.abstract)

Metadata character set (C) (MD_Metadata.characterSet) Distribution format (O)

(MD_Metadata > MD_Distribution > MD_Format.name and MD_Format.version)

Metadata point of contact (M) (MD_Metadata.contact > CI_ResponsibleParty)

Additional extent information for the dataset (vertical and temporal) (O) (MD_Metadata > MD_DataIdentification.extent >

EX_Extent > EX_TemporalExtent or EX_VerticalExtent)

Metadata date stamp (M) (MD_Metadata.dateStamp)

Tabelle 9: Kernmetadaten (Core Data) für gegrafische Datenmengen QUELLE: ISO/FDIS 19115:2003(E), S. 16.

3.2.4.2 Profile

Vor der Fragestellung, wie ein Katalogserver mit unterschiedlichen ISO-19115- konformen Profilen umgehen kann, erscheint es wichtig, den Prozess der Entstehung bzw. die Regeln für die Erstellung eines Profils und der Extension genauer zu

betrachten.

Der Begriff "unterschiedlich" bezieht sich im Kontext dieser Arbeit auf denjenigen Bereich eines Profils, der durch Erweiterung dem umfassenden Metadatenprofil (Comprehensive Metadata Profile) hinzugefügt werden kann. Dieser Bereich (in

(37)

Abbildung 11: die weiße Fläche im Profil) kann für jedes Profil anders aussehen.

Wie unterschiedlich sie sind, das gilt es zu untersuchen. Metadatenelemente im Erweiterungsbereich existieren unter Umständen in keinem anderen Profil und bilden für einen Katalogserver, der Metadaten zu einem unbekannten (aber ISO-konformen) Profil abzuarbeiten hat, eine mögliche Problemstelle. Da ISO 19115 lediglich eine abstrakte Definition der Metadaten darstellt, müssen für eine Untersuchung zusätzlich die Implementierungsvorgaben aus ISO 19139 berücksichtigt werden.

Annex C und F des ISO-19115-Standards geben detailliert Aufschluss darüber, was unter einer Erweiterung (Extension) zu verstehen ist und definieren das Vorgehen zur Erstellung eines (neuen) Profils. Auch werden Hinweise für diverse

Erweiterungsszenarien mit konkreten Lösungsvorschlägen gegeben.

Grösste Sorgfallt ist auf Redundanzfreiheit zu legen. Neue Erweiterungen müssen disjunkt zu bestehenden Metadatenelementen sein, d.h. es sollten keine „neuen“

Metadatenelemente definiert werden, die bereits im ISO 19115 enthalten sind.

Regeln für die Erstellung neuer Profile

- Der potentielle Ersteller eines neuen Profils soll bereits registrierte Profile prüfen.

- Bei der Erweiterung müssen die dafür definierten Regel des ISO-Standards eingehalten werden.

- Das neue Profil soll Namen, Definition und Datentyp eines (bestehenden) Metadatenelements nicht verändern.

- Das neue Profil muss die Kerndaten (Core Data, das minimales Metadatenmodell) enthalten.

- Das neue Profil muss alle mandatory Metadatenelemente aus allen mandatory Sektionen enthalten

- Das neue Profil muss alle an Bedingungen geknüpfte(conditional)

Metadatenelemente in allen mandatory-Sektionen enthalten, wenn der Datensatz die entsprechende Bedingung, die im Metadatenelement definiert ist, erfüllt.

- Das neue Profil muss alle mandatory-Metadatenelemente in allen conditional- Sektionen enhalten, wenn der Datensatz die entsprechende Bedingung, die in der Sektion definiert ist, erfüllt.

(38)

- Das neue Profil muss alle conditional-Metadatenelemente in allen conditional Sektionen, wenn der Datensatz die entsprechende Bedingung, die in der Sektion und im Metadatenelement definiert ist, erfüllt.

- Die Entitätsbeziehungen, die im Annex A des ISO-19115-Standards definiert sind, müssen eingehalten sein.

- Das Profil und seine Dokumentation muss jedem zugänglich gemacht werden, der Metadaten dieses Profils verwendet.

3.2.4.3 Erweiterungen (Extensions)

Im Sinne des Standards gibt es eine Reihe von mögliche Erweiterungsstrukturen, die als Extension einem Profil hinzugefügt werden können:

- Neue Sektion (eine oder mehrere logisch zusammengehörende Entitäten) - Neue Metadaten-Codelist. Ersetzt die Domain eines Metadatenelements, das als

Domainwert „freetext“ hat. Hiermit wird „freetext“ durch eine Liste vordefinierter Werte ersetzt und somit der Wertebereich eingeschränkt.

- Erweitern einer bestehender Codelist um neue Werte.

- Neues Metadatenelement - Neues Metadatenentität

- Erhöhung des Verpflichtungsgrad (obligation) eines existierenden Metadatenelements.

- Weitere Restriktion der Werte in der Codelist eines existierenden Metadatenelements.

Wie bereits bei der Erstellung von Profilen, gilt es auch hier, die bereits bestehenden Metadatenelemente auf ihre Eignung zu prüfen und ggf. zu verwenden. Für jede neue Sektion, jede Entität und jedes Metadatenelement muss folgendes spezifiziert

werden: Name, und/oder Element, Kurzname (shortname), Definition,

Verpflichtungsgrad (obligation), Bedingung (condition), maximales Vorkommen (maximum occurence), Datentyp, Domainwerte. Zusätzlich müssen folgende Regel beachtet werden:

- Ein neues Metadatenelement soll nicht verwendet werden, um Namen, Definition oder Datentyp eines bestehenden Elements zu ändern.

- Erlaubt sind neue Entitäten, wobei diese erweiterte oder bestehende

(39)

- In der Erweiterung dürfen bestehende Metadatenelemente im Verpflichtungsgrad strenger sein als im Standard vorgegeben.

- Metadatenelemente dürfen Domains haben, die restriktiver sind, als im Standard vorgegeben.

- Domainwerte dürfen weiter eingeschränkt sein als im Standard vorgegeben.

- Codelists dürfen weitere Werte hinzugefügt werden.

- Eine Erweiterung darf nichts erlauben, was der Standard verboten hat.

Die vorstehenden Angaben sind ISO/FDIS 19115:2003(E), Annex C, S. 105 entnommen.

4 Der Umgang mit Profilen

Nach den obigen Erläuterungen stellt sich der Kern des Problems, das hier untersucht werden soll, nun wie folgt dar. Katalogdienste stehen im Bereich Harvesting und Transaction von der Aufgabe, mit allen nur denkbaren individuellen Profilen umgehen zu müssen. Dabei sind die individuellen Profile im Voraus nicht konkret festgelegt, durch Annex F der ISO 19115 ist jedoch der Rahmen für die Erstellung ISO-konformer Profile abgesteckt. Der Katalogdienst kann sich also darauf

"verlassen", Metadaten in bestimmter Form zu bekommen. Es stellt sich nun konkret die Frage, ob eine weitere Harmonisierung der Profile notwendig ist oder ob die durch ISO 19115 gemachten Vorgaben bereits ausreichen, um Katalogdienste in die Lage zu versetzten mit beliebigen ISO-konformen individuellen Profilen umzugehen.

Die Abbildung 13: soll einen Eindruck von der Vielfältigkeit der individuellen Ausprägungen von Profilen geben. Die Profile sind dabei durch die dicke Umrandung gekennzeichnet.

(40)

Core ISO 19115

Core Core

Core ISO 19115

Profil 1 Profil 2 Profil 3

Profil 4

Profil 5 Core

Core ISO 19115

Profil

Core ISO 19115

Abbildung 13: Beispiele für Metadatenprofile

Profil 1 ist mit dem Core identisch. Es stellt das kleinste mögliche Profil dar.

Profil 2 besteht aus dem Core und es enthält zusätzlich einen Großteil der übrigen Metadaten des Profils ISO 19115.

Profil 3 setzt sich aus dem Core und weiteren Metadaten (in der Abbildung als orangefarbiger Kreis dargestellt) zusammen, die jedoch nicht Bestandteil der ISO 19115 sind. Das Profil 4 schließlich umfasst einen Teil der Metadaten der ISO 19115 und zusätzlich weitere Metadaten, die als weiße Fläche veranschaulicht sind.

Das Profil 5 schließlich besteht auf Profil 2 und zusätzlichen Metadaten, die durch die graue Fläche symbolisiert werden.

Alle Profile müssen den Kern enthalten. Profil 1 stellt gleichzeitig das kleinste ISO- konforme Profil dar.

(41)

Abbildung 14: Kleinstes ISO-konformes Profil

Darüber hinaus können die Profile einen Teil oder alle übrigen Entitäten des ISO 19115 enthalten, sie müssen es jedoch nicht. Abbildung 15: „ISO-19115-Kann- Bestandteile eines Profils“ verdeutlicht dies. Die dick umrandeten Bereiche der ISO 19115 stellen Kann-Bestandteile eines Profils dar. Die linke und mittlere Darstellung umfassen dabei nur einen Teil des ISO 19115, die rechte Darstellung umfasst die gesamten Entitäten des ISO 19115.

Abbildung 15: ISO-19115-Kann-Bestandteile eines Profils

Zudem können Profile noch über eine Extension verfügen. Diese sind im folgenden dargestellt und entsprechen den Extensions der Profilen aus Abbildung 13:

„Beispiele für Metadatenprofile“. Die unterschiedlichen Farben und Formen deuten die Unterschiedlichkeit der möglichen Extensions an.

Abbildung 16: Extensions von Profilen

Core

(42)

Die einfachste Möglichkeit, um mit dem Problem der unbekannten Entitäten eines Profils umzugehen, ist die Reduzierung eines jeden Profils auf den Core. Auch wenn die Einfachheit diese Ansatzes bestechend ist, so wird dadurch doch nicht den Anforderungen der Anwender und Profil-Ersteller Rechnung getragen. In der Praxis zeigt sich, dass geographische Metadaten nicht auf den Core des ISO 19115

beschränkt werden können. So erstellen Länder und Institutionen i.d.R. eigene ISO- konforme Profile, weil der Core nicht ausreichend ist. Die Reduktion auf den Core ist daher keine ernstzunehmende Option und kann bestenfalls eine temporäre

Zwischenlösung sein.

Ansatz 2: Anpassen der Anforderungen an das bestehende Metadatenmodell aus ISO 19115

Eine zweite Möglichkeit ist es, alle Entitäten als Objekte der Basisklasse zu behandeln. Auch diese Lösung reduziert die Komplexität stark und ignoriert die Unkenntnis über die tatsächliche Ausprägung von Entitäten einfach. Im Gegensatz zu Ansatz 1 wird mit diesem Ansatz also auf die individuellen Ausprägungen eines Profils durchaus Rücksicht genommen, da Entitäten, die über den Core hinausgehen, in die Betrachtung einbezogen werden. Allerdings wird die Individualität der

Entitäten selbst nicht zur Kenntnis genommen. Insofern ist dieser Ansatz besser als der erste, auch wenn er keine volle Individualität erlaubt.

Ansatz 3: Ausschöpfung der Möglichkeiten durch Extensions

Ein dritter Ansatz ist es, alle Entitäten als Objekte ihres wirklichen Typs zu behandeln. Dieser Ansatz nimmt in vollem Umfang auf die Individualität der Entitäten Rücksicht. Er ist der aufwändigste, aber auch beste Ansatz.

5 Untersuchung der Methodik zur Erstellung von Extensions 5.1 Methodik zur Erstellung einer Extension

Die im folgenden dargestellte Methodik ist dem Annex F der ISO/FDIS 19115:2003(E) entnommen.

Um sicherzustellen, dass durch die Erstellung einer Extension keine Redundanzen oder Inkonsistenzen im Datenmodell entstehen, schlägt der Standard ein neun- stufiges Verfahren vor, dasgarantiert, dass nur gültige Änderungen und somit ein ISO-19115-konforme Extensions, entstehen.

(43)

Die folgende Abbildung gibt einen Überblick über das Vorgehen bei der Erweiterung von Metadaten.

Stage 1 Durch-

sicht besteh-

ender Meta- daten- elemente

Stage 2 Sektion

Stage 9 Doku-

men- tation

Stage 8 Restrik- tion Stage 5 Element

Stage 3 Codelist

Stage 6 Entität

Stage 4 Element Codelist Stage 7 Verbind- lichkeit

neue Sektion

Domain-Einschränkung Domain-Erweiterung

höhere Verbindlickheit neue Codelist

neues Metadaten-

element neue

Entität

neues Metadatenelement

neue Entität

Abbildung 17: Methodik zur Erstellung einer Extension Stage 1 – Durchsicht der bestehenden Metadatenelemente

In der ersten Stufe sollen die bestehende ISO-Norm und bereits veröffentlichte Profile auf Wiederverwendbarkeit untersucht werden. Diese Untersuchung soll sich nicht nur auf Namen von Entitäten und Metadatenelementen beschränken, sondern sie soll Definition, Datentyp, Obligation, Domain und Maximum Number of Occurences berücksichtigen.

Nachdem diese Vorprüfung erfolgt ist und kein Element aus der Norm unverändert übernommen werden kann, muss unterschieden werden welche Art der Erweiterung vorzunehmen ist.

Erweiterung – Neu Aktion

Neue Sektion Stage 2

Neues Metadatenelement Stage 5

Neue Entität Stage 6

Tabelle 10: Extension – Einführung neuer Elemente

Referenzen

ÄHNLICHE DOKUMENTE

Cocoon Office enthält einen beträchtlichen Anteil von optischen Aufheller, die sich im Altpapier befinden, zusätzlich wird noch eine kleine Menge optischer Aufheller zugesetzt, um

Diese Europäische Norm muss den Status einer nationalen Norm erhalten, entweder durch Veröffentlichung eines identischen Textes oder durch Anerkennung bis September 2006, und

Durch den Parallelbetrieb bei Einführung des ISO 20022 Standards ergibt sich für alle Beteiligten im Prozess das Risiko, dass bei Verwendung einer bestimmten Methode Daten

Brandschutz- und Rauchabzugsklappen, Luft-Wasser- Systeme, Luftdurchlässe, Luftfilter, Volumenstrom- Regelgeräte, Schalldämpfer, Systemtechnik, zentrale und

EN ISO 15877, Kunststoff-Rohrleitungssysteme für die Warm- und Kaltwasserinstallation — Chloriertes Polyvinylchlorid (PVC-C) (ISO 15877:2003). Für Rohre und Formstücke, die vor

Diese Europäische Norm muss den Status einer nationalen Norm erhalten, entweder durch Veröffentlichung eines identischen Textes oder durch Anerkennung bis Mai 2004, und

Von den für das Elutionsverhalten relevanten Gesichtspunkten können nicht alle in einer einzelnen Norm berücksichtigt werden (siehe Beschreibung der Einflussfaktoren in Anhang

Dieses Dokument wurde vom Europäischen Komitee für Normung (CEN), dem Technischen Komitee CEN/TC 275 Lebensmittelanalytik — Horizontale Verfahren, in Zusammenarbeit mit