• Keine Ergebnisse gefunden

Enterprise Information Integrationmit semantischen Technologien

N/A
N/A
Protected

Academic year: 2022

Aktie "Enterprise Information Integrationmit semantischen Technologien"

Copied!
36
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Enterprise Information Integration mit semantischen Technologien

Walter Waterfeld

(2)

Inhalt

 Enterprise Information Integration (EII)

 Semantische Technologien

 Semantische Informations-Integration

(3)

Informationsbeschaffung

existierende manuell benötigt

Verkauf Support Management

Kunden

(4)

Informationsbeschaffung

 Heterogene Datenquellen

 Technische Heterogenität

Verschiedene Formate

Unvollständige Daten

Redundante Daten

 Verschiedene Bedeutung

 Verschiedene Zugriffs-Systeme

Verschiedene Benutzerschnittstellen

(5)

Bisherige Technologien

EAI

Remote Aufruf

Prozess Automatisierung Keinerlei Integration von Daten

 ETL (Data warehouse)

Kopieren von Daten

Konsolidierungen Veraltete Daten

(6)

Enterprise Information Integration (EII)

 Direktzugriff

 Integriertes

Informationsmodell

Abbildun g

Abbildun g

Abbildun g Modell

(7)

EII Nutzen

 Einheitliche Sicht auf heterogene Information

 Anreicherung Informationsmodell

 Online Zugriff

 Schnelle Reaktion auf Änderungen von

Informationsquellen

Nutzung von Information

 Keine Änderung bestehender Anwendungssysteme

(8)

Beispiel

 Kundeninformation

Aggregiert aus allen relevanten Informationsquellen

Konsolidiert

Angepasst an einheitliche Terminologie

Angepasst an verschiedene Informationsnutzer

(9)

Kernfunktionalität: Semantik

Technische Integration nur 1. Schritt

Zugriffsprotokolle

Formatkonvertierungen

Integration nur über Semantik

verschiedene Terminologie

Z.B. Kundenbezeichner, KundenId, Kundenname, ..

verschiedene Datenmodellierung

Verschiedene Datentypen

Integriertes Informationsmodell

Ausdruckstark

Flexibel

Ausführbar

(10)

Semantische Technologien

 Semantic Web

Heutiges Web für Menschen

Vision machinenlesbares Web

Durch Semantik

Semantische Annotation von Webseiten

(11)

Semantic Web Schichten

(12)

XML

Syntax ist nicht genug

<Bestellung>

<Anzahl>300</Anzahl>

<Sorte>Schekel</Sorte>

</Bestellung>

(13)

Ontologie

 Ursprünglich philosophische Disziplin

Lehre von Möglichkeiten und Bedingungen des Seienden

Informatik

Explizite Spezifikation gemeinsamer Konzeptualisierung eines Anwendungsbereichs

Gemeinsames Vokabular

Gemeinsames Verständnis

(14)

Semantische Ausdrucksfähigkeit

Tuple Set

subclassification Modellierungs-

konzepte Modellierungs-

sprachen

Relationen- modell

Taxonomien

narrower than

Thesaurus ERM subclass

UML Transitiv

Symmetrisch invers

Ontologie

(15)

OWL als Ontologiesprache

 W3C Standard seit 2003

 XML als Syntax

 Bestandteile

Klassen

Property

Individuen

(16)

Klassen

 Klasse: Menge von Individuen

 Liste von Superklassen: Teilmenge von

 Vordefinierte Klassen

Alle Individuen: owl:Thing

Leere Menge: owl:Nothing

<owl:Class rdf:ID=“Person">

</owl:Class>

<owl:Class rdf:ID=“Kunde">

<rdfs:subClassOf rdf:resource=“Person"/>

<rdfs:subClassOf rdf:resource=“Firma"/>

</owl:Class>

(17)

Property

Beziehungen zwischen Klassen

ObjectProperty: class x class

Eigenschaften für Klassen

DatatypeProperty: class x datatype

Binäre Relation: domain x range

Definition unabhängig von Klasse

<owl:ObjectProperty rdf:ID=“hatEigentümber">

<rdfs:domain rdf:resource=“Firma"/>

<rdfs:range rdf:resource=“Firma"/>

</owl:ObjectProperty>

<owl:DatatypeProperty rdf:ID=“verdient">

<rdfs:domain rdf:resource=“Region"/>

<rdfs:range rdf:resource=“xs:decimal"/>

(18)

Property Charakteristiken

Funktionale Property

Transitivität

Symmetrie

<owl:TransitiveProperty rdf:ID=“beteiligtAn">

<rdfs:domain rdf:resource=“Firma"/>

<rdfs:range rdf:resource=“Firma"/>

</owl:TransitiveProperty>

<owl:FunctionalProperty rdf:ID=“gehörtzu">

<rdfs:domain rdf:resource=“Kunde"/>

<rdfs:range rdf:resource=“Region"/>

</owl:FunctionalProperty>

(19)

Property Charakteristiken

Inverse Property

<owl:ObjectProperty rdf:ID=“beteiligtAn">

<rdfs:domain rdf:resource=“Firma"/>

<rdfs:range rdf:resource=“Firma"/>

</owl:ObjectProperty>

<owl:ObjectProperty rdf:ID=“hatEigentümer">

<rowl:inverseOF rdf:resource=“beteiligtAn"/>

<rdfs:domain rdf:resource=“Firma"/>

<rdfs:range rdf:resource=“Firma"/>

</owl:ObjectProperty>

(20)

Klassen und Properties in OWL

Offenes Modell

Nur gemachte Zusicherungen gelten

Keine Vollständigkeit

Beliebig ergänzbar, wenn kein Konflikt

Trennung Klassen und Properties

Jeder kann alles über alles sagen

Globale Property Charakteristiken

Lokale Property Charakteristiken

Property-Verwendung bei Klasse eingeschränkt

(21)

Lokale Property Restriktionen

allValuesFrom und someValuesFrom

maxCardinality und minCardinality

<owl:Class rdf:ID=“Kunde">

<rdfs:subClassOf><owl:Restriction>

<owl:onProperty rdf:resource=“kauft”/>

<owl:allValuesFrom rdf:resource=“Produkt”/>

</owl:Restriction></rdfs:subClassOf>

</owl:Class>

<owl:Class rdf:ID=“Person">

<rdfs:subClassOf><owl:Restriction>

<owl:onProperty rdf:resource=“name”/>

<owl:minCardinality rdf:datatype=“xs:nonNegativeInteger”>1

</owl:minCardinality>

</owl:Restriction></rdfs:subClassOf>

(22)

Individuen

Instanzen von Klassen

mit properties

Unterschied zu Werten von Datentypen

Identität als URI

unabhängig von Eigenschaften

<Firma rdf:ID=“Allianz“/>

<Firma rdf:ID=“DresdnerBank">

<hatEigentümer rdf:resource=“Allianz"/>

<name rdf:datatype=“xs:string”>Dresdner Bank</name>

</Koala>

(23)

Stufen von OWL

OWL basiert auf Beschreibungslogiken

Formale Definition durch Prädikatenlogik

Ableitung von impliziter Information möglich

Klassifizierung berechenbar: Klassenhierarchie

Zielkonflikt: Effiziens versus Ausdrucksmächtigkeit

OWL lite (bisher)

Einfach, effizient realisierbar

OWL DL

Hohe Ausdrucksmächtigkeit

gute Effiziens in praktischen Fällen

Entscheidbar, berechenbar

OWL Full

Höchste Ausdrucksmächtigkeit

Nicht effizient

Nicht immer entscheidbar und berechenbar

(24)

Klassenausdrücke (OWL DL)

intersectionOf und unionOf

complementOf

oneOf (Enumeration)

hasValue (lokale Property Einschränkung)

<owl:Class rdf:ID=“Abiturientinnen"><owl:intersectionOf>

<owl:Class rdf:about=“Personen“/>

<owl:Restriction>

<owl:onProperty rdf:resource=“schulabschluss”/>

<owl:hasValue rdf:resource=“Abitur”/>

</owl:Restriction>

<owl:Restriction>

<owl:onProperty rdf:resource=“geschlecht”/>

<owl:hasValue rdf:datatype=“xs:boolean”>weiblich

</owl:hasValue>

</owl:Restriction>

<owl:intersectionOf></owl:Class>

(25)

Klassencharakteristika (OWL DL)

disjointWith

Nur so explizit typische disjunkte Subklassen-Modellierung

<owl:Class rdf:ID=“Kunden">

<owl:disjointWith rdf:resource=“Mitarbeiter“/>

</owl:Class>

(26)

OWL Full

 Klassen als Individuen

 DatatypeProperty Subklasse von ObjecttypeProperty

In OWL DL disjunkt

(27)

Nutzbarkeit semantische Technologien

 Noch nicht im Webmaßstab

Aber

Erste viel versprechende Anwendungen und Produkte

Kontinuierlich steigende auch kommerzielle Nutzung

Reif für Einsatz im begrenzten Rahmen

Unternehmensweit

Ideal für Informations-Integration

(28)

Semantische Informations-Integration

 Ontologien als Integrationsmodell

 Abbildung auf Modelle von Datenquellen

Erfordert Ontologie Regelsprache

Beginnende Standardisierung

 Zugriff auf Integrationsmodell

Ontologie Anfragesprache

Teilmenge von Regelsprache

(29)

Alternative EII Realisierungen

 Föderierte Datenbanken

Wenig Semantik

Starres Datenmodell

 Reine XML-basiertes EII

Wenig Semantik

 UML-basiertes EII

Starre Generierung

(30)

Beispiel Realisierung

Enterprise Information Integrator

 EII Produkt Software AG

 Nutzung semantische Technologie

Ontologie

Ontologie Regelsprache

Querysprache als Teilmenge Regelsprache

 Repository für Metadaten

(31)

Architektur

Enterprise Information Integrator

Semantic Server Repository

Mapping Ontologien Ausgeführte

Ontologien Web Service

Queries

Tamino WebDAV UDDI Query

Metadata User Security Laden

Studio

(Eclipse-basiert)

(32)

Verwendung Ontologien

Externe Sichten

XML-iesierte Ontologie Anfragen

Integrations Ontologie

Abbildung

Source Ontologie

Automatisch generiert

Externe Datenquellen

Source Onto-T

Tabellen Query1

XML ADA

Query2 Queryn

Source

Onto-W Source

Onto-X Source Onto-A

WSDL

Integrations Ontologie

(33)

Source Ontologie

Import Metadata

Abbildung Source Ontologien

Query Builder Deploy

Web Service

Integrator Studio Benutzer

Anwendung

Web Service

Semantic Server

Integrations Ontologie

Start End

Benutzung Enterprise Information

Integrator

(34)

Technische Infrastruktur

Enterprise Information Integrator

 Komplett Java-basiert

 Eclipse Entwicklungsumgebung

Integrator Studio als Menge von Eclipse Plugins

 Semantic Server

Java Ablauf-Umgebung

 Metadata Repository

XML-basiert

UDDI

Webdav

(35)

Beispielanfrage implizites Wissen

Externe Datenquelle

Anfrage

Beteiligungen Allianz

Name Eigentümer

DeutscheBörse DresdnerBank DresdnerBank Allianz

(36)

Vorteile semantische Integration

 Semantik durch Ontologien

Ausdrucksstark

Erweiterbare Semantik

Lose Kopplung an Modelle von heterogenen Datenquellen

 Modellieren statt programmieren

Ontologien als ausführbares Modell

Referenzen

ÄHNLICHE DOKUMENTE

[r]

[r]

[r]

[r]

rdf:Property rdf:Property rdf:Property rdfs:Resource rdfs:Resource rdf:type The subject is an instance of a class. rdfs:subClassOf The subject is a subclass of

Reifikation: Modellieren mehrerer Description-Elemente durch bag für das Zusammenfassen mehrerer Statements (statement

(a) Ihre Laborrechner für das Interface /dev/eth1 über den Rou- ter RNS1 und für die Protokoll IPv4 und IPv6 kommunikations- fähig machen. (b) Einsatztests sowohl über die

(a) Ihre Laborrechner für das Interface /dev/eth1, über den Router RNS1 und für die Protokoll IPv4 und IPv6 kommunika- tionsfähig machen. (b) Einsatztests sowohl über die