Enterprise Information Integration mit semantischen Technologien
Walter Waterfeld
Inhalt
Enterprise Information Integration (EII)
Semantische Technologien
Semantische Informations-Integration
Informationsbeschaffung
existierende manuell benötigt
Verkauf Support Management
Kunden
Informationsbeschaffung
Heterogene Datenquellen
Technische Heterogenität
Verschiedene Formate
Unvollständige Daten
Redundante Daten Verschiedene Bedeutung
Verschiedene Zugriffs-Systeme
Verschiedene BenutzerschnittstellenBisherige Technologien
EAI
Remote Aufruf
Prozess Automatisierung Keinerlei Integration von Daten ETL (Data warehouse)
Kopieren von Daten
Konsolidierungen Veraltete DatenEnterprise Information Integration (EII)
Direktzugriff
Integriertes
Informationsmodell
Abbildun g
Abbildun g
Abbildun g Modell
EII Nutzen
Einheitliche Sicht auf heterogene Information
Anreicherung Informationsmodell
Online Zugriff
Schnelle Reaktion auf Änderungen von
Informationsquellen
Nutzung von Information Keine Änderung bestehender Anwendungssysteme
Beispiel
Kundeninformation
Aggregiert aus allen relevanten Informationsquellen
Konsolidiert
Angepasst an einheitliche Terminologie
Angepasst an verschiedene InformationsnutzerKernfunktionalität: Semantik
Technische Integration nur 1. Schritt Zugriffsprotokolle
Formatkonvertierungen
Integration nur über Semantik verschiedene Terminologie
Z.B. Kundenbezeichner, KundenId, Kundenname, ..
verschiedene Datenmodellierung
Verschiedene Datentypen
Integriertes Informationsmodell Ausdruckstark
Flexibel
Ausführbar
Semantische Technologien
Semantic Web
Heutiges Web für Menschen
Vision machinenlesbares Web Durch Semantik
Semantische Annotation von Webseiten
Semantic Web Schichten
XML
Syntax ist nicht genug<Bestellung>
<Anzahl>300</Anzahl>
<Sorte>Schekel</Sorte>
</Bestellung>
Ontologie
Ursprünglich philosophische Disziplin
Lehre von Möglichkeiten und Bedingungen des Seienden Informatik
Explizite Spezifikation gemeinsamer Konzeptualisierung eines Anwendungsbereichs
Gemeinsames Vokabular
Gemeinsames VerständnisSemantische Ausdrucksfähigkeit
Tuple Set
subclassification Modellierungs-
konzepte Modellierungs-
sprachen
Relationen- modell
Taxonomien
narrower than
Thesaurus ERM subclass
UML Transitiv
Symmetrisch invers
Ontologie
OWL als Ontologiesprache
W3C Standard seit 2003
XML als Syntax
Bestandteile
Klassen
Property
IndividuenKlassen
Klasse: Menge von Individuen
Liste von Superklassen: Teilmenge von
Vordefinierte Klassen
Alle Individuen: owl:Thing
Leere Menge: owl:Nothing<owl:Class rdf:ID=“Person">
</owl:Class>
<owl:Class rdf:ID=“Kunde">
<rdfs:subClassOf rdf:resource=“Person"/>
<rdfs:subClassOf rdf:resource=“Firma"/>
</owl:Class>
Property
Beziehungen zwischen Klassen ObjectProperty: class x class
Eigenschaften für Klassen DatatypeProperty: class x datatype
Binäre Relation: domain x range Definition unabhängig von Klasse
<owl:ObjectProperty rdf:ID=“hatEigentümber">
<rdfs:domain rdf:resource=“Firma"/>
<rdfs:range rdf:resource=“Firma"/>
</owl:ObjectProperty>
<owl:DatatypeProperty rdf:ID=“verdient">
<rdfs:domain rdf:resource=“Region"/>
<rdfs:range rdf:resource=“xs:decimal"/>
Property Charakteristiken
Funktionale Property
Transitivität
Symmetrie
<owl:TransitiveProperty rdf:ID=“beteiligtAn">
<rdfs:domain rdf:resource=“Firma"/>
<rdfs:range rdf:resource=“Firma"/>
</owl:TransitiveProperty>
<owl:FunctionalProperty rdf:ID=“gehörtzu">
<rdfs:domain rdf:resource=“Kunde"/>
<rdfs:range rdf:resource=“Region"/>
</owl:FunctionalProperty>
Property Charakteristiken
Inverse Property<owl:ObjectProperty rdf:ID=“beteiligtAn">
<rdfs:domain rdf:resource=“Firma"/>
<rdfs:range rdf:resource=“Firma"/>
</owl:ObjectProperty>
<owl:ObjectProperty rdf:ID=“hatEigentümer">
<rowl:inverseOF rdf:resource=“beteiligtAn"/>
<rdfs:domain rdf:resource=“Firma"/>
<rdfs:range rdf:resource=“Firma"/>
</owl:ObjectProperty>
Klassen und Properties in OWL
Offenes Modell Nur gemachte Zusicherungen gelten
Keine Vollständigkeit
Beliebig ergänzbar, wenn kein Konflikt
Trennung Klassen und Properties Jeder kann alles über alles sagen
Globale Property Charakteristiken
Lokale Property Charakteristiken Property-Verwendung bei Klasse eingeschränkt
Lokale Property Restriktionen
allValuesFrom und someValuesFrom
maxCardinality und minCardinality<owl:Class rdf:ID=“Kunde">
<rdfs:subClassOf><owl:Restriction>
<owl:onProperty rdf:resource=“kauft”/>
<owl:allValuesFrom rdf:resource=“Produkt”/>
</owl:Restriction></rdfs:subClassOf>
</owl:Class>
<owl:Class rdf:ID=“Person">
<rdfs:subClassOf><owl:Restriction>
<owl:onProperty rdf:resource=“name”/>
<owl:minCardinality rdf:datatype=“xs:nonNegativeInteger”>1
</owl:minCardinality>
</owl:Restriction></rdfs:subClassOf>
Individuen
Instanzen von Klassen mit properties
Unterschied zu Werten von Datentypen
Identität als URI
unabhängig von Eigenschaften
<Firma rdf:ID=“Allianz“/>
<Firma rdf:ID=“DresdnerBank">
<hatEigentümer rdf:resource=“Allianz"/>
<name rdf:datatype=“xs:string”>Dresdner Bank</name>
</Koala>
Stufen von OWL
OWL basiert auf Beschreibungslogiken
Formale Definition durch Prädikatenlogik
Ableitung von impliziter Information möglich
Klassifizierung berechenbar: Klassenhierarchie
Zielkonflikt: Effiziens versus Ausdrucksmächtigkeit
OWL lite (bisher)
Einfach, effizient realisierbar
OWL DL
Hohe Ausdrucksmächtigkeit
gute Effiziens in praktischen Fällen
Entscheidbar, berechenbar
OWL Full
Höchste Ausdrucksmächtigkeit
Nicht effizient
Nicht immer entscheidbar und berechenbar
Klassenausdrücke (OWL DL)
intersectionOf und unionOf
complementOf
oneOf (Enumeration)
hasValue (lokale Property Einschränkung)
<owl:Class rdf:ID=“Abiturientinnen"><owl:intersectionOf>
<owl:Class rdf:about=“Personen“/>
<owl:Restriction>
<owl:onProperty rdf:resource=“schulabschluss”/>
<owl:hasValue rdf:resource=“Abitur”/>
</owl:Restriction>
<owl:Restriction>
<owl:onProperty rdf:resource=“geschlecht”/>
<owl:hasValue rdf:datatype=“xs:boolean”>weiblich
</owl:hasValue>
</owl:Restriction>
<owl:intersectionOf></owl:Class>
Klassencharakteristika (OWL DL)
disjointWith Nur so explizit typische disjunkte Subklassen-Modellierung
<owl:Class rdf:ID=“Kunden">
<owl:disjointWith rdf:resource=“Mitarbeiter“/>
</owl:Class>
OWL Full
Klassen als Individuen
DatatypeProperty Subklasse von ObjecttypeProperty
In OWL DL disjunktNutzbarkeit semantische Technologien
Noch nicht im Webmaßstab
Aber
Erste viel versprechende Anwendungen und Produkte
Kontinuierlich steigende auch kommerzielle Nutzung
Reif für Einsatz im begrenzten Rahmen Unternehmensweit
Ideal für Informations-IntegrationSemantische Informations-Integration
Ontologien als Integrationsmodell
Abbildung auf Modelle von Datenquellen
Erfordert Ontologie Regelsprache
Beginnende Standardisierung Zugriff auf Integrationsmodell
Ontologie Anfragesprache Teilmenge von Regelsprache
Alternative EII Realisierungen
Föderierte Datenbanken
Wenig Semantik
Starres Datenmodell Reine XML-basiertes EII
Wenig Semantik UML-basiertes EII
Starre GenerierungBeispiel Realisierung
Enterprise Information Integrator
EII Produkt Software AG
Nutzung semantische Technologie
Ontologie
Ontologie Regelsprache
Querysprache als Teilmenge Regelsprache Repository für Metadaten
Architektur
Enterprise Information Integrator
Semantic Server Repository
Mapping Ontologien Ausgeführte
Ontologien Web Service
Queries
Tamino WebDAV UDDI Query
Metadata User Security Laden
Studio
(Eclipse-basiert)
Verwendung Ontologien
Externe Sichten
XML-iesierte Ontologie Anfragen
Integrations Ontologie
Abbildung
Source Ontologie
Automatisch generiert
Externe Datenquellen
Source Onto-T
Tabellen Query1
XML ADA
Query2 Queryn
Source
Onto-W Source
Onto-X Source Onto-A
WSDL
Integrations Ontologie
Source Ontologie
Import Metadata
Abbildung Source Ontologien
Query Builder Deploy
Web Service
Integrator Studio Benutzer
Anwendung
Web Service
Semantic Server
Integrations Ontologie
Start End
Benutzung Enterprise Information
Integrator
Technische Infrastruktur
Enterprise Information Integrator
Komplett Java-basiert
Eclipse Entwicklungsumgebung
Integrator Studio als Menge von Eclipse Plugins Semantic Server
Java Ablauf-Umgebung Metadata Repository
XML-basiert
UDDI
WebdavBeispielanfrage implizites Wissen
Externe Datenquelle
Anfrage Beteiligungen Allianz
Name Eigentümer
DeutscheBörse DresdnerBank DresdnerBank Allianz