• Keine Ergebnisse gefunden

Zusammenführung der konzeptuellen Modelle für operative und analytische Daten in einem logischen Modell, dargestellt am Beispiel des Precision Dairy Farming

N/A
N/A
Protected

Academic year: 2021

Aktie "Zusammenführung der konzeptuellen Modelle für operative und analytische Daten in einem logischen Modell, dargestellt am Beispiel des Precision Dairy Farming"

Copied!
4
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Zusammenführung der konzeptuellen Modelle für operative und analytische Daten in einem logischen Modell,

dargestellt am Beispiel des Precision Dairy Farming

Christian Schulze1, Joachim Spilke1, Wolfgang Lehner 2

1 Arbeitsgruppe Biometrie und Agrarinformatik Martin-Luther-Universität Halle-Wittenberg

Ludwig-Wucherer-Str. 82-85 06108 Halle

2 Lehrstuhl für Datenbanken Institut für Systemarchitektur Technische Universität Dresden

01062 Dresden

christian.schulze@landw.uni-halle.de joachim.spilke@landw.uni-halle.de

lehner@inf.tu-dresden.de

Abstract: Die als Ergebnis der konzeptuellen Datenmodellierung im Rahmen des Precision Dairy Farming vorliegenden getrennten Modelle für operative und ana- lytische Daten sind in ein logisches Modell zu überführen. Wir propagieren dabei den Entwurf eines gemeinsamen relationalen Modells für beide Datensichten. Nur so kann Redundanz und Inkonsistenz auf Modell- und Datenebene vermieden wer- den. Anhand eines Beispiels wird die Vorgehensweise erläutert.

1 Motivation

Grundlage der Konzepte des Precision Agriculture ist ein angepasstes Informationsma- nagement, bei dessen praktischer Umsetzung der Datenmodellierung eine Schlüsselrolle zukommt. Hierbei liegt ein besonderes Interesse in der Unterstützung einerseits kurz- fristiger (operativer) und andererseits strategischer (analytischer) Entscheidungsprozesse durch konsistente Datenspeicherung und einer zeitkritischen Datenbereitstellung. Beide Nutzungsarten münden in getrennten Datensichten, die entsprechend im Modellierungs- prozess zu berücksichtigen sind. An einem Beispiel des Precision Dairy Farming (PDF) wird im vorliegenden Beitrag der logische Datenbankentwurf sowohl für die operative als auch für die analytische Datensicht ausgehend von entsprechend getrennten konzep- tuellen Datenmodellen [SSL05] hin zu einem gemeinsamen relationalen Modell gezeigt.

Die Allgemeingültigkeit der getroffenen Aussagen sichert die Anwendbarkeit über das PDF und Precision Agriculture hinaus.

257

(2)

2 Konzeptuelle Modellierung

Im Ergebnis der konzeptuellen Datenmodellierung im Rahmen des PDF liegen zwei getrennte Datenmodelle, zum einen für eine operative und zum anderen für eine analy- tische Datensichtweise vor [SSL05]. Der operativen Datenmodellierung kommt die Aufgabe der Abbildung atomarer Daten zu, während im Rahmen der analyseorientierten Datenmodellierung neben atomaren Daten und Datenaggregationen auch Analyse- strukturen im Sinne möglicher Wege der Auswertung für den Anwender abgebildet werden müssen. Entsprechend nutzen wir für die Modellierung operativer Daten das Entity-Relationship-Modell (E/RM) [EN03] und für die Abbildung einer analyseorien- tierter Sicht das multidimensionale Entity-Relationship-Modell (mE/RM) [Sa98] mit von uns als notwendig erachteten Erweiterungen [SSL05]. Abbildung 1 stellt beispielhaft Krankheitsbehandlungen an Kühen bzw. Eutervierteln als E/RM dar. Die Behandlung ist über Beziehungstypen zwischen den Entitätstypen „Zeitpunkt“, „Person“, „Krankheits- diagnose“ und „Euterviertel“ bzw. „Kuh“ modelliert. Zur Vereinfachung wurden weitere Sachverhalte (bspw. Medikamentengaben) vernachlässigt. Dieses E/RM bildet den de- taillierten Sachkontext für operative Aufgaben ab. Abbildung 2 zeigt eine analyseorien- tierte Sicht auf den gleichen Kontext, modelliert mit dem von uns erweiterten mE/RM.

Statt der detaillierten Unterscheidung in Tier- und Euterviertelbehandlung ist in der analyseorientierten Sicht die konsolidierte Betrachtung von Behandlungen auf ein Tier inklusive Euterviertelbehandlungen von Interesse.

Zeitpunkt Kuh

0,4

Tiergruppe Kuh in Gruppe

1,n 0,n

Tierbe - handlung

Person Krankheits -

diagnose Krankheits -

gruppe

gruppiert 0,n

1,1

0,n0,n

0,n

0,n 0,n

0,n

Euterviertel- behandlung

0,n

0,n

0,n 0,n

Haltungssystem Melksystem

1,1

Euterviertel hat

Abbildung 1: E/RM für Tierbehandlungen

Kuh Tiergruppe

Monat Krankheits-

diagnose Krankheits-

gruppe

Aggregationstyp:flow

Metrik:SELECT kuh_nr, diagnose, monat, sum(anzahl_behandlungen) AS anzahl_behandlungen FROM (SELECT tierbehandlung.kuh_nr AS kuh_nr, tierbehandlung.diagnose AS diagnose, (date_part('year', tierbehandlung.zeitpunkt)|| '-' || date_part('month', tierbehandlung.zeitpunkt)) AS monat, count(tierbehandlung.*) AS anzahl_behandlungen FROM tierbehandlung GROUP BY tierbehandlung.kuh_nr, tierbehandlung.diagnose, monat

UNION SELECT euterviertelbehandlung.kuh_nr AS kuh_nr, euterviertelbehandlung.diagnose AS diagnose, (date_part('year', euterviertelbehandlung.zeitpunkt)||

'-' || date_part('month', euterviertelbehandlung.zeitpunkt)) AS monat, count(euterviertelbehandlung.*) AS anzahl_behandlungen FROM euterviertelbehandlung GROUP BY euterviertelbehandlung.kuh_nr, euterviertelbehandlung.diagnose, monat) AS behandlung_union

GROUP BY kuh_nr, diagnose, monat;

Beschreibung:Anzahl der Krankheitsbehandlungen je Tier und Monat Maßeinheit:Monat-1

Haltungssystem Melksystem

t

Jahr Behandlung

Anzahl_Be- handlungen

Abbildung 2: Erweitertes mE/RM für Tierbehandlungen

258

(3)

Analysegegenstand ist die Anzahl der Behandlungen je Kuh, Monat und Krankheit, modelliert als Kennzahl der Faktbeziehung Tierbehandlungen. Die eindeutige Definition der Kennzahl erfolgt über ein entsprechendes Eigenschaftsfenster. Mögliche Auswerte- pfade sind über Klassifikationsstufen und ihre Beziehungen mit entsprechender Kenn- zeichnung temporaler Restriktionen dargestellt. Damit bildet das erweiterte mE/RM den Sachkontext in einer analyseorientierten Sichtweise ab.

3 Relationale Modellierung

Zweiter Schritt im Datenbankentwurfsprozess ist die Transformation der konzeptuellen Datenmodelle in ein logisches, in unserem Fall relationales Modell [EN03]. Bisherige Anwendungen gehen von einer strikten Trennung der operativen und analytischen An- sätze aus. Bei Betrachtung beider konzeptueller Modelle fällt jedoch eine Vielzahl struk- tureller Gemeinsamkeiten auf. Wir propagieren deshalb eine Zusammenführung beider Datensichten in einem gemeinsamen relationalen Datenmodell. Die Transformation konzeptueller Notationselemente, sowohl des E/RM als auch des mE/RM, in das relatio- nale Modell erfolgt anhand weitestgehend standardisierter Transformationsregeln [EN03, GB01]. Für die relationale Umsetzung der von uns neu eingeführten Notations- elemente sei aus Platzgründen auf [SSL05b] verwiesen. Ergebnis der gemeinsamen relationalen Umsetzung beider konzeptueller Modelle ist ein relationales Modell mit detaillierter Grundstruktur, entsprechend den Anforderungen des operativen Modells und zusätzlichen relationalen Konstrukten zur Abbildung der analyseorientierten Sichtweise (Abb. 3). Die Entitäts- und Beziehungstypen des operativen Modells werden in ent- sprechende Relationen überführt. Darauf aufbauend sind für eine adäquate Abbildung der analytischen Sicht fehlende relationale Konstrukte zu definieren, so dass Redundanz und Inkonsistenz durch beiderseitige Nutzung identischer Modellteile vermieden wird.

Das Attribut „Zeitpunkt“ wird als Datentyp „timestamp“ (Datum + Zeit) modelliert, so dass die Klassifikationsstufen „Monat“ und „Jahr“ lediglich als Sicht auf die Relation

„Zeitpunkt“ angelegt werden müssen. Um den bei der Transformation semantikreicher multidimensionaler Notationselemente in das semantikarme Relationenmodell zwangs- läufig auftretenden Informationsverlust zu vermeiden, muss parallel zum Datenmodell ein Metamodell implementiert werden. Nur so können Meta-Informationen zu Analyse- gegenstand und Analysestrukturen bewahrt werden.

4 Zusammenfassung und Ausblick

Die dem PDF inhärente duale Datennutzung für operative und analytische Aufgaben hat entsprechend in der Datenmodellierung Beachtung zu finden. Die damit im Ergebnis des konzeptuellen Datenbankentwurfs vorliegenden getrennten Datenmodelle sollten jedoch im logischen Entwurfsschritt zu einem gemeinsamen Modell zusammen geführt werden.

Nur so ist Redundanz und Inkonsistenz auf Modell- und damit auch auf Datenebene zu vermeiden. Bei der physischen Implementierung des Modells muss jedoch in Abhängig- keit von Datenbankmanagementsystem, Datenvolumen und Nutzungsverhalten eine Entscheidung über die Art der Umsetzung der zusätzlichen analytischen Modellteile z.B.

259

(4)

in Sichten, materialisierte Sichten oder partitionierte Tabellen erfolgen.

Euterviertel PK Euterviertel PK,FK1 Kuh_Nr

Kuh PK Kuh_Nr

Tiergruppe PK Gruppenname

Haltungssystem Melksystem

Tierbehandlung PK,FK1 Kuh_Nr PK,FK3 Zeitpunkt PK,FK2 Diagnose

FK4 Person

Zeitpunkt PK Zeitpunkt

Kuh_in_Gruppe PK,FK4 Kuh_Nr PK,FK1 Gruppenname PK,FK2 gültig_von FK3 gültig_bis

Euterviertelbehandlung PK,FK1 Euterviertel PK,FK1 Kuh_Nr PK,FK3 Zeitpunkt PK,FK4 Diagnose

FK2 Person

Person PK Name_Person Krankheitsdiagnose

PK Krankheistdiagnose FK1 Krankheitsgruppe

Krankheitsgruppe PK Krankheitsgruppe

Name der Relation

PK – Primärschlüssel (primary key) FK – Fremdschlüssel (foreign key) Fremdschlüssel-

beziehung Relation

Legende:

Behandlung PK,FK2 Kuh_Nr PK,FK1 Diagnosis

PK Monat

Anzahl_Behandlungen Analytischer Teil

Operativer Teil

Zeit-Dimension PK,FK1 Zeitpunkt

Monat Jahr

Abbildung 3: Relationales Modell für Tierbehandlungen

Danksagung

Dieses Projekt wird durch die Deutsche Forschungsgemeinschaft (DFG) gefördert.

Literaturverzeichnis

[EN03] Elmasri, R., Navathe, S.B.: Grundlagen von Datenbanksystemen. 3. Pearson-Studium, München, 2003.

[GB01] Günzel, H., Bauer, A.: Data-Warehouse-Systeme. dpunkt, Heidelberg, 2001.

[Sa98] Sapia, C., Blaschka, M., Höfling, G., Dinter, B.: Extending the E/R Model for the multi- dimensional paradigm. In: Proceedings of the 1st Intl. Workshop on Data Warehouse and Data Mining (DWDM'98), LNCS, 1552, Springer, 1998; S. 105-116.

[SSL05a] Schulze, C.; Spilke, J.; Lehner, W.: Hybred modeling of operational and analytical data at Precision Dairy Farming. In: Tagungsband EFITA/WCCA2005, 25.-27.07.2005, U- niv. de Trás-os-Montes e Alto Douro, Vila Real, Portugal, 2005; S. 960-965.

[SSL05b] Schulze, C.; Spilke, J.; Lehner, W.: Data Modeling for Precision Dairy Farming within the Competitive Field of Operational and Analytical Tasks. Computers and Electronics in Agriculture, 2005 (eingereicht).

260

Abbildung

Abbildung 1: E/RM für Tierbehandlungen
Abbildung 3: Relationales Modell für Tierbehandlungen

Referenzen

ÄHNLICHE DOKUMENTE

Für das premis soll zunächst eine eigene Schnittstelle spezifiziert werden, die den Datenaustausch mit anderen Systemen auch im Hin- blick auf Application Services ermöglicht und

Um die oben genannten Nachteile zu kompensieren wurde am Lehrstuhl für Geographie und geographische Fernerkundung der Universität München das Abbildende

Tab.: 9. Berechnung der Wirtschaftlichkeitsschwelle für einen spezialisierten Getreidebaubetrieb Quelle: KTBL, 2006.. Legt man diese Tabelle zugrunde, so entsteht bei einem 100

Mit dem Schwerpunkt einer verbesserten Modellierung wird eine annotationsbasierte Prozessmodellierung vorgeschlagen (Regelsprachraum für die annotationsbasierte Prozessmodellierung

Der konsequente Einsatz einer serviceorientierten Architektur bringt jedoch nicht nur Vorteile mit sich, sondern verursacht auch einen erheblichen organi- satorischen Aufwand..

Im vorliegenden Artikel wird ein Ansatz f¨ur den PDF-Bereich pr¨asentiert, wie diese Regeln auf Basis der SBVR und mit Hilfe des RuleSpeak-Ansatzes ausgedr¨uckt werden k¨onnen..

Allein die aktuell zur Verfügung stehenden Spezifikationen für WMS und WFS und daraus resultierende (mögliche) stabile Zugriff auf entsprechende Geodatendienste bieten den land-

Die Liste solcher Fragestellungen k¨onnte fast beliebig fortgesetzt wer- den. Bemerkenswert ist vor allem, dass es keine allgemeine Prozesskonzep- tion gibt, die sich gleichermaßen