• Keine Ergebnisse gefunden

Materialisierte Sichten

N/A
N/A
Protected

Academic year: 2022

Aktie "Materialisierte Sichten"

Copied!
32
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Materialisierte Sichten

Seminar Business Intelligence - Teil I:

OLAP & Data Warehousing

Sebastian Benz

25.07.2003

(2)

Gliederung

1.

Materialisierte Sichten

- Prinzip und Anwendung

2.

Auswahl zu materialisierender Sichten

- Statische vs. Dynamische Auswahl 3.

Aktualisierung

- Inkrementelle Aktualisierung 4.

Konsistenz

- Aspekte und Konzepte 5.

Zusammenfassung

(3)

{ Hauptzweck von OLAP Analyse von Daten

Æ hauptsächlich lesender Zugriff

{ Sehr große Datenmengen

Æ aufwändige Anfrageauswertung

{ Oft Aggregationsanfragen

Æ kleinere Anfrageergebnisse

Æ möglichst gute Anfrage- und Antwortperformanz nötig

Æ häufig benutze Anfragen im Data-Warehouse materialisieren

Æ materialisierte Sichten (MS)

Motivation

(4)

Quelle1 Quelle2 Quelle3 Quellen:

Quellrelationen Data-Warehouse:

materialisierte Sichten

Basisrelationen

R S T U

R S T U

R S R S T T U

Anfragen: R JOIN S = ? R JOIN S JOIN T = ?

Materialisierte Sichten

(5)

Vorausetzungen :

o Transparente Nutzung der MS

o Neue Anfrage ist gültige Ersetzung der alten Anfrage

o Additivität der Aggregationsfunktionen Änderung der Anfrage mit Hilfe von

Kompensationsoperationen, so dass sie eine materialisierte Sicht nutzen kann

Æ Beispielverfahren: “verallgemeinerte Projektion“

Anfrageumformulierung

(6)

Anfrage Q

σ

Fact Geschäfte

Produkte Jahr, ArtikelNr

Verkäufe

γ

Verkäufe ArtikelNr

Materialisierte Sicht M

γ

Fact

Geschäfte

Summe von Attribut Gruppierung

Join

Auswahl nach Prädikat

γ

σ P

Beispiel für Nutzung der MS

ArtikelNr GeschäftsNr

GeschäftsNr

σ σ σ

Jahr≥“1991“ Bezirk=“Pfalz“

Bezirk=“Pfalz“

Materialisierte Sicht M

Jahr≥“1991“

(7)

Gliederung

1.

Materialisierte Sichten

- Prinzip und Anwendung

2.

Auswahl zu materialisierender Sichten

- Statische vs. Dynamische Auswahl 3.

Aktualisierung

- Inkrementelle Aktualisierung 4.

Konsistenz

- Aspekte und Konzepte 5.

Zusammenfassung

(8)

{ Jeder Knoten mögliche

materialisierte Sicht

{ Für n

Gruppierungs- attribute 2n Möglichkeiten

{ Welche

auswählen?

(Region) (Gruppe) (Monat)

( )

(Monat,Region) (Monat,Gruppe) (Region,Gruppe)

(Monat,Region,Gruppe)

Aggregationsgitter

(9)

{ Anlegen der materialisierten Sichten an einem bestimmten Zeitpunkt von

Algorithmus oder Administrator

{ Algorithmus nach Greedy Prinzip

Æ für jeden Knoten Nutzen feststellen Æ Knoten mit größtem Nutzen

materialisieren

Æ solange bis max. Speicherplatz belegt Æ liefert Menge an zu materialisierenden

Sichten mit dem größten Nutzen

Statische Auswahl

(10)

Beispielalgorithmus:

[Harinarayan, Rajaraman, Ullman]

{ Eingabe:

ƒ Menge aller Gitterknoten N

ƒ maximaler Speichermehraufwand S

ƒ erwarteter Speicheraufwand |n| bei Materialisierung von Knoten n

{ Ausgabe:

ƒ Menge aller zu materialisierenden

ƒ Knoten

Statische Auswahl

(11)

(A2)900 (A1)980

95%

0%

(A2)9900 (A1)9980

( )

(A1,A2)18000 (A1,A3)16028 (A2,A3)7348

(A1,A2,A3)

Statische Auswahl

Kandidatenmenge:

0.{(A1,A2,A3)}

1.{(A1,A2,A3),(A1,A2)}

2.{(A1,A2,A3),(A1,A2),(A3)}

3.{(A1,A2,A3),(A1,A2), (A3),(A1,A3)}

4.{(A1,A2,A3),(A1,A2), (A3),(A1,A3),(A2,A3)}

Verwendeter zusätzlicher Speicher (max. 70%):

10%

(A1,A3)8014

(A1,A2) (A2,A3)3674

12%

(A3)9800 (A3)(A3)9800

(A1,A3)4007 (A2,A3)1837

32%

(A1,A3) (A2,A3)1837

(12)

{ Aufwändig mit Komplexität von O(n³)

Æ Optimierungen möglich

ƒ Nutzung von funktionalen Abhängigkeiten

ƒ Untere Schranke für Verdichtungsfaktor

ƒ Nur Auswahl von Knoten, deren Attribute in Anfragen aufgetreten sind

{ Nachteile:

ƒ Keine Erkennung von Anfragemustern

ƒ Schnelle Alterung bei häufiger Aktualisierung

ƒ Keine Anpassung an wechselnde Anfragemuster

ƒ Keine Anfragebearbeitung möglich während Auswahl läuft

Æ Dynamische Auswahl

Bewertung

(13)

Entscheidung welche Sichten materialisiert werden ist vom aktuellen Anfrageverhalten abhängig

Vorteile:

{ Unterstützung von OLAP-Anwendungen (Bsp. Roll-up-Operation)

{ Anfrageergebnisse oft klein

Æ Große Beschleunigung der Auswertung mit wenig Speicherplatzverbrauch

Dynamische Auswahl

(14)

{ Pufferung von Anfrageergebnissen anhand Semantik und Zusammenhang

{ Speicherung in Hauptspeicher oder Festplatte

Æ Beschleunigung hauptsächlich durch schnelle Ermittlung der Ergebnismenge

{ Speicherplatz beschränkt

Æ Verdrängungsverfahren für bestehende Sichten notwendig

Semantisches Caching

(15)

Verdrängungskriterien:

{ Zeit des letzten Zugriffs

{ Referenzierungshäufigkeit

{ Größe der MS

{ Kosten, die Neuberechnung/Aktualisierung der MS verursachen würde

{ Anzahl Anfragen, die in Vergangenheit mit der MS hätten beantwortet werden können

{ Anzahl Anfragen, die prinzipiell mit MS beantwortet werden könnten

Æ Nutzwert berechnet sich aus gewichteten

Verdrängung von MS

(16)

Kompromiss zwischen zusätzlichen Speicher- bedarf und Anfrageoptimierung

Æ anwendungsabhängig

Frage: Wie bei Änderung der Basisdaten aktualisieren der materialisierten Sichten?

Auswahl von Sichten

(17)

1.

Materialisierte Sichten

- Prinzip und Anwendung

2.

Auswahl zu materialisierender Sichten

- Statische vs. Dynamische Auswahl 3.

Aktualisierung

- Inkrementelle Aktualisierung 4.

Konsistenz

- Aspekte und Konzepte 5.

Zusammenfassung

Gliederung

(18)

Einfachste Möglichkeit:

Komplettes Löschen und Neuberechnen der Sicht nach Änderung

Nachteil:

Ineffizient, wenn sich nur ein kleiner Teil der Daten geändert hat

Æ Sehr großer Datendurchsatz bei Aktualisierung

Rematerialisierung

(19)

Idee: Nachvollziehen der Änderungen in der MS Berechnung des neuen Zustands der MS aus dem alten Zustand der MS und der

durchgeführten Änderung der Basisrelation Ablauf:

1. Update Basisrelation

2. Nachricht an Sicht über Update

3. Anfragen der Sicht an andere

Basisrelationen ob Aktualisierung notwendig

4. Aktualisierung der Sicht

Inkrementelle Aktualisierung

(20)

Softdrink Cola

Bier Becks

Basisrelationen B1, B2:

B1(Produkt, PGruppe) B2(PGruppe, Herkunft)

FR Wein

GER Bier

Materialisierte Sicht V:

V(Produkt, Herkunft) Sichtdefinition:

GER

Becks CREATE VIEW V AS

(SELECT b1.Produkt, b2.Herkunft FROM b1, b2

WHERE b1.PGruppe = b2.PGruppe)

Beispiel

(21)

Anfrage Q1

SELECT Region FROM B2

WHERE PGruppe = Wasser Anfrage Q2

SELECT Region FROM B2

WHERE PGruppe = Wein Q1 = { }

Update U1

Insert(B1,{Perling, Wasser})

Update U1

Insert(B1,{Perling, Wasser})

Update U2

Insert(B1,{Merlot, Wein})

Q2 = {FR}

Wasser Perling

Wein Merlot

Softdrink Cola

Bier Becks

GER Bier

GER Becks

Basisrelationen:

Sicht V:

B1(Produkt, PGruppe) :

B2(PGruppe, Herkunft)

Update U2

Insert(B1,{Merlot, Wein})

FR Merlot

GER Becks

Beispiel

V(Produkt, Herkunft)

Wasser Perling

Softdrink Cola

Bier Becks

Softdrink Cola

Bier Becks

(22)

Problem:

Parallele Änderungen der Basisrelation(en) Æ mögliches Auftreten von Anomalien

Lösung mit speziellen Algorithmen :

z.B. ECA-Verfahren:

Æ Hinzufügen von Kompensationsanfragen bei Quellanfragen zum Ausgleich von parallelen Änderungen

Anomalien

(23)

Ziel: Vermeidung von Zugriffen auf Basisrelationen

Wein Merlot

Softdrink Cola

Bier Becks

FR Wein

GER Bier

GER Becks

Basisrelationen:

Sicht: B1:

B2:

V:

Anfrage Q1

SELECT Region FROM B2

WHERE PGruppe = Wein

Optimierung der Aktualisierung

(24)

Autonom aktualisierbar, wenn Aktualisierung ohne Zugriffe auf Basisrelationen stattfindet

Æ In Praxis nur Forderung nach partieller Autonomie (nicht für alle Operationen)

Nutzung von Zusatzinformationen:

ƒ Schemainformationen (Bsp.

Primärschlüsseleigenschaften)

ƒ Count einzelner Tupel (Æ Counting Algorithmus)

ƒ Verwendung von Hilfssichten

Autonome Aktualisierung

(25)

1.

Materialisierte Sichten

- Prinzip und Anwendung

2.

Auswahl zu materialisierende Sichten

- Statische vs. Dynamische Auswahl 3.

Aktualisierung

- Inkrementelle Aktualisierung 4.

Konsistenz

- Aspekte und Konzepte 5.

Zusammenfassung

Gliederung

(26)

Probleme:

{ Sehr viele materialisierte Sichten (

>1000)

{ Redundanzen zwischen verschiedenen Sichten

Æ Konsistenzerhaltung wichtig

ƒ Basisrelationen ↔ materialisierten Sichten

ƒ materialisierten Sichten ↔ materialisierten Sichten

Konsistenz

(27)

{ Anwenderdefinierte Aktualitätsanforderungen

ƒ Zeitlicher Abstand

ƒ Wertemäßiger Abstand

ƒ Versionsbezogener Abstand

{ Anfragekonsistenz

{ Sitzungskonsistenz

{ Aktualisierungsgranulat

ƒ Gesamtes Data-Warehouse

ƒ Einzelne Sichten

ƒ Gruppen von Sichten (Æ Bsp. Viewgroup Konzept)

Konsistenzaspekte

(28)

Nebenläufige Aktualisierung:

Æ möglichst kleine Einschränkung der

Anfragebearbeitung durch Aktualisierung

Unterstützung individueller Aktualisierungsstrategien:

Æ Anpassbarkeit der einzelnen

Aktualisierungsgranulate an unterschiedliche Anwendungsanforderungen

Ziel: Den besten Kompromiss zwischen Leistung und Konsistenz zu finden

Anforderungen

(29)

{ Erhöhung der Nebenläufigkeit durch

mehrere Versionen eines Datenobjektes

Æ Anfragen lesen ältere Version, während auf neuer Version aktualisiert wird

{ Vorteil: Aktualisierung und Anfragen sind unabhängig

{ Nachteil: Zugriffe auf veraltete Objekte möglich

(↔ anwenderdefinierte

Aktualitätsanforderung)

Mehrversionen Prinzip

(30)

1.

Materialisierte Sichten

- Prinzip und Anwendung

2.

Auswahl zu materialisierender Sichten

- Statische vs. Dynamische Auswahl 3.

Aktualisierung

- Inkrementelle Aktualisierung 4.

Konsistenz

- Aspekte und Konzepte 5.

Zusammenfassung

Gliederung

(31)

{ Anfrageauswertung wird stark beschleunigt

Æ stellt aber wieder neue Anforderungen und Probleme

Æ letztendlich Suche nach dem besten Kompromiss zwischen Leistung und Komplexität

{ Entwicklung noch nicht abgeschlossen

Zusammenfassung

(32)

Ende

Materialisierte Sichten

Referenzen

ÄHNLICHE DOKUMENTE

Wenngleich das Konzept quattromodaler Knoten einen gewissen Interpretationsspielraum lässt – so werden etwa die Pipeline, Normal- und Breitspur sowie die Binnen- und

Computer-gestützte Programme für das Ge- wichtsmanagmeent seien zwar weniger wirk- sam als persönliche Interventionen, aber auf jeden FAll besser als nichts und auch ange- sichts

Technische Universität München, Fakultät für Medizin, Klinik und Poliklinik für Derma- tologie und

Im weiteren Verlauf erfolgte bei dem Patienten im stabilen Stadium der Erkran- kung die operative Korrektur der Penisdeviati- on durch partielle Plaqueexzision und Grafting, da

Im Bayerischen Ärzteblatt, Heft 7-8/2017 wird unter der Rubrik „Blickdiagnose“ im Ar- tikel „Schmerzen und Knoten am Penis“ bei den Therapiemöglichkeiten der Induratio penis

Und wenn ich das tue, möchte ich auch nicht Toleranz in Anspruch nehmen müssen - Toleranz würde ja nur bedeuten, dass ich zwar schon was und womöglich begründet dagegen habe,

2) Lies dir den Satz auf den ersten Papierstreifen genau durch. 3) Leg diesen Papierstreifen wieder zurück in das Briefkuvert. 4) Versuch nun den Satz aus deinem Gedächtnis

Bei ihre__ geringen Einkommen kann sie sich einen Urlaub in Italien nicht leisten.. bei mir