Masterarbeit Otto-von-Guericke-Universit¨atMagdeburg

(1)

Fakult¨ at f¨ ur Informatik

Institut f¨ ur Technische und Betriebliche Informationssysteme Arbeitsgruppe Datenbanken

Masterarbeit

Ein selbstlernendes Entscheidungsmodell f¨ ur die Verteilung von Datenbankoperationen auf

CPU/GPU-Systemen

Verfasser:

Sebastian Breß

26. Februar 2012

Betreuer:

Dr.-Ing. Eike Schallehn

Universität Magdeburg Fakultät für Informatik Postfach 4120, D–39016 Magdeburg

Germany

Prof. Dr.-Ing. habil. Kai-Uwe Sattler

Technische Universität Ilmenau Fakultät für Informatik und Automatisierung

Postfach 100 565, D–98684 Ilmenau Germany

(2)

Breß, Sebastian:

Ein selbstlernendes Entscheidungsmodell f¨ur die Verteilung von Datenbankoperationen auf CPU/GPU-Systemen

Masterarbeit, Otto-von-Guericke-Universit¨at Magdeburg, 2012.

(3)

Danksagung

Zuerst möchte ich mich bei Dr. Eike Schallehn bedanken, ohne dessen Anleitung und konstruktive Kritik diese Arbeit nicht möglich gewesen wäre.

Weiterhin möchte ich mich bei Prof. Dr. Kai-Uwe Sattler für die Bereitschaft bedanken, die Rolle des Zweitgutachters zu übernehmen.

Bei Andreas Lübcke und Dr. Veit Köppen möchte ich mich für Hilfestellungen und Korrekturlesen bedanken. Für Hinweise zum wissenschaftlichen Arbeiten gilt mein Dank Ingolf Geist. Für die Bereitstellung von Literatur gilt mein Dank Alexander Grebhahn.

Ferner m¨ochte ich den anonymen Reviewern des Workshops f¨ur Self-Managing- Database-Systems (SMDB) danken, da durch deren Feedback das Modell signifikant verbessert werden konnte.

Abschließend möchte ich mich bei allen bedanken, die mich während der Anfertigung dieser Arbeit noch unterstützt haben.

(4)

ii

(5)

Inhaltsverzeichnis

Inhaltsverzeichnis iii

Abbildungsverzeichnis vii

Tabellenverzeichnis ix

Verzeichnis der Abk¨urzungen xi

Abk¨urzungen im Modell xii

1 Einleitung 3

1.1 Hintergrund . . . 3

1.2 Motivation . . . 3

1.3 Ziele . . . 4

1.4 Struktur der Arbeit . . . 4

1.5 Derzeitiger Stand der Technik . . . 5

1.6 Allgemeine Beschreibung des Projektes . . . 5

2 Grundlagen 7 2.1 Grundlegende Begriffe . . . 7

2.2 Grundlegende Architektur von Datenbanken . . . 9

2.3 Anfrageoptimierung . . . 11

2.3.1 Phasen der Anfrageoptimierung . . . 12

2.3.2 Physische Optimierung . . . 12

2.3.3 Zusammenfassung . . . 14

2.4 Datenbank-Tuning . . . 14

2.4.1 Zielstellung . . . 14

(6)

iv INHALTSVERZEICHNIS

2.4.2 Optimierbare Systembestandteile . . . 15

2.4.3 Grundlegende Prinzipien . . . 16

2.5 Self-Tuning . . . 17

2.5.1 Motivation . . . 17

2.5.2 Prinzipien . . . 18

2.6 Interpolationsverfahren . . . 21

2.6.1 Methode der kleinsten Quadrate . . . 21

2.6.2 Interpolation mit kubischen Splines . . . 22

2.7 GPU . . . 23

2.7.1 Uberblick . . . .¨ 23

2.7.2 SIMT-Architektur . . . 24

2.7.3 Abgrenzung SIMD- vs. SIMT-Architektur . . . 26

2.8 Stand der Forschung . . . 26

2.8.1 Forschungstrend: Auslagerung von DB-Operationen auf GPUs . . 26

2.8.2 Analytische Modelle für die Ausführungszeitschätzung von GPU- Algorithmen . . . 27

2.8.3 Statistik-basierte Ausf¨uhrungszeit-Sch¨atzmodelle . . . 28

2.9 Sortieralgorithmen . . . 31

2.9.1 Radixsort . . . 31

2.9.2 Quicksort . . . 32

2.9.3 Mergesort . . . 32

2.10 Zusammenfassung . . . 32

3 Das Entscheidungsmodell 33 3.1 Motivation . . . 33

3.2 Bewertungskriterien . . . 34

3.3 Grundlegendes Modell . . . 35

3.4 Self-Tuning Ausf¨uhrungszeitsch¨atzer . . . 36

(7)

3.4.1 Aktualisierung des Modells . . . 36

3.4.2 Self-Tuning-Zyklus des Ausf¨uhrungszeitsch¨atzers . . . 37

3.4.3 Adaption an neue Lastsituationen . . . 38

3.4.4 Statistische Verfahren . . . 40

3.5 Entscheidungskomponente . . . 42

3.5.1 Optimierungskriterien . . . 42

4 Diskussion m¨oglicher Erweiterungen 45 4.1 Erweiterung: alternde Statistik . . . 45

4.2 Erweiterung: Ereignisbasierte Modellaktualisierung . . . 46

4.3 Erweiterung: Abschalten des Self-Tunings . . . 47

4.4 GPU-Metriken . . . 48

4.4.2 Notation . . . 49

4.4.3 Erweiterungen von vorhandenen Metriken . . . 50

4.4.4 Berechnung der totalen Ausf¨uhrungszeit . . . 51

4.4.5 Berechnung der Antwortzeit unter Ber¨ucksichtigung der Parallelit¨at 51 4.4.6 Nutzung bei der physischen Optimierung . . . 52

4.5 Modellparameter . . . 54

4.5.1 Ausreißer-Erkennung und Ringpuffergr¨oße . . . 55

4.5.2 Grad von Polynomen bei der Methode der kleinsten Quadrate . . 55

4.5.3 L¨ange der Trainingsphasen . . . 56

4.5.4 Zusammenfassung Modellparameter . . . 56

4.6 Einsatz des Modells in RDBMS f¨ur Joins . . . 56

5 Implementierung und Evaluation 59 5.1 Implementierung . . . 59

5.1.1 Framework Grundlagen . . . 59

5.1.2 Verwendete Bibliotheken . . . 60

(8)

vi INHALTSVERZEICHNIS

5.1.3 Kontrollfluss des Frameworks . . . 60

5.2 Modell Qualit¨atsmaße . . . 61

5.2.1 Ausf¨uhrungszeitsch¨atzer . . . 61

5.2.2 Entscheidungskomponente . . . 62

5.2.3 Zusammenfassung Modell Qualit¨atsmaße . . . 64

5.3 Fallstudie: Sortierungen . . . 65

5.3.2 Grundlegender Messprozess . . . 65

5.3.3 Modellparameter . . . 66

5.3.4 Gewinnung der Messdaten . . . 66

5.3.5 Darstellung der Experimente in Modellnotation . . . 67

5.3.6 Validierung der Sch¨atzkomponente . . . 68

5.3.7 Validierung der Entscheidungskomponente . . . 71

6 Abschluss 81 6.1 Zusammenfassung . . . 81

6.2 Beurteilung . . . 81

6.3 Ausblick . . . 82

Literaturverzeichnis 85

(9)

Abbildungsverzeichnis

2.1 DBMS Architektur in Anlehnung an [Vos08] . . . 9

2.2 Optimierungsproblem in Anlehnung an [SHS05] . . . 13

2.3 Relevante Systemkomponenten beim Datenbank Tuning in Anlehnung an [Sch11] . . . 15

2.4 Datenbank-Tuning-Quandrilemma in Anlehnung an [Sch11] . . . 16

2.5 IBMs Self-Tuning-Zyklus MAPE in Anlehnung an [KC03] . . . 20

2.6 Grid aus Thread-Bl¨ocken, entnommen aus [NVI12b] . . . 24

3.1 Informationsfluss im Modell . . . 36

3.2 Beispielalgorithmen GPU und CPU f¨ur eine Operation O . . . 39

3.3 Beispiel f¨ur die Erh¨ohung der Last auf der CPU . . . 40

3.4 Beispiel f¨ur das Sinken der Last auf der CPU . . . 40

3.5 Beispiel f¨ur eine zu starke Erh¨ohung der Last auf der CPU . . . 41

5.1 Ausf¨uhrungskurven der Sortieralgorithmen . . . 67

5.2 Durchschnittlicher prozentualer Sch¨atzfehler bei der Methode der kleinsten Quadrate . . . 70

5.3 Gesch¨atzte und gemessene Werte . . . 70

5.4 Durchschnittlicher prozentualer Sch¨atzfehler bei kubischen Splines . . . . 72

5.5 Gesch¨atzte und gemessene Werte . . . 72

5.6 Trefferrate . . . 73

5.7 Modellentscheidung . . . 74

5.8 Trefferrate . . . 77

5.9 Modellentscheidung . . . 78

(10)

viii ABBILDUNGSVERZEICHNIS

(11)

Tabellenverzeichnis

5.1 Modellqualität ausgewählter Entscheidungsmodelle . . . 75 5.2 Performance-Steigerung des Modells verglichen mit der Einzelausführung

von Algorithmen . . . 75 5.3 Modellqualität ausgewählter Entscheidungsmodelle . . . 77 5.4 Performance-Steigerung des Modells verglichen mit der Einzelausführung

von Algorithmen . . . 78

(12)

x TABELLENVERZEICHNIS

(13)

Verzeichnis der Abk¨ urzungen

ACID Atomicity, Consistency, Isolation und Durability; Eigenschaften einer Transaktion

CPU Central-Processing-Unit

CUDA Compute-Unified-Device-Architecture DB Datenbank

DBMS Datenbankmanagementsystem

DBS Datenbanksystem, umfasst die konkrete Instanz einer Datenbank, die von einem Datenbankmanagementsystem verwaltet wird

GPU Graphics-Processing-Units

GPGPU General-Purpose-Computation-on-Graphics-Processing-Units MAPE Monitor-Analyse-Plan-Execute

RAM Random Access Memory

SIMD Single-Instruction, Multiple-Data SIMT Single-Instruction, Multiple-Thread SM Streaming-Multiprocessors

Spore Spares POlynomial REgression TXN Transaktion

VRAM Video-RAM

(14)

xii

Abk¨ urzungen im Modell

Abk¨ urzungen f¨ ur Modellparameter

A Algorithmus D Datenmenge D

ITL initiale Trainingsl¨ange

MMPA minimale Messpaar Anzahl MP Messpaar

MTL maximale Trainingsl¨ange (in Anzahl der ben¨otigten Messpaare) NBR Neuberechnungsrate

O Operation O

PAG prozentuale Ausreißergrenze

RPG Ringpuffergr¨oße (Anzahl der Messpaare im Ringpuffer)

W Workload, ist ein Tupel W = (DS, O), wobei DS =D₁, D₂,· · · , D_n eine Menge von zu verarbeitende Datenmengen D_i darstellt und O die auszuf¨uhrende Operation ist.

(15)

Abk¨ urzungen innerhalb des Modells

AP_O Algorithmenpool der Operation O, beinhaltet alle Algorithmen, die für die Ausführung der Operation zur Verfügung stehen

DP SF durchschnittlicher prozentualer Sch¨atzfehler EMi, EMj Entscheidungsmodelle

ET_i in Schritt i (f¨ur die Datenmenge D_i aus der Workload W) gesch¨atzte Zeit

FA(D) Approximationsfunktion f¨ur Algorithmus A in Abh¨angigkeit von der Datenmenge D

L_A Lernverfahren für Algorithmus A M P L_A Messpaarliste für Algorithmus A M Q Modellqualität

M Ti in Schritt i (f¨ur die Datenmenge Di aus der Workload W) gemessene Zeit N Anzahl der Modell Iterationen

P SF_i prozentualer Sch¨atzfehler in Schritt i

RE Anzahl der richtigen Entscheidungen (für den kostenminimalen Algorithmus) T_A(D) Ausführungszeit des Algorithmus A für die Datenmenge D

T_est(A, D) vom Modell berechneter Sch¨atzwert, ¨aquivalent zu F_A(D)

T_EM(W) die vom Entscheidungsmodell (EM) hervorgerufene totale Ausf¨uhrungszeit f¨ur die Abarbeitung der Workload W

T_EM−X(W) durch den Einsatz des Modells EM-X resultierende Zeit f¨ur die Abarbeitung der Workload W.

T_{N A}(W) Zeit, die insgesamt f¨ur alle Neuberechnungen der Approximationsfunktionen (NA) ben¨otigt wurde

TOverhead(EM, W) Zeit, die durch das Modell zus¨atzlich verbraucht wurde

T_real(D, A) ist die gemessene Ausführungszeit, die der Algorithmus A für die Verar- beitung der Datenmenge D benötigt hat

T_{SW B}(W) Zeit, die insgesamt für alle Schätzwertberechnungen (SWB) benötigt wurde T E Anzahl der insgesamt getroffenen Entscheidungen

T R Trefferrate

T RM Z Totale Reale Modellzeit, beinhaltet Modell-Overhead

(16)

xiv

Zusammenfassung Modellqualit¨ atsmaße

P SF_i = |ET_i−M T_i| M T_i

DP SF =

N

P

i=1

P SF_i

N T R = RE

T E

T_Overhead(EM, W) =T_{SW B}(W) +T_{N A}(W) T_EM(W) = X

D∈DS

T_real(D, w¨ahleAlgorithmus(D, O)) +T_Overhead(EM, W) P GS(EM −X →EM −Y, W) = T_EM−X(W)−TEM−Y(W)

T_EM−X(W)

Betrachtete Entscheidungsmodelle:

EM −Ideal ideales Entscheidungsmodell, entscheidet sich immer f¨ur den schnellsten Algorithmus

EM −Real das in dieser Arbeit konstruierte Entscheidungsmodell

EM −M ergesort Entscheidungsmodell, dass immer Mergesort für die Ausführung einer Sortieroperation auswählt

EM −Radixsort Entscheidungsmodell, dass immer Radixsort für die Ausführung einer Sortieroperation auswählt

EM −Quicksort Entscheidungsmodell, dass immer Quicksort für die Ausführung einer Sortieroperation auswählt

EM −W orst−Case Worst-Case-Entscheidungsmodell, entscheidet sich immer f¨ur den langsamsten Algorithmus

(17)

Abstract

Ein aktueller Datenbankforschungstrend fokussiert die Abarbeitung von Datenbankop- erationen auf Grafikkarten (GPU), um eine schnellere Anfrageverarbeitung zu erreichen. Die GPU-Algorithmen sind aber nicht in allen Fällen schneller als ihre CPU- Gegenstücke und umgekehrt. Dies liegt vor allem am Overhead des Datentransfers zwischen dem Hauptspeicher der CPU und dem Speicher der Grafikkarte. Um eine optimale Geschwindigkeitssteigerung erreichen zu können, ist es erforderlich, für eine Operation den schnellsten Algorithmus auszuwählen. In Abhängigkeit davon, ob ein Algorithmus für die CPU oder die GPU geschrieben wurde, wird die zugehörige Operation auf der CPU oder GPU ausgeführt. Auf diese Weise werden Operationen optimal auf vorhandene Recheneinheiten verteilt.

Für die Verteilung von Operationen wird ein Entscheidungsmodell benötigt. Ein solches soll in dieser Arbeit entwickelt werden. Es abstrahiert von hardwarenahen Pa- rametern und nutzt statistische Verfahren, wie die Methode der kleinsten Quadrate und Spline-Interpolation, zur Schätzung von Ausführungszeiten auf Basis von zuvor gemesse- nen Ausführungszeiten. Der Einsatz statistischer Verfahren und das kontinuierliche Sam- meln von Messdaten ermöglicht zusätzlich eine dynamische Anpassung an neue Lastsit- uationen, da veränderte Messwerte zu veränderten Schätzungen führen.

In der präsentierten Fallstudie wurden CPU- und GPU-Algorithmen zum Sortieren verwendet. Das Ergebnis war eine minimale Performance-Steigerung von ca. 7%. Die erreichte Modellqualität liegt bei 99%. Der relative Schätzfehler liegt bei Einsatz des kleinste Quadrate Verfahrens unter 20% und bei Verwendung von Splines unter 5%.

(18)

2

(19)

Kapitel 1 Einleitung

In diesem Kapitel wird eine kurze Einleitung in die Thematik dieser Arbeit gegeben.

Zunächst wird der Hintergrund vorgestellt und die Arbeit motiviert. Anschließend folgt die Vorstellung der für die Arbeit gesetzten Ziele und der genutzten Kapitelstruktur. Ein kurzer Überblick über den Forschungsstand und eine kurze Beschreibung des Projektes schließen das Kapitel.

1.1 Hintergrund

Ein aktueller Forschungstrend fokussiert die Beschleunigung von Daten- banken, durch die Auslagerung von Datenbankoperationen auf Grafikkarten [HLY⁺09],[WWN⁺10],[PMK11],[GLW⁺04]. Allerdings sind weder die CPU-, noch die GPU-Algorithmen bei der Ausf¨uhrung einer Operation immer schneller als die jeweils anderen.

Es wäre performanter, wenn immer der schnellste Algorithmus zur Ausführung aus- gewählt werden würde, um eine bestmögliche Performance gewährleisten zu können.

Ein weiteres Problem ist die antwortzeitminimale Algorithmenauswahl (und damit ver- bundene Verteilung von Operationen auf CPU und GPU) ohne Kenntnis der konkreten Hardware durchzuführen, denn die Verwaltung der Parameter eines analytischen Kosten- modells würde in der Praxis einen hohen Aufwand bedeuten und wäre somit kostenin- tensiv.

1.2 Motivation

Darum wird ein Entscheidungsmodell ben¨otigt, dass Datenbankoperationen zur Laufzeit auf CPU und GPU verteilt und sich an neue Lastsituationen anpassen kann. Diese Arbeit hat das Ziel, ein solches Modell zu erstellen.

Von hardwarenahen Parametern wird abstrahiert, indem das Ausführungsverhalten von Algorithmen, die für die Ausführung einer Operation genutzt werden, gelernt wird.

Dies soll durch den Einsatz von statistischen Verfahren erfolgen, die für jeden Algorith- mus eine Schätzfunktion trainieren, die dann für die Schätzung der Ausführungszeiten der für eine Operation verfügbaren Algorithmen verwendet wird. Der Algorithmus mit der niedrigsten geschätzten Ausführungszeit wird zur Ausführung gebracht. Auf diese

(20)

4 1.3. Ziele

Weise wird eine antwortzeitminimale Verteilung von Operationen auf CPU und GPU¹ realisiert. Durch den Einsatz statistischer Verfahren und das kontinuierliche Sammeln von Messpaaren für die zur Ausführung gebrachten Algorithmen ist eine dynamische Lastanpassung zur Laufzeit möglich.

1.3 Ziele

Das Ziel dieser Arbeit ist die Beschleunigung der Anfrageverabeitung in Datenbankman- agementsystemen (DBMS) durch eine antwortzeitminimale Verteilung von Datenbank- operationen auf unterschiedliche Recheneinheiten (CPU/GPU). Ein wesentliche An- forderung ist, dass das zu erstellende Modell ohne hardwarenahe Parameter auskommt und sich prinzipiell an ver¨anderte Lastsituationen anpassen kann. Auf diese Weise soll auch bei schwankender Last auf CPU und GPU ein maximaler Performancenutzen erreicht werden.

Weitere Ziele dieser Arbeit sind deshalb die Beantwortung folgender Fragen:

1. Wie kann eine antwortzeitminimale Verteilung von Datenbankoperationen ohne Kenntnis der zugrunde liegenden Hardware (CPU,GPU) umgesetzt werden?

2. Hat diese Vorgehensweise einen Nutzen und wenn ja, wie hoch ist er im Vergleich zum Idealfall?

3. Wie kann dabei eine Anpassung an neue Lastsituationen erfolgen?

4. Welches der betrachteten statistische Verfahren erzeugt ein (nahezu) optimales Modell?

Die Ziele dieser Arbeit werden zum einen durch qualitative Diskussionen und zum anderen durch Experimente erreicht.

1.4 Struktur der Arbeit

Die weitere Arbeit ist wie folgt aufgebaut:

Kapitel 2 In Kapitel 2 wird eine Einf¨uhrung in den f¨ur diese Arbeit relevanten The- menbereich gegeben.

Kapitel 3 In Kapitel 3 wird das Entscheidungsmodell vorgestellt und dessen Be- standteile aufgeschl¨usselt und diskutiert.

Kapitel 4 In Kapitel 4 werden Überlegungen zur Adressierung aktueller Schwächen des Modells präsentiert, die nicht mit Experimenten validiert werden.

Kapitel 5 In Kapitel 5 folgt die Beschreibung und Auswertung der durchgef¨uhrten Ex- perimente.

Kapitel 6 In Kapitel 6 wird die Arbeit zusammengefasst und ein Ausblick gegeben.

1Nachfolgend wird das auch einfach als Scheduling bezeichnet.

(21)

1.5 Derzeitiger Stand der Technik

In aktuellen Publikationen wird die Auswahl von Algorithmen vor der Laufzeit durchgef¨uhrt [KDY10]. Es gibt keinen Ansatz, der geeignet w¨are, Operationen dynamisch auf CPU und GPU zu verteilen. Genauere Informationen zum relevanten Forschungs- stand werden in Abschnitt 2.8.1 auf Seite 26 gegeben.

Offene Probleme: Für die GPU wurden einige analytische Modelle erstellt, die sich aber nicht an neue Lastsituationen anpassen können. Außerdem erfordern sie die Kennt- nis von hardwarenahen Parametern wie z.B. Taktrate und Anzahl der verfügen Prozes- soren. In der Praxis würde dies die Wartung erschweren, weswegen das Lernen des Ausführungsverhaltens eines Algorithmus wünschenswert wäre. Dies wird von dem in dieser Arbeit entwickelten Modell umgesetzt.

Unterschiede zu bisherigen Ansätzen: Ein weiterer Unterschied ist, dass das Modell die Ausführungszeit von Operationen schätzt, und nicht für Anfragen. Dadurch können die zu einer Anfrage gehörenden Operationen auf die jeweils geeignetste Rech- eneinheit verteilt werden, was bei einem Anfrage basiertem Ansatz nicht möglich wäre.

Wie bereits erwähnt wurde, verschenken bisherige Ansätze mögliche Zeiteinsparungen bei der Anfragebearbeitung dadurch, dass sie statisch einen Algorithmus wählen, der entweder für die CPU oder die GPU geschrieben wurde. Das zu erstellende Modell hingegen wählt dynamisch zur Laufzeit einen Algorithmus aus und kann so mehr Ausführungszeit sparen.

1.6 Allgemeine Beschreibung des Projektes

In diesem Abschnitt werden allgemeine Informationen zum Projekt gegeben.

Die Arbeit wurde bei der Arbeitsgruppe Datenbanken des Instituts für Technische und Betriebliche Informationssysteme der Universität Magdeburg verfasst. Von den darin gewonnenen Ergebnissen können alle Datenbankmanagementsysteme profitieren, die auf einem hybriden CPU/GPU System laufen. Anfragen können in kürzerer Zeit verarbeitet werden und somit den Nutzern eines DBMS einen besseren Service bieten. Von dem Ansatz können besonders Antwortzeit sensitive Systeme wie z.B. Data-Warehouses profitieren.

(22)

6 1.6. Allgemeine Beschreibung des Projektes

(23)

Kapitel 2 Grundlagen

In diesem Kapitel werden die Grundlagen für das Verständnis des später zu entwickelnden Konzeptes gelegt. Zunächst erfolgt eine Einführung in allgemeine Grundlagen von Daten- banken und deren Tuning. Dafür werden grundlegende Begriffe definiert, der Aufbau eines DBMS beschrieben und darauf folgend der Optimierungsprozess von Anfragen näher betrachtet. Anschließend folgt eine Einführung über Datenbank-Tuning und darauf aufbauend über Self-Tuning. Zu den speziellen Grundlagen, die für das Verständnis erforderlich sind, gehört eine kurze Erläuterung der später verwendeten Interpolationsver- fahren, eine nähere Betrachtung von GPUs und deren Architektur und eine kurze Vorstel- lung der genutzten Sortierverfahren. Anschließend folgen Ausführungen zum aktuellen Forschungsstand. Das Kapitel schließt mit einer Zusammenfassung.

2.1 Grundlegende Begriffe

In diesem Abschnitt werden grundlegende Begriffe erklärt, die für das Verständnis dieser Arbeit erforderlich sind. Sofern nicht anders gekennzeichnet, sind alle Inhalte dieses Abschnitts aus [SSH10] entnommen worden.

• ”Ein Algorithmus ist eine pr¨azise (d.h. in einer festgelegten Sprache abge- fasste) endliche Beschreibung eines allgemeinen Verfahrens unter Verwendung ausf¨uhrbarer elementarer (Verarbeitungs-) Schritte.” [SS06]

• Eine Datenbank (DB) ist ein strukturierter, von einem DBMS verwalteter Datenbestand.

• Ein Datenbank Management System (DBMS) ist die Software, die f¨ur die Ver- waltung von Datenbanken verantwortlich ist.

• Ein Datenbanksystem (DBS) besteht aus einer konkreten Instanz einer Daten- bank, die von einemDBMS verwaltet wird.

• Eine Operation, die auf einer Datenbank ausgef¨uhrt wird, wird Datenbankopera- tion genannt [SHS05].

• Eine Folge von Datenbankoperationen, die aus einer oder mehreren Basisrelationen eine Ergebnisrelation berechnet, wird als Anfrage bezeichnet.

(24)

8 2.1. Grundlegende Begriffe

• Eine Transaktion (TXN) ist eine Folge von Operationen, die die Datenbank von einem konsistenten Zustand in einen neuen konsistenten Zustand ¨uberf¨uhrt, wobei das ACID-Prinzip gilt [SHS05]:

– Atomarität (Atomicity): Eine Transaktion wird entweder ganz oder gar nicht ausgeführt. Sie darf keine (inkonsistenten) Zwischenzustände hinterlassen, selbst beim Auftreten von Fehlern.

– Konsistenz (Consistency): Der von einer Transaktion hinterlassende Daten- bankzustand muss den Integrit¨atsbedingungen gen¨ugen.

– Isolation (Isolation): Ein Nutzer sollte den Eindruck haben, als würde er allein auf der Datenbank arbeiten, selbst wenn in Wirklichkeit mehrere Nutzer auf ihr arbeiten. Das Ergebnis einer Transaktion darf sich somit nicht ändern, nur weil sie parallel zu anderen Transaktionen ausgeführt wird.

– Persistenz (Durability): Am Ende einer Transaktion m¨ussen alle vorgenommenen ¨Anderungen dauerhaft in der Datenbank gespeichert sein.

• Datenbank Tuning umfasst alle Aktivitäten, die ausgeführt werden, um An- forderungen bezüglich der Performance eines Datenbanksystems zu erfüllen [Sha92].

• Datenbank Self-Tuning beschreibt die Fähigkeit eines DBMS seine eigene Funk- tionalität, Parameter und interne Strukturen für ein gegebenes Datenbanksystem zu optimieren, um die Performance zu optimieren und den gestellten Anforderun- gen zu genügen [CN07].

• Die Central Processing Unit (CPU) ist die zentrale Komponente eines Rechnersys- tems. Sie f¨uhrt Programme aus, indem sie deren Maschinenanweisungen nacheinan- der abarbeitet [Gla10].

• Graphics Processing Units (GPU), zu deutsch Grafikprozessoren, sind Vielkern- Prozessoren, die sehr große Rechenkapazität besitzen und einen hohen Datendurch- satz erreichen können. Früher wurden sie speziell für den Einsatz in der Computer- grafik entworfen, heute sind es parallele Mehrzweck-Prozessoren mit Unterstützung von Programmierschnittstellen für etablierten Hochsprachen wie C [GPG11].

• GPGPU steht f¨ur General-Purpose-Computation-on-Graphics-Processing-Units, zu deutsch Mehrzweckberechnungen auf Grafikprozessoren. Ein alternativer Begriff ist GPU-Computing [GPG11]. Dabei wird die GPU von ihrem traditionellem An- wendungsbereich, dem Rendering, auf ein weiteres Anwendungsspektrum erweitert, um allgemeine Probleme in der Informatik zu l¨osen.

• Scheduling ist ein Entscheidungsprozess, in dem die Allokation von Ressourcen zu Aufgaben über einen bestimmten Zeitraum gesteuert wird. Das Ziel ist die Optimierung eines Systems anhand einem oder mehreren Optimierungskriterien [Pin08]. Im Rahmen dieser Arbeit beschränkt sich das Scheduling auf die Zuweisung von Datenbankoperationen (Tasks) auf Berechnungseinheiten wie CPU und GPU (Ressourcen) für die Dauer einer Operation mit dem Ziel die Systemeigenschaften anhand eines Optimierungsziels zu verbessern.

(25)

2.2 Grundlegende Architektur von Datenbanken

In diesem Abschnitt wird die Architektur eines DBMS kurz vorgestellt. Die einzelnen Komponenten werden genannt und deren Funktionsweise erkl¨art. Falls nicht anders angegeben, wurden die Inhalte dieses Abschnittes aus [Vos08] entnommen. Die beschriebene Architektur und deren Komponenten wird in Abbildung 2.1 dargestellt.

Input/Output Prozessor

Parser Autorisierungskontrolle Precompiler

Integritäts-

prüfung Update-

Prozessor Query-

Prozessor Optimierer

Zugriffsplanerstellung Code-Erzeugung

Transaktionsmanager

Recovery-Manager Scheduler

Data-Manager Puffer-Manager

Datenbank Log

Data-Dictionary

Ebene 1 Der Benutzer- sprache

Ebene 2 Der Anfrage- bearbeitung

Ebene 3

Der Zugriffstrukturen und Code-Erzeugung

Ebene 4

Der Synchronisation paralleler Zugriffe

Ebene 5 Der Speicher- verwaltung

Abbildung 2.1: DBMS Architektur in Anlehnung an [Vos08]

Der Benutzer kommuniziert mit einem System über einenInput-/Output Prozes- sor, der Anfragen des Nutzers entgegen nimmt und für die Anfragebearbeitung notwendi- ge Aktionen im System veranlasst. Falls die Anfrage erfolgreich ausgeführt werden konnte, wird das Ergebnis der Anfrage zurückgegeben, andernfalls wird mit einer Fehlermel- dung abgebrochen.

Die vomInput/Output Prozessorentgegengenommene Anfrage wird demParser

übergeben, der die syntaktische Richtigkeit der Anfrage überprüft. Dabei wird getestet, ob das Kommando entsprechend eines vorgegebenen Schemas aufgebaut ist (Semantik) und die in der Anfrage verwendeten Schlüsselwörter zu der Anfragesprache gehören (Syn-

(26)

10 2.2. Grundlegende Architektur von Datenbanken

tax). Bereits in dieser Komponente werden Informationen aus dem Data-Dictionary benötigt (z.B. um zu prüfen ob es die in einer Anfrage angegebenen Tabellen überhaupt gibt), deshalb muss der Parser mit Data-Dictionary kommunizieren können. Im Fall von eingebetteten Kommandos ist unter Umständen die Nutzung desPrecompilerser- forderlich. Unabhängig vom Anfragetyp ist eine Autorisierungskontrolle notwendig, die sicherstellt, dass der Nutzer nur ihm erlaubte Aktionen imDBMSdurchführen darf und nur die für ihn freigegebenen Daten lesen oder verändern kann.

Das Ergebnis dieser ersten Phase der Anfrageverarbeitung ist eine interne Darstel- lung der vom Nutzer eingegebenen Anfrage. Bei relationalen DBMS wäre dies z.B. ein Anfragebaum, dessen Blätter Relationen und deren innere Knoten die auszuführenden Operationen sind.

Das DBMS kann abhängig davon, ob eine Anfrage nur Daten liest oder auch Daten schreibt (aktualisiert), unterschiedliche Aktionen ausführen. Bei Aktualisierungen ist die Einhaltung der Integritätsbedingungen notwendig, um die semantische Korrektheit oder Konsistenz einer Datenbank sicher zu stellen. Diese Spiegeln in der Außenwelt vorherrschende Eigenschaften und Zusammenhänge wieder, wie z.B. dass das Alter eines Menschen nicht negativ sein darf und das keine lebende Person in der Zukunft geboren werden kann. Diese Integritätsbedingungen werden bei der Definition des konzeptuellen Schemas festgelegt und zur Laufzeit vomDBMSselbstständig überwacht. Die bisherige interne Repräsentation der Nutzeranfrage wird in diesem Fall dem Update-Prozessor unter Verwendung der Integritätsprüfung übergeben.

Falls eine Anfrage nur Leseoperationen ausführt, so ist keine Integritätsprüfung erforderlich, da sie keine Daten verändern wird und somit auch keine In- tegritätsverletzungen verursachen kann. Falls eine Anfrage über einem externem Schema gestellt worden ist, so muss der Query-Prozessor sie so umwandeln, dass sie über dem konzeptuellen Schema gestellt werden kann. Hierfür ist es beispielsweise nötig, im externen Schema definierte Abkürzungen mit deren Definition zu ersetzen, was als View- Auflösung bezeichnet wird.

Nutzer werden nicht notwendigerweise Anfragen stellen, die vom DBMS effizient verarbeitet werden k¨onnen. Deswegen versucht dasDBMS Anfragepl¨ane zu verbessern.

Für diese Aufgabe ist der Optimierer zuständig, der aus der bisherigen Zwischenform der Nutzeranfrage einen semantisch äquivalenten¹ Anfrageplan erstellt, der effizienter ausführbar ist.

Im nächsten Schritt werden die vomDBMSverfügbaren Zugriffsstrukturen ermittelt (z.B. Indexe), ein möglichst effizienter Zugriffspfad ausgewählt und ein ausführbarer Plan mithilfe des Code-Erzeugers erstellt.

Meistens arbeiten eine Vielzahl von Nutzern an einem Datenbanksystem. Aus diesem Grund muss dass DBMS gleichzeitige Zugriffe auf die Datenbank synchronisieren.

Im laufendem Betrieb werden alle aktiven Transaktionen verzahnt miteinander aus- geführt, um einen hohen Durchsatz zu erreichen. Damit der gleichzeitige Zugriff auf gemeinsame Daten keine Inkonsistenzen verursacht, müssen die Lese- und Schreibzu- griffe von Transaktionen synchronisiert werden. Aus diesem Grund besitzt ein DBMS einen Transaktionsmanager, der das DBS einem Nutzer so erscheinen lässt, als würde er alleine auf der Datenbank arbeiten. Die Synchronisation selbst übernimmt der

1Das Ergebnis darf sich unabh¨angig von den Daten durch die Transformation nicht ver¨andern.

(27)

Scheduler, der damit die sogenannte Concurrency Control (Gleichzeitigkeitskontrolle) umsetzt.

Eine Transaktion wird entweder ganz oder gar nicht ausgeführt. Sollte eine Transak- tion abgebrochen werden, dürfen die von der Transaktion vorgenommenen Änderungen nicht in der Datenbank verbleiben. Sollte der Transaktions-Manager feststellen, dass eine Transaktion abgebrochen wurde, wird sie dem Recovery-Manager übergeben.

Dieser muss nun die Änderungen der abgebrochenen Transaktion rückgängig machen.

Dafür nutzt er den Log desDBMS, indem unter anderem alle Änderungen verzeichnet werden. Der Recovery-Manager hat außerdem die Aufgabe, das Datenbanksystem nach einem Fehlerfall (Festplattencrash, Betriebssystem oder DBMS abgestürzt) wieder an- laufen zu lassen. Dazu ist es nötig, die Datenbank wieder in einen konsistenten Zustand zu versetzen. Alle erfolgreich beendeten (comitteten) Transaktionen, deren Änderungen durch den Absturz verloren gegangen sind, müssen erneut ausgeführt werden, alle anderen nicht.

Die Speicherverwaltung bildet den untersten Bereich des DBMS und umfasst den Puffer-Manager und den Data-Manager. Der Puffer-Manager dient der Verwal- tung des vom DBMS genutzten Hauptspeichers. Der Data-Manager verwaltet die vom DBMSgenutzten Betriebsmittel und f¨uhrt unter der Aufsicht des Transaktionsmanagers alle physischen Zugriffe auf die Datenbank aus.

Das bereits erw¨ahnte Data-Dictionary stellt Informationen bereit, die von vielen Komponenten desDBMS ben¨otigt werden.

Ein DBMS kann in f¨unf Ebenen eingeteilt werden, denen wiederum die bereits beschriebenen Komponenten zugeordnet werden k¨onnen.

1. Ebene der Benutzersprache: I/O Prozessor, Parser, Precompiler, Au- torisierungskontrolle

2. Ebene der Anfrageverarbeitung: Integrit¨atspr¨ufung, Update- sowie Query Prozessor, Optimierer

3. Ebene der Zugriffsstrukturen: Zugriffsplanerstellung, Code-Erzeugung

4. Ebene der Synchronisation: paralleler Zugriffe, Transaktionsverwaltung, Sche- duler, Recovery Manager

5. Ebene der Speicherverwaltung: Puffer- sowie Data-Manager

Im n¨achsten Abschnitt wird die Funktionsweise des Optimierers n¨aher betrachtet.

2.3 Anfrageoptimierung

Die Optimierung von Anfragen ist von zentraler Bedeutung in einem DBMS, da sie maßgeblich die Performance des Systems beeinflusst. Aus diesem Grund folgt nun eine kurze Einf¨uhrung in die Anfrageoptimierung. Zu Beginn wird auf die einzelnen Phasen eingegangen, um anschließend speziell die physische Optimierung n¨aher zu beleuchten.

Der Abschnitt schließt mit einer kurzen Zusammenfassung.

(28)

12 2.3. Anfrageoptimierung

2.3.1 Phasen der Anfrageoptimierung

Sofern nicht anders gekennzeichnet, sind alle Inhalte dieses Abschnitts aus [SSH10] entnommen worden.

1. Ubersetzung und Sichtexpansion:¨ Aus einer SQL Anfrage wird zunächst ein initialer Anfrageplan erzeugt. Dabei werden bei verschachtelten SQL Anfragen die Unteranfragen aufgelöst, um die später folgende Optimierung zu vereinfachen.

Außerdem werden arithmetische Ausdrücke vereinfacht. Bei Zugriffen auf Sichten müssen diese aufgelöst werden, indem sie durch ihre Sichtdefinition ersetzt werden.

Dieser Vorgang wird als Sichtexpansion bezeichnet.

2. Logische und algebraische Optimierung: Bei dieser Optimierung wird der Anfrageplan des vorherigen Schritts anhand algebraischer Regeln semantisch ¨aquivalent umgeformt, um einen verbesserten Anfrageplan zu erhalten.

Ublicherweise werden Selektionsoperationen im Anfrageplan in Richtung der Basis¨ Relationen verschoben, um Zwischenergebnisse m¨oglichst klein zu halten.

3. Physische oder interne Optimierung: Bei dieser Optimierung werden die ab- strakten Operationen im Anfrageplan durch Algorithmen ersetzt, die diese Opera- tionen ausführen werden. Weiterhin wird die physische Speicherung der Daten und die dabei eingesetzten Datenstrukturen mit berücksichtigt. Auf diese Weise entste- hen gewöhnlich mehrere semantisch äquivalente Anfragepläne. Aus diesen kann auf Basis von Heuristiken in dieser Phase oder durch Einsatz eines Kostenmodells in der nächsten Phase ein Anfrageplan ausgewählt werden.

4. Kostenbasierte Auswahl: In dieser Phase werden zu den in der letzten Phase generierten Anfragepl¨anen die Kosten berechnet und der kostenminimale Anfrage- plan zur Ausf¨uhrung gebracht.²

5. Planparametrisierung: Diese Phase ist nur Teil des Optimierungsvorgangs, wenn vorkompilierte SQL Anweisungen zur Ausführung gebracht werden sollen. In diesem Fall werden die vorherigen Optimierungsphasen übersprungen, da bereits ein optimierter Anfrageplan vorliegt. Dieser wurde mit Parametern versehen, in die die Werte aus der SQL Anfrage eingefügt werden.

6. Code-Erzeugung: In der letzten Optimierungsphase wird der Zugriffsplan zu ausführbaren Code kompiliert. Bei einigen Systemen werden Zugriffspläne auch mit einem Interpreter ausgeführt.

2.3.2 Physische Optimierung

Die physische Optimierung hat das Ziel, einen optimierten logischen Anfrageplan in einen ausf¨uhrbaren Anfrageplan umzuformen. Dies wird dadurch erreicht, indem die logischen Operationen im logischen Anfrageplan mit konkreten Algorithmen ersetzt werden. Die Entscheidung, welche Operation durch welchen Algorithmus ersetzt werden muss, wird

2Bei dieser Entscheidung werden Parameter wie die Tabellengröße und die Selektivität von Attributen mit berücksichtigt.

(29)

durch den Einsatz eines Kostenmodells realisiert. Das Ziel ist die Ermittlung eines kostenminimalen ausf¨uhrbaren Anfrageplans [SHS05].

Plangenerierung und Suchstrategien

Der Einsatz von Transformationsregeln, sowohl in der logischen als auch der physischen Optimierung, resultiert (normalerweise) in mehreren semantisch äquivalenten Anfrage- plänen. Das bedeutet, dass die Ausführung von all diesen Plänen auf jeweils identischen Datenbanken zu jeweils dem gleichen Ergebnis führen würde. Allerdings sind die Kosten meistens unterschiedlich. Das Ziel ist, den kostenminimalen Anfrageplan zu ermitteln.

Auf diese Weise soll die Performance des DBSmaximiert werden [SHS05].

Das Problem kann dabei in zwei Teilprobleme zerlegt werden. Das Erste ist das Auf- spannen des Suchraums, der sämtliche semantisch äquivalenten Anfragepläne enthält.

Dafür müssen zunächst alle möglichen Pläne erstellt werden.³Das zweite Problem ist den kostenminimalen Plan im Suchraum zu finden. Dafür wird eine Suchstrategie benötigt, die möglichst schnell den optimalen oder fast optimalen Anfrageplan auswählt. Das Auswahlkriterium stellen die Kosten eines Anfrageplans dar, die anhand eines Kosten- modells für jeden betrachteten Anfrageplan berechnet werden müssen [SHS05].

Meistens werden beide Phasen parallel ausgeführt, d.h. während neue Anfragepläne generiert werden, können von schon bestehenden Plänen die Kosten berechnet werden.

Die eben beschriebenen Zusammenh¨ange werden in Abbildung 2.2 zusammenfassend dargestellt. Eine ausf¨uhrliche Diskussion der hier angesprochenen Problematik ist in [SHS05] zu finden.

Anfrage

Aufspannen des Suchraums

Aufspannen des Suchraums Äquivalente Pläne

Transformationsregeln

Kostenmodell

''Optimaler'' Plan

Abbildung 2.2: Optimierungsproblem in Anlehnung an [SHS05]

3Dies wird in der Praxis aus Effizienzgründen nicht gemacht. Vielmehr wird dort mit Heuristiken gearbeitet, die den Optimierungsraum möglichst einschränken sollen.

(30)

14 2.4. Datenbank-Tuning

Kostenmodelle

Ein Kostenmodell bildet die wichtigste Grundlage f¨ur die Auswahl eines Anfrageplans.

Es stellt ein Entscheidungskriterium bez¨uglich eines Optimierungsziels zur Verf¨ugung.

Ublicherweise besteht ein Kostenmodell aus drei Teilen. Der Erste wird von Kostenfunk-¨ tionen gebildet, die die Ausführungskosten von einzelnen Operationen und Anfragen berechnen. Statistiken stellen den zweiten Teil dar. Sie umfassen nähere Informationen zu Tabellen wie Anzahl der Tupel, Wertebereiche und Werteverteilungen einzelner At- tribute usw. Formeln stellen den letzten Teil dar. Sie werden benötigt, um mithilfe der Statistiken die Größen von Zwischenergebnissen, die für die Kostenfunktionen benötigt werden, zu schätzen [SHS05].

Eine detailliertere Diskussion findet der interessierte Leser in [SHS05].

2.3.3 Zusammenfassung

In diesem Abschnitt wurde eine kurze Einführung in die Anfrageoptimierung eines DBMS gegeben. Die einzelnen Phasen wurden kurz vorgestellt und die Phase der physischen Optimierung zusätzlich detaillierter beschrieben, da sie für den Kontext der späteren Inhalte dieser Arbeit wichtig ist. Im nächsten Abschnitt wird eine kurze Einführung in das Tuning von Datenbanksystemen gegeben.

2.4 Datenbank-Tuning

In diesem Abschnitt wird eine kurze Einf¨uhrung in das Datenbank-Tuning gegeben.

Zun¨achst wird auf die Ziele des Datenbank-Tunings eingegangen, um anschließend einen Uberblick ¨¨ uber die optimierbaren Systembestandteile zu geben. Darauf folgend werden die Grundprinzipien vorgestellt und eine Zusammenfassung gegeben.

Falls nicht anders angeben, wurden die Inhalte dieses Abschnitts aus [Sha92] entnommen.

2.4.1 Zielstellung

Das grundlegende Ziel von Tuning ist die Verbesserung der Performance eines Systems.

Aber Performance ist ein weit gefasster Begriff, der vieles bedeuten kann, z.B. Qualit¨at der Verarbeitung und deren Ergebnisse, Verf¨ugbarkeit und Nutzbarkeit.

Datenbank-Tuning zielt meistens auf die Laufzeit-Performance ab, wobei es drei grundlegende Optimierungskriterien gibt. Dazu geh¨oren Durchsatz, Antwortzeit und Ressourcennutzung.

• Durchsatz:Hier ist das Ziel, die Anzahl der Anfragen oder Transaktionen, die in einem festen Zeitraum verarbeitet werden k¨onnen, zu maximieren.

• Antwortzeit: Die Antwortzeit ist die Zeit, die vom Startzeitpunkt einer Anfrage bis zu dem Zeitpunkt, an dem das vollst¨andige Ergebnisse vorliegt, vergeht. Diese Zeit soll minimiert werden.

(31)

• Ressourcennutzung:Optimiert die tempor¨ar (CPU, Hauptspeicher) und perma- nent (Festplattenplatz) verwendeten Ressourcen.

Diese Optimierungskriterien k¨onnen sich widersprechen, z.B. kann eine Optimierung der Antwortzeit den Durchsatz senken.

Der allgemeine Ansatz für eine Optimierung ist es, einige Beschränkungen zu setzen (z.B. die maximale Auslastung einer Ressource), und die bestmögliche Lösung für ein spezifisches Optimierungsziel zu finden (z.B. für den Durchsatz).

2.4.2 Optimierbare Systembestandteile

Heutige Informationssysteme sind sehr komplex und bestehen aus einer Vielzahl von Komponenten. Im Wesentlichen können vier Schichten genutzt werden, um eine für das Tuning geeignete Abstraktion zu erhalten. An erster Stelle steht eine Anwendung, die die Funktionalität des DBMSverwendet. DasDBMSselbst nutzt die vom Betriebssystem bereitgestellte Schnittstelle, um Daten persistent auf der Festplatte zu speichern. Das Betriebssystem wiederum abstrahiert die zugrunde liegende Hardware und präsentiert Anwendungen eine einheitliche Schnittstelle für die Kommunikation mit der Hardware.

Diese Zusammenh¨ange wurden zusammenfassend in Abbildung 2.3 dargestellt [Sha92].

Datenbank Management System (DBMS)

Anwendungen

Betriebssystem (BS)

Hardware

Abbildung 2.3: Relevante Systemkomponenten beim Datenbank Tuning in Anlehnung an [Sch11]

Um ein Datenbanksystem tunen zu k¨onnen, ist ein tief greifendes Wissen ¨uber alle Komponenten erforderlich. Weder Systementwickler und Datenbankadministratoren noch Datenbankexperten kennen alle Details aller Schichten. Dieses Problem wird als Datenbank-Tuning-Quadrilemma bezeichnet [Sch11], das zusammenfassend in Abbil- dung 2.4 zu sehen ist.

(32)

16 2.4. Datenbank-Tuning

Betriebssystem Hardware

Anwendungen DBMS

ein optimales Datenbanktuning erfordert umfassendes Wissen über

Abbildung 2.4: Datenbank-Tuning-Quandrilemma in Anlehnung an [Sch11]

2.4.3 Grundlegende Prinzipien

Die Kenntnis der grundlegenden Prinzipien des Datenbank-Tunings sind elementar für das Verständnis der weiteren Diskussion, deshalb werden sie in diesem Abschnitt kurz präsentiert. Zu den wichtigsten Prinzipien gehören nach [Sha92]: denke Global, tune (repariere) Lokal; Partitionierung löst Flaschenhälse auf; Startkosten sind hoch, Laufzeitkosten sind gering; und überlasse dem Server, was dem Server gebührt.

1. denke Global, tune Lokal:Die Idee dieses Prinzips ist, die richtigen Gr¨oßen zu messen und zu den richtigen Schlussfolgerungen zu kommen, um den Flaschenhals⁴, der das Performance-Problem verursacht, zu finden und zu beseitigen.

2. Partitionierung löst Flaschenhälse auf: Falls ein Flaschenhals identifiziert wurde, sollte erst versucht werden, die zugehörige Komponente zu beschleunigen (z.B. durch eine Anpassung der Konfiguration). Falls dies nicht zum Erfolg führt, dann sollte die Last über mehr Ressourcen verteilt werden. Ein Beispiel ist z.B.

eine große Tabelle aufzuteilen und die entstandenen Partitionen auf verschiedene Festplatten zu verteilen, um den Ein-/Ausgabe Flaschenhals zu reduzieren. Eine weitere M¨oglichkeit einen Flaschenhals aufzul¨osen, ist einen Teil der Arbeitslast

über einen größeren Zeitraum zu verteilen. Ein Beispiel ist die Verschiebung des täglichen Backups von der Mittagszeit in die Nacht.

3. Startup-Kosten sind hoch, Laufzeitkosten sind gering:Die meisten Kompo- nenten benötigen einen signifikanten Anteil ihrer Ressourcen zum Starten. Dies ist z.B. für das Betriebssystem und Teile des DBMS der Fall. Also sollten alle Kom- ponenten möglichst in Ausführung bleiben und wenn möglich nicht neu gestartet werden, um Ressourcen zu sparen.

4. ¨uberlasse dem Server, was dem Server geb¨uhrt: Dieses Prinzip sieht vor, dass die Last zwischen demDBMSund der Anwendung balanciert sein sollte. Der

4Teil eines Systems, dass die Gesamt-Performance begrenzt.

(33)

Server sollte die Aufgaben übernehmen, die er am besten lösen kann. Das gleiche gilt für die Anwendung.

Eine tiefgreifendere Diskussion findet der interessierte Leser in [Sha92].

2.4.4 Zusammenfassung

In diesem Abschnitt wurde eine grundlegende Einführung in das Datenbank-Tuning gegeben, um die nachfolgende Diskussion über Self-Tuning in Datenbanksystemen vorzu- bereiten. Es wurden Ziele und Prinzipien erläutert und die optimierbaren Systembe- standteile vorgestellt.

2.5 Self-Tuning

In diesem Abschnitt wird eine Einf¨uhrung in das Self-Tuning von Datenbanksystemen gegeben. Zun¨achst wird das Konzept des Self-Tunings motiviert, um anschließend auf die zugrunde liegenden Prinzipien einzugehen. Der Abschnitt schließt mit einer Zusam- menfassung.

2.5.1 Motivation

Datenbanksysteme unterliegen ständigen Veränderungen, sie müssen immer größere Datenmengen verwalten und werden dabei von immer mehr Benutzern und Anwen- dungen verwendet. Außerdem ändern sich die Anforderungen ständig, sie müssen immer performanter und skalierbarer werden. Datenbankadministratoren benötigen aber allein 50% ihrer Zeit dafür, das System weiterhin im operativen Betrieb zu halten, um eine hohe Verfügbarkeit zu gewährleisten. Über 80% der Kosten für das Tuning von Daten- banksystemen werden für Personal benötigt. Außerdem kommen viele Datenbankadmin- istratoren mit den ständig steigenden Anforderungen mit dem Tuning kaum hinterher.

Aus diesem Gründen wäre es wünschenswert, wenn ein Datenbanksystem sich selbst optimieren würde, um auf diese Weise Kosten zu sparen und ein Maximum an Performance zu erreichen [Sat06],[CN07],[WHMZ94],[CW06].

Das Self-Tuning hat folgende Ziele [Sch11]:

1. Reduktion der Kosten f¨ur Wartung und Administration von Datenbanksystemen, 2. Automatisierung von so vielen Aufgaben wie m¨oglich,

3. Reduktion der Anzahl der Tuning-Parameter,

4. Erreichen der Performance Anforderungen mit weniger Aufwand.

Die grundlegende Idee ist, dass dasDBMSder beste Tuning-Experte ist, weil es sich selbst und seine Interaktionen mit Betriebssystem und Hardware am besten kennt. Die Analyse von fr¨uherer und aktueller Nutzung erlaubt in einem begrenztem Rahmen eine

(34)

18 2.5. Self-Tuning

Vorhersage der zukünftigem Nutzung, für die die notwendigen Änderungen durchgeführt werden⁵ [CW06].

2.5.2 Prinzipien

Zun¨achst werden die Grundprinzipien des Self-Tunings in diesem Abschnitt grob umris- sen, um in den folgenden Abschnitten detaillierter auf sie einzugehen.

Zu den Grundprinzipien des Self-Tunings geh¨oren :

Trade-off-Eliminierung ist ein wichtiges Ziel des Self-Tunings, n¨amlich das DBMS alle Entscheidungen treffen zu lassen, dies es selbst treffen kann [CW06].

Statisches vs. Dynamisches Tuning beschreibt zeitliche Aspekte, wann Entschei- dungen getroffen werden k¨onnen oder m¨ussen [CW06].

Self-Tuning Kreislauf zielt auf einen automatischen kontinuierlichen Entschei- dungsprozess zur Laufzeit ab [CW06].

Self-Tuning Overhead ber¨ucksichtigt schließlich die negativen Einfl¨usse des Self- Tunings auf ein System [Sch11].

Trade-off Eliminierung

Bei der Trade-off Eliminierung wird das Prinzip verfolgt, Tuning-Parameter zu entfernen oder schwer zu beherrschende Low-Level-Parameter mit einfacher zu verwaltenden High- Level-Parametern zu ersetzen. Die zwei wesentlichen Aspekte sind dabei erstens, die Automatisierung einfacher Entscheidungen und zweitens die Ersetzung von schwierigen Entscheidungen durch Einfache [CN07]. Beispiele f¨ur ein solches Vorgehen ist z.B. die Einstellung der Gr¨oße des Datenbankpuffers oder die Wahl der Seitenersetzungsstrategie [CW06],[Sat06].

Statisches vs. Dynamisches Tuning

Beim statischen Self-Tuning werden Aktivitäten einmal oder mehrmals durchgeführt, wobei sie manuell oder vom DBMS ausgelöst werden können. Die Analyse und das Anpassen des Systems können zu einem großen Grad vom DBMS entkoppelt werden.

Statisches Self-Tuning ist für die Justierung von sich langsam verändernden oder stabilen Eigenschaften des Datenbanksystems geeignet [CW06],[Sat06]. Beispiele sind die Auswahl von Indexen für ein Attribut einer Tabelle oder die Bestimmung einer geeigneten Partitionierung einer Tabelle.

Das dynamische Self-Tuning führt kontinuierlich Aktivitäten durch und ist tief in das DBMS integriert. Es nutzt Algorithmen, die eigenständig Parameter anpassen und ist für das Tuning von Systemeigenschaften geeignet, die sich häufig oder kontinuierlich

¨andern [CW06],[Sat06].

5DasDBMSkann z.B. nicht voraussehen, dass sich die Anzahl der Nutzer n¨achsten Monat verdop- pelt oder wie es sich auf anderer Hardware verhalten w¨urde.

(35)

Self-Tuning Kreislauf

Beim Self-Tuning kommt das Konzept des online Regelkreises zum Einsatz. Dabei beobachtet das System kontinuierlich bestimmte Performance-Metriken und justiert dynamisch zur Laufzeit Tuning-Parameter, falls eine Performance-Metrik einen bestimmten Grenzwert ¨uberschreitet [CN07].

Der online Regelkreis wird in drei Phasen unterteilt, diese heißen Beobachtung, Vorhersage und Reaktion [CN07].

Die Beobachtungsphase überwacht Performance-Metriken und Workload- Parameter, die als Indikatoren für Performance-Probleme oder die Erkennung einer signifikanten Veränderung der Last genutzt werden können. Das entscheidende Prob- lem in dieser Phase ist die Wahl der zu betrachtenden Parameter. Durchsatz und die Antwortzeiten von Anfragen sind gute globale Indikatoren, geben aber keinen Hinweis auf die Ursache eines Performance-Problems. Deswegen ist die Betrachtung von mikroskopischen Daten notwendig, um einen adequaten Tuning-Parameter für die Justierung auszuwählen. Eine geeignete mikroskopische Metrik ist die Länge der Fest- plattenwarteschlangen [CN07].

Der Zweck der Vorhersagephase ist es die hypothetischen Anpassungen ver- schiedener Tuning-Parameter quantitativ abzusch¨atzen. Es wird also ein mathematisches Modell f¨ur die Funktion

Last-Parameter×Tuning-Parameter→Performance-Metrik

benötigt, welche die Last und Tuning-Parameter eines Systems auf Performance- Metriken abbildet. Ein Tuning-Parameter sollte nur verändert werden, wenn eine sig- nifikante Verbesserung vorhergesagt wird und zu erwarten ist, dass das System in einem stabilen Zustand bleibt. Die Vorhersage hilft auch den geeignetsten Tuning-Parameter auszuwählen, wenn es mehrere Kandidaten gibt. Die Stabilitätskontrolle ist wichtig, da es ansonsten passieren kann, das nur bestimmte Aspekte des Systems verbessert werden, während sich andere Teile des Systems verschlechtern. Ein Beispiel dafür wäre, alle Indexseiten im Hauptspeicher zu belassen, was die Geschwindigkeit von Index-Lookups erhöhen würde, aber eventuell unzureichenden Speicher für Sortieroperationen oder Joins nach sich zieht [CN07].

Die letzte Phase des online Regelkreises ist derReaktionsschritt. Wenn der Vorher- sageschritt eine klare Empfehlung gibt, welcher Tuning-Parameter um welchen Wert angepasst werden sollte, dann muss theoretisch nur diese Anpassung vorgenommen werden. Aus praktischer Sicht ist es aber nicht einfach, ein System zu entwickeln, bei dem zur Laufzeit alle Tuning-Parameter geändert werden können, während das System seine Workload abarbeitet [CN07].

Ein DBMS das erfolgreich einen online Regelkreis in seinem Optimierer verwendet, ist DB2, dass einen Self-Tuning Optimierer namens LEO einsetzt [GLMK01].

Kephart et al. präsentieren in [KC03] eine Übersicht über die Eigenschaften von selbst verwaltenden Systemen. Dabei wird ein System als eine Menge von autonomen Elementen abstrahiert, die miteinander kommunizieren können. Jedes autonome Element hat seinen eigenen Regelkreis, der als MAPE (Monitor Analyse Plan Execute) bezeichnet wird.⁶ Im Mittelpunkt steht eine zu verwaltende Ressource, die durch einen Sensor

6In [CN07] besteht der Regelkreis aus drei Phasen und bei MAPE aus vier Phasen.

(36)

20 2.5. Self-Tuning

beobachtet wird. Die Informationen vom Sensor werden von einer Beobachtungkompo- nente entgegengenommen, die abhängig von den Eingabewerten die Analysekomponente benachrichtigt, die das System auf vorliegende Probleme analysiert. Anschließend werden Änderungen am System geplant, um das Problem zu beheben. Dieser Plan wird dann ausgeführt, indem die Ausführungskomponente den Effektor ansteuert. Eine Be- nachrichtigung anderer autonomer Elemente ist ebenfalls möglich. In allen Phasen des Zyklus können Informationen aus einer gemeinsamen Wissensbasis verwendet werden.

Die verwaltete Ressource, Sensor und Effektor stellen das zu verwaltende System dar und die übrigen Komponenten bilden den Autonomic Manager. Die erläuterten Zusam- menhänge wurden in Abbildung 2.5 visualisiert.

Beobachten (Monitor)

Analysieren Planen

Ausführen (Execute) Wissen

Autonomic Manager

Verwaltete Ressource

Sensor Effektor verwaltetes

System

Abbildung 2.5: IBMs Self-Tuning-Zyklus MAPE in Anlehnung an [KC03]

Self-Tuning Overhead

Self-Tuning verursacht immer einen zusätzlichen Aufwand, der immer mit betrachtet werden sollte. Beispiele hierfür sind der Verbrauch zusätzlicher CPU-Zeit und die Bele- gung von mehr Festplattenplatz für das Ablegen von Informationen für den Entschei- dungsprozess. Der vom Self-Tuning gebrachte Nutzen muss größer sein als die zusätzlich verursachten Kosten, sonst würde das System besser ohne das Self-Tuning arbeiten [GLMK01]. Es kann aber passieren, dass das Self-Tuning eine Fehlfunktion verursacht oder zu schwer lokalisierbaren Problemen führt. Aus diesem Grund muss es folgenden zwei Bedingungen genügen. Erstens muss Self-Tuning transparent arbeiten, d.h. seine Ak- tivitäten müssen verfolgbar sein, um das aktuelle Systemverhalten erklären zu können.

Zweitens muss es im Fehlerfall m¨oglich sein, das Self-Tuning abzuschalten und manuell die Tuning-Parameter einzustellen [LLH⁺06].

(37)

2.5.3 Zusammenfassung

In diesem Abschnitt wurde eine Einführung in das Self-Tuning von Datenbanksystemen gegeben. Dafür wurde die Thematik motiviert und die zugrunde liegenden Prinzipien erläutert. Im nächsten Abschnitt werden Interpolationsverfahren vorgestellt, die für das später zu konstruierende Modell verwendet werden.

2.6 Interpolationsverfahren

In diesem Abschnitt wird eine kurze Einführung von zwei Interpolationsverfahren gegeben, die später genutzt werden, um die Ausführungszeitkurven von Algorithmen zu schätzen. Zunächst wird die Methode der kleinsten Quadrate vorgestellt, um an- schließend die Grundlagen der Interpolation mit kubischen Splines zu erläutern. Der Abschnitt schließt mit einer Zusammenfassung.

2.6.1 Methode der kleinsten Quadrate

Die Inhalte dieses Abschnitt wurden, sofern nicht anders gekennzeichnet, aus [BKKN03]

entnommen. Ein Polynom m-ten Grades wird als N¨aherungsfunktion verwendet, um eine gegebene Datenmenge

(x1, y1),(x2, y2),· · · ,(xm, ym) anzun¨ahern, wobeim >=n+ 1 sein muss.⁷

y=f(x) = a₀+a₁x+a₂x²+· · ·+a_nx^m

Die beste N¨aherungsfunktion hat den kleinsten quadratischen Fehler. Dies hat den Vorteil, dass große Fehler stark bestraft werden und kleine Fehler (< 1) durch die Quadrierung noch weniger ins Gewicht fallen. Dies soll f¨ur eine insgesamt gute Ap- proximation sorgen.

min=F(a₀, a₁,· · ·, a_n) =

n

X

i=1

[y_i−f(x_i)]² =

n

X

i=1

[y_i−(a₀+a₁x+a₂x²+· · ·+a_nx^m)]² Die Unbekannten a₀, a₁,· · · , a_n sollen so bestimmt werden, dass der quadratische Fehler minimal wird. Ein Minimum wird dort erreicht, wo alle partiellen Ableitungen von F nach ai Null werden:

∂F

∂a_i = 0 ∀i∈ {1,2,· · · , n}

Für jede Ableitung entsteht eine Gleichung. Somit entsteht bei n Ableitungen ein Gleichungssystem mit n Unbekannten. Die Lösung des Gleichungssystems ergibt den gesuchten Lösungsvektor A = (a₀, a₁,· · · , a_n), mit dem das Interpolationspolynom aufgestellt werden kann.

7Wir brauchen mehr Datenpunkte als freie Parameter in der Gleichung.

(38)

22 2.6. Interpolationsverfahren

m

X

i=1

y_i =a₀

m

X

i=1

1 +a₁

m

X

i=1

x_i+a₂

m

X

i=1

x²_i +· · ·+a_n

m

X

i=1

xⁿ_i (2.1)

m

X

i=1

x_iy_i =a₀

m

X

i=1

x_i+a₁

m

X

i=1

x²_i +a₂

m

X

i=1

x³_i +· · ·+a_n

m

X

i=1

xⁿ⁺¹_i (2.2)

m

X

i=1

x²_iyi =a0 m

X

i=1

x²_i +a1 m

X

i=1

x³_i +a2 m

X

i=1

x⁴_i +· · ·+an m

X

i=1

xⁿ⁺²_i (2.3)

... (2.4)

m

X

i=1

xⁿ_iy_i =a₀

m

X

i=1

xⁿ_i +a₁

m

X

i=1

xⁿ⁺¹_i +a₂

m

X

i=1

xⁿ⁺²_i +· · ·+a_n

m

X

i=1

xⁿ⁺ⁿ_i (2.5) Als Ausgleichs/Regressionspolynom m-ten Grades ergibt sich f¨ur den Datensatz (x₁, y₁),· · ·(x_m, y_m):

f(x) =a₀+a₁x+a₂x² +· · ·+a_nx^m

Je nach genutztem Algorithmus und der Darstellung des Polynoms ist die Berech- nungskomplexität des Verfahrens anders. Polynom-Interpolation ist nur für Aufgaben mit einem kleinerem Umfang geeignet. Die Approximationsgüte wächst nicht notwendigerweise mit steigendem Polynomgrad. Es kommt bei zu hohem Polynomgraden zu Os- zillationen, die die Schätzgenauigkeit stark vermindern und das Verfahren unbrauchbar machen. Eine alternative Methode stellen die Splines dar, die zwar eine schlechtere Kon- vergenz als die Polynom-Interpolation aufweist, dafür aber bessere Schätzungen erreicht [SK09b].

2.6.2 Interpolation mit kubischen Splines

Kubische Spline-Interpolation ist eine schnelle, effiziente Methode für die Interpolation von Funktionen. Sie ist eine Alternative zur Polynom-Interpolation und funktioniert nach folgendem Prinzip: Das Interpolationsintervall wird in kleinere Teilintervalle unterteilt. In jedem dieser Teilintervalle wird die zu interpolierende Funktion durch ein kubisches Polynom approximiert. Die Koeffizienten des Polynoms werden so gewählt, dass bestimmte Bedingungen erfüllt sind, die von der genutzten Interpolationsmethode abhängen. Allgemeine Anforderungen sind Stetigkeit der Funktion, und dass sie durch alle gegebenen Punkte verläuft. Es könnten auch zusätzliche Anforderungen gestellt werden, z.B. die Linearität der Funktion zwischen Knoten [ALG12b].

Nun folgt die formalere Darstellung. Sei ∆ = {a = x0 < x1 < · · · < xn = b}

eine Unterteilung des Intervalls [a,b]. Dann ist eine Splinefunktion eine aus n kubischen Polynomen st¨uckweise zusammengesetzte Funktion S_∆. Dabei mussS_∆ und seine ersten beiden Ableitungen an den Intervallunterteilungen x1, x2,· · · , xn−1 stetig sein [FH07].

Die formale Definition aus [FH07] lautet:

Definition 1 Unter einer zu ∆ geh¨origen kubischen Spline Funktion S_∆ versteht man eine reelle Funktion S_∆: [a,b] 7→ R mit den Eigenschaften

(39)

a) S∆ ∈C² [a,b]: S∆ ist auf [a,b] zweimal stetig differenzierbar.

b) Auf jedem Teilintervall [x_i, x_i+1],i= 0,1,· · · , n−1, stimmt S_∆ mit einem kubischen Polynom ¨uberein.

Allerdings ist S_∆ noch nicht eindeutig bestimmt, weswegen noch zwei Zusatzbe- dingungen gefordert werden. Zwei m¨ogliche Zusatzforderungen sind, dass die zweite Ableitung der Splinefunktion an den Intervallgrenzen a und b Null wird und das an den gleichen Stellen die erste Ableitung der zu interpolierenden Funktion mit der ersten Ableitung der Splinefunktion ¨ubereinstimmt. Weitere Details sind in [FH07],[Far97] und [ALG12b] zu finden.

Die größten Vorteile der Spline-Interpolation sind ihre Stabilität und Berechnungsef- fizienz. Mengen von linearen Gleichungssystemen, welche für die Konstruktion der Splines gelöst werden müssen, sind sehr gut konditioniert⁸. Dadurch werden die Polynomko- effizienten präzise berechnet. Als Ergebnis bleibt das Berechnungsschema selbst für große N stabil. Die Konstruktion der Spline Koeffizienten Tabelle ist in linearer Zeit (O(n)) möglich, während die Interpolation nur logarithmischen Aufwand (O(log n)) hat [ALG12b].

Aufgrund dieser Eigenschaften ist es als Schätzverfahren für Ausführungszeiten in einem Self-Tuning-Datenbankmanagementsystem geeignet, da nur ein geringen Overhead und eine gute Schätzgenauigkeit zu erwarten sind. In Experimenten des Autors mit der Alglib [ALG12a] wurde für die Berechnung eines Schätzwertes zwischen 0 und 3µs benötigt, im Durchschnitt waren es 0.891465µ. Die Berechnung der Spline Funktion dauerte zwischen 260µs und 1468µs.

2.6.3 Zusammenfassung

In diesem Abschnitt wurde eine kurze Einführung in die Interpolationsverfahren Methode der kleinsten Quadrate und Spline-Interpolation gegeben. Im nächsten Abschnitt werden einige Grundlagen zu Grafikkarten gegeben, da sie einige Besonderheiten aufweisen, die für die späteren Diskussion in dieser Arbeit relevant sind.

2.7 GPU

In diesem Abschnitt wird eine kurze Einführung in den Aufbau und die Funktionsweise von GPUs gegeben. Zunächst erfolgt ein Überblick, um nachfolgend die zugrunde liegende Architektur vorzustellen. Anschließend folgt eine kurze Abgrenzung zwischen der von aktuellen GPUs genutzten SIMT-Architektur und der SIMD-Architektur. Der Abschnitt schließt mit einer Zusammenfassung.

2.7.1 Uberblick ¨

In den letzten Jahren ¨anderte sich die Nutzung von GPUs von rein graphischen Anwendungen zu einer Mehrzwecknutzung. Dieser Trend wird als General-Purpose-

8Sei Ax=b ein Gleichungssystem. Dann ist die Kondition einer Matrix A ein Maß dafür, wie empfind- lich der relative Fehler einer Lösung x ist, wenn Änderungen an der rechten Seite b vorgenommen werden [FH07].

(40)

24 2.7. GPU

Computation-on-Graphics-Processing-Units (GPGPU) bezeichnet, was zu deutsch

”Mehrzweckberechnungen auf Grafikkarten” bedeutet. Die Idee ist, dass Anwendungen, die einen hohen Grad an Datenparallelit¨at aufweisen, von der massiv parallelen Architek- tur von GPUs profitieren k¨onnen [NVI12a].

2.7.2 SIMT-Architektur

Abbildung 2.6: Grid aus Thread-Bl¨ocken, entnommen aus [NVI12b]

Die nun folgenden Erl¨auterungen zu GPUs werden am Beispiel von Nvidia GPUs und CUDA (Compute Unified Device Architecture). CUDA ist eine parallele Berech- nungsplattform und ein Programmiermodell, welches von NVIDIA entwickelt wurde [NVI12a].

Eine GPU wird in CUDA als CUDA-Device abstrahiert, welches im Kern ein skalier- bares Array von Multithread-Streaming-Multiprocessors (SMs) ist. Ein solcher Multi-