• Keine Ergebnisse gefunden

Konklusion

Im Dokument Hochschule Wismar (Seite 119-133)

6. Konklusion

6

Kapitel 6

Konklusion

„[J]edes Softwaresystem ab einem bestimmten Maß an Komplexität [enthält]

Fehler.“ [Lig09, S. 4]

Da es sich bei Data Warehouse und Business Intelligence Systemen um Software-systeme mit einer sehr hohen Komplexität handelt, ist die Gefahr für Fehler folglich besonders hoch. Die Bedeutung des Testens dieser Systeme wird jedoch in der Lite-ratur sehr wenig behandelt und auch in der Praxis findet es in der Regel weniger Be-trachtung, als oftmals nötig. Golfarelli und Rizzi haben diesbezüglich eine Unterneh-mensbefragung durchgeführt. Sie kommen zu dem Ergebnis, dass der Großteil der befragten Unternehmen das Testen im Business Intelligence und Data Warehouse Umfeld sehr informell und wenig organisiert angeht. [vgl. Gol11, S. 1183] Aus diesen Umständen ergab sich die Motivation für die Anfertigung dieser Arbeit. Das Ziel war dabei zu zeigen, was zu testen ist und welche Prüftechniken dabei angewendet wer-den können.

Um einen Überblick zu den Thematiken „Data Warehouse und Business Intelligence Systeme“ sowie „Testen von Software“ zu erlangen, wurden diese beiden Aspekte zunächst vorgestellt. Als Referenzarchitektur eines Data Warehouse Systems wurde der Ansatz nach Kimball et al. [Kim04] mit seinen Komponenten und Vorgehensmo-dellen gewählt. Anschließend wurden allgemeine Softwareprüftechniken beschrie-ben.

Im Hauptteil dieser Arbeit wurde analysiert, wie sich die Softwareprüftechniken auf die verschiedenen Teilbereiche eines Business Intelligence Systems anwenden las-sen. Als erstes wurde gezeigt, inwiefern sich Data Warehouse und Business Intelli-gence Systeme von klassischen Softwaresystemen unterscheiden. Danach wurden für die einzelnen Komponenten eines Business Intelligence Systems (Datenintegrati-on, Data Warehouse, OLAP-System, Reporting Front-End und Automatisierungssys-tem) anhand von Beispielen typische Fehlersituationen aus der Praxis beschrieben.

Zu diesen Situationen wurden exemplarisch Prüftechniken vorgestellt. Viele

allge-Kapitel 6 - Konklusion

meingültige Prüftechniken finden dabei ihren Einsatz wieder. Neben dem Testen der Implementierung lag ein zusätzlicher Fokus auf einem vorgelagerten Schritt: dem Überprüfen der multidimensionalen Modellierung.

Auch im alltäglichen Betrieb ist ein Business Intelligence System zu testen. Die Da-ten im Data Warehouse werden regelmäßig aktualisiert. Aufgrund der vielen Abhän-gigkeiten zu den umliegenden Quellsystemen, können fehlerhafte Datenlieferungen im Data Warehouse nicht ausgeschlossen werden. Damit keine falschen Informatio-nen in den Umlauf geraten, müssen besonders kritische Zahlen vor einer Freigabe geprüft werden. Mithilfe von Statistiken zu den Datenverarbeitungen kann sogar ein gewisses Maß an Automatisierung bei der Überprüfung erzielt werden. Mit einigen einfachen Vorkehrungen können Falschlieferungen im Betrieb schnell korrigiert wer-den.

Abschließend wurde beschrieben, wie die Infrastruktur für das Testen von Business Intelligence und Data Warehouse Systemen aussehen kann. Die Auswahl an Test-werkzeugen hält sich im Vergleich zur klassischen Softwareentwicklung sehr stark in Grenzen. Für das Überprüfen von Daten in relationalen Tabellen wurde ein Test-werkzeug vorgestellt.

Mit den Ergebnissen dieser Arbeit können Unternehmen ihre Testaktivitäten bezüg-lich Data Warehouse und Business Intelligence Systemen besser strukturieren. Die oftmals informellen, impliziten Tests lassen sich mit den vorgestellten Prüftechniken formalisieren und konkretisieren, sodass bessere Testergebnisse zu erwarten sind.

Anhang A: Business Intelligence System in der Praxis

Anhang A: Business Intelligence System in der Praxis

Die folgende Abbildung zeigt, wie ein Business Intelligence System in der Realität aussehen kann. Für die fünf Komponenten kommen auch fünf verschiedene Produk-te zum Einsatz. Nähere Beschreibungen zu den einzelnen ProdukProduk-ten können auf den Produkt-Websites nachgelesen werden: Talend, IBM DB2, Oracle Essbase, Oracle Hyperion, UC4 (jeweils Abgerufen 12.02.2012).

Abbildung A-1: Business Intelligence System in der Praxis [Eigene Darstellung]

Anhang B: ADAPT-Notation

Anhang B: ADAPT-Notation

ADAPT ist eine multidimensionale Modellierungssprache. In der folgenden Abbildung sind die wichtigsten Notationselemente kurz beschrieben. Eine ausführliche Be-schreibung der Sprache kann in [Sym06] nachgelesen werden.

Der OLAP-Würfel. Die Kennzahlen wer-den als eigene Dimension dargestellt (Kennzahlendimension).

Eine Dimension (Kante) des Würfels.

Eine Hierarchie einer Dimension.

Eine Aggregationsstufe innerhalb einer Dimension.

Ein eindeutiges Element einer Dimension.

Zusätzliches (beschreibendes Attribut) einer Dimension.

Formel zum Berechnen abgeleiteter Kennzahlen.

Lose Zuordnung.

Strikte Zuordnung.

Abbildung B-1: ADAPT-Notation [vgl. Sym06]

Abkürzungsverzeichnis

Abkürzungsverzeichnis

ADAPT Application Design for Analytical Processing Technologies AktG Aktiengesetz

BI Business Intelligence

BICC Business Intelligence Competence Center BIS Business Intelligence System

DI Datenintegration

DSS Decision Support System DW Data Warehouse

DWS Data Warehouse System ER Entity-Relationship

ETL Extraktion, Transformation, Laden HOLAP Hybrides Online-Analytical-Processing

KonTraG Gesetz zur Kontrolle und Transparenz im Unternehmensbereich MDBMS Multidimensionales Datenbankmanagementsystem

MOLAP Multidimensionales Online-Analytical-Processing OLAP Online-Analytical-Processing

OLTP Online-Transaction-Processing

RDBMS Relationales Datenbankmanagementsystem RI Referentielle Integrität

ROLAP Relationales Online-Analytical-Processing SCD Slowly Changing Dimension

UML Unified Modeling Language VSNR Versicherungsscheinnummer

Abbildungsverzeichnis

Abbildungsverzeichnis

Abbildung 2-1: Zusammenhang von BIS und DWS... 7

Abbildung 2-2: Heterogenität von Quellsystemen ... 10

Abbildung 2-3: Spreadsheet Reporting (Excel) ... 12

Abbildung 2-4: OLAP-Würfel ... 13

Abbildung 2-5: Zeit-Hierarchie ... 14

Abbildung 2-6: OLAP-Würfel Perspektiven ... 15

Abbildung 2-7: Operatives Schema und Sternschema ... 16

Abbildung 2-8: Exaktheit von Daten ... 17

Abbildung 2-9: Business Intelligence System Big Picture ... 22

Abbildung 2-10: Klassifikation der Softwareprüftechniken ... 24

Abbildung 2-11: V-Modell ... 25

Abbildung 2-12: Wasserfallmodell vs. Prototyp ... 26

Abbildung 2-13: Ursache-Wirkungs-Graph Notation ... 29

Abbildung 2-14: Kontrollflussgraph ... 31

Abbildung 2-15: Datenflussgraph ... 32

Abbildung 2-16: Zustandsautomat Datenflussanomalien ... 36

Abbildung 3-1: Softwareentwicklungsprozess ... 42

Abbildung 3-2: ADAPT-Modell... 46

Abbildung 3-3: Standarddimension Zeit ... 47

Abbildung 3-4: Gleichheitsfaktorquadrant ... 50

Abbildung 3-5: Ungenauigkeit bei Gleitkommazahlen ... 52

Abbildung 3-6: Einlesen eines COBOL Copybooks (Talend) ... 56

Abbildung 3-7: Datenqualitätsregeln (Talend) ... 57

Abbildung 3-8: Ursache-Wirkungs-Graph - Qualitätsregeln ... 58

Abbildung 3-9: Ursache-Wirkungs-Graph - Typ 1 SCD ... 60

Abbildung 3-10: Datenflussgraph (Talend) ... 61

Abbildung 3-11: Datenflussanomalieanalyse (Talend) ... 63

Abbildung 3-12: Data Lineage Analyse (Talend) ... 65

Abbildung 3-13: Tabelle Dim_Absatzgebiet ... 76

Abbildung 3-14: Korrekte Dimensionsladeregel (Jedox) ... 76

Abbildung 3-15: Falsche Dimensionsladeregel (Jedox) ... 77

Abbildung 3-16: Geladene Dimensionen (Jedox) ... 77

Abbildungsverzeichnis

Abbildung 3-17: Faktenladeregel (Jedox) ... 78

Abbildung 3-18: ADAPT-Modell erweitert um Konsolidierungen ... 81

Abbildung 3-19: Job-Programmablaufplan ... 90

Abbildung 5-1: Fehlgeschlagener Datenbank-Testfall (DbUnit)... 109

Abbildung 5-2: OLAP-Testfall (Excel) ... 111

Abbildung 5-3: Test Unit Job (Talend) ... 112

Abbildung A-1: Business Intelligence System in der Praxis ... 116

Abbildung B-1: ADAPT-Notation ... 117

Tabellenverzeichnis

Tabellenverzeichnis

Tabelle 2-1: Operative vs. dispositive Daten ... 9

Tabelle 2-2: Originaldaten aus Quellsystem ... 19

Tabelle 2-3: Gesäuberte Daten ... 19

Tabelle 2-4: Harmonisierte Daten ... 20

Tabelle 2-5: Daten im Sternschema ... 20

Tabelle 2-6: Fehlerkosten ... 25

Tabelle 2-7: Grenzwerte ... 28

Tabelle 2-8: Äquivalenzklassen ... 28

Tabelle 2-9: Entscheidungstabelle ... 30

Tabelle 2-10: Variablenzugriffe (Datenflussgraph) ... 32

Tabelle 2-11: Variablenzugriffe (Datenflussanomalieanalyse)... 36

Tabelle 3-1: Fakten und Dimensionen ... 45

Tabelle 3-2: Bus-Matrix ... 49

Tabelle 3-3: Mapping-Tabelle ... 54

Tabelle 3-4: Typ 2 SCD ... 54

Tabelle 3-5: Äquivalenzklassen für COBOL Copybook ... 55

Tabelle 3-6: Entscheidungstabelle - Qualitätsregeln ... 59

Tabelle 3-7: Entscheidungstabelle - Typ 1 SCD ... 60

Tabelle 3-8: Eltern-Kind-Beziehung ... 72

Tabelle 3-9: Vollständige Generation ... 72

Tabelle 3-10: Laden von Kennzahlen ... 73

Tabelle 3-11: Falsche und korrekte Konsolidierung ... 74

Tabelle 3-12: Äquivalenzklassen zum Testen der Dimensionalität... 75

Tabelle 3-13: Korrekte Darstellung von Kennzahlen ... 85

Tabelle 3-14: Sicherheitsrollen ... 86

Tabelle 3-15: Entscheidungstabelle Sicherheitsrollen ... 87

Tabelle 3-16: Prozess-Reihenfolge ... 88

Tabelle 3-17: Prüftechniken Big Picture ... 91

Tabelle 4-1: Zeitscheiben mit Prozess-ID ... 100

Listingverzeichnis

Listingverzeichnis

Listing 2-1: SQL für Spreadsheet Reporting ... 12

Listing 2-2: Syntaktische Programmierkonventionen ... 34

Listing 3-1: COBOL Copybook ... 51

Listing 3-2: Ungenauigkeit bei Gleitkommazahlen... 52

Listing 3-3: Struktur einer Kunden-Tabelle ... 68

Listing 3-4: SQL-Statements zum Testen der Kunden-Tabelle ... 68

Listing 3-5: SQL-Programmierkonventionen... 70

Listing 3-6: Berechnungsregel (Essbase) ... 79

Listing 3-7: Sicherheitsfilter (Essbase) ... 84

Listing 4-1: Korrigieren einer falschen Lieferung ... 101

Listing 5-1: Erwartete Datenätze als XML-Datei (DbUnit) ... 108

Listing 5-2: Datenbank-Testfall (DbUnit) ... 109

Listing 5-3: Datenbank-Testfall für Strukturen (DbUnit) ... 110

Formelverzeichnis

Formelverzeichnis

Formel 3-1: Konformitätsfaktor ... 48 Formel 3-2: Gleichheitsfaktor ... 49 Formel 3-3: Maximale Größe eines Essbase BSO-Würfels ... 81

Literaturverzeichnis

Literaturverzeichnis

[AktG] BUNDESGESETZBLATT DEUTSCHLAND: Aktiengesetz

36. Auflage, Deutscher Taschenbuch Verlag, München, 2003 [Amb06] S.W.AMBLER,P.J.SADALAGE:

Refactoring Databases: Evolutionary Database Design 1. Auflage, Addison-Wesley Longman, Amsterdam, 2006 [BSI] BUNDESAMT FÜR SICHERHEIT IN DER INFORMATIONSTECHNIK:

M 7.9 Datenschutzrechtliche Freigabe

https://www.bsi.bund.de/ContentBSI/grundschutz/baustein-datenschutz/html/m07009.html (Abgerufen 12.02.2012) [Bha07] S.R.BHAT:

Data Warehouse Testing – Practical Approach Whitepaper, 2007

Studienbrief, WINGS - Wismar International Graduation Services GmbH, Wismar, 2010

[Coo02] R.COOPER,S.ARBUCKLE:

Ho to Thoroghly Test a Data Warehouse Whitepaper, 2002

http://www.stickyminds.com/s.asp?F=S5941_ART_2 (Abgerufen 12.02.2012)

[Gol09] M.GOLFARELLI,S.RIZZI:

Data warehouse testing: A prototype-based methodology

In: Proceedings 12th International Workshop on Data Warehousing and OLAP (DOLAP 2009), S. 17-24, Hong Kong, 2009

[Gol11] M.GOLFARELLI,S.RIZZI:

Data warehouse testing: A prototype-based methodology

In: Information and Software Technology, Volume 53, Number 11, S. 1183-1198, 2011

Literaturverzeichnis

[Han05] H.R.HANSEN,G.NEUMANN:

Wirtschaftsinformatik 1 - Grundlagen und Anwendung 9. Auflage, Lucius & Lucius, Stuttgart, 2005

[Her01] O.HERDEN:

Eine Entwurfsmethodik für Data Warehouses

Dissertation, Carl von Ossietzky Universität Oldenburg, 2001

http://oops.uni-oldenburg.de/volltexte/2002/307/ (Abgerufen 15.01.2012) [Hin02] H.HINRICHS:

Datenqualitätsmanagement in Data Warehouse-Systemen Dissertation, Carl von Ossietzky Universität Oldenburg, 2002

http://oops.uni-oldenburg.de/volltexte/2002/309/ (Abgerufen 15.01.2012) [Hof08] D.W.HOFFMANN:

Software-Qualität

1. Auflage, Springer-Verlag, Berlin/Heidelberg, 2008 [Inf10] INFOSYS LIMITED:

4. Auflage, Wiley Publishing, Indianapolis, 2005 [Kam10] R.KAMAL,NAKUL:

Adventures with Testing BI/DW Application: On a crusade to find the Holy Grail

Whitepaper, 2010

http://www.stickyminds.com/s.asp?F=S15975_ART_2 (Abgerufen 12.02.2012)

[Kem10] H.-G.KEMPER,H.BAARS,W.MEHANNA:

Business Intelligence - Grundlagen und praktische Anwendung 3. Auflage, Vieweg + Teubner Verlag, Wiesbaden, 2010

[Kim02] R.KIMBALL,M.ROSS:

The Data Warehouse Toolkit

2. Auflage, John Wiley & Sons, 2002 [Kim04] R.KIMBALL,J.CASERTA:

The Data Warehouse ETL Toolkit

1. Auflage, Wiley Publishing, Indianapolis, 2004

Literaturverzeichnis

[Koe07] H.KÖNIG:

Grundlagen der Objektorientierung

Lehrskript, Fachhochschule für die Wirtschaft (FHDW), Hannover, 2007 [Koe09] H.KÖNIG:

Formale Grundlagen entscheidungsunterstützender Systeme

Lehrskript, Fachhochschule für die Wirtschaft (FHDW), Hannover, 2009 [Lig09] P.LIGGESMEYER:

Softwarequalität

2. Auflage, Spektrum Akademischer Verlag, Heidelberg, 2009 [Moo08] A.MOOKERJEA,P.MALISETTY:

Data Warehouse / ETL Testing: Best Practices Whitepaper, 2008

http://test2008.in/Test2008/pdf/Anandiya et al - Best Practices in data warehouse testing.pdf (Abgerufen 12.02.2012)

[Ols03] J.E.OLSEN:

Data Quality: The Accuracy Dimension

1. Auflage, Morgan Kaufmann Publishers, 2003 [Ora10] ORACLE:

Oracle Essbase 11.1.2 Bootcamp Schulungsunterlagen, 2010 [Rai08] V.RAINARDI:

Building a Data Warehouse: With Examples in SQL Server 1. Auflage, Apress, 2008

[Sch07] F.C.SCHRÖDER:

Vergleichende Analyse von ETL-Konzepten für latenzzeitsensible Data Warehouse Architekturen

Diplomarbeit, Otto-von-Guericke-Universität Magdeburg, 2007 http://wwwiti.cs.uni-magdeburg.de/iti_db/publikationen/ps/

auto/thesisSchroeder.pdf (Abgerufen 16.02.2012) [Sco09] M.SCOTT:

The Shortcut Guide to IT Workload Automation and Job Scheduling 1. Auflage, Realtime Publishers, 2009

[Sha07] R.K.SHARMA:

Test Automation: Im Data Warehouse Projects Whitepaper, 2007

http://www.stickyminds.com/s.asp?F=S13590_ART_2 (Abgerufen 12.02.2012)

Literaturverzeichnis

[Sne09] H.M.SNEED,M.BAUMGARTNER,R.SEIDEL: Der Systemtest

2. Auflage, Carl Hanser Verlag, München, 2009 [Spi03] A.SPILLNER,T.LINZ:

Basiswissen Softwaretest

3. Auflage, dpunkt Verlag, Heidelberg, 2005 [Sun07] A.SUNDARARAMAN:

Testing for DW/BI - Current State and a Peek into Future Whitepaper, 2007

http://www.information-management.com/infodirect/20070622/-1083670-1.html?zkPrintable=true (Abgerufen 12.02.2012) [Sym06] SYMMETRY CORPORATION:

Getting Started with ADAPT™

Whitepaper, 2006

http://www.symcorp.com/downloads/ADAPT_white_paper.pdf (Abgerufen 15.01.2012)

[The07] J.THEOBALD:

Strategies for Testing Data Warehouse Applications Whitepaper, 2007

http://www.information-management.com/issues/20070601/1086005-1.html?zkPrintable=true (Abgerufen 12.02.2012)

[Tot00] A.TOTOK:

Modellierung von OLAP- und Data-Warehouse-Systemen 1. Auflage, Deutscher Universitäts-Verlag, Wiesbaden, 2000

Ehrenwörtliche Erklärung

Ehrenwörtliche Erklärung

Ich erkläre hiermit ehrenwörtlich, dass ich die vorliegende Arbeit selbstständig ange-fertigt habe. Die aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als solche kenntlich gemacht. Es wurden keine anderen als die angegebenen Quellen und Hinweise verwandt.

Die vorliegende Arbeit wurde bisher keiner anderen Prüfungsbehörde vorgelegt und auch noch nicht veröffentlicht.

Hannover, 20. Februar 2012 _________________________

(Renke Hegeler)

Im Dokument Hochschule Wismar (Seite 119-133)