6. Konklusion
6
Kapitel 6Konklusion
„[J]edes Softwaresystem ab einem bestimmten Maß an Komplexität [enthält]
Fehler.“ [Lig09, S. 4]
Da es sich bei Data Warehouse und Business Intelligence Systemen um Software-systeme mit einer sehr hohen Komplexität handelt, ist die Gefahr für Fehler folglich besonders hoch. Die Bedeutung des Testens dieser Systeme wird jedoch in der Lite-ratur sehr wenig behandelt und auch in der Praxis findet es in der Regel weniger Be-trachtung, als oftmals nötig. Golfarelli und Rizzi haben diesbezüglich eine Unterneh-mensbefragung durchgeführt. Sie kommen zu dem Ergebnis, dass der Großteil der befragten Unternehmen das Testen im Business Intelligence und Data Warehouse Umfeld sehr informell und wenig organisiert angeht. [vgl. Gol11, S. 1183] Aus diesen Umständen ergab sich die Motivation für die Anfertigung dieser Arbeit. Das Ziel war dabei zu zeigen, was zu testen ist und welche Prüftechniken dabei angewendet wer-den können.
Um einen Überblick zu den Thematiken „Data Warehouse und Business Intelligence Systeme“ sowie „Testen von Software“ zu erlangen, wurden diese beiden Aspekte zunächst vorgestellt. Als Referenzarchitektur eines Data Warehouse Systems wurde der Ansatz nach Kimball et al. [Kim04] mit seinen Komponenten und Vorgehensmo-dellen gewählt. Anschließend wurden allgemeine Softwareprüftechniken beschrie-ben.
Im Hauptteil dieser Arbeit wurde analysiert, wie sich die Softwareprüftechniken auf die verschiedenen Teilbereiche eines Business Intelligence Systems anwenden las-sen. Als erstes wurde gezeigt, inwiefern sich Data Warehouse und Business Intelli-gence Systeme von klassischen Softwaresystemen unterscheiden. Danach wurden für die einzelnen Komponenten eines Business Intelligence Systems (Datenintegrati-on, Data Warehouse, OLAP-System, Reporting Front-End und Automatisierungssys-tem) anhand von Beispielen typische Fehlersituationen aus der Praxis beschrieben.
Zu diesen Situationen wurden exemplarisch Prüftechniken vorgestellt. Viele
allge-Kapitel 6 - Konklusion
meingültige Prüftechniken finden dabei ihren Einsatz wieder. Neben dem Testen der Implementierung lag ein zusätzlicher Fokus auf einem vorgelagerten Schritt: dem Überprüfen der multidimensionalen Modellierung.
Auch im alltäglichen Betrieb ist ein Business Intelligence System zu testen. Die Da-ten im Data Warehouse werden regelmäßig aktualisiert. Aufgrund der vielen Abhän-gigkeiten zu den umliegenden Quellsystemen, können fehlerhafte Datenlieferungen im Data Warehouse nicht ausgeschlossen werden. Damit keine falschen Informatio-nen in den Umlauf geraten, müssen besonders kritische Zahlen vor einer Freigabe geprüft werden. Mithilfe von Statistiken zu den Datenverarbeitungen kann sogar ein gewisses Maß an Automatisierung bei der Überprüfung erzielt werden. Mit einigen einfachen Vorkehrungen können Falschlieferungen im Betrieb schnell korrigiert wer-den.
Abschließend wurde beschrieben, wie die Infrastruktur für das Testen von Business Intelligence und Data Warehouse Systemen aussehen kann. Die Auswahl an Test-werkzeugen hält sich im Vergleich zur klassischen Softwareentwicklung sehr stark in Grenzen. Für das Überprüfen von Daten in relationalen Tabellen wurde ein Test-werkzeug vorgestellt.
Mit den Ergebnissen dieser Arbeit können Unternehmen ihre Testaktivitäten bezüg-lich Data Warehouse und Business Intelligence Systemen besser strukturieren. Die oftmals informellen, impliziten Tests lassen sich mit den vorgestellten Prüftechniken formalisieren und konkretisieren, sodass bessere Testergebnisse zu erwarten sind.
Anhang A: Business Intelligence System in der Praxis
Anhang A: Business Intelligence System in der Praxis
Die folgende Abbildung zeigt, wie ein Business Intelligence System in der Realität aussehen kann. Für die fünf Komponenten kommen auch fünf verschiedene Produk-te zum Einsatz. Nähere Beschreibungen zu den einzelnen ProdukProduk-ten können auf den Produkt-Websites nachgelesen werden: Talend, IBM DB2, Oracle Essbase, Oracle Hyperion, UC4 (jeweils Abgerufen 12.02.2012).
Abbildung A-1: Business Intelligence System in der Praxis [Eigene Darstellung]
Anhang B: ADAPT-Notation
Anhang B: ADAPT-Notation
ADAPT ist eine multidimensionale Modellierungssprache. In der folgenden Abbildung sind die wichtigsten Notationselemente kurz beschrieben. Eine ausführliche Be-schreibung der Sprache kann in [Sym06] nachgelesen werden.
Der OLAP-Würfel. Die Kennzahlen wer-den als eigene Dimension dargestellt (Kennzahlendimension).
Eine Dimension (Kante) des Würfels.
Eine Hierarchie einer Dimension.
Eine Aggregationsstufe innerhalb einer Dimension.
Ein eindeutiges Element einer Dimension.
Zusätzliches (beschreibendes Attribut) einer Dimension.
Formel zum Berechnen abgeleiteter Kennzahlen.
Lose Zuordnung.
Strikte Zuordnung.
Abbildung B-1: ADAPT-Notation [vgl. Sym06]
Abkürzungsverzeichnis
Abkürzungsverzeichnis
ADAPT Application Design for Analytical Processing Technologies AktG Aktiengesetz
BI Business Intelligence
BICC Business Intelligence Competence Center BIS Business Intelligence System
DI Datenintegration
DSS Decision Support System DW Data Warehouse
DWS Data Warehouse System ER Entity-Relationship
ETL Extraktion, Transformation, Laden HOLAP Hybrides Online-Analytical-Processing
KonTraG Gesetz zur Kontrolle und Transparenz im Unternehmensbereich MDBMS Multidimensionales Datenbankmanagementsystem
MOLAP Multidimensionales Online-Analytical-Processing OLAP Online-Analytical-Processing
OLTP Online-Transaction-Processing
RDBMS Relationales Datenbankmanagementsystem RI Referentielle Integrität
ROLAP Relationales Online-Analytical-Processing SCD Slowly Changing Dimension
UML Unified Modeling Language VSNR Versicherungsscheinnummer
Abbildungsverzeichnis
Abbildungsverzeichnis
Abbildung 2-1: Zusammenhang von BIS und DWS... 7
Abbildung 2-2: Heterogenität von Quellsystemen ... 10
Abbildung 2-3: Spreadsheet Reporting (Excel) ... 12
Abbildung 2-4: OLAP-Würfel ... 13
Abbildung 2-5: Zeit-Hierarchie ... 14
Abbildung 2-6: OLAP-Würfel Perspektiven ... 15
Abbildung 2-7: Operatives Schema und Sternschema ... 16
Abbildung 2-8: Exaktheit von Daten ... 17
Abbildung 2-9: Business Intelligence System Big Picture ... 22
Abbildung 2-10: Klassifikation der Softwareprüftechniken ... 24
Abbildung 2-11: V-Modell ... 25
Abbildung 2-12: Wasserfallmodell vs. Prototyp ... 26
Abbildung 2-13: Ursache-Wirkungs-Graph Notation ... 29
Abbildung 2-14: Kontrollflussgraph ... 31
Abbildung 2-15: Datenflussgraph ... 32
Abbildung 2-16: Zustandsautomat Datenflussanomalien ... 36
Abbildung 3-1: Softwareentwicklungsprozess ... 42
Abbildung 3-2: ADAPT-Modell... 46
Abbildung 3-3: Standarddimension Zeit ... 47
Abbildung 3-4: Gleichheitsfaktorquadrant ... 50
Abbildung 3-5: Ungenauigkeit bei Gleitkommazahlen ... 52
Abbildung 3-6: Einlesen eines COBOL Copybooks (Talend) ... 56
Abbildung 3-7: Datenqualitätsregeln (Talend) ... 57
Abbildung 3-8: Ursache-Wirkungs-Graph - Qualitätsregeln ... 58
Abbildung 3-9: Ursache-Wirkungs-Graph - Typ 1 SCD ... 60
Abbildung 3-10: Datenflussgraph (Talend) ... 61
Abbildung 3-11: Datenflussanomalieanalyse (Talend) ... 63
Abbildung 3-12: Data Lineage Analyse (Talend) ... 65
Abbildung 3-13: Tabelle Dim_Absatzgebiet ... 76
Abbildung 3-14: Korrekte Dimensionsladeregel (Jedox) ... 76
Abbildung 3-15: Falsche Dimensionsladeregel (Jedox) ... 77
Abbildung 3-16: Geladene Dimensionen (Jedox) ... 77
Abbildungsverzeichnis
Abbildung 3-17: Faktenladeregel (Jedox) ... 78
Abbildung 3-18: ADAPT-Modell erweitert um Konsolidierungen ... 81
Abbildung 3-19: Job-Programmablaufplan ... 90
Abbildung 5-1: Fehlgeschlagener Datenbank-Testfall (DbUnit)... 109
Abbildung 5-2: OLAP-Testfall (Excel) ... 111
Abbildung 5-3: Test Unit Job (Talend) ... 112
Abbildung A-1: Business Intelligence System in der Praxis ... 116
Abbildung B-1: ADAPT-Notation ... 117
Tabellenverzeichnis
Tabellenverzeichnis
Tabelle 2-1: Operative vs. dispositive Daten ... 9
Tabelle 2-2: Originaldaten aus Quellsystem ... 19
Tabelle 2-3: Gesäuberte Daten ... 19
Tabelle 2-4: Harmonisierte Daten ... 20
Tabelle 2-5: Daten im Sternschema ... 20
Tabelle 2-6: Fehlerkosten ... 25
Tabelle 2-7: Grenzwerte ... 28
Tabelle 2-8: Äquivalenzklassen ... 28
Tabelle 2-9: Entscheidungstabelle ... 30
Tabelle 2-10: Variablenzugriffe (Datenflussgraph) ... 32
Tabelle 2-11: Variablenzugriffe (Datenflussanomalieanalyse)... 36
Tabelle 3-1: Fakten und Dimensionen ... 45
Tabelle 3-2: Bus-Matrix ... 49
Tabelle 3-3: Mapping-Tabelle ... 54
Tabelle 3-4: Typ 2 SCD ... 54
Tabelle 3-5: Äquivalenzklassen für COBOL Copybook ... 55
Tabelle 3-6: Entscheidungstabelle - Qualitätsregeln ... 59
Tabelle 3-7: Entscheidungstabelle - Typ 1 SCD ... 60
Tabelle 3-8: Eltern-Kind-Beziehung ... 72
Tabelle 3-9: Vollständige Generation ... 72
Tabelle 3-10: Laden von Kennzahlen ... 73
Tabelle 3-11: Falsche und korrekte Konsolidierung ... 74
Tabelle 3-12: Äquivalenzklassen zum Testen der Dimensionalität... 75
Tabelle 3-13: Korrekte Darstellung von Kennzahlen ... 85
Tabelle 3-14: Sicherheitsrollen ... 86
Tabelle 3-15: Entscheidungstabelle Sicherheitsrollen ... 87
Tabelle 3-16: Prozess-Reihenfolge ... 88
Tabelle 3-17: Prüftechniken Big Picture ... 91
Tabelle 4-1: Zeitscheiben mit Prozess-ID ... 100
Listingverzeichnis
Listingverzeichnis
Listing 2-1: SQL für Spreadsheet Reporting ... 12
Listing 2-2: Syntaktische Programmierkonventionen ... 34
Listing 3-1: COBOL Copybook ... 51
Listing 3-2: Ungenauigkeit bei Gleitkommazahlen... 52
Listing 3-3: Struktur einer Kunden-Tabelle ... 68
Listing 3-4: SQL-Statements zum Testen der Kunden-Tabelle ... 68
Listing 3-5: SQL-Programmierkonventionen... 70
Listing 3-6: Berechnungsregel (Essbase) ... 79
Listing 3-7: Sicherheitsfilter (Essbase) ... 84
Listing 4-1: Korrigieren einer falschen Lieferung ... 101
Listing 5-1: Erwartete Datenätze als XML-Datei (DbUnit) ... 108
Listing 5-2: Datenbank-Testfall (DbUnit) ... 109
Listing 5-3: Datenbank-Testfall für Strukturen (DbUnit) ... 110
Formelverzeichnis
Formelverzeichnis
Formel 3-1: Konformitätsfaktor ... 48 Formel 3-2: Gleichheitsfaktor ... 49 Formel 3-3: Maximale Größe eines Essbase BSO-Würfels ... 81
Literaturverzeichnis
Literaturverzeichnis
[AktG] BUNDESGESETZBLATT DEUTSCHLAND: Aktiengesetz
36. Auflage, Deutscher Taschenbuch Verlag, München, 2003 [Amb06] S.W.AMBLER,P.J.SADALAGE:
Refactoring Databases: Evolutionary Database Design 1. Auflage, Addison-Wesley Longman, Amsterdam, 2006 [BSI] BUNDESAMT FÜR SICHERHEIT IN DER INFORMATIONSTECHNIK:
M 7.9 Datenschutzrechtliche Freigabe
https://www.bsi.bund.de/ContentBSI/grundschutz/baustein-datenschutz/html/m07009.html (Abgerufen 12.02.2012) [Bha07] S.R.BHAT:
Data Warehouse Testing – Practical Approach Whitepaper, 2007
Studienbrief, WINGS - Wismar International Graduation Services GmbH, Wismar, 2010
[Coo02] R.COOPER,S.ARBUCKLE:
Ho to Thoroghly Test a Data Warehouse Whitepaper, 2002
http://www.stickyminds.com/s.asp?F=S5941_ART_2 (Abgerufen 12.02.2012)
[Gol09] M.GOLFARELLI,S.RIZZI:
Data warehouse testing: A prototype-based methodology
In: Proceedings 12th International Workshop on Data Warehousing and OLAP (DOLAP 2009), S. 17-24, Hong Kong, 2009
[Gol11] M.GOLFARELLI,S.RIZZI:
Data warehouse testing: A prototype-based methodology
In: Information and Software Technology, Volume 53, Number 11, S. 1183-1198, 2011
Literaturverzeichnis
[Han05] H.R.HANSEN,G.NEUMANN:
Wirtschaftsinformatik 1 - Grundlagen und Anwendung 9. Auflage, Lucius & Lucius, Stuttgart, 2005
[Her01] O.HERDEN:
Eine Entwurfsmethodik für Data Warehouses
Dissertation, Carl von Ossietzky Universität Oldenburg, 2001
http://oops.uni-oldenburg.de/volltexte/2002/307/ (Abgerufen 15.01.2012) [Hin02] H.HINRICHS:
Datenqualitätsmanagement in Data Warehouse-Systemen Dissertation, Carl von Ossietzky Universität Oldenburg, 2002
http://oops.uni-oldenburg.de/volltexte/2002/309/ (Abgerufen 15.01.2012) [Hof08] D.W.HOFFMANN:
Software-Qualität
1. Auflage, Springer-Verlag, Berlin/Heidelberg, 2008 [Inf10] INFOSYS LIMITED:
4. Auflage, Wiley Publishing, Indianapolis, 2005 [Kam10] R.KAMAL,NAKUL:
Adventures with Testing BI/DW Application: On a crusade to find the Holy Grail
Whitepaper, 2010
http://www.stickyminds.com/s.asp?F=S15975_ART_2 (Abgerufen 12.02.2012)
[Kem10] H.-G.KEMPER,H.BAARS,W.MEHANNA:
Business Intelligence - Grundlagen und praktische Anwendung 3. Auflage, Vieweg + Teubner Verlag, Wiesbaden, 2010
[Kim02] R.KIMBALL,M.ROSS:
The Data Warehouse Toolkit
2. Auflage, John Wiley & Sons, 2002 [Kim04] R.KIMBALL,J.CASERTA:
The Data Warehouse ETL Toolkit
1. Auflage, Wiley Publishing, Indianapolis, 2004
Literaturverzeichnis
[Koe07] H.KÖNIG:
Grundlagen der Objektorientierung
Lehrskript, Fachhochschule für die Wirtschaft (FHDW), Hannover, 2007 [Koe09] H.KÖNIG:
Formale Grundlagen entscheidungsunterstützender Systeme
Lehrskript, Fachhochschule für die Wirtschaft (FHDW), Hannover, 2009 [Lig09] P.LIGGESMEYER:
Softwarequalität
2. Auflage, Spektrum Akademischer Verlag, Heidelberg, 2009 [Moo08] A.MOOKERJEA,P.MALISETTY:
Data Warehouse / ETL Testing: Best Practices Whitepaper, 2008
http://test2008.in/Test2008/pdf/Anandiya et al - Best Practices in data warehouse testing.pdf (Abgerufen 12.02.2012)
[Ols03] J.E.OLSEN:
Data Quality: The Accuracy Dimension
1. Auflage, Morgan Kaufmann Publishers, 2003 [Ora10] ORACLE:
Oracle Essbase 11.1.2 Bootcamp Schulungsunterlagen, 2010 [Rai08] V.RAINARDI:
Building a Data Warehouse: With Examples in SQL Server 1. Auflage, Apress, 2008
[Sch07] F.C.SCHRÖDER:
Vergleichende Analyse von ETL-Konzepten für latenzzeitsensible Data Warehouse Architekturen
Diplomarbeit, Otto-von-Guericke-Universität Magdeburg, 2007 http://wwwiti.cs.uni-magdeburg.de/iti_db/publikationen/ps/
auto/thesisSchroeder.pdf (Abgerufen 16.02.2012) [Sco09] M.SCOTT:
The Shortcut Guide to IT Workload Automation and Job Scheduling 1. Auflage, Realtime Publishers, 2009
[Sha07] R.K.SHARMA:
Test Automation: Im Data Warehouse Projects Whitepaper, 2007
http://www.stickyminds.com/s.asp?F=S13590_ART_2 (Abgerufen 12.02.2012)
Literaturverzeichnis
[Sne09] H.M.SNEED,M.BAUMGARTNER,R.SEIDEL: Der Systemtest
2. Auflage, Carl Hanser Verlag, München, 2009 [Spi03] A.SPILLNER,T.LINZ:
Basiswissen Softwaretest
3. Auflage, dpunkt Verlag, Heidelberg, 2005 [Sun07] A.SUNDARARAMAN:
Testing for DW/BI - Current State and a Peek into Future Whitepaper, 2007
http://www.information-management.com/infodirect/20070622/-1083670-1.html?zkPrintable=true (Abgerufen 12.02.2012) [Sym06] SYMMETRY CORPORATION:
Getting Started with ADAPT™
Whitepaper, 2006
http://www.symcorp.com/downloads/ADAPT_white_paper.pdf (Abgerufen 15.01.2012)
[The07] J.THEOBALD:
Strategies for Testing Data Warehouse Applications Whitepaper, 2007
http://www.information-management.com/issues/20070601/1086005-1.html?zkPrintable=true (Abgerufen 12.02.2012)
[Tot00] A.TOTOK:
Modellierung von OLAP- und Data-Warehouse-Systemen 1. Auflage, Deutscher Universitäts-Verlag, Wiesbaden, 2000
Ehrenwörtliche Erklärung
Ehrenwörtliche Erklärung
Ich erkläre hiermit ehrenwörtlich, dass ich die vorliegende Arbeit selbstständig ange-fertigt habe. Die aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als solche kenntlich gemacht. Es wurden keine anderen als die angegebenen Quellen und Hinweise verwandt.
Die vorliegende Arbeit wurde bisher keiner anderen Prüfungsbehörde vorgelegt und auch noch nicht veröffentlicht.
Hannover, 20. Februar 2012 _________________________
(Renke Hegeler)