• Keine Ergebnisse gefunden

Fazit und Ausblick

Im Dokument Data Mining (Seite 12-15)

suchung und Auswertung von Linkstrukturen auf der Typologie von Hyperlinks.

Mit diesen Analysen lassen sich zum Beispiel Webseiten kategorisieren und ihre Ähnlichkeiten und Unterschiede aufdecken. „Für die thematische und nutzer-freundliche Gestaltung solcher Web-Ressourcen ist es für die Website-Administratoren wichtig zu wissen, ob z. B. Seiten mehr Verweischarakter (sog.

hub pages) haben oder inhaltsbezogen (sog. content pages) sind“ (Müller/ Lenz 2013: 117f.). Die dritte Form des Web Mining, das Web Usage Mining, dient der Untersuchung der Daten, die während der Nutzung einer Webseite innerhalb einer oder mehrerer Sitzungen protokolliert werden. Interessant sind in diesem Zusam-menhang vor allem Klickstatistiken, die zur Optimierung der Seiten bezüglich Zugriffspfade oder indivualisierter Inhalte genutzt werden. (Vgl. ebd. 117f.)

5 Fazit und Ausblick

„Identifying interesting structure and useful patterns among the plethora of possi-bilities is what a data mining algorithm must do, and it must do it quickly over very large databases“ (Fayyad 2002: 29f.).

Angesichts der durch die Digitalisierung immer mehr steigenden Datenmassen4 sowie Speicherung dieser, reichen manuelle Auswertungsmethoden nicht aus, um Erkenntnisse aus diesen zu ziehen. Demnach sind Data Mining Tools unabdingbar geworden. Diese können dazu genutzt werden, von der Fragestellung abhängige Methoden wie etwa Cluster- oder Ausreißeranalysen anzuwenden, um Kenntnisse aus den Daten zu gewinnen. Für Daten aus Texten oder dem Internet wurden die spezifischen Formen Text und Web Mining entwickelt, die auf ähnlichen Metho-den basieren, jedoch speziell an die besonderen Datentypen angepasst sind. Doch auch die computerbasierten Programme allein reichen nicht aus. Für die Wahl der Methode oder die korrekte Interpretation der Ergebnisse werden Spezialisten be-nötigt (vgl. Fayyad 1998: 6). Die gespeicherten Datenmengen steigen stetig und viele Unternehmen und Organisationen haben erkannt, welcher Nutzen sich hinter den Daten verbergen kann. Allerdings mangelt es an Experten, die in der Lage

4 „The capacity of digital data storage worldwide has doubled every nine months for at least a de-cade, at twice the rate predicted by Moore’s Law for the growth of computing power during the same period“ (Fayyad 2002: 28).

5 Fazit und Ausblick 11

sind mit diesen Daten umzugehen. „Our ability to capture and store data has far outpaced our ability to process and utilize it“ (Fayyad 2002: 28). So sind Daten-analysten eine gesuchte Berufsgruppe auf dem Arbeitsmarkt.

Trotz der Vorteile von Data Mining birgt dieses auch Nachteile und Probleme.

Das Wachstum neuer Datentypen und die Analyse dieser stellt die Analysten vor eine Herausforderung:

„Diverse applications generate a wide spectrum of new data types, from structured data such as relational and data warehouse data to semi-structured and unstructured data; from stable data repositories to dynamic data streams; from simple data objects to temporal data, biological sequences, sensor data, spatial data, hypertext data, mul-timedia data, software program code, Web data, and social network data“ (Han et al.

2012: 32).

Aufgrund dieser Vielfalt an Datentypen und auch der verschiedenen Ziele einer Analyse werden unterschiedliche Data Mining Systeme benötigt.

Auch der Datenschutz ist ein Thema, das bei der Analyse der Daten zu beachten ist. Oft werden Daten von Nutzern oder Käufern analysiert. Obwohl die Daten überwiegend aggregiert werden, spielt die Nichtaufdeckung persönlicher Daten einzelner Individuen eine wichtige Rolle beim Data Mining (vgl. ebd.). Data Mi-ning kann neben positiven Zwecken auch gegen Konkurrenten oder Feinde einge-setzt werden:

„Moreover, data mining tools can work both ways—also helping individuals figure out when their space is being mined inappropriately. Since competition is part of our human nature, wars will be waged over this information. Data banks will be held hostage and robbed. Magnificent digital libraries will be destroyed“ (Fayyad 2001:

65).

Um valide Ergebnisse zu bekommen und nutzen zu können gilt es Probleme wie schlechte Datenqualität, falsche Interpretation der Ergebnisse oder die Anwen-dung statistischer Werte auf Einzelne zu vermeiden. Die auf die Situation abge-stimmte Vorverarbeitung der Daten sowie die anderen vier Prozessschritte des Knowledge Discovery (vgl. Kapitel 2.1) sind dafür von Bedeutung.

Trotz der Gefahren hat Data Mining ein großes Potenzial nützliches Wissen auf vielen Gebieten zu generieren. Mit der Entwicklung immer besserer und schnelle-rer Tools, werden die Möglichkeiten, Erkenntnisse aus der riesigen Datenflut zu extrahieren, vergrößert.

„In the same vein, my imagination fails to begin to visualize the wonders we will discover as data mining evolves into the effective cybernavigation science of tomor-row. I envy the early discovery expeditions into the new world of data. A wondrous journey awaits us all“ (ebd).

Literaturverzeichnis 12

Literaturverzeichnis

Cleve, Jürgen/ Lämmel, Uwe (2014): Data Mining. München.

Dey, Pabitra Kumar/ Chakraborty, Gangotri/ Ruj, Purnendu/ Sarkar, Suvobrata (2012): A Data Mining Approach on Cluster Analysis of IPL. In: International Journal of Machine Learning and Computing, 2012, Vol. 2, Nr. 4: 351-354.

Fayyad, Usama/ Piatetsky-Shapiro, Gregory/ Smyth, Padhraic (1996): The KDD Process for Extracting Useful Knowledge from Volumes of Data. In:

Communications of the ACM, Nov. 1996, Vol. 39, Nr. 11: 27-34.

Fayyad, Usama (1998): Editorial. In: Data Mining and Knowledge Discovery 2.

Kluwer Academic Publishers: 5-7; 115-119.

Fayyad, Usama (2001): The Digital Physics of Data Mining. In: Communications of the ACM, March 2001, Vol.44, Nr. 3: 62-65.

Gabriel, Roland/ Gluchowski, Peter/ Pastwa, Alexander (2009): Data Wa-rehouse & Data Mining. Herdecke/ Witten.

Han, Jiawei/ Kamber, Micheline/ Pei, Jian (2012): Data mining: concepts and techniques. Amsterdam.

Müller, Roland M./ Lenz, Hans-Joachim (2013): Business Intelligence. Berlin/

Heidelberg.

Pastuchovöá, Elena/ Václavíková, Stefánia (2013): Cluster Analysis – Data Mi-ning Technique for Discovering Natural Groupings in the Data. In: Journal of Electrical Engineering, 2013, Vol. 64, Nr. 2: 128–131.

Runkler, Thomas A. (2010): Data Mining. Methoden und Algorithmen intelli-genter Datenanalyse. Wiesbaden.

Sharafi, Armin (2013): Knowledge Discovery in Databases: Eine Analyse des Änderungsmanagements in der Produktentwicklung. Wiesbaden.

Shi, Guangren (2014): Data Mining and Knowledge Discovery for Geoscientists.

Amsterdam.

Witten, Ian H./ Frank, Eibe/ Hall, Mark A. (2011): Data Mining: Practical Ma-chine Learning Tools and Techniques. Amsterdam.

Versicherung über Selbstständigkeit

Hiermit versichere ich, dass ich die vorliegende Arbeit im Sinne der Prüfungsord-nung ohne fremde Hilfe selbstständig verfasst und nur die angegebenen Hilfsmit-tel benutzt habe.

________________________

(Datum, Unterschrift)

Im Dokument Data Mining (Seite 12-15)