Anwendungen des Anwendungen des
Data Mining in der Praxis Data Mining in der Praxis
Seminarvortrag
Seminarvortrag von Holger Dürrvon Holger Dürr
Seminar Data Mining Wintersemester 2003/
Seminar Data Mining Wintersemester 2003/20042004
Professor Dr. Schweigert
Professor Dr. Schweigert -- UniversitätUniversität UlmUlm
Themenübersicht Themenübersicht
• • Data Mining Data Mining - - Kleine Einführung Kleine Einführung
• • Data Mining Aufgabentypen Data Mining Aufgabentypen
• • Prozess in der Praxis Prozess in der Praxis
• • Praxisbeispiele Praxisbeispiele
• • Probleme Probleme
• • Zusammenfassung Zusammenfassung
Data Mining
Data Mining - - Kleine Einführung Kleine Einführung
• • Definition des Data Mining: Definition des Data Mining:
„nicht triviale Entdeckung gültiger, neuer, potentiell
„nicht triviale Entdeckung gültiger, neuer, potentiell nützlicher und verständlicher Muster in großen
nützlicher und verständlicher Muster in großen Datenbeständen“
Datenbeständen“
• • Arten des Data Mining: Arten des Data Mining:
- - in Tabellen in Tabellen - - in Texten in Texten - - im Web im Web
- - in Bildern und Filmen in Bildern und Filmen
Data Mining
Data Mining - - Kleine Einführung Kleine Einführung
• • Bedeutung des Data Mining Bedeutung des Data Mining
- - Verdoppelung der weltweiten Datenbestände Verdoppelung der weltweiten Datenbestände alle 20 Monate
alle 20 Monate
- - 50% der Großunternehmen verwenden DM- 50% der Großunternehmen verwenden DM - Analysen
Analysen
- - 87% der deutschen Benutzer, sprechen von 87% der deutschen Benutzer, sprechen von hoher Rentabilität
hoher Rentabilität
- - 10% der Daten werden überhaupt analysiert 10% der Daten werden überhaupt analysiert
Data Mining Aufgabentypen Data Mining Aufgabentypen
• • Assoziationsanalysen Assoziationsanalysen
z.B.: Untersuchung des Kaufverhaltens von Kunden z.B.: Untersuchung des Kaufverhaltens von Kunden
• • Klassifikationsanalysen Klassifikationsanalysen
z.B.: Kreditwürdigkeit von Bankkunden z.B.: Kreditwürdigkeit von Bankkunden
• • Clustering Clustering
z.B.: Gruppeneinteilung von Kunden
z.B.: Gruppeneinteilung von Kunden
Berufstätig?
Vermögen?
30 < Alter < 35?
Einkommen < 100.000?
Bürgschaft ? Schulden > 250.000?
Student?
Klasse 0 Klasse 1 Klasse 0
Nein Ja
... ...
...
...
...
Ja
Ja
Ja
Ja
Ja
Ja
Nein
Nein Nein
Nein Nein
Nein Klasse 0 = kein Kredit Klasse 0 = kein Kredit Klasse 1 = Kredit Klasse 1 = Kredit
Entscheidungsbaum
Entscheidungsbaum
Anzahl
Ferngespräche
Anzahl
Ortsgespräche