• Keine Ergebnisse gefunden

Anwendungen des Anwendungen des Data Mining in der Praxis Data Mining in der Praxis

N/A
N/A
Protected

Academic year: 2021

Aktie "Anwendungen des Anwendungen des Data Mining in der Praxis Data Mining in der Praxis"

Copied!
20
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Anwendungen des Anwendungen des

Data Mining in der Praxis Data Mining in der Praxis

Seminarvortrag

Seminarvortrag von Holger Dürrvon Holger Dürr

Seminar Data Mining Wintersemester 2003/

Seminar Data Mining Wintersemester 2003/20042004

Professor Dr. Schweigert

Professor Dr. Schweigert -- UniversitätUniversität UlmUlm

(2)

Themenübersicht Themenübersicht

• • Data Mining Data Mining - - Kleine Einführung Kleine Einführung

• • Data Mining Aufgabentypen Data Mining Aufgabentypen

• • Prozess in der Praxis Prozess in der Praxis

• • Praxisbeispiele Praxisbeispiele

• • Probleme Probleme

• • Zusammenfassung Zusammenfassung

(3)

Data Mining

Data Mining - - Kleine Einführung Kleine Einführung

• • Definition des Data Mining: Definition des Data Mining:

„nicht triviale Entdeckung gültiger, neuer, potentiell

„nicht triviale Entdeckung gültiger, neuer, potentiell nützlicher und verständlicher Muster in großen

nützlicher und verständlicher Muster in großen Datenbeständen“

Datenbeständen“

• • Arten des Data Mining: Arten des Data Mining:

- - in Tabellen in Tabellen - - in Texten in Texten - - im Web im Web

- - in Bildern und Filmen in Bildern und Filmen

(4)

Data Mining

Data Mining - - Kleine Einführung Kleine Einführung

• • Bedeutung des Data Mining Bedeutung des Data Mining

- - Verdoppelung der weltweiten Datenbestände Verdoppelung der weltweiten Datenbestände alle 20 Monate

alle 20 Monate

- - 50% der Großunternehmen verwenden DM- 50% der Großunternehmen verwenden DM - Analysen

Analysen

- - 87% der deutschen Benutzer, sprechen von 87% der deutschen Benutzer, sprechen von hoher Rentabilität

hoher Rentabilität

- - 10% der Daten werden überhaupt analysiert 10% der Daten werden überhaupt analysiert

(5)

Data Mining Aufgabentypen Data Mining Aufgabentypen

• • Assoziationsanalysen Assoziationsanalysen

z.B.: Untersuchung des Kaufverhaltens von Kunden z.B.: Untersuchung des Kaufverhaltens von Kunden

• • Klassifikationsanalysen Klassifikationsanalysen

z.B.: Kreditwürdigkeit von Bankkunden z.B.: Kreditwürdigkeit von Bankkunden

• • Clustering Clustering

z.B.: Gruppeneinteilung von Kunden

z.B.: Gruppeneinteilung von Kunden

(6)

Berufstätig?

Vermögen?

30 < Alter < 35?

Einkommen < 100.000?

Bürgschaft ? Schulden > 250.000?

Student?

Klasse 0 Klasse 1 Klasse 0

Nein Ja

... ...

...

...

...

Ja

Ja

Ja

Ja

Ja

Ja

Nein

Nein Nein

Nein Nein

Nein Klasse 0 = kein Kredit Klasse 0 = kein Kredit Klasse 1 = Kredit Klasse 1 = Kredit

Entscheidungsbaum

Entscheidungsbaum

(7)

Anzahl

Ferngespräche

Anzahl

Ortsgespräche

Cluster von Kunden einer Telefongesellschaft

Cluster von Kunden einer Telefongesellschaft

(8)

Der Prozess in der Praxis Der Prozess in der Praxis

• • Buisness Understanding Buisness Understanding

• • Data Understanding Data Understanding

• • Data Preperation Data Preperation

• • Modeling Modeling

• • Evaluation Evaluation

• • Deployment Deployment

(9)

Praxisbeispiele Praxisbeispiele

• • CRM und Marketing CRM und Marketing

- - Gruppeneinteilung von Bankkunden Gruppeneinteilung von Bankkunden Ziel:

Ziel: Umsatzsteigerung durch bessere Umsatzsteigerung durch bessere Kundenansprache

Kundenansprache Typ: Typ: Clustering Clustering

Ergebnis:

Ergebnis: sinnvolle Einteilung in 7 sinnvolle Einteilung in 7 Kundengruppen

Kundengruppen

(10)

Praxisbeispiele Praxisbeispiele

• • CRM und Marketing CRM und Marketing

- - Analyse von UNICEF Analyse von UNICEF - - Spendern Spendern Ziel:

Ziel: Zuordnung von Spendern zu Zuordnung von Spendern zu Spendenthemen

Spendenthemen Typ: Typ: Klassifikation Klassifikation

Ergebnis:

Ergebnis: Bis zu 80% höhere Antwortraten Bis zu 80% höhere Antwortraten

(11)

Praxisbeispiele Praxisbeispiele

• • CRM und Marketing CRM und Marketing

- - Auswahl von Bankkunden bei einer Auswahl von Bankkunden bei einer Mailingaktion für Aktienfonds

Mailingaktion für Aktienfonds Ziel:

Ziel: Höhere Antwortrate Höhere Antwortrate Typ: Typ: Klassifikation Klassifikation

Ergebnis:

Ergebnis: Verkaufszahlen bis zu 65 % Verkaufszahlen bis zu 65 % gesteigert

gesteigert

(12)

Praxisbeispiele Praxisbeispiele

• • Banken und Versicherungen Banken und Versicherungen

- - Risikoanalyse bei Krediten oder Risikoanalyse bei Krediten oder Lebensversicherungen

Lebensversicherungen

- - Betrugsaufdeckung bei Kreditkarten oder Betrugsaufdeckung bei Kreditkarten oder Versicherungsleistungen

Versicherungsleistungen Ziel:

Ziel: Analyse der Kunden oder Fälle Analyse der Kunden oder Fälle

Typ: Typ: Klassifikation Klassifikation

(13)

Praxisbeispiele Praxisbeispiele

• • Handel Handel

- - Warenkorbanalyse bei Wal Warenkorbanalyse bei Wal - - Mart Mart Ziel:

Ziel: Verbesserung von Angebot und Verbesserung von Angebot und Verkaufsgestaltung

Verkaufsgestaltung

Typ: Typ: Assoziationsanalyse Assoziationsanalyse

(14)

Praxisbeispiele Praxisbeispiele

• • Verbrechensbekämpfung Verbrechensbekämpfung - - Tätererkennung Tätererkennung

Ziel:

Ziel: Zusammenhänge in ungeklärten Zusammenhänge in ungeklärten Straftaten entdecken

Straftaten entdecken Typ: Typ: Clustering Clustering

Ergebnis:

Ergebnis: Aufklärung von Straftaten Aufklärung von Straftaten

(15)

Praxisbeispiele Praxisbeispiele

• • Text Mining Text Mining

- - Produktentwicklung Produktentwicklung - - Marketing Marketing

- - Kundenmanagement Kundenmanagement

- - Wissensmanagement Wissensmanagement

(16)

Praxisbeispiele Praxisbeispiele

• • Pharmagroßhandel Pharmagroßhandel

Potentielle Anwendungsgebiete:

Potentielle Anwendungsgebiete:

- - Klassifikation umsatzstarker Kunden Klassifikation umsatzstarker Kunden

- - Clustering der Kunden nach Bestellsortiment Clustering der Kunden nach Bestellsortiment - - Warenkorbanalyse Warenkorbanalyse

- - Kundenverhalten beim Onlinedienst Kundenverhalten beim Onlinedienst

- - Klassifikation zahlungsunfähiger Kunden Klassifikation zahlungsunfähiger Kunden

(17)

Praxisbeispiele Praxisbeispiele

• • Pharmagroßhandel Pharmagroßhandel Probleme:

Probleme:

- - veraltete, ungenaue oder unvollständige Daten veraltete, ungenaue oder unvollständige Daten - - mangelnde technische Voraussetzungen mangelnde technische Voraussetzungen

- - wichtige Daten nicht im Data Warehouse wichtige Daten nicht im Data Warehouse integriert

integriert

(18)

Praxisbeispiele Praxisbeispiele

• • Pharmagroßhandel Pharmagroßhandel Ergebnisse:

- Kundenclustering teilweise möglich

- triviale oder unbedeutende Ergebnisse

- Genauigkeit von Vorhersagen bei Klassifikation

nur 33%

(19)

Probleme Probleme

Datenqualität

Softwarequalität

Aussagekraft der Ergebnisse

Datenschutz

(20)

Zusammenfassung Zusammenfassung

• • Bezüglich der Aufgabentypen: Bezüglich der Aufgabentypen:

- - Klassifikation: Klassifikation: am häufigsten, beste Ergebnisse am häufigsten, beste Ergebnisse - - Clustering: Clustering: weniger, Aussagekraft geringer weniger, Aussagekraft geringer - - Assoziations- Assoziations -

analyse:

analyse: vor allem im Handel vor allem im Handel

• • Erfolgsvoraussetzungen: Erfolgsvoraussetzungen:

- - gute Datenqualität gute Datenqualität

- - geeignete Software und technische Voraussetzungen geeignete Software und technische Voraussetzungen

Referenzen

ÄHNLICHE DOKUMENTE

Entferne Kandidaten Item-Mengen, die nicht häufig auftretende Teilmengen der Länge k enthalten. Ermittle den Support

• durch Spezifizierung von interessanten Kalendern, können Regeln entdeckt werden, die in der gesamten Datenbasis nicht auffallen würden u.ä. BSP: Regel: pen =&gt; juice

• kategorielle Daten müssen in metrische Daten umgewandelt werden. • Netz ist individuell bezüglich

 Ähnlich wie beim standart data mining prozess, kann der Web Usage Mining Prozess in 3 Teile geteilt werden.  Data collection &amp; pre-processing

Voraussetzung für die Optimierung der Performanz von Support Vector Machines ist, dass nicht nur die als relevant klassifizierten Publikationen angesehen werden.. Verifikation

Die Leistungsangaben für Supercomputer mögen einen in Erstaunen versetzen, jedoch ist dabei zu beachten, dass diese Leistung nur für sehr spezielle Program- me auch wirklich

“YouTube eine weltweite, nicht-exklusive und gebührenfreie Lizenz ein (mit dem Recht der Unterlizenzierung) bezüglich der Nutzung, der Reproduktion, dem Vertrieb,

Beim Web Mining (vgl. Kapitel 4.2) kommt die Analyse von se- mistrukturierten Texten zum Einsatz, die auf die Tags einer Auszeichnungsspra- che wie HTML zugreift. Zeitreihen