• Keine Ergebnisse gefunden

Klassifikation im Bereich Musik

N/A
N/A
Protected

Academic year: 2022

Aktie "Klassifikation im Bereich Musik"

Copied!
19
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klassifikation im Bereich Musik

Klassifikation im Bereich Musik

Michael G¨unnewig 30. Mai 2006

Michael G¨unnewig 1 30. Mai 2006

(2)

Klassifikation im Bereich Musik

Inhaltsverzeichnis

1 Was ist eine Klassifikation? 3

1.1 Arten und Aufbau von Klassifikationen . . . 4

2 Einsatz von Klassifikationen 5

2.1 Klassifikationen im Bereich Musik . . . 6

3 Die automatische Klassifikation 7

4 Lernarten des Klassifizierers 8

5 Klassifikationsverfahren 10

5.1 Vergleich der Klassifikationsverfahren . . . 13

Michael G¨unnewig 2 30. Mai 2006

(3)

Klassifikation im Bereich Musik

6 Evaluierung 14

7 Probleme / Schwierigkeiten 17

8 Fazit & Ausblick 18

Michael G¨unnewig 3 30. Mai 2006

(4)

Klassifikation im Bereich Musik

1 Was ist eine Klassifikation?

planm¨aßige Darstellung von Klassen, Kategorien oder anderen abstrakten Konzepten, welche nach bestimmten Ordnungsprinzipien (einem System) gestaltet sind.

Einteilung von Objekten anhand bestimmter Merkmale, der Klassifizierung – bildet die Klassen.

Klassen werden hierarchisch angeordnet.

Michael G¨unnewig 4 30. Mai 2006

(5)

Klassifikation im Bereich Musik

1.1 Arten und Aufbau von Klassifikationen

Monohierarchisch

Jede Klasse besitzt nur eine Oberklasse Polyhierarchisch

Jede Klasse kann mehrere Oberklassen haben.

Analytische

vom Allgemeinen zum Besonderen, auf Pr¨akoordination ausgerichtet Synthetische

vom Besonderen zum Allgemeinen, auf Postkoordination ausgerichtet

Michael G¨unnewig 5 30. Mai 2006

(6)

Klassifikation im Bereich Musik

2 Einsatz von Klassifikationen

Dokumentation

Dokumentenmanagement (dort im Zusammenhang mit der Indexierung mit Metadaten)

Warenwirtschaft (dort spricht man eher von ’Warengruppen’)

Wissenschaft (dort spricht man eher von ’Systematik’)

Michael G¨unnewig 6 30. Mai 2006

(7)

Klassifikation im Bereich Musik

2.1 Klassifikationen im Bereich Musik

m¨annlich und/oder weiblich Stimmen/Gesang

Muskinstrument(e) (z.B. Gitarre, Klavier, . . . )

Genre (z.B. Classic, Country, Dance, HipHop, Jazz, Pop, . . . )

Rhytmus (z.B. Cha Cha, Jive, Rumba, Samba, Tango, Waltzer, . . . )

Thema (z.B. Drogen, Familie, Haß, Krieg, Liebe, . . . )

Benutzerschema (z.B. Arbeit, Relax, Auto, Urlaub, . . . )

Benutzerpr¨aferenzen

Michael G¨unnewig 7 30. Mai 2006

(8)

Klassifikation im Bereich Musik

3 Die automatische Klassifikation

1. Erzeugung eines Algorithmus (lernender), der auf bekannte und schon klassifizierte F¨alle angewandt Strukturen berechnet.

2. Ein auswertender Algorithmus kann dann anhand der erlernten Strukturen

einen neuen und bisher unbekannten Fall aufgrund der beobachteten Attribute und deren Auspr¨agungen einer der bekannten Ziel-Klassen zuzuordnen.

Michael G¨unnewig 8 30. Mai 2006

(9)

Klassifikation im Bereich Musik

4 Lernarten des Klassifizierers

supervised learning

Klasseneinteilungen der Trainingsdaten vollst¨andig vorgegeben semi-supervised learning

nur ein Teil der Trainingsdaten wurde zuvor klassifiziert active learning

Klassifizierer w¨ahlt Beispiele aus, die manuell klassifiziert werden sollen self-training

Klassifizierer ordnet Trainingsdaten selbst

Michael G¨unnewig 9 30. Mai 2006

(10)

Klassifikation im Bereich Musik

co-training

Zwei Klassifizierer ordnen sich gegenseitig multi-view-training

Zwei Klassifizierer mit unterschiedlichen Ansichten ordnen sich gegenseitig reinforcement learning

Klassifizierer bekommt Feedback bzgl. seiner Kategorisierung, jedoch nicht expliziert ob korrekt

unsupervised learning

Keine vorgegebenen Klassen

Michael G¨unnewig 10 30. Mai 2006

(11)

Klassifikation im Bereich Musik

5 Klassifikationsverfahren

k-Nearest Neighbour

k-Means

(Naive) Bayes

K¨unstliches neuronales Netz

Support-Vector-Maschinen

. . .

Michael G¨unnewig 11 30. Mai 2006

(12)

Klassifikation im Bereich Musik

k-Nearest Neighbour

Hier k = 3:

New Example Classification

Training

Michael G¨unnewig 12 30. Mai 2006

(13)

Klassifikation im Bereich Musik

k-Means

1. Initialisierung: Auswahl von k Clusterzentren 2. Zuordnung: Jedes Objekt wird dem ihm

am n¨achsten liegenden

Clusterzentrum zugeordnet

3. Neuberechnung: Es werden f¨ur jedes Cluster die Clusterzentren neu berechnet

4. Wiederholung: Falls sich nun die Zuordnung der Objekte ¨andert, weiter mit Schritt 2, ansonsten Abbruch

New Example Classification

Training

Michael G¨unnewig 13 30. Mai 2006

(14)

Klassifikation im Bereich Musik

5.1 Vergleich der Klassifikationsverfahren

Accuracy

Random 26.72

C4.5 45.44

Naive Bayes 43.69

k-NN 53.23

Accuracy

Random 44.07

C4.5 49.52

Naive Bayes 49.92

k-NN 49.63

The accuracy for the genre classification The averaged accuracy for the user tasks.

Michael G¨unnewig 14 30. Mai 2006

(15)

Klassifikation im Bereich Musik

6 Evaluierung

Auswertenden Algorithmus auf Testdaten anwenden

jeweils 2 Klassen werden gegen¨ubergestellt, z.B. Classic/Pop

Maße (Accuracy, Recall, Precision)

Michael G¨unnewig 15 30. Mai 2006

(16)

Klassifikation im Bereich Musik

positiv klassifiziert negativ klassifiziert

tats¨achlich positiv a c a + c

tats¨achlich negativ b d b + d

a + b c + d n

Accuracy a = a+dn Recall r = a+ca Precision p = a+ba

Michael G¨unnewig 16 30. Mai 2006

(17)

Klassifikation im Bereich Musik

Kreuzvalidierung

Problem: ausreichende, brauchbare und markierte Lern- und Testdaten f¨ur die gew¨unschte Klassifikation – viele 1000 Musikst¨ucke.

M¨ogliche L¨osung ist die n-Fache Kreuzvalidierung, meist 10-fach.

zuf¨alliges Teilen der Daten in n m¨oglichst gleich große Teile,

ein Teil als Evaluierungsdaten zum Absch¨atzen der Fehlerrate,

und der Rest als Lerndaten des Klassifikators.

Das ganze wird n Mal durchgef¨uhrt, so dass jeder Datensatz n 1 Mal zum Lernen und einmal zum Evaluieren genutzt wird.

Michael G¨unnewig 17 30. Mai 2006

(18)

Klassifikation im Bereich Musik

7 Probleme / Schwierigkeiten

Subjektivit¨at bei der manuellen Klasifikation der Lern-/Testdaten

Inkonsistenzen z.B. Album- vs. Trackgenre

Wahl einer geeigneter Klassen/Kategorienhierarchie – z.B. Musikindustrie vs.

H¨andler, . . .

mehrere Ansichten auf Daten m¨oglich z.B. ID3 Tags, Lyrics, Audiodaten

Auswahl des Lern- und Klassifikationsverfahrens

Auswahl der Metadaten/Low-Level-Deskriptoren

Overfitting

Preferenzen der Benutzer ¨andern sich ¨uber die Zeit, so dass andere/s Metadaten/Verfahren besser w¨aren

Michael G¨unnewig 18 30. Mai 2006

(19)

Klassifikation im Bereich Musik

8 Fazit & Ausblick

es wird trotz der Probleme eingesetzt

Fehlklassifikationen werden entweder nicht erkannt, ignoriert oder nachtr¨aglich korrigiert

adaptiv auf noch unbekannte Daten

erm¨oglicht einfache und (relativ) schnelle Gruppierung/Sortierung

Vielf¨altig einsetzbar, z.B. : – Dokumentation

– Ahnlichkeitssuche/Playlisten¨ anderer Vortrag

– Dokumentmanagement/Visualisierung anderer Vortrag

Michael G¨unnewig 19 30. Mai 2006

Referenzen

ÄHNLICHE DOKUMENTE

We show how existing verification techniques can be adapted to efficiently verify desirable properties of extracted decision tree policies: (i) we learn a decision tree policy

First, we view our learning task as optimization in policy space, modulo the constraint that the desired policy has a programmatic representation, and solve this optimization

Reinforcement learning is a class of machine learning algorithms whose underlying mechanism is inspired by behaviourist psychology, where the learner and decision maker — called agent

Reinforcement Learning(RL) ist der ¨ Uberbegriff f¨ ur eine Reihe von Methoden des Maschinellen Lernens. Der große Vorteil dieser Verfahren ist die F¨ ahigkeit ” k¨ unstlich“

Dass die Agenten noch weiterhin neue Zustände lernen und die Gewinnrate nie genau 100% erreicht, liegt an der gewählten Explorationsrate von  = 0,001, die dazu führt, dass der Agent

TPC-H Workloads - Single Table-Workload Pair, or Set of Table- Workload Pairs: In order to give an optimal partitioning for the tables in the TPC-H workload at SF10 cases

For terminal states found during training or by applying the trained network we perform a further Monte Carlo analysis in the space of order one coefficients a ij , b ij (which

• Eine diskrete Aktion wird gewählt und erhält zusätzliche Informationen durch die kontinuierliche Aktion... Hybride