Kollaboratives Strukturieren von Multimediadaten für
Peer-to-Peer Netze
Lehrstuhl für Künstliche Intelligenz Prof. Dr. Katharina Morik
Dipl. inf. Michael Wurst
C B
Jazz Pop
A
C A Jazz
Was heißt das?
● Kollaborativ
● Strukturieren
● Multimediadaten
● Peer-to-Peer
Peer-to-Peer Computing
● Keine zentrale, vermittelnde Instanz
● Kommunikation direkt zwischen einzelnen Knoten
● Agenten, P2P Filesharing , ...
A B
C D
Zentralisiertes Anbieten von Daten
A B
C D
A
D
Verteiltes Anbieten von Daten
Was heißt das?
● Kollaborativ
● Strukturieren
● Multimediadaten
● Peer-to-Peer
Strukturieren von Daten
● Objekte in Beziehung setzen (z.B. Ähnlichkeit)
● Objekte zu Kategorien zusammenfassen (z.B. Musikgenres)
● Taxonomien, als hierarchische Anordnung von Kategorien
● Ontologien, als Form von komplexen logischen Beziehungen zwischen Objekten
(z.B. ist Autor von(X,Y))
A B
Zentralisiertes Strukturieren von Daten
C D
Pop Rock
Metal
A B
C
D
A
D
Soft Rock
Metal
Jazz Pop
Deutsch Englisch
Verteiltes Strukturieren von Daten
Was heißt das?
● Kollaborativ
● Strukturieren
● Multimediadaten
● Peer-to-Peer
A B
C
D
A
D
Soft Rock
Metal
Jazz Pop
Deutsch Englisch
Kollaboratives Strukturieren von
Daten
Pop
Kopieren von Teilbäumen
A
B A
D
Soft Rock
Metal Jazz
Deutsch Englisch C
D
B A
Jazz Pop
A B
C
D
A
D
Soft Rock
Metal
Jazz Pop
Deutsch Englisch
Kollaboratives Strukturieren von Daten
Klassifizieren von Objekten
A B
C
D
A
D
Soft Rock
Metal
Jazz Pop
Deutsch Englisch B
A
A B
C
D
A
D
Soft Rock
Metal
Jazz Pop
Deutsch Englisch
B
???
Kollaboratives Strukturieren von Daten
Beschreibung von Objekten
A B
C
D
A
D
Soft Rock
Metal
Jazz Pop
Deutsch Englisch
B Jazz
Weitere mögliche Anwendungen
● Finden ähnlicher Objekte
● Finden ähnlicher Kategorien
● Finden eines passenden Schemas gegeben eine Menge von Objekten (z.B. Internetradio)
● Finden von Benutzern mit ähnlichen Interessen
● ...
Was heißt das?
● Kollaborativ
● Strukturieren
● Multimediadaten
● Peer-to-Peer
Verarbeitung von Multimediadaten
● Objekte (z.B. mp3 Dateien) müssen geeignet kodiert werden
● Problem: Welche Merkmale sollen ausgewählt werden? Wie beschreibt man Musik oder Video?
● Erste Möglichkeit: Externe Metadaten (z.B.
festgelegtes Genre, Interpret, Schauspieler, Jahr)
● Zweite Möglichkeit: Extrahierte Metadaten (z.B.
Tempo, Lautstärke, ...)
Anpassung des Entwurfes
Durchführung
Data Mining Aufgaben Data Mining
Aufgaben
Data Mining Experiment
Meta- Daten Daten
Entwurf
Das Yale System
Yale Features
– Operatoren zur Datenvorverarbeitung (Audiodaten, Texte, ...)
– Zahlreiche Lernverfahren (Klassifikation, Clustering, Merkmalstransformation, ...) – Leicht erweiterbar (Java/XML basiert) – GUI/Batchmodus, Anwendungs API
– Opensource / Weltweite Verbreitung (20+
Länder)
Audioverarbeitung mit YALE
xyz.mp3
0.1 0.4 0.2 ... 0.0 0.0 0.3
Tempo Lautstärke
Relevante Forschungsgebiete
● Multimediaverarbeitung/Retrieval
● Metadatenannotierung (MPEG-7)
● Maschinelles Lernen
● Ontologien, Kataloge, Semantic Web
● Verteilte Algorithmen/Agentensysteme/
Dezentrale Architekturen
Was heißt das?
● Kollaborativ
● Strukturieren
● Multimediadaten
● Peer-to-Peer
PG Aufgabe
YALE
Audioverarbeitung
Existierendes P2P/
Agentensystem
B C
B A
Soft
Jazz Jazz
A Pop
Aufgaben I
● Auswahl eines geeigneten P2P Systems
● Entwurf eines erweiterbaren Frameworks:
– Lokale Kodierung von Objekten (Yale)
– Austauschprotokolle für Objektinformationen und Ontologien
– Indexierung für schnelle Suche
– Verteiltes Maschinelles Lernen (Yale)
– Evaluationsmöglichkeiten (Yale)
– Einfaches Benutzerinterface
Aufgaben II
● Auswahl und Entwurf von Funktionen für das System
● Implementierung/Test des Frameworks
● Implementierung/Test der einzelnen Funktionen
● Evaluierung des Gesamtsystems
● Dokumentation und Deliverables (nicht nur Endbericht)
Geplanter Ablauf der PG
● Ab 3.9. Ausgabe von Seminarthemen
● Anfang Oktober: Seminarphase
● Analyse/Spezifikation: Aufteilung in Arbeitsgruppen
● Entwicklungsphase I
● Anfang SS05: Seminarphase II
● Entwicklungsphase II
● Integration und Evaluation
● Zusammenfassung der Deliverables zum Endbericht
Projektgruppen am Lehrstuhl VIII
● Professionelles Softwareengineering und Projektmanagement
● Anspruchsvolle, forschungsrelevante Aufgaben (kein bloßes Implementieren)
● Möglichkeit für wissenschaftliche Veröffentlichungen
● Möglichkeit als HiWi beim LS VIII zu arbeiten
● Möglichkeit für Diplomarbeit beim LS VIII
● Kooperation mit anderen Gruppen
Projektgruppen am Lehrstuhl VIII
● Eigenständiges Arbeiten bei intensiver Betreuung
● 5 erfolgreiche vergangene PGs
● Weitere Infos:
Homepage LS VIII
oder direkt bei uns GB IV/R120
Literatur/Links
● Milojicic, M.J. et. al: Peer-to-peer computing.
● Maes P.:Agents that reduce work and information overload, Communications of the ACM, 1994.
● Mitchell, T: Machine Learning, McGraw Hill, 1997.
● Anderberg, M.: Cluster Analysis for applications, 1973.
● mpeg Überblick (besonders mpeg-7):
www.chiariglione.org/mpeg
● YALE: http://yale.cs.uni-dortmund.de