• Keine Ergebnisse gefunden

D.Schlesinger–TUD/INF/KI/IS Bildverarbeitung:Clusterung

N/A
N/A
Protected

Academic year: 2022

Aktie "D.Schlesinger–TUD/INF/KI/IS Bildverarbeitung:Clusterung"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Bildverarbeitung: Clusterung

D. Schlesinger – TUD/INF/KI/IS

(2)

Einfache Clusterung Aufgabe

Aufgabe: partitioniere eine Menge der Objekte auf sinnvolle Teile – Clusters.

Die Objekte eines Clusters sollen „ähnlich“ sein.

Clustermenge:K

Indexmenge:I={1,2, . . . ,|I|}

Merkmalsvektoren:xi,iI.

Partitionierung:C= (I1,I2, . . . ,I|K|),IkIk0=∅fürk6=k0,

S

kIk=I Jeder Cluster hat einen „Repräsentant“yk

Die Aufgabe:

X

k

X

i∈Ik

kxiykk2→min

C,y

Alternativ – gesucht wird eine AbbildungC:IK

X

i

kxiyC(i)k2→min

y,C

X

i

min

k

kxiykk2→min

y

(3)

K-Means Algorithmus

Initialisiere Clusterzentrenykzufällig.

Wiederhole bis sich die ClusterungC ändert:

1) Klassifikation:

C(i) = arg min

k0

kxiyk0k2iIk

2) Aktualisierung der Zentren:

yk= arg min

y

X

i∈Ik

kxiyk2=

X

i∈Ik

xi

– NP-vollständig.

– Bei|K| |I|bleibt kein Cluster frei (bei der global optimalen Lösung).

– K-Means Konvergiert zum lokalen Optimum→abhängig von der Initialisierung (Beispiel lokaler Konvergenz auf der Tafel).

(4)

Varianten/Generalisierungen

Ein anderer Abstandsmaß, zum Beispielkxiykkanstattkxiykk2: beim K-Means ist die Klassifikation 1) dasselbe,

die Aktualisierung 2) – finde das Zentrum des Umkreises der Punktexi,iIk

Problem: die Merkmalexlassen sich nicht immer mitteln.

Eine Verallgemeinerung basiert auf der Beobachtung

X

i

kxi−¯xk2

X

ij

kxixjk2,

daraus folgt

X

k

X

ij∈Ik

kxixjk2=

X

k

X

ij∈Ik

d(i,j)→min

C ,

mit der Abstandsmatrixd(die auf unterschiedlichste Weisen definiert werden kann).

Noch eine Variante – Minimierung der Durchmesser:

max

k max

ij∈Ikd(i,j)→min

C

Diese aufgabe ist bei|K|= 2 polynomiell lösbar.

(5)

Abstandsmaße

Graph basierte Abstandsmaße.

Gegeben ist ein Graph, dessen Knoten die Elementen von I sind. Jede Kante ist mit d(i,j) bewertet. Der Abstand zwischeniundjist die (summarische) Länge des kürzesten Pfaden zwischen den entsprechenden Knoten im Graphen.

→So ein Abstandsmaß ist eine Metrik.

Pfad basierte Abstandsmaße (auch Graphen).

Die Idee – selbst wenn zwei Merkmalexiundxj von einander weit entfernt sind, gehören sie eher zum selben Cluster, wenn ein Pfad (xi,xl,xl0, . . . ,xj) existiert so, dass die Abständed(xl,xl0) klein sind.

→Der minimale aufspannende Baum wird benötigt.

Abstandsmaße für „andere“ Objekte (nicht∈Rn).

Zum Beispiel:

Edit distance (Levenstein Abstand) zwischen zwei Folgen, Graph Isomorphismus basierte Abstände zwischen Graphen etc.

(6)

Farbreduktion

Die Elementen sind die Pixel des Bildes, die Merkmale sind Farbwerte,

man zerlege das Bild auf Teile, die jeweils „charakteristischen Farben“ entsprechen.

Beispiel der Farbreduktion auf 8 Farben:

(7)

Segmentierung

Die Elementen sind die Pixel des Bildes.

Idee – die Matrix der Abständedberücksichtigt

a) Unterschied der lokalen Merkmalswerte (z.B. der Farbe), b) Die räumliche Entfernung der Pixel von einander.

Beispiel: „Geodesics“.

Graphen basiertes Abstandsmaß. Kanten verbinden nah liegende Pixel.

Die Kantenbewertung – Farbdifferenz Die kürzesten Wege von allen Pixeln zu einem (vom Nutzer gegebenem) bilden einen Baum (effizient berechenbar).

Die Längen werden mit einem Schwellwert verglichen.

Der Vordergrund ist zusammenhängend.

Andere ähnliche Vorgehensweisen:

Semidefinite Programmierung, Normalized Cut, usw.

Referenzen

ÄHNLICHE DOKUMENTE

baren Achsen nach den T. Für andere Länder gelten andere Vorschriften. Die Gattung 3101 hat bei den preußis ch-hessischen Statsbahnen mit 8,7t den höchsten Triebraddruck‚. In

Max Derruau hat ein Buch veroffentlicht iiber die Grande Limagne1). In der stattlichen Reihe der grofien, franzosischen regionalen Thesen ist das Werk ein Markstein. Das

[r]

Close entwickelte nach und nach seine ganz eigene Technik: Er unterteilt zunächst Porträtfotos mithilfe eines Rasters in viele Einzelelemente..

Mit Franziskus als Gesprächspartner ist dies nicht anders 8 : Bereits zu seinen Leb- zeiten, dann durch die Drei-Gefährten-Legende, den Legenden über Franz in den Fio- retti, durch

Viele Ebenen (Bildschirme) werden auf eine abgebildet.... , Gesucht werden

Gegeben sei eine Menge der Datenpunkten in R n , die einem Objekt entsprechen (nach welchem schließlich gesucht wird).. Zusätzlich sei bekannt, dass der Objekt bestimmte

der Deskriptor (numerisch) wird wehrend der Erkennung durch Clusternummer ersetzt – Klassifikation (Interpretation des Wertes) – eine „etwas semantischere“ Bedeutung. ⇒ Output: