• Keine Ergebnisse gefunden

Computer Vision: Bag of Visual Words

N/A
N/A
Protected

Academic year: 2022

Aktie "Computer Vision: Bag of Visual Words"

Copied!
4
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Computer Vision: Bag of Visual Words

D. Schlesinger – TUD/INF/KI/IS

D. Schlesinger () CV: BoW 1 / 4

(2)

Punktmerkmale → Bildmerkmale

Grundlage:

Input: Bild

→Interessante Punkte (Harris, MSER, Laplace ...)

→Deskriptoren, ein pro Punkt (Haar, SIFT, Bildfragmente ...) Output: Ein „Tupel“ von Vektoren pro Bild.

Was ist im Bild zu sehen (Erkennung, Klassifikation)?

Die Deskriptoren an sich sind nicht aussagekräftig genug – es sind „nur Zahlen“.

Die Menge aller Deskriptoren wird geclustert,

der Deskriptor (numerisch) wird wehrend der Erkennung durch Clusternummer ersetzt – Klassifikation (Interpretation des Wertes) – eine „etwas semantischere“ Bedeutung

Output: Eine Liste der Besondere Punkte mit den entsprechenden Clusternummern.

Was ist im Bild zu sehen?

Die Idee:

die Häufigkeiten des Vorkommens der Clusternummer sind für die Klassifikation relevant Beispiel: „sehr viele vertikale Kanten im Bild“⇒(höchstwahrscheinlich) „Zebra“

Bildmerkmalist das Histogramm des Vorkommens der Clusternummer.

D. Schlesinger () CV: BoW 2 / 4

(3)

Bag of Visual Words

D. Schlesinger () CV: BoW 3 / 4

(4)

Erkennung

Was ist im Bild zu sehen?

Bild → Merkmal →

?

Klasse

EinKlassifikatorist eine Abbildunge:RnK, die jedemMusterx∈RneineKlassekK zuordnet.

Lernaufgabe:

Gegeben sei eine FamilieEder Klassifikatoren

Gegeben sei eineannotierte Lernstichprobe (x1,k1),(x2,k2). . .(xL,kL)

Man suche nach dem Klassifikatore∈ Eso, dasse(xl) =klfür allelgilt (wenn es mehrere gibt, finde den „besten“)

Mashine Learning, Mustererkennung Empfehlenswert:

http://people.csail.mit.edu/torralba/shortCourseRLOC/index.html

D. Schlesinger () CV: BoW 4 / 4

Referenzen

ÄHNLICHE DOKUMENTE

b) Possible extensions: row-wise Iterated Conditional Mode, more complex data-terms

Scene type Scene geometry Object classes Object position Object orientation Object shape Depth/occlusions Object appearance Illumination Shadows Motion blur Camera

• „Tracking an object in an image sequence means continuously identifying its location when either the object or the camera are moving“ [Lepetit and Fua 2005].. • This can

Computation  of  the  “Cornerness”...  colors,  homogenous  regions

Shape from Texture. Shape

Lowe: Distinctive Image Features from Scale-Invariant Keypoints – Viola & Jones: Rapid Object Detection using a Boosted Cascade of Simple Features.

der Deskriptor (numerisch) wird wehrend der Erkennung durch Clusternummer ersetzt – Klassifikation (Interpretation des Wertes) – eine „etwas semantischere“ Bedeutung. ⇒ Output:

Methoden: Diskrete Optimierung, LevelSet Methoden und Variationelle An- sätze, Statistische Modellierung mittels Markovscher Zufallsfelder, Support Vektor Maschinen