Bildverarbeitung: Diskrete Energieminimierung
Entrauschung → Segmentierung
Beide Definitionsbereich und Wertebereich sind diskret.
R∈Z2– die Pixelmenge,E⊂R2– die Nachbarschaftstruktur (z.B. 4-Nachbarschaft) x :R →Z– das Ausgangsbild,y :R→K – die gesuchte Abbildung (das restaurierte Bild).k∈Krepräsentiert den „wahren“ Grauwert (Label).
Die Energieminimierung:
y∗= arg min
y
Ed(y) +αEm(y)z.B. arg min
y
hX
r∈R
(xr−yr)2+α
X
rr0∈E
(yr−yr0)2
i
Farben→semantische Bedeutungen (Werte eines Merkmals)...
Die Menge der Pixel ist auf „sinnvolle“ Teilmengen zu partitionieren.
D. Schlesinger () BV: Diskrete Energieminimierung 2 / 11
Segmentierung
Original
A possible segmentation
r r r r
r r
Data terms Compactness terms
Penalty Zero
k= 3: Shadow k= 2: Forest k= 1: Field
Dissimilarity measure Observed features
y∗= arg min
y
hX
r
qr(yr) +
X
rr0
grr0(yr,yr0)
i
Iterated Conditional Modes
y∗= arg min
y
hX
r
qr(yr) +
X
rr0
grr0(yr,yr0)
i
Die Idee: wähle (lokal) immer wieder das energetisch günstigste Label bei fixiertem Rest [Besag, 1986].
Wiederhole oft für aller: yr= arg min
k
h
qr(k) +
X
r0:rr0∈E
grr0(k,yr0)
i
(ME: synchrone Dynamik in Hopfield-Netzen)
+ Extrem einfach, parallelisierbar.
− „Koordinatenweise“ Optimierung
→konvergiert nicht zum globalen Optimum selbst bei einfachen Modellen.
D. Schlesinger () BV: Diskrete Energieminimierung 4 / 11
Iterated Conditional Modes
Erweiterung: fixiere nicht alle Variablen bis auf eine, sondern nur eine Teilmenge so, das der Rest einfach optimierbar ist (zum Beispiel eine Kette oder ein Baum).
Für Bilder – Zeilenweise/Spaltenweise Optimierung.
→durch Dynamische Programmierung exakt und effizient lösbar.
Äquivalente Transformationen (Reparametrisierung)
Zwei AufgabenA= (q,g) undA0= (q0,g0) sind zu einanderäquivalent, wenn
hX
r
qr(yr) +
X
rr0
grr0(yr,yr0)
i
=
hX
r
qr0(yr) +
X
rr0
g0rr0(yr,yr0)
i
für alle Labellingsygilt.
A(A) – Äquivalenzklasse (alle zuAäquivalenten Aufgaben).
ÄquivalenteTransformationen:
Φ = ϕr(k)∀r,k, ϕrr0(k), ∀rr0,k
ϕr(k) +
X
r0:rr0∈E
ϕrr0(k) = 0 ∀r,k
D. Schlesinger () BV: Diskrete Energieminimierung 6 / 11
Äquivalente Transformationen
SeiA= (q,g) eine Aufgabe,A0= (q0,g0) = Φ(A) ist die Aufgabe nach der Anwendung der Äquivalenten Transformation Φ, d.h.
qr0(k) =qr(k) +ϕr(k)
g0rr0(k,k0) =grr0(k,k0) +ϕrr0(k) +ϕr0r(k0)
⇒AundA0 sind zu einander äquivalent.
Sind zwei AufgabenAundA0 äquivalent,
soexistierteine Äquivalente Transformation Φ so, dassA0= Φ(A).
Weitere Eigenschaften:
Φ Φ0(A)
= Φ0 Φ(A)
= (Φ⊕Φ0)(A) – Superposition.
Φ−1 Φ(A)
=A, d.h. Φ⊕Φ−1= Φ0– Inverse Transformationen.
Die Menge aller Φ bildet eineGruppe.
Scheinbare Qualität
Die Energie einer Aufgabe:
E(A) = min
y
hX
r
qr(yr) +
X
rr0
grr0(yr,yr0)
i
Scheinbare Qualität einer Aufgabe:
man wähle von einander unabhängig für jede Kante (für jeden Knoten) das beste Labelpaar (den besten Label)
SQ(A) =
X
r
min
k qr(k) +
X
rr0
min
kk0 grr0(k,k0)
SQ(A) ist offensichtlich eineuntere SchrankefürE(A), d.h.SQ(A)≤E(A) Eine Aufgabe heißttrivial, wennE(A) =SQ(A) gilt.
D. Schlesinger () BV: Diskrete Energieminimierung 8 / 11
Scheinbare Qualität
Die Äquivalenten Transformationen ändern E(A)nicht,SQ(A) aberschon.
Die Idee – suche die Aufgabe größter Scheinbarer Qualität in der ÄquivalenzklasseA(A) – maximiere die untere Schranke der Energie:
X
r
min
k qr(k) +ϕr(k)
+
X
rr0
min
kk0 grr0(k,k0) +ϕrr0(k) +ϕr0r(k0)
→max
Φ
s.t.ϕr(k) +
X
r0:rr0∈E
ϕrr0(k) = 0 ∀r,k
eine konkave nicht überall differenzierbare Optimierungsaufgabe.
– Wie istSQ(A) (effizient) zu maximieren?
– Trivialität zu prüfen ist NP im Allgemeinen.
– Für welcheAgibt es einen trivialen Äquivalent?
Diffusion Algorithmus
Wiederhole oft für aller,k
1) Sammeln – gießen so viel wie möglich inqr(k):
4rr0(k) = min
k0 grr0(k,k0) qr(k) =qr(k) +
X
r0:rr0∈E
4rr0(k,k0)
grr0(k,k0) =grr0(k,k0)− 4rr0(k,k0) 2) Verteile gleichmäßig auf inzidente Kantengrr0(k,k0):
4r(k) =qr(k)/4 (bei 4-Nachbarschaft) grr0(k,k0) =grr0(k,k0) +4r(k) qr(k) = 0
Es ist nicht ganz klar, welche Aufgabe der Algorithmus eigentlich löst.
Im Allgemeinen wird SQ damit nicht global optimiert.
Praktisch funktioniert oft befriedigend.
Erweiterungen:
Message Passing Algorithmen – „ gezielte“ (nicht gleichmäßige) Verteilung, Subgradienten Verfahren ...
D. Schlesinger () BV: Diskrete Energieminimierung 10 / 11
Polynomiell lösbare Spezialfälle
Im Allgemeinen sind diskrete Energieminimierung Probleme NP-vollständig.
Bekannte polynomiell lösbare Fälle:
– Der Graph der Aufgabe ist einfach, zum Beispiel eine Kette.
– Die Funktionenghaben bestimmte Eigenschaften.
Submodulare Aufgaben:
r r0
k2
k1 k10
k20
Sei die Menge der LabelKvollständig geordnet, d.h.K={1,2, . . .|K|},
seik1≤k2undk10 ≤k20 in dieser Ordnung.
Die Funktiongrr0 heißt submodular, wenn g(k1,k10) +g(k2,k20)≤g(k1,k20) +g(k2,k10) für alle derartige viertuppelk1,k2,k01,k02.
Die Aufgabe heißt submodular, wenn alle Funktionen submodular sind.
Beispiele:
Entrauschung mit (yr−yr0)2 oder|yr−yr0|, manche binäre Segmentierungen usw.
Es gibt auch gemischte polynomiell lösbare Fälle.