• Keine Ergebnisse gefunden

3.2 Methoden der Bildverarbeitung

3.2.3 Segmentierung

Bei den Verfahren zur Bildvorverarbeitung wurden Operationen vorgestellt, die die Erkennung von Objekten verbessern. Bei der Segmentierung erfolgt schließ-lich die Zuordnung von Bildpunkten zu Objekten. Es entstehen hierdurch Binär-bilder, die eine Einteilung in Bildregionen implizieren. Die elementaren Segmen-tierungsverfahren können nach JÄHNE (2012, S. 542) in

pixelorientierte Segmentierung, kantenorientierte Segmentierung,

regionenorientierte Segmentierung sowie modellbasierte Segmentierung

klassifiziert werden. Die ersten drei Verfahren basieren auf lokalen Informatio-nen. Dabei werden entweder Grauwerte einzelner Pixel genutzt (pixelorientierte Segmentierung), mittels der Detektion von Diskontinuitäten Kanten identifiziert und verfolgt (kantenorientierte Segmentierung) oder homogene Grauwertberei-che identifiziert (regionenorientierte Segmentierung). Bei der modellbasierten Segmentierung hingegen wird die geometrische Form zur Objekterkennung ver-wendet (JÄHNE 2012, S. 542). Bei den vier grundlegenden Konzepten zur Seg-mentierung handelt es sich um alternative Ansätze. Diese werden in der Folge vorgestellt und ihre Vor- und Nachteile diskutiert.

Pixelorientierte Segmentierung

Das pixelorientierte Verfahren, auch Schwellwertverfahren genannt, ist das ein-fachste und am häufigsten angewandte Werkzeug zur Bildsegmentierung (HORN

2014, S. 21, JÄHNE 2012, S. 542). Bei Schwellwertverfahren werden alle Punkte eines Bildes unterhalb eines bestimmten Grauwertes als schwarz und alle ande-ren als weiß definiert (DEMANT et al. 2011, S. 97). Dieser bestimmte Grauwert wird als Schwellwert bezeichnet. Die Wahl des Schwellwertes ist von entschei-dender Bedeutung für den Erfolg der Binarisierung (HORN 2014, S. 21). Idealer-weise weist das Histogramm der Grauwerte eines Bildes, bspw. bei der Trennung eines Objekts vom Bildhintergrund, eine bimodale Verteilung mit zwei getrenn-ten Maxima auf (vgl. Abbildung 17).

Abbildung 17: Beispiel eines bimodalen Grauwerthistogramms

In der Praxis treten aber auch immer Grauwerte zwischen den beiden Verteilun-gen auf. Nach JÄHNE (2012, S. 542-543) ist die Bestimmung des optimalen Schwellwertes ohne Wissen über den Typ der Kante zwischen Objekt und Hin-tergrund nicht möglich. Im Falle einer symmetrischen Kante entspricht der kor-rekte Schwellwert dem mittleren Grauwert zwischen Hintergrund- und Objektpi-xeln. Die Wahl des Schwellwertes kann neben einer manuellen Festlegung auch automatisiert auf Basis des Grauwerthistogramms und damit reproduzierbar erfolgen (HORN 2014, S. 21). Hierzu existieren nach BURGER & BURGE (2015, S. 268) zwei verschiedene Ansätze: formbasierte und statistische Methoden.

Formbasierte Methoden analysieren die Form des Grauwerthistogramms bspw.

im Hinblick auf lokale Minima und Maxima. Sie bieten im Vergleich zu statisti-schen Methoden keine nennenswerten Vorteile und sind weniger robust. Im Ge-gensatz hierzu nutzen statistische Methoden statistische Informationen aus dem Grauwerthistogramm zur Schwellwertbestimmung. Das bekannteste Verfahren nach OTSU (1979) wird im Folgenden erläutert:

Für ein Bild, bestehend aus u*v Pixel sowie den Grauwertstufen {0, 1, 2, …, L-1}, soll eine Trennung in die beiden Bildbereiche D (dunkle Pixel) für die Grauwerte [0; k] und H (helle Pixel) für die Grauwerte [k+1; L] erzeugt werden.

Es wird davon ausgegangen, dass das Histogramm mit der Anzahl von nI Pixel des Grauwertes I eine bimodale Verteilung aufweist. Die Wahrscheinlichkeit dafür, dass ein Pixel in D liegt, beträgt:

PD(k) = ∑ pI

Für H beträgt die Wahrscheinlichkeit:

PH(k) = ∑ pI

L−1

I=k+1

= 1 − PD(k) (3–12)

Dabei berechnet sich der Anteil der Pixel mit dem Grauwert I in einem Bild zu:

pI = nI

uv (3–13)

Des Weiteren betragen die durchschnittlichen Grauwerte mD in D, mH in H, so-wie im gesamten Bild mG:

mD(k) = 1

PD(k) ∑ I ∙ pI

k

i=0

, (3–14)

mH(k) = 1

PH(k) ∑ I ∙ pI

L−1

I=k+1

(3–15)

mG = ∑ I ∙ pI

L−1

I=0

. (3–16)

Zur Ermittlung des optimalen Schwellwertes nutzt das Verfahren nach Otsu die Varianz zwischen den beiden Bildbereichen D und H (Interklassenvarianz σB2).

Diese lässt sich wie folgt berechnen:

σB2 = PD(k) ∙ (mD(k) − mG)2+ PH(k) ∙ (mH(k) − mG)2. (3–17) Schließlich gilt für den optimalen Schwellwert k* mit der maximalen Interklas-senvarianz:

k = arg max0≤k≤L−1σB2(k). (3–18)

Darüber hinaus existiert eine Vielzahl weiterer statistischer, Histogramm-basierter Verfahren. Einen Überblick geben bspw. BURGER & BURGE (2015, S. 267-290). Des Weiteren sind in Tabelle 3 die wichtigsten Verfahren aufge-führt. Wie die Verfahren sich voneinander unterscheiden, ist in der angegebenen Literatur nachzulesen.

Tabelle 3: Statistische Methoden zur Schwellwertbestimmung (LANDINI 2015)

Bezeichnung Urheber

Huang HUANG &WANG 1995

Intermodes PREWITT &MENDELSOHN 1996

ISODATA RIDLER &CALVARD 1978

Li LI &TAM 1998

Maximum Entropy KAPUR et al. 1985

Mean GLASBEY 1993

Minimum Error KITTLER &ILLINGWORTH 1986

Minimum PREWITT &MEDELSOHN 1996

Moments TSAI 1985

Otsu OTSU 1979

Percentile DOYLE 1962

Renyi Entropy basiert auf KAPUR et al. 1985 Shangbhag SHANBHAG &ABHIJIT 1994

Triangle ZACK et al. 1977

Yen YEN et al. 1995

Ein Vorteil pixelorientierter Segmentierungsverfahren liegt in der Detektion von Objekten, die einen hohen Kontrast zum Hintergrund aufweisen und sich gegen-seitig nicht berühren (HORN 2014, S. 21). Aufgrund der pixelweisen Segmentie-rung sind identifizierte Objekte allerdings nicht immer zusammenhängend, d. h.

es können isolierte Pixel oder kleine losgelöste Regionen resultieren (JÄHNE

2012, S. 547). Daher sind in den meisten Fällen Nachbearbeitungsschritte not-wendig. Nachteilig ist zudem ein sich einstellender Größeneffekt bei der Objekt-segmentierung, der sich dadurch ergibt, dass sich im Randbereich von Objekten der Grauwert nur allmählich dem Hintergrundgrauwert annähert. Weniger helle Objekte werden daher zu klein, hellere Objekte zu groß segmentiert (JÄHNE

2012, S. 544-545). Ferner ist neben der Verwendung eines Schwellwertes für ein gesamtes Bild auch die Definition mehrerer ortsabhängiger Schwellwerte pro Bild möglich (SEZGIN & SANKUR 2004). Dies ist dann sinnvoll, wenn verschie-dene Bildbereiche unterschiedliche Helligkeiten aufweisen (DEMANT et al. 2011, S. 98). Die Definition ortsabhängiger Schwellwerte geht jedoch mit Einbußen der Geschwindigkeit des Segmentierungsverfahrens einher. Besser ist es daher, die inhomogene Beleuchtung bei der Bildaufnahme oder bei der Bildvorverarbeitung

zu kompensieren (JÄHNE 2012, S. 542). Voraussetzung für die Verwendung eines globalen Schwellwertes sind demnach homogen beleuchtete Bilder.

Kantenorientierte Segmentierung

Häufig sind Kanten von Objekten durch abrupte Änderungen der lokalen Bildin-formation, wie der Helligkeit oder der Farbe, gekennzeichnet (HORN 2014, S. 22). Kantenorientierte Verfahren verwenden zur Segmentierung die Maxima des Betrags des Grauwertgradienten. Diese Maxima werden anschließend entlang der Objektkontur verfolgt (JÄHNE 2012, S. 547). Einen entsprechenden Algo-rithmus gibt bspw. PARKER (1994). Zudem ist das Ergebnis der Segmentierung unabhängig von der Intensität des Bildes. Ferner verläuft die Segmentierung auch dann korrekt, wenn die Beleuchtung des Bildes inhomogen ist. Ein weiterer Vor-teil ist, dass die segmentierten Objekte immer zusammenhängend sind (DEMANT

et al. 2011, S. 107). Kantenorientierte Verfahren weisen nur dann systematische Fehler auf, wenn der Kontrast von Objekten gering ist, d. h. wenn die Kanten verschmiert sind (JÄHNE 2012, S. 547). Des Weiteren müssen überflüssige Kan-ten mittels NachbearbeitungsschritKan-ten, wie bspw. des Canny-Algorithmus (C AN-NY 1986), entfernt werden (HORN 2014, S. 23).

Regionenorientierte Segmentierung

Regionenorientierte Verfahren konstruieren die Bildsegmente direkt. Der Ansatz basiert auf der Annahme, dass Objekte bzgl. bestimmter Kenngrößen, wie bspw.

der Grauwertintensität, homogen sind. Bezüglich dieser Kenngrößen wird ein Homogenitätskriterium formuliert (HORN 2014, S. 24). Die dabei gewählte Schwelle ist entscheidend für die Segmentierung (STEINBRECHER 2002, S. 203-204). Um diese zu ermitteln, existieren heute automatisierte Verfahren (CHAUDHURI & AGRAWAL 2010). Die beiden grundlegenden Ansätze sind das Regionenwachstum und die Regionenspaltung. Beim Regionenwachstum werden initial einzelne Pixel als Segmente angenommen, die dann mittels eines Homo-genitätskriteriums vergrößert werden. Das Verfahren ist beendet, wenn keine weitere Zusammenfassung möglich ist, ohne das Homogenitätskriterium zu ver-letzen. Bei der Regionenspaltung ist die Vorgehensweise gegensätzlich, d. h. der Prozess beginnt mit dem ganzen Bild. Folglich wird das Bild solange geteilt, bis das Homogenitätskriterium für jedes Segment erfüllt ist (HORN 2014, S. 24).

Darüber hinaus werden beim „split and merge“ die beiden grundlegenden Ansät-ze kombiniert (JÄHNE 2012, S. 547). Ein Bild wird zunächst ähnlich eines Schachbretts in Felder unterteilt. Falls das Homogenitätskriterium der Felder nicht erfüllt ist werden diese weiter unterteilt. Demgegenüber werden auch

be-nachbarte Felder zusammengefasst, falls für die Kombination das Homogenitäts-kriterium erfüllt ist (STEINBRECHER S. 2002, 211-213). Ein Vorteil von regio-nenorientierten Verfahren ist deren Eignung zur Segmentierung von verrauschten Bildern. Demgegenüber steht aber ein hoher Implementierungsaufwand (JAIN

1989, S. 412).

Modellbasierte Segmentierung

Bei den bisher vorgestellten Segmentierungsverfahren, die den klassischen An-satz der Bildverarbeitung repräsentieren, wurde jeweils durch die Binarisierung der Bilder die Basis für die spätere Merkmalsextraktion und die anschließende Klassifikation geschaffen. Man kann dies als die Suche nach Kandidaten für mögliche Bildobjekte umschreiben (DEMANT et al. 2011, S. 108). Bei modellba-sierten Segmentierungsverfahren (Template Matching) hingegen werden direkt spezifische Muster in Bildern durch den Vergleich (Matching) mit Beispielmus-tern (Templates) gesucht (HORN 2014, S. 27). Ein Template wird hierzu über das zu analysierende Bild geschoben und an jeder Position ein Ähnlichkeitsmaß berechnet (DEMANT et al. 2011, S. 109). Modellbasierte Verfahren können daher angewandt werden, wenn die exakte Form von Objekten in Bildern bereits vorher bekannt ist (JÄHNE 2012). Meist sind dabei nur geringe Abweichungen der ge-suchten von dem im Bild befindlichen Objekten erlaubt (HORN 2014, S. 27).

Eine Ausweitung auf eine beliebige Anzahl an Objekten ist möglich, zieht aber hohe Rechenaufwände nach sich (DEMANT et al. 2011, S. 109).