• Keine Ergebnisse gefunden

4 Datenauswertung

4.2 Klassifizierung

4.2.3 Digitale Klassifizierung

4.2.3.1 Funktionsweisen unterschiedlicher Verfahren

Die digitale Klassifizierung von Fernerkundungsdaten ist die Umsetzung der Rasterdaten in themati-sche Daten mit computergestützten Verfahren. Hierbei wird jedes Pixel in Abhängigkeit der Grauwert-verteilung in den verschiedenen Kanälen einer Klasse zugeordnet. Digital klassifizierte Daten können nach geometrischer Entzerrung direkt in einem GIS weiterverarbeitet werden.

Abb.8: Funktionsweisen verschiedener überwachter Klassifizierungsverfahren (aus WERNER

1996)

Die digitalen Verfahren lassen sich nach der Methode, mit der die Merkmalsräume einer Klasse defi-niert werden, in zwei Hauptgruppen einteilen. Die multispektrale Klassifizierung basiert auf der Unter-suchung der Grauwerte jedes einzelnen Bildpunktes, um Abgrenzungskriterien für die Bildung der thematischen Klassen definieren zu können. Die texturelle Klassifizierung dagegen untersucht zusam-menhängende Pixelgruppen, um anhand der räumlichen Lagebeziehungen der Grauwerte Aussagen über die Textur bzw. Oberflächenstruktur zu erhalten.

Die multispektralen Klassifizierungsverfahren können nach

• dem Prozess der Zuweisung der Pixel zu Klassen, und

• der Definition der spektralen Abgrenzungskriterien unterschieden werden.

Hinsichtlich des Prozesses der Zuweisung der Pixel zu Klassen werden überwachte und unüberwachte Verfahren unterschieden. Bei der überwachten spektralen Klassifizierung wird vom Bearbeiter durch die Einbindung von Trainingsgebieten im Vorfeld der Klassifizierung eine Definition der thematischen Klassen vorgenommen. Im nachfolgenden Klassifizierungsprozess wird jedes Pixel der Bildszene diesen Klassen zugeordnet. Unüberwachte Verfahren dagegen basieren auf der automatisierten Gruppierung (Clustering) von Pixeln. Diese Gruppen oder Spektralklassen werden erst im Nachhinein vom Bearbeiter sinnvollen thematischen Klassen zugeordnet.

Die überwachten multispektralen Klassifizierungsverfahren unterscheiden sich hinsichtlich der Defini-tion der spektralen Merkmalsräume der jeweiligen thematischen Klassen anhand der Grauwertvertei-lung innerhalb der Trainingsgebiete, was auf Abb.8 schematisch verdeutlicht ist.

Bei der einfachsten Methode dienen die minimalen und maximalen Grauwerte der Trainingsgebiete, die die thematischen Klassen repräsentieren, als Abgrenzungskriterien (Hyperbox-Methode). Bei der Mahalanobis-Distanz- und der Maximum-Likelihood-Klassifizierung fließt ein zusätzlicher scher Parameter, die Covarianz, in die Berechnung der Klassenzuordnung eines Pixels ein. Ein statisti-sches Maß, der Mahalanobis-Abstand, stellt hierbei für die GAUSS`sche Verteilung, welche für die Grauwerte der Klassen angenommen wird, eine Gewichtung dar. Bei der Maximum-Likelihood-Klassifizierung können zudem vom Bearbeiter ”a priori” – Wahrscheinlichkeiten definiert werden.

Somit werden z.B. Klassen mit großen Flächenanteilen auf der Bildszene stärker gewichtet. Ist die Zuweisung eines Pixels zu einer Klasse nicht eindeutig, wird es der Klasse mit der höheren Priorität zugeordnet. Dies wird als BAYES`sche Entscheidungsregel bezeichnet. (Doch wird im üblichen Sprachgebrauch auch die Klassifizierung ohne Verwendung von à priori-Wahrscheinlichkeiten als Maximum-Likelihood-Verfahren bezeichnet, obwohl sie strenggenommen der Mahalanobis-Distanz-Klassifizierung entspricht. Da der Begriff der Mahalanobis-Distanz-Mahalanobis-Distanz-Klassifizierung daher vielen nicht geläufig ist, wird in dieser Arbeit die geläufige Bezeichnung ‘Maximum-Likelihood’ für beide Klassifizierungsverfahren übernommen).

Da das Mahalanobis-Distanz- bzw. Maximum-Likelihood-Klassifizierungsverfahren die meisten statistischen Parameter berücksichtigt, ermöglicht es in vielen Fällen eine gute Abgrenzung der Klas-sen. Daher wird die Maximum-Likelihood-Klassifizierung als die exakteste Methode innerhalb der überwachten Klassifizierungsverfahren bezeichnet und am häufigsten für die Satellitenbildauswertung verwendet (RICHARDS 1993).

Die einfachste unüberwachte multispektrale Klassifizierungsmethode ist die Erstellung von Spektralklassen bzw. Clustern im RGB-Farbraum (RGB = Rot Grün Blau), was als RGB -Clustering bezeichnet wird. Hier wird der dreidimensionale Spektralraum (RGB) in gleiche Grauwertintervalle gegliedert. Die Grauwertintervalle beschreiben die spektralen Merkmalsräume der Cluster, so dass alle Pixel innerhalb eines dreidimensionalen Intervalls zu einem Cluster zugeordnet werden. Die Anzahl der Intervalle bzw. Cluster wird vom Nutzer festgelegt.

Bei der ISODATA-Clusteranalyse (Iterative Self-Organizing DATA Analysis Technique) ist die Clusterbildung hingegen weit differenzierter. Hierbei werden zunächst schematisch Zentroide für die Cluster, deren Anzahl vom Nutzer vorher bestimmt wird, festgelegt. Die Cluster- und deren

Zentroidbildung wird mehrmals wiederholt, so dass die Zentroide sich in Richtung der optimalen Mittelwerte der Cluster verschieben (siehe Abb.9).

Abb.9: Funktionsweise der ISODATA-Clusteranalyse (aus RICHARDS 1993)

Das Kriterium für die Clusterbildung ist hier die SAQ bzw. engl. ‚SSE‘ (Summe der Abweichungsquadrate / Sum of Squared Errors). Die SSE ist die kumulative euklidische Distanz, d.h.

der Abstand zwischen jedem Pixel und dem Zentroid bzw. Mittelwert seines Clusters über alle Cluster.

Die Anzahl der Iterationen wird vom Nutzer festgelegt. Für eine optimale Clusterbildung soll sie hoch genug sein, dass die Festlegung der Cluster und deren Mittelwerte weitgehend stabil ist, was durch die Konvergenzgrenze (Convergence Threshold) beschrieben werden kann (WERNER 1996).

Bei der Texturklassifizierung wird die Homogenität bzw. die Heterogenität der Oberflächen unter-sucht. Auch die Extraktion von Kanten oder die Erkennung bestimmter Muster (z.B. bei der geologi-schen Kluftsystemanalyse) ist ein Teil der Texturanalyse.

Die Texturklassifizierung wird meistens anhand von Filterverfahren, die die Umgebung eines Pixels mittels eines Fensters analysieren, durchgeführt. Ein Nachteil bei der Verwendung von Filtern oder Klassifizierungsverfahren, die Fenster verwenden, ist, dass es Fehlzuweisungen an den Grenzen zweier Flächen bzw. Klassen gibt, die bei einer großen Fenstergröße massiver sind als bei einer kleinen (GONG 1994). Daher sollte immer eine möglichst kleine Fenstergröße verwendet werden.

Der am meisten eingesetzte Texturfilter ist die Varianzanalyse. Bei diesem statistischen Verfahren wird die Varianz der Grauwerte innerhalb eines Fensters bestimmt und dem zentralen Pixel zugewiesen. Die Größe des Fensters wird vom Nutzer definiert. Da die Varianz gewissermaßen die Streuung der Grauwertintensitäten der Pixel innerhalb des Fensters beschreibt, ist sie ein Maß für die kleinräumige Homogenität bzw. Heterogenität in der Umgebung des Pixels.

Es gibt aber auch überwachte Texturklassifizierungsverfahren, bei denen die Lagebeziehungen der Grauwerte im Vorfeld durch Trainingsgebiete erfasst werden. Ein Beispiel ist die EBIS-Klassifizierung (Evidenzbasierte Interpretation von Satellitendaten), bei der die Lagebeziehungen anhand von Co-Occurence-Matrizen berechnet werden. Eine nähere Erläuterung dieser Methode kann LOHMANN (1994) und HARALICK (1986) entnommen werden.

Wie bereits in Kap.3, Stand der Wissenschaft, erwähnt, gibt es neben den eben genannten Verfahren weitere moderne digitale Methoden, wobei die objektorientierte Klassifizierung, bei der die Bildda-ten im Vorfeld der Klassifizierung segmentiert werden, für die Auswertung räumlich hochauflösender Bilddaten am vielversprechendsten ist. Die Ausweisung von Segmenten besteht in der Erfassung der Grenzlinien von flächigen Strukturen, linearen Elementen und Einzelobjekten. Die nachfolgende Kla s-sifizierung ist objektorientiert, d.h. die Randlinien der Segmente entsprechen bereits den Grenzen der unterschiedlichen thematischen Klassen, so dass sich die Klassifizierung nicht mehr auf die gesamte Bildszene, sondern jeweils auf die einzelnen Segmente bezieht. Es stehen daher nicht nur die Refle-xionswerte der einzelnen Pixel des Datensatzes als Abgrenzungskriterien zur Verfügung, sondern auch Informationen über Größe, Form, Lage und Nachbarschaften der Segmente. Diese strukturellen und kontextuellen Eigenschaften können bei einer wissensbasierten Klassifizierung für die jeweiligen Klassen als Entscheidungskriterien definiert werden.

Um die Qualität der Klassifizierungsergebnisse bewerten zu können, gibt es Methoden der Bestim-mung der Klassifizierungsgenauigkeit bzw. –güte. Hierbei sollen, anhand der Erstellung einer Feh-ler- oder Konfusionsmatrix möglichst genaue Aussagen unter Verwendung von Stichprobenkontrollen bzw. Referenzdaten getroffen werden. Die Fehlermatrix trägt die Klassenzuweisung von a) der durch-geführten Klassifizierung und b) der Referenzdaten gegenseitig an. Somit kann die prozentuale Klassi-fizierungsgenauigkeit angegeben werden. Die Qualität der KlassiKlassi-fizierungsgenauigkeit einer Fehlermatrix hängt vom Umfang und von der Zuverlässigkeit der Referenzdaten ab. Dass die Referenzdaten einen hohen Einfluss auf die Berechnung der Klassifizierungsgenauigkeit haben, zeigen LO & WATSON (1998) exemplarisch auf. Die Fehlermatrix liefert daher Annäherungswerte der Klassifizierungsgüte, die jedoch nicht als quantitative Maße Gültigkeit haben.