• Keine Ergebnisse gefunden

7 MULTIVARIATE ANALYSE SPEKTRORADIOMETRISCHER MESSUNGEN

7.4 Modellierungsergebnisse und ihre Diskussion

7.4.5 Zusammenfassung der Ergebnisse aus der Regressionsanalyse

Im Mittelpunkt der Untersuchungen zur Regressionsanalyse in den vorherigen Kapiteln standen die Beziehungen zwischen spektraler Information und den Nährelementkonzentrationen frischer und getrockneter Pflanzenmasse.

Grundsätzlich dienten die Untersuchungen zur Klärung folgender Fragen:

(1) Welcher Wellenlängenbereich ist zur Ableitung von Komponentenkonzentrationen aus Spektralinforation am besten geeignet?

(2) Welches Standardisierungsverfahren liefert den besten Eingangsdatensatz für die multiple Regression (MLR)?

(3) Können Ergebnisse der Laborspektroskopie auf in situ Messungen übertragen werden?

(4) Welche spektrale Auflösung wird für die multivariate Analyse von Pflanzenaufnahmen zur Vorhersage von Komponentenkonzentrationen benötigt?

(5) Wird das Vorhersagemodell durch andere (biophysikalische) Faktoren beeinträchtigt?

Die Schätzmodelle auf Basis der Wellenlängenkanäle im VNIR-Bereich (580 – 1050 nm) weisen im Allgemeinen eine bessere Vorhersagegüte (r2) für in situ Messungen auf als diejenigen für den SWIR-Bereich (Tab. 35). Die Kombination der beiden Spektralbereiche führt in den meisten Fällen zu leichten Verbesserungen der Vorhersagegenauigkeit, die aber das Signifikanzniveau der Vorhersage nicht entscheidend verbessern. Die Gründe hierfür sind zum einen systembedingt (höhere spektrale Auflösung, niedrigeres Signal-Rausch-Verhältnis im VNIR), zum anderen durch die Genese der Absorptionsbanden zu erklären. Die Absorptionsbanden im VIS sind auf Elektronenübergänge zurückzuführen, für die Energie elektromagnetischer Strahlung "eingefangen" wird. Die Energiebeträge, die hierfür benötigt werden, sind um ein Vielfaches höher, als diejenigen, die zur Ausbildung von Molekülschwingungen und Rotationsbewegungen führen und entsprechend die Strahlung im NIR / SWIR aufnehmen. Umso deutlicher schlagen sich auch die Energieumwandlungen im VIS in der Spektralsignatur nieder.

Zusätzlich weist der VNIR-Bereich mit dem Rot-Absorptionsbereich und dem R-IR-Anstieg zwei signifikante Signaturmerkmale auf, die in jedem Vegetationsspektrum markant hervortreten. Entsprechend deutlich treten auch Änderungen dieser Merkmale in den normierten Spektralbereichen hervor.

Tab. 35: Konzentrations-Schätzungen der Makronährelemente und der Trockenmasse aus der Regressionsanalyse für das jeweils beste Spektralderivat (in situ Messungen)

(EC-32) abhängige Variable

in situ Messungen (VNIR) N P K Mg Ca S dm H2O

Spektralderivat R' R' R' BNC R' BNC SNC BNC/SNC korr. r2 0.589* 0.653 0.524 0.596 0.434 0.374 0.633 0.534 RMSEn 5.62 4.4 1.42 3.73 8.1 5.96 11.4 0.65 Regressionsverfahren MLR MLR MLR MLR MLR MLR MLR MLR Anzahl Variablen (HK / WL) 5 5 5 5 5 5 5 5 in situ Messungen (SWIR) N P K Mg Ca S dm H2O Spektralderivat R' R' Rp BNC RFV R' RFV R’

korr. r2 0.36 0.454 0.359 0.498 0.367 0.401 0.469 0.469 RMSEn 7.01 5.52 5.2 4.16 8.57 5.78 13.72 0.690 Regressionsverfahren MLR MLR PCR MLR PCR MLR PCR MLR Anzahl Variablen (HK / WL) 4 4 4 5 4 4 5 5 in situ Messungen (gesamt) N P K Mg Ca S dm H2O Spektralderivat R' R' R' R' SNC R' BNC/SNC R’

korr. r2 0.641 0.697 0.524 0.579 0.583 0.578 0.565 0.595 RMSEn 5.25 4.11 4.49 3.81 6.95 4.85 12.41 0.610 Regressionsverfahren MLR MLR MLR MLR MLR MLR MLR MLR Anzahl Variablen (HK / WL) 5 5 5 5 5 5 3 5

* Alle Zusammenhänge sind innerhalb eines Konfidenzintervalls von 99 % (zweiseitig) statistisch signifikant.

Mit Ausnahme des SWIR-Bereichs wird die beste Vorhersage immer durch ein Regressionsmodell auf Basis der wellenlängenbasierten Spektralvariablen (R', BNC, SNC) gebildet. Die Ableitungsspektren und die Kontinuum-transformierten Spektren bilden die lokalen Extrema bzw. Minima (BNC, SNC) am besten heraus und führen gleichzeitig zur Minimierung der Einflüsse multiplikativer oder additiver Effekte auf die Ausbildung der Funktionsmerkmale. Gleichzeitig werden vor allem durch die Ableitung und die SNC-Skalierung (vgl. Kap. 6.6.2.3) enge, untergeordnete Spektralmerkmale innerhalb breiter Absorptionsbereiche (z. B. von Pflanzenwasser) hervorgehoben.

Die erste Ableitung der geglätteten Spektren (vgl. Kap. 6.2) führt generell zur Ausbildung signifikanter Vorhersagemodelle und wird deshalb für die Überprüfung der Übertragbarkeit der Modelle in Kap. 7.4.6 verwendet.

Die Vorhersagegenauigkeit der Konzentrationen für die untersuchten Mikronährelemente ist auf den ersten Blick vergleichbar mit der für die Hauptnährelemente (vgl. Tab. 35 und Tab.

). Für die Beurteilung der Schätzgüte müssen hier aber zusätzlich die mittleren normierten Residuen (RMSE

36

n) der Schätzmodelle betrachtet werden. Diese zeigen trotz des hohen Bestimmtheitsmaßes überdurchschnittlich starke Abweichungen der Vorhersagewerte (cpred) von den Messwerten (cmeas). Dieses Beispiel zeigt, dass zur Bewertung der Vorhersagegenauigkeit nicht ein einzelnes Gütemaß ausreicht, sondern je nach Ausprägung der Variablenwerte verschiedene Kennwerte unterschiedliche Aussagen liefern. Die Schätzung der Mikronährelementkonzentrationen aus den Spektralvariablen wird aufgrund der hohen mittleren Restfehler der Schätzung verworfen.

Tab. 36: Konzentrations-Schätzungen der Mikronährelemente aus der Regressionsanalyse für das jeweils beste Spektralderivat (in situ und Labormessungen)

(EC-32) abhängige Variable

in situ Messungen (gesamt) Fe Mn Zn Cu Mo Na Al Spektralderivat R' R' SNC R' RP R' R' korr. r2 0.705 0.65 0.812 0.573 0.531 0.632 0.559 RMSEn 24.37 11.54 16.81 12.77 32.49 17.64 46.88 Regressionsverfahren MLR MLR MLR MLR PCR MLR MLR

5

Anzahl Variablen (HK / WL) 5 5 5 5 5 5

Die Hauptkomponentenregression (PCR) führt nur in wenigen Fällen für die Hauptnährelementkonzentrationen zu Ergebnissen, die mit denen der MLR vergleichbar sind (vgl. Tab. 30 bis Tab. 32). Obwohl durch die Transformation der Einflussvariablen (RP, RFV, ROZ2) in unkorrelierte Hauptkomponenten ein Datensatz mit bestmöglicher erklärter Varianz vorliegt, ist die Vorhersagegüte im Mittel schlechter als für die übrigen Modellierungen. Dies kann mit dem hohen Anteil erklärter Varianz (>95%) in den ersten beiden Hauptkomponenten begründet werden. Auch wenn eine höhere Anzahl von Hauptkomponenten in die Regressionsanalyse einbezogen wird, ändert dies nichts an der minderen Qualität des Eingangsdatensatzes, die durch die hohen Multikollinearitäten der Variablenwerte bedingt ist (vgl. hierzu Kap. 7.3.1.1). Die ersten drei Hauptkomponenten der kalibrierten bzw. skalierten Spektralvariablen beschreiben pauschal lediglich 3 ± 1 große Wellenlängenbereiche (siehe Abb. 64). Die erste HK enthält i.d.R. die Varianz des VIS und NIR/SWIR-1-Bereichs (hier:

580 – 730 nm, 750 – 1280 nm), die zweite HK beschreibt den R-IR-Anstieg (REI: 700 – 750 nm) und die dritte HK enthält in den meisten Fällen die Varianz des kompletten SWIR-2-Bereichs (2000 – 2350 nm). Wendet man diese Feststellung auf die Beantwortung der Frage nach der bestmöglichen spektralen Auflösung eines Fernerkundungssystems zum Vegetationsmonitoring an, wären in dieser Konesequenz lediglich drei oder vier breite Wellenlängenkanäle im VIS, REI, NIR/SWIR und SWIR-2 notwendig, um den Versorgungszustand eines Pflanzenbestands annähernd genauso gut zu beschreiben, wie es

mit Hilfe des kompletten Datensatzes eines hochauflösenden Spektrometers der Fall wäre. Zu vergleichbaren Ergebnissen bei der Auswertung der Hauptkomponentenmatrizen von nicht-transformierter Spektrometerdaten kommt CLEVERS (1999).

Der Nachteil breiter Spektralkanäle liegt jedoch in der begrenzten Möglichkeit der differentialanalytischen Transformation und Auswertung solcher Spektralinformationen, was wiederum eine multivariate Auswertung zum Zwecke der Zustandsbeschreibung natürlicher Oberflächen unmöglich macht.

-0.4 -0.2 0 0.2 0.4 0.6 0.8 1

550 750 950 1150 1350 1550 1750 1950 2150 2350

Wellenlänge [nm]

HK_1 HK_2 HK_3

Abb. 64: Faktorladungen (Korrelationskoeffizienten) der ersten drei Hauptkomponenten für einen Datensatz skalierter Winterweizenspektren (RFV) (Imbshausen, Schlag: Unter dem Echter Wege)

Für die multivariate Datenauswertung mit Hilfe einer Regressionsanalyse ist die spektrale Bandbreite des Aufnahmesystems bis zu einem oberen kritischen Grenzwert (ca. 10 nm) nicht das entscheidende Kriterium für den Informationsgehalt eines Sensors. Die Simulation der ASD FieldSpec®-Messungen auf die spektrale Bandbreite bestehender Hyperspektralsensoren (EOS-1/Hyperion, HyMap®, siehe Kap. 7.4.4) brachte keine wesentlichen Einbußen in der Güte der Schätzmodelle zur Vorhersage von Komponentenkonzentrationen (cmeas) mit sich.

Entscheidend für die Auswertung von Vegetationsspektren ist vielmehr ein möglichst hohes, konstantes Signal-Rausch-Verhältnis (SNR) und die Lage der Zentrumswellenlängen eines Wellenlängenkanals.

Die vergleichende Auswertung der durch die in situ und die Labormessungen gebildeten Regressionsmodelle führt zu dem Schluss, dass die Regressionsparameter der Schätzmodelle für die Labormessungen nicht ohne weiteres auf Vorhersagemodelle für in situ Spektralsignaturen übertragen werden können (siehe auch bei JACQUEMOUD et al. 1995). Die durch die schrittweise Regression detektierten Wellenlängenkanäle mit der höchsten erklärten Varianz für die jeweilige abhängige Variable (Komponentenkonzentration) sind für die spektroradiometrischen Labormessungen und die entsprechenden Feldaufnahmen nur vereinzelt deckungsgleich. In der Regel besteht kein Zusammenhang zwischen den durch den Algorithmus ausgewählten Spektralkanälen.

Für die in situ Messungen weist jede der untersuchten Komponenten einen individuellen Datensatz von maximal fünf Einflussvariablen auf, die die Variabilität der Messwerte am

besten erklären können (Abb. 65). Hierbei gibt es so gut wie keine Überschneidungen zu den erklärenden Variablen für den Pflanzenwassergehalt, was die Unabhängigkeit der Signaturmerkmale untereinander und vor allem in Bezug zum Wassergehalt unterstreicht. Für die vorliegende Untersuchung besteht auf der Basis des transformierten Datensatzes (Ableitungsspektren) keine Beeinträchtigung der Signaturmerkmale für die Hauptnährelemente durch die Wasserabsorptionsbanden.

550 750 950 1150 1350 1550 1750 1950 2150 2350

Wellenlänge [nm ] n

p

k

mg

ca

s

h2o

Abb. 65: Lage der Wellenlängenkanäle mit der höchsten erklärten Varianz der

Nährelementkonzentrationen von Winterweizenbeständen (in situ Messungen)

Die Schätzung von Komponentenkonzentrationen aus Spektralinformationen mit Hilfe der multiplen schrittweisen Regression liefert insgesamt vielversprechende Ergebnisse, selbst wenn nur der VNIR-Bereich betrachtet wird. Die durch das Iterationsverfahren ausgewählten Wellenlängenkanäle sind nicht stabil, liegen jedoch in den meisten Fällen in oder in der Nähe eines nachgewiesenen Absorptionsbereiches für das jeweilige Element, bzw. den durch dieses geprägte Stoffwechselprodukt oder ein verwandtes Element (siehe hierzu Zusammenfassung in CURRAN 1989 und BARTON et al. 1992). Die Regressionsparameter für die Schätzung der Hauptnährelemente N, P und K aus spektroradiometrischen in situ Messungen von Winterweizenbeständen sind in Tab. 37 zusammengestellt.

Tab. 37: Regressionsparameter ausgewählter Schätzmodelle für den VNIR und den SWIR-Bereich (EC-32)

in situ Messungen N P K

r2 0.59* 0.36 0.65 0.45 0.52 0.36

RMSEn 5.61 7.01 4.40 5.52 1.41 5.20

637 (Chb) 1250 880 1145 625 1160

661 (Cha) 2105 964 (H2O) 1280 889 1175 730 2165 1009 2045 (N) 919 (N) 1220 (H2O) 784 2180 1012 2315 (N) 976 (H2O) 2330 Wellenlängen

1024 1018 (N) 1009

Transformation R' R' R'

Spektralbereich VNIR SWIR

* Alle Zusammenhänge sind innerhalb eines Konfidenzintervalls von 99 % (zweiseitig) statistisch signifikant.

VNIR SWIR VNIR SWIR

(fettgedruckte Wellenlängen indizieren einen indirekten Zusammenhang zum Absorptionsmerkmal eines anderen Elements, fett rotgedruckte Wellenlängen indizieren einen direkten kausalen Zusammenhang zu dem Absorptionsmerkmal)