• Keine Ergebnisse gefunden

3 Ergebnisse

3.4 Zur Einbeziehung weiterer Variablen

3.4.1 Teilauswertung III

Um die Möglichkeit der Einbeziehung weiterer Variablen zu überprüfen, soll für diese Teilauswertung auf einen größeren Datenbestand zurückgegriffen werden. Der verwen-dete Datensatz enthält alle verfügbaren Einzelbaumdaten der europäischen Koniferen (Fichten, Kiefern und Lärchen) und umfasst 858 Einzelbäume. Mit Hilfe einer

ERGEBNISSE

kompletten Kreuzvalidierung dieses Datensatzes soll vor allem überprüft werden, inwieweit die k-NN Methode in der Lage ist, Schätzungen auch über verschiedene Baumarten abzuleiten. Als zusätzliche Variable wird hierzu die mittlere Holzdichte der betreffenden Baumart herangezogen, die als Diskriminanzvariable einen gewissen Trennungscharakter zwischen den Baumarten aufweist. Hierbei ist zu bedenken, dass die hier verwendeten Kennzahlen keine einzelbaumspezifischen Daten darstellen. Die mittlere Holzdichte in einem Baumindividuum ist stark von der Jahrringbreite, also somit den herrschenden Wuchsbedingungen in Bezug auf Klima, Boden und der gegebenen Konkurrenzsituation abhängig (NIEMZ, 1993). Die hier verwendeten Holzdichten sind daher nur bedingt geeignet, um als unabhängige Variable im Rahmen einer Regressionsanalyse verwendet zu werden. Hinzu kommt, dass die mittlere Dichte eines einzelnen Baumes stark von den in der Zeit wechselnden Anteilen der einzelnen Biomassekompartimente abhängig ist. Da solche Daten nicht für alle Baumarten vorhanden sind, wird hier auf Dichtekennzahlen aus dem Bereich der Materialkunde zurückgegriffen (SACHSSE, 1984). Neben der mittleren Holzdichte für eine bestimmte Baumart könnte zusätzlich auch der Elastizitätsmodul als weiteres Attribut verwendet werden. Der Elastizitätsmodul (E) als Materialkennwert aus der Werkstoffanalyse ist der Kehrwert der Dehnungszahl. Er entspricht der Zugkraft die nötig ist, um einen Stab mit definiertem Querschnitt elastisch in seiner Länge zu verdoppeln (ausgedrückt in Newton/mm2).

Da die maximale Höhe und Verteilung der Biomasse eines Baumes zum Teil von der Stabilität des Stammes beeinflusst wird, kann diese Kennzahl eventuell als weitere Suchvariable verwendet werden. Die verwendeten Kennzahlen sind in Tabelle 3-10 aufgeführt.

Tabelle 3-10. Mittlere Holzdichte und Elastizitätsmodul der verwendeten Baumarten.

Baumart Darrdichte [g/cm3] E-Modul [N/mm2]

Fichte 0,43 107873 Kiefer 0,49 117000 Lärche 0,55 135331

Für die gegebenen Eingangsgrößen wurden, auf Grundlage von 20 Iterationen der kompletten Kreuzvalidierung, angepasste Gewichtungsverhältnisse hergeleitet. Wie

ERGEBNISSE

schon unter 2.5.2 dargelegt, führt die Erhöhung der Anzahl der berücksichtigten Variablen zu einer enorm großen Anzahl möglicher Kombinationen an Gewichtungs-faktoren für die einzelnen Dimensionen. Zur Bestimmung einer optimalen Kombination der Variablengewichtung sowie der Parameter der Distanzgewichtungsfunktion ist daher die Verwendung eines Optimierungsalgorithmus angebracht. Andererseits hat sich im Rahmen dieser Analyse herausgestellt, dass marginale Veränderungen der Gewichtungsfaktoren nur einen relativ geringen Einfluss auf das Fehlerkriterium RMSE haben. Vielmehr geht es darum, die Bedeutung der verwendeten Variablen auf die zu schätzende Zielgröße untereinander zu relativieren. Dies kann bereits nach einer relativ geringen Anzahl von Iterationen erreicht werden. Abbildung 3-21 zeigt den Verlauf des Fehlerkriteriums RMSE% sowie des Bias über der unterschiedlichen Größe der berücksichtigten Nachbarschaft. Die Zielgröße dieser Untersuchung ist die oberirdische holzige Biomasse (agwb).

Die Gewichtungsfaktoren für die berücksichtigten Variablen BHD (wbhd), Höhe (wh) und Holzdichte (wd) sind dabei wie folgt gewählt: wbhd=0,7; wh=0,2 und wd=0,1. Die Minkowski Konstante ist auf 2 festgelegt (euklidische Distanzmetrik). In diesem Beispiel wurde keine Distanzgewichtung durchgeführt, bzw. der Gewichtungsparameter t=0 gesetzt. Für die so gewählten Parametereinstellungen liegt der geringste RMSE der Kreuzvalidierung mit 26,7% bei einer Anzahl von 4 Nachbarn.

26,7

Abbildung 3-21. Entwicklung des RMSE% sowie des BIAS% über einer unterschied-lichen Anzahl berücksichtigter Nachbarn (k) für alle europäischen Nadelbäume

ERGEBNISSE

Ähnlich wie in der Teilauswertung III wurde als Alternative zu einer festgelegten Anzahl von Nachbarn eine feste Bandbreite überprüft. Hierbei konnte durch die Wahl einer Kernel-Distanz von 0,03 der RMSE% weiter auf 26% gesenkt werden.

Anders als beispielsweise in Teilauswertung I, in der verschiedene Prognoseansätze für die Baumarten Fichte und Kiefer angepasst wurden, wird in diesem Fall ein generali-sierter Ansatz, der für alle beteiligten Baumarten gilt, abgeleitet. Abbildung 3-22 zeigt die „beobachtete“ und geschätzte Biomasse über dem BHD getrennt nach den Baumarten Fichte, Kiefer und Lärche. Weiterhin sind für jede Baumart die Anzahlen der verwendeten Nachbarn über dem BHD dargestellt.

Fichte (n=578):

ERGEBNISSE

Abbildung 3-22. Anzahl berücksichtigter Nachbarn (k) (links) und beobachtete bzw.

geschätzte oberirdische holzige Biomasse (agwb) über dem BHD (rechts).

Wie aus der Einzelbetrachtung der verschiedenen Baumarten deutlich wird, scheint der generalisierte Ansatz in diesem Fall relativ gut in der Lage zu sein, die Beobachtungs-werte abzubilden. Lediglich bei den verwendeten Fichtendaten ist, ähnlich wie in der ersten Teilauswertung, eine beträchtliche Unterschätzung des größten Baumes zu beobachten, da dieser auch in diesem artübergreifenden Datensatz das Extrem der Durchmesserverteilung darstellt. Bei Kiefern und Lärchen bleibt dieser Effekt in diesem Fall aus, da größere Bäume anderer Baumarten zur Schätzung herangezogen werden können. So wird z.B. die Biomasse der größten Lärche aufgrund von 5 Nachbarn geschätzt, die alle Kiefern sind, da sich diese Baumarten in Bezug auf ihre Holzdichte ähnlicher sind als Lärchen und Fichten. Eine detailliertere Darstellung der Durch-messerbereiche der verwendeten Baumarten findet sich in Abbildung 9-2 auf Seite 138.

Neben der Holzdichte kann als weitere Variable auch das Alter der Bäume in die Schätzung einbezogen werden. Hierbei reduziert sich jedoch die Anzahl der berück-sichtigten Trainingsdaten im vorhandenen Datensatz auf 327 Bäume, da nur für diese das Einzelbaumalter bekannt ist. Eine Minimierung des RMSE% führt hierbei zu einer angepassten Anzahl von 8 Nachbarn (siehe auch den Anhang auf Seite 146).

ERGEBNISSE