• Keine Ergebnisse gefunden

Der Einfluss von Korrelation auf die Ergebnisse von Berechnungen

N/A
N/A
Protected

Academic year: 2022

Aktie "Der Einfluss von Korrelation auf die Ergebnisse von Berechnungen"

Copied!
10
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

von Berechnungen

Gerhard NAVRATIL

Dieser Beitrag wurde nach Begutachtung durch das Programmkomitee als „reviewed paper“

angenommen.

Zusammenfassung

Korrelation ist bei der Verarbeitung von Daten aus großräumigen Vermessungen immer noch ein Mysterium. Es gibt unterschiedliche Meinungen darüber, ob korrelierte Daten die Qualität von Auswertungen verbessern oder verschlechtern. Es ist anzunehmen, dass es mehrere Faktoren gibt, welche die Antwort auf diese Frage beeinflussen. In diesem Beitrag wird anhand einiger kleiner Beispiele gezeigt, dass einer dieser Faktoren die Verwendung absoluter Werte ist und relative Modelle bessere Ergebnisse liefern als absolute Modelle.

1 Einleitung

Korrelation ist ein wesentlicher Bestandteil des täglichen Lebens. Vor allem die räumliche und zeitliche Autokorrelation nehmen wir als selbstverständlich hin und erwarten, dass sich die Orte der Restaurants, die Angebote der Supermärkte und die Fahrtintervalle der öffent- lichen Verkehrsmittel nicht beliebig ändern. Dasselbe gilt natürlich auch für vermessungs- technisch relevante Bereiche wie beispielsweise die Atmosphäre. Bei zeitnah am selben Ort durchgeführten Messungen sind die atmosphärischen Bedingungen ähnlich. Da die Atmo- sphäre jedoch die Messungen beeinflusst (beispielsweise durch die unterschiedliche Aus- breitungsgeschwindigkeit optischer Signale bei unterschiedlicher Dichte) werden auch die Ergebnisse dieser Messungen in ähnlicher Art beeinflusst. Diesem Umstand wird bei hoch- genauen Aufgaben der Vermessung Rechnung getragen. In der Ingenieurgeodäsie und der höheren Geodäsie ist es bei den heute üblichen Genauigkeitsanforderungen nicht möglich, ohne Berücksichtigung der Korrelationen zu brauchbaren Ergebnissen zu kommen, da die Fehlereinflüsse sonst nicht genau genug modelliert und die Messabweichungen eliminiert werden können. Hier werden entweder Strategien zur Elimination von Korrelationen einge- setzt oder die auftretenden Korrelationen werden entsprechend modelliert und in den Be- rechnungen berücksichtigt. Bei Aufgaben mit niedrigeren Genauigkeitsansprüchen werden die Korrelationen aber oftmals außer Acht gelassen. So werden zum Beispiel beim Einspie- len von Daten in Geographische Informationssysteme vorhandene Informationen zur Korre- lation aus mehreren Gründen meist weggelassen, weshalb man in der Folge von unkorre- lierten Beobachtungen ausgeht. Neben der Unkenntnis über das Ausmaß der Korrelation gibt es drei weitere Gründe für diese Vorgangsweise: Zwei davon sind die sich daraus er- gebenden formalen Vereinfachungen und die Einsparungen bei der Datenmenge, die bereits ohne Daten zur Korrelation in die Terabyte gehen kann. Ein letzter Grund ist allerdings die

(2)

Unsicherheit darüber, ob Korrelation nun positive oder negative Effekte auf die Ergebnisse hat. Im Zweifel werden Korrelationen daher ignoriert. Sie sind aber vorhanden und somit stellt sich die Frage, wie bei der Auswertung vorgegangen werden sollte, um negative Ein- flüsse auf die Genauigkeit der Auswertung zu verhindern oder zumindest abzuschwächen.

Warum werden solche Überlegungen immer wichtiger? Bei terrestrischen Beobachtungen wird in der Praxis zumindest versucht, offensichtliche Ursachen für Korrelation zu vermei- den. Ist das nicht möglich, so kann zumindest versucht werden, die vorhandene Korrelation abzuschätzen. Das ist bei auch modernen Verfahren wie GPS möglich, aber aufwändig (vgl.

SCHÖN &BRUNNER 2008, SCHWIEGER 2001). Diese Informationen sollten dann aber nicht ungenutzt bleiben. Bei der Erfassung von Daten vorgegebener Qualität ist es notwendig, die Auswirkungen dieser Korrelationen zu berücksichtigen. Oftmals ist aber nicht die Messge- nauigkeit, sondern die Qualität abgeleiteter Werte vorgegeben, was in relativer oder absolu- ter Form erfolgen kann. Beim Antrag auf Agrarförderung gibt es beispielsweise eine GIS- spezifische Toleranz, die sich folgendermaßen berechnet: „Umfang des digitalisierten Feld- stücks in Meter x 1,5 ergibt die Toleranz in m2“ (AGRARMARKT AUSTRIA 2008, 24). Wie bestimmt man in solchen Fällen die notwendige Messgenauigkeit und wie berücksichtigt man allfällige Korrelationen? Für die Berücksichtigung von Korrelationen gibt es geeignete Ansätze. Übliche Methoden sind die Fehlerfortpflanzung mit Taylor-Linearisierung oder die Monte Carlo Simulation (vgl. KARSSENBERG &DE JONG 2005). Die Varianz des Er- gebnisses einer Funktion f(x1, …, xn) ermittelt man über

2

2 2

1 , 1;

i 2 i k

n n

f x x x

i i i k i k i k

f f f

x x x

  

 

     

 

    

  . (1)

Dabei sind 2xi die Varianz des i-ten Parameters, 2f die Varianz des Funktionsergebnis- ses, xixk die Kovarianz zwischen dem i-ten und dem k-ten Parameter ist und die Brüche die partiellen Ableitungen der Funktion nach den jeweils angegebenen Parametern. Die Kovarianzen ergibt sich aus der Korrelation rxixk über xixk xixkrxixk. Es ist sofort er- sichtlich, dass die doppelte Summe in (1) wegfällt und sich die Formel wesentlich verein- facht, wenn alle Korrelationen gleich Null, also alle Parameter unkorreliert sind.

Das Quantifizieren von Korrelationen ist problematisch. Zum Abschätzen von Korrelatio- nen ist eine große Menge an Daten notwendig. Jedes Wertepaar müsste vielfach bestimmt werden, um daraus die Korrelation abzuleiten. Das ist in der Praxis meist nicht gegeben, da Messungen ökonomisch zu erfolgen haben, also in möglichst geringer Zahl. Es ist daher im Allgemeinen bei einer durchzuführenden Berechnung nur bekannt, dass es Korrelationen gibt, wie groß diese Korrelationen sind, ist jedoch fraglich. Dann sollte bei der Berechnung so vorgegangen werden, dass sich das Ergebnis der Berechnung beim Vorliegen von Korre- lationen verbessern und nicht verschlechtern würde. In diesem Artikel wird gezeigt, wie man einerseits den Einfluss von Korrelationen abschätzen kann und es werden andererseits Kriterien für geeignete Berechnungsmodelle angegeben.

(3)

2 Korrelation

Liegen Wertepaare (xi, yi) vor, so können diese unabhängig voneinander streuen oder aber eine gewisse Abhängigkeit zeigen. Beschreiben beispielsweise die xi die Körpergröße und die yi das Gewicht, so wird sich ein Zusammenhang zeigen, da große Menschen tendenziell schwerer sind als kleine Menschen. Die Streuung der einzelnen Größen wird mit der Va- rianz

  

 

n

i i n

i

i x

x n x

n 1 x 1

2 2 1

Mittelwert dem

1 mit

 1 (2)

beschrieben, der Zusammenhang zwischen den beiden Größen mit der Kovarianz

  

n

i

i i

xy x x y y

n 1

 1 . (3)

Durch Normieren der Kovarianz über

y x

xy

rxy

  , (4)

bekommt man den Pearsonschen Korrelationskoeffizienten rxy, der Richtung und Stärke des linearen Zusammenhanges zwischen den Wertepaaren misst (SCHNEIDER et al. 1995).

Wie im Folgenden noch näher erläutert wird, ist in der Geodäsie die Differenzierung in eine physikalische, mathematische und gemischte Korrelation von großer Bedeutung (WOLF

1975). Physikalische Korrelation entsteht durch äußere Einflüsse während der Messung.

Bei Airborne LaserScanning werden Laser-Strahlen verwendet um den Boden abzutasten.

Im Laufe des Weges vom Flugzeug zum Boden weitet sich der Strahl auf bis zu 1 m Durchmesser auf. Das Resultat der Messung hängt von der gesamten, vom Laser getroffe- nen Fläche ab. Bei hoher Punktdichte (z.B. 10 Punkte pro m2) ergeben sich zwangsläufig Überlappungen der Flächen, also physikalische bedingte Korrelation der Resultate. Hinzu kommt noch, dass die Strahlen dieselbe Atmosphäre durchlaufen, was ebenfalls wieder zu physikalischen Korrelationen führt. Die Abschätzung des Ausmaßes der physikalischen Korrelation wurde bereits von anderen Autoren behandelt und ist nicht Thema dieses Arti- kels. Mathematische Korrelation resultiert aus der gemeinsamen Auswertung von (an sich unkorrelierten) Beobachtungen, beispielsweise in einer Ausgleichung. Gemischte Korrela- tion bedeutet, dass beide Ursachen eingetreten sind. Beim Vorliegen korrelierter Werte (also von Beobachtungen oder abgeleiteten Größen) ist die Auswirkung aller drei Arten von Korrelation jedoch identisch, da sie in gleicher Art in die Rechenmodelle eingeführt werden und die Ergebnisse in derselben Weise beeinflussen.

Es gibt eine ganze Reihe von Beschreibungen der Genauigkeit von Werten (beispielsweise KUTTERER &SCHÖN 2004, SCHMIDT 1997). Die Texte über Korrelation beschäftigen sich meist mit der quantitativen Bestimmung des Korrelationskoeffizienten selbst (siehe z.B.

BÄHR &RICHTER 1975,CASPARY 1973,SCHWIEGER 1999) oder seiner Berücksichtigung in weiteren Berechnungen (beispielsweise SCHÖN &BRUNNER 2008, WOLF 1975). Untersu- chungen zur generellen Auswirkung von Korrelationen gibt es nur wenige; zu nennen wä- ren in diesem Kontext Arbeiten über den Einfluss von Korrelation bei der Bestimmung von Stoffkonstanten eines Materialgesetzes (BOPP et al. 1975) und sowie zur Kovarianz in der

(4)

Messtechnik (MATTHIAS 1986). Nach Matthias ist die Varianz der Differenz positiv korre- lierter Daten kleiner und die Varianz der Summe größer als bei unkorrelierten Daten. Die Auswirkung von Korrelation bei spezifischen Anwendungen wurden am Beispiel von Vo- lumenberechnungen bei digitalen Geländemodellen (KRAUS 2000) und Flächenberechnun- gen im Kataster untersucht (NAVRATIL &ACHATSCHITZ 2004). Von den modernen Mess- verfahren wurde bisher nur bei GPS der Einfluss von Korrelation näher untersucht. Hierbei handelt es sich meist um zeitliche Korrelation (beispielsweise HOWIND et al. 1999;

PETOVELLO et al. 2009, SCHWIEGER 2001, STOEW et al. 2007).

3 Experimentelle Umgebung

Um den Einfluss von Korrelation auf die Ergebnisse von Berechnungen abschätzen zu können, ist eine Testumgebung notwendig. In dieser muss sowohl die Berechnung selbst als auch die Abschätzung der Varianz für die Berechnungsergebnisse möglich sein. Die Ab- schätzung mittels Fehlerfortpflanzung ist nur für differenzierbare Funktionen möglich.

Daher wurde für die Testumgebung die Berechnung mittels Monte Carlo Simulation in der Programmiersprache Haskell realisiert. Bei der Monte Carlo Simulation ist nicht auf diffe- renzierbare Funktionen beschränkt. Sie funktioniert auch dann, wenn beispielsweise für die Steuerung von Verzweigungen Klassifizierungen innerhalb der Berechnungen vorgenom- men werden. Sie funktioniert außerdem auch bei sehr großen Abweichungen. Dieser Um- stand hat in der klassischen Geodäsie meist geringe Bedeutung, kann aber bei Verknüpfun- gen mit menschlichen Wahrnehmungen, Klassifikationen oder Extrapolationen wichtig werden.

Ausgangspunkt für alle Berechnungen sind Daten (x1, …, xn) mit ihren statistischen Vertei- lungen. Gesucht sind dann die Ergebnisse einer Funktion f(x1, …, xn) dieser Daten und die statistische Verteilung dieser Ergebnisse. Die Monte Carlo Simulation (SOBOL 1968) er- möglicht die Berechnung dieser Werte. Dazu werden die Eingangsparameter zufällig ge- mäß ihrer Verteilung variiert und die aus diesen Zahlen berechneten Funktionsergebnisse gesammelt. Aus den gesammelten Ergebnissen werden dann die statistischen Parameter für das Funktionsergebnis abgeschätzt.

Die Monte Carlo Simulation verwendet bei jedem Durchlauf einen neuen Datensatz (x1, …, xn). Diese Datensätze müssen der statistischen Verteilung der gegebenen Daten genügen.

Die meisten Programmiersprachen verfügbaren über Generatoren für Zufallszahlen. Diese liefern jedoch in der Regel gleichverteilte Zahlen, beispielsweise im Intervall [0,1]. Daher ist eine Transformation dieser Zufallszahlen in die entsprechende Verteilung notwendig.

Für jeden Parameter xi des Modells liegt dann eine zufällige Realisierung vor. Bei verschie- denen Durchläufen ergeben sich wegen der Verwendung von Zufallszahlen jeweils andere Realisierungen. Betrachtet man die Realisierungen des Parameters xi, so müssen diese der vorgegebenen Verteilung entsprechen. Unterschiedliche Parameter xi und xj sind aber noch unkorreliert, da die Zufallszahlen unabhängig voneinander ermittelt werden.

Diese unkorrelierten Daten dienen als Ausgangspunkt für die Erzeugung korrelierter Daten.

Eine Realisierung für jeden Parameter xi wird im Vektor sj zusammengefasst und mit ge- eigneten Funktionen so verknüpft, dass bei wiederholter Durchführung mathematisch kor- relierte Vektoren sj entstehen. Die mathematischen Korrelationen ersetzen also im Modell die in der Realität auftretenden physikalischen oder gemischten Korrelationen.

(5)

Die Beschreibung der zu erzielenden Korrelationen erfolgt mithilfe einer Kovarianzmatrix Qxx. In der Hauptdiagonale von Kovarianzmatrix Qxx stehen die Varianzen der Parameter xi. An den übrigen Positionen stehen die Kovarianzen, aus denen die Korrelationen abgeleitet werden können. Die Kovarianzmatrix kann jedoch nicht direkt verwendet werden. Es ist zuerst eine Dreieckszerlegung nach Cholesky in Qxx = DDT mit der Dreiecksmatrix D not- wendig. Die korrelierten Daten uj ergeben sich dann zu uj = Dsj (HEISTER & WELSCH

1972). Die resultierenden Datensätze uj entsprechen dann sowohl on den Varianzen der einzelnen Parameter xi, als auch von den Korrelationen zwischen unterschiedlichen Para- metern den Vorgaben.

Für die Realisierung der Testumgebung wurde auf bereits existierenden Code (ERWIG &

KOLLMANSBERGER 2006) zurückgegriffen. Der Quell-Code der Testumgebung kann unter ftp://ftp.geoinfo.tuwien.ac.at/navratil/Korr10.zip gefunden werden.

4 Beispiel und Ergebnisse

Um die Einflüsse von Korrelationen aufzuzeigen, wurde eine einfache Auswertung durch- geführt, in deren Rahmen ein einfaches Höhenmodell in einer bestimmten Höhe zu schnei- den und das Ausmaß der Schnittfläche zu bestimmen war. Das Beispiel zeigt, dass bei auf korrelierten Daten beruhenden Auswertungen absolute Werte im Auswerteprozess einen negativen Einfluss auf die Präzision der Ergebnisse haben.

Den Ausgangspunkt bildet hierbei die folgende Aufgabenstellung: In einem durch ein TIN (Triangular Irregular Network) realisierten Höhenmodell, dessen Punkte als Koordinaten- tripel (xi, yi, hi) realisiert sind, soll das Ausmaß der horizontalen Schnittfläche in einer vor- gegebenen Höhe ermittelt werden (Abbildung 1). Die Schnitthöhe kann auf zwei unter- schiedliche Arten festgelegt werden. Einerseits kann man einen absoluten Wert verwenden, andererseits kann die Höhe auch als Funktion der Eingangsdaten bestimmt werden. Die erste Variante wird im Verlauf als globale Definition der Schnitthöhe mit hglobal, die zweite Variante als lokale Definition mit hlokal bezeichnet.

Abb. 1: Schnitt eines TIN mit einer Ebene in einer vorgegebenen Schnitthöhe

(6)

Bei der Bestimmung der Schnittfläche zwischen dem Körper unter dem TIN und einer horizontalen Ebene in vorgegebener Höhe h muss zunächst die Abgrenzung der Schnittflä- che ermittelt werden. Dabei werden alle Prismen separat betrachtet, die aus einem Dreieck des TIN dadurch entstehen, dass die Punkte des Dreieckes in Richtung der h-Achse auf die xy-Ebene projiziert werden. Zunächst sortiert man die Eckpunkte des Dreiecks nach auf- steigender Höhe hi sortiert. Die einfachsten Fälle ergeben sich, wenn die horizontale Ebene das Prisma nicht schneidet, wenn also für alle Punkte des Dreieckes gilt hi < h für i = 1,2,3 oder hi > h für i = 1,2,3. Im ersten Fall liegt das Prisma unterhalb der Schnittfläche, gehört also nicht zum Ergebnis, im zweiten Fall liegt das Dreieck oberhalb der Schnittfläche, die horizontale Projektion des Dreiecks muss also zur Gänze in die Lösung aufgenommen werden. Schneidet die horizontale Ebene das erzeugende Dreieck, so ist die Schnittfigur zwischen horizontaler Ebene und Prisma entweder ein Dreieck oder ein Viereck. Geht man davon aus, dass sich die drei Punkte des Dreiecks auf unterschiedlichen Höhen h1, h2 und h3

mit h1 < h2 < h3 befinden, so kann folgendes Kriterium zur Unterscheidung der beiden Fälle verwendet werden: Ist h > h2 oder h < h2? Im ersten Fall entsteht ein Dreieck, im zweiten ein Viereck. In beiden Fällen müssen zwei Schnittpunkte berechnet werden. Im ersten Fall liegen diese zwischen den Punkten 1 und 3 sowie 2 und 3, im zweiten Fall zwischen den Punkten 1 und 2 sowie 1 und 3. Die Koordinaten dieser neuen Punkte erhält man über li- neare Interpolation aus den Punkthöhen und der Schnitthöhe h. In (5) bezeichnen die Indi- zes a und b die beiden Punkte, zwischen denen interpoliert werden soll und der Index i das Ergebnis:

     



 

 

 

 

h

h h

h y h y h y

h h x h x x h y x

a b

a a b a a b

a a b a i i

i, , , , (5)

Die ebene Fläche des Dreiecks mit den Eckpunkten 1,2 und 3 kann aus der Gaußsche Drei- ecksformel (GRUBER 1996, 42) abgeleitet werden:

     

1 2 3 2 3 1 3 1 2

1

F2 x yyx yyx yy . (6)

Im Fall eines Vierecks als Ergebnis wird die Formel etwas aufwändiger. Um nur eine Flä- chenformel zu verwenden, ist eine Trennung zwischen der Bestimmung der Schnittfiguren und der Flächenbestimmung sinnvoll. Dabei wird das Viereck in zwei Dreiecke aufgespal- tet. Der Vorteil ist, dass man das Ergebnis des Schnittes mit einem einzelnen Dreieck des TIN als Liste von Dreiecken darstellen kann. Die Liste umfasst 0, 1 oder 2 Dreiecke.

Wird nun das gesamte TIN mit der horizontalen Fläche geschnitten, so erhält man für jedes Dreieck im TIN eine Liste solcher Ergebnislisten. Diese Listen können zu einer Gesamtliste vereinigt werden, wobei jedes einzelne Element dieser Liste ein Dreieck ist.

Die Höhe ist bei der globalen Definition fest vorgegeben. Sie ist daher stochastisch unab- hängig von den Koordinaten des Dreieckes. Im Falle der lokalen Definition berechnet sich die Höhe aus den Höhen der einzelnen Punkte. Bei einem einzelnen Dreieck erhält man sie also über

1 2 3

lok 3

h h h

h  

 . (7)

(7)

Damit ist die Schnitthöhe aber mathematisch korreliert mit den Höhen der Punkte. Das beeinflusst das Ergebnis der Fehlerfortpflanzung nach (1). Somit kann das Ergebnis der Fehlerfortpflanzung für das Ausmaß der Schnittfläche bei der lokalen Bestimmung auch bei sonst gleichen Ausgangsdaten nicht mehr gleich dem Ergebnis bei globaler Bestimmung sein.

Im ersten Beispiel wurde ein einzelnes Dreieck verwendet. Tabelle 1 enthält die entspre- chenden Koordinaten. Die Schnitthöhe wurde zunächst absolut definiert mit 3,05 m. An- schließend wurde nach (7) der Mittelwert der drei Punkthöhen verwendet, der sich ebenfalls zu 3,05 m ergibt. Unter Verwendung der ersten (globalen) Höhendefinition und bei An- nahme einer Standardabweichung für jede Koordinate von 10 cm ergibt sich eine Standard- abweichung der Flächen von 1,2 m2. Die zweite (lokale) Definition führt zu einer Standard- abweichung von nur 0,2 m2. Auffällig ist das Verhalten, wenn wir im Rahmen der Monte Carlo Simulation Daten mit vorgegebenen Korrelationen generieren (Tabelle 2). Jenes Modell, in welchem das Ausmaß der Schnittfläche unter Zuhilfenahme der lokalen Punkte- höhe hlokal ermittelt wird, liefert bei höheren Korrelationskoeffizienten bessere Ergebnisse in dem Sinn, dass die Standardabweichung des Ergebnisses sinkt. Die Ergebnisse bei Ver- wendung der globalen Punkthöhe hglobal verschlechtern sich jedoch weiter, streuen also umso stärker, je höher der Korrelationskoeffizient angesetzt wird. Der Grund dafür ist, dass die Korrelation zu einer Verschiebung des gesamten Systems führt. Die lokale Höhendefi- nition passt sich an diese Verschiebung an und wandert mit. Die globale Definition bleibt jedoch starr und führt somit zu einer größeren Streuung der Ergebnisse.

Tabelle 1: Koordinaten des verwendeten Dreiecks mit den Punkten 1, 2 und 3

# x [m] y [m] h [m]

1 12,00 27,00 2,75

2 12,00 33,00 2,81

3 16,00 30,00 3,59

Tabelle 2: Standardabweichung s der Größe der Dreiecks- Schnittfläche mit lokaler und globaler Höhen- definition unter Annahme unterschiedlicher Korrelationskoeffizienten r

r slokal sglobal

0,1 0,21 m2 1,3 m2

0,3 0,18 m2 1,5 m2

0,5 0,15 m2 1,7 m2

0,7 0,12 m2 1,8 m2

0,9 0,07 m2 1,9 m2

(8)

Abb. 2:

Im Beispiel verwendetes, einfaches TIN im Grundriss Tabelle 3: Standardabweichung s der Größe der TIN-

Schnittfläche mit lokaler und globaler Höhen- definition unter Annahme unterschiedlicher Korrelationskoeffizienten r

r slokal sglobal

0,1 1,5 m2 2,6 m2

0,3 1,3 m2 3,1 m2

0,5 1,1 m2 3,6 m2

0,7 0,9 m2 4,0 m2

0,9 0,5 m2 4,3 m2

Dasselbe Verhalten tritt auch dann auf, wenn nicht nur ein einzelnes Dreieck untersucht wird. Abbildung 2 zeigt ein einfaches, aus 6 Dreiecken bestehendes TIN. Der Zentralpunkt hat dabei die Koordinaten (100 m, 100 m) und der Abstand der äußeren Punkte vom Zen- tralpunkt ist 10 m. Die Höhe der Punkte wurde mit 10 m für den Zentralpunkt und 0 m für die äußeren Punkte festgelegt. Auf dieses einfache TIN wurden nun dieselben Funktionen angewendet wie auf das einzelne Dreieck. Es wurde allerdings für die globale Behandlung eine Schnitthöhe von 1,4285 m angenommen, da dies der mittleren Höhe aller sieben Punk- te entspricht. Die Schnittfläche hat eine Größe von 191,8 m2. Unter Annahme von unkorre- lierten Koordinaten mit einer Standardabweichung von 10 cm in jeder Koordinate ergibt sich bei lokaler Höhenbestimmung eine Standardabweichung von 1,6 m2 und bei globaler Annahme der Höhe eine Standardabweichung von 2,3 m2. Der Einfluss angenommener Korrelationen zwischen den Eingangsdaten ist in Tabelle 3 dargestellt. Man sieht deutlich, dass auch hier die Größe der Schnittfläche bei der lokalen Höhendefinition für höhere Kor- relationskoeffizienten eine geringere Standardabweichung aufweist. Bei der globalen Hö- hendefinition ist wieder das gegenteilige Verhalten zu beobachten.

5 Diskussion und Ausblick

Das Beispiel hat gezeigt, dass Korrelation einen positiven oder negativen Einfluss auf die Genauigkeit der Ergebnisse haben kann. Insbesondere scheint der Übergang auf lokale Differenzen bei korrelierten Daten sinnvoll zu sein. Der Übergang von Differenzen zu absolut definierten Werten erzielt jedoch einen gegenteiligen Effekt.

(9)

Aufgrund des in dieser Arbeit vorgestellten Modells kann nun auch erklärt werden, weshalb bei korrelierten Daten die Ergebnisse der Volumenbestimmung in einem TIN wesentlich schlechter ausfallen als bei unkorrelierten Daten (KRAUS 2000) bzw. was unternommen werden muss, um bessere Ergebnisse zu erhalten. Kraus hat das gesamte Volumen unter dem Höhenmodell bestimmt, also die Differenz zwischen der Höhe des Modells und der Höhe Null. Gerade bei Deponien, die von Kraus als Beispiel verwendet wurden, ist jedoch das Volumen des gelagerten Materials bzw. das noch vorhandene Fassungsvermögen von größerer Bedeutung. Somit wird eigentlich die Differenz zweier Volumina bestimmt. Im ersten Fall handelt es sich um das Volumen zwischen den Höhenmodellen von zwei ver- schiedenen Zeitpunkten. Die Datensätze sind (wenn mit modernen Methoden der massen- haften Punktebestimmung gearbeitet wird) in sich korreliert. Zwischen den Höhenmodellen treten zusätzlich mathematische Korrelationen auf, sobald bei der Lagerung der Höhenmo- delle identische Punkte verwendet werden. Im zweiten Fall handelt es sich um das Volu- men zwischen dem aktuellen Höhenmodell und einem Modell der maximalen Füllhöhe, das sich aus dem vorhandenen Höhenmodell ableiten lässt. In beiden Fällen sollte das Ergebnis eine höhere Genauigkeit aufweisen als unter Annahme unkorrelierter Daten. Eine genauere Abschätzung bedarf aber noch weitergehender Untersuchungen.

Welche Lehren sollten speziell GIS-Anwender aus diesen Ergebnissen ziehen? Es sollten Auswertemodelle benutzt werden, bei denen sich allfällige Korrelationen positiv auf die Varianz des Ergebnisses auswirken würden. So wird vermieden, dass zu optimistische Genauigkeitsabschätzungen erfolgen. Das Beispiel deutet darauf hin, dass lokale Diffe- renzmodelle besser geeignet sind, da die Streuung der Ergebnisse größerer Korrelation kleiner war. Das soll aber nicht heißen, dass möglichst hohe Korrelationen erzielt werden sollen, da dann die Kontrollierbarkeit – und somit auch wieder die Qualität – leidet. Es sollte aber immer ein Verfahren gewählt werden, bei dem möglicherweise vorhandene Korrelationen einen positiven Effekt haben. Solche Methoden sind allen Überlegungen vorzuziehen, die von unkorrelierten Daten ausgehen, da unkorrelierte Daten in vielen Be- reichen nur unter großem Zeitaufwand zu erfassen sind.

Danksagung

Ich möchte mich herzlich bei den unbekannten Reviewern bedanken, die mit kritischen Bemerkungen und Kommentaren zur signifikanten Verbesserung des Textes beigetragen haben.

Literatur

AGRARMARKT AUSTRIA (2008): Merkblatt der Agrarmarkt Austria (AMA) zum Mehrfach- antrag Flächen 2008. Wien, 64 S.

BÄHR,H.-G.&RICHTER, R. (1975): Über die Wahl von a-priori-Korrelationen. In: Zeit- schrift für Vermessungswesen (zfv), 100 (4), S. 180-188.

BOPP, H., GRÜNDIG, L. &LINKWITZ, K. (1975): Ein Beispiel zur Berücksichtigung der Korrelation abgeleiteter Beobachtungen bei der Bestimmung der Materialkonstanten in einem Stoffgesetz. In: Zeitschrift für Vermessungswesen (ZfV), 100 (12), S. 571-577.

(10)

CASPARY, W. (1973): Die Schätzung des Korrelationskoeffizienten aus Beobachtungen. In:

Zeitschrift für Vermessungswesen (zfv), 98 (9), S. 416-422.

ERWIG, M. & KOLLMANSBERGER, S. (2006): Functional Pearls: Probabilistic Functional Programming in Haskell. In: Journal of Functional Programming, 16 (1), S. 13-20.

GRUBER, F. J. (1996): Formelsammlung für das Vermessungswesen. 3. Aufl. Dümmler Verlag, Bonn, 125 S.

HEISTER,H.&WELSCH, W. (1972): Erzeugung und Test normalverteilter Zufallszahlen. In:

Zeitschrift für Vermessungswesen (zfv), 97 (10), S. 446-456.

HOWIND,J.,KUTTERER,H.&HECK, B. (1999): Impact of temporal correlations on GPS- derived relative point positions. In: Journal of Geodesy, 73 (5), S. 246-258.

KARSSENBERG, D. & DE JONG, K. (2005): Dynamic Environmental Modelling in GIS:

2. Modelling Error Propagation. In: International Journal of Geographic Information Science, 19 (6), S. 623-637.

KRAUS, K. (2000): Zur Genauigkeit der Volumenbestimmung. In: Zeitschrift für Vermes- sungswesen (zfv), 125 (12), S. 398-401.

KUTTERER,H.&SCHÖN, S. (2004): Alternativen bei der Modellierung der Unsicherheit beim Messen. In: Zeitschrift für Vermessungswesen (zfv), 129 (6), S. 389-398.

MATTHIAS, H. J. (1986): Bedeutung und Konstruktion von Kovarianzen in der Messtech- nik. ETH Zürich, Institut für Geodäsie und Photog., Zürich, Mitteilungen 41, 75 S.

NAVRATIL,G.&ACHATSCHITZ, C. (2004): Influence of Correlation on the Quality of Area Computation. In: International Symposium on Spatial Data Quality (ISSDQ), Bruck a. d. Leitha, Austria, Department of Geoinformation and Cartography, S. 291-303.

PETOVELLO,M.G.,O´KEEFE,K.,LACHAPELLE,G.&CANNON,M.E. (2009): Consideration of time-correlated errors in a Kalman filter applicable to GNSS. In: Journal of Geodesy, 83 (1), S. 51-56.

SCHMIDT,H. (1997): Was ist Genauigkeit? – Zum Einfluß systematischer Abweichungen auf Meß- und Ausgleichungsergebnisse. In: Vermessungswesen und Raumordnung (VR), 59 (4), S. 212-228.

SCHNEIDER,W.,KORNRUMPF,J.&MOHR,W. (1995): Statistische Methodenlehre. Olden- bourg Verlag, München, 326 S.

SCHÖN,S. &BRUNNER,F. K. (2008): A proposal for modelling physical correlations of GPS phase obervations. In: Journal of Geodesy, 82 (10), S. 601-612.

SCHWIEGER,V. (1999): Ein Elementarfehlermodell für GPS-Überwachungsmessungen – Konstruktion und Bedeutung interepochaler Korrelationen. Universität Hannover, Geo- dätisches Institut, Hannover, Mitteilungen 231, 189 S.

SCHWIEGER,V. (2001): Time-Dependent Correlations Using the GPS – A Contribution to Determine the Uncertainty of GPS-Measurements. In: Proceedings of the FIG Working Week, Seoul, Korea, FIG, 13 S.

SOBOL, I. M. (1968): Die Monte-Carlo-Methode. VEB Deutscher Verlag der Wissenschaf- ten, Potsdam, 74 S.

STOEW,B.,NILSSON,T.,ELGERED,G.&JARLEMARK, P. O. J. (2007): Temporal correla- tions of atmospheric mapping functions errors in GPS estimation. In: Journal of Geode- sy, 81 (5), S. 311-323.

WOLF, H. (1975): Korrelierte Beobachtungen in der Triangulierung. In: Zeitschrift für Vermessungswesen (zfv), 100 (1), S. 3-14.

Referenzen

ÄHNLICHE DOKUMENTE

Bei diesen Probanden ergab die Messung mit dem Halitox am häufigsten eine starke Halitosis (47%), diejenige mit Fresh Kiss am häufigsten Grad 1 (33%) und 4 (27%)..

Variante 3: MSCL-Dichte; Geschwindigkeit aus MSCL-Daten (Abb. 8) Diese Me- thode verwendet für Dichte und Geschwindigkeit die MSCL-Messungen. 2.3.4) mit der MSCL- Geschwindigkeit

Eine Voraussetzung für die Ein- führung der teilflächenspezifischen Bewirtschaftung sind effektive Me- thoden zur ortsdifferenzierten Be- stimmung von Boden- und Pflan-

Die lineare Regression geht von einem linearen Zusammenhang zwischen Prädiktor und Kriterium aus, so dass die vorausgesagten (geschätzten) Werte auf einer geraden darstellbar

Bei komplexen Zusammenhängen zwischen einer Kriteriumsvariable und mehreren Prädiktoren kann eine Vorhersage über multiple Regression getroffen werden.. Voraussetzung: Die

Wird die Kontaktbereichslänge des höchsten Vernetzungsgrads NF0,02 als am zu- verlässigsten betrachtet, kann eine Matrix (Tabelle 1) aufgestellt werden, die die Zuverläs- sigkeit

Die Varianz einer Linearkombination von ZVen ist nicht die Linearkombination der einzelnen Varianzen..

Trotz der Tatsache, dass PCT zwar einen guten, dennoch aber nicht idealen Marker für die Diagnose dieser Krankheit darstellt, sollte die Verwendung des BRAHMS PCT-Q Test