• Keine Ergebnisse gefunden

Exkurs 1: Einfluss der Schrittweite auf die Variogrammanalyse und Kriging.58

6. Ergebnisdiskussion und Zusammenführung

6.1. Fazit der exemplarischen Problemlösung

6.1.1. Fazit Flächenschätzungen

Aus aufbereiteten Daten der Grundwasserbeschaffenheit mehrerer Landesmessnet-ze wurden für die gesamte Landesfläche und die Fläche eines ausgewählten Ein-zugsgebiets (Enz) der qualitative Zustand für verschiedene physikalische und chemi-sche Parameter mittels geostatistichemi-scher Verfahren und der IDW-Interpolation ge-schätzt. Die eingesetzten Verfahren führen in weiten Teilen zu ähnlichen Ergebnis-sen. Verfahrensbedingt ermöglicht die Geostatistik eine qualitative Beurteilung der Schätzergebnisse über Testparameter. Aufgrund der Charakteristik der räumlichen Autokorrelation ist eine Kriging-Schätzung nach der Strukturanalyse nur für einige Parameter zulässig. Die Aussagefähigkeit wird kaum erhöht, wenn lediglich die Da-ten der näher zu untersuchenden Teilfläche – beispielsweise eines Einzugsgebiets – für Schätzungen verwendet werden. Die Ergänzung der Datengrundlage aus Lan-desmessnetzen mit weiteren Daten regionaler Messnetze wäre wünschenswert.

Die errechneten prozentualen Schätzfehler der Krigingschätzungen erreichen meist Maxima in Bereichen mit geringen Konzentrationen der untersuchten Parame-ter. Eine der Ursachen ist in den geringen Konzentrationswerten zu sehen – unter-stellt man eine flächenhaft gleich bleibende Qualität des Variogrammmodells, wirken sich absolute Schätzfehler in Gebieten relativ niedriger Konzentrationen besonders stark aus. Eine weitere Ursache ist darin zu sehen, dass Flächen geringer Konzent-rationen meist mit Gebieten einer geringen Messstellendichte zusammenfallen. Als Beispiel dafür kann der Schwarzwald dienen: Als nähr- und schadstoffarmer Natur-raum mit nur vergleichsweise geringer anthropogener Beeinflussung durch größere Siedlungen oder intensive landwirtschaftliche Nutzung (geringe anthropogene Beein-flussung) stellt er ein Gebiet dar, in dem die Überwachung der Grundwasserbeschaf-fenheit als weniger prioritär angesehen wird (wenige Messstellen).

Die niedrigen Schätzfehler der Krigingschätzungen der pH-Werte für die ge-samte Landesfläche und der Atrazin- und Simazin-Konzentrationen für das Einzugs-gebiet Enz zeigen deutlich, wie bedeutend die Berücksichtigung der Kriterien für die

räumliche Schätzung schon bei der Anpassung des Variogrammmodells ist. In der vorliegenden Untersuchung wurden für die Kriging-Schätzung eines Punktes die Merkmalsausprägungen von maximal 20 und minimal fünf Messpunkten verwendet.

In Abhängigkeit von der Messstellendichte findet sich diese als optimal definierte Messstellenzahl bereits innerhalb einer geringen Entfernung vom zu schätzenden Punkt, Messstellen größerer Distanz bleiben unberücksichtigt. Damit wird lediglich die Distanz des angepassten Variogrammmodells für die Schätzung verwendet, die dem vom Schätzpunkt weitestentfernten Messpunkt entspricht. Die tatsächliche Qua-lität der Schätzung ist damit abhängig vom verwendeten Bereich des angepassten Variogrammmodells. Die üblicherweise verwendete Kreuzvalidierung gibt im Gegen-satz dazu den standardisierten Schätzfehler für die gesamte Reichweite des Vari-ogrammmodells an – also auch für die Bereiche, die häufig nicht für die Schätzung verwendet werden. Die Weiterentwicklung von Kriging-Algorithmen, die beispielswei-se die mittlere für eine Schätzung verwendete Reichweite des Variogrammmodells ausgeben, würde nachtäglich eine Optimierung der Variogrammmodellanpassung an relevante Distanzbereiche ermöglichen.

Die teils großen Flächen, für die bei Verwendung der angepassten Vari-ogrammmodelle keine Schätzungen möglich sind (Atrazin- und SimazSchätzungen für das Einzugsgebiet Enz; Kapitel 5.2.1.3), ließen sich vermeiden, in-dem im GIS für eine Untersuchung definierte Kriterien umgesetzt würden, die eine Mindestreichweite eines Variogrammmodells ermitteln. Dabei musste für die in dieser Untersuchung definierten Kriterien lediglich der maximal notwendige Suchradius er-mittelt werden, mit dem es möglich ist, an allen zu schätzenden Punkten wenigstens fünf Messstellen für die Schätzung zur Verfügung zu haben.

In vielen Fällen steigen die Schätzfehler an den Grenzen der Untersuchungsflä-chen an. In der vorliegenden Untersuchung wurden Messstellen, die außerhalb des betrachteten Raumes lagen, nicht berücksichtigt, um eine Beeinflussung der Schätzwerte durch Nachbarräume auszuschließen. Gerade für Gebiete mit ver-gleichsweise geringer Informationsdichte wäre dies zu überdenken. Zwar würden die Schätzwerte bei Zuhilfenahme externer Daten durch diese beeinflusst, jedoch dürfte

6. Ergebnisdiskussion und Zusammenführung

vorrufen. In diesem Fall wäre für die Umsetzung der WRRL eine Adaption an europa-rechtliche Regelungen vorzusehen.

6.1.2. Fazit Messstellengruppierungen

Drei verschiedene Clusterverfahren wurden für unterschiedliche Teilziele eingesetzt:

Das Single-Linkage-Verfahren wurde verwendet, um Ausreißer aufzuspüren, die in multiplen Clusterverfahren die Ergebnisse negativ beeinflussen würden. Das Ward-Verfahren ist zum Einsatz gekommen, um eine optimale Clusteranzahl für die Grundgesamtheit zu ermitteln (als Trennschärfe-Kriterium dient die Fehlerquadrat-summe). Um die Gruppenhomogenitäten zu erhöhen, wurde das Austauschverfahren K-means verwendet, zur Optimierung der Ergebnisse wurden die drei Verfahren „in Reihe geschaltet“. Zur Überprüfung, ob es auf diesem Weg möglich ist, besondere Charakteristika der Grundgesamtheit zu ermitteln, wurde der gesamte Clustervor-gang jeweils einmal auf Grundlage aller zur Verfügung stehenden Parameter und einmal auf Grundlage der Parameter, die eindeutig anthropogenen Ursprungs sind, durchgeführt.

Das Single-Linkage-Verfahren erkennt sowohl auf Grundlage aller Parameter, als auch auf Grundlage der anthropogenen chemischen Verbindungen sehr gut Messstellen, an denen über den Untersuchungszeitraum mehrere extreme Grund-wassereigenschaften auftreten. Der Vergleich der kaum sinnvoll interpretierbaren direkten Ward-Clusterung mit derjenigen nach Ausschluss der durch Single-Linkage-Verfahren ermittelten Ausreißer für die Clusterungen auf Grundlage aller Parameter macht dies deutlich. Zwar sind grundlegende Eigenschaften der gebildeten Cluster charakterisierbar, aber bereits bei einer 8-Clusterlösung werden vier Cluster gebildet, die lediglich mit einer oder zwei Messstellen belegt sind – die Messstellen, die durch eine vorgeschaltete Single-Linkage-Clusterung erkannt und entfernt werden können.

Die Ward-Clusterungen liefern entsprechend den Single-Linkage-Clusterungen zunächst mögliche Clusteranzahlen, von denen die geeignetsten anhand der Fehler-quadratsumme, aber auch aufgrund ihrer Lage in den verschiedenen räumlichen Bezugssystemen für die sich anschließende K-means-Clusterung ausgewählt wer-den. Die Ergebnisse der Ward-Clusterungen – sowohl für die Clusterrungen auf Grundlage aller Parameter, als auch auf Grundlage nur der anthropogenen

Parame-ter – zeigen aber auch bereits gut inParame-terpretierbare CharakParame-teristika der gebildeten Gruppen, die sich durch die ihre Lage in klassifizierten Gebieten unterschiedlicher räumlicher Bezugssysteme bestätigen lassen. Für exakte Interpretationen reicht al-lerdings die Qualität (räumliche Auflösung, grobe Klassifikation) der verwendeten Informationen über die räumlichen Bezugssysteme nicht aus. Insbesondere die 8-Clusterlösungen – sowohl der Clusterung auf Grundlage aller Parameter, als auch nur der anthropogen Parameter – geben gute Anhaltspunkte für besondere Eigen-schaften der gebildeten Gruppen, die sich durch ihre besonderen Lage-Charakteristika unterstreichen lassen. Durch den Einsatz multipler Korrelationen wä-ren die Ähnlichkeiten der Messstellengruppierung anhand der Merkmalsausprägun-gen (Clusterverfahren) zum einen und der Messstellengruppierung durch die Lage in Klassen der räumlichen Bezugssysteme andererseits qualitativ exakt charakterisier-bar. Zu diesem Zweck müssten GIS-gekoppelte Datenbanken angelegt werden, die neben den Lageparametern der Messstellen die Ausprägungen aller erfassten Merkmale in höchstmöglicher Auflösung beinhalten, die über GIS-integrierte statisti-sche Abfragen ermöglichen – die Kombination mit gängigen GIS-Fuktionen, bei-spielsweise Pufferfunktionen, wäre in diesem Fall wünschenswert.

Die im Allgemeinen höheren Gruppen-Homogenitäten der K-means-Clusterung führen zu einem wesentlichen Unterschied in den Ergebnissen: Werden für die Clusterung auf Grundlage aller Parameter mehrere stark besetzte Gruppen bei der 7-Clusterlösung gebildet, so ist für die Clusterung auf Grundlage der anthropogenen Parameter ein Cluster mit 1.533 Messstellen sehr dominant. Die kleineren Cluster dieser Gruppierung sind allerdings sehr gut aufgrund ihrer Eigenschaften charakteri-sierbar und räumlich recht exakt in bestimmte Bezugsklassen einzuordnen. Klar er-kennbar ist die Bedeutung meist eines Parameters, auf dessen Grundlage diese Gruppe gebildet wurde (hohe t-Werte).

Nach dem letzten Schritt eines dreistufigen Clusterverfahrens sind die gebilde-ten Gruppen aufgrund der Merkmalsausprägungen der in ihnen zusammengefassgebilde-ten Messstellen am besten interpretierbar und räumlichen Klassen zuzuordnen, für die Charakteristika entsprechend der Gruppierungen erwartet werden können.

Ähnlich-6. Ergebnisdiskussion und Zusammenführung

rung in räumliche Klassen ist stark abhängig von den Kriterien der Bildung räumlicher Bezugssysteme und der räumlichen Auflösung.