• Keine Ergebnisse gefunden

Kern dieser Arbeit ist die Quantifizierung der Biomasseanlagen basierend auf den in Kapitel 4.1 erhobenen Daten und einer darauf aufbauenden Auswertung und Hochrechnung dieser. In Abbildung 4-7 ist die Vorgehensweise zur Hochrechnung des Anlagenbestandes zusammengefasst.

Erhobene Daten

Anlagenbestand je Technologiegruppe und Teilnehmer Regionale Charaktistika der Kehrbezirke

Auswertung der Daten

Hochrechnung der Daten

Ermittlung des Einflusses regionaler Parameter und Unterschiede auf den Anlagenbestand

Horvitz-Thompson-Schätzer Automatische lineare Regressionsschätzung Modellierung

Ergebnis : Anlagenbestand je Technologiegruppe/Brennstoffsortiment Charakterisierung der Kehrbezirke

hinsichtlich regionaler Parameter

Einbeziehen regionaler Parameter und Unterschiede als

Schichtungsvariable

Iteratives Bilden von Modellen durch Hinzunahme regionaler Parametern und Unterschiede Einbeziehen regionaler

Para-meter und Unterschiede auto-matisch durch das Programm

Grundlage für die Hochrechnung bilden die erhobenen Daten zur regionalen Charakteristika und dem Anlagenbestand je Technologiegruppe je Teilnehmer. Bevor die erhobenen Daten mittels der drei in Abbildung 4-7 aufgeführten Methoden (Horvitz-Thompson-Schätzer, Automatische lineare Modellierung, Regressionsschätzung) hochgerechnet werden, werden diese folgendermaßen ausgewertet:

· Charakterisierung der Kehrbezirke hinsichtlich regionaler Parameter. Die Grenzen der Kehrbezirke und Gemeinden sind nicht deckungsgleich. Mit der Zuordnung der circa 11.500 Gemeinden zu den 7.704 Kehrbezirken können die Kehrbezirke hinsichtlich der in Tabelle 4-1 dargelegten regionalen Parametern charakterisiert werden.

· Ermittlung des Einflusses regionaler Parameter und Unterschiede auf den Anlagenbestand. Die Stärke des Zusammenhangs wird mittels des Spearmanschen Rangkorrelationskoeffizienten 𝑟𝑆𝑃 bestimmt. Im Gegensatz zu dem häufig verwendeten Korrelationskoeffizienten nach Bravais-Pearson 𝑟𝑥𝑦 ist dieser robust, sofern Rahmenbedingungen wie Linearität des Zusammenhangs und Normalverteilung der Parameter eingehalten werden. Somit werden die regionalen Parameter mit einem starken Einfluss auf den Bestand der Einzelraumfeuerungen sowie Zentral- und Sonderfeuerstätten herausgefiltert. Ergänzend zu den regionalen Parametern wird auch der Einfluss der Regionen auf den Anlagenbestand (Nord-Süd-, Ost-West-Gefälle) untersucht. Hierfür werden signifikante Unterschiede der Mittelwerte des Anlagenbestandes je Bundesland unter Verwendung des Man-Whitney-U-Tests ermittelt. Nach [Benesch 2013] setzt dieser Test weder eine Normal-verteilung noch eine Varianzhomogenität voraus.

Mit diesen Erkenntnissen kann der Bestand an Einzelraumfeuerungen sowie Zentral- und Sonderfeuerstätten hochgerechnet werden. Zu diesem Zweck werden Abbildung 4-7 folgend die nachstehend im Detail erläuterten drei Methoden Horvitz-Thompson-Schätzer, Automatische lineare Modellierung und Regressionsschätzung angewandt. Diese drei Methoden ermöglichen eine Punkt-schätzung, also das Festlegen eines unbekannten Populationsparameters auf einen bestimmten Wert.

Sowohl der Horvitz-Thompson-Schätzer als auch die Regressionsschätzung ermöglichen mit der Intervallschätzung zudem den Wertebereich anzugeben, in dem die unbekannten Populationsparameter mit einem Sicherheitsniveau 1−∝ mit dem Signifikanzniveau ∝ liegen.

4.3.1 Horvitz-Thompson-Schätzer

In dieser Arbeit wird der Horvitz-Thompson-Schätzers sowohl für die uneingeschränkte als auch für die geschichtete uneingeschränkte Zufallsauswahl angewendet:

· Uneingeschränkte Zufallsauswahl. Bei der uneingeschränkten Zufallsauswahl wird der Anlagenbestand einer Technologiegruppe aus dem Produkt des durchschnittlichen Anlagen-bestandes je Teilnehmer (Strichprobenmittelwert) und der Anzahl aller Kehrbezirke (Umfang der Grundgesamtheit) berechnet.

· Geschichtete uneingeschränkte Zufallsauswahl. Bei der geschichteten uneingeschränkten Zufalls-auswahl werden hingegen die regionalen Parameter berücksichtigt, die den stärksten Zusammen-hang mit dem Anlagenbestand aufweisen, gemessen unter Verwendung des Spearmanschen Rangkorrelationskoeffizienten 𝑟𝑆𝑃. Sowohl die Summe aller Kehrbezirke (=Grundgesamtheit) als auch die Teilnehmer (=Stichprobe) werden nach den fünf regionalen Parametern mit dem stärksten Zusammenhang (𝑟𝑆𝑃) geschichtet (=Post-Stratifizierung).

Die Ergebnisse der uneingeschränkten als auch der geschichteten uneingeschränkten Zufallsauswahl werden sowohl ohne als auch mit Berücksichtigung der regionalen Unterschiede ausgewiesen.

4.3.2 Automatische Lineare Modellierung

Eine Möglichkeit die lineare Regression anzuwenden, liefert die Software SPSS mit der Option der Automatischen linearen Modellierung. Dem Namen folgend wählt das Programm automatisch aus der Vielzahl der eingegebenen regionalen Parameter diejenigen aus, die der Beschreibung der Zielvariablen Anlagenbestand dienen und transformiert diese.

4.3.3 Regressionsschätzung

Neben dem Horvitz-Thompson-Schätzer und der Automatischen linearen Modellierung wird zur Quantifizierung des Anlagenbestandes auch die Regressionsschätzung angewandt. Im Zuge dieser Arbeit werden mehrere regionale Parameter (=multiple lineare Regression) zur Beschreibung des Anlagenbestandes mithilfe eines Regressionsmodells herangezogen. Die Herausfilterung eines geeigneten Regressionsmodells erfolgt iterativ in den drei nachstehend beschriebenen Schritten.

· Bilden eines Regressionsmodells. Die Suche nach einem geeigneten Regressionsmodell erfolgt in einem iterativen Prozess, indem die regionalen Parameter auf verschiedene Weise miteinander kombiniert werden. Dabei steht im Vordergrund, die Anzahl der regionalen Parameter auf ein Mindestmaß zu beschränken.

· Analyse des Regressionsmodells. Die Einhaltung der Randbedingungen Linearität des Zusammenhangs, Homoskedastizität, Normalverteilung der Residuen sowie Multikollinearität wird für jedes Modell überprüft und der Betrag des korrigierten Bestimmtheitsmaßes 𝑅𝑘𝑜𝑟𝑟.2 als Maß der Modellgüte ermittelt. Ein gutes Regressionsmodell zeichnet sich nicht allein durch ein möglichst hohes korrigiertes Bestimmtheitsmaß aus, sondern auch durch die Einhaltung der Randbedingungen und eine minimale Auswahl der Regressoren.

· Modifizierung des Regressionsmodells. Infolge der Verletzung von Randbedingungen der linearen Regression sowie einem geringen korrigierten Bestimmtheitsmaß 𝑅𝑘𝑜𝑟𝑟.2 werden weitere regionale Parameter in das Modell aufgenommen bzw. ausgetauscht. Dabei ist der Blick auf das korrigierte Bestimmtheitsmaß von Interesse, anhand dessen abgelesen werden kann, inwiefern ein neu aufgenommener regionaler Parameter tatsächlich der Verbesserung des Regressionsmodells dient.

Insbesondere vor der Herausforderung ein gut erklärendes Modell mit so wenig Regressoren wie nötig zu bilden, ist dieser Schritt von großer Bedeutung. Führt auch die Aufnahme beziehungsweise der Austausch regionaler Parameter nicht zur Einhaltung der Randbedingung Linearität des Zusammenhangs, besteht die Möglichkeit Variablen zu transformieren. Eine häufige Transformation ist die Logarithmische, die jedoch die Besonderheit aufweist, dass der Logarithmus von Null – in diesem Fall keine Anlage je Anlagengruppe und Teilnehmer – nicht definiert ist. Dies kann durch einen Versatz der zu transformierenden Variable um den Wert 0,5 gelöst werden [McDonald 2014].

Regionale Unterschiede werden zusätzlich bei den Modellen berücksichtigt, die ein hohes Gütemaß in Form des korrigierten Bestimmtheitsmaßes 𝑅𝑘𝑜𝑟𝑟.2 aufweisen und die Randbedingungen erfüllen. In der Software SPSS wird dies realisiert, indem die Regionen als Dummy-Variable als Regressor in das Regressionsmodell aufgenommen werden.

Lineare Regressionsmodelle haben als Ergebnis eine Schätzfunktion. Die daraus abzuleitenden Vorhersagewerte und das individuelle Konfidenzintervall je Vorhersagewert weist die Software SPSS zusätzlich aus. Die Punktschätzung auf den Ebenen Bund und Bundesland kann durch Summenbildung der Vorhersagewerte ermittelt werden. Für die Intervallschätzung ist zunächst die Varianz der einzelnen Vorhersagewerte abzuleiten und daraus die Summe zu bilden.

4.3.4 Exkurs: Quantifizierung des Anlagenbestandes für 2012

Anhand der drei Methoden (Horvitz-Thompson-Schätzer, Automatische lineare Modellierung, Regressionsschätzung) wird der Anlagenbestand für das Jahr 2014 ermittelt. Der Anlagenbestand für das Jahr 2012 kann analog zur Vorgehensweise für das Jahr 2014 oder mittels einer Rückrechnung anhand von Trends der wiederkehrenden Teilnehmer ermittelt werden. Nachstehend werden beide Vorgehensweisen im Detail beschrieben.

· Analoge Vorgehensweise zur Erhebung 2014. Diese Vorgehensweise umfasst die Verwendung der gleichen Schichtungsvariablen (Horvitz-Thompson-Schätzer) sowie Regressionsmodelle (Automatische lineare Modellierung, Regressionsschätzung) auf den Teilnehmerkreis 2012. Nachteil dabei ist, dass Veränderungen zwischen beiden Erhebungsjahren nicht nur auf die tatsächliche Entwicklung zurückzuführen sind, sondern möglicherweise durch den unterschiedlichen Erhebungskreis beeinflusst werden.

· Rückrechnung anhand des Trends der wiederkehrenden Teilnehmer. Der Anlagenbestand für 2012 wird basierend auf dem geschätzten Anlagenbestand 2014 unter Berücksichtigung der Entwicklung des Anlagenbestandes zwischen 2012 und 2014 bei den wiederkehrenden Teilnehmern ermittelt.

Dieser Ansatz kompensiert den Einfluss des unterschiedlichen Teilnehmerkreises auf die Entwicklung des Anlagenbestandes. An dieser Stelle wird vorweggegriffen, dass in 2014 mehr Teilnehmer gewonnen werden konnten als in 2012 (siehe Kapitel 5.1.1).