• Keine Ergebnisse gefunden

5.3 Ökonometrische Analyse mittels MCI-Modell

5.3.1 Datenaufbereitung

5.3.1.1 Neusegmentierung und Georeferenzierung der Nachfrageorte

Im ersten Schritt der Aufbereitung musste der Siedlungsstruktur des Untersuchungsgebietes Rechnung getragen werden. Unter den insgesamt 34 Ortsteilen befinden sich Teilgebiete mit sehr geringen Einwohnerzahlen (unter 1.000 Einwohner, wobei zu dieser Gliederungsebene keine Haushaltszahlen vorliegen), so dass auch die hier theoretisch zu erreichende Stichprobenzahl dementsprechend gering wäre. Je geringer die Stichprobengröße auf lokaler Ebene ist, desto eher kann der Fall auftreten, dass bestimmte Nachfrager-Anbieter-Interaktionen nicht erfasst werden und somit eine große Anzahl leerer Zellen in der späteren Interaktionsmatrix zurückbleibt. Da die Linearisierung des MCI-Modells nur Werte der eingehenden Variablen (hier: lokaler Marktanteil) oberhalb von null akzeptiert, müssten hier in jedem Fall Nachbearbeitungen der Daten vorgenommen werden (COOPER/NAKANISHI

2010, S. 153ff.). Da solche Korrekturen stets Verzerrungen der Ausgangsdaten mit sich bringen, ist es sinnvoll, den Effekt nicht ausgefüllter Felder von vorn herein abzumildern.

Einige Ortschaften sind zudem sogar so klein, dass bei einer anvisierten Stichprobe von 350 Befragten unter der Annahme einer der Grundgesamtheit exakt gleichen räumlichen Verteilung die Zahl der befragten Personen unter eins liegen würde. Hierzu zählen beispielsweise der zu Beverungen gehörige Ortsteil Rothe (158 Einwohner) oder der Holzminden angehörende Ortsteil Mühlenberg (96 Einwohner).

Es ist vor diesem Hintergrund bei der Anwendung des MCI-Modells möglich und auch üblich, bei Bedarf die Größen der Nachfrageorte zu homogenisieren bzw. diese zu größeren Einheiten zusammenzufassen (z.B. GHOSH 1984, TIHI/ORUC 2012). Daher wurden zur weiteren Bearbeitung kleine, benachbarte Ortsteile zu größeren Teilgebieten mit mindestens 1.000 Einwohnern aggregiert. Hierbei wurden stets die am nahesten beieinander liegenden Ortschaften zu einem neuen Gebiet zusammengeschlossen, bis dieses die gesetzte Grenze der Bevölkerungsgröße erreicht bzw. überschritten hatte. Notwendigerweise sind bei diesem Vorgehen auch einzelne Ortschaften über 1.000 Einwohner mit deutlich kleineren benachbarten Ortschaften fusioniert worden. Mit diesem Verfahren wurden die 34 Ortsteile des Untersuchungsgebietes zu 19 Teilgebieten (z.B. „Beverungen-Nordost“, „Höxter-Süd“) zusammengefasst. Im Ergebnis ist nur die Gemeinde Derental (Samtgemeinde Boffzen) und in Ermangelung weiterer Orte in räumlicher Nähe das Gebiet „Beverungen-West“ mit einer Einwohnerzahl unter 1.000 Personen zurückgeblieben. Die Kernstadtgebiete sowie größere Ortsteile (z.B. Höxter-Stahle) sind aufgrund ihrer Größe eigene Gebiete geblieben (siehe Anhang, Tabelle A 2 und A 3). Diese Teilgebiete bildeten die Basis aller weiteren (nachfragebezogenen) Berechnungen.

Um die Nachfrageorte als Vektordaten in späteren GIS-Analysen verwenden zu können, wurde ein Punkt-Shapefile mit den 19 Teilgebieten erstellt. Die Punktmarkierung wurde hierbei jeweils im Siedlungszentrum des Ortes (bei Teilgebieten bestehend aus mehreren Ortsteilen: Siedlungszentrum des bevölkerungsbezogen größten Ortes) gesetzt.

5.3.1.2 Berechnung der lokalen Marktanteile

Das vorläufige Ergebnis der Haushaltsbefragung zu den letzten Einkäufen in den relevanten Bereichen (siehe Kap. 5.2.3) waren empirisch ermittelte Einkäufe der befragten Haushalte bei den jeweiligen Anbietern; diese bildeten im Folgenden die Grundlage für die Berechnung empirischer lokaler Marktanteile. Da die Adressen der Befragten aus der Telefonliste vorlagen, konnten diese den Ortsteilen, in denen sie wohnen, und somit auch den 19 Teilgebieten des Untersuchungsgebietes (siehe Kap. 5.3.1.1) zugeordnet werden. Tabelle 7 zeigt diese Befragungsrohdaten schematisch anhand der Einkäufe von neun befragten Haushalten (h) aus drei Nachfrageorten (i) bei drei Anbietern (j).

Fall bzw. befragter

Haushalt (h) Wohnort (i) Empirisch ermittelte Einkäufe des Haushalts h bei Anbieter j (Ehj)

j1 j2 j3

1 i1 Eh1j1 Eh1j2 Eh1j3

2 i1 Eh2j1 Eh2j2 Eh2j3

3 i1 Eh3j1 Eh3j2 Eh3j3

4 i2 Eh4j1 Eh4j2 Eh4j3

5 i2 Eh5j1 Eh5j2 Eh5j3

6 i2 Eh6j1 Eh6j2 Eh6j3

7 i3 Eh7j1 Eh7j2 Eh7j3

8 i3 Eh8j1 Eh8j2 Eh8j3

9 i3 Eh9j1 Eh9j2 Eh9j3

Tabelle 7: MCI-Modell – Empirisch ermittelte Einkäufe (schematisch) Quelle: Eigene Darstellung

Die empirisch ermittelten Einkäufe der Haushalte bei den jeweiligen Anbietern (Ehj) wurden im nächsten Schritt auf der Ebene der 19 Teilgebiete (i) summiert (Eij). Die lokalen Marktanteile der j Anbieter in den i Nachfrageorten wurden auf der Grundlage der allgemeinen Formel zur Kalkulation von Marktanteilen (COOPER/NAKANISHI 2010, S. 18)aus dem Quotienten der getätigten Einkäufe beim Anbieter j aus Nachfrageort i und der Summe aller getätigten Einkäufe aus Nachfrageort i berechnet (siehe Formel 30). Wie in allen Marktgebietsanalysen, deren empirische Grundlage nicht Umsatz- bzw. Kaufkraft-, sondern Kundenströme sind (z.B. GHOSH 1984, TIHI/ORUC 2012), handelt es sich bei diesen lokalen Marktanteilen also genau genommen um Interaktionsanteile und somit um eine messbare Repräsentation dessen, was im HUFF-Modell die Zielgröße (Interaktionswahrscheinlichkeit) darstellt.

 

i ij

ij

E

p E

(30)

pij = Marktanteil des Anbieters j in Nachfrageort i

Eij = Empirisch ermittelte Einkäufe aus Nachfrageort i bei Anbieter j ΣEi = Summe aller Einkäufe aus Nachfrageort i

Um sicherzustellen, dass jedes Feld der Interaktionsmatrix, also jede i x j-Kombination ausgefüllt ist, was die spätere Transformation des Modells voraussetzt, mussten die

Marktanteile jedoch noch dahingehend korrigiert werden (Ähnliches Beispiel siehe HARTMANN 2005, S. 63). Hierfür wird mitunter so verfahren, dass die Nachfrageorte immer weiter aggregiert werden, bis alle lokalen Marktanteile größer null sind (z.B. COLOMÉ

PERALES 2002, TIHI/ORUC 2012). Diese Methode birgt allerdings das Problem einer so starken Zusammenfassung der Nachfrageorte, dass kleinräumige Interaktionsmuster nicht mehr abgebildet werden können. Außerdem kann davon ausgegangen werden, dass von einigen Nachfrageorten zu bestimmten Angebotsstandorten nur so wenige Interaktionen stattfinden (wenn sie überhaupt stattfinden), dass es unwahrscheinlich ist, sie über eine Stichprobe überhaupt zu erfassen. Daher wurde hier, analog zu HARTMANN (2005) bzw.

KUBIS/HARTMANN (2007), diese Korrektur darüber vorgenommen, dass die ermittelten Einkäufe jedes Anbieters (Ehj) um eins erhöht und auf dieser Grundlage die lokalen Marktanteile (pij) berechnet wurden (Formel 30). Im Ergebnis stand nun eine Matrix mit den lokalen Marktanteilen aller j Anbieter in allen i Nachfrageorten (schematische Darstellung auf der Grundlage des o.g. Beispiels siehe Tabelle 8).

Nachfrageort (i) Anbieter (j) Marktanteil von Anbieter j in Nachfrageort i (pij)

i1 j1 pi1j1

i1 j2 pi1j2

i1 j3 pi1j3

i2 j1 pi2j1

i3 j3 pi3j3

Tabelle 8: MCI-Modell – Lokale Marktanteile (schematisch) Quelle: Eigene Darstellung

5.3.1.3 Berechnung der Fahrtzeiten

Im nächsten Schritt mussten die Fahrtzeiten zwischen den 19 Nachfrageorten und allen untersuchungsrelevanten Anbietern ermittelt werden. Prinzipiell existieren hierfür unzählige frei verfügbare GIS-basierte Routenplaner-Dienste (z.B. Google Maps, ViaMichelin);

allerdings wäre die manuelle Kalkulation aller benötigten Fahrtzeiten bzw. Entfernungen so langwierig (Beispiel: 19 Nachfrageorte x 10 Anbieter = 190 einzelne Routen), dass es zeiteffizienter war, diese Aufgabe mit Hilfe einer Netzwerkanalyse41 in ArcGIS zu lösen. Die Generierung eines einzelnen Straßennetzes hat zudem den Vorteil, dass neue räumliche Konfigurationen (z.B. neue Start-/Endpunkte, neue Straßen) sofort integriert und weiterverarbeitet werden können. In der Analyse von Marktgebieten im Einzelhandel finden

41 Netzwerke stellen eine der wesentlichsten Funktionen in Geographischen Informationssystemen dar, da sie zur Modellierung von Verkehrssystemen unterschiedlichen Typs (Transportnetzwerke) oder anderer Formen von realen Netzsystemen (z.B. Rohrleitungsnetze) verwendet werden können. Netzwerke im GIS sind Vektordaten, die, basierend auf der mathematischen Graphentheorie, aus Kanten (einzelne Strecken, z.B. Straßen) und Knoten (Verknüpfungsstellen der Strecken, z.B. Straßenkreuzungen) bestehen. Um Entfernungen oder

Fahrtzeiten zu modellieren, ist ein Netzwerk notwendig, dessen Kanten gewichtet sind (z.B. durch Streckenlänge und/oder Geschwindigkeit). Hiermit ist es z.B. möglich, einzelne Routen zwischen einem Start- und Zielpunkt, Fahrtzeitradien um einen Zielpunkt (z.B. Erreichbarkeit eines Lebensmittelmarktes) oder eine Distanzmatrix zwischen einer Reihe von Start- und Zielpunkten automatisch zu generieren. Software zur Routenplanung basiert auf diesem Datenmodell (Überblick zu Netzwerkanalysen im GIS siehe z.B. DE LANGE 2013, S. 372ff.).

Netzwerkanalysen zur Modellierung von Wegstrecken bzw. Fahrtzeiten vereinzelt Verwendung (z.B. FITTKAU 2004, SUÁREZ-VEGA et al. 2011).

Um ein routenfähiges Straßennetzwerk im GIS zu erstellen, mussten zunächst Datengrundlagen zum Straßenverlauf im Untersuchungsgebiet beschafft werden; hierbei wurde auf die Shapefiles der Geofabrik GmbH zurückgegriffen, die regelmäßig aus aktuellen Daten des OpenData-WebGIS OpenStreetMap (OSM) generiert werden und ebenso frei zugänglich sind (www.geofabrik.de). Aus dem dort vorgehaltenen Datenbestand (u.a.

Straßen, Gewässer, Ortschaften, Gebäude) wurden die Straßenverläufe der Bundesländer Nordrhein-Westfalen und Niedersachsen als Linien-Shapefiles besorgt und anhand der als Flächen-Shapefile vorliegenden Grenzen der Untersuchungsgemeinden auf diesen relevanten Bereich beschnitten. Die OSM-Straßendaten sind, wie NEIS et al. (2012, S. 5ff.) zeigen, nicht nur seit Ende der 2000er Jahre massiv angewachsen, sondern mittlerweile im Hinblick auf ihre Vollständigkeit sogar den Datensätzen mancher kommerziell vertriebener Navigationssoftware überlegen. Sie enthalten u.a. Straßentypen, zugelassene Höchstgeschwindigkeiten, Straßennamen sowie Kennzeichnungen ob es sich um eine Einbahnstraße oder eine Brücke (d.h. kein Knoten bzw. Übergang zu kreuzenden Kanten) handelt; keines dieser Attribute liegt jedoch in den Datensätzen vollständig vor.

Das Straßen-Shapefile (Stand: September 2011) wurde um nicht für den PKW-Verkehr verfügbare Wege (z.B. Fahrradwege) bereinigt. Um auf dieser Grundlage Fahrtzeiten zu berechnen, mussten zunächst die Gewichtungen der Streckenabschnitte definiert werden.

Sofern eine zulässige Maximalgeschwindigkeit im Datensatz angegeben war, wurde diese übernommen; in allen anderen Fällen wurden den Straßen je nach Typ im Datensatz Maximalgeschwindigkeiten zugewiesen (u.a. für Überlandstraßen 100 km/h, innerorts 50 km/h, Straßen in Wohngebieten 30 km/h). Mittels ArcGIS wurden die Längen der Linienelemente des Shapefiles (d.h. Streckenabschnitte) ermittelt und anschließend mit der Geschwindigkeit zu einer streckenspezifischen Fahrtzeit verrechnet. Um möglichen Verkehrshindernissen Rechnung zu tragen, wurden hierfür 80 % der zulässigen Maximalgeschwindigkeit zu Grunde gelegt (siehe Formel 31), was etwa den PKW-Geschwindigkeiten auf dem Straßennetz von FITTKAU (2004) und den Annahmen der Erreichbarkeitsmodelle des BBSR (2013d) entspricht. Auf dieser Grundlage wurde über die zugehörige ArcGIS-Funktion ein Straßennetzwerk mit den abschnittspezifischen Fahrtzeiten als Kostenfaktor erstellt (zum Ablauf siehe ESRI 2013a).

8 60

tn = Fahrtzeit auf dem Streckenabschnitt n in Minuten ln = Länge des Streckenabschnitts n in km

Gmax n = Maximal zugelassene Geschwindigkeit auf dem Streckenabschnitt n in km/h

Da die Nachfrageorte (i) und untersuchungsrelevanten Anbieter (j) als Punkt-Shapefiles vorlagen, konnten auf der Grundlage des Straßennetzwerks Fahrtzeiten für alle Kombinationen aus Nachfrageorten (Startpunkte) und Anbietern (Zielpunkte) berechnet werden. Hierbei wurde jeweils die schnellste Strecke im bestehenden Netzwerk auf der Grundlage des hierfür typischerweise genutzten und in den ArcGIS-Netzwerkfunktionen implementierten Dijkstra-Algorithmus ermittelt (DE LANGE 2013, S. 116ff.; ESRI 2013b). Die

Fahrtzeit für eine gesamte Route (m) setzt sich aus der Summe der Fahrtzeiten in Minuten auf allen einzelnen, hierfür nötigen Streckenabschnitten (tn) zusammen. Da in den OSM-Daten nur teilweise OSM-Daten zu Ampeln und anderen Verzögerungselementen enthalten waren, konnten diese Daten nicht für die Erstellung des Netzwerks benutzt werden; stattdessen wurden auf jede kalkulierte Route pauschal zwei Minuten addiert (siehe Formel 32). Die kalkulierten Fahrtzeiten wurden stichprobenartig mit den Ergebnissen mehrerer Web-Routenplaner zu verschiedenen Tageszeiten verglichen, wobei nur geringe Abweichungen festgestellt wurden.

  2

 

n

m

t

d

(32)

dm = Fahrtzeit der Route m in Minuten

5.3.1.4 Berechnung der Konzentrationsvariablen

Im nächsten Schritt wurden die zwei im Fokus stehenden erklärenden Variablen des hier genutzten MCI-Modells berechnet: die Konzentrationsvariablen für die Abbildung der räumlichen Nähe zu anderen bzw. konkurrierenden Anbietern. Diese von FOTHERINGHAM

(1985) vorgeschlagenen Modellgrößen bilden die Summe aller möglichen Interaktionen und lassen sich als Nutzen des Besuchs anderer potenzieller Anbieter bei einem Einkauf interpretieren, wobei deren Größe als interaktionsfördernde Wirkung und die Distanz zu ihnen als interaktionshemmende Wirkung berücksichtigt werden (ORPANA/LAMPINEN 2003, S.

324f.). Auf dieser Grundlage wurden für die untersuchungsrelevanten Anbieter zwei Konzentrationsvariablen berechnet: Die erste (KAj) stellt die Konzentration in Bezug auf Einzelhandelsanbieter anderer Branchen dar (siehe Formel 33), die zweite (KKj) die Konzentration hinsichtlich der Anbieter der gleichen Branche (siehe Formel 34).

Als Attraktivitätsmaß der anderen Anbieter (Aa bzw. Ak) wurde hier ebenso, wie auch von FOTHERINGHAM (1985) vorgeschlagen, die Verkaufsfläche genutzt. Leider finden sich in den einschlägigen Quellen (FOTHERINGHAM 1985, ORPANA/LAMPINEN 2003, TIHI/ORUC 2012) für die Konzentrationsvariablen keine Überlegungen oder Anweisungen für die Gewichtung der Verkaufsfläche, so dass sie in der dieser Berechnung unterbleibt. Als Maß für die Entfernung zwischen den untersuchungsrelevanten Anbietern (j) und den anderen (a) bzw.

konkurrierenden Anbietern (k) wird die Straßenentfernung in Kilometern verwendet, um möglichst keine Verkehrsmittelwahl bei den (möglichen) räumlich multifinalen Einkäufen vorzugeben. Entsprechend der Formulierung von FOTHERINGHAM (1985) wurden die Distanzen mit einem Exponenten (λ) gewichtet; da dieser weder bekannt noch ohne weiteres empirisch zu ermitteln ist und ebenso keine diesbezüglichen Vorgaben oder Empfehlungen existieren, wurde er, wie in anderen Studien, in denen keine empirische Gewichtung vorliegt (siehe Kap. 3.2.2.3), auf λ = 2 festgelegt. Dies bedeutet einen vergleichsweise hohen Distanzwiderstand, was zur Folge hat, dass direkt benachbarte Anbieter (z.B. in einer Standortkooperation oder einem Einkaufszentrum) sehr stark ins Gewicht fallen, während weit entfernte den Wert der Konzentrationsvariablen nur gering erhöhen; es wird also der Vorstellung von LI/LIU (2012) Rechnung getragen, dass sich Agglomerationseffekte nur innerhalb einer bestimmten Grenze entfalten (siehe Kap. 4.2.2.1).

KAj = Konzentrationsvariable für die Ballung des Anbieters j mit allen a Anbietern Aa = Verkaufsfläche des Anbieters a

dja = Entfernung (km) von Anbieter j zu Anbieter a

KKj = Konzentrationsvariable für die Ballung des Anbieters j mit allen k Anbietern Ak = Verkaufsfläche des Anbieters k

djk = Entfernung (km) von Anbieter j zu Anbieter k

Die Kalkulation der Entfernungen erfolgte in ArcGIS auf der Grundlage des bereits für die Fahrtzeiten erstellten Straßennetzwerks (siehe Kap. 5.3.1.3). Berücksichtigt wurden hierbei jeweils alle anderen bzw. konkurrierenden Anbieter im gesamten Untersuchungsgebiet. Im Ergebnis standen also zwei Distanzmatrizen mit allen j x a- bzw. j x k-Straßenentfernungen, die daraufhin mit den Verkaufsflächen der a bzw. k Anbieter verrechnet und jeweils für alle j Anbieter summiert wurden. Die Konzentrationsvariablen sind also so aufgebaut, dass sie größer null sind (was die spätere Modelltransformation auch voraussetzt) und keine obere Grenze besitzen. Für spätere Modellvarianten wurden nach demselben Verfahren für die Lebensmittelmärkte noch betriebsformenspezifische Konzentrationsvariablen und weitere zur räumlichen Nähe im Hinblick auf Apotheken und Drogeriemärkte gebildet.

5.3.1.5 Erstellung der Interaktionsmatrix und Transformation

Alle für die Untersuchung relevanten Daten (lokale Marktanteile, Attraktivitätswerte, Fahrtzeiten, Konzentrationsvariablen) lagen in separaten Tabellen vor, die in einer MS-Access-Datenbank schrittweise verknüpft wurden. Im Ergebnis stand eine Interaktionsmatrix mit allen Kombinationen aus Nachfrageorten (i) und Anbietern (j) mit allen zugehörigen Informationen. Tabelle 9 zeigt eine schematische Interaktionsmatrix im Stil o.g. Beispiele und drei Anbieterattributen (Ahj).

Im letzten Schritt war die Transformation der Variablen durch geometrische Mittelwerte und Logarithmieren notwendig, um eine transformierte Interaktionsmatrix zu erhalten, die im Sinne des MCI-Modells als Datensatz in einer linearen Regressionsanalyse bearbeitet werden kann. Hierzu wurden zunächst von allen betrachteten Struktureigenschaften der Anbieter (Aj, KAj, KKj) und den jeweiligen Distanzen von den Nachfrageorten i zu allen j Anbietern (dij) die geometrischen Mittelwerte (siehe Formel 35) gebildet und die jeweiligen Ausprägungen durch diese dividiert. Im Anschluss sind die Logarithmen der Variablenspalten berechnet worden (HUFF/MCCALLUM 2008, S. 23f.; NAKANISHI/COOPER 1974, S. 304ff.).

Tabelle 10 zeigt schematisch eine transformierte Interaktionsmatrix, d.h. den Aufbau des für die Regressionsanalyse präparierten Datensatzes, im Stil der o.g. Beispiele.

n n

i i

geom

x

x

1

. (35)

xˉ geom. = Geometrisches Mittel der n Zahlen x1, …, xn

Einkaufs-interaktionen

Zu erklärende Größe

(= abhängige Variable) Erklärende Größen (= unabhängige Variablen) i j Log ( pij / p ̃i ) Log ( dij / d ̃i ) Log (Ahj / A ̃hj )

i1 j1 Log ( pi1j1 / p ̃i1 ) Log ( di1j1 / d ̃i1 ) Log ( Ah1j1 / A ̃h1j) Log ( Ah2j1 / A ̃h2j) Log ( Ah3j1 / A ̃h3j)

i1 j2

i1 j3

i2 j1

i3 j3

Tabelle 10: MCI-Modell – Transformierte Interaktionsmatrix (schematisch) Quelle: Eigene Darstellung

Vor der Erstellung der transformierten Interaktionsmatrix wurde für die Lebensmittelmärkte noch eine Datenmodifikation vorgenommen, die darauf abzielt, die Unterschiedlichkeit der Betriebsformen zu berücksichtigen und hierbei gleichzeitig die Zahl unausgefüllter Zellen in der Interaktionsmatrix weiter zu senken. Die berücksichtigten Lebensmittelanbieter umfassen kleine und großer Super- und Verbrauchermärkte sowie LM-Discounter (siehe Kap. 5.2.2.3);

diese verfügen jedoch unter ansonsten gleich bleibenden Bedingungen bereits über sehr unterschiedlich große Marktgebiete, was sich bereits an ihren Standortanforderungen (siehe Anhang, Tab. A 1) ablesen lässt. In der Markt- bzw. Standortanalyse werden beispielsweise vereinfachend Radien von fünf Kilometern für Supermärkte und LM-Discounter oder zehn Kilometer für Verbrauchermärkte angenommen (KOSCHNY/LISCHKA 2009, S. 418). Daher wurde die Interaktionsmatrix für die Marktgebiete der Lebensmittelmärkte vor der Transformation noch betriebsformenspezifisch um Einträge mit großen Entfernungswerten und (nahezu) keinen erfassten Interaktionen bereinigt; hierbei wurde darauf geachtet, dass die verbleibenden Einträge in der Interaktionsmatrix noch mindestens 95 % der registrierten Einkäufe abdecken.

5.3.2 Modellschätzung und Modellüberprüfung