• Keine Ergebnisse gefunden

3.3 Ökonometrische Marktgebietsmodelle

3.3.2 Das diskrete Entscheidungsmodell nach M C F ADDEN

In der Modellierung des räumlichen Einkaufsverhaltens und anderer raumbezogener Fragestellungen spielen mittlerweile Multinomiale Logitmodelle (MNL) zur Analyse individueller (Konsumenten-)Entscheidungen eine wesentliche Rolle (HUNT et al. 2004, S.

750ff.; MÜLLER-HAGEDORN/NATTER 2011, S. 209ff.). Dieser Modelltyp entstammt ursprünglich der Verkehrsökonomie und wurde von MCFADDEN (1974) zur Analyse der Verkehrsmittelwahl etabliert. Genauso wie das MCI-Modell bilden diese Modelle eine Spezifikation allgemeiner Marktanteilsmodelle und bauen auf verhaltenstheoretischen Grundlagen (siehe Kap. 3.1.2) auf (CLIQUET 2006, S. 143f.). Ihnen liegt ebenso eine nicht näher spezifizierte Nutzenfunktion zu Grunde (siehe Formel 22), die einen deterministischen bzw. „erklärbaren“ und einen stochastischen bzw. „nicht erklärbaren“ Teil (Störterm) enthält (TRAIN 2009, S. 14f.).

ij ij

ij

V

U   

(22)

Uij = Nutzen aus der Alternative j für den Entscheidungsträger i

Vij = Erklärter (deterministischer) Teil des Nutzens (Repräsentativer Nutzen) εij = Nicht erklärter (stochastischer) Teil des Nutzens

Der inhaltliche Unterschied liegt darin, dass die abhängige Variable des Modells nicht der Marktanteil eines Produktes oder Anbieters ist, sondern die Wahlentscheidung eines Individuums oder Haushaltes für eine Alternative selbst; eine solche Wahlentscheidung ist eine absolute Größe (z.B. Kauf/Nicht-Kauf, Besuch/Kein Besuch), weswegen die Zielgröße eine diskrete (d.h. abzählbare) bzw. „qualitative“ Variable darstellt. Modelle mit dieser Zielgröße werden für gewöhnlich als diskrete Entscheidungsmodelle (Discrete choice models) bezeichnet; diese Bezeichnung bezieht sich auf den Inhalt der Modelle, während der Begriff „Multinomiales Logitmodell“ bzw. MNL die zugrunde gelegte Analysetechnik (Logistische Regression) beschreibt (MOOSMÜLLER 2004, S. 206f.; TEMME 2007, S. 327f.).

Diese Methode wird dann verwendet, wenn Zusammenhänge modelliert werden sollen, in denen die Zielvariable nicht metrisch-rational, sondern nominal skaliert ist und zwei (binär-logistische Regression) oder mehrere diskrete Ausprägungen (multinomiale (binär-logistische Regression) hat; die logistische Regression schätzt somit nicht die „Größe“ der nur qualitativ zu interpretierenden Zielvariable, sondern die Eintrittswahrscheinlichkeit einer bestimmten Ausprägung (z.B. Wahlentscheidung, Eintritt eines Ereignisses) (ROHRLACK 2007, S. 198f.).

Die Nutzenfunktion in diskreten Entscheidungsmodellen ist für gewöhnlich linear bzw. wird durch eine Transformation linearisiert (siehe Formel 23). Das mathematische Verhältnis zwischen Auswahlwahrscheinlichkeit und repräsentativem Nutzen wird durch eine logistische Funktion (siehe Formel 24) ausgedrückt, deren Verlauf S-förmig ist. Die vorhergesagten Werte der abhängigen Variablen liegen zwischen null und eins und summieren sich für jedes Individuum (i) zu eins. Inhaltlich bedeutet der S-förmige Kurvenverlauf, dass bei Alternativen

mit sehr hohem und sehr niedrigem Nutzen eine Nutzensteigerung nur sehr geringen Einfluss auf die Auswahlwahrscheinlichkeit hat; große Effekte hat die Steigerung des Nutzens im mittleren Bereich, wobei die stärksten Einflüsse im Bereich der 50%-Marke liegen (TRAIN 2009, S. 36ff.). Mathematisch liegt dieses Vorgehen darin begründet, dass die logistische Funktion, die aus einer logistischen Regression hervorgeht, eine Begrenzung der Zielvariable auf einen Wertebereich zwischen null und eins (bzw. 0 und 100 %) herbeiführt und plausible Auswahlwahrscheinlichkeiten nur in diesem Bereich liegen. Mit einer konventionellen linearen Regression ist dies nicht möglich, da theoretisch auch Werte unter null und über eins geschätzt werden können, was dem Grundprinzip der Wahrscheinlichkeiten widerspricht (ERNSTE 2011, S. 353f.).

ij

ij

x

V  

(23)

xij = Vektor von beobachteten Erklärungsgrößen (z.B. Eigenschaften der Alternative j) β = Gewichtungsparameter (empirisch ermittelt)

n

j V V ij

ij ij

e p e

1

(24)

pij = Wahrscheinlichkeit, dass sich ein Entscheidungsträger in der i-ten Entscheidungssituation für die Alternative j entscheidet

e = Eulersche Zahl

Die Schätzung des Modells erfolgt nicht mit der OLS-Methode des konventionellen linearen Regressionsmodells, sondern mit der Maximum-Likelihood-Methode34 oder anderen Schätzmethoden; eine Prüfung des Modells erfolgt anhand der für dieses Verfahren entwickelten Modellgütemaße (TRAIN 2009, S. 60ff.). Wenn das Modell auf der Basis von Echtdaten parametrisiert wurde, wird die gewichtete Nutzenfunktion in das Modell zur Auswahlwahrscheinlichkeit (Formel 24) eingesetzt; auf dieser Grundlage ist auch hier eine Anwendung als Simulations- und Prognosemodell möglich, die der des HUFF- und des MCI-Modells sehr ähnlich ist (MÜLLER-HAGEDORN/NATTER 2011, S. 211f.).

3.3.2.2 Möglichkeiten und Probleme der Anwendung

Ebenso wie das MCI-Modell kann das diskrete Entscheidungsmodell prinzipiell auf verschiedenste Formen von (Konsumenten-)Entscheidungen angewandt werden; im Einzelhandelskontext wird es zur Analyse der (individuellen oder haushaltsbezogenen) Einkaufsstättenwahl auf der Grundlage von Nutzenfunktionen mit anbieter- und/oder nachfrageseitigen Erklärungsgrößen verwendet (z.B. ARENTZE et al. 2005, GIJSBRECHTS et al. 2008, GONZÁLEZ-BENITO et al. 2005b, PANCRAS et al. 2012, POPKOWSKI LESZCZYC et al.

2004, REUTTERER/TELLER 2009, VROEGRIJK et al. 2013). Es ist mit diesen Modellen auch

34 Das Maximum-Likelihood-Verfahren bildet neben dem OLS-Verfahren eine gängige Schätzmethode für Regressionsmodelle; es basiert darauf, diejenigen Parameter zu ermitteln, die mit der größten Wahrscheinlichkeit den Zusammenhang zwischen den Prädiktoren und der Zielvariable beschreiben (ERNSTE 2011, S. 374f.).

möglich, die empirische Relevanz der erklärenden Größen des HUFF-Modells (Distanz, Verkaufsfläche) empirisch-ökonometrisch zu testen (z.B. LADEMANN 2007).

Die abhängigen Variablen in diskreten Entscheidungsmodellen bilden Wahlentscheidungen (z.B. Kauf der Marke X, Besuch des Anbieters Y) von individuellen Konsumenten oder Haushalten, die in Befragungen empirisch ermittelt werden (TEMME 2007, S. 329). Die Befragung erfolgt entweder anhand eines Revealed-Preference-Ansatzes (wie beim MCI-Modell), bei dem tatsächliches Wahlverhalten der Vergangenheit abgefragt wird (z.B.

ARENTZE et al. 2005, POPKOWSKI LESZCZYC et al. 2004), oder mit einem Stated-Preference-Ansatz, bei dem mehrere (fiktive) Wahlalternativen und ihre Eigenschaften in einem Befragungsexperiment vorgegeben werden (z.B. BORGERS/VOSTERS 2011, BROOKS et al.

2004 u. 2008, DELLAERT et al. 1998, HSIAO 2009, OPPEWAL/HOLYOAKE 2004).

Im Hinblick auf die theoretischen Grundlagen, den Anwendungszweck und das methodische Vorgehen sind sich das diskrete Entscheidungsmodell und das MCI-Modell durchaus ähnlich; in der praktischen Anwendung besteht der Unterschied darin, dass MCI-Modelle zumeist für aggregierte (Konsumenten-)Entscheidungen benutzt werden, wohingegen diskrete Entscheidungsmodelle individuelles, also disaggregiertes Verhalten modellieren (DION/CLIQUET 2006, S. 41f.). In technischer Hinsicht besteht der Vorteil, dass Nicht-Interaktionen (bzw. Entscheidungen gegen eine oder mehrere Alternativen) explizit mitbehandelt werden und nicht, wie beim MCI-Modell, unter Umständen eine Korrektur der Interaktionsmatrix notwendig ist (siehe Kap. 3.3.1.2). Allerdings impliziert das diskrete Entscheidungsmodell die Wahl einer Alternative unter Ausschluss anderer (z.B.

Haupteinkaufsquelle für Lebensmittel wie bei LADEMANN 2007), wohingegen das MCI-Modell zumindest theoretisch alle Alternativen abbilden kann.

Die Berechnung der Entscheidungs-/Interaktionswahrscheinlichkeiten erfolgt im diskreten Entscheidungsmodell ebenso auf der Grundlage einer nicht-linearen Verknüpfungsfunktion (Formel 24); die zu Grunde gelegte Nutzenfunktion (Formel 23) ist jedoch linear in ihren Parametern (was im MCI-Modell durch eine mehrstufige Transformation erreicht wird). Auch in Logit-Modellen kann daher das Problem der Multikollinearität bestehen und alternative Schätzmethoden erforderlich machen (CAMMINATIELLO/LUCADAMO 2010, S. 94ff.). Weiterhin sind mit Logit-Analysen spezifische Probleme hinsichtlich der Interpretation der Modelle verbunden. Die ermittelten Parameter sind im Gegensatz zum linearen Regressionsmodell schwieriger zu interpretieren; so lässt sich aus ihnen zwar die Richtung, jedoch nicht die Stärke des Einflusses der Prädiktoren ablesen. Es ist also nur eine indirekte Interpretation der Parameter möglich35. Ein weiteres Problem besteht in der Deutung der Modellgütemaße, da ein normiertes und unmissverständlich interpretierbares Gütemaß wie bei linearen Regressionsmodellen (R2) für Logit-Modelle nicht existiert (HOETKER 2007, S. 334ff.).

Aufgrund von inhaltlichen und mathematischen Einschränkungen des MNL-Modells sind mehrere darauf aufbauende, komplexere Verfahren entwickelt worden, z.B. zur Verschachtelung von Entscheidungen (Nested-Logit-Modell) oder zur Berücksichtigung der

35 Hierfür kann z.B. die odds ratio aus den Parametern bestimmt werden, die anzeigt, wie sich das

Chancenverhältnis bei der Erhöhung einer erklärenden Variable um eine Einheit verändert (ROHRLACK 2007, S.

204f.). Aus den Modellergebnissen lassen sich zudem Elastizitäten für die einzelnen Merkmale bzw. Teilnutzen mathematisch ableiten (TRAIN 2009, S. 57ff.; Anwendungsbeispiel: LADEMANN 2007, S. 153ff.).

Heterogenität von Entscheidungsträgern durch eine vorherige Klassifizierung anhand des Auswahlverhaltens (Latent-Class-Modell). Diese Verfahren sind jedoch insofern schwer anwendbar, als dass die komplizierten mathematischen Vorgänge in vielen gängigen Softwarepaketen nicht implementiert sind (TEMME 2007, S. 330ff.).