• Keine Ergebnisse gefunden

Bestimmung der Parametersignifikanz

Im Dokument Do----iT iT iT iT (Seite 193-197)

Fahrt mit Telefonat

Stufe 2: Anbindungswahl nach manuell vorgebebener Gewichtung

A- Daten-Datenbereinigung

4 Schätzung der Parameter des Routenwahlverhaltens (AP5)

4.1.3.3 Bestimmung der Parametersignifikanz

mit

ρ

2 rho-square (Wertebereich zwischen 0 und 1)

K Anzahl Parameter

L

1 Log-Likelihood des geschätzten Modells

L

0 Null-Log-Likelihood

Der Unterschied zwischen diesen beiden Werten nimmt mit zunehmendem Stichprobenumfang ab und ist für die Schätzungen in dieser Arbeit vernachlässigbar.

ρ

2 kann Werte zwischen 0 und 1 annehmen, wobei die erreichten Werte in der Regel deutlich geringer als das Bestimmtheitsmaß R² der linearen Regression sind. In der Literatur wird allgemeinhin für

ρ

2 ein Bereich von 0,2 bis 0,4 angegeben, bei dem man von einer hohen Güte ausgehen kann (vgl. u.a. Backhaus et. al, 2006). Dieser Bereich entspricht nach Domencich & McFadden (1975) einem R² der linearen Regression von 0,44 bis 0,72.

4.1.3.3 Bestimmung der Parametersignifikanz

Für die geschätzten Parameter wird bei der Maximum-Likelihood-Schätzung ein Signifikanztest durchgeführt. Dadurch kann für ein gewähltes Signifikanzniveau sichergestellt werden, dass der Parameter ungleich 0 ist und damit in das Modell

über-Schätzung der Parameter des Routenwahlverhaltens (AP5)

nommen werden sollte. Die Prüfgröße

T

i ermittelt sich damit aus dem bei der Schätzung ermittelten Wert

β

i eines Parameters und seiner Standardabweichung

bi

s

:

= β

i

i b

T s

mit

T

i Prüfgröße für den Parameter i

β

i Schätzwert des Parameters i

bi

s

Standardfehler des Parameters

β

i

Unter Voraussetzung einer ausreichend großen Stichprobe ergeben sich die folgenden Werte aus der Student-t-Verteilung, die die Prüfgröße

T

i im Betrag nicht unterschreiten sollte, um als signifikant (95 %) bzw. hochsignifikant (99 %) zu gelten.

Freiheitsgrade Signifikanzniveau

90 % 95 % 99 %

>1.000 1,67 1,96 2,58

Tabelle 17: t-Tabelle für den zweiseitigen Test (aus Backhaus et al., 2006, S. 808).

Dieser Test mit der Student-t-Verteilung liefert bei der Maximum-Likelihood-Schätzung identische Ergebnisse wie der in der Literatur gelegentlich verwendete Wald-Test. Die Prüfgröße des Wald-Tests ist

T

i2 und wird mit Werten der Chi-Quadrat-Tabelle für einen Freiheitsgrad verglichen.

4.1.4 Verkehrsmeldungen

Für die Erhebungen mit Kennzeichenerfassungssystemen werden vom Südwestrundfunk (SWR) zur Verfügung gestellte Verkehrsmeldungen verwendet. Für die Auswertung der Trajektorien aus Mobilfunkdaten kann auf die Daten der Landes-meldestelle Baden-Württemberg, die vom Landeskriminalamt verwaltet werden, zurückgegriffen werden (vgl. Tabelle 18).

Schätzung der Parameter des Routenwahlverhaltens (AP5)

Spalte Name Typ Beschreibung

1 Meldungsnummer Long Integer Eindeutige Meldungsnummer der Landesmeldestelle 2 Version Integer Index für verschiedene Versionen einer Meldung (mit

identischer Meldungsnummer), beginnt bei 0

3 Eingabestelle Integer z.B. „LPD S“ für die Landespolizeidirektion Stuttgart. Der Wert

„SYSTEM“ beschreibt automatische Systemabmeldungen, die 15min nach der Aufhebungsmeldung erfolgen.

4 Datum Datum TT.MM.JJJJ

5 Zeit Uhrzeit HH:MM

6 Strasse Text Angabe der Straße (nur bei Autobahn und Bundesstraße) 7 Richtung Text Angabe der Richtung im Klartext, z.B: „Basel – Heidelberg“

8 Meldungstext Text Meldungstext, voll- und teilstandardisiert 9 Stau Integer Angabe der Staulänge in km (optional)

Tabelle 18: Definition der Verkehrsmeldungen der Landesmeldestelle.

Bei den sehr seltenen Vollsperrungen (nur 0,04 % aller Meldungen) werden entweder die gemeldete Staulänge verwendet oder 10 km eingesetzt. Staumeldungen ohne Staulängenangabe werden mit 1 km weiterverarbeitet.

Die Daten werden so aufbereitet, dass für die späteren Analysen alle Informationen streckenbezogen zur Verfügung stehen. Dabei werden die folgenden Regeln verwendet:

• Bei Meldungen mit nur einer Ortsangabe (z.B. „A8 Höhe Pforzheim-Ost“) wird die stromabwärts liegende Strecke ausgewählt.

• Bei Staulängenangaben, die größer als die Strecken zwischen den angegebenen Knoten sind, wird die Staulänge längengewichtet auf die betroffenen Strecken verteilt.

• Zusätzliche Angaben zur Stauursache etc. werden ausgelesen und gespeichert.

Um für einige Auswertungen die Meldungen über Stau und stockenden Verkehr zusammenfassen und für die Verkehrslage einen einheitlichen Wert verwenden zu können, werden diese wie folgt zusammengefasst:

i

VL

i Verkehrslage eines Streckenabschnittes bzw. einer Route [km]

i

l

Stau, Gemeldete Länge gestauten Verkehrs auf einer Strecke bzw. Route i [km]

i Stockend

l

, Gemeldete Länge stockenden Verkehrs auf einer Strecke bzw. Route i [km]

f Faktor zu Abminderung von

l

Stockend,i

Dabei sollte der Faktor f zwischen 0 und 1 liegen. Der Wert 0 bedeutet dabei, dass eine Meldung über stockenden Verkehr nicht in die Verkehrslage eingeht, also vom

Schätzung der Parameter des Routenwahlverhaltens (AP5)

Verkehrsteilnehmer als nicht relevant erachtet wird. Der Wert 1 bedeutet dagegen, dass Meldungen über Stau und stockenden Verkehr gleichwertig eingeschätzt werden.

Für den Verkehrsteilnehmer gibt es eine Vielzahl von Möglichkeiten, sich über die aktuelle Verkehrslage zu informieren. Zum einem gibt es die Möglichkeit der Pre-Trip-Informationen z.B. auf Webseiten von Radiosendern. Zum anderen kann der Verkehrsteilnehmer während der Fahrt (on-trip) die Verkehrsnachrichten verschiedener Radiosender hören oder über TMC ausgestrahlte Meldungen im Radio oder im Navigationsgerät sehen. Die Meldungen der meisten Quellen basieren auf den Daten der Landesmeldestelle, die auf ftp-Servern als xml-Dateien abgerufen werden können, werden aber insbesondere von den Radiostationen durch eigene Verkehrsredaktionen weiterverarbeitet (Voeske, 2008).

Datenquelle 14:30 14:45 15:00 15:15 15:30 15:45 16:00 16:15

Landesmeldestelle - 5 5 5 5 5 5 -

SWR1 Radio - - 5 5 5 5 - -

SWR1 Internet - - - 5 5 5 5 -

Hitradio Radio - - 5 5 5 5 5 -

Hitradio Internet - 5 5 5 5 5 5 -

Tabelle 19: Vergleich einer Störungsmeldung [Staulänge in km] auf der A6 im zeitlichen Verlauf.

Eine manuelle Analyse über einen Tag zeigt allerdings, dass die Staumeldungen bei ausgewählten Quellen sehr ähnlich sind. Tabelle 19 zeigt, dass die Meldung „A6 Heilbronn Richtung Nürnberg zwischen AS Heilbronn/Neckarsulm und Kreuz Weinsberg 5 km Stau“ im gleichen Zeitintervall bei der Landesmeldestelle und auf der Webseite von Hitradio Antenne 1 Baden-Württemberg erscheinen. Die Meldungen im Radio sind etwas verzögert, auch da diese nur halbstündig ausgestrahlt werden. Die Anzeige auf der Webseite von SWR1 erscheint erst um 15:15 Uhr. Das Stauende ist bei allen Medien nahezu identisch.

Bei weiteren Störungsmeldungen zeigen sich andere Muster, auch die angegebenen Staulängen variieren teilweise um geringe Werte. Es lässt sich allerdings feststellen, dass die Meldungen sehr ähnlich verlaufen und somit auf eine differenzierte Analyse der 12 landesweiten Radiosender sowie der über 30 lokalen Radiosender verzichtet werden kann. Dies gilt vor allem vor dem Hintergrund, dass es für Verkehrsmeldungen keine einheitliche Schnittstelle gibt und somit die Datenlieferungen – auch für die Radiosender – erheblichen Aufwand darstellen würden. So ist beispielsweise beim SWR die einzig vorhandene Export-Schnittstelle ein Papierausdruck der Dateien.

Schätzung der Parameter des Routenwahlverhaltens (AP5)

Im Dokument Do----iT iT iT iT (Seite 193-197)