• Keine Ergebnisse gefunden

Verlassen des relevanten Netzes

Im Dokument Do----iT iT iT iT (Seite 128-135)

Fahrt mit Telefonat

K- verschiedene Routen

3.2 A-Daten-Datenbereinigung

3.2.4 Verlassen des relevanten Netzes

Die A-Daten werden für 53 Location Areas geliefert. Davon haben 41 einen räumlichen Bezug zum VPN („VPN-LAC“). Die Datensätze mit LACs ohne Bezug zum VPN („Fremd-LAC“) werden gelöscht. Dabei werden die im Folgenden beschriebenen Fälle unterschieden.

Abbildung 14: VPN und Schienennetz mit VPN-LACs (blau) und Fremd-LACs (grün), Einfärbung der VPN-Strecken nach Location Area.

Fremd-LACs zu Beginn bzw. am Ende einer UsrID

In den in Abbildung 15 verdeutlichten Fällen, in denen Mobilfunkgeräte zu Beginn bzw.

am Ende ihren Bewegung Fremd-LACs haben, werden diese Einträge gelöscht. Die weiteren Einträge der betroffenen UsrID werden unverändert beibehalten, falls mindestens drei unterschiedlichen LACs in den restlichen Einträgen vorhanden sind.

Trajektoriengenerierung

Abbildung 15: In das VPN hineingehende bzw. herausgehende Bewegung eines Mobilfunkteilnehmers.

Fremd-LACs zwischen VPN-LACs

Wenn ein Mobilfunkteilnehmer während seiner Bewegung das VPN verlässt, kann dies entweder eine Bewegung sein, die tatsächlich außerhalb des VPN stattfindet oder es handelt sich um ein kurzes Wechseln in eine Fremd-LAC aufgrund der Besonderheiten des Mobilfunknetzes.

Abbildung 16 zeigt ein Beispiel, bei dem die A-Daten eines Mobilfunkteilnehmers neben der LAC-Folge 6 – 5 – 4 zusätzlich einen oder mehrere Datensätze der Fremd-LAC 3 beinhalten.

Abbildung 16: Eine Fremd-LAC zwischen VPN-LACs.

Die Einträge der Fremd-LAC werden gelöscht, dabei werden zwei Fälle unterschieden:

LAC4 LAC5 LAC6

LAC1 LAC2 LAC3

Fremd-LAC

VPN-LAC

Trajektoriengenerierung

• Falls die Aufenthaltsdauer in der Fremd-LAC weniger als 10min beträgt, wird der Rest der Einträge nicht weiter verändert.

• Falls die Aufenthaltsdauer 10min oder mehr beträgt, wird davon ausgegangen, dass der Bereich des VPN tatsächlich verlassen worden ist. Deshalb werden in solchen Fällen zwei Fahrten für den Mobilfunkteilnehmer erzeugt. Die erste Fahrt von Beginn bis zum letzten VPN-LAC, d.h. vor Verlassen des VPN-Bereichs, sowie die zweite Fahrt vom ersten VPN-LAC nach Verlassen der Fremd-LAC also dem Wiedereintritt in den VPN-Bereich bis zum Ende.

Die Aufteilung auf zwei Fahrten wird unabhängig von der Aufenthaltsdauer auch dann durchgeführt, wenn zwei oder mehr unterschiedliche Fremd-LACs hintereinander in den A-Daten eines Mobilfunkteilnehmers sind (vgl. Abbildung 17).

Abbildung 17: Zwei Beispiele mit zwei aufeinanderfolgenden Fremd-LACs.

3.3 Fahrtidentifikation

Mobilfunkteilnehmer können während der Aufzeichnung der A-Daten mehrere Fahrten im Straßen- oder Schienennetz durchführen, oder aber auch keine Fahrten machen. In diesem Kapitel werden daher drei Regeln beschrieben, nach denen aus den bereinig-ten A-Dabereinig-ten pobereinig-tentielle Fahrbereinig-ten identifiziert werden:

• 60min-Regel

• Erweiterte 60min-Regel

• Nervositätsregel

LAC4 LAC5 LAC6

LAC1 LAC2 LAC3

Fremd-LAC

VPN-LAC

Trajektoriengenerierung

3.3.1 60min-Regel

Ein Mobilfunkteilnehmer, der sich deutlich länger in einer Location Area aufhält, als die direkte Durchfahrt unter Berücksichtigung von Stauereignissen dauert, hat in der jeweiligen Location Area einen potentiellen Fahrtbeginn bzw. –ende. Die Festlegung der Grenze, bei der eine Fahrt aufgetrennt wird, beeinflusst die Anzahl und Qualität der Trajektorien:

• Eine zu niedrige Grenze führt zu einer zu häufigen Trennung von Fahrten in zwei kürzere Fahrten.

• Eine zu hohe Grenze führt zu einer zu seltenen Trennung von Fahrten. Die daraus entstehenden langen Bewegungen können dann nicht als Trajektorie erkannt werden, wenn sie in ihrer Gesamtheit eine nicht identifizierbare Bewegung (z.B. Hin- und Rückfahrt) ergeben.

Abbildung 18 zeigt eine globale Betrachtung der Aufenthaltsdauern in den Location Areas. Knapp 25 % aller Aufenthaltsdauern sind unter 60 Sekunden, ca. 90 % liegen unter 20 Minuten. Danach nimmt der Anteil stetig ab, aber trotzdem sind noch knapp 5 % der Aufenthaltsdauern über 60 Minuten.

Abbildung 18: Aufenthaltsdauern in allen Location Areas.

Trajektoriengenerierung

Eine klare Grenze, ab der eine Bewegung eines Mobilfunkteilnehmers aufgeteilt werden sollte, ist dabei nicht zu erkennen. Auch eine LAC-weise Betrachtung in Abbildung 19 gibt keine weiteren Aufschlüsse über eine eventuelle LAC-feine Grenze, was sich auch aus der Vielzahl von möglichen Durchfahrtswegen durch eine Location Area ergibt.

Abbildung 19: Aufenthaltsdauer je Location Area.

Daher muss die Grenze unter Berücksichtigung der LAC-Ausdehnungen und darauf resultierender Durchfahrtszeiten manuell festgelegt werden. Ein relativ hoher Wert von 60 Minuten ist dabei sinnvoll, da dadurch auch größere Stauereignisse abgedeckt sind und Fahrten nicht unnötig aufgetrennt werden. Im Gegenzug wird aber akzeptiert, dass fälschlicherweise nicht aufgeteilte Fahrten im späteren Verlauf nicht zu Trajektorien weiterverarbeitet werden können und somit die Anzahl der Trajektorien sinkt. Letzteres ist aufgrund der zu erwartenden hohen Anzahl von Trajektorien akzeptabel.

Trajektoriengenerierung

Die folgende Abbildung 20 zeigt schematisch die Anwendung der 60min-Regel anhand der LA-Aufenthaltsdauern entlang einer Bewegung eines Mobilfunkteilnehmers. In LAC 2 ist die Aufenthaltsdauer über der festgelegten Grenze von 60 Minuten. Daher wird hier davon ausgegangen, dass in LAC 2 eine Fahrt beendet wird. Somit entstehen zwei neue Fahrten, eine mit der Folge 4 – 3 – 2 und eine weitere mit der LAC-Folge 2 – 1 – 5 – 6 – 7. Die neu entstehenden LAC-LAC-Folgen müssen der Anforderung aus Kapitel 3.2.2 genügen und mindestens drei verschiedene LACs enthalten.

Abbildung 20: Bewegung eines Mobilfunkteilnehmers mit LAC-Aufenthaltsdauern.

Die Anwendung der 60min-Regel soll nun an zwei realen Beispielen verdeutlicht werden. Das erste Beispiel ist in Tabelle 4 gezeigt, in der links die ursprünglichen Einträge für den User 306394488 dargestellt sind. Dieser hat in der Location Area 29453 eine Aufenthaltsdauer von ca. 1,5 Stunden. Daher wird der User an dieser Stelle aufgeteilt. Die erste Fahrt behält die alte UsrID 306394488 und geht von Zeile 1 bis 6.

Für den zweiten Teil wird eine neue UsrID (hier: 309496459) generiert und der Eintrag der Location Area 29453 als neue Zeile hinzugefügt. Der neu hinzugefügten Location Area wird eine Aufenthaltsdauer von einer Minute zugeordnet. Dies entspricht dem häufigsten Wert einer Aufenthaltsdauer in einer Location Area.

LAC1 10min

LAC2 63min

LAC3 10min

LAC4 12min LAC5

10min LAC6 10min LAC7 10min

Trajektoriengenerierung

Vor Anwendung der 60min-Regel Nach Anwendung der 60min-Regel

Zeile UsrID Uhrzeit cLAC Zeile UsrID Uhrzeit cLAC

1 306394488 14:12:44 30724 1 306394488 14:12:44 30724

2 306394488 14:38:18 30726 2 306394488 14:38:18 30726

3 306394488 14:43:16 29454 3 306394488 14:43:16 29454

4 306394488 14:49:19 29453 4 306394488 14:49:19 29453

1 309496459 16:31:07 29453

5 306394488 16:32:07 29454 2 309496459 16:32:07 29454

6 306394488 16:52:25 30726 3 309496459 16:52:25 30726

7 306394488 16:57:58 30724 4 309496459 16:57:58 30724

Tabelle 4: Aufteilung der UsrID 306394488 aufgrund der 60min-Regel in Zeile 5.

Das zweite Beispiel ist der Mobilfunkteilnehmer mit der UsrID 307744434 (vgl. Tabelle 5), der sich in der ersten Location Area mehr als 60 Minuten aufhält. Es ist davon auszugehen, dass sich der Mobilfunkteilnehmer in dieser relativ kleinen Location Area östlich von Walldorf (LAC 26638) aufgehalten hat, bevor er seine Fahrt auf der A6 Richtung Heilbronn begonnen hat. Dort wird ebenfalls eine zusätzliche UsrID erzeugt, die ursprüngliche UsrID wird allerdings aufgrund der Forderung, dass jede UsrID mindestens drei unterschiedliche LACs haben muss, gelöscht. Für die neue UsrID wird die erste Uhrzeit auf eine Aufenthaltsdauer von einer Minute angepasst.

Trajektoriengenerierung

Vor Anwendung der 60min-Regel Nach Anwendung der 60min-Regel

Zeile UsrID Uhrzeit cLAC Zeile UsrID Uhrzeit cLAC

1 307744434 18:57:25 26638 1 307744434 18:57:25 26638

1 309655461 20:30:29 26638

2 307744434 20:31:29 26643 2 309655461 20:31:29 26643

3 307744434 20:40:03 26645 3 309655461 20:40:03 26645

4 307744434 21:02:07 26644 4 309655461 21:02:07 26644

5 307744434 21:06:08 26636 5 309655461 21:06:08 26636

6 307744434 21:06:36 26644 6 309655461 21:06:36 26644

7 307744434 21:08:24 26636 7 309655461 21:08:24 26636

Tabelle 5: Änderung der UsrID 307744434 aufgrund der 60min-Regel in Zeile 1.

Im Dokument Do----iT iT iT iT (Seite 128-135)