• Keine Ergebnisse gefunden

„Untersuchung der qualitativen Eignung von OSM zur Ermittlung von Wohngebäudeflächen“

N/A
N/A
Protected

Academic year: 2022

Aktie "„Untersuchung der qualitativen Eignung von OSM zur Ermittlung von Wohngebäudeflächen“"

Copied!
56
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Universitätslehrganges „Geographical Information Science & Systems“

(UNIGIS MSc) am Interfakultären Fachbereich für GeoInformatik (Z_GIS) der Paris Lodron-Universität Salzburg

zum Thema

„Untersuchung der qualitativen

Eignung von OSM zur Ermittlung von Wohngebäudeflächen“

vorgelegt von

Peter Maryok

103225, UNIGIS MSc Jahrgang 2013

Zur Erlangung des Grades

„Master of Science (Geographical Information Science & Systems) – MSc(GIS)”

Krefeld, 20.01.2015

(2)

II Selbständigkeitserklärung

Hiermit versichere ich, dass ich diese Master Thesis selbständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt, sowie Zitate kenntlich gemacht habe.

________________________________

Peter Maryok

Krefeld, den 25.01.2016

(3)

III

Kurzfassung

VGI werden vermehrt als ernst zu nehmende Alternative zu amtlichen oder proprietären Geodaten angesehen. Die Herausforderung der VGI liegt in der Unkenntnis der Qualität der Daten. Die von traditionellen Anbietern adäquate Dokumentation und Professionalität ist bei VGI Anwendung allgemein nicht bis spärlich vorhanden. Regeln zur Erfassung, Dokumentation oder Bereitstellung von VGI Daten fehlen oder deren Einhaltung kann von den VGI Anbietern, aus Mangel an Ressourcen, nur mangelhaft geprüft werden. Auch die Eignung der VGI Ersteller ist in der Regel eine unbekannte Größe. So ist jeder, der VGI Daten benutzt, selbst für die Sicherstellung der Qualität oder der Eignung der Daten verantwortlich.

OSM, eine der umfangreichsten VGI Anwendungen, sammelt unter anderem Informationen zu Wohngebäuden. Diese haben Einfluss auf die Siedlungsstruktur und deren Analyse ist sowohl für die Beurteilung der aktuellen Siedlungsentwicklung, als auch für die Planung und Umsetzung von Siedlungszielen entscheidend. Ein wichtiger Faktor der Gebäudedaten ist unter anderem die Brutto-Grundfläche (BGF). Zum einen ist sie eine wichtige Größe bei der Planung und Kostenkalkulation von Gebäuden und zum anderen bestimmt sie die Flächeneffizienz, ist Grundlage zur Berechnung des Energiebedarfs oder kann mithilfe von Kennwerten zur Bestimmung z.B. der Wohnfläche herangezogen werden. Die Wohnfläche selbst wiederum ist eine maßgebende Kennzahl für Bewertung und Planung der Siedlungsentwicklung.

Aus diesem Grund untersucht diese Arbeit die qualitative Eignung von OSM zur Berechnung der Brutto-Grundfläche und der Wohnfläche von Wohngebäuden. Hierzu werden aus den Voraussetzungen zur Ermittlung von Brutto-Grundfläche und, in Kombination mit statistischen Kennwerten des BKI, der Wohnfläche, Usability-Qualitätselementen, nach ISO 19157, erstellt. Daraufhin wird geprüft, ob das dokumentierte Vorgehen zur Modellierung von Wohngebäuden in OSM, den Anforderungen der Qualitätselemente genügt.

Es zeigt sich, dass OSM die Voraussetzungen zur Berechnung Brutto-Grundfläche erfüllt, allerdings differenziert OSM die einzelnen Wohnformen nicht weit genug, um auch die Wohnfläche, mittels statistischer Kennwerte, zu bestimmen.

(4)

IV

Abstract

VGI are increasingly regarded as an serious alternative to proprietary or official geodata. The challenge in regard to VGI lies in the ignorance of the quality of the data. VGI often lack the adequate documentation and professionalism of traditional providers. Rules for recording, documentation and supply of VGI data are missing or there compliance can’t be checked properly by the providers, due to lack of resources. Even the suitability of the VGI creator is usually an unknown quantity. So each VGI user is responsible to ensure the quality or the suitability of the data.

OSM, one of the largest VGI application, collects amongst other things information on residential buildings. These Information have an impact on settlement patterns and their analysis is essential both for assessing the current settlement development, as well as for the planning and implementation of development goals. An important factor of building data is, among other things, the gross floor area (GFA). It is an important factor for planning and cost calculations of buildings, further it is the base for calculating the space efficiency, the energy demand or it can be used to determine the living area using statistical parameters. The living area in turn is a decisive indicator for the assessment and planning of settlement development.

For this reason, this work examines the qualitative suitability of OSM for the calculation of gross floor area and the living area of residential buildings. From the requirements for the determination of gross floor area and living area, usability quality elements have been created according to ISO 19157. Then, it is checked whether the documented approach for modeling of residential buildings in OSM meets the requirements of the quality elements.

It turns out that the conditions for calculating the gross floor area are fulfilled by OSM, however, OSM doesn’t differentiate the individual types of housing far enough to calculate the living area by means of statistical characteristics.

(5)

V

Inhalt

Kurzfassung ... III Abstract ... IV

1. Einleitung ... 1

1.1 VGI – Volunteered Geographic Information ... 1

1.2 OSM - OpenStreetMap ... 2

1.3 Gebäudedaten ... 5

1.4 Darstellung von Gebäuden in OSM ... 7

1.5 Problemstellung. ... 8

1.6 Forschungsfrage ... 9

2. Literaturüberblick ... 11

2.1 VGI und Qualität ... 11

2.2 Qualität OSM ... 16

2.3 Qualität OSM Gebäude ... 18

3. Methodik ... 23

3.1 Brutto-Grundfläche nach DIN 277 ... 23

3.2 Statistische Kennwerte des BKI ... 24

3.3 Data Quality-Elemente ... 25

4. Ergebnisse ... 28

5. Diskussion ... 35

5. Ausblick ... 38

Literaturverzeichnis ... 39

Anhang ... 45

Abbildungsverzeichnis ABBILDUNG 1:OSMOBJEKTE UND ATTRIBUTE, AUS JOSMEDITOR (KR.,OSTWALL) ... 3

ABBILDUNG 2:BSP. FÜR KARTEN AUS OSMROHDATEN, V.L. A)ÖPNV, B)SEEKARTE, C)OSM, D) FÜR ROLLSTUHLFAHRER . 4 ABBILDUNG 3:MESSEIGENSCHAFTEN DER SIEDLUNGSSTRUKTUR (RESEARCH STUDIOS AUSTRIA 2010) ... 6

ABBILDUNG 4:BEISPIELE GEBÄUDEFORMEN, EIGENE DARSTELLUNG ... 8

ABBILDUNG 5:BSP.NUTZERBEWERTUNGSSYSTEM VON EBAY (EBAY 2015) ... 14

ABBILDUNG 6:ÜBERBLICK IOSMANALYZER, AUS (BARRON ET AL.2014) ... 18

ABBILDUNG 7:ZUORDNUNG ZUR BGF, EIGENE DARSTELLUNG NACH DIN277 ... 23

ABBILDUNG 8:BSP.BERECHNUNG FLÄCHE VON DACHGESCHOSS BEI EINFACHEN DACHFORMEN. ... 26

ABBILDUNG 9:PUNKT ALS LAT/LON KOORDINATENPAAR, AUS JOSM ... 28

ABBILDUNG 10:TRENNUNG DER STOCKWERK, EIGENE DARSTELLUNG NACH OSMWIKI ... 30

Tabellenverzeichnis TABELLE 1: KATEGORIEN UND QUALITY ELEMENTE NACH ISO10157, EIGENE DARSTELLUNG ... 12

(6)

VI

TABELLE 2:DIMENSIONEN DER KONZEPTIONELLEN QUALITÄT, NACH BALLATORE UND ZIPF (2015) ... 16

TABELLE 3:VERHÄLTNIS WFL ZU BGF NACH BKI(2010) ... 24

TABELLE 4:DQ-ELEMENT MODELLIERUNGSGENAUIGKEIT ... 26

TABELLE 5:ERGEBNISSE ... 33

TABELLE 6:VALUES DES KEYS "BUILDING" UND DEREN ANZAHL ... 35

(7)

1

1. Einleitung

Diese Arbeit untersucht die Eignung von OpenStreetMap zur Berechnung der Brutto- Grundfläche und der Wohnfläche von Wohngebäuden. In der Einleitung wird zunächst erklärt was VGI und OSM ist, warum Gebäudedaten wichtig sind und wie Gebäude in OSM dargestellt werden. Anschließend werden die Problemstellung und die Forschungsfrage beschrieben.

1.1 VGI – Volunteered Geographic Information

Der Begriff Volunteered Geographic Information wurde von Goodchild (2007) geprägt.

Dieser Begriff bezieht sich auf Geodaten, die freiwillig von Internetnutzern bereitgestellt und zusammengetragen werden. Dazu zählen sämtliche freiwillig erhobenen Informationen, die über einen sogenannten Geocode verfügen und diese mit einer spezifischen Raumeinheit verknüpfen (Sui D. et al. 2013). Diese Daten können, wie Goodchild (2007) weiterhin ausführt, von jedermann erhoben und bereitgestellt werden, die einzig wirkliche Voraussetzung ist der Zugang zum Internet.

Der Aufstieg von VGIs begann mit dem Aufkommen von Web 2.0 Technologien, als es fast genauso einfach wurde Inhalte über das Internet zu konsumieren wie selbst Inhalte bereitzustellen (O‘Riley 2005). Denn das Entscheidende bei VGIs ist die Möglichkeit über den eigenen Browser Zugriff auf die Datenbanken der VGI Anwendungen zu erhalten, seine eigenen Daten dort abzulegen, Daten anderer einzusehen, diese zu Nutzen und wenn nötig auch zu ändern.

War die Erhebung und Bereitstellung geographischer Informationen aufgrund von hohen Kosten, enormen Zeitaufwand und dem Mangel an effektiven Verteilungsmöglichkeiten traditionell eher amtlichen oder kommerziellen Stellen vorbehalten (Amelunxen 2010), sind diese seit dem Aufkommen von VGIs nicht mehr die einzige Quelle für geographische Informationen. Der Zugang zu und die Verfügbarkeit von räumlichen Daten und kartographischen Produkten erfährt eine dramatische Veränderung (Jokar Arsanjani et al 2015). Die wichtigsten Gründe für das Wachstum von VGIs, außer Web 2.0, sind die enorme Kostenreduzierung der Infrastruktur und die Verbesserung von Geräten, wie Smartphones,

(8)

2

in der Nutzung und Genauigkeit von Satellitendaten, was zahlreichen Menschen das Erheben und Bearbeiten von Geodaten erst ermöglicht hat. (Goodchild 2007b).

Ein wichtiger Vorteil gegenüber traditionellen Geoinformationen ist die zeitnahe Erstellung und Aktualisierung von Informationen bei Veränderungen in der realen Welt. Im Besonderen für das Krisen- und Katastrophenmanagement ist eine schnelle und zeitnahe Bereitstellung von Geoinformationen entscheidend, ein Fall bei dem traditionelle Dienste nicht mithalten können (Haklay et al., 2014), vor allem wenn diese selbst betroffen sind.

Oft als Vorteil ausgelegt, aber leider nicht immer zutreffend, ist die Zugänglichkeit und kostenlose Nutzung ohne Beschränkungen. Für viele VGIs wie z.B. OSM trifft dieses zu, jedoch ist das nicht bei jeder VGI Anwendung der Fall, wie z.B. bei Flickr (Flickr 2015) oder Google Maps (Google 2015), wo die Nutzung starken Einschränkungen unterworfen ist.

Ein weiterer Anreiz von VGIs besteht darin, dass Informationen zu Objekten bereitgestellt werden, die von traditionellen Institutionen aus Mangel an Interesse oder aus Gründen der Wirtschaftlichkeit nicht erhoben werden. So sammelt und veröffentlicht z.B. mundraub.org Daten zu frei zugänglichen Obstbäumen und Kräutern (mundraub.org).

VGIs werden zunehmend zu einer interessanten Quelle für Geoinformationen für eine stetig steigende Anzahl von Anwendungen (Keßler et al. 2013). Ein großes Hindernis um traditionellen Geoinformationen auf Augenhöhe zu begegnen liegt zurzeit in der Beurteilung der Qualität der VGIs (Antoniou und Skopeliti 2015). Die Daten werden im Gegensatz zu traditionellen Institutionen mit unterschiedlichen Methoden und Werkzeugen von verschiedensten Menschen, oft Laien, aus den unterschiedlichsten Gründen erhoben (van Exel et al 2010), woraus eine nicht gleichbleibende Qualität resultiert. Diese zu beurteilen bzw. Methoden und Techniken zu finden die eine Beurteilung der Qualität erlauben, zählt zu den wichtigsten Aufgaben der Erforschung von VGIs (Flanagin et al. 2008).

1.2 OSM - OpenStreetMap

OpenStreetMap (OSM) ist ein 2004 gegründetes Projekt, das sich zur Aufgabe gestellt hat frei verfügbare geografische Daten zu erstellen und für deren Verfügbarkeit zu sorgen.

Umgesetzt wird dieses Anliegen in dem die Nutzer selbst für den Inhalt verantwortlich sind.

(9)

3

Dazu stellt OSM eine für jeden offene und frei editierbare Datenbank zur Verfügung, die über den eigenen Browser oder über bereitgestellte Editoren zugänglich ist. Die Nutzer können mittels GPS-fähigen Geräten Koordinaten von Straßen, Gebäuden und sonstigen Objekten aufnehmen oder von Sattelitenbildern und Karten abzeichnen und anschließend in OSM ablegen (OSM Wiki Contributors, 2015a). Die kartierten Objekte werden als Punkte, Linien oder geschlossene Linienzüge (Polygone) in 2D modelliert und die Eigenschaften der Objekte in Form von Attributen angehängt (Abb. 1). Die Attribute bestehen aus key-value Paaren oder sogenannten Tags. Der key beschreibt eine übergeordnete Kategorie, und wird über den value spezifiziert. Soll ein Polygon als Haus beschrieben werden so wird dem Polygon der Tag building=house hinzugefügt. Gehören mehrere Objekte zu einem Thema, wie z.B. verschiedene Straßenabschnitte einer Route einer Buslinie, wird die Zugehörigkeit in sogenannten Relationen angegeben. Diese Rohdaten werden dann verwendet um Themenbezogenen und visuell ansprechende Karten zu erstellen( Abb. 2).

Abbildung 1: OSM Objekte und Attribute, aus JOSM Editor (Kr., Ostwall)

(10)

4

Der gesamte Erfassungsprozess unterliegt dabei zunächst keinen besonderen Einschränkungen, was einerseits den Einstieg in OSM erleichtert, andererseits aber laut Barron et al. (2014) zu der größten Herausforderung bezüglich der Bestimmung der Qualität zählt. Damit kein zu großes Chaos entsteht, ist die OSM Community bemüht, für die Verwendung von Attributen ein möglichst einheitliches Schema durchzusetzen und so eine Grundlage für die weitere Verwendung der Daten zu schaffen (OSM Wiki Contributors, 2015e).

Um von der Community als etablierte Praxis angenommen zu werden, finden zwei verschiedene Prozesse Anwendung. Die eine Möglichkeit könnte man als das „Recht des Stärkeren“ bezeichnen. Der Tag, der für die Beschreibung einer bestimmten Eigenschaft bereits am häufigsten verwendet wird, wird zum Standard erklärt. Zum anderen können über die OSM Wiki Seite Vorschläge unterbreitet werden, die nach einer Diskussion in einer Abstimmung angenommen oder abgelehnt werden können. Wie auf der DE:How to map a Wiki Seite zu lesen ist, ändert sich durch diesen lebhaften Prozess die Systematik von OSM ständig (OSM Wiki Contributors, 2015b). Basiert eine Anwendung auf OSM, so muss auf Veränderungen geachtet werden und wenn nötig die Anwendung entsprechend angepasst werden.

Abbildung 2: Bsp. für Karten aus OSM Rohdaten, v.l. a) ÖPNV (ÖPNVKARTE 2015), b) Seekarte (OpenSeaMap 2015), c) OSM (OpenStreetMap 2015), d) für Rollstuhlfahrer (wheelmap.org 2015)

Der Attributierungsprozess, die unterschiedlichen Erfassungsmethoden und Geräte, haben direkten Einfluss auf die Qualität der Daten, beziehungsweise erlauben keine Aussagen zur Qualität ohne eine entsprechende Analyse. Zwar werden OSM Daten immer häufiger in

(11)

5

verschiedenen Anwendungen eingesetzt (Arsanjani J.J. et al 2015), sind aber,für die Verwendung in kommerziellen Anwendungen oder für Forschungsfragen ohne geeignete Untersuchungsmethoden zur Bestimmung der Qualität mit einer zu großen Unsicherheit behaftet (Fram et al. 2015).

1.3 Gebäudedaten

Geodaten zu Gebäuden sind Teil der räumlichen Daten zum dazugehörigen Siedlungsraum und bilden mit den Infrastrukturdaten die Grundlage zur Modellierung und Erforschung von Siedlungsstrukturen. Da räumliche Gebäudedaten direkten Einfluss auf sämtliche Dimensionen (physische, funktionale, ökonomische, ökologische, soziale, historische, kulturelle u. virtuelle (Thinh. 2004)) der Siedlungsstruktur haben, ist deren Analyse sowohl für die Beurteilung der aktuellen Siedlungsentwicklung, als auch für die Planung und Umsetzung von Siedlungszielen entscheidend. Gebäude sind unmittelbar mit dem Raum und dem Leben verknüpft, wodurch sie Rückschlüsse auf die Lebensqualität einer Siedlung oder Stadt erlauben. Die Entfernungen u. a. zur Arbeit, zum Kindergarten oder zur Schule, zu den nächsten Einkaufsmöglichkeiten, zum Café, Kino oder Schwimmbad sind räumliche Aufgabenstellungen, die Aussagen über die Kompaktheit und Nutzmischung einer Siedlung oder Stadt hervorbringen und gleichzeitig die Sozial- und Umweltverträglichkeit beurteilen (SCHUMACHER 2008). Allein die Betrachtung flächenhafter Messeigenschaften (Abb. 3) einer Siedlungsstruktur, wie sie im Projekt „Räumliche Siedlungsindikatoren“ beschrieben werden (Research Studios Austria 2010), unterstreicht den enormen Einfluss der Gebäudedaten auf Siedlungsindikatoren. Jede der beschriebenen Messeigenschaften erfordert Angaben zu Gebäudedaten um die jeweilige Eigenschaft abbilden zu können.

Ein wichtiger Faktor der Gebäudedaten ist unter anderem die Brutto-Grundfläche (BGF).

Zum einen ist sie eine wichtige Größe bei der Planung und Kostenkalkulation von Gebäuden zum anderen bestimmt sie die Flächeneffizienz, ist Grundlage zur Berechnung des Energiebedarfs oder kann mithilfe von Kennwerten zur Bestimmung von z.B. der Wohnfläche herangezogen werden. Die Wohnfläche selbst wiederum ist eine maßgebende Kennzahl für Bewertung und Planung der Siedlungsentwicklung. Fragestellungen rund um

(12)

6

den Siedlungsraum sind auf Gebäudedaten angewiesen und würden von leicht zugänglichen und kostenlosen Informationen wie sie OSM anbietet stark profitieren. Aber auch für das Risikomanagement, speziell im Blick auf die Exposition hinsichtlich Naturgefahren, wären OSM Daten sehr vorteilhaft. Weiterhin können z.B. mit Daten zu Dächern Analysen für die Solarnutzung vollzogen werden.

Um diese Daten verwenden zu können sind Kenntnisse über deren Qualität unentbehrlich, denn nur wenn diese in angemessener Form vorhanden sind, können verlässlich Ergebnisse erwartet werden.

Abbildung 3: Messeigenschaften der Siedlungsstruktur (Research Studios Austria 2010)

(13)

7 1.4 Darstellung von Gebäuden in OSM

OSM erlaubt es Gebäude in Bezug auf Form und Beschreibung sehr detailreich zu kartieren.

Objekte gelten als Gebäude sobald sie mit dem Key building versehen werden (OSM Wiki Contributors 2015c). Von einfachen Grundrissen bis hin zu komplexen Gebäudeformen mit verschiedenen Höhen und Formen ist eine Beschreibung möglich. Eigenschaften die nicht visuell dargestellt werden können, können als Attribute, wie z.B. die Anzahl der Geschosse (levels) oder die Höhe, hinterlegt werden. Abbildung 4 zeigt Beispielhaft einige Grundrisse von unterschiedlich komplexen Gebäuden. Bei einfacheren Gebäudeformen mit konstanten Eigenschaften über das gesamte Gebäude, genügen einfache Polygone oder Multipolygone, in Verbindung mit den entsprechenden Tags, um das gesamte Gebäude eindeutig zu beschreiben (Abb. 4a und b). Ändert sich aber die Form eines Gebäudes, sei es das ein Gebäudeteil höher ist als ein anderer oder ein Anbau erst ab einem bestimmten Stockwerk beginnt, hat ein Tag wie levels nicht mehr für das ganze Gebäude Gültigkeit. OSM ermöglicht hier das Aufteilen von Gebäuden und den entstandenen einzelnen Teilen verschiedenen Tags zuzuordnen (Abb. 4c). Die Einzelteile erhalten jeweils den Tag building:part=yes und werden anschließend in einer Relation zusammengefasst. Diese wird dann mit dem Tag type=building versehen und identifiziert somit die einzelnen Teile als ein Gebäude (OSM Wiki Contributors 2015m).

Zur vollständigen Beschreibung der Form eines Gebäudes gehört zudem die Form des Daches. Die Dachform an sich, die Höhe des Daches, Ausrichtung des Firsts und die Anzahl der Dachgeschosse können als Informationen hinterlegt werden (OSM Wiki Contributors 2015m).

Außer der Beschreibung der Form ist auch die Nutzung oder die Art des Gebäudes oft ein entscheidendes Kriterium. Dieses wird in den meisten Fällen über den Value des Keys building vorgenommen. 52 verschiedene Values sind im Wiki zum Key building dokumentiert, wie house, church, school, stadium, commercial, barn, garage usw..

Zusätzlich kann über den Key material das Baumaterial oder mit building:material das Material der Fassade angegeben werden.

(14)

8

Abbildung 4: Beispiele Gebäudeformen, eigene Darstellung

Zusätzlich zur Form und Nutzung besteht noch die Möglichkeit kosmetische Aspekte eines Gebäudes zu erwähnen. Unter anderem gehören dazu z.B. die Farbe des Gebäudes/Daches oder welches Dachmaterial Verwendung findet. Zahlreiche weitere Angaben lassen sich nach Belieben hinzufügen, womit die Beschreibung von Gebäuden in OSM einen sehr hohen Detailgrad erreichen kann.

Die Community versucht die Beschreibung von Gebäuden zu vereinheitlichen und ist in ständigem Diskurs über Methoden und Schemata. Ziel ist es die Beschreibung zu vereinheitlichen, um die Daten einfach nutzen zu können.

1.5 Problemstellung.

Gebäudedaten nehmen eine zentrale Rolle in der Erklärung und Erforschung von Siedlungsstrukturen ein. Vor allem flächenhafte Messeigenschaften und Strukturmodelle profitieren von einer guten und qualitativ angemessenen Datengrundlage. Auf der Suche

(15)

9

nach Daten trifft man früher oder später unweigerlich auf OSM und möchte natürlich wissen in wie weit sich die, von Freiwilligen zusammengetragenen, Daten für eigene Analysen eigenen. OSM hat eventuell Daten die Verwendung finden könnten, aber OSM hat auch ein Problem bezüglich der Kenntnis der Qualität eben dieser Daten. Somit muss die Bestimmung der Qualität, wenn in der Literatur nichts zum Thema vorliegt, in eigener Verantwortung durchgeführt werden.

Die besondere Herausforderung bei Gebäudedaten besteht darin, dass diese Daten eine drei bzw. vier (Zeit) dimensionale Struktur und Funktion beschreiben. OSM Daten werden allerdings als zwei Dimensionale Objekte modelliert und erst mittels Tags können überhaupt Angaben zur dritten und vierten Dimension hinzugefügt werden. Ist das OSM Modell qualitativ hochwertig genug um Gebäude in der Form zu beschreiben, dass nutzbare drei dimensionale Eigenschaften, die über das 3D rendern hinausgehen, ermittelt werden können.

Dieses versucht diese Arbeit anhand der Bestimmung von Gebäudeflächen zu untersuchen.

Im speziellen ist die Brutto-Grundfläche und die Wohnfläche von Wohngebäuden Gegenstand der Arbeit. Da keine Tags bezüglich dieser Größen vorhanden sind, wird geprüft ob diese auf anderem Wege ermittelt werden können. Die Wohnfläche nimmt hier eine spezielle Rolle ein. Erfüllt OSM nämlich die Voraussetzungen zu ihrer Berechnung, dann könnte die Wohnfläche in Kombination mit der Gebäude- und Wohnungszählung auf Basis des Zensus 2011 als Proxy für die Qualität der Gebäudedaten in Bezug auf die Brutto- Grundfläche und die Wohnfläche dienen.

1.6 Forschungsfrage

Wie zuvor beschrieben sind die Brutto-Grundfläche und die Wohnfläche wichtige Faktoren für Forschungsfragen zu Gebäuden, Siedlungstrukturen und deren Entwicklung. Als Quelle für solche Daten bietet sich OSM, mit seinem Bestreben alles zu beschreiben und zu modellieren, an.

Ziel der Arbeit ist es folgende Fragen zu beantworten:

1. Bietet OSM eine ausreichende Grundlage zur Ermittlung der Brutto-Grundfläche?

(16)

10

2. Wenn ja, stehen genug weitere Informationen zur Verfügung, um aus der Brutto- Grundfläche mit Hilfe statistischer Kennwerte die Wohnfläche zu ermitteln?

Zur erwartende Ergebnisse.

a) OSM bietet keine geeignete Grundlage zur Berechnung der Brutto-Grundfläche.

b) Die Brutto-Grundfläche kann berechnet werden, die Wohnfläche jedoch nicht.

c) Brutto-Grundfläche und die Wohnfläche können bestimmt werden.

Wenn c zutrifft, wird die Wohnfläche als Proxy für Gebäudedaten vorgeschlagen.

Zur Beantwortung beider Fragen wird das Usability Element (ISO 19157) herangezogen.

Die Ergebnisse dieser Arbeit beziehen sich nur auf Deutschland, da andere Länder eventuell andere Bestimmung zur Wohnflächenberechnung haben oder sich die Definitionen der Tags länderübergreifend leicht, jedoch für das Verfahren entscheidend, ändern können.

(17)

11

2. Literaturüberblick

Im Folgenden wird zuerst über Qualitätsuntersuchungen zu VGIs im Allgemeinen berichtet, anschließend ein kurzer Überblick zu Qualität und OSM gegeben und zum Schluss genauer auf Qualitätsuntersuchungen zu Gebäuden in OSM eingegangen.

2.1 VGI und Qualität

Die, von Fram et al. (2015) erwähnte, Unsicherheit hinsichtlich der Qualität von VGIs, macht die Beurteilung und Dokumentation der Qualität zu einem essentiellen Faktor im Umgang mit eben diesen. Erste Anlaufstelle zur Qualitätsbestimmung bieten traditionelle Herangehensweisen. Da VGIs unter anderem mit traditionellen digitalen geographischen Informationen konkurrieren bzw. für dieselben Aufgaben verwendet werden, ist es naheliegend dieselben Qualitätsanforderungen anzusetzen. Seit den 1980igern sind dies für geographische Informationen, laut Goodchild et al. (2012), zunächst folgende 5 Dimensionen anhand derer die Qualität beurteilt wird: Lineage, Positional Accuracy, Attribute Accuracy, Completeness und Logical Consistency. Morrison (1995) erwähnt allerdings noch Semantic Accuracy und Temporal Inforamtion, als sechstes und siebtes, unter anderem von der ICA (International Cartographic Association) in den 80igern akzeptierten Dimensionen zur Qualitätsuntersuchung von geographischen Informationen. Im Laufe der Zeit wurden kleine Veränderungen vorgenommen und die heutige ISO 19157 Geographic information - Data quality spricht von 5 Kategorien die in weitere Quality Elements (QE) unterteilt sind (Tab.

1). Vorteil besitzen diese Elemente vor allem bei extrinsischen Methoden, wenn gegen eine Grundwahrheit getestet werden kann. Dabei wird angenommen, dass amtliche oder kommerzielle Daten über eine höhere Qualität als VGI verfügen und somit als Referenz verwendet werden können.

(18)

12

Tabelle 1: Kategorien und quality elemente nach ISO 10157, eigene Darstellung

Kategorie -Element

Beschreibung

Completeness Beschreibt das Vorhandensein und Fehlen von Objekten, Attributen und Beziehungen.

-commission Datenüberschuss ist vorhanden

-omission Daten fehlen

Logical Consistency Einhaltung logischer Regeln der Datenstruktur, Attribute und Beziehungen

- conceptual consistency Einhaltung der Regeln des konzeptionellen Schemas - domain consistency Übereinstimmung der Werte mit den Wertedomänen

- format consistency Grad, zu dem die Daten in Übereinstimmung mit der physischen Struktur des Datensatzes gespeichert werden

- topological consistency Korrektheit der kodierten topologischen Eigenschaften eines Datensatzes

Positional Accuracy Beschreibt die Genauigkeit der Position von Objekten innerhalb eines räumlichen Referenzsystems

- absolute or external accuracy

Grad der Übereinstimmung der Koordinatenwerte zu wahren oder als wahr akzeptierten Werten

- relative or internal accuracy

Grad der Übereinstimmung relativer Positionen im Datensatz zu wahren oder als wahr akzeptierten relativen Positionen

- gridded data positional accuracy

Grad der Übereinstimmung räumlicher Werte von Rasterdaten zu wahren oder als wahr akzeptierten Werten

Thematic accuracy Beschreibt die Genauigkeit quantitativer und die Korrektheit nicht quantitativer Attribute und die Klassifizierung von Objekten und deren Beziehungen

- classification correctness Vergleich der zugeordneten Klassen der Attribute zum vorliegenden Thema

- non-quantitative attribute correctness

Maß, ob ein nicht-quantitatives Attribut richtig oder falsch ist - quantitative attribute

accuracy

Grad der Übereinstimmung von Werten quantitativer Attribute zu wahren oder als wahr akzeptierten Werten

Temporal quality Beschreibt die Qualität temporaler Attribute und temporaler Beziehungen von Objekten

- accuracy of a time measurement

Grad der Übereinstimmung temporaler Messwerte zu wahren oder als wahr akzeptierten Werten

- temporal consistency Korrektheit temporaler Abfolge

- temporal validity Gültigkeit der Daten in Bezug auf die Zeit

(19)

13

Usability element Spezifische Informationen zur Qualität über die Eignung eines Datensatzes für eine bestimmte Anwendung oder über die Konformität zu einem Satz von Anforderungen

Ein gutes Beispiel hierzu ist der Vergleich zur Bestimmung der Vollständigkeit und Positionsgenauigkeit vom OSM Straßennetzwerk mit amtlichen oder kommerziellen Daten, wie er bei Haklay (2010) oder Neis et al. (2011) vollzogen wird. Doch nicht immer ist eine Grundwahrheit vorhanden oder ein Referenzdatensatz ist, aus den unterschiedlichsten Gründen, außerhalb der Reichweite. Auch durch das Fehlen von verpflichtenden Spezifikationen für die Erstellung von VGI, ist die traditionelle Herangehensweise nicht immer die beste Wahl (Antoniou, 2011).

So sind Wissenschaftler auf der Suche nach neuen Qualitätselementen bzw. –indikatoren die dem Charakter der VGIs entsprechen. Konzepte wie Vertrauen (D’Antonio et al 2014) oder Glaubwürdigkeit kommen auf und versuchen die Qualität über den Ersteller zu beurteilen, da die Motivation, politische Einstellung oder sonstige Hintergründe des Erstellers von zentraler Bedeutung für die Bewertung der Qualität sein können (Flanagin et al. 2008).

Angenommen wird dabei, dass wer bisher qualitativ gute VGIs erstellt hat, dieses auch weiterhin tun wird und man diesen Daten der bestimmten Person, ohne gegen eine Grundwahrheit geprüft zu haben, vertrauen kann.

Einen Ansatz zur Bewertung der Glaubwürdigkeit, welcher die Community miteinbezieht, schlagen Bishr und Kuhn (2007) vor. Es ist, wie schon aus anderen Domänen des Internets bekannt, ein System das auf Nutzerbewertungen basiert. Nutzerbewertungen sind keine revolutionäre Neuerung und durch Hotelportale, eBay (Abb. 5) oder Amazon sind die meisten Internutzer bereits mit solch einem System vertraut. Die Problematik die sich hier stellt, ist das solche Bewertungen nicht vor Manipulationen gefeilt sind, wie Peters et al.

(2008) und Mühlenbeck et al. (2010) ausführen, und dadurch eventuell eher schaden als nutzen können. Nutzerbewertungen würden zudem nur bedingt Schutz vor, wie Ballatore (2014) es nennt, „cartographic vandalism“ bieten, da nicht davon auszugehen ist, dass stets derselbe Account für Missbrauch genutzt wird.

(20)

14

Abbildung 5: Bsp. Nutzerbewertungssystem von eBay (eBay 2015)

Eine Methode zur Bewertung der Glaubwürdigkeit, ohne die Community zu bemühen, wird von Senaratne et al. (2013) eingeführt. Am Beispiel von Flickr wird hier versucht die Glaubwürdigkeit anhand der Metadaten und einer Reverse Viewshed Analyse zu bestimmen.

Wenn jemand auf seinem Foto ein Gebäude z.B. als Reichstag identifiziert, wird anhand des Geocodes mittels der Reverse Viewshed Analyse errechnet ob es überhaupt möglich ist, den Reichstag von dieser Stelle aus zu sehen.

Die Herangehensweise von Barron et al. (2014) widmet sich einer rein intrinsischen Untersuchung. Hier wird auf die Vollständigkeit der Hausnummerierungen in OSM geprüft.

Als Grundlage hierzu dienen die Gebäudegröße und die Annahme, dass ab einer bestimmten Größe eine Hausnummer vorhanden sein sollte. Auf diese Weise kann festgestellt werden ob und wo Hausnummern eventuell fehlen. Eventuell deshalb, da die Annahme nicht für jedes Gebäude zutreffend ist. So würden Garagen oder Scheunen in die Liste nicht vollständig adressierter Gebäude aufgenommen werden, obwohl diese per se nicht unbedingt über eine Hausnummer verfügen. So konnten Barron et al. (2014) keinen Algorithmus finden der mit 100%iger Sicherheit sagen kann, ob ein Gebäude eine Hausnummer haben sollte oder eben nicht.

(21)

15

Antoniou und Skopeliti (2015) haben den Versuch unternommen die neuen Konzepte und Verfahren zu kategorisieren und sprechen bei Methoden wie Bishr und Kuhn (2007) von Contributors Indicators und bei Barron et al. (2014) von Data Indicators. Hinzu gesellen sich Demographic Indicators, da z.B. die Bevölkerungsdichte Einfluss auf Vollständigkeit und Positionsgenauigkeit hat (Zielstra und Zipf 2010), und Socio-economic Indicators, da unter anderem die Höhe des Gehalts Auswirkung auf die Anzahl der Beiträge hat (Girres und Touya 2010).

Ballatore und Zipf (2015) widmen sich dem Hauptproblem der VGIs, nämlich der Dokumentation und Spezifikation und stellen ein System zur Beurteilung der konzeptionellen Qualität vor. Dieses versucht Fragen hinsichtlich der Bedeutung von Tags, deren Interpretation, Mehrdeutigkeit oder Anwendung, der Klarheit von Spezifikationen, der Intention des Erstellers und vieles mehr zu beantworten. Hierfür wurden sechs Dimensionen der konzeptionellen Qualität identifiziert (Tab. 2), die den Attributierungsprozess und die Attributierung qualitativ beurteilen.

Die Beurteilung der Qualität von VGIs orientiert sich anhand der gegebenen Voraussetzungen. Wo möglich werden extrinsische Methoden bevorzugt. Diese stoßen bei VGIs aber oft an ihre Grenzen, weshalb sich der Fokus der Forschung zunehmend auf intrinsische Methoden verlagert. Doch auch der Ersteller der Daten wird zunehmend als Maß für deren Qualität herangezogen, womit die Daten selbst nur eine untergeordnete Rolle für die Qualitätsbestimmung spielen.

Es zeigt sich, dass Untersuchungen zur Qualität von VGIs nicht unbedingt eine triviale Angelegenheit sind und bei neuen und intrinsischen Methoden oft ein Rest Unsicherheit zurück bleibt. Die größte Sicherheit bieten extrinsische Methoden, zumindest noch, denn wie Vandecasteele and Devillers, (2015) bemerken, sind VGI in einigen Regionen qualitativ besser als amtliche Daten, was den amtlichen Daten die Eignung als Grundwahrheit nimmt.

Die ISO 19157 begegnet den neuen Herausforderungen durch VGI mit dem Usability Element, das die Qualität nach frei wählbaren Anforderungen bestimmt und dem VGI Charakter am besten entspricht, allerdings ist bisher noch keine Verwendung beschrieben worden. Die neuen Methoden müssen sich erst noch beweisen, vor allem müssen Wege

(22)

16

gefunden werden, die verbleibende Unsicherheit bei intrinsischen Methoden zu quantifizieren, um überhaupt einschätzen zu können ob der jeweilige Ansatz geeignet ist. Die Erforschung der Qualität von VGIs bleibt weiterhin eine herausfordernde Aufgabe.

Tabelle 2: Dimensionen der konzeptionellen Qualität, nach Ballatore und Zipf (2015)

Dimension Beschreibung

Conceptual Accuracy Iac Distanz zwischen Konzeption und Domänenwissen. Kann als Grad der Korrektheit der Klassifizierung von Objekten τ in Klassen C gesehen werden. Indikatoren: Anzahl der Features mit Mehrfachklassifikation; Anzahl der Bearbeiter.

Conceptual Granularity Igr Tiefe der thematischen Beschreibung von Daten; von sehr abstrakt bis sehr spezifisch. Indikatoren: Tiefe der Klassen in der Klassenhierarchie

Conceptual Completeness Icl Umfang der Konzeptualisierung von Merkmalen. Unterscheidung zwischen Klassenvollständigkeit und Attributvollständigkeit.

Indikatoren: Anzahl von Klassen; Anzahl von Attributen

Conceptual Consistency Icn Grad der Homogenität in der Beschreibung geographischer Objekte. Indikatoren: Anzahl der Objekte einer Klasse mit gleicher Attributierung;

Conceptual Compliance Icm Zugehörigkeit eines Attributs, eines Objekts oder eines Sets dieser zu einer gegebenen Quelle. Indikatoren: Verhältnis der Anzahl der Klassen und Attribute einer externen Quelle S zur Gesamtanzahl der Klassen und Attribute

Conceptual Richness Iri Menge und Vielfalt der Dimensionen, die in der Beschreibung eines reellen Entität vorhanden sind. Indikatoren: Anzahl der Attribute die ein Objekt beschreiben

2.2 Qualität OSM

Da OSM Informationen zu allem möglichen enthält, ist eine Analyse der kompletten Daten auf einmal, je nachdem wie absolut die Qualität bestimmt werden soll, äußerst schwierig bis unmöglich. Zum einem sind nicht zu allem verlässliche Referenzen vorhanden, zum anderen bleibt bei intrinsischen Methoden stets eine Unsicherheit zurück. So werden OSM Daten Kategorie bezogen geprüft. Eine der am häufigsten untersuchten Kategorien ist das Straßennetzwerk.

(23)

17

Für Deutschland verglichen Zielestra und Zipf (2010) die Länge der Straßen in OSM mit der von TeleAtlas, Ludwig et al. (2011) untersuchten Unterschiede zu Navteq und Neis et. al.

(2011) zu TomTom. Forghani und Delavar (2014) verglichen das Teheraner Straßennetzwerk mit amtlichen Daten der Stadt Teheran, Hakklay (2010) versuchte sich am Vergleich des englischen Straßennetzwerk mit dem Ordnance Survey Meridian 2 , Kounady (2011) verglich das Athener Straßennetzwerk mit den Daten des Hellenic Military Geographical Service. Die aufgeführten Autoren untersuchten teilweise verschiedene Aspekte des Straßennetzwerkes und verwendeten unterschiedliche Methoden, dennoch gelangen sie allgemein zu ähnlichen Ergebnissen. So sind alle auf den Umstand gestoßen, dass die Qualität der Daten mit der Bevölkerungsdichte steigt. Die Qualität in urbanen Regionen ist oft signifikant besser als in ländlichen Regionen. Ähnlich verhält es sich laut Hakklay (2010) zwischen reichen und armen Gegenden. Weiterhin wird die Qualität von der Bedeutung des Objekts (Straße) beeinflusst, was z.B. die Genauigkeit (Hakklay 2010, Ludwig et al. 2011) oder die Attributierung (Ludwig et al. 2011) betrifft. Zudem wird den Daten eine gute bis sehr gute Genauigkeit und Vollständigkeit, im Hinblick auf Objekte, bescheinigt. Neis et al.

(2011) berichten von einer 91%igen Überdeckung mit TomTom, Zielstra und Zipf (2010) stellen nur eine 7%ige Abweichung in der Gesamtlänge der Straßen zu TeleAtlas fest. Die Vollständigkeit kann jedoch regional stark schwanken und Werte von bis zu 97% in stark besiedelten Regionen und lediglich 18% Prozent in unbewohnten Regionen erreichen (Ludwig et al. 2011).

Außer dem Straßennetzwerk wurde auch die Landnutzung (Estima und Painho 2015, Jokar Arsanjani et al. 2013b), Bodenbedeckung (Mooney et al. 2010) oder die Repräsentation natürlicher Objekte (Mooney et al. 2010) untersucht. Weitere Forschungsthemen betreffen unter anderem die Aktivität der Nutzer (Neis P und Zipf A 2012, Napolitano und Mooney 2012, Jokar Arsanjani et al. 2013a) oder den Annotationsprozess (Mooney und Corcoran 2012a/b).

Einen der umfangreichsten Ansätze zur Qualitätsuntersuchung von OSM stellen Barron et al. (2014) vor. Deren iOSMAnalyzer bedient sich 25 verschiedener Methoden und

(24)

18

Indikatoren (Abb. 6), um über den OSM-Full-History-Dump die Qualität, in Hinsicht auf die Nutzung der Daten, zu bestimmen.

Auf Untersuchungen zu Gebäudedaten wird im Folgenden genauer eingegangen.

Abbildung 6: Überblick der Themen und intrinsischen Indikatoren des iOSMAnalyzer, aus (Barron et al. 2014)

2.3 Qualität OSM Gebäude

OSM Gebäude in Deutschland bestehen meist aus einfachen Polygonen. Etwa 60% dieser Polygone bestehen aus nur 4 Punkten, der Durchschnitt liegt bei 5,38 Punkten und 95% der Gebäude bestehen aus weniger als 10 Punkten, lediglich ein vernachlässigbar geringer Teil besteht aus komplexen Polygonen (Götz, 2012). 5% der Gebäude weisen eine geringere Fläche als 30m² auf, was auf kleine Hütten oder Garagen schließen lässt und wie Götz (2012) anmerkt eventuell auch Teile eines Gebäudekomplexes sein könnten. Zur Attribuierung der Gebäude stellt Götz (2012) fest, dass 17,87% Prozent der Gebäude über eine vollständige

(25)

19

Adresse verfügen, während bei 21,82% lediglich eine Hausnummer und Straße vorhanden sind. Ansonsten beziehen sich weitere Angaben, wenn überhaupt vorhanden, auf den Namen, den Gebäudetyp und auf 3D-Informationen. Insgesamt sind zu diesem Zeitpunkt laut Götz (2012) 13% der Gebäude Deutschlands in OSM erfasst, jedoch sind oft mehrere Gebäude zu einem Polygon zusammengefasst, was diese Zahl verfälscht. Zudem wurden hier nur absolute Zahlen verglichen, so dass z.B. gemappte kleine Hütten in OSM mitgezählt wurden, diese aber nicht in die amtlichen Gebäudezählungen aufgenommen werden, was die ermittelte Werte weiter verfälscht. Götz (2012) schlussfolgert aus seiner Untersuchung, dass Gebäude in OSM meist eine vereinfachte Darstellung der realen Gebäude sind, semantische Informationen nur sporadisch zu Verfügung gestellt werden und dass eine Vollständigkeit der Gebäudegrundrisse, wie sie beim Straßennetzwerk vorhanden ist, in etwa vier bis fünf Jahren zu rechnen ist. Götz und Zipf (2012) sprechen schon von 30% erfassten Gebäuden und einer Dauer bis zur Vollständigkeit der Gebäudeumrisse von ein bis zwei Jahren. Doch auch hier wurden nur absolute Zahlen verglichen und der Wert beinhaltet dieselben Verfälschungen wie bei Götz (2012).

Eine genauere Untersuchung der Vollständigkeit der Gebäudepolygone wurde von Kunze (2012) durchgeführt. Sie bedient sich zweier objektbasierter Methoden, der Centroid und der Overlap Methode, um die OSM Gebäudedaten mit Daten aus der Amtliche Liegenschaftskarte und dem Amtlich Topographischen Informationssystems (ATKIS) zu vergleichen. Verglichen wurden verschiedene Regionen aus NRW und Sachsen mit unterschiedlichen Bevölkerungszahlen und –dichten. Die angewandten Methoden führen teilweise zu deutlich unterschiedlichen Ergebnissen. Während die Werte für ganz NRW (10,45% Centroid, 10,6% Overlap) und Sachsen (11,39 % Centroid, 14,41 Overlap) für beide Methoden noch recht nahe bei einander liegen, liegt der Unterschied im Fall der Stadt Essen (28,5 % Centroid, 52,5 Overlap) zwischen den Methoden bei ca. 24%. Für fast alle Regionen zeigt die Overlap Methode einen deutlich höheren Wert als die Centroid Methode. Die Differenzen in den Ergebnissen werden, laut Kunze (2012) durch die Ungenauigkeit in der Modellierung erklärt, die sich unterschiedlich stark auf die Methoden auswirken. Die deutlichen Unterschiede in den Ergebnissen werden jedoch von Hecht et al. (2013) nicht bestätigt. Die Auswertung desselben Datensatzes mit denselben Methoden weist bei Hecht

(26)

20

et al. (2013) vergleichsweise sehr geringe Unterschiede zwischen den Methoden auf. So beträgt der Unterschied für Essen zwischen den beiden Methoden lediglich 1% (53,5 Centroid zu 52,5 Overlap), zudem ist hier die Centroid Methode, diejenige die stets höhere Übereinstimmungen mit den Referenzdaten zeigt. Es ist davon auszugehen das bei Kunze (2012) die CentroidMethode fehlerhaft angewendet worden ist und die Ergebnisse dort deshalb so weit auseinanderliegen. Die Ergebnisse der Overlap Methode weisen in beiden Arbeiten dieselben Werte auf. Die Unterschiede bei Hecht et al. (2013) werden auch den Modellierungsungenauigkeiten zugeordnet. Zum einen führt die Abstraktion des Referenzgebäudes auf einem Punkt zu Fehlern bei der Gebäudeidentifizierung, so dass die Centroid Methode den tatsächlichen Wert leicht unter- oder überschätzt. Zum anderen ist die Überdeckung bei der Overlap Methode eventuell nicht stark genug und das OSM Gebäude wird der Referenz nicht zugeordnet.

Hecht et al. (2013) untersuchten zwei weitere Methoden basierend auf räumlichen Einheiten.

Hierfür wurde das Untersuchungsgebiet in räumliche Einheiten gegliedert und die Anzahl der Gebäude pro Einheit (CNo) als auch die Fläche der Gebäude pro Einheit (CArea) ermittelt.

Die Ergebnisse von (CNo) unterschätzen die tatsächlichen Werte, da in OSM oft mehrere Gebäude als ein Polygon gemappt werden und (CArea) überschätzt die Vollständigkeit stark, da OSM Gebäude oft von Orthophotos abgezeichnet werden und die Fläche vom Dach und nicht die vom Grundriss wiedergegeben wird. Hecht et al. (2013) stufen diese Methoden für Qualitätsuntersuchungen als nicht geeignet ein und empfehlen auf deren Einsatz zu verzichten.

Außer der Vollständigkeit untersuchte Hecht et al. (2013) die Wachstumsrate der Gebäudedaten bezogen auf die Gebäudeumrisse innerhalb eines Jahres (Nov, 2011 – Nov, 2012). Die Zuwachsraten betragen je nach Region zwischen 14% und 56% und sind zudem rückläufig. Hatte Götz (2012) noch vier bis fünf Jahre, Götz und Zipf (2012) optimistische ein bis zwei, für die Vervollständigung der Gebäudedaten geschätzt, so gehen Hecht et al.

(2013) von mindestens 9 Jahren aus.

(27)

21

Nach Kunze (2012), Kunze et al. (2013) und Hecht et al. (2013) sind die Gebäudedaten in urbanen Regionen vollständiger als in ländlichen Regionen. Insgesamt sind die Gebäudedaten jedoch zu dürftig für großräumige wissenschaftliche Analysen und können mit der Vollständigkeit des Straßennetzwerkes bei weitem nicht mithalten.

Fan et al. (2014) haben die Qualität der Gebäudedaten für München geprüft. Außer der Vollständigkeit wurde die Semantische-, die Positions- und Formgenauigkeit untersucht.

Zuerst wurde hier die, laut Hecht et al. nicht geeignet, auf räumlichen Einheiten basierende Fläche der Gebäude (CArea) zur Prüfung der Vollständigkeit herangezogen. Nach einem Vergleich mit ATKIS Daten ist die gesamt Gebäudefläche in OSM höher als die in ATKIS.

Ein weiterer Vergleich mit der Overlap Methode ergab allerdings, dass nur 66,1% der ATKIS Gebäude in OSM vorhanden sind und 1233 Gebäude aus OSM nicht im ATKIS Bestand zu finden sind.

Als semantisch korrekt bezeichnet Fan et al. ein Objekt, wenn es als das was es ist gekennzeichnet worden ist. Da fast alle OSM Gebäude den ATKIS Gebäuden zugeordnet werden können, wird davon ausgegangen das die semantische Genauigkeit, also ein Gebäude als Gebäude zu bezeichnen, bei 100% liegt. Da die ATKIS Daten drei Jahre älter als die OSM Daten sind, nehmen Fan et al. (2014) an, dass die 1233 Gebäude die in OSM vorhanden sind in ATKIS aber fehlen, neue Gebäude sind und auch korrekt als Gebäude getagt sind.

Für die Analyse der Positionsgenauigkeit wurden nur die Gebäude mit einer 1:1 Beziehung verwendet. Es wurde die Abweichung der korrespondierenden Punkte zwischen OSM und ATKIS berechnet. Im Durchschnitt haben die OSM Gebäude eine 4,13m Abweichung zu ATKIS, wobei 15m die höchste und wenige cm die kleinste Abweichung ist. Den Grund für diese Abweichung sehen Fan et al. (2014) in der Auflösung von Bings, die für München 3- 5m beträgt, wovon die meisten Gebäude abgezeichnet werden. Amelunxen (2010) hatte für NRW beim Vergleich von OSM Adressen mit amtlichen Hauskoordinaten noch eine durchschnittliche Abweichung von 11m festgestellt, allerdings war der Datensatz von 2009 bevor es die Möglichkeit gab Bing (erst ab 2010) zu nutzen.

(28)

22

Die Formgenauigkeit wurde anhand der Gebäude mit einer 1:1 Beziehung mithilfe der Turning Function getestet. Die meisten OSM Gebäude verfügen über eine hohe Ähnlichkeit (über 70%) zu ATKIS Gebäuden und das trotz einfachere Darstellung, da OSM Gebäudepolygone im Durchschnitt über 10 Punkte weniger verfügen. (Fan et al. 2014).

Fram et al. (2015) untersuchten, ob die Bevölkerungsdichte als Proxy für die Vollständigkeit der Gebäudedaten verwendet werden kann. Es konnte jedoch keine signifikante Korrelation zwischen Bevölkerungsdichte und Vollständigkeit beobachtet werden. Allerdings wurde als Grundlage die Vollständigkeit mit dem auf räumlichen Einheiten basierenden Flächenvergleich (CArea) bestimmt, was die OSM Fläche, wie schon erwähnt, stark überschätzt und somit etwaige Korrelationen beeinflusst.

Die Vollständigkeit und Differenziertheit der Attributierung von Gebäuden wird allgemein als sehr gering angesehen. Schon Götz und Zipf (2012) stellten fest, dass weit unter 1% der Gebäude über gebäudebeschreibende Attribute verfügen. Auch zwei Jahre später bemängeln Fan et al. (2014), dass immer noch Attribute wie Name, Typ, Höhe, etc. weitläufig fehlen.

(29)

23

3. Methodik

Im Folgenden werden die Annahmen, Daten und die sich daraus ergebenden Qualitäts- Elemente vorgestellt. Ziel ist es Qualitäts-Elemente aus den gegebenen Informationen und den Eigenschaften von OSM abzuleiten, die eine Begutachtung der Eignung der OSM Struktur zur Berechnung der Brutto-Grundfläche und der Wohnfläche, erlauben.

3.1 Brutto-Grundfläche nach DIN 277

Die DIN 277 zählt zur Brutto-Grundfläche die Summen aller Grundflächen der Grundrissebenen eines Gebäudes. Dabei gelten die äußeren Maße der Bauteile einschließlich der Bekleidung. Um diese zu ermitteln werden die Grundflächen zunächst in 3 Kategorien eingeteilt (Abb. 7):

- Bereich a: überdeckt und allseitig in voller Höhe umschlossen (grün)

- Bereich b: überdeckt, jedoch nicht allseitig in voller Höhe umschlossen (orange) - Bereich c: nicht überdeckt (rot)

Abbildung 7: Zuordnung zur BGF, eigene Darstellung nach DIN 277; Bereich a = grün, Bereich b = orange, Breich c = rot

Zur Brutto-Grundfläche zählen die Bereiche a und b, wobei der Bereich b, in den nicht vollständig umschlossenen Bereichen nur bis zur senkrechten Projektion der Überdeckung

(30)

24

mit einberechnet wird. Der Bereich c wird bei der Brutto-Grundfläche nicht Berücksichtigt.

Weiterhin zählen nichtnutzbare Dachflächen, konstruktiv bedingte Hohlräume und konstruktive und gestalterische Vor- und Rücksprünge an den Außenflächen nicht zur Brutto-Grundfläche (DIN 277 2005).

3.2 Statistische Kennwerte des BKI

Das Baukosteninformationszentrum Deutscher Architektenkammern (BKI) hat von 313 Wohngebäuden statistische Kennwerte ermittelt (BKI, 2010). Dazu zählt unter anderem das Verhältnis von Brutto-Grundfläche zur Wohnfläche. Ermittelt wurden die Kennwerte unter Berücksichtigung der DIN 277 und der Wohnflächenverordnung. Die Wohnhäuser wurden in 11 Kategorien innerhalb von zwei Baugruppen eingeteilt (Tab. 3)

Tabelle 3: Verhältnis WFL zu BGF nach BKI (2010)

Einzelhäuser (1 - 2 Wohnungen) Anzahl der Häuser WFL/BGF

unterkellert 76 52,1 %

nicht unterkeller 46 63,3 %

Passivhaus 19 58,1 %

Holzhaus, unterkellert 10 61,3 %

Holzhaus, nicht unterkellert 13 69,0 %

Doppel-, Reihen- und Mehrfamilienhäuser

Doppel- und Reihenendhäuser 18 61,0 %

Reihenhäuser 32 65,8 %

Mehrfamilienhäuser mit bis zu 6 WE 32 55,9 %

Mehrfamilienhäuser mit 6 bis 19 WE 27 53,2 %

Mehrfamilienhäuser mit mehr als 20 WE 29 56,8 %

Mehrfamilienhäuser, energiesparend, ökologisch 11 57,8 %

(31)

25 3.3 Data Quality-Elemente

Die Anforderungen ergeben sich unter anderem aus der DIN 277 und den statistischen Kennwerten. Um diese anzuwenden muss eine Differenzierung der OSM Daten möglich sein, die den Gruppen der statistischen Kennwerte entspricht. Weiterhin muss auf das vorhanden sein von Attributen geprüft werden, die entsprechend der DIN 277 die Berechnung der Brutto-Grundfläche ermöglichen.

Bei der Berechnung der BGF sind zwei Fälle zu Unterscheiden. Dies sind zum einen Wohngebäude bei denen die Angabe einer Grundrissebene für die Berechnung ausreichend ist und zum anderen Wohngebäude bei denen mehrere Grundrissebenen zur Ermittlung der BGF modelliert werden müssen.

Der erste und denkbar günstigste Fall für die Berechnung der BGF liegt vor, wenn sämtliche Grundrissebenen des Gebäudes gleich sind. Dieser Fall erfordert zur Berechnung der BGF lediglich die modellierte Grundrisseben und deren Anzahl (Stockwerke). Ändert sich die Form der Grundrissebene in den Dachgeschossen, so kann bei einfachen Dachformen wie z.B. Satteldach auf eine extra Modellierung der Dachgrundrissebenen verzichtet werden, da mit Angaben zur Dachform, Dachhöhe, Dachneigung, Ausrichtung des Dachfirsts und Anzahl der Dachgeschosse die Fläche der jeweiligen Dachgrundrissebene rechnerisch bestimmt werden kann. (Abb. 8).

Sind in einem Wohngebäude die Grundrissebenen verschieden, so müssen diese einzeln so modelliert werden, dass die Ebenen innerhalb der jeweiligen Teile konstant sind (Abb. 4).

Ist die BGF ermittelt werden für die Ermittlung der Wohnfläche noch Angaben zur Wohnform (Haus, Mehrfamilienhaus, usw.), zum Baumaterial (z.B. Holzhaus) und die Information, ob das Wohngebäude unterkellert ist, benötigt. Da Wohngebäude, vor allem im innerstädtischen Raum, auch Gewerbeflächen enthalten, muss zudem noch eine Möglichkeit vorhanden sein diese Flächen von den Wohnflächen zu unterscheiden. Nicht zu vergessen ist, dass auch eine gewisse Modellierungsgenauigkeit vorhanden sein muss damit die Flächengröße entsprechend repräsentiert werden kann.

(32)

26

Abbildung 8: Bsp. Berechnung Fläche von Dachgeschoss bei einfachen Dachformen, G muss nur noch verdoppelt werden und entsprechend der Orientierung des Daches mit der Längs- oder Breitseite multipliziert werden.

Aus diesen Anforderungen wurden insgesamt 18 Quality-Elemente ermittelt. (DQ-E, Tabellen s. Anhang):

Beispiel Usability Quality Element nach ISO 19157:DQ-E 1 Modellierungsgenauigkeit

Tabelle 4: DQ-Element Modellierungsgenauigkeit

Line Component Description

1 Name Modellierungsgenauigkeit

2 Alias -

3 Element Name usability element 4 Basic Measure correctness indicator

5 Definition Gibt an ob genau genug gezeichnet werden kann 6 Description

7 Parameter

8 Value Type Boolean (True wenn Anforderung erfüllt) 9 Value Structure

10 Source Reference 11 Example

12 Identifier 1

DQ-E Differenzierung zwischen Wohnformen, wie Haus, Reihenhaus, Mehrfamilienhaus 2.1 Differenzierung Einzelhaus

2.2 Differenzierung Doppelhaus 2.3 Differenzierung Reihenendhaus 2.4 Differenzierung Passivhaus 2.5 Differenzierung Reihenhaus

(33)

27 2.6 Differenzierung Mehrfamilienhaus

2.7 Differenzierung Mehrfamilienhäuser nach Wohneinheiten DQ-E 3. Angaben zu Flächen (Stockwerken)

DQ-E 4. Differenzierung zwischen mit und ohne Keller DQ-E 5. Differenzierung nach Baumaterial

DQ-E 6. Differenzierung der Dachformen.

6.1 Angaben Dachhöhe 6.2 Angaben Neigungswinkel 6.3 Angaben Dachstockwerke 6.4 Angaben Orientierung

DQ-E 7. Abbildung komplexer Formen

DQ-E 8. Flächennutzung innerhalb eines Gebäudes Aggregation Measures

DQ-E 9. Anforderungen bestanden

9.1 Anzahl nicht erfüllter Anforderungen 9.2 Anzahl erfüllter Anforderungen 9.3 Durchfallrate

9.3 Erfolgsrate Anwendungsbereich

Der Anwendungsbereich umfasst die OSM Objekte und Daten zu Wohngebäuden innerhalb Deutschlands.

Qualität Test Methode

Es wird geprüft, ob die dokumentierte Vorgehensweise zur Modellierung und Attribuierung von Wohngebäuden den Anforderungen der Quality-Elemente genügt.

(34)

28

4. Ergebnisse

DQ-E 1 Modellierungsgenauigkeit

OSM verwendet als Koordinatesystem das WGS84 Referenzsystem. Punkte werden als Lat/lon Koordinatenpaare mit bis zu 7 Nachkommastellen gespeichert (Abb. 9). Das bedeutet, das eine Angabe von Punkten mit einer Genauigkeit von 0,01m möglich ist.

Abbildung 9: Punkt als Lat/Lon Koordinatenpaar, aus JOSM

DQ-E 2.1 Differenzierung Einzelhaus

Für die Beschreibung eines Einzelhauses können laut OSM Wiki drei verschiedene kv-Paare verwendet werden. Zum einen building=house, building=detached und building=bungalow.

Während building=detached eindeutig ein einzeln stehendes Einfamilienhaus identifiziert, bezieht sich building=house auf ein Einfamilienhaus, wobei es sich auch um eine Doppelhaushälfte oder um ein Reihenhaus handeln kann. Gebäude mit dem Tag building=bungalow sind als Einzelhaus zu betrachten, da sie lediglich dazu dienen Einzelhäuser in eingeschossige oder mehrgeschossige Häuser zu unterscheiden. Trotz des Konfliktes mit building=house ist ein eindeutige Identifizierung eines Wohngebäudes als Einzelhaus mit dokumentierten Tags möglich (OSM Wiki Contributors 2015c).

DQ-E 2.2 Differenzierung Doppelhaus

Eine eindeutige Identifizierung eines Wohngebäudes als Doppelhaus ist nicht vorhanden.

Doppelhäuser sollen als einzelne Doppelhaushälften modelliert und mit dem kv-Pair building=house getagt werden (OSM Wiki Contributors 2015c). Somit ist eine klare vorgegebene Einteilung eines Wohngebäudes als Doppelhaus oder Doppelhaushälfte nicht vorhanden.

DQ-E 2.3 Differenzierung Reihenendhaus

Eine eindeutige Identifizierung eines Wohngebäudes als Reihenendhaus über Attribute ist im OSM Wiki nicht vorhanden. Eine Identifizierung durch eine räumliche Analyse von als

(35)

29

Reihenhaus markierten Polygonen und z.B. einer Filterung nach Polygonen mit nur einem Nachbarn ist nicht möglich, da ein Reihenhausverbund als ein Polygon erfasst wird bzw.

wenn die Häuser einzeln erfasst werden, sollen diese laut OSM Wiki mit dem Tag building=house versehen werden (OSM Wiki Contributors 2015c).

DQ-E 2.4 Differenzierung Passivhaus

Eine eindeutige Identifizierung eines Wohngebäudes als Passivhaus ist im OSM Wiki nicht vorgesehen.

DQ-E 2.5 Differenzierung Reihenhaus

Für Reihenhäuser ist der Tag building=terrace vorhanden. Zwar ist Beschreibung auf der OSM Wiki Seite zum Key building nicht ganz eindeutig und spricht von einer Reihe verbundener Wohnhäuser was nicht unbedingt dem Begriff Reihenhaus entsprechen muss.

Auf der Wiki Seite zum Tag building=terrace wird jedoch auf die Wikipedia Seite zum Thema Reihenhaus verlinkt, was den Gebrauch des Tags eindeutig bestimmt. Ein Problem ist allerdings das empfohlen wird jedes Haus des Verbundes einzeln zu mappen und mit dem Tag building=house zu versehen. Somit wird eine eindeutige Identifizierung ausgeschlossen, da obwohl dies möglich ist, es offiziell empfohlen wird einen weniger differenzierten Tag zu verwenden (OSM Wiki Contributors 2015f).

DQ-E 2.6 Differenzierung Mehrfamilienhaus

Für Mehrfamilienhäuser steht laut OSM Wiki der Tag building=apartment zur Verfügung.

Es wird zudem darauf hingewiesen, dass sich im Erdgeschoss eventuell gewerblich genutzte Flächen befinden können, was in Innenstädten sehr häufig anzutreffen ist (OSM Wiki Contributors 2015c).

DQ-E 2.7 Differenzierung Mehrfamilienhäuser nach Wohneinheiten

Über den Key building:flats kann die Anzahl der Wohnungen angeben werden. Somit ist eine Möglichkeit zur Differenzierung von Wohngebäuden nach der Anzahl der Wohneinheiten gegeben (OSM Wiki Contributors 2015h).

(36)

30 DQ-E 3. Angaben zu Flächen (Stockwerken)

Stockwerke werden in OSM zunächst auf 3 Arten unterschieden, building:levels, building:levels:underground und roof:levels (Abb. 10). Der Key building:levels gibt die Anzahl der Stockwerke zwischen Erdoberfläche und Dachgeschoss wieder. Beginnt ein Gebäudeteil nicht direkt an der Erdoberfläche und lässt ein oder mehrere Stockwerke aus, wird die Anzahl der Stockwerke für diesen Gebäudeteil über eine Kombination der Keys building:levels und building:min_level angegeben (Abb 4). Dabei enthält building:min_level die Anzahl ausgelassener (nicht vorhandener) Stockwerke und building:levels die Anzahl der ausgelassenen und der vorhanden Stockwerke. Die Differenz beider Keys ergibt dann die Anzahl tatsächlich vorhandener Stockwerke für den jeweiligen Gebäudeabschnitt. Für das Gebäude c aus Abb. 1 und Gebäudeabschnitt 2 wäre die Anzahl der Stockwerke somit building:levels=5 – building:min_level=2 = 3 Stockwerke.

Mit dem Key building:levels:underground wird die Anzahl der Kellergeschosse angegeben und mit dem Key roof:levels die Anzahl der Dachgeschosse (Abb. 10). Somit kann die Anzahl der Stockwerke akkurat wiedergeben werden (OSM Wiki Contributors 2015i).

Abbildung 10: Trennung der Stockwerk, eigene Darstellung nach OSM Wiki

(37)

31 DQ-E 4. Differenzierung Keller – kein Keller

Aus DQ-E 2 folgt, dass eine Differenzierung zwischen Gebäuden mit Keller und Gebäuden ohne Keller über den Key building:levels:underground gegeben ist.

DQ-E 5. Differenzierung nach Baumaterial

Auch hierzu steht ein dokumentierter Key zur Verfügung nämlich material. Dieser Key beschreibt das Hauptmaterial aus dem ein physisches Objekt besteht. Im Fall eines Holzhauses wäre der Tag material=wood zu verwenden (OSM Wiki Contributors 2015k).

Verwechslungsgefahr besteht mit dem Key building:material, der allerdings laut OSM Wiki ausschließlich für die Beschreibung der Fassade eines Gebäudes zu verwenden ist (OSM Wiki Contributors 2015j).

DQ-E 6. Differenzierung Dachformen

Eine Differenzierung der Dachformen ist über den Key roof:shape möglich und im OSM Wiki sind zudem gängige Dachformen aufgeführt (OSM Wiki Contributors 2015m).

DQ-E 6.1 Dachhöhe

Die Dachhöhe wird über den Key roof:height definiert (OSM Wiki Contributors 2015m).

DQ-E 6.2 Dachneigung

Die Dachneigung wird über den Key roof:angle angegeben (OSM Wiki Contributors 2015m).

DQ-E 6.3 Dachgeschoss

Aus DQ-E 2 folgt, dass Angaben zur Anzahl der Dachgeschosse über den Key roof:levels erfolgen.

DQ-E 6.4 Orientierung Dachfirst

Angaben zur Orientierung des Dachfirsts werden über den Key roof:orientation gemacht, wobei der Value along die Orientierung parallel zur längeren Seite und across parallel zur kürzeren Seite des Wohngebäudes angibt (OSM Wiki Contributors 2015m).

(38)

32 DQ-E 7 Fläche komplexer Gebäudeformen

Komplexe Gebäudeformen können mit Hilfe des Simple 3D Building Schemas modelliert werden (OSM Wiki Contributors 2015m). Kann das komplette Gebäude nicht über eine Grundrissebene ausreichend modelliert werden, ermöglicht dieses Schema Gebäude in Einzelteile zu gliedern. Die Gliederung kann horizontal, vertikal oder als Mix aus beidem erfolgen (Abb. 4). Als Grundlage für die Modellierung dient ein „Fußabdruck“ der das gesamte Gebäude umfasst. Innerhalb dieses Polygons werden die Grundrisse der einzelnen Gebäudeteile modelliert, dabei enthält der „Fußabdruck“ Tags die das ganze Gebäude betreffen und die Einzelteile jeweils deren spezifischen Eigenschaften. „Fußabdruck“ und Gebäudeteile werden anschließend in einer Relation mit dem Tag type=building zusammengefasst. Die BGF der Gebäudeteile wird anschließend wie bei den Einzelgebäuden bestimmt und danach zur Gesamt Brutto-Grundfläche addiert.

DQ-E 8 Flächennutzung innerhalb eines Gebäudes

Ist nur eine Grundrissebene gezeichnet, das Gebäude enthält außer Wohnungen auch gewerblich genutzte Flächen, wird dies in OSM über einen POI innerhalb des Gebäudepolygons veranschaulicht. Hier kann dann über den Key level dem POI das oder die besetzten Stockwerke zugewiesen werden (OSM Wiki Contributors 2015d). Es handelt sich um eine indirekte Angabe, da der Tag nicht direkt beim Gebäudepolygon eingetragen wird.

Ungenau wird diese Art der Angabe wenn ein Arzt oder ein Geschäft nur das halbe Geschoss nutzt und die andere Hälfte bewohnt ist. Die Angabe von Kommazahlen wie level=0,5 oder level=2,5 ist hier zwar möglich, doch könnten sich solche Angabe auf Zwischengeschosse beziehen, da die Verwendung von Dezimalzahlen in Verbindung mit dem Key level noch diskutiert wird, ist der gebrauch nicht eindeutig.

Die weitaus bessere Alternative ist es für solche Gebäude das Simple 3D Schema zu verwenden. Auf diese Weise kann sehr genau Wohnfläche zu nicht Wohnfläche abgegrenzt werden und die Information ist direkt mit dem Gebäude verknüpft.

Referenzen

ÄHNLICHE DOKUMENTE

Erst durch das Hinzutreten der Zeit als vierte Koordinate wird die drei-dimensionale Projektion zur Weltlinie, aus der auch alle übrigen Eigenschaften, wie die

Zwei Punkte, deren Koordinaten sich in genau zwei Stellen unterscheiden (Hamming-Distanz 2), können durch eine Seitenflä- chendiagonale verbunden werden, und zwei Punkte,

Dazu stellen wir uns einen langen Tisch vor, auf dem zuerst eine 3D-Pyramide der H¨ ohe n steht, dahinter eine 3D-Pyramide der H¨ ohe n − 1 und so weiter, bis am Ende ein einzelnes

bzcat downloaded.osm.bz2 | osmosis --read-xml enableDateParsing=no file=- -- bounding-box top=49.5138 left=10.9351 bottom=49.3866 right=11.201 --write-xml file=- | bzip2

Die genannte Ordnung wird in Anlage 1 durch den Studiengang Biomedizinische Technik mit dem Abschluss Bachelor of Engineering und der Regelstudienzeit von 7 Semestern

The process of computing the necessary data proved to be complex and time-consuming: Parts of the planet file are loaded into a local PostGIS database to be processed, exported,

Einstieg: Die SuS betrachten gemeinsam die Bildelemente aus M 1–M 3; alternativ kann ein „Ich sehe was, was du nicht siehst“-Ratespiel gespielt werden, um das

[r]