Intervallisierung der Ähnlichkeits- bzw. Distanzwerte

4.3 Die Salzburger Dialektometrie

4.3.5 Intervallisierung der Ähnlichkeits- bzw. Distanzwerte

In der aus dem paarweisen Vergleich der Ortsvektoren resultierenden Ähnlichkeits- bzw. Dis-tanzmatrix liegen zu jedem Messpunkt N – 1 dialektometrisch relevante Werte vor, die jeweils eine bestimmte Spannweite aufweisen. Die Häufigkeitsverteilung der Ähnlichkeitswerte inner-halb dieser Spannweite wird in der Dialektometrie auch als das Ähnlichkeitsprofil eines Mess-punktes bezeichnet. Zur kartographischen Darstellung dieses Ähnlichkeitsprofils (vgl. Kap.

4.3.7.2) werden die Ähnlichkeitswerte in disjunkte Wertklassen bzw. Intervalle eingeteilt.²⁷⁷ Eine auf rein subjektiv festgelegten Wertklassen basierende Intervallisierung hat dabei den gro-ßen σac̍teil, „dass Häufǐkeitsverteiluňen zu versc̍iedenen εesspunkten nur me̍r sc̍wer miteinander verglichen werden können, da sich die Bandbreite an jeweils gemessenen Werten von Punkt zu Punkt ändert“ (ɒauer β00λμ 10β). τbjektiver und praktikabler ist eine Lösung, bei der „die Wertklassenbilduň (Intervalleinteiluň) durc̍ einen mat̍ematischen Algorithmus an die statistischen Kennwerte der jeweils vorliegenden empirischen Häufigkeitsverteiluň“

gebunden wird (Goebl 1984: 93).²⁷⁸

Die Klassenanzahl kann dabei unterschiedlich eingestellt werden, wobei der visuelle Eindruck um so komplexer und das Auffinden der entsprechenden höherrangigen räumlichen Ordnungsstrukturen um so schwieriger ist, je größer die Anzahl der Wertklassen gewählt wird.

Bei der Wahl der Wertklassenzahl muss mithin die begrenzte Leistungsfähigkeit des menschli-chen Sehsinns berücksichtigt werden: Generell ist die serielle Verarbeitung von mehr als acht Farbstufen für das menschliche Auge problematisch, sodass ein wirksamer globaler Eindruck bei einer Anzahl von mehr als acht Klassen nicht mehr gewährleistet ist (Goebl 1984: 92, Bauer 2009: 103).²⁷⁹ Ein sowohl im Hinblick auf die visuelle Verarbeitung als auch im Hinblick auf den heuristischen Gehalt optimaler Karteneindruck wird meist mit einer 6-fachen Intervallein-teilung erreicht.

Bei der Wertklassenbildung kommen in der S-DM die Algorithmen MINMWMAX, MEDMW und MED zum Einsatz (vgl. Goebl 1984: 94ff.).

1) Der Algorithmus MINMWMAX basiert auf dem Minimum (diskreter Wert), dem arithmeti-schen Mittel bzw. Mittelwert (stetiger Wert)²⁸⁰ und dem Maximum (diskreter Wert) der jewei-ligen Häufigkeitsverteilung. Dabei werden die (numerischen) Spannweiten zwischen dem Mi-nimum und dem Mittelwert einerseits und dem Maximum und dem Mittelwert andererseits ge-bildet und jeweils in eine bestimmte Anzahl gleich breiter Klassen eingeteilt (Tab. 13). Der Algorithmus MINMWMAX zeichnet sich dadurch aus, dass hier vor allem die mittleren Wert-klassen stark besetzt sind, sodass die statistisch am stärksten vertretenen mittleren Ähnlich-keitsverhältnisse und damit die Übergangsräume zwischen extremen dialektalen Ähnlichkeiten (mit Messpunkten im direkten geographischen Umfeld) und extremen dialektalen Distanzen (zu Messpunkten in geographisch entfernten Gebieten) gut visualisiert werden.

277 Bei Vorliegen einer Distanzmatrix wird analog vorgegangen.

278 Das subjektive Moment manifestiert sich ̍ier „nur“ noc̍ in der Wa̍l des Intervallaľorit̍mus. Gänzlic̍ lässt es sich aufgrund des subjektiven Charakters jeder Klassifikation – die ja in Abhängigkeit vom jeweiligen For-schungsziel geschieht (vgl. Kap. 4.3.2) – einsic̍tǐerweise nic̍t „auflösen“.

279 Um Einsicht in die Detailstruktur der Ähnlichkeitsverteilungen zu erlangen, kann auch eine größere Anzahl an Wertklassen (in VDM bis zu 20) gewählt werden (Bauer 2009: 103).

280 Das arithmetische Mittel kann, muss jedoch nicht in der Häufigkeitsverteilung der Ähnlichkeitswerte vorkom-men (Bauer 2009: 103).

Wertklasse Tabelle 13. Wertklassenbildung zum AIS-Messpunkt 237 (Gromo (Lombardei), Ähnlichkeitswerte zu 250 norditalienischen Messpunkten) mittels MINMWMAX, 6-fach (nach Goebl 1984: 94, MIN = Mi-nimum, MW = arithmetisches Mittel, MAX = Maximum). Die zu beiden Seiten des Mittelwertes gele-genen Wertklassen mit der gleichen Spannweite sind mit derselben Farbe unterlegt. Die hier (und in den folgenden Tabellen) durch Addition dargestellte nochmalige Aufteilung der Messpunkte jeder Klasse in zwei Untergruppen liegt der Darstellung der Häufigkeitsverteilung im Histogramm zugrunde (s.u.).

2) Der Algorithmus MEDMW basiert ebenfalls auf dem Minimum, dem arithmetischen Mittel und dem Maximum der jeweiligen Häufigkeitsverteilung. Hier werden die zu einem Messpunkt vorhandenen Ähnlichkeitswerte, die zwischen dem Minimum und dem Mittelwert einerseits und dem Maximum und dem Mittelwert andererseits liegen, zunächst ihrer Größe nach geord-net und danach zu beiden Seiten des Mittelwertes in eine bestimmte Anzahl von Klassen ein-geteilt, die jeweils etwa dieselbe Anzahl an Werten (bzw. Messpunkten) enthalten (Tab. 14).

Die mittleren Wertklassen sind damit hier nicht stärker besetzt als die Wertklassen mit extrem niedrigen bzw. extrem hohen Ähnlichkeitswerten, sodass die zugrunde liegende Verteilung der Werte nicht zum Vorschein kommt.

Tabelle 14. Wertklassenbildung zum AIS-Messpunkt 237 (Gromo (Lombardei), Ähnlichkeitswerte zu 250 norditalienischen Messpunkten) mittels MEDMW, 6-fach (nach Goebl 1984: 95, MIN = Minimum, MW = arithmetisches Mittel, MAX = Maximum). Die zu beiden Seiten des Mittelwertes gelegenen Wertklassen mit einer jeweils etwa gleich großen Anzahl an Messpunkten sind mit derselben Farbe unterlegt.

3) Bei dem Algorithmus MED werden lediglich das Minimum und das Maximum der jeweili-gen Häufigkeitsverteilung berücksichtigt; das arithmetische Mittel spielt keine Rolle. Alle zu einem Messpunkt vorhandenen Ähnlichkeitswerte werden ihrer Größe nach sortiert und danach

zu beiden Seiten des Medians²⁸¹ in eine bestimmte Anzahl von Klassen eingeteilt, die jeweils etwa dieselbe Anzahl an Werten (bzw. Messpunkten) enthalten (Tab. 15). Auch hier wird die Dominanz der mittleren Ähnlichkeitswerte innerhalb der Gesamtverteilung nicht sichtbar.

Zudem erzeugen MEDMW und MED bei der kartographischen Visualisieruň „einen größeren Bildkonstrast bzw. einen unruhigeren Flächeneindruck“ als εIσεWεɑX (ɒauer β00λμ 10η), sodass sich letzterer zur Visualisierung einzelner Ähnlichkeitsprofile besser eignet.²⁸²

Wertklasse

Tabelle 15. Wertklassenbildung zum AIS-Messpunkt 237 (Gromo (Lombardei), Ähnlichkeitswerte zu 250 norditalienischen Messpunkten) mittels MED, 6-fach (nach Goebl 1984: 96, MIN = Minimum, MED = Median, MAX = Maximum). Die zu beiden Seiten des Medians gelegenen Wertklassen mit einer jeweils etwa gleich großen Anzahl an Messpunkten sind mit derselben Farbe unterlegt.

Auf der dialektometrischen Ähnlichkeitskarte ist die Häufigkeitsverteilung der Ähnlichkeits-werte zum jeweiligen Messpunkt in Form eines Säulendiagramms (Histogramms) dargestellt, das meist (d.h. bei einer 6-fachen Intervalleinteilung) 12 Stäbe enthält, von denen jeweils zwei (identisch eingefärbte) Stäbe eine Wertklasse repräsentieren, sodass jeder einzelne Stab die Hälfte der jeweiligen Wertklassenbreite umfasst (Goebl 1984: 97).²⁸³ Vor dem Histogramm ist die Kurve der Gaußschen Normalverteilung eingeblendet, sodass die Art der Abweichung der jeweiligen Ähnlichkeitsverteilung von dieser auf einen Blick erfasst werden kann (vgl. Abb.

12). Je nach Verteilung der Ähnlichkeitswerte können die Ähnlichkeitsprofile der Messpunkte mehr oder weniger symmetrisch ausfallen. Die Symmetrie des Ähnlichkeitsprofils eines Mess-punktes wird dadurch bestimmt, wie groß der Anteil der Ähnlichkeitswerte ist, die über bzw.

unter dem Mittelwert (MW) liegen: Je größer die Differenz zwischen den Anteilen über und unter dem Mittelwert ist, desto asymmetrischer ist das Ähnlichkeitsprofil. Häufig ist zu be-obachten, dass asymmetrische (linkslastige) Ähnlichkeitsprofile (oberes Beispiel in Abb. 12) eher in Orten auftreten, die sich in peripheren Gebieten des untersuchten geographischen Raums befinden, während symmetrische Verteilungen (unteres Beispiel in Abb. 12) meist in zentral gelegenen Orten zu finden sind (Goebl 2001: 1482).

281 Der Median bzw. Zentralwert bezeichnet in der Statistik einen (diskreten) Wert, der dadurch definiert ist, dass

„jeweils mindestens η0% der ɒeobac̍tuňen x1,…, xn einen Wertgrößer oder gleich bzw. kleiner oder gleich dem εedian anne̍men“ (Hartuň/Elpelt/Klösener β00ημ 32).

282 ɒei kartǒrap̍isc̍en Heuristika, bei denen auf die ̌esamte Ä̍nlic̍keitsmatrix (d.̍. alle σ/β ∙ (σ - 1) Werte) zurückgegriffen wird (vgl. Kap. 4.3.7.4, 4.3.7.8 und 4.3.8), kann die Verwendung von MEDMW oder MED hin-gegen zur Optimierung des visuellen Eindrucks beitragen (Bauer 2009: 105).

283 Die Höhe des Histogrammstabs ergibt sich aus dem Quotient ( ^p

d ) aus der relativen Häufigkeit (pj) der in der durch den Histogrammstab umfassten Wertklasse (j) enthaltenen Messwerte und der numerischen Breite des be-treffenden Histogrammstabs (dj), vgl. ebd.

Abbildung 12. Ähnlichkeitsprofile zu verschiedenen AIS-Messpunkten (aus der VDM-Projektdatei zum AIS, Ähnlichkeitsmaß RIWjk, Intervallalgorithmus MINMWMAX).

Oben: Ähnlichkeitsprofil zum AIS-Messpunkt 10 (Camischolas (Tujetsch), Graubünden (Schweiz)) mit zugehöriger Intervalleinteilung.

Unten: Ähnlichkeitsprofil zum AIS Messpunkt 285 (Pescarolo, Lombardei) mit zugehöriger Intervall-einteilung.

Symbolisierung: MIN = Minimum, MW = Mittelwert, MAX = Maximum.

Im Dokument Struktur und Entwicklung der dialektalen Variation in der Campania (Seite 122-125)