• Keine Ergebnisse gefunden

4.3 Die Salzburger Dialektometrie

4.3.6 Clusteranalytische Verfahren

Neben der direkten, wertklassenbasierten Visualisierung bedient sich die Dialektometrie der multivariaten Klassifikation der in der Ähnlichkeits- bzw. Distanzmatrix enthaltenen Werte in Form clusteranalytischer Verfahren. Dabei haben sich insbesondere solche Methoden als ge-eignet erwiesen, die in der numerischen Taxonomie mit dem Sigel SAHN beschrieben werden (vgl. Sneath/Sokal 1973: 214). Das bedeutet, sie sind

sequenziell, d.h. die Objekte werden nacheinander in einem rekursiven Vorgang verarbeitet, agglomerativ, d.h. die Klassifikation geht von einer Menge separater Einheiten aus, die Schritt für Schritt zu immer größeren Clustern zusammengefügt werden, bis sich alle Objekte in einem einzigen Cluster befinden (vgl. ebd.: 202f., 208f.),

hierarchisch, d.h. die Klassen jeder Clusterstufe (Partition) r werden aus den Klassen der vo-rangehenden Partition r – 1 gebildet (vgl. Vogel 1975: 234), sodass die Anzahl der Cluster von Partition zu Partition immer mehr abnimmt284 und

284 Hierarchische Clusterverfahren haben gegenüber iterativen Clusterverfahren den Vorteil, dass die Anzahl der Klassen nicht im Vorfeld festzulegen ist, jedoch den Nachteil, dass die Zuordnung von Elementen zu Clustern nicht rückgängig gemacht werden kann, wenn sich im Laufe des Klassifikationsprozesses die Eigenschaften der Cluster ändern (vgl. Vogel 1975: 349f.).

nicht-überlappend, d.h. in jeder Partition schließen sich die Cluster gegenseitig aus, sodass je-des Element in einer Partition immer nur genau einem Cluster angehört (vgl. Sneath/Sokal 1973: 207f.).

Hierarchisch-agglomerative Verfahren gehen also von einer maximalen Anzahl an Clus-tern (d.h. so vielen ClusClus-tern wie Elementen) aus und lassen diese auf der Basis ihrer Abstände Sc̍ritt um Sc̍ritt zu ̌rößeren Clustern fusionieren. Die Klassifikation erfoľt also „von unten nac̍ oben“ (bottom-up).285 ɑls zentrale Prinzipien der Fusionieruň ̌elten dabei, dass „die Variation innerhalb eines Clusters (Intra-Group-Distanz) immer möglichst gering gehalten werden soll“ und dass „die Untersc̍iede zwisc̍en den Clustern (Inter-Group-Distanz) mit fort-sc̍reitender ɑ̌̌lomerieruň immer ̌rößer werden“ (ɒauer β00λμ 14λ). In jedem Klassifika-tionsschritt werden zunächst diejenigen zwei Cluster fusioniert, die die geringste Distanz bzw.

die größte Ähnlichkeit zueinander aufweisen (Pair-Group-Methoden).286 Nach jeder Fusion werden die Distanzen zwischen den neuen Clustern und den unveränderten Clustern mithilfe eines geeigneten Algorithmus bestimmt und eine aktualisierte Datenmatrix erstellt, die gegen-über der vorigen in ihrer Größe reduziert ist. Dann folgt der nächste Klassifikationsschritt. Die-ser Vorgang wird so lange wiederholt, bis alle Elemente einem gemeinsamen Cluster angehören (Bock 1974: 385f.).

Zur Aktualisierung der Datenmatrix können unterschiedliche Verfahren bzw. Algorith-men verwendet werden (vgl. Sneath/Sokal 1973: 218ff.). In der Salzburger Dialektometrie kommen die Verfahren Single Linkage, Complete Linkage, Average Linkage (WPGMA, UPGMA) sowie die Methode nach Ward zum Einsatz.287

1) Bei dem Verfahren Single Linkage (Nearest Neighbour oder auch Minimum Method)288 ent-spricht der Abstand zwischen zwei Clustern J und K dem Abstand zwischen den am nächsten zueinander liegenden Elementen dieser Cluster (Bock 1974: 387):289

� J, K = Min {�, } wobei j ∈ J und k ∈ K

C̍arakteristisc̍ für Siňle δinkǎe ist die Tendenz zur „Verkettuň“ von Elementen über sog.

„intermediates“, die nah beieinander am Rand zweier Cluster liegen und diese so miteinander verbinden (Vǒel 1λιημ βλκ). „ɑusreißer“, d.̍. Elemente, die zu allen übrǐen einen ̌roßen Abstand aufweisen, treten hier erst sehr spät in ein Cluster ein und können daher mit dieser Methode leicht identifiziert werden.

2) Beim Complete Linkage (Furthest Neighbour oder auch Maximum Method) entspricht der Abstand zwischen zwei Clustern J und Kdem Abstand zwischen den am weitesten voneinander entfernt liegenden Elementen beider Cluster (Bock 1974: 392):

� J, K = Max {�, } wobei j ∈ J und k ∈ K

285 Im Gegensatz zu agglomerativen Verfahren gehen divisive Verfahren von einem Gesamtcluster aus, das alle Elemente enthält und gliedern aus diesem Schritt für Schritt einzelne Elemente aus, bis die Anzahl der Cluster der Anzahl der Elemente entspricht (top-down-Verfahren, vgl. Vogel 1975: 349f.).

286 In sog. Variable Group-Methoden können hingegen auf jeder Clusterstufe mehrere Klassen miteinander fusi-oniert werden (vgl. Vogel 1975: 304).

287 Im Hinblick auf die Auswirkungen der Clusterverfahren auf den metrischen Raum spricht man nach Lance/Williams (1967) bei Single Linkage von einem kontrahierenden und bei Complete Linkage von einem dilatierenden Verfahren. Bei Average Linkage und der Methode nach Ward handelt es sich um konservierende Verfahren (vgl. Sneath/Sokal 1973: 219).

288 Vgl. Sneath/Sokal (1973: 218).

289 Die Symbolisierung weicht hier – wie in den folgenden Algorithmen – von jener der zitierten Quellen ab.

Das Verfahren hat den Vorteil, dass es die bei Single Linkage auftretende Verkettung vermei-det, da die Anforderungen für eine Fusion zweier Cluster sehr hoch sind. Es erzeugt somit kom-pakte Klassen, die einen relativ großen Abstand zueinander aufweisen (vgl. Bock 1974: 394, Sneath/Sokal 1973: 222).

3) Bei der Weighted Pair Group Method using Arithmetic Averages (WPGMA) entspricht der Abstand zwischen zwei Clustern dem Mittelwert der Abstände zwischen allen Elementen des Clusters. Bei der Berechnung des Abstands zwischen zwei Clustern werden hier die einzelnen Elemente in Abhängigkeit von ihrer internen Struktur unterschiedlich gewichtet (vgl.

Sneath/Sokal 1973: 218):

� J, K = ∑ ,, wobei j ∈ J und k ∈ K

sowie = und C die Anzahl der von j bereits durchlaufenen Clusterstufen bzw. = und C die Anzahl der von � bereits durchlaufenen Clusterstufen 4) Die Unweighted Pair Group Method using Arithmetic Averages (UPGMA) gehört zu den in der numerischen Taxonomie am häufigsten verwendeten Verfahren. Wie bei der WPGMA kommt hier ebenfalls das arithmetische Mittel zur Berechnung des Abstands zwischen zwei Clustern zum Einsatz. Im Unterschied zur WPGMA werden hier jedoch die einzelnen Elemente bzw. Cluster unabhängig von ihrer Struktur gleichberechtigt in die Berechnung des Abstands zu einem anderen Element bzw. Cluster einbezogen (vgl. Bock 1974: 402):

� J, K = � � × ∑ �, , wobei j ∈ J und k ∈ K

sowie � die Anzahl der Elemente in Cluster J und � die Anzahl der Elemente in Cluster K 5) Bei der Ward-Methode (Minimale Varianz)290 handelt es sich um ein Verfahren, das grund-sätzlich anders funktioniert als die bisher beschriebenen Algorithmen. Hier entspricht der Ab-stand zwischen zwei Clustern dem Heterogenitätszuwachs291 – Ward (1963) selbst spricht von

„Informationsverlust“, der sic̍ durc̍ eine Fusion dieser Cluster eřibt. ɒei einer Klassifikation mittels der Ward-Methode werden mithin immer diejenigen Cluster fusioniert, bei denen sich der geringste Heterogenitätszuwachs ergibt, sodass sehr homogene Klassen generiert werden.

ɑllerdiňs tendiert das Verfa̍ren dazu, „die Klassen kompakter erscheinen zu lassen als sie sind“ (Vǒel 1λιημ γβγ) und den Daten damit „eine bestimmte Struktur aufzuzwiňen“ (ebd.μ 325).

Die Darstellung des Ergebnisses einer hierarchischen Clusteranalyse erfolgt in Form eines Dendrogramms (vgl. Kap. 4.3.7.8).292 Im Allgemeinen wird angenommen, dass eine Klas-sifikation dann optimal ist, wenn sie so genau wie möglich die ursprünglichen Ähnlichkeits- bzw. Distanzverhältnisse zwischen den untersuchten τbjekten wiedeřibt („natural concept“,

290 Benannt ist diese Methode nach dem US-amerikanischen Statistiker Joe H. Ward, Jr., der sie 1963 einführte.

291 Das Maß für die Heterogenität einer Klasse K ist dabei die Fehlerquadratsumme Ek , d.̍. „die Summe der nk

quadrierten euklidisc̍en Distanzen der τbjekte einer Klasse zum Centroid dieser Klasse“ (Vǒel 1λιημ γ1η).

Zum Algorithmus vgl. ebd. sowie Bock (1974: 407f.).

292 Sneath/Sokal (1973) verwenden synonym auch den englischen Terminus phenogram.

vgl. Sneath/Sokal 1973: 278f.). Zur Ermittlung der Korrelationen zwischen einer Ähnlichkeits-matrix S bzw. der dazu komplementären DistanzÄhnlichkeits-matrix D und einem auf dieser basierenden Klassifikationsergebnis werden die Distanzen zwischen den Elementen im resultierenden Dendrogramm in kop̍enetisc̍e Werte „übersetzt“ und aus diesen eine εatrix C ̌ebildet. Über die Berechnung der Korrelation zwischen dieser Matrix und der ursprünglichen Distanzmatrix D mittels eines geeigneten kophenetischen Korrelations-Koeffizienten (meist abgekürzt als rcoph

oder rc) kann dann festgestellt werden, wie genau das Klassifikationsergebnis die ursprüngli-chen Ähnlichkeits- bzw. Distanzverhältnisse wiedergibt (vgl. ebd.).

4.3.7 Kartographische Visualisierung und Interpretation