Dr. A. W¨unsche, Tel. 39-3186 WiSe 2019/2020
Aufgaben zur Vorlesung
Statistische Analyseverfahren
7. Ubung¨ (26. November 2019)
1. Aufgabe:
In einer Diplomarbeit wurden unter anderem sechs Regionen Deutschlands betrach- tet und f¨ur jede der Regionen eine Reihe von Merkmalen bestimmt. Das Merkmal Bevist die absolute Bev¨olkerungszahl (in tausend Einwohner) der Region, w¨ahrend das MerkmalBevOZdie Bev¨olkerungszahl (in tausend Einwohner) im Oberzentrum und das Merkmal BevUmland die Bev¨olkerungsdichte (in Einwohner je Quadrat- kilometer) im Umland angibt. Das Merkmal Luft gibt die durchschnittliche Flug- zeit zu allen 41 europ¨aischen Agglomerationsr¨aumen in Minuten an. Das Merkmal PKW gibt die durchschnittliche Pkw-Fahrzeit zu den n¨achsten drei Agglomerati- onsr¨aumen in Minuten an. Das Merkmal IC gibt die Pkw-Fahrzeit zum n¨achsten IC-Systemhalt des Kernnetzes der Bahn in Minuten an. Die folgende Tabelle zeigt die Auspr¨agungen der Merkmale in den sechs Regionen.
Region Bev BevOZ Luft PKW IC BevUmland
M¨unster 1524.8 265.4 272 79 24 223.5
Bielefeld 1596.9 323.6 285 87 23 333.9
Duisburg/Essen 2299.7 610.3 241 45 9 632.1
Bonn 864.1 303.9 220 53 11 484.7
Rhein-Main 2669.9 645.5 202 61 15 438.6
D¨usseldorf 2985.2 571.2 226 45 16 1103.9
(aus Andreas Handl und Torben Kuhlenkasper,Multivariate Analysemethoden Theorie und Praxis mit R, 3., wesentl. ¨uberarb. Aufl. 2017, Springer Spektrum)
a) Bestimmen Sie die standardisierten Merkmale.
b) Bestimmen Sie die euklidische Distanz zwischen den standardisierten Merkma- len.
2. Aufgabe:
F¨ur sechs Objekte wurde die Distanzmatrix wie folgt bestimmt:
D=
0 5 37 4 6 34
5 0 32 9 1 29
37 32 0 41 31 3 4 9 41 0 10 38 6 1 31 10 0 28 34 29 3 38 28 0
a) Rechnen Sie das Clusterverfahren Complete-Linkage (furthest neigbour) voll- st¨andig durch.
i. Zeichnen Sie das Dendrogramm. Wieviele und welche Cluster w¨urden Sie aufgrund des Dendrogrammes w¨ahlen?
ii. Bestimmen Sie die standardisierten Verschmelzungsniveaus. Wieviele und welche Cluster w¨urden Sie aufgrund der standardisierten Verschmelzungs- niveaus w¨ahlen?
b) Rechnen Sie das Clusterverfahren Average-Linkage vollst¨andig durch.
i. Zeichnen Sie das Dendrogramm. Wieviele und welche Cluster w¨urden Sie aufgrund des Dendrogrammes w¨ahlen?
ii. Bestimmen Sie die standardisierten Verschmelzungsniveaus. Wieviele und welche Cluster w¨urden Sie aufgrund der standardisierten Verschmelzungs- niveaus w¨ahlen?