• Keine Ergebnisse gefunden

Multivariate Statistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Multivariate Statistik"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

TECHNISCHE UNIVERSIT ¨AT DORTMUND Wintersemester 2007/2008

FAKULT ¨AT STATISTIK 18.12.2007

Prof. Dr. G. Trenkler Blatt 10

Dipl.-Stat. M. Arnold

Ubungen zur Vorlesung¨

Multivariate Statistik

Aufgabe 34

Gegeben sei folgende Distanzmatrix der vier Objekte A, B, C und D:









0 1 11 5

1 0 2 3

11 2 0 4

5 3 4 0









.

F¨uhren Sie jeweils eine Clusteranalyse durch und zeichnen Sie das Dendrogramm unter Verwendung von

a) single linkage, b) complete linkage, c) average linkage.

Aufgabe 35

Unterhttp://www.statistik.uni-dortmund.de/∼arnold finden Sie in der DateiSprachen.txtdie Zah- len 1 bis 10 in 11 europ¨aischen Sprachen. Als Merkmal f¨ur die ¨Ahnlichkeit zweier Sprachen soll die Anzahl der Zahlen dienen, die mit dem gleichen Buchstaben beginnen - die resultierende ¨Ahnlich- keitsmatrix steht in der DateiSprachen-Matrix.txt.

a) Wandeln Sie die ¨Ahnlichkeitsmatrix in eine geeignete Distanzmatrix um.

b) Clustern Sie die 11 Sprachen und zeichnen Sie das Dendrogramm bei Verwendung von single linkage.

c) Clustern Sie die 11 Sprachen und zeichnen Sie das Dendrogramm bei Verwendung von complete linkage.

d) Wieviele Cluster w¨urden Sie w¨ahlen? Wie sehen die Cluster aus?

Aufgabe 36

Mit den Methoden der Clusteranalyse k¨onnen nicht nur Objekte (Merkmalstr¨ager), sondern auch die Merkmale selbst zu Gruppen zusammengefasst werden. Ein ¨Ahnlichkeitsmaß kann dazu etwa aus dem Korrelationskoeffizienten abgeleitet werden. Zeigen Sie, dass der Stichprobenkorrelations- koeffizient der beiden bin¨aren VariablenX undY mit zugeh¨origer Vierfeldertafel

X\Y 0 1

0 a b

1 c d

gegeben ist durch

r= ad−bc

p(a+b)(a+c)(b+d)(c+d).

(2)

Aufgabe 37

Zu einem gegebenen Abstandsmaßdf¨ur einzelne Objekte (z.B. euklidischer Abstand) sei ein allge- meines AbstandsmaßDf¨ur paarweise disjunkte Cluster R,P undQ folgendermaßen definiert:

D(x, y) = d(x, y),

D(R, P ∪Q) = α1D(R, P) +α2D(R, Q) +α3|D(R, P)−D(R, Q)|.

Dabei sindα1,α2 und α3 geeignet zu w¨ahlende Gewichte.

a) Zeigen Sie, dass sich f¨ur α1 = α2 = 12 und α3 = 12 der nearest-neighbour-Abstand (single linkage) ergibt.

b) Seien die Anzahlen der Elemente von P,Q und R mit p, q und r bezeichnet. Zeigen Sie, dass sich f¨urα1= p+qp ,α2 = p+qq und α3 = 0 deraverage-linkage-Abstand ergibt.

c) F¨ur welche Gewichte α1, α2 und α3 entspricht D dem furthest-neighbour-Abstand (complete linkage)?

Abgabebis Montag, 07.01.2008, 14:00 Uhr, in den Briefkasten im Mathefoyer.

Referenzen

ÄHNLICHE DOKUMENTE

Allerdings k¨ onnen Operationen wie das An- h¨ angen an eine Liste vom Compiler opti- miert werden, wenn die alte Liste danach nicht mehr verwendet wird.. Listen k¨ onnen mit

Unter http://www.statistik.uni-dortmund.de/∼arnold finden Sie zwei Datens¨atze mit nationalen Bestzeiten ¨uber die Laufdistanzen 100m, 200m, 400m, 800m, 1500m, 3000m (nur Frauen),

F¨uhren Sie f¨ur die Daten der M¨anner und Frauen jeweils zwei Haupt- komponentenanalysen durch - einmal mit den urspr¨unglichen Werten und einmal mit standardisier- ten

Im Faktormodell ist es nicht immer m¨oglich, f¨ur beliebig kleines m eine Darstellung Σ = LL 0 + Ψ zu finden, so dass die Hauptdiagonaleintr¨age von Ψ positiv sind.. Es handelt

Unter http://www.statistik.uni-dortmund.de/∼arnold befinden sich in der Datei Bankrott.txt Da- ten zu finanziellen Kennzahlen von mittlerweile insolventen Unternehmen einerseits

a) Unterstellen Sie f¨ ur die Umfrageergebnisse eine multivariate Normalverteilung mit f¨ ur die beiden Institute unterschiedlichen Erwartungswertvektoren µ I bzw. Bestimmen Sie

Bestimmen und skizzieren Sie f¨ur die folgenden vier Situationen jeweils die diskriminierende Funktion unter Normalverteilungsannahme bei gleichen Missklassifikationskosten und

Dabei bezeichnet die erste Variable die durchschnittlich erzielte Rendite eines Managers, die zweite Variable misst auf einer aufsteigenden Skala von 1 (sehr konservativ) bis 5