TECHNISCHE UNIVERSIT ¨AT DORTMUND Sommersemester 2008
FAKULT ¨AT STATISTIK 4.6.2008
Prof. Dr. G. Trenkler Blatt 8
Dipl.-Stat. M. Arnold Dipl.-Math. R. Kwiecien
Ubungen zur Vorlesung¨
Statistik IV
Aufgabe 29(2 Punkte)
Betrachten Sie nochmals den Datensatz Europa.txt aus Aufgabe 25. Stellen Sie die Werte der 27 Staaten auf den ersten beiden Hauptkomponenten in einem Streudiagramm dar und interpretieren Sie die Grafik. Erkennen Sie Zusammenh¨ange zwischen den beiden Hauptkomponenten?
Aufgabe 30
Gegeben sind zwei Populationen Π1 und Π2 mit zugeh¨origen Dichtefunktionen
f1(x) =
34(1−x2), |x| ≤1
0, sonst
und f2(x) =
12(x+ 1), |x| ≤1 0, sonst
.
a) Skizzieren Sie die beiden Dichten.
b) Bestimmen Sie die ML-Diskriminanzregel f¨ur die Zuordnung einer Beobachtungxzu Population Π1 bzw. Π2 . Wie lauten die zugeh¨origen KlassifikationsregionenR1 und R2?
c) Wie ¨andern sich R1 und R2, wenn a priori bekannt ist, dass eine Beobachtung eher aus Π1 als aus Π2 stammt?
d) Welchen Einfluss auf die Diskriminanzregel haben unterschiedliche Missklassifikationskosten (d.h. eine Zuordnung von x zu Π1, obwohl x in Wirklichkeit aus Π2 stammt, ist
”teurer“ als eine Zuordnung zu Π2, wennx aus Π1 stammt)?
Aufgabe 31
Wie aus Satz 5.1 der Vorlesung bekannt, lautet die ML-Diskriminanzregel bei multivariater Nor- malverteilung mit identischer positiv definiter Kovarianzmatrix im Fallg= 2
x7→Π1, falls a0(x−µ)>0, x7→Π2, falls a0(x−µ)<0, wobeia= Σ−1(µ1−µ2) undµ= 12(µ1+µ2).
Zeigen Sie, dass diese Diskriminanzregel
”im Erwartungswert“ richtig entscheidet, dass also gilt:
a) F¨urx aus Π1 ist E h
a0(x−µ) i
>0.
b) F¨urx aus Π2 ist E h
a0(x−µ) i
<0.
Aufgabe 32(6 Punkte)
Wahlumfragen zum Berliner Abgeordnetenhaus ergaben im letzten halben Jahr die folgenden Re- sultate:
Institut Datum CDU SPD Gr¨une FDP Linke Sonstige
Forsa 05.05. 23 28 16 8 16 9
Infratest 18.04. 25 29 16 7 17 6
Forsa 28.03. 23 26 16 8 16 11
Infratest 12.03. 23 29 16 7 18 7
Forsa 06.03. 22 28 14 8 16 12
Forsa 29.01. 25 28 15 7 15 10
Forsa 28.12. 23 28 14 7 16 12
Infratest 12.12. 23 31 16 7 15 8
Forsa 21.11. 22 30 15 7 15 11
Infratest 15.11. 25 31 16 5 16 7
Die Umfragen von Infratest dimap werden im RBB sowie der Berliner Morgenpost ver¨offentlicht;
die Ergebnisse von Forsa stehen in der Berliner Zeitung (Quelle: www.wahlumfragen.de, Zugriff vom 26.05.2008). Die Daten stehen auch unterhttp://www.statistik.uni-dortmund.de/∼arnold in der DateiBerlin.txt.
Unterstellen Sie f¨ur die Umfrageergebnisse eine multivariate Normalverteilung mit f¨ur die beiden Institute unterschiedlichen ErwartungswertvektorenµI bzw.µF sowie identischer Kovarianzmatrix Σ.
a) Sch¨atzen Sie die unbekannten ParameterµI,µF sowie Σ aus den Daten. Hat der Sch¨atzer f¨ur Σ vollen Rang? Falls nein, warum nicht?
b) Bestimmen Sie aus den Umfrageergebnissen eine Diskriminanzregel, welche die einzelnen Um- fragen jeweils einem der beiden Institute zuordnet. Falls Ihr Sch¨atzer f¨ur Σ in (a) nicht invertierbar ist, entfernen Sie eine aus Ihrer Sicht weniger wichtige Variable aus dem Datensatz.
Wenden Sie die Diskriminanzregel auf die einzelnen Umfragen an. Wieviele der Zuordnungen sind falsch?
Abgabe: Mittwoch, 11.6.2008, 8:15 Uhr, in den Briefkasten im Mathefoyer. Bitte vermerken Sie auf der Abgabe, welche ¨Ubung Sie besuchen.