UNIVERSIT ¨AT DORTMUND Wintersemester 2007/2008
FACHBEREICH STATISTIK 04.12.2007
Prof. Dr. G. Trenkler Blatt 8
Dipl.-Stat. M. Arnold
Ubungen zur Vorlesung¨
Multivariate Statistik
Aufgabe 27
Zeigen Sie, dass die Klassifikationsregel f¨ur zwei Klassen bei multivariater Normalverteilung mit unterschiedlichen Kovarianzmatrizen Σ1 bzw. Σ2 eine Beobachtungxder Population Π1 zuordnet, falls
−1
2x0 Σ−11 −Σ−12 x+
µ01Σ−11 −µ02Σ−12
x−k≥ln
c(1|2) c(2|1)
π2 π1
gilt, wobei die Konstante kgegeben ist durch k= 1
2ln
det(Σ1) det(Σ2)
+1
2
µ01Σ−11 µ1−µ02Σ−12 µ2
.
Aufgabe 28
Die Zufallsvariable X sei N(µ,4)-verteilt. Falls X aus Population Π1 stammt, ist µ gleich 10;
stammtX aus Population Π2, so ist µgleich 14. Wir betrachten die Ereignisse A1 : X stammt aus Population Π1
A2 : X stammt aus Population Π2 B1 : X wird Population Π1 zugeordnet B2 : X wird Population Π2 zugeordnet
Die a-priori Wahrscheinlichkeiten seien P(A1) = P(A2) = 0,5. Die Missklassifikationskosten be- tragen c(2|1) = 5 Euro sowie c(1|2) = 10 Euro. Es ist naheliegend, X Population Π1 zuzuordnen, fallsX≤cgilt, wobei das kostenminimale cnoch bestimmt werden muss. Vervollst¨andigen Sie die folgende Tabelle:
c P(B1|A2) P(B2|A1) P(A1∩B2) P(A2∩B1) P(Fehler) erw. Kosten 10
11 12 13 14
F¨ur welchesc sind die erwarteten Kosten am geringsten? Wie hoch sind die minimalen erwarteten Kosten?
Aufgabe 29
Der Zufallsvektor X sei multivariat normalverteilt mit Erwartungsvektor µ und positiv definiter Kovarianzmatrix Σ. StammtX aus Π1, so istµ=µ1, f¨urX aus Π2 istµ=µ2. Wir betrachten die LinearkombinationY =l0X mitl= Σ−1(µ1−µ2). Zeigen Sie:
E
l0X |Π1
> 1
2l0(µ1+µ2)>E
l0X|Π2 .
Aufgabe 30
Wahlumfragen zum Berliner Abgeordnetenhaus ergaben im letzten halben Jahr die folgenden Re- sultate:
Institut Datum CDU SPD Gr¨une FDP Linke Sonstige
Infratest 15.11. 25 31 16 5 16 7
Forsa 23.10. 22 28 14 9 15 12
Infratest 11.10. 25 33 14 6 14 8
Forsa 25.09. 24 26 13 8 17 12
Infratest 12.09. 24 31 16 5 16 8
Forsa 26.08. 22 28 15 6 16 13
Forsa 27.07. 24 26 14 7 15 14
Infratest 04.07. 24 31 15 7 16 7
Forsa 01.07. 22 24 15 8 17 14
Infratest 06.06. 23 30 17 7 15 8
Forsa 28.05. 21 27 17 8 13 14
Die Umfragen von Infratest dimap werden im RBB sowie der Berliner Morgenpost ver¨offentlicht;
die Ergebnisse von Forsa stehen in der Berliner Zeitung (Quelle: www.wahlumfragen.de, Zugriff vom 14.11.2007). Die Daten stehen auch unter http://www.statistik.uni-dortmund.de/∼arnold in der DateiWahlumfragen.txt.
a) Unterstellen Sie f¨ur die Umfrageergebnisse eine multivariate Normalverteilung mit f¨ur die beiden Institute unterschiedlichen Erwartungswertvektoren µI bzw. µF sowie unterschiedlichen Kovari- anzmatrizen ΣI bzw. ΣF. Bestimmen Sie eine Diskriminanzregel bei gleichen a-priori-Wahrschein- lichkeiten und gleichen Missklassifikations-Kosten. Beachten Sie dabei, dass die Sch¨atzer f¨ur die Kovarianzmatrizen invertierbar sein m¨ussen - falls notwendig, k¨onnen Sie aus Ihrer Sicht weniger wichtige Variablen aus dem Datensatz entfernen.
b) Die j¨ungste Umfrage vom 21.11. ergab folgendes Ergebnis:
CDU SPD Gr¨une FDP Linke Sonstige
22 30 15 7 15 11
W¨ahlen Sie geeignete a-priori-Wahrscheinlichkeiten f¨ur die beiden Institute (etwa aufgrund der Zeitpunkte der bisherigen Umfragen im letzten halben Jahr, hier gibt es keine eindeutig richtige L¨osung). Entscheiden Sie anhand Ihrer Diskriminanzfunktion, ob die j¨ungste Umfrage von Infratest oder Forsa durchgef¨uhrt wurde.
Abgabebis Montag, 10.12.2007, 14:00 Uhr, in den Briefkasten im Mathefoyer.