• Keine Ergebnisse gefunden

Multivariate Statistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Multivariate Statistik"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

UNIVERSIT ¨AT DORTMUND Wintersemester 2007/2008

FACHBEREICH STATISTIK 04.12.2007

Prof. Dr. G. Trenkler Blatt 8

Dipl.-Stat. M. Arnold

Ubungen zur Vorlesung¨

Multivariate Statistik

Aufgabe 27

Zeigen Sie, dass die Klassifikationsregel f¨ur zwei Klassen bei multivariater Normalverteilung mit unterschiedlichen Kovarianzmatrizen Σ1 bzw. Σ2 eine Beobachtungxder Population Π1 zuordnet, falls

−1

2x0 Σ−11 −Σ−12 x+

µ01Σ−11 −µ02Σ−12

x−k≥ln

c(1|2) c(2|1)

π2 π1

gilt, wobei die Konstante kgegeben ist durch k= 1

2ln

det(Σ1) det(Σ2)

+1

2

µ01Σ−11 µ1−µ02Σ−12 µ2

.

Aufgabe 28

Die Zufallsvariable X sei N(µ,4)-verteilt. Falls X aus Population Π1 stammt, ist µ gleich 10;

stammtX aus Population Π2, so ist µgleich 14. Wir betrachten die Ereignisse A1 : X stammt aus Population Π1

A2 : X stammt aus Population Π2 B1 : X wird Population Π1 zugeordnet B2 : X wird Population Π2 zugeordnet

Die a-priori Wahrscheinlichkeiten seien P(A1) = P(A2) = 0,5. Die Missklassifikationskosten be- tragen c(2|1) = 5 Euro sowie c(1|2) = 10 Euro. Es ist naheliegend, X Population Π1 zuzuordnen, fallsX≤cgilt, wobei das kostenminimale cnoch bestimmt werden muss. Vervollst¨andigen Sie die folgende Tabelle:

c P(B1|A2) P(B2|A1) P(A1∩B2) P(A2∩B1) P(Fehler) erw. Kosten 10

11 12 13 14

F¨ur welchesc sind die erwarteten Kosten am geringsten? Wie hoch sind die minimalen erwarteten Kosten?

(2)

Aufgabe 29

Der Zufallsvektor X sei multivariat normalverteilt mit Erwartungsvektor µ und positiv definiter Kovarianzmatrix Σ. StammtX aus Π1, so istµ=µ1, f¨urX aus Π2 istµ=µ2. Wir betrachten die LinearkombinationY =l0X mitl= Σ−11−µ2). Zeigen Sie:

E

l0X |Π1

> 1

2l012)>E

l0X|Π2 .

Aufgabe 30

Wahlumfragen zum Berliner Abgeordnetenhaus ergaben im letzten halben Jahr die folgenden Re- sultate:

Institut Datum CDU SPD Gr¨une FDP Linke Sonstige

Infratest 15.11. 25 31 16 5 16 7

Forsa 23.10. 22 28 14 9 15 12

Infratest 11.10. 25 33 14 6 14 8

Forsa 25.09. 24 26 13 8 17 12

Infratest 12.09. 24 31 16 5 16 8

Forsa 26.08. 22 28 15 6 16 13

Forsa 27.07. 24 26 14 7 15 14

Infratest 04.07. 24 31 15 7 16 7

Forsa 01.07. 22 24 15 8 17 14

Infratest 06.06. 23 30 17 7 15 8

Forsa 28.05. 21 27 17 8 13 14

Die Umfragen von Infratest dimap werden im RBB sowie der Berliner Morgenpost ver¨offentlicht;

die Ergebnisse von Forsa stehen in der Berliner Zeitung (Quelle: www.wahlumfragen.de, Zugriff vom 14.11.2007). Die Daten stehen auch unter http://www.statistik.uni-dortmund.de/∼arnold in der DateiWahlumfragen.txt.

a) Unterstellen Sie f¨ur die Umfrageergebnisse eine multivariate Normalverteilung mit f¨ur die beiden Institute unterschiedlichen Erwartungswertvektoren µI bzw. µF sowie unterschiedlichen Kovari- anzmatrizen ΣI bzw. ΣF. Bestimmen Sie eine Diskriminanzregel bei gleichen a-priori-Wahrschein- lichkeiten und gleichen Missklassifikations-Kosten. Beachten Sie dabei, dass die Sch¨atzer f¨ur die Kovarianzmatrizen invertierbar sein m¨ussen - falls notwendig, k¨onnen Sie aus Ihrer Sicht weniger wichtige Variablen aus dem Datensatz entfernen.

b) Die j¨ungste Umfrage vom 21.11. ergab folgendes Ergebnis:

CDU SPD Gr¨une FDP Linke Sonstige

22 30 15 7 15 11

W¨ahlen Sie geeignete a-priori-Wahrscheinlichkeiten f¨ur die beiden Institute (etwa aufgrund der Zeitpunkte der bisherigen Umfragen im letzten halben Jahr, hier gibt es keine eindeutig richtige L¨osung). Entscheiden Sie anhand Ihrer Diskriminanzfunktion, ob die j¨ungste Umfrage von Infratest oder Forsa durchgef¨uhrt wurde.

Abgabebis Montag, 10.12.2007, 14:00 Uhr, in den Briefkasten im Mathefoyer.

Referenzen

ÄHNLICHE DOKUMENTE

Unter http://www.statistik.uni-dortmund.de/∼arnold finden Sie zwei Datens¨atze mit nationalen Bestzeiten ¨uber die Laufdistanzen 100m, 200m, 400m, 800m, 1500m, 3000m (nur Frauen),

F¨uhren Sie f¨ur die Daten der M¨anner und Frauen jeweils zwei Haupt- komponentenanalysen durch - einmal mit den urspr¨unglichen Werten und einmal mit standardisier- ten

Im Faktormodell ist es nicht immer m¨oglich, f¨ur beliebig kleines m eine Darstellung Σ = LL 0 + Ψ zu finden, so dass die Hauptdiagonaleintr¨age von Ψ positiv sind.. Es handelt

Unter http://www.statistik.uni-dortmund.de/∼arnold befinden sich in der Datei Bankrott.txt Da- ten zu finanziellen Kennzahlen von mittlerweile insolventen Unternehmen einerseits

Bestimmen und skizzieren Sie f¨ur die folgenden vier Situationen jeweils die diskriminierende Funktion unter Normalverteilungsannahme bei gleichen Missklassifikationskosten und

(c) Ein Fehler erster Art w¨ are: Die Unterrichtsmethoden liefern eigentlich die gleichen Leistungs- indizes, aber wir kommen durch den Test zum Ergebnis, dass sie deutlich von

ANOVA untersucht Unterschiede einer abh¨ angigen Variable bei mehreren Gruppen.. MANOVA untersucht Unterschiede mehrerer abh¨ angiger

– Relativ robust gegen¨ uber Verletzung der Multivariaten Normalverteilung – Roy nicht robust gegen¨ uber heterogenen Varianz-Kovarianz Matrizen – Bei gleichen Gruppengr¨