• Keine Ergebnisse gefunden

Statistik IV

N/A
N/A
Protected

Academic year: 2022

Aktie "Statistik IV"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

TECHNISCHE UNIVERSIT ¨AT DORTMUND Sommersemester 2008

FAKULT ¨AT STATISTIK 4.6.2008

Prof. Dr. G. Trenkler Blatt 8

Dipl.-Stat. M. Arnold Dipl.-Math. R. Kwiecien

Ubungen zur Vorlesung¨

Statistik IV

Aufgabe 29(2 Punkte)

Betrachten Sie nochmals den Datensatz Europa.txt aus Aufgabe 25. Stellen Sie die Werte der 27 Staaten auf den ersten beiden Hauptkomponenten in einem Streudiagramm dar und interpretieren Sie die Grafik. Erkennen Sie Zusammenh¨ange zwischen den beiden Hauptkomponenten?

Aufgabe 30

Gegeben sind zwei Populationen Π1 und Π2 mit zugeh¨origen Dichtefunktionen

f1(x) =





34(1−x2), |x| ≤1

0, sonst

und f2(x) =





12(x+ 1), |x| ≤1 0, sonst

.

a) Skizzieren Sie die beiden Dichten.

b) Bestimmen Sie die ML-Diskriminanzregel f¨ur die Zuordnung einer Beobachtungxzu Population Π1 bzw. Π2 . Wie lauten die zugeh¨origen KlassifikationsregionenR1 und R2?

c) Wie ¨andern sich R1 und R2, wenn a priori bekannt ist, dass eine Beobachtung eher aus Π1 als aus Π2 stammt?

d) Welchen Einfluss auf die Diskriminanzregel haben unterschiedliche Missklassifikationskosten (d.h. eine Zuordnung von x zu Π1, obwohl x in Wirklichkeit aus Π2 stammt, ist

”teurer“ als eine Zuordnung zu Π2, wennx aus Π1 stammt)?

Aufgabe 31

Wie aus Satz 5.1 der Vorlesung bekannt, lautet die ML-Diskriminanzregel bei multivariater Nor- malverteilung mit identischer positiv definiter Kovarianzmatrix im Fallg= 2

x7→Π1, falls a0(x−µ)>0, x7→Π2, falls a0(x−µ)<0, wobeia= Σ−11−µ2) undµ= 121+µ2).

Zeigen Sie, dass diese Diskriminanzregel

”im Erwartungswert“ richtig entscheidet, dass also gilt:

a) F¨urx aus Π1 ist E h

a0(x−µ) i

>0.

b) F¨urx aus Π2 ist E h

a0(x−µ) i

<0.

(2)

Aufgabe 32(6 Punkte)

Wahlumfragen zum Berliner Abgeordnetenhaus ergaben im letzten halben Jahr die folgenden Re- sultate:

Institut Datum CDU SPD Gr¨une FDP Linke Sonstige

Forsa 05.05. 23 28 16 8 16 9

Infratest 18.04. 25 29 16 7 17 6

Forsa 28.03. 23 26 16 8 16 11

Infratest 12.03. 23 29 16 7 18 7

Forsa 06.03. 22 28 14 8 16 12

Forsa 29.01. 25 28 15 7 15 10

Forsa 28.12. 23 28 14 7 16 12

Infratest 12.12. 23 31 16 7 15 8

Forsa 21.11. 22 30 15 7 15 11

Infratest 15.11. 25 31 16 5 16 7

Die Umfragen von Infratest dimap werden im RBB sowie der Berliner Morgenpost ver¨offentlicht;

die Ergebnisse von Forsa stehen in der Berliner Zeitung (Quelle: www.wahlumfragen.de, Zugriff vom 26.05.2008). Die Daten stehen auch unterhttp://www.statistik.uni-dortmund.de/∼arnold in der DateiBerlin.txt.

Unterstellen Sie f¨ur die Umfrageergebnisse eine multivariate Normalverteilung mit f¨ur die beiden Institute unterschiedlichen ErwartungswertvektorenµI bzw.µF sowie identischer Kovarianzmatrix Σ.

a) Sch¨atzen Sie die unbekannten ParameterµI,µF sowie Σ aus den Daten. Hat der Sch¨atzer f¨ur Σ vollen Rang? Falls nein, warum nicht?

b) Bestimmen Sie aus den Umfrageergebnissen eine Diskriminanzregel, welche die einzelnen Um- fragen jeweils einem der beiden Institute zuordnet. Falls Ihr Sch¨atzer f¨ur Σ in (a) nicht invertierbar ist, entfernen Sie eine aus Ihrer Sicht weniger wichtige Variable aus dem Datensatz.

Wenden Sie die Diskriminanzregel auf die einzelnen Umfragen an. Wieviele der Zuordnungen sind falsch?

Abgabe: Mittwoch, 11.6.2008, 8:15 Uhr, in den Briefkasten im Mathefoyer. Bitte vermerken Sie auf der Abgabe, welche ¨Ubung Sie besuchen.

Referenzen

ÄHNLICHE DOKUMENTE

Man kann davon ausgehen, dass alle Zahlen mit gleicher Wahr- scheinlichkeit auftreten. Es handelt sich also um einen Laplaceschen

Außerdem sind sie wegen der gemachten Modellannahmen unabh¨ angig. Es ist also lediglich p zu bestimmen. Sind in der Urne θ schwarze Kugel, so ist die Wahrscheinlichkeit zuf¨ allig

(c) Ein Fehler erster Art w¨ are: Die Unterrichtsmethoden liefern eigentlich die gleichen Leistungs- indizes, aber wir kommen durch den Test zum Ergebnis, dass sie deutlich von

G 12 Pr¨ ufen Sie jeweils, ob die angegebene Funktion eine Wahrscheinlichkeitsdichte ist. Die Eintrittskarten sind un- terschiedlich teuer. Sie k¨onnen sich nicht entscheiden

F¨ur p = 0.2 wird auf der H¨ohe 0.2 eine waagerechte Linie gezeichnet, bis man auf die empirische Verteilungsfunktion trifft.. Da dies gerade bei einer Stufe der Treppe der Fall

Saison Zuschauer Zuwachsrate 1. Somit hat der neue Vorstand sein Ziel nicht erreicht... Wert in cm) und Kopfumfang (2. Wert in cm) gemessen. Jedes Segment ist mit einer der Ziffern

(a) In einer Klinik wird unter n Neugeborenen die Anzahl der Kinder ermittelt, die mit dieser Stoffwechselkrankheit auf die

Es wird angenommen, dass sich die Produktionsmenge der Arbeiter ohne klassische Hinter- grundmusik durch i.i.d.. Von den ausgew¨ahlten Arbeitern liegen uns