• Keine Ergebnisse gefunden

L¨osung zur 2. Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2010/11 30.03.2011

N/A
N/A
Protected

Academic year: 2022

Aktie "L¨osung zur 2. Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2010/11 30.03.2011"

Copied!
9
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

L¨ osung zur 2. Klausur zu Statistik I

Prof. Dr. Claudia Becker Wintersemester 2010/11

30.03.2011 Aufgabe 1 (insgesamt 18 Punkte)

1. Bei den Landtagswahlen vor 2002 hatte um 14:00 Uhr noch niemand seine Stimme abgegeben. (3 Punkte)

Richtig x Falsch Begr¨undung:

F¨ur 14:00 Uhr ist f¨ur die Jahre nach 2002 keine Wahlbeteiligung ausgewiesen.

Nur zwischen 12:00 und 14:00 Uhr wurden keine Stimmen abgegeben.

x Vor 2002 wurde die Wahlbeteiligung zum Stand 14:00 Uhr nur nicht erhoben.

2. Die mediane Wahlbeteiligung liegt fast immer zwischen 16:00 und 18:00 Uhr.

(3 Punkte) Richtig x Falsch Begr¨undung:

Der Wert von 50% Wahlbeteiligung wird fast immer um 18:00 Uhr zum ersten Mal ¨uberschritten.

Bei vier angegebenen Zeiten liegt der Median zwischen den beiden mittleren, also zwischen 14:00 und 16:00 Uhr.

x Die mediane Wahlbeteiligung zu verschiedenen Uhrzeiten ist keine sinnvoll definierte Gr¨oße.

3. Bis 12:00 Uhr gaben maximal 1/3 der Stimmberechtigten ihre Stimme ab.

(3 Punkte) Richtig x Falsch Begr¨undung:

Alle ausgewiesenen Wahlbeteiligungen f¨ur 12:00 Uhr liegen unterhalb von 1/3.

x Nicht alle ausgewiesenen Wahlbeteiligungen f¨ur 12:00 Uhr liegen unterhalb von 1/3.

Die Aussage kann anhand der Abbildung nicht beurteilt werden.

4. Unmittelbar nach der Wende war die Wahlbeteiligung am h¨ochsten. (3 Punkte) Richtig

x Falsch Begr¨undung:

x Die h¨ochste Wahlbeteiligung gab es 1998.

Unmittelbar nach der Wende betrug die Wahlbeteiligung nur 54.8%.

(2)

5. Die mittlere Wahlbeteiligung liegt bei 57.25%. (3 Punkte) Richtig

x Falsch Begr¨undung:

Das arithmetische Mittel der Wahlbeteilungen (Werte von 18:00 Uhr) betr¨agt 57.25%.

x Die Aussage ist anhand der Abbbildung nicht ¨uberpr¨ufbar, da die Anzahl der Wahlberechtigten nicht ausgewiesen wird.

Der Median der Wahlbeteiligungen (Werte von 18:00 Uhr) betr¨agt 55.65%.

6. Zwischen 16:00 und 18:00 Uhr gaben seit 1994 jeweils mehr als 10% der Wahlberech- tigten ihre Stimme ab. (3 Punkte)

x Richtig Falsch Begr¨undung:

Angegeben sind nicht die Wahlberechtigten, sondern die tats¨achlichen W¨ahler.

x Es waren jeweils von 11% bis 13%.

Es waren jeweils von 11% bis 12%.

(3)

Aufgabe 2 (insgesamt 14 Punkte) Aufgabe 2 (a): (insgesamt 6 Punkte)

Bestimmung der Mediane: gesucht xmed f¨ur Parteien A und B.

Beobachtungen ordnen(je 0.5 Punkte = insgesamt 1 Punkt):

lfd. Nr. 1 2 3 4 5 6 7 8 9 10

Partei A 340 350 360 365 375 380 395 405 430 500 Partei B 350 360 370 380 390 390 400 400 410 450 Es ist n= 10 gerade (0.5 Punkte), und f¨ur n gerade ist

xmed = 1

2 ·x(n2)+x(n2+1)

(0.5 Punkte).

Hierxmed = 12 ·x(10

2)+x(10

2+1)

= (x(5)+x(6))/2(1 Punkt).

Damit:

f¨ur Partei A istxmed = (x(5)+x(6))/2 = (375 + 380)/2 = 377.5 (0.5 Punkte), f¨ur Partei B ist xmed= (x(5)+x(6))/2 = (390 + 390)/2 = 390(0.5 Punkte).

Damit liegt f¨ur Partei B der Median gleichauf mit dem Mittelwert, f¨ur Partei A ist der Me- dian kleiner als der Mittelwert(1 Punkt). Die Ursache liegt bei Partei B in der einen relativ extremen Angabe 500, die das arithmetische Mittel nach oben beeinflusst, den Median je- doch nicht (1 Punkt).

Aufgabe 2 (b):(insgesamt 8 Punkte)

Auf dem Median beruhendes Streuungsmaß: MAD (0.5 Punkte) mit MAD =med{|xi −xmed|, i= 1, . . . , n} (0.5 Punkte).

Berechnung von MAD: bestimme |xi−xmed|

lfd. Nr. 1 2 3 4 5 6 7 8 9 10

A: x(i)−xmed −37.5 −27.5 −17.5 −12.5 −2.5 2.5 17.5 27.5 52.5 122.5 (1 P.) A: |x(i)−xmed| 37.5 27.5 17.5 12.5 2.5 2.5 17.5 27.5 52.5 122.5 (0.5 P.)

B: x(i)−xmed −40 −30 −20 −10 0 0 10 10 20 60 (1 P.)

B: |x(i)−xmed| 40 30 20 10 0 0 10 10 20 60 (0.5 P.)

|x(i)−xmed|ordnen und den Median als Mitte zwischen f¨unfter und sechster Ordnungsstatistik (analog zu (a)) dieser Werte bestimmen:

lfd. Nr. 1 2 3 4 5 6 7 8 9 10

Partei A 2.5 2.5 12.5 17.5 17.5 27.5 27.5 37.5 52.5 122.5 (0.5 Punkte)

Partei B 0 0 10 10 10 20 20 30 40 60 (0.5 Punkte)

MADA= (17.5 + 27.5)/2 = 22.5(0.5 Punkte) MADB = (10 + 20)/2 = 15 (0.5 Punkte)

Vergleich: die Vorschl¨age der Politiker von Partei A streuen st¨arker als die der Politiker von Partei B(1 Punkt). Damit sind sich die Politiker von Partei B in ihren Vorstellungen ¨ahnli- cher (1 Punkt).

(4)

Aufgabe 3:(insgesamt 15 Punkte) Aufgabe 3 (a): (insgesamt 9 Punkte)

Hilfstabellen: ben¨otigte Gr¨oßen f¨ur den Gini-Koeffizienten Sachsen-Anhalt

Partei x(q) fq uq veq

GR ¨UNE 70 906 0.25 0.25 0.0842

SPD 213 586 0.25 0.50 0.2536

DIE LINKE 234 917 0.25 0.75 0.2789

CDU 322 897 0.25 1.00 0.3833

P 842 306

(0.5 P.) (0.5 P.) (0.5 P.) (0.5 P.) Baden-W¨urttemberg

Partei x(q) fq uq veq

FDP 421 994 0.25 0.25 0.1163 GR ¨UNE 462 889 0.25 0.50 0.1275 SPD 996 207 0.25 0.75 0.2744 CDU 1 748 766 0.25 1.00 0.4818

P 3 629 856

(0.5 P.) (0.5 P.)

Bestimmung der Gini-Koeffizienten:

G=

Xk

j=1

(uj−1+uj)·vej −1 (1 Punkt)

Sachsen-Anhalt q uq−1·veq uq·veq

1 0 0.0211

2 0.0634 0.1268 Insgesamt also

3 0.1395 0.2092 G= 0.4904 + 0.7404−1 = 0.2308

4 0.2875 0.3833 (1 Punkt)

P 0.4904 0.7404

(0.5 Punkte) (0.5 Punkte)

Baden-W¨urttemberg q uq−1·veq uq·veq

1 0 0.0291

2 0.0319 0.0638 Insgesamt also

3 0.1372 0.2058 G= 0.5305 + 0.7805−1 = 0.311

4 0.3614 0.4818 (1 Punkt)

P 0.5305 0.7805

(0.5 Punkte) (0.5 Punkte)

Vergleich: die Konzentration der politischen Richtungen ist in Baden-W¨urttemberg st¨arker als in Sachsen-Anhalt (1 Punkt).

(5)

Aufgabe 3 (b):(insgesamt 4 Punkte)

Da es sich hier um die Situation einer gegebenen Urliste handelt und die Urliste in beiden F¨allen jeweils vier Objekte enth¨alt (in beiden Landtagen sind jeweils vier Parteien vertreten) (2 Punkte), bleibt die Relation der beiden Gini-Koeffizienten gleich, egal, ob jeweils der nor- mierte oder der nicht normiert Wert benutzt wird (1 Punkt). Der Vergleich der politischen Konzentration in diesen beiden Landtagen f¨allt also in beiden F¨allen gleich aus (1 Punkt).

Aufgabe 3 (c): (insgesamt 2 Punkte)

Die 50% “kleinsten” Parteien haben in Sachsen-Anhalt 33.78%(1 Punkt)der f¨ur die im Land- tag vertretenen Parteien abgegebenen Stimmen, in Baden-W¨urttemberg sind es 24.38% (1 Punkt).

(6)

Aufgabe 4:(insgesamt 18 Punkte) Aufgabe 4 (a): (insgesamt 13 Punkte)

Zwei M¨oglichkeiten: bedingte Verteilungen oder Kontingenzkoeffizient Uber bedingte Verteilungen¨ (1 Punkt):

• gemeinsame H¨aufigkeiten durch Randh¨aufigkeiten dividieren (1 Punkt) (z.B. bedingte Vtlg. der Wahlentscheidung gegeben das Alter: zeilenweise die H¨aufigkeiten im Tafelin- neren durch die Zeilensumme dividieren (1 Punkt))

• Vergleich der verschiedenen bedingten Verteilungen (1 Punkt)

• bedingte Verteilungen alle sehr ¨ahnlich: spricht eher f¨ur Unabh¨angigkeit der Merkmale (1 Punkt)

• bedingte Verteilungen deutlich verschieden: spricht eher f¨ur Abh¨angigkeit (1 Punkt) Uber Kontingenzkoeffizient¨ (1 Punkt):

• Tafel der unter Unahbh¨angigkeit erwarteten H¨aufigkeiten berechnen (1 Punkt)): f¨ur Zelle (i, j) die Randh¨aufigkeiten deri-ten Zeile und derj-ten Spalte multiplizieren und durch die Gesamth¨aufigkeit dividieren (1 Punkt)

• mit Hilfe der erwarteten H¨aufigkeiten denχ2-Koeffizienten ausrechnen (1 Punkt)

• aus χ2 den korrigierten Kontingenzkoeffizienten K ausrechnen (1 Punkt)

• Wert von K einordnen (Schema 0.2, 0.5, 0.8, 1) und St¨arke des Zusammenhangs beurteilen (1 Punkt)

• Zuordnung der St¨arken(1 Punkt)

Aufgabe 4 (b):(insgesamt 5 Punkte)

Zur Beurteilung des Zusammenhangs zwischen den beiden Merkmalen bestimme den korri- gierten Kontingenzkoeffizienten K (0.5 Punkte). Es ist

K =

q χ2

n+χ2

qM−1 M

(0.5 Punkte)

mit M = min{k, m}(0.5 Punkte).

Hier istk = 5,m = 2, daherM = 2(0.5 Punkte). Weiter ist nach Aufgabentextn= 2 088 619 (1 Punkt) und nach Aufgabentext χ2 = 24 042.37. Insgesamt ergibt sich

K =

q 24 042.37 2 088 619+24 042.37

q1 2

(0.5 P.)=

√0.0114

√0.5 =√

0.0228 = 0.1510 (0.5 P.) (ohne Zwischenrundung 0.1508651)

Einsch¨atzung des Zusammenhangs zwischen den beiden Merkmalen: da der korrigierte Kon- tingenzkoeffizient K einen Wert von K <0.2 (0.5 Punkte)) besitzt, besteht kein wesentli- cher Zusammenhang (0.5 Punkte) zwischen den Merkmalen.

(7)

Aufgabe 5:(insgesamt 18 Punkte) Aufgabe 5 (a): (insgesamt 6 Punkte)

Wenn die im Text beschriebene Zusammenhangsrichtung gilt, so folgt: hat die Partei eine hohe Stimmenzahl in der ersten Wahl, so hat sie auch eine hohe Stimmenzahl in der folgen- den Wahl; umgekehrt: hat die Partei eine niedrige Stimmenzahl in der ersten Wahl, so hat sie auch eine niedrige Stimmenzahl in der folgenden Wahl.(2 Punkte)

Anders ausgedr¨uckt: je h¨oher der Stimmenanteil in der ersten Wahl, desto h¨oher auch der Stimmenanteil in der folgenden Wahl (1 Punkt). Dies beschreibt gerade einen positiven (1 Punkt), monotonen (1 Punkt) Zusammenhang. Der Rangkorrelationskoeffizient sollte also einen hohen (unter der Annahme, dass der postulierte Zusammenhang tats¨achlich vorliegt) positiven Wert aufweisen(1 Punkt).

Aufgabe 5 (b):(insgesamt 5 Punkte)

Zwei M¨oglichkeiten, entweder nach der ursrp¨unglichen Formel

rSp =

Pn

i=1rg(xi)·rg(yi)− n·(n+1)4 2

q(Pni=1(rg(xi))2n·(n+1)4 2)·(Pni=1(rg(yi))2n·(n+1)4 2) (1 Punkt)

oder nach der vereinfachten Formel

rSp= 1− 6·Pni=1d2i

n·(n2−1), (1 Punkt) wobeidi =rg(xi)−rg(yi).

Hier anzuwenden ist die usrpr¨ungliche Formel (1 Punkt), da die vereinfachte Formel nur anwendbar ist, wenn in den Daten keine Bindungen vorliegen (1 Punkt). Der Datensatz zu den Wahlen enth¨alt aber Bindungen (1 Punkt).

Aufgabe 5 (c): (insgesamt 7 Punkte)

Berechnung von rSp mit der Langversion der Formel gem¨aß (b). Zun¨achst Bestimmung des Z¨ahlers:

Xn

i=1

rg(xi)·rg(yi) = 17·10 + 17·18 + 12·14.5 +. . .+ 11·16.5 + 15·19 + 19·4

= 170.0 + 306.0 + 174.0 + 246.5 + 42.0 + 25.0 + 7.0 + 14.0 + 42.0 + 18.0 +12.0 + 42.0 + 28.0 + 114.0 + 76.0 + 214.5 + 181.5 + 285.0 + 76.0

= 2 073.5(2 Punkte) n·(n+ 1)2

4 = 19·202

4 = 1 900 (1 Punkt)

Insgesamt hat der Z¨ahler damit den Wert 2 073.5−1 900 = 173.5 (0.5 Punkte) Nutze die angegebene Hilfsgr¨oße f¨ur den Nenner. Dann ist

(8)

Es handelt sich also zwischen den Ergebnissen einer Landtagswahl und der Folgewahl f¨ur diese Partei nur um einen schwachen positiven monotonen Zusammenhang(1.5 Punkte). Ein Schluss von den Ergebnissen einer Wahl auf den Trend bei der Folgewahl ist daher kaum sinnvoll (1 Punkt).

(9)

Aufgabe 6:(insgesamt 17 Punkte) Aufgabe 6 (a): (insgesamt 7 Punkte)

Langfristige Entwicklung: bis Mitte der 1960er-Jahre ist ein Aufw¨artstrend in den Stimmen- anteilen zu erkennen (1 Punkt), gefolgt von einer Phase der Stagnation (Stabilit¨at) bis etwa Ende der 1980er-Jahre(1 Punkt). Seit Beginn der 90er ist ein abfallender Trend zu verzeich- nen (1 Punkt).

Die Anpassung eines linearen Trends ¨uber den gesamten Zeitraum empfiehlt sich nicht (1 Punkt), da nicht ¨uber die gesamte betrachtete Zeit ein einheitlicher Trend vorliegt(1 Punkt).

F¨ur die drei identifizierten Teilphasen k¨onnte man aber jeweils eine separate lineare Trend- funktion bestimmen(1 Punkt), da die langfristige Entwicklung innerhalb dieser drei Phasen jeweils linear erscheint (1 Punkt).

Aufgabe 6 (b):(insgesamt 4 Punkte)

Wenn alle bisherigen Wahlen (ab 1991) ber¨ucksichtigt sind, dann ist der Zeitpunkt der

¨ubern¨achsten Wahl gerade t = 56 (1 Punkt). Damit ist der erwartete Stimmenanteil der SPD zu bestimmen als

−0.1979·56 + 39.999 (1 Punkt) = 28.9166 (1 Punkt)

Die SPD kann nach diesem Modell bei der ¨ubern¨achsten (Landtags-)Wahl mit rund 28.9%

der Stimmen rechnen (1 Punkt).

Aufgabe 6 (c): (insgesamt 6 Punkte)

Sinnlos wird die Prognose, die ja einen negativen Trend beschreibt (1 Punkt), sp¨atestens dann, wenn ein negativer Stimmenanteil errechnet wird (1 Punkt), da es nicht weniger als 0% der Stimmen f¨ur eine Partei geben kann(1 Punkt). Bestimme also tso, dass zum ersten Mal der prognostizierte Stimmenanteil negativ wird:

−0.1979·t+ 39.999 = 0(1 Punkt)

⇔ 39.999 = 0.1979·t

⇔ t= 39.999

0.1979 = 202.1172 (1 Punkt) Ab t= 203 (1 Punkt)wird demnach die Prognose sp¨atestens sinnlos.

Referenzen

ÄHNLICHE DOKUMENTE

Die Anbieter dieser beiden Themen stellen zusammen weniger als die Anbieter von Ratgeber- und sonstiger Literatur5. x Die Anbieter dieser beiden Themen stellen zusammen weniger als

Der Zusammenhang besteht nicht zwischen der Impfung gegen die normale Grippe und der Anzahl der Schweinegrippe-F¨alle, son- dern beispielsweise zwischen der Impfung gegen die

Da die zur Konstruktion eines Histogramms verwendeten Klassen nicht aneinanderstoßen, stoßen auch die Rechtecke nicht aneinander.. Das Kreisdiagramm wird nach dem Prinzip

x Das arithmetische Mittel darf nur f¨ur metrisch skalierte Merkmale berechnet werden, jedoch nicht f¨ur ordinal oder nominal skalierte Merkmale2. Das arithmetische Mittel darf nur

x Ein diskretes Merkmal kann sowohl stetig als auch diskret erhoben werden.. x Ein stetiges Merkmal muss stetig

sind insgesamt eher gleichm¨aßiger auf die Versichertenklassen verteilt, nicht besonders stark auf eine Klasse konzentriert (0.5 Punkte).. Alternativ: G ∗

Wenn schon kein besonders starker monotoner Zu- sammenhang vorliegt, kann man auch keinen starken linearen Zusammenhang erwarten (2 Punkte)... Er sagt hier aus, ob die er-

Eine metrische Skalierung kann in keine andere Skalierung umgewandelt werden.. Die Ordnung der Skalen von niedrig nach hoch ist nominal → metrisch