L¨ osung zur 2. Klausur zu Statistik I
Prof. Dr. Claudia Becker Wintersemester 2002/03
05.04.03
Aufgabe 1 (a)
Erhobenes Merkmal: didaktische F¨ahigkeiten von Lehrern(1 Punkt)
M¨ogliche Auspr¨agungen: Werte von 1 bis 6 bzw. “sehr gut”, “gut”, “befriedigend”, “ausrei- chend”, “mangelhaft”, “ungen¨ugend”(1 Punkt)
Das Merkmal hat ordinales Skalenniveau(1 Punkt)
denn: man kann die Auspr¨agungen zwar anordnen, die Bildung von Differenzen und Quoti- enten macht aber keinen Sinn (1 Punkt)
Aufgabe 1 (b)
Der dargestellte Ausschnitt geh¨ort in den Bereich der deskriptiven Statistik.(1 Punkt) Bei der Darstellung handelt es sich um ein S¨aulendiagramm. (1 Punkt)
Andere sinnvolle Darstellungsarten in diesem Fall (qualitatives Merkmal, ordinal)
• Stabdiagramm
• Balkendiagramm
• Kreisdiagramm (zusammen 3 Punkte)
Aufgabe 1 (c)
H¨ochstens ausreichende Leistungen = Noten 4, 5, 6
⇒32% + 22% + 13% = 67% der Sch¨uler bescheinigten h¨ochstens ausreichende Leistungen, (1 Punkt)
dies sind 0.67·5000 = 3350 Sch¨uler (1 Punkt) Alternativ:
Note 4 wurde von 32% gegeben →0.32·5000 = 1600 Sch¨uler Note 5 wurde von 22% gegeben →0.12·5000 = 1100 Sch¨uler Note 6 wurde von 13% gegeben →0.13·5000 = 650 Sch¨uler (1 Punkt)
zusammen also 1600 + 1100 + 650 = 3350 Sch¨uler (1 Punkt)
Aufgabe 1 (d)
1. Die Aussage ist falsch. (1 Punkt)
Am h¨aufigsten wurde “ausreichend” vergeben (32%). (1 Punkt) 2. Die Aussage ist falsch. (1 Punkt)
Noten 1 und 2 wurden von 6% + 10% = 16% vergeben. (1 Punkt) 3. Die Aussage ist richtig. (1 Punkt)
Noten 1 bis 3 von 6% + 10% + 17% = 33% der Sch¨uler vergeben, also von weniger als 50%. (1 Punkt)
4. Die Aussage trifft nicht zu bzw. kann an Hand der Daten nicht getroffen werden (1 Punkt)
Zahlen beziehen sich auf Anzahlen von Sch¨ulern, nicht von Lehrern. (1 Punkt)
Aufgabe 2 (a):
F¨unf-Punkte-Zusammenfassung: x(1), x0.25, xmed, x0.75, x(n) (0.5 Punkte) geordnete Quadratmeterpreise:
30 32 44 47 55 61 67
⇒ x(1)= 30, x(n) =x(7) = 67 (zusammen 1 Punkt) Quartile:
p= 0.25: n·p= 7·0.25 = 1.75, nicht ganzzahlig
→ bestimme [n·p] + 1 = [1.75] + 1 = 2
⇒x0.25=x(2) (1 Punkt)
= 32 (1 Punkt)
p= 0.75 : n·p= 7·0.75 = 5.25, nicht ganzzahlig
→ bestimme [n·p] + 1 = [5.25] + 1 = 6
⇒x0.75=x(6) = 61 (1 Punkt)
alternativ: da x0.25 die 2. geordnete Beobachtung von unten, muss x0.75 die 2. geordnete Beobachtung von oben sein ⇒x0.75 = 61 (ebenfalls 1 Punkt)
Median:
es ist n= 7 ungerade ⇒xmed =x(n+1
2 ) (1 Punkt) damitxmed =x(8
2) =x(4) = 47 (1 Punkt) Insgesamt:
x(1) x0.25 xmed x0.75 x(n)
30 32 47 61 67
(0.5 Punkte)
Geeignete graphische Darstellung w¨are ein Boxplot auf Basis der F¨unf-Punkte-Zusammenfassung (1 Punkt)
Aufgabe 2 (b):
1. L¨osungsansatz: alle Pfund-Preise zun¨achst in Euro umrechnen, dann von beiden Da- tens¨atzen die arithmetischen Mittel bilden. (1 Punkt)
2. L¨osungsansatz: von beiden Datens¨atzen die arithmetischen Mittel bilden, dann den Mit- telwert aus dem zweiten Datensatz von Pfund in Euro umrechnen.(1 Punkt)
Variante 1: Rechnen auf Weg 1 Preise in Deutschland:
x= n1 Pni=1xi (0.5 Punkte)
= 17 ·336 = 48 (Euro/qm) (0.5 Punkte)
Preise in GB:
Standort i in GB 1 2 3 4 5 6 7
Preis yi in Euro/qm 1.5·42 = 63 31.5 45 46.5 31.5 55.5 63 (1 Punkt)
y= n1 Pni=1yi = 17 ·336 = 48 (Euro/qm) (0.5 Punkte)
Die mittleren Preise der ausgew¨ahlten Grundst¨ucke sind in beiden L¨andern gleich.(0.5 Punk- te)
Variante 2: Rechnen auf Weg 2 Preise in Deutschland:
x= n1 Pni=1xi (0.5 Punkte)
= 17 ·336 = 48 (Euro/qm) (0.5 Punkte) Preise in GB:
y= n1 Pni=1yi = 17 ·224 = 32 (Pfund/qm) (0.5 Punkte)
Mit Umrechung Pfund in Euro:y = 1.5·32 = 48 (Euro/qm) (1 Punkt)
Die mittleren Preise der ausgew¨ahlten Grundst¨ucke sind in beiden L¨andern gleich.(0.5 Punk- te)
Aufgabe 2 (c):
Variationskoeffizienten:
vX = seX
x , vY = seY y (1 Punkt, auch wenn nur eine der beiden Varianten da steht)
Bestimmung x,y: entweder aus (b) ¨ubernehmen oder neu ausgerechnet:
x= 48, y= 32 (1 Punkt) Standardabweichungen:
se2X = n1 Pni=1(xi−x)2 = n1 Pni=1x2i −x2 (1 Punkt, auch wenn nur eine Variante der Formel da steht)
= 17 ·17304−482 (mit Hinweis)
= 2472−2304 = 168 (1 Punkt)
⇒seX =qse2X = 12.96 (12.961481) (0.5 Punkte)
se2Y = n1 Pni=1yi2−y2
= 17 ·7640−322 (mit Hinweis)
= 1091.43−1024 = 67.43 (1091.4286 - 1024 = 67.4286) (1 Punkt)
⇒seY =qse2Y = 8.21 (8.2115772; bzw. √
67.4286 = 8.2114919) (0.5 Punkte)
Variationskoeffizienten:
vX = esxX = 12.9648 = 0.27 (12.96148148 = 0.2700308) (0.5 Punkte)
vY = esyY = 8.2132 = 0.26 (0.2565625; bzw. 8.211577232 = 0.2566117, 8.211491932 = 0.2566091) (0.5 Punkte)
Die Variabilit¨at in den beiden Datens¨atzen ist also als ungef¨ahr gleich zu beurteilen. (1 Punkt)
vist hier besonders gut geeignet, da zwei Datens¨atze zu vergleichen sind, die dasselbe messen, nur in unterschiedlichen Einheiten(1 Punkt)
und dav eine maßstabsunabh¨angige Gr¨oße ist.(1 Punkt)
Aufgabe 3 (a):
Zuordnung Lorenzkurven zu Gini-Koeffizienten:
Der Gini-Koeffizient entspricht der doppelten Fl¨ache zwischen Diagonale und Lorenzkurve (1 Punkt)
Bei Haus 2 ist diese Fl¨ache am kleinsten⇒ G1 = 0.14 zu Haus 2 (1 Punkt)
Bei Haus 3 ist die von Lorenzkurve und Diagonale umschlossene Fl¨ache ein Dreieck; bei Haus 1 ist das Bild ¨ahnlich, aber eine Spitze des Dreiecks ist abgeschnitten ⇒ Fl¨ache bei Haus 1 kleiner als bei Haus 3. (2 Punkte)
Damit: G2 = 0.57 zu Haus 1 und G3 = 0.75 zu Haus 3(2 Punkte)
Aufgabe 3 (b):
Da die Werte des Gini-Koeffizienten immer zwischen 0 und n−1n liegen, h¨angt G von der Anzahl n der Merkmalstr¨ager ab. (1 Punkt)
Damit sind die Werte vonGf¨ur unterschiedliche Anzahlen von Merkmalstr¨agern nicht direkt vergleichbar.(1 Punkt)
Stattdessen ist zum Vergleich der normierte Gini-KoeffizientG∗ zu benutzen, der Werte zwi- schen 0 und 1 annimmt, unabh¨angig von n (2 Punkte)
Es ist G∗ = n−1n ·G (1 Punkt) Hier also:
G∗A= 54 ·0.4 = 0.5, G∗B = 20001999 ·0.4 = 0.4002 (zusammen 1 Punkt)
Das heißt, die Ums¨atze konzentrieren sich zwar in ¨ahnlicher, jedoch nicht in gleicher Weise auf die Artikel. (1 Punkt)
Aufgabe 3 (c):
Maß f¨ur die absolute Konzentration ist der Index von Hirschmann/Herfindahl:
H =
n
X
i=1
xi
Pn j=1xj
!2
(1 Punkt)
Hier:Pnj=1xj = 1000; damit
H =
200 1000
2
+
125 1000
2
+
375 1000
2
+
100 1000
2
+
200 1000
2
(1 Punkt)
= 0.22+ 0.1252+ 0.3752+ 0.12+ 0.22
= 0.04 + 0.015625 + 0.140625 + 0.01 + 0.04
= 0.24625 (1 Punkt)
K¨ame ein sechster Artikel mit Umsatz 0 hinzu, w¨urde sich H nicht ¨andern (da Maß f¨ur absolute, nicht relative Konzentration). (1 Punkt)
Aufgabe 4 (a):
Siegzeit (Y) bis einschl. mehr als
10 Sek. 10 Sek.
H¨ohe (X) gering 2 7 9
¨uber
NN groß 3 3 6
5 10 15
(1/2 Punkt pro richtig erg¨anzter Zelle = 2.5 Punkte)
L¨aufer “in großer H¨ohe” und “langsam”: 3 von insgesamt 15
⇒ Anteil = 3/15 = 1/5 = 0.2 = 20% (1 Punkt)
“langsame” L¨aufer insgesamt: 10 von 15
⇒ Anteil = 10/15 = 0.67 = 67% (0.5 Punkte)
Aufgabe 4 (b):
Bedingte Verteilung der Siegzeit gegeben die H¨ohe:
fY(bj|ai) = hij/hi. (1 Punkt)
Siegzeit (Y) bis einschl. mehr als
10 Sek. 10 Sek.
gegeben H¨ohe gering 2/9 = 0.22 7/9 = 0.78 gegeben H¨ohe groß 3/6 = 0.5 3/6 = 0.5
(1/2 Punkt pro Zelle = 2 Punkte)
Inhaltlich: in geringer H¨ohe laufen mehr L¨aufer “langsam” (1 Punkt)
Formal: Die bedingten Verteilungen unterscheiden sich, es scheint einen Zusammenhang zu geben (1 Punkt)
Aufgabe 4 (c):
Unter Unabh¨angigkeit erwarteter Wert in Zelle (i, j):
eij = hi.h.j
n (1 Punkt)
Erwartete Tafel:
Siegzeit (Y) bis einschl. mehr als
10 Sek. 10 Sek.
H¨ohe (X) gering 9·515 = 3 9·1015 = 6
¨ uber
NN groß 6·515 = 2 6·1015 = 4
(1/2 Punkt pro Zelle = 2 Punkte)
χ2-Wert:
χ2 =
k
X
i=1 m
X
j=1
(hij −eij)2 eij
(1 Punkt) Damit hier:
χ2 = (2−3)2
3 + (7−6)2
6 +(3−2)2
2 +(3−4)2 4
= 1 3 +1
6 +1 2 +1
4
= 4
12+ 2 12+ 6
12+ 3 12
= 15
12 = 1.25 (2 Punkte)
Aufgabe 4 (d):
K∗ = 0.39 bedeutet, es liegt ein schwacher Zusammenhang zwischen Laufleistung und H¨ohe vor. (1 Punkt)
Aufgabe 5 (a):
Die Zufriedenheitswerte nehmen ab, je l¨anger die Fahrtdauer ist. Pendler mit l¨angeren Fahrt- dauern sind eher unzufrieden, Pendler mit k¨urzeren Fahrtdauern eher zufrieden. (1 Punkt) Die Punkte liegen von links oben nach rechts unten, die Form der Punktwolke sieht stark nach einer Gerade aus. (1 Punkt)
⇒ zu vermuten ist ein starker negativer linearer Zusammenhang.(1 Punkt)
Aufgabe 5 (b):
Korrelationskoeffizient nach Bravais-Pearson: nutze folgende Formel, die angegebene Hilfs- gr¨oßen zur Berechnung benutzt:
rXY =
Pn
i=1xi·yi−n·x·y
qPn
i=1x2i −n·x2·qPni=1yi2−n·y2
(1 Punkt) x= n1 Pni=1xi = 1582/20 (mit Hinweis) = 79.1
y= n1 Pni=1yi = 976/20 (mit Hinweis) = 48.8
(zusammen 3 Punkte; Formel, x berechnen, y berechnen) Damit
rXY = 60150−20·79.1·48.8
√147993−20·6256.81·√
62925−20·2381.44
= 60150−77201.6
√22856.8·√
15296.2 = −17051.6 151.18466·123.67781
= −0.91(−0.9119387) (1 Punkt)
Die Vermutung aus (a) wird damit best¨atigt. (1 Punkt)
Alternativ, falls (a) nicht bearbeitet: es ergibt sich ein starker negativer linearer Zusammen- hang. (ebenfalls 1 Punkt)
Aufgabe 5 (c):
Zum Beispiel
6
-
∗
∗
∗
∗
∗
∗∗
∗
∗ ∗ ∗∗∗∗ ∗
∗ ∗∗
∗∗
(2 Punkte)
Aufgabe 6 (a):
Gratifikation ja nein
zufrieden ja 50 12 62
mit
Arbeit nein 32 26 58
82 38 120
(je 0.5 f¨ur jede korrekt berechnete Zelle = 2.5 Punkte; Struktur der Tafel = 0.5 Punkte;
zusammen 3 Punkte) Alternativ:
zufrieden mit Arbeit
ja nein
ja 50 32 82
Gratifikation
nein 12 26 38
62 58 120
(ebenfalls je 0.5 f¨ur jede korrekt berechnete Zelle = 2.5 Punkte; Struktur der Tafel = 0.5 Punkte; zusammen 3 Punkte)
Aufgabe 6 (b):
Ereignisse:
G= “Gratifikation erhalten”, Z = “mit Arbeitssituation zufrieden”
26
G
32
50
12 Z
'
&
$
% '
&
$
%
(1 Punkt f¨ur die korrekte Struktur des Diagramms, 1 Punkt f¨ur die korrekte Zuordnung der Zahlen; gesamt 2 Punkte)
Aufgabe 6 (c):
1. P(keine Gratifikation) = P(GC) = 12038 = 0.32 (0.31666667) (2 Punkte: 1 f¨ur richtigen Ansatz, 1 f¨ur Ergebnis)
2.P(Gratifikation, wenn nur unter Unzufriedenen gew¨ahlt wird) = 3258 = 0.55 (0.5517241)(3 Punkte: 1 f¨ur korrekten Z¨ahler, 1 f¨ur korrekten Nenner, 1 f¨ur Ergebnis)
Aufgabe 6 (d):
P(G∩Z) = 12050 = 0.42 (0.41666667) (2 Punkte)
G∩Z = Besch¨aftigter hat eine Gratifikation erhalten und ist gleichzeitig mit der Arbeitssi- tuation zufrieden. (2 Punkte)