• Keine Ergebnisse gefunden

L¨osung zur 2. Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2002/03 05.04.03

N/A
N/A
Protected

Academic year: 2022

Aktie "L¨osung zur 2. Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2002/03 05.04.03"

Copied!
11
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

L¨ osung zur 2. Klausur zu Statistik I

Prof. Dr. Claudia Becker Wintersemester 2002/03

05.04.03

Aufgabe 1 (a)

Erhobenes Merkmal: didaktische F¨ahigkeiten von Lehrern(1 Punkt)

M¨ogliche Auspr¨agungen: Werte von 1 bis 6 bzw. “sehr gut”, “gut”, “befriedigend”, “ausrei- chend”, “mangelhaft”, “ungen¨ugend”(1 Punkt)

Das Merkmal hat ordinales Skalenniveau(1 Punkt)

denn: man kann die Auspr¨agungen zwar anordnen, die Bildung von Differenzen und Quoti- enten macht aber keinen Sinn (1 Punkt)

Aufgabe 1 (b)

Der dargestellte Ausschnitt geh¨ort in den Bereich der deskriptiven Statistik.(1 Punkt) Bei der Darstellung handelt es sich um ein S¨aulendiagramm. (1 Punkt)

Andere sinnvolle Darstellungsarten in diesem Fall (qualitatives Merkmal, ordinal)

• Stabdiagramm

• Balkendiagramm

• Kreisdiagramm (zusammen 3 Punkte)

Aufgabe 1 (c)

H¨ochstens ausreichende Leistungen = Noten 4, 5, 6

⇒32% + 22% + 13% = 67% der Sch¨uler bescheinigten h¨ochstens ausreichende Leistungen, (1 Punkt)

dies sind 0.67·5000 = 3350 Sch¨uler (1 Punkt) Alternativ:

Note 4 wurde von 32% gegeben →0.32·5000 = 1600 Sch¨uler Note 5 wurde von 22% gegeben →0.12·5000 = 1100 Sch¨uler Note 6 wurde von 13% gegeben →0.13·5000 = 650 Sch¨uler (1 Punkt)

zusammen also 1600 + 1100 + 650 = 3350 Sch¨uler (1 Punkt)

(2)

Aufgabe 1 (d)

1. Die Aussage ist falsch. (1 Punkt)

Am h¨aufigsten wurde “ausreichend” vergeben (32%). (1 Punkt) 2. Die Aussage ist falsch. (1 Punkt)

Noten 1 und 2 wurden von 6% + 10% = 16% vergeben. (1 Punkt) 3. Die Aussage ist richtig. (1 Punkt)

Noten 1 bis 3 von 6% + 10% + 17% = 33% der Sch¨uler vergeben, also von weniger als 50%. (1 Punkt)

4. Die Aussage trifft nicht zu bzw. kann an Hand der Daten nicht getroffen werden (1 Punkt)

Zahlen beziehen sich auf Anzahlen von Sch¨ulern, nicht von Lehrern. (1 Punkt)

(3)

Aufgabe 2 (a):

F¨unf-Punkte-Zusammenfassung: x(1), x0.25, xmed, x0.75, x(n) (0.5 Punkte) geordnete Quadratmeterpreise:

30 32 44 47 55 61 67

⇒ x(1)= 30, x(n) =x(7) = 67 (zusammen 1 Punkt) Quartile:

p= 0.25: n·p= 7·0.25 = 1.75, nicht ganzzahlig

→ bestimme [n·p] + 1 = [1.75] + 1 = 2

⇒x0.25=x(2) (1 Punkt)

= 32 (1 Punkt)

p= 0.75 : n·p= 7·0.75 = 5.25, nicht ganzzahlig

→ bestimme [n·p] + 1 = [5.25] + 1 = 6

⇒x0.75=x(6) = 61 (1 Punkt)

alternativ: da x0.25 die 2. geordnete Beobachtung von unten, muss x0.75 die 2. geordnete Beobachtung von oben sein ⇒x0.75 = 61 (ebenfalls 1 Punkt)

Median:

es ist n= 7 ungerade ⇒xmed =x(n+1

2 ) (1 Punkt) damitxmed =x(8

2) =x(4) = 47 (1 Punkt) Insgesamt:

x(1) x0.25 xmed x0.75 x(n)

30 32 47 61 67

(0.5 Punkte)

Geeignete graphische Darstellung w¨are ein Boxplot auf Basis der F¨unf-Punkte-Zusammenfassung (1 Punkt)

Aufgabe 2 (b):

1. L¨osungsansatz: alle Pfund-Preise zun¨achst in Euro umrechnen, dann von beiden Da- tens¨atzen die arithmetischen Mittel bilden. (1 Punkt)

2. L¨osungsansatz: von beiden Datens¨atzen die arithmetischen Mittel bilden, dann den Mit- telwert aus dem zweiten Datensatz von Pfund in Euro umrechnen.(1 Punkt)

Variante 1: Rechnen auf Weg 1 Preise in Deutschland:

x= n1 Pni=1xi (0.5 Punkte)

= 17 ·336 = 48 (Euro/qm) (0.5 Punkte)

(4)

Preise in GB:

Standort i in GB 1 2 3 4 5 6 7

Preis yi in Euro/qm 1.5·42 = 63 31.5 45 46.5 31.5 55.5 63 (1 Punkt)

y= n1 Pni=1yi = 17 ·336 = 48 (Euro/qm) (0.5 Punkte)

Die mittleren Preise der ausgew¨ahlten Grundst¨ucke sind in beiden L¨andern gleich.(0.5 Punk- te)

Variante 2: Rechnen auf Weg 2 Preise in Deutschland:

x= n1 Pni=1xi (0.5 Punkte)

= 17 ·336 = 48 (Euro/qm) (0.5 Punkte) Preise in GB:

y= n1 Pni=1yi = 17 ·224 = 32 (Pfund/qm) (0.5 Punkte)

Mit Umrechung Pfund in Euro:y = 1.5·32 = 48 (Euro/qm) (1 Punkt)

Die mittleren Preise der ausgew¨ahlten Grundst¨ucke sind in beiden L¨andern gleich.(0.5 Punk- te)

Aufgabe 2 (c):

Variationskoeffizienten:

vX = seX

x , vY = seY y (1 Punkt, auch wenn nur eine der beiden Varianten da steht)

Bestimmung x,y: entweder aus (b) ¨ubernehmen oder neu ausgerechnet:

x= 48, y= 32 (1 Punkt) Standardabweichungen:

se2X = n1 Pni=1(xi−x)2 = n1 Pni=1x2i −x2 (1 Punkt, auch wenn nur eine Variante der Formel da steht)

= 17 ·17304−482 (mit Hinweis)

= 2472−2304 = 168 (1 Punkt)

⇒seX =qse2X = 12.96 (12.961481) (0.5 Punkte)

se2Y = n1 Pni=1yi2−y2

= 17 ·7640−322 (mit Hinweis)

= 1091.43−1024 = 67.43 (1091.4286 - 1024 = 67.4286) (1 Punkt)

⇒seY =qse2Y = 8.21 (8.2115772; bzw. √

67.4286 = 8.2114919) (0.5 Punkte)

(5)

Variationskoeffizienten:

vX = esxX = 12.9648 = 0.27 (12.96148148 = 0.2700308) (0.5 Punkte)

vY = esyY = 8.2132 = 0.26 (0.2565625; bzw. 8.211577232 = 0.2566117, 8.211491932 = 0.2566091) (0.5 Punkte)

Die Variabilit¨at in den beiden Datens¨atzen ist also als ungef¨ahr gleich zu beurteilen. (1 Punkt)

vist hier besonders gut geeignet, da zwei Datens¨atze zu vergleichen sind, die dasselbe messen, nur in unterschiedlichen Einheiten(1 Punkt)

und dav eine maßstabsunabh¨angige Gr¨oße ist.(1 Punkt)

(6)

Aufgabe 3 (a):

Zuordnung Lorenzkurven zu Gini-Koeffizienten:

Der Gini-Koeffizient entspricht der doppelten Fl¨ache zwischen Diagonale und Lorenzkurve (1 Punkt)

Bei Haus 2 ist diese Fl¨ache am kleinsten⇒ G1 = 0.14 zu Haus 2 (1 Punkt)

Bei Haus 3 ist die von Lorenzkurve und Diagonale umschlossene Fl¨ache ein Dreieck; bei Haus 1 ist das Bild ¨ahnlich, aber eine Spitze des Dreiecks ist abgeschnitten ⇒ Fl¨ache bei Haus 1 kleiner als bei Haus 3. (2 Punkte)

Damit: G2 = 0.57 zu Haus 1 und G3 = 0.75 zu Haus 3(2 Punkte)

Aufgabe 3 (b):

Da die Werte des Gini-Koeffizienten immer zwischen 0 und n−1n liegen, h¨angt G von der Anzahl n der Merkmalstr¨ager ab. (1 Punkt)

Damit sind die Werte vonGf¨ur unterschiedliche Anzahlen von Merkmalstr¨agern nicht direkt vergleichbar.(1 Punkt)

Stattdessen ist zum Vergleich der normierte Gini-KoeffizientG zu benutzen, der Werte zwi- schen 0 und 1 annimmt, unabh¨angig von n (2 Punkte)

Es ist G = n−1n ·G (1 Punkt) Hier also:

GA= 54 ·0.4 = 0.5, GB = 20001999 ·0.4 = 0.4002 (zusammen 1 Punkt)

Das heißt, die Ums¨atze konzentrieren sich zwar in ¨ahnlicher, jedoch nicht in gleicher Weise auf die Artikel. (1 Punkt)

Aufgabe 3 (c):

Maß f¨ur die absolute Konzentration ist der Index von Hirschmann/Herfindahl:

H =

n

X

i=1

xi

Pn j=1xj

!2

(1 Punkt)

Hier:Pnj=1xj = 1000; damit

H =

200 1000

2

+

125 1000

2

+

375 1000

2

+

100 1000

2

+

200 1000

2

(1 Punkt)

= 0.22+ 0.1252+ 0.3752+ 0.12+ 0.22

= 0.04 + 0.015625 + 0.140625 + 0.01 + 0.04

= 0.24625 (1 Punkt)

K¨ame ein sechster Artikel mit Umsatz 0 hinzu, w¨urde sich H nicht ¨andern (da Maß f¨ur absolute, nicht relative Konzentration). (1 Punkt)

(7)

Aufgabe 4 (a):

Siegzeit (Y) bis einschl. mehr als

10 Sek. 10 Sek.

H¨ohe (X) gering 2 7 9

¨uber

NN groß 3 3 6

5 10 15

(1/2 Punkt pro richtig erg¨anzter Zelle = 2.5 Punkte)

L¨aufer “in großer H¨ohe” und “langsam”: 3 von insgesamt 15

⇒ Anteil = 3/15 = 1/5 = 0.2 = 20% (1 Punkt)

“langsame” L¨aufer insgesamt: 10 von 15

⇒ Anteil = 10/15 = 0.67 = 67% (0.5 Punkte)

Aufgabe 4 (b):

Bedingte Verteilung der Siegzeit gegeben die H¨ohe:

fY(bj|ai) = hij/hi. (1 Punkt)

Siegzeit (Y) bis einschl. mehr als

10 Sek. 10 Sek.

gegeben H¨ohe gering 2/9 = 0.22 7/9 = 0.78 gegeben H¨ohe groß 3/6 = 0.5 3/6 = 0.5

(1/2 Punkt pro Zelle = 2 Punkte)

Inhaltlich: in geringer H¨ohe laufen mehr L¨aufer “langsam” (1 Punkt)

Formal: Die bedingten Verteilungen unterscheiden sich, es scheint einen Zusammenhang zu geben (1 Punkt)

(8)

Aufgabe 4 (c):

Unter Unabh¨angigkeit erwarteter Wert in Zelle (i, j):

eij = hi.h.j

n (1 Punkt)

Erwartete Tafel:

Siegzeit (Y) bis einschl. mehr als

10 Sek. 10 Sek.

H¨ohe (X) gering 9·515 = 3 9·1015 = 6

¨ uber

NN groß 6·515 = 2 6·1015 = 4

(1/2 Punkt pro Zelle = 2 Punkte)

χ2-Wert:

χ2 =

k

X

i=1 m

X

j=1

(hij −eij)2 eij

(1 Punkt) Damit hier:

χ2 = (2−3)2

3 + (7−6)2

6 +(3−2)2

2 +(3−4)2 4

= 1 3 +1

6 +1 2 +1

4

= 4

12+ 2 12+ 6

12+ 3 12

= 15

12 = 1.25 (2 Punkte)

Aufgabe 4 (d):

K = 0.39 bedeutet, es liegt ein schwacher Zusammenhang zwischen Laufleistung und H¨ohe vor. (1 Punkt)

(9)

Aufgabe 5 (a):

Die Zufriedenheitswerte nehmen ab, je l¨anger die Fahrtdauer ist. Pendler mit l¨angeren Fahrt- dauern sind eher unzufrieden, Pendler mit k¨urzeren Fahrtdauern eher zufrieden. (1 Punkt) Die Punkte liegen von links oben nach rechts unten, die Form der Punktwolke sieht stark nach einer Gerade aus. (1 Punkt)

⇒ zu vermuten ist ein starker negativer linearer Zusammenhang.(1 Punkt)

Aufgabe 5 (b):

Korrelationskoeffizient nach Bravais-Pearson: nutze folgende Formel, die angegebene Hilfs- gr¨oßen zur Berechnung benutzt:

rXY =

Pn

i=1xi·yi−n·x·y

qPn

i=1x2i −n·x2·qPni=1yi2−n·y2

(1 Punkt) x= n1 Pni=1xi = 1582/20 (mit Hinweis) = 79.1

y= n1 Pni=1yi = 976/20 (mit Hinweis) = 48.8

(zusammen 3 Punkte; Formel, x berechnen, y berechnen) Damit

rXY = 60150−20·79.1·48.8

√147993−20·6256.81·√

62925−20·2381.44

= 60150−77201.6

√22856.8·√

15296.2 = −17051.6 151.18466·123.67781

= −0.91(−0.9119387) (1 Punkt)

Die Vermutung aus (a) wird damit best¨atigt. (1 Punkt)

Alternativ, falls (a) nicht bearbeitet: es ergibt sich ein starker negativer linearer Zusammen- hang. (ebenfalls 1 Punkt)

Aufgabe 5 (c):

Zum Beispiel

6

-

∗∗

∗ ∗ ∗∗∗∗ ∗

∗ ∗∗

∗∗

(2 Punkte)

(10)

Aufgabe 6 (a):

Gratifikation ja nein

zufrieden ja 50 12 62

mit

Arbeit nein 32 26 58

82 38 120

(je 0.5 f¨ur jede korrekt berechnete Zelle = 2.5 Punkte; Struktur der Tafel = 0.5 Punkte;

zusammen 3 Punkte) Alternativ:

zufrieden mit Arbeit

ja nein

ja 50 32 82

Gratifikation

nein 12 26 38

62 58 120

(ebenfalls je 0.5 f¨ur jede korrekt berechnete Zelle = 2.5 Punkte; Struktur der Tafel = 0.5 Punkte; zusammen 3 Punkte)

Aufgabe 6 (b):

Ereignisse:

G= “Gratifikation erhalten”, Z = “mit Arbeitssituation zufrieden”

26

G

32

50

12 Z

'

&

$

% '

&

$

%

(1 Punkt f¨ur die korrekte Struktur des Diagramms, 1 Punkt f¨ur die korrekte Zuordnung der Zahlen; gesamt 2 Punkte)

(11)

Aufgabe 6 (c):

1. P(keine Gratifikation) = P(GC) = 12038 = 0.32 (0.31666667) (2 Punkte: 1 f¨ur richtigen Ansatz, 1 f¨ur Ergebnis)

2.P(Gratifikation, wenn nur unter Unzufriedenen gew¨ahlt wird) = 3258 = 0.55 (0.5517241)(3 Punkte: 1 f¨ur korrekten Z¨ahler, 1 f¨ur korrekten Nenner, 1 f¨ur Ergebnis)

Aufgabe 6 (d):

P(G∩Z) = 12050 = 0.42 (0.41666667) (2 Punkte)

G∩Z = Besch¨aftigter hat eine Gratifikation erhalten und ist gleichzeitig mit der Arbeitssi- tuation zufrieden. (2 Punkte)

Referenzen

ÄHNLICHE DOKUMENTE

x Das arithmetische Mittel darf nur f¨ur metrisch skalierte Merkmale berechnet werden, jedoch nicht f¨ur ordinal oder nominal skalierte Merkmale2. Das arithmetische Mittel darf nur

x Ein diskretes Merkmal kann sowohl stetig als auch diskret erhoben werden.. x Ein stetiges Merkmal muss stetig

sind insgesamt eher gleichm¨aßiger auf die Versichertenklassen verteilt, nicht besonders stark auf eine Klasse konzentriert (0.5 Punkte).. Alternativ: G ∗

Wenn schon kein besonders starker monotoner Zu- sammenhang vorliegt, kann man auch keinen starken linearen Zusammenhang erwarten (2 Punkte)... Er sagt hier aus, ob die er-

Eine metrische Skalierung kann in keine andere Skalierung umgewandelt werden.. Die Ordnung der Skalen von niedrig nach hoch ist nominal → metrisch

Lehrstuhl 3 besch¨aftigt einen “Scheinarbeiter”, so dass sich der Wert des Herfindahl-Index im Vergleich zu Lehrstuhl 2 nicht ¨andert (Eigenschaft von H als absolutes

Das Prinzip der L¨angentreue wurde nicht eingehalten (S¨aulen zu Antwort 5 f¨ur beide Politiker gleich hoch, obwohl bei Politiker 1 dort 45 Stimmen, f¨ur Politiker 2 aber 61 Stimmen)

32 Besch¨ aftigte erhielten eine Gratifikation, waren aber gleichzeitig mit ihrer Arbeitssituation nicht zufrieden. (a) Stellen Sie die genannten H¨ aufigkeiten in einer 2