L¨ osung zur 1. Klausur zu Statistik I
Prof. Dr. Claudia Becker Wintersemester 2011/12
08.02.2012 Aufgabe 1 (20 Punkte)
1. Der Median ist ein Streuungsmaß. (1 Punkt) Richtig
x Falsch
Begr¨undung: (4 Punkte)
Der Median wird im MAD benutzt, also in einem Streuungsmaß.
x Der Median ist ein Lagemaß.
Der Median ist ein Konzentrationsmaß.
Der Median ist ein Schiefemaß.
2. Zur Bestimmung einer mittleren Wachstumsrate wird das arithmetische Mittel benutzt. (1 Punkt)
Richtig x Falsch
Begr¨undung: (4 Punkte)
Wachstumsraten sind metrisch skaliert, daher ist das arithmetische Mittel ange- messen.
Wachstumsraten sind nur ordinal skaliert, daher kann das arithmetische Mittel nicht benutzt werden.
Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.
x Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische Mittel zur Anwendung.
3. Der Schiefekoeffizient nach Pearson basiert auf dem dritten Moment. (1 Punkt) x Richtig
Falsch
Begr¨undung: (4 Punkte)
x Die Formel basiert auf dritten Potenzen der Abweichungen vom Mittelwert, die auch dritte Momente heißen.
Der Schiefekoeffizient misst die Symmetrie der H¨aufigkeitsverteilung.
Man unterscheidet drei F¨alle zur Beurteilung der Schiefe (>0, = 0, <0).
Der Schiefekoeffizient hat nichts mit Momenten zu tun.
4. Ist der Schiefekoeffizient deutlich kleiner als Null, so ist die Verteilung rechtssteil.
(1 Punkt) x Richtig
Falsch
Begr¨undung: (4 Punkte)
In diesem Fall ist die Verteilung rechtsschief.
x In diesem Fall ist die Verteilung linksschief.
In diesem Fall ist die Verteilung linkssteil.
In diesem Fall ist die Verteilung symmetrisch.
Aufgabe 2 (a): (insgesamt 10 Punkte)
Gesucht: arithmetische Mittel und Varianzen f¨ur beide Hotels.
x= 1 n
n
X
i=1
xi (1 Punkt)
˜ s2 = 1
n
n
X
i=1
(xi−x)2 = 1 n
n
X
i=1
x2i −x2 (1 Punkt) Berlin:
xBerlin = 101 ·1 450 = 145 (1 Punkt)
˜
s2Berlin = 101 ·223 900−1452 = 1 365(1 Punkt) M¨unchen:
xMunchen¨ = 101 ·1 850 = 185 (1 Punkt)
˜
s2Munchen¨ = 101 ·374 100−1852 = 3 185(1 Punkt)
Im Durchschnitt liegen die ¨Ubernachtungspreise in Berlin bei 145 Euro und in M¨unchen bei 185 Euro pro Gast (1 Punkt). Somit sind die Preise f¨ur ¨Ubernachtungen in M¨unchen h¨oher als in Berlin (1 Punkt).
Bei der Interpretation der Varianzen tritt das Problem auf, dass diese nicht die gleiche Einheit wie das Merkmal haben (1 Punkt). Eine L¨osung hierf¨ur ist die Bestimmung der Standard- abweichungen (1 Punkt).
Aufgabe 2 (b): (insgesamt 6 Punkte)
Gesucht: Schwankungsbereich um x, in dem ca. 95% der Beobachtungen liegen sollten (1 Punkt).
x±2·s˜(1 Punkt)
Damit:
[165−2·51.7204; 165 + 2·51.7204] = [61.5592; 268.4408] (1 Punkt)
Zwischen 61.56 und 268.44 Euro sollten ca. 95% der ¨Ubernachtungspreise liegen (1 Punkt).
Aufgabe 2 (c): (insgesamt 4 Punkte)
Es kann daran liegen, dass nicht gen¨ugend viele Beobachtungen vorhanden sind(2 Punkte).
Es sollten > 30 f¨ur diese Regel gelten(2 Punkte).
Aufgabe 3 (a): (insgesamt 6 Punkte)
Es sollen zwei von den folgenden Maßen genannt werden:
Lagemaße (1 Punkt): zentrale Tendenz, wo liegt die Vtlg. im Wesentlichen(2 Punkte).
Streuungsmaße(1 Punkt): ¨uber welchen Bereich erstrecken sich die Beobachtungen, wie stark schwanken sie (2 Punkte).
Schiefemaße(1 Punkt): ist die Verteilung symmetrisch (2 Punkte).
Konzentrationsmaße(1 Punkt): wie sind die Merkmalsauspr¨agungen auf die Merkmalstr¨ager verteilt(2 Punkte).
Aufgabe 3 (b): (insgesamt 14 Punkte)
Lage und Streuung(4 Punkte)- ¨Ahnlichkeit im Mittel(2 Punkte)und ¨Ahnlichkeit bez¨uglich der Variabilit¨at (2 Punkte); falls im Mittel gleich, k¨onnten Streubreiten noch sehr unter- schiedlich sein(3 Punkte), falls im Mittel verschieden, k¨onnten große Streuungen die Unter- schiede verschwimmen lassen (3 Punkte).
Aufgabe 4 (a): (insgesamt 11 Punkte) Gesucht:rXY. Es ist
rXY =
Pn
i=1xi·yi−n·x·y
q(Pni=1x2i −n·x2)·q(Pni=1y2i −n·y2) (1 Punkt) Mit den angegebenen Hilfsgr¨oßen ergibt sich
x= 1 n ·
n
X
i=1
xi = 44/15 = 2.9333 (1 Punkt), y = 5.4/15 = 0.36(1 Punkt), Insgesamt also
rXY =
1
15 ·28.4−2.9333·0.36
q1
15·168−2.93332·q151 ·6.6−0.362 (1 Punkt)
= 0.8373
1.6111·0.5571
= 0.9329 (1 Punkt)
Zwischen der Anzahl energiesparender Maßnahmen und der Umsatzver¨anderung besteht ein starker (1 Punkt), positiver (1 Punkt), linearer (1 Punkt) Zusammenhang, da 0.9329 ≥ 0.8 (1 Punkt). D.h. je mehr Maßnahmen durchgef¨uhrt werden, desto h¨oher ist die Umsatz- ver¨anderung(2 Punkte).
Aufgabe 4 (b): (insgesamt 5 Punkte)
Korrelation nach Spearman(1 Punkt), da Zufriedenheit ordinal skaliert (und Umsatzver¨anderung mindestens ordinal skaliert) (2 Punkte) und monotoner Zusammenhang bestimmt wird (2 Punkte).
Aufgabe 4 (c): (insgesamt 4 Punkte)
K∗ sagt lediglich aus, ob ein Zusammenhang vorliegt (1 Punkt); trifft aber keine Aussage
¨uber die Richtung (je-desto) (1 Punkt). Somit kann man mit K∗ die Frage aus (b) nicht beantworten(2 Punkte).
Aufgabe 5 (a): (insgesamt 9 Punkte)
In der Abbildung sind eine saisonale Schwankung (1 Punkt) und einen Trend(1 Punkt) mit S¨attigung (1 Punkt)zu erkennen.
Inhaltlich bedeutet das zum einen, dass das Hotel im Sommer mehr G¨aste als im Winter hat (2 Punkte). Zum anderen ist eine positive Entwicklung in der G¨astezahl ¨uber die Jahre zu erkennen(2 Punkte), wobei im Jahr 2011 die volle Auslastung erreicht wurde und damit keine weitere Steigung m¨oglich war(2 Punkte).
Aufgabe 5 (b): (insgesamt 11 Punkte)
Gesucht: Gleitende Durchschnitte der Ordnungp= 5.
Da pungerade (1 Punkt)ist, gilt:
q= p−1
2 (1 Punkt)= 5−1
2 = 2 (1 Punkt) und
ˆ
gtp = 1 2q+ 1
q
X
j=−q
yt+j = 1
p ·(yt−q+. . .+yt+. . .+yt+q) (1 Punkt) mit t=q+ 1, . . . , T −q
t yt ˆgtp 1 3.0 2 3.1 3 2.7 2.74 4 2.5 3.10 5 2.4 3.44 6 4.8 3.86 7 4.8 4.04 8 4.8 4.18 9 3.4 3.76 10 3.1 3.40 11 2.7 12 3.0
(je 0.5 = 4 Punkte)
012345
Monat
Anzahl Übernachtungen Y (in 1000)
1 2 3 4 5 6 7 8 9 10 11 12
(2 Punkte)
Die Erkenntnisse aus (a) und (b) f¨uhren zu der Annahme, dass eine Steigung der G¨astezahl
¨uber die Kapazit¨at m¨oglich w¨are(1 Punkt).