Klausur zu Grundz¨ uge der Statistik: Statistik I Prof. Dr. Claudia Becker
Wintersemester 2002/03 05.04.2003
Name: ...
Matrikelnummer: ...
Erlaubte Hilfsmittel:
• Taschenrechner
• Formelsammlung ohne Beispielrechnungen in gehefteter Form (keine lo- sen Bl¨ atter)
Nicht zugelassen sind:
• eigenes Papier
• Skript, ¨ Ubungsaufgaben, alte Klausuren
• Lehrb¨ ucher
Es sind insgesamt 100 Punkte zu erreichen.
Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle sechs Aufgaben enth¨ alt.
Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!
Aufgabe 1 2 3 4 5 6 P
erreichbare
Punkte 19 23 17 16 11 14 100
erreichte Punkte
NOTE:
Die Pisa-Studie schl¨agt weiterhin Wellen. In einer großen deutschen Illustrierten findet sich der folgende Ausschnitt:
Sch¨ uler bewerten Lehrer
In einer Umfrage unter 5000 deutschen Sch¨ulern beurteilten die Befragten die didaktischen F¨ahigkeiten ihrer Lehrer an Hand von Schulnoten. Die folgende Graphik gibt die Meinungen der Sch¨uler wieder.
-
Note
1 2 3 4 5 6
6%
10%
17%
32%
22%
13%
Noten:
1 = “sehr gut”
2 = “gut”
3 = “befriedigend”
4 = “ausreichend”
5 = “mangelhaft”
6 = “ungen¨ugend”
(a) Welches Merkmal wurde hier erhoben, welche m¨oglichen Auspr¨agungen besitzt es?
Welches Skalenniveau besitzt das Merkmal? Begr¨unden Sie Ihre Antwort!
(4 Punkte)
(b) Welchem Bereich der Statistik l¨asst sich obiger Ausschnitt zuordnen, und welche Dar- stellungsart wurde gew¨ahlt? Welche anderen graphischen Darstellungsformen erschei- nen Ihnen f¨ur diese Daten sinnvoll? (5 Punkte)
(c) Wie viele Sch¨uler bescheinigten ihren Lehrern h¨ochstens ausreichende Leistungen (Note 4 oder schlechter)? (2 Punkte)
(d) Welche der folgenden Aussagen sind korrekt? Begr¨unden Sie jeweils Ihre Antwort! (8 Punkte)
1. Am h¨aufigsten bewerten die Sch¨uler ihre Lehrer mit “mangelhaft”.
2. 15% der Sch¨uler bewerten ihre Lehrer mit “gut” oder “sehr gut”.
3. Weniger als die H¨alfte der Sch¨uler bewerten die Leistung der Lehrer als “sehr gut”
bis “befriedigend”.
4. 10% der Lehrer bringen nach Ansicht der Sch¨uler eine “gute” Leistung.
Ein Konzern will f¨ur neu zu bauende Produktionsst¨atten Grundst¨ucke ankaufen. Dazu in- formiert er sich ¨uber die Quadratmeterpreise an verschiedenen Standorten in Deutschland.
Die folgende Tabelle zeigt die ermittelten Preise:
Standort i in D 1 2 3 4 5 6 7
Preis xi in Euro/qm 67 44 32 55 30 47 61
(a) Geben Sie eine F¨unf-Punkte-Zusammenfassung obiger Daten an. Welche graphische Darstellung w¨are zur Visualisierung der Verteilung der Grundst¨uckspreise geeignet? (8 Punkte)
(b) Der gleiche Konzern schaut sich auch in Großbritannien um und ermittelt die Preise f¨ur weitere potenzielle Standorte:
Standort i in GB 1 2 3 4 5 6 7
Preis yi in Pfund/qm 42 21 30 31 21 37 42
Vergleichen Sie den mittleren Quadratmeterpreis in Euro f¨ur die beiden L¨ander an Hand der arithmetischen Mittelwerte. Beachten Sie dabei, dass 1 Pfund = 1.5 Euro entspricht. Beschreiben Sie die beiden m¨oglichen L¨osungsans¨atze und rechnen Sie dann aufeinem der von Ihnen beschriebenen Wege. (5 Punkte)
(c) Vergleichen Sie die Variabilit¨at in den beiden Datens¨atzen an Hand der Variationsko- effizienten. Warum ist v hier zum Variabilit¨atsvergleich besonders gut geeignet? (10 Punkte)
Hinweis:
Geben Sie in (a), (b) und (c) jeweils zun¨achst die allgemeinen Formeln an. Nutzen Sie die folgenden Hilfsgr¨oßen:
7
X
i=1
x2i = 17304,
7
X
i=1
yi2 = 7640 Runden Sie ggf. Ihre Ergebnisse auf zwei Stellen nach dem Komma.
(a) Zum Vergleich mehrerer Warenh¨auser einer Kette wird betrachtet, wie gleichm¨aßig oder ungleichm¨aßig sich die Jahresums¨atze auf die angebotenen Artikel verteilen. Betrach- ten Sie dazu die folgenden drei Lorenzkurven und die angegebenen Gini-Koeffizienten.
Ordnen Sie die G-Werte den Lorenzkurven korrekt zu und begr¨unden Sie Ihre Zuord- nung. (6 Punkte)
- 6
Haus 1
t t t t
t t
(((((((
- 6
Haus 2
t t
t t
t t
- 6
Haus 3
t t t t t
t
((((((((((
Gini-Koeffizienten:G1 = 0.14, G2 = 0.57, G3 = 0.75.
(b) Zum entsprechenden Vergleich zweier Verkaufsh¨auser aus zwei verschiedenen Waren- hauskettenAundBbestimmen die verantwortlichen Manager ebenfalls Gini-Koeffizien- ten. Dabei hat das Verkaufshaus der Kette A einen Angebotsumfang von 5 verschie- denen Artikeln, das der Kette B ein Angebot von 2000 verschiedenen Artikeln. Der Manager von A berechnet einen Wert von GA = 0.4, der Manager von B bestimmt GB = 0.4. Die beiden kommen zu dem Schluss, dass sich die Ums¨atze bei beiden Ket- ten in gleicher Weise auf die Artikel konzentrieren. Erkl¨aren Sie, warum die Manager sich irren, welches Maß hier zum Vergleich der beiden Ketten angebracht ist, und be- stimmen Sie das entsprechende Maß f¨urA und B. Wie sieht der Vergleich nun aus? (7 Punkte)
(c) Die Warenhauskette A interessiert sich nun zus¨atzlich f¨ur die absolute Konzentration des Gesamtumsatzes. Die Ums¨atze (in 1000 Euro) f¨ur die f¨unf Artikel sind:
Artikel 1 2 3 4 5
Umsatz 200 125 375 100 200
Welches Konzentrationsmaß ist hier angebracht? Bestimmen Sie den entstprechenden Wert! Wie w¨urde dieser Wert sich ¨andern, wenn ein sechster Artikel im Angebot hin- zuk¨ame, der aber keinen Umsatz einbringt? (4 Punkte)
Hinweis:
Geben Sie in (b) und (c) zun¨achst die allgemeine Formel an.
Bei den olympischen Spielen der Jahre 1932 - 1996 (insgesamt gab es in diesem Zeitraum 15-mal olympische Spiele) lagen die Siegzeiten im 100m-Lauf der M¨anner immer zwischen 9 und 11 Sekunden. Die “schnelleren” L¨aufer brauchten f¨ur die Strecke h¨ochstens 10 Sekunden, die “langsameren” mehr als 10 Sekunden. Es wird vermutet, dass die geographische Lage der Austragungsorte einen Einfluss auf die Leistung der L¨aufer hat. Insbesondere nimmt man an, dass die H¨ohe ¨uber dem Meeresspiegel eine Rolle spielt. In der folgenden Kontingenztafel ist zusammengestellt, wieviele “schnelle” und “langsame” L¨aufer es in großer und geringer H¨ohe gab.
Siegzeit (Y) bis einschl. mehr als
10 Sek. 10 Sek.
H¨ohe (X) gering 7 9
¨ uber
NN groß 3
15
(a) Leider sind beim ¨Ubertragen der Daten einige Werte verloren gegangen. Rekonstruieren Sie die Tafel (in absoluten H¨aufigkeiten). Wieviel Prozent aller L¨aufer liefen in großer H¨ohe und waren dabei eher “langsam”? Wieviel Prozent aller L¨aufer waren insgesamt eher “langsam”? (4 Punkte)
(b) Berechnen Sie die bedingten Verteilungen der Siegzeit gegeben die H¨ohe des Austra- gungsortes. Gibt es einen Zusammenhang? Wie interpretieren Sie die Resultate inhalt- lich? (5 Punkte)
(c) Geben Sie die Tafel mit den unter Unabh¨angigkeit erwarteten H¨aufigkeiten an und be- rechnen Sie denχ2-Wert. Geben Sie dabei den vollst¨andigen Rechenweg an. (6 Punkte) (d) Aus dem χ2-Wert errechnet sich der korrigierte KontingenzkoeffizientK∗ hier zuK∗ = 0.39. Welche Aussage k¨onnen Sie hieraus ¨uber den Zusammenhang zwischen Lauflei- stung und H¨ohe des Ortes treffen? (1 Punkt)
Hinweis:
Geben Sie in (b) und (c) jeweils zun¨achst die allgemeinen Formeln an.
Runden Sie gegebenenfalls Ihre Ergebnisse auf zwei Nachkommastellen.
Bei einer Fahrgastbefragung der Deutschen Bahn wird u.a. die ZufriedenheitY der Fahrg¨aste erhoben, wobei Werte zwischen 0% (v¨ollig unzufrieden) und 100% (v¨ollig zufrieden) angege- ben werden k¨onnen. Zus¨atzlich wird nach der t¨aglichen Fahrtdauer (X) zur Arbeit gefragt.
Das folgende Steudiagramm gibt die Werte f¨ur 20 Personen wieder.
6
Zufriedenheit
- Fahrtdauer 100%
0%
50%
150 min
0 30 60 90 120
∗
∗∗
∗
∗ ∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗∗
(a) Interpretieren Sie die Graphik inhaltlich. Was k¨onnen Sie anhand des Streudiagramms
¨
uber die Art des Zusammenhangs zwischenX und Y vermuten? (3 Punkte)
(b) Berechnen Sie den Korrelationskoeffizienten von Bravais-Pearson. Verwenden Sie dabei die angegebenen Hilfsgr¨oßen. Wird Ihre Vermutung aus (a) best¨atigt? (6 Punkte) (c) Skizzieren Sie ein Streudiagramm, das einen negativ-monotonen, aber nicht-linearen
Zusammenhang darstellt. (2 Punkte)
Hinweis:
Geben Sie in (b) zun¨achst die ben¨otigten allgemeinen Formeln an.
Nutzen Sie folgende Hilfsgr¨oßen bei der Berechnung:
20
X
i=1
xi = 1582,
20
X
i=1
yi = 976,
20
X
i=1
xiyi = 60150,
20
X
i=1
x2i = 147993,
20
X
i=1
yi2 = 62925 Runden Sie Ihre Ergebnisse ggf. auf zwei Nachkommastellen.
In einer Firma mit 120 Besch¨aftigten wird f¨ur besonders engagierte Mitarbeiter eine Gratifi- kation vergeben. Im letzten Jahr kamen 82 Besch¨aftigte in den Genuss dieser Anerkennung.
Von denen, die keine Gratifikation erhielten, gaben 12 an, mit ihrer Arbeitssituation zufrie- den zu sein. 32 Besch¨aftigte erhielten eine Gratifikation, waren aber gleichzeitig mit ihrer Arbeitssituation nicht zufrieden.
(a) Stellen Sie die genannten H¨aufigkeiten in einer 2 ×2-Kontingenztafel dar und ver- vollst¨andigen Sie diese. (3 Punkte)
(b) Bezeichnen Sie das Ereignis “Gratifikation erhalten” mit Gund das Ereignis “mit Ar- beitssituation zufrieden” mitZ, und stellen Sie den Inhalt der Kontingenztafel zus¨atz- lich als Venn-Diagramm dar. (2 Punkte)
(c) Wie groß ist die Wahrscheinlichkeit, dass
1. ein zuf¨allig ausgew¨ahlter Besch¨aftigter keine Gratifikation erhalten hat? (2 Punk- te)
2. ein unter den mit der Arbeitssituation unzufriedenen Besch¨aftigten zuf¨allig Aus- gew¨ahlter in den Genuss der Gratifikation gekommen ist? (3 Punkte)
(d) Wie groß ist P(G∩Z)? Welches Ereignis wird durch G∩Z beschrieben? (4 Punkte)