Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2019/2020
12.02.2020
Name: ...
Matrikelnummer: ...
Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:
• Taschenrechner (keine alphanumerische Tastatur, nicht programmierbar)
• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:
• eigenes Papier
• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen
• Lehrb¨ ucher, Verteilungstabellen
Es sind insgesamt 100 Punkte zu erreichen.
Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle f¨ unf Aufgaben enth¨ alt.
Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!
Aufgabe 1 2 3 4 5 P
erreichbare
Punkte 20 20 20 20 20 100
erreichte
Punkte
Aufgabe 1: Multiple Choice (20 Punkte)
Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.
(a) Ein linearer Zusammenhang ist gleichzeitig auch immer ein monotoner Zusammenhang, und ein monotoner Zusammenhang ist auch immer ein linearer Zusammenhang.
Richtig Falsch
WennrSp einen hohen Wert annimmt, dann nimmt auchrXY einen relativ hohen Wert an.
Dies zeigt, dass ein monotoner Zusammenhang auch gleichzeitig ein linearer Zusammen- hang ist, umgekehrt ist dies nicht der Fall.
WennrXY einen hohen Wert annimmt, dann nimmt auchrSp einen relativ hohen Wert an.
Dies zeigt, dass ein linearer Zusammenhang auch gleichzeitig ein monotoner Zusammen- hang ist, umgekehrt ist dies nicht der Fall.
Monotonie und Linearit¨at sind quasi Synonyme. Bei beiden Typen gibt es positive und negative Zusammenhangsarten, nur dass bei einem linearen Zusammenhang die Struktur genauer beschrieben wird.
(b) Qualitative Merkmale k¨onnen mithilfe von Stabdiagramm, Kreisdiagramm und Histo- gramm dargestellt werden.
Richtig Falsch
F¨ur qualitative Merkmale eignen sich Histogramme nicht, da sie dem diskreten Charakter der Merkmalsauspr¨agungen nicht gerecht werden.
F¨ur qualitative Merkmale eignen sich lediglich tabellarische Darstellungen, da die Anzahl der Merkmalsauspr¨agungen relativ klein ist und eine graphische Darstellung zu aufwendig w¨are.
F¨ur qualitative Merkmale sind die gesamten Darstellungsarten geeignet, da sie den diskre- ten Charakter der Merkmalsauspr¨agungen angemessen ber¨ucksichtigen.
(c) Eine Lorenzkurve ist immer monoton wachsend und konvex.
Richtig Falsch
Die Form einer Lorenzkurve ist abh¨angig von den Daten. Somit determinieren die Daten auch die Konvexit¨at oder Konkavit¨at der Kurve.
Eine Lorenzkurve ist immer monoton wachsend und konvex, da die kumulierte relative Merkmalssumme der geordneten Datenreihe h¨ochstens so groß sein kann wie der kumulierte Anteil der Merkmalstr¨ager.
Eine Lorenzkurve ist immer monoton wachsend und konkav, da der kumulierte Anteil der Merkmalstr¨ager der geordneten Datenreihe h¨ochstens so groß sein kann wie die kumulierte relative Merkmalssumme.
(d) Ein Boxplot kann erste Hinweise ¨uber Lage, Streuung und Schiefe einer Verteilung liefern.
Richtig Falsch
Ein Boxplot beruht auf der 5-Punkte-Zusammenfassung und liefert deshalb Informationen zu Streuung und Lage, aber nicht zur Schiefe.
Aus einem Boxplot k¨onnen in erster Linie Informationen zur Konzentration abgelesen werden.
Form, Lage und L¨ange des Boxplots und der Box erm¨oglichen einen ersten Eindruck der Parameter einer Verteilung.
(e) Die empirische Kovarianz gibt Auskunft ¨uber die St¨arke des linearen Zusammenhangs zweier Merkmale.
Richtig Falsch
Die empirische Kovarianz kann positiv oder negativ sein und gibt daher Auskunft sowohl
¨
uber die Richtung als auch ¨uber die St¨arke eines linearen Zusammenhangs.
Die empirische Kovarianz muss durch das Produkt der Standardabweichungen beider Merk- male geteilt werden, um auf die St¨arke des Zusammenhangs schließen zu k¨onnen.
Die St¨arke eines linearen Zusammenhanges kann nur mithilfe des korrigierten Kontingenz- koeffizienten bestimmt werden.
Aufgabe 2: Indexzahlen (20 Punkte)
Die Golfprofis Martin Kaymer (Spieler 1), Bubba Watson (Spieler 2) und Tiger Woods (Spieler 3) treffen sich zuf¨allig bei einer Kindergeburtstagsparty auf dem Minigolfplatz. Nach den ersten Schl¨agen stellen sie fest, dass ihnen ihr K¨onnen auf dem Golfplatz auf der Minigolfanlage (mit 10 Bahnen) nicht hilft. Die Anzahl der Schl¨age bis zum Einlochen sind in der folgenden Tabelle gegeben:
Tabelle 1: ¨Ubersicht Schl¨age
Bahn 1 2 3 4 5 6 7 8 9 10
Spieler 1 2 3 7 2 5 6 1 7 2 1 Spieler 2 7 2 3 2 4 6 5 4 2 1 Spieler 3 1 1 1 2 7 7 7 3 3 3
(a) Bubba Watsons Bruder ist Unternehmensberater von Sportanlagen. Eine Hotelkette m¨ochte eine ¨ahnliche Minigolfanlage mit mittlerem Handycap bauen lassen. Als Vergleichswer- te zieht Mr. Watson die Ergebnisse seines Bruders und seiner Kollegen heran. F¨ur eine erste Analyse von Daten wird h¨aufig ein Boxplot erstellt. Berechnen Sie die 5-Punkte- Zusammenfassung f¨ur die gegebenen Daten und stellen Sie Ihre Ergebnisse in geeigneter Form graphisch dar.(12.5 Punkte)
(b) Vergleichen Sie den Boxplot den Sie in (a) erstellt haben mit den unten dargestellten Box- plots f¨ur die enzelnen Spieler. Wie sch¨atzen Sie das K¨onnen der Golfprofis beim Minigolf ein?(3 Punkte)
1 2 3
1234567
Spieler
Anzahl Schlaege
(c) Der Modus ist ein weiteres Lagemaß der beschreibenden Statistik. Bestimmen Sie den Modus f¨ur die Schl¨age der drei Spieler. Inwiefern unterscheiden sie sich untereinander?
(4.5 Punkte)
Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.
Aufgabe 3: Empirische Dichte- und Verteilungsfunktion (20 Punkte)
Biathlon ist nach Skispringen die zweitbeliebteste Wintersportart in Deutschland. Dies liegt vor allem an der Kombination von Skifahren und Schießen. Gerade beim Skifahren erreichen die Biathleten/innen hohe Geschwindigkeiten. Tabelle 6 zeigt die durchschnittlichen Geschwin- digkeiten inkm/h von 36 Biathletinnen beim Weltcuprennen in Ruhpolding 2018.
Tabelle 2: Geschwindigkeiten in km/h von 36 Biathletinnen - Weltcup Ruhpolding 2018 Biathletin Geschwindigkeit Biathletin Geschwindigkeit Biathletin Geschwindigkeit
1 21.1964 13 23.1442 25 24.0397
2 22.3307 14 23.1919 26 24.1689
3 22.3769 15 23.2128 27 24.2055
4 22.3890 16 23.2769 28 24.2418
5 22.5282 17 23.2789 29 24.2457
6 22.5357 18 23.3281 30 24.4951
7 22.7762 19 23.5911 31 24.7131
8 22.7925 20 23.6790 32 24.8082
9 22.8031 21 23.7582 33 25.1158
10 23.0150 22 23.7802 34 25.3435
11 23.0425 23 23.8390 35 25.3635
12 23.1085 24 23.8579 36 26.3621
Quelle: https://www.biathlonworld.com, abgerufen am 24.01.2019.
(a) Ein Reporter m¨ochte sich die Verteilung der Geschwindigkeiten genauer ansehen. Ein Kollege schl¨agt ihm vor, die Geschwindigkeiten zuerst in Klassen einzuteilen. Bilden Sie die Klassen und nutzen Sie hierf¨ur die Ihnen bekannten Regeln. Die Klassenuntergrenze der kleinsten Klasse soll bei einschließlich 21 km/hliegen und die Klassenobergrenze der gr¨oßten Klasse bei kleiner als 27 km/h. Außerdem soll die Klassenbreite f¨ur alle Klassen gleich sein.(3 Punkte)
(b) Erstellen Sie mit der in (a) vorgenommenen Klasseneinteilung eine geeignete graphische Darstellung der empirischen Dichte. (6 Punkte)
(c) Zus¨atzlich zur empirischen Dichte m¨ochte der Reporter auch die empirische Verteilungs- funktion f¨ur die klassierten Daten in seinem Artikel zeigen. Hierf¨ur hat er eine andere Klasseneinteilung gew¨ahlt (siehe Tabelle 3). Stellen Sie die empirische Verteilungsfunkti- on f¨ur die klassierten Daten aus Tabelle 3 sowohl graphisch als auch formal dar. Wie hoch ist der Anteil der Biathletinnen, die eine Geschwindigkeit zwischen 22.2 und 24.3 km/h haben? Berechnen Sie den Anteil f¨ur die klassierten Daten. Was f¨allt Ihnen auf, wenn Sie den Wert mit der Urliste vergleichen.(11 Punkte)
Tabelle 3: Klasseneinteilung des Reporters Klasse [21,23) [23,25) [25,27)
nj 9 23 4
Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.
Aufgabe 4: Zusammenhangsanalyse (20 Punkte)
Die Wintersportsaison im beschaulichen Ort Fredagshyttan wird aufgrund von Schneeman- gel von Jahr zu Jahr k¨urzer. Der B¨urgermeister vermutet, dass dies auf den Klimawandel zur¨uckzuf¨uhren ist. Er interessiert sich daher f¨ur das Verhalten der Bewohner beim Energiever- brauch und hat folgende - nach Haushaltsgr¨oßen getrennte - Kontingenztafeln erstellen lassen.
In ihnen ist ersichtlich, woher die Einwohner ihren Strom beziehen und womit sie heizen.
Tabelle 4: Einpersonenhaushalte Bezug von Strom
eigene Produktion Okostrom¨ konventioneller Strom P Quelle
f¨ur Heizen
Ol¨ 0 20 200 220
Gas 0 40 200 240
Pellets 0 30 10 40
P 0 90 410 500
Tabelle 5: Zweipersonenhaushalte Bezug von Strom
eigene Produktion Okostrom¨ konventioneller Strom P Quelle
f¨ur Heizen
Ol¨ 0 20 300 320
Gas 50 60 270 380
Pellets 100 150 50 300
P 150 230 620 1000
Tabelle 6: Drei- und Mehrpersonenhaushalte Bezug von Strom
eigene Produktion Okostrom¨ konventioneller Strom P Quelle
f¨ur Heizen
Ol¨ 10 20 330 360
Gas 40 140 400 580
Pellets 200 320 40 560
P 250 480 770 1500
(a) Betrachten Sie die drei Tabellen. Vermuten Sie einen Zusammenhang zwischen der Haus- haltsgr¨oße und dem Verhalten bei der Energienutzung? Begr¨unden Sie kurz.(2 Punkte) (b) Der B¨urgermeister h¨alt die Trennung nach Haushaltsgr¨oßen nun doch f¨ur unpraktisch.
Fassen Sie die Daten zu einer Tabelle zusammen, die alle Haushalte enth¨alt. (6 Punkte) (c) Berechnen Sie in der auf der n¨achsten Seite gegebenen Vorlage, wie die unter Unabh¨angigkeit
der Merkmale erwartete Tabelle auss¨ahe. Vermuten Sie einen Zusammenhang? Begr¨unden Sie ihre Vermutung.(6 Punkte)
(d) Der χ2 Koeffizient betr¨agt 1384. Berechnen Sie den korrigierten Kontingenzkoeffizienten.
Vergleichen Sie das Ergebnis mit Ihren Vermutungen aus (a) und (c).(6 Punkte) Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.
[1-1]
Tabelle 7: Vorlage f¨ur die Berechnung der unter Unabh¨angigkeit erwarteten H¨aufigkeiten
Bezug von Strom
eigene Produktion Okostrom¨ konventioneller Strom P Quelle
f¨ur Heizen
Ol¨ 900
Gas 1200
Pellets 900
P 400 800 1800 3000
Aufgabe 5: Indexzahlen (20 Punkte)
Tiger Woods hat 4 Kinder. Sein j¨ungstes Kind hat vor einiger Zeit begonnen Golf zu spielen.
Jetzt wurde es Zeit f¨ur eine eigene Golfausr¨ustung. Er wundert sich ¨uber den Gesamtpreis der Ausr¨ustung. Er ist der Meinung, dass die Ausr¨ustungen der ¨alteren Kinder nicht so teuer waren. Zu Hause ¨uberpr¨uft er die Quittungen der Ausr¨ustungen seiner Kinder. Die Preise und Produktbeschreibungen sind in der folgenden Tabelle gegeben:
Tabelle 8: Warenkorb Golfsausr¨ustung
Bezeichnung Menge Preis ($) Menge Preis ($) Menge Preis ($) Menge Preis ($)
2010 2010 2015 2015 2018 2018 2020 2020
Schl¨agertasche 1 80 1 80 1 95 1 100
Golftrolley 0 0 1 100 1 150 1 150
Schl¨agerset 1 259 1 245 1 599 1 350
B¨alle 1 150 1 200 1 160 1 100
Bekleidung 1 500 1 250 1 395 1 650
(a) Die Preissteigerung von 2015 zu 2018 kommt Tiger Woods besonders groß vor. Er m¨ochte wissen, was er in 2015 f¨ur die Ausstattung, welche er in 2018 gekauft hat, bezahlt h¨atte.
H¨atte er Geld gespart und wenn ja, wie viel? Nachdem Sie jetzt einen Preisindex ausge- rechnet haben, betrachten Sie jetzt den jeweils anderen Preisindex und den Umsatzindex.
Welche Erkenntnis erwarten Sie und warum? (10 Punkte)
(b) Vergleichen Sie jetzt die beiden Warenk¨orbe aus 2010 und 2020 miteinander. Wie viel mehr/ weniger h¨atte Tiger Woods in 2020, wenn er die Ausstattung bereits 2010 gekauft h¨atte? Welche Probleme sind bei der Berechnung des Preisindexes aufgetreten?(5 Punkte) (c) Welche Probleme sehen Sie generell bei der Nutzung des Indexverfahrens? (5 Punkte) Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.