• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2019/2020 12.02.2020

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2019/2020 12.02.2020"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2019/2020

12.02.2020

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur, nicht programmierbar)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

(a) Ein linearer Zusammenhang ist gleichzeitig auch immer ein monotoner Zusammenhang, und ein monotoner Zusammenhang ist auch immer ein linearer Zusammenhang.

Richtig Falsch

WennrSp einen hohen Wert annimmt, dann nimmt auchrXY einen relativ hohen Wert an.

Dies zeigt, dass ein monotoner Zusammenhang auch gleichzeitig ein linearer Zusammen- hang ist, umgekehrt ist dies nicht der Fall.

WennrXY einen hohen Wert annimmt, dann nimmt auchrSp einen relativ hohen Wert an.

Dies zeigt, dass ein linearer Zusammenhang auch gleichzeitig ein monotoner Zusammen- hang ist, umgekehrt ist dies nicht der Fall.

Monotonie und Linearit¨at sind quasi Synonyme. Bei beiden Typen gibt es positive und negative Zusammenhangsarten, nur dass bei einem linearen Zusammenhang die Struktur genauer beschrieben wird.

(b) Qualitative Merkmale k¨onnen mithilfe von Stabdiagramm, Kreisdiagramm und Histo- gramm dargestellt werden.

Richtig Falsch

F¨ur qualitative Merkmale eignen sich Histogramme nicht, da sie dem diskreten Charakter der Merkmalsauspr¨agungen nicht gerecht werden.

F¨ur qualitative Merkmale eignen sich lediglich tabellarische Darstellungen, da die Anzahl der Merkmalsauspr¨agungen relativ klein ist und eine graphische Darstellung zu aufwendig w¨are.

F¨ur qualitative Merkmale sind die gesamten Darstellungsarten geeignet, da sie den diskre- ten Charakter der Merkmalsauspr¨agungen angemessen ber¨ucksichtigen.

(c) Eine Lorenzkurve ist immer monoton wachsend und konvex.

Richtig Falsch

Die Form einer Lorenzkurve ist abh¨angig von den Daten. Somit determinieren die Daten auch die Konvexit¨at oder Konkavit¨at der Kurve.

Eine Lorenzkurve ist immer monoton wachsend und konvex, da die kumulierte relative Merkmalssumme der geordneten Datenreihe h¨ochstens so groß sein kann wie der kumulierte Anteil der Merkmalstr¨ager.

Eine Lorenzkurve ist immer monoton wachsend und konkav, da der kumulierte Anteil der Merkmalstr¨ager der geordneten Datenreihe h¨ochstens so groß sein kann wie die kumulierte relative Merkmalssumme.

(3)

(d) Ein Boxplot kann erste Hinweise ¨uber Lage, Streuung und Schiefe einer Verteilung liefern.

Richtig Falsch

Ein Boxplot beruht auf der 5-Punkte-Zusammenfassung und liefert deshalb Informationen zu Streuung und Lage, aber nicht zur Schiefe.

Aus einem Boxplot k¨onnen in erster Linie Informationen zur Konzentration abgelesen werden.

Form, Lage und L¨ange des Boxplots und der Box erm¨oglichen einen ersten Eindruck der Parameter einer Verteilung.

(e) Die empirische Kovarianz gibt Auskunft ¨uber die St¨arke des linearen Zusammenhangs zweier Merkmale.

Richtig Falsch

Die empirische Kovarianz kann positiv oder negativ sein und gibt daher Auskunft sowohl

¨

uber die Richtung als auch ¨uber die St¨arke eines linearen Zusammenhangs.

Die empirische Kovarianz muss durch das Produkt der Standardabweichungen beider Merk- male geteilt werden, um auf die St¨arke des Zusammenhangs schließen zu k¨onnen.

Die St¨arke eines linearen Zusammenhanges kann nur mithilfe des korrigierten Kontingenz- koeffizienten bestimmt werden.

(4)

Aufgabe 2: Indexzahlen (20 Punkte)

Die Golfprofis Martin Kaymer (Spieler 1), Bubba Watson (Spieler 2) und Tiger Woods (Spieler 3) treffen sich zuf¨allig bei einer Kindergeburtstagsparty auf dem Minigolfplatz. Nach den ersten Schl¨agen stellen sie fest, dass ihnen ihr K¨onnen auf dem Golfplatz auf der Minigolfanlage (mit 10 Bahnen) nicht hilft. Die Anzahl der Schl¨age bis zum Einlochen sind in der folgenden Tabelle gegeben:

Tabelle 1: ¨Ubersicht Schl¨age

Bahn 1 2 3 4 5 6 7 8 9 10

Spieler 1 2 3 7 2 5 6 1 7 2 1 Spieler 2 7 2 3 2 4 6 5 4 2 1 Spieler 3 1 1 1 2 7 7 7 3 3 3

(a) Bubba Watsons Bruder ist Unternehmensberater von Sportanlagen. Eine Hotelkette m¨ochte eine ¨ahnliche Minigolfanlage mit mittlerem Handycap bauen lassen. Als Vergleichswer- te zieht Mr. Watson die Ergebnisse seines Bruders und seiner Kollegen heran. F¨ur eine erste Analyse von Daten wird h¨aufig ein Boxplot erstellt. Berechnen Sie die 5-Punkte- Zusammenfassung f¨ur die gegebenen Daten und stellen Sie Ihre Ergebnisse in geeigneter Form graphisch dar.(12.5 Punkte)

(b) Vergleichen Sie den Boxplot den Sie in (a) erstellt haben mit den unten dargestellten Box- plots f¨ur die enzelnen Spieler. Wie sch¨atzen Sie das K¨onnen der Golfprofis beim Minigolf ein?(3 Punkte)

1 2 3

1234567

Spieler

Anzahl Schlaege

(c) Der Modus ist ein weiteres Lagemaß der beschreibenden Statistik. Bestimmen Sie den Modus f¨ur die Schl¨age der drei Spieler. Inwiefern unterscheiden sie sich untereinander?

(4.5 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Aufgabe 3: Empirische Dichte- und Verteilungsfunktion (20 Punkte)

Biathlon ist nach Skispringen die zweitbeliebteste Wintersportart in Deutschland. Dies liegt vor allem an der Kombination von Skifahren und Schießen. Gerade beim Skifahren erreichen die Biathleten/innen hohe Geschwindigkeiten. Tabelle 6 zeigt die durchschnittlichen Geschwin- digkeiten inkm/h von 36 Biathletinnen beim Weltcuprennen in Ruhpolding 2018.

Tabelle 2: Geschwindigkeiten in km/h von 36 Biathletinnen - Weltcup Ruhpolding 2018 Biathletin Geschwindigkeit Biathletin Geschwindigkeit Biathletin Geschwindigkeit

1 21.1964 13 23.1442 25 24.0397

2 22.3307 14 23.1919 26 24.1689

3 22.3769 15 23.2128 27 24.2055

4 22.3890 16 23.2769 28 24.2418

5 22.5282 17 23.2789 29 24.2457

6 22.5357 18 23.3281 30 24.4951

7 22.7762 19 23.5911 31 24.7131

8 22.7925 20 23.6790 32 24.8082

9 22.8031 21 23.7582 33 25.1158

10 23.0150 22 23.7802 34 25.3435

11 23.0425 23 23.8390 35 25.3635

12 23.1085 24 23.8579 36 26.3621

Quelle: https://www.biathlonworld.com, abgerufen am 24.01.2019.

(a) Ein Reporter m¨ochte sich die Verteilung der Geschwindigkeiten genauer ansehen. Ein Kollege schl¨agt ihm vor, die Geschwindigkeiten zuerst in Klassen einzuteilen. Bilden Sie die Klassen und nutzen Sie hierf¨ur die Ihnen bekannten Regeln. Die Klassenuntergrenze der kleinsten Klasse soll bei einschließlich 21 km/hliegen und die Klassenobergrenze der gr¨oßten Klasse bei kleiner als 27 km/h. Außerdem soll die Klassenbreite f¨ur alle Klassen gleich sein.(3 Punkte)

(b) Erstellen Sie mit der in (a) vorgenommenen Klasseneinteilung eine geeignete graphische Darstellung der empirischen Dichte. (6 Punkte)

(c) Zus¨atzlich zur empirischen Dichte m¨ochte der Reporter auch die empirische Verteilungs- funktion f¨ur die klassierten Daten in seinem Artikel zeigen. Hierf¨ur hat er eine andere Klasseneinteilung gew¨ahlt (siehe Tabelle 3). Stellen Sie die empirische Verteilungsfunkti- on f¨ur die klassierten Daten aus Tabelle 3 sowohl graphisch als auch formal dar. Wie hoch ist der Anteil der Biathletinnen, die eine Geschwindigkeit zwischen 22.2 und 24.3 km/h haben? Berechnen Sie den Anteil f¨ur die klassierten Daten. Was f¨allt Ihnen auf, wenn Sie den Wert mit der Urliste vergleichen.(11 Punkte)

Tabelle 3: Klasseneinteilung des Reporters Klasse [21,23) [23,25) [25,27)

nj 9 23 4

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(6)

Aufgabe 4: Zusammenhangsanalyse (20 Punkte)

Die Wintersportsaison im beschaulichen Ort Fredagshyttan wird aufgrund von Schneeman- gel von Jahr zu Jahr k¨urzer. Der B¨urgermeister vermutet, dass dies auf den Klimawandel zur¨uckzuf¨uhren ist. Er interessiert sich daher f¨ur das Verhalten der Bewohner beim Energiever- brauch und hat folgende - nach Haushaltsgr¨oßen getrennte - Kontingenztafeln erstellen lassen.

In ihnen ist ersichtlich, woher die Einwohner ihren Strom beziehen und womit sie heizen.

Tabelle 4: Einpersonenhaushalte Bezug von Strom

eigene Produktion Okostrom¨ konventioneller Strom P Quelle

f¨ur Heizen

Ol¨ 0 20 200 220

Gas 0 40 200 240

Pellets 0 30 10 40

P 0 90 410 500

Tabelle 5: Zweipersonenhaushalte Bezug von Strom

eigene Produktion Okostrom¨ konventioneller Strom P Quelle

f¨ur Heizen

Ol¨ 0 20 300 320

Gas 50 60 270 380

Pellets 100 150 50 300

P 150 230 620 1000

Tabelle 6: Drei- und Mehrpersonenhaushalte Bezug von Strom

eigene Produktion Okostrom¨ konventioneller Strom P Quelle

f¨ur Heizen

Ol¨ 10 20 330 360

Gas 40 140 400 580

Pellets 200 320 40 560

P 250 480 770 1500

(a) Betrachten Sie die drei Tabellen. Vermuten Sie einen Zusammenhang zwischen der Haus- haltsgr¨oße und dem Verhalten bei der Energienutzung? Begr¨unden Sie kurz.(2 Punkte) (b) Der B¨urgermeister h¨alt die Trennung nach Haushaltsgr¨oßen nun doch f¨ur unpraktisch.

Fassen Sie die Daten zu einer Tabelle zusammen, die alle Haushalte enth¨alt. (6 Punkte) (c) Berechnen Sie in der auf der n¨achsten Seite gegebenen Vorlage, wie die unter Unabh¨angigkeit

der Merkmale erwartete Tabelle auss¨ahe. Vermuten Sie einen Zusammenhang? Begr¨unden Sie ihre Vermutung.(6 Punkte)

(d) Der χ2 Koeffizient betr¨agt 1384. Berechnen Sie den korrigierten Kontingenzkoeffizienten.

Vergleichen Sie das Ergebnis mit Ihren Vermutungen aus (a) und (c).(6 Punkte) Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

[1-1]

(7)

Tabelle 7: Vorlage f¨ur die Berechnung der unter Unabh¨angigkeit erwarteten H¨aufigkeiten

Bezug von Strom

eigene Produktion Okostrom¨ konventioneller Strom P Quelle

f¨ur Heizen

Ol¨ 900

Gas 1200

Pellets 900

P 400 800 1800 3000

Aufgabe 5: Indexzahlen (20 Punkte)

Tiger Woods hat 4 Kinder. Sein j¨ungstes Kind hat vor einiger Zeit begonnen Golf zu spielen.

Jetzt wurde es Zeit f¨ur eine eigene Golfausr¨ustung. Er wundert sich ¨uber den Gesamtpreis der Ausr¨ustung. Er ist der Meinung, dass die Ausr¨ustungen der ¨alteren Kinder nicht so teuer waren. Zu Hause ¨uberpr¨uft er die Quittungen der Ausr¨ustungen seiner Kinder. Die Preise und Produktbeschreibungen sind in der folgenden Tabelle gegeben:

Tabelle 8: Warenkorb Golfsausr¨ustung

Bezeichnung Menge Preis ($) Menge Preis ($) Menge Preis ($) Menge Preis ($)

2010 2010 2015 2015 2018 2018 2020 2020

Schl¨agertasche 1 80 1 80 1 95 1 100

Golftrolley 0 0 1 100 1 150 1 150

Schl¨agerset 1 259 1 245 1 599 1 350

B¨alle 1 150 1 200 1 160 1 100

Bekleidung 1 500 1 250 1 395 1 650

(a) Die Preissteigerung von 2015 zu 2018 kommt Tiger Woods besonders groß vor. Er m¨ochte wissen, was er in 2015 f¨ur die Ausstattung, welche er in 2018 gekauft hat, bezahlt h¨atte.

H¨atte er Geld gespart und wenn ja, wie viel? Nachdem Sie jetzt einen Preisindex ausge- rechnet haben, betrachten Sie jetzt den jeweils anderen Preisindex und den Umsatzindex.

Welche Erkenntnis erwarten Sie und warum? (10 Punkte)

(b) Vergleichen Sie jetzt die beiden Warenk¨orbe aus 2010 und 2020 miteinander. Wie viel mehr/ weniger h¨atte Tiger Woods in 2020, wenn er die Ausstattung bereits 2010 gekauft h¨atte? Welche Probleme sind bei der Berechnung des Preisindexes aufgetreten?(5 Punkte) (c) Welche Probleme sehen Sie generell bei der Nutzung des Indexverfahrens? (5 Punkte) Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Abbildung

Tabelle 2: Geschwindigkeiten in km/h von 36 Biathletinnen - Weltcup Ruhpolding 2018 Biathletin Geschwindigkeit Biathletin Geschwindigkeit Biathletin Geschwindigkeit
Tabelle 4: Einpersonenhaushalte Bezug von Strom
Tabelle 8: Warenkorb Golfsausr¨ ustung

Referenzen

ÄHNLICHE DOKUMENTE

F¨ ur eine erneute Berechnung wurden die Jah- resums¨ atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Dann k¨ onnen klassierte H¨ aufigkeitsverteilungen immer in unklassierte H¨ aufigkeitsverteilungen umgewandelt werden, aber unklassierte H¨ aufigkeitsverteilungen k¨ onnen nicht

b) Es liegt eine Datenreihe vor, auf deren Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini-

Im Vergleich zu den befragten Studenten machen sich doppelt so viele Studentinnen manchmal oder oft Sorgen ¨ uber ihre Klausuren.

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Geben Sie die verwendeten Rechenregeln in allge- meiner Form an. Runden Sie Ihre

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch