• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2018/2019 29.03.2019

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2018/2019 29.03.2019"

Copied!
10
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2018/2019

29.03.2019

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

m

(3)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

(a) Die folgende Abbildung zeigt eine linkssteile H¨aufigkeitsverteilung.

1 2 3 4 5 6 7 8

aj h(aj) 02468101214

Richtig Falsch

Die H¨aufigkeitsverteilung ist symmetrisch, da xmod=xmed=x.

Die H¨aufigkeitsverteilung ist rechtsschief, da xmod < xmed < x.

Die H¨aufigkeitsverteilung ist rechtssteil, da xmod > xmed> x.

(b) Betrachten Sie die Abbildung in Teilaufgabe (a). Der Modus der Angaben liegt bei Ant- wortkategorie 2.

Richtig Falsch

Der Modalwert entspricht der Auspr¨agung mit h¨ochster kumulierter H¨aufigkeit.

F¨ur Antwortkategorie 2 errechnet sich die h¨ochste relative H¨aufigkeit.

Die Antwortkategorien 7 und 8 liegen mit der h¨ochsten relativen H¨aufigkeit vor.

(4)

(c) Die Abbildung in Teilaufgabe (a) zeigt das Wahlergebnis f¨ur 8 verschiedene Parteien. Eine alternative graphische Darstellungsform f¨ur das oben gezeigte Wahlergebnis der Parteien ist das Kreisdiagramm.

Richtig Falsch

F¨ur ein qualitatives, stetiges Merkmal wie das hier betrachtete ist ein Kreisdiagramm geeignet.

F¨ur ein quantitatives, stetiges Merkmal wie das hier betrachtete ist ein Kreisdiagramm geeignet.

F¨ur ein qualitatives, diskretes Merkmal wie das hier betrachtete ist ein Kreisdiagramm geeignet.

(d) Wenn der Interquartilsabstand einer empirischen Verteilung Null betr¨agt, dann ist auch immer die empirische Varianz gleich Null.

Richtig Falsch

Interquartilsabstand und Varianz messen beide die Streuung, daher haben entweder beide den Wert Null (keine Streuung) oder nehmen beide einen echt positiven Wert an.

Die empirische Varianz ist nur dann Null, wenn alle Werte gleich sind, der Interquartils- abstand kann auch in anderen F¨allen Null betragen.

Der Interquartilsabstand misst den Abstand zwischen erstem und dritten Quartil und kann daher niemals Null betragen.

(e) Komponentenmodelle, wie zum Beispiel das additive Modell yt=gt+st+εt, t= 1, ..., T werden genutzt, um Bestandteile von Zeitreihen zu analysieren.

Richtig Falsch

Ein Ziel der Komponentenmodelle ist die Sch¨atzung der sogenannten Trendkomponente.

Auf Basis von Komponentenmodelle k¨onnen Zeitreihen zwar formal zerlegt werden, eine Analyse ist aber nur im Ganzen m¨oglich.

Ein Ziel der Komponentenmodelle ist die Erkl¨arung sogenannter irregul¨arer Schwankun- gen.

(5)

Aufgabe 2: (20 Punkte)

Im Biathlon Einzelrennen der Damen am 08.02.2019 in Canmore (Kanada) sind von den 93 gestarteten Athletinnen 88 mit einer Wertung ins Ziel gekommen. Aus Tabelle 1 k¨onnen Sie die Laufzeiten der 30 bestplatzierten L¨auferinnen entnehmen. Die Zeiten sind in Minuten angegeben (z.B. 36.500 = 36 Minuten und 30 Sekunden).

Tabelle 1: Laufzeiten der ersten 30 L¨auferinnen in Minuten

Platzierung Name Vorname Laufzeit

1 Eckhoff Tiril 36.548

2 Davidova Marketa 36.712

3 Vittozzi Lisa 36.897

4 Hildebrand Franziska 37.345

5 Tandrevold Ingrid Landmark 37.645

6 Hinz Vanessa 37.857

7 Bescond Anais 37.908

8 Kuzmina Anastasiya 38.038

9 Dahlmeier Laura 38.057

10 Schwaiger Julia 38.175

11 Gasparin Elisa 38.353

12 Roeiseland Marte Olsbu 38.393

13 Fialkova Paulina 38.363

14 Herrmann Denise 38.393

15 Hauser Lisa Theresa 38.463

16 Vasileva Margarita 38.747

17 Kaisheva Uliana 38.825

18 Preuss Franziska 38.988

19 Simon Julia 39.138

20 Tachizaki Fuyuko 39.187

21 Kalkenberg Emilie Aagheim 39.275

22 Wierer Dorothea 39.287

23 Oja Regina 39.325

24 Chevalier Anais 39.742

25 Aymonier Celia 39.745

26 Bankes Megan 39.790

27 Bondar Iana 39.797

28 Braisaz Justine 39.835

29 Crawford Rosanna 39.910

30 Haecki Lena 39.930

Quelle: https://www.xc-ski.de/events/biathlon-weltcup/biathlon-weltcup-ergebnisse/

ergebnis-biathlon-weltcup-canmore-can-125-km-kurzes-einzel-damen/, abgerufen am 20.02.2019.

(6)

(a) Berechnen Sie die Standardabweichung der Laufzeiten in der Gruppe der bestplatzierten 30 L¨auferinnen. (7 Punkte)

(b) Der gesamte Datensatz mit allen 88 L¨auferinnen wurde in drei Teile geteilt. Tabelle 2 enth¨alt Informationen zur durchschnittlichen Laufzeit und der Varianz innerhalb der Gruppen. Berechnen Sie die Standardabweichung aller 88 L¨auferinnen. Gehen Sie f¨ur Ihre Berechnung davon aus, dass Ihr Ergebnis in (a) 0.95 betr¨agt (dies ist nicht notwen- digerweise das richtige Ergebnis).(9 Punkte)

Tabelle 2: Durchschnittliche Laufzeit und Varianz innerhalb der Gruppen Gruppe Anzahl der L¨auferinnen Durchschnittliche Laufzeit Varianz

Platz 1-30 30 38.6541

Platz 31-60 30 41.0937 0.5081

Platz 61-88 28 44.3309 3.8744

Platz 1-88 88 41.2920

(c) Berechnen Sie die Werte, die Sie f¨ur die Erstellung eines Boxplots der erstplatzierten 30 L¨auferinnen ben¨otigen (nur rechnen, nicht zeichnen!). (4 Punkte)

Hilfsgr¨oßen: P30i=1xi = 1159.623; P30i=1x2i = 44852.142 Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(7)

Aufgabe 3: Konzentrationsmaße (20 Punkte)

Das Endergebnis der Olympischen Winterspiele 2018 in Pyeongchang sorgte beim Deutschen Olympischen Sportbund (DOSB) f¨ur Freude. Mit 14 Goldmedaillen wurde Deutschland die zweitbeste Nation im Medaillenspiegel. Tabelle 3 zeigt die Verteilung der Goldmedaillen der zehn st¨arksten Nationen.

Tabelle 3: Verteilung der Goldmedaillen bei den Olympischen Winterspielen 2018

Nation Goldmedaillen (je Nation)

Norwegen, Deutschland 14

Kanada 11

USA 9

Niederlande 8

Schweden 7

S¨udkorea, Schweiz, Frankreich, ¨Osterreich 5 Quelle:

https://de.wikipedia.org/wiki/Medaillenspiegel_der_Olympischen_Winterspiele_2018, abgerufen am 26.02.2019.

(a) Den DOSB interessiert, wie stark die relative Konzentration der Verteilung der Goldme- daillen ist. Welches Maß w¨urden Sie dem DOSB empfehlen, falls er dieses mit anderen Medaillenspiegeln vergleichen m¨ochte? Begr¨unden Sie Ihre Entscheidung, berechnen Sie das von Ihnen vorgeschlagene Maß und interpretieren Sie Ihr Ergebnis. Vervollst¨andigen Sie die gegebene Hilfstabelle.(14 Punkte)

(b) Der DOSB h¨atte f¨ur seinen Report gerne eine graphische Darstellung der relativen Kon- zentration. Welche Darstellung w¨urde sich eignen? Zeichnen Sie diese und stellen Sie einen Zusammenhang zum relativen Konzentrationsmaß dar.(6 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Tabelle 4: Hilfstabelle

j aj h(aj) fj uj aj·h(aj) ˜vj vj uj·v˜j uj−1·v˜j

1 0.0964 0

2 0.0422 0.0337

3 0.0578 0.0482

4 0.0759 0.0650

5 0.1060 0.0928

6 0.3373 0.2698

P

(8)

Aufgabe 4: Mehrdimensionale Merkmale (20 Punkte)

F¨ur eine Studie zum Verletzungsrisiko im alpinen Wintersport werden aus den Unfallprotokol- len eines Skigebietes (Zeitraum 2003 bis 2008) folgende Angaben zu den Verletzten und zum jeweiligen Unfallort extrahiert: Alter, Geschlecht, Wintersportart (Ski- oder Snowboardsport) sowie Schwierigkeit des Gel¨andes, auf dem ein Unfall geschah. Das Gel¨ande wird im Wintersport in die Schwierigkeitsgrade blau (leicht), rot (mittel) und schwarz (schwer) sowie Fungel¨ande un- terteilt. Ein begeisterter Snowboarder stellt die Frage, ob sich f¨ur die Verletzungsh¨aufigkeiten ein Zusammenhang zwischen Gel¨andeschwierigkeit und Sportart finden l¨asst.

31,7%

30,9%

55,5%

46,5%

4,0%

17,9%

3,5%

1,9%

5,3%

2,8%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Ski Snowboard

blau rot schwarz Fungelände sonstiges Gelände

(a) Welches statistische Maß erscheint Ihnen zur Beantwortung der obigen Fragestellung grunds¨atzlich geeignet und warum? (3 Punkte)

(b) Zur Berechnung des Zusammenhangs sei ausschließlich das oben abgebildete Diagramm gegeben. Welche Rechenschritte sind erforderlich, um den χ2-Koeffizienten zu ermitteln?

Beschreiben Sie diese inhaltlich. Wo sehen Sie ggf. Probleme?(6 Punkte)

(c) Stellen Sie die folgenden im Text angegebenen Daten in Form einer Kreuztabelle dar.

Nutzen Sie dazu die unten vorgegebene Tabelle. (5 Punkte)

Im Skigebiet gab es im untersuchten Zeitraum insgesamt 2842 Verletzte, darunter 1865 Skifahrer. Auf der blauen Piste verletzten sich 893 Personen, darunter 591 Skifahrer. Auf der roten Piste verletzten sich 454 Snowboarder und 1036 Skifahrer. Von insgesamt 977 verletzten Snowboardern traf es 19 auf der schwarzen Piste und 27 auf sonstigem Gel¨ande.

Im Fungel¨ande verletzten sich 74 Skifahrer, auf sonstigem Gel¨ande sogar 98 Skifahrer.

(9)

(d) Berechnen Sie unter Verwendung vonχ2 = 166.986 ein aussagekr¨aftiges Zusammenhangs- maß zwischen den Merkmalen “Gel¨ande“ und “Sportart“. Interpretieren Sie Ihr Ergebnis.

(6 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Kreuztabelle:

Skifahrer Snowboardfahrer P blau

rot schwarz Fungel¨ande

sonstiges

P

(10)

Aufgabe 5: Indexzahlen (20 Punkte)

G¨unther W. ist seit Jahren begeisterter Wintersportfan. Er f¨ahrt seit 20 Jahren jedes Jahr mit seinen ehemaligen Kommilitonen zum Biathlon-Weltcup nach Oberhof. Die vier Herren

¨

ubernachten jedes Jahr im gleichen Hotel, nutzen die gleichen Transportmittel (Bus und Bahn) und absolvieren das gleiche Programm (Abendprogramm, Skilaufen und Weltcup gucken). Als Wirtschaftswissenschaftler verdient G¨unther W. zwar gut, achtet aber trotzdem immer auf seine Ausgaben und hebt seine Abrechnungen auf. Einer seiner Freunde hat sich beim j¨ahrlichen Ausflug maßlos ¨uber die aus seiner Sicht grenzenlose Preissteigerung ge¨argert. In Tabelle 5 finden Sie den Warenkorb des j¨ahrlichen Ausfluges, einmal f¨ur 1999 und einmal f¨ur 2019.

Tabelle 5: Ausgaben Skiurlaub

Preis 1999 in DM Menge 1999 Preis 2019 in Euro Menge 2019

Unterkunft 210.00 7 170.00 7

DB und Busticket 90.00 2 75.00 2

Tickets Skirennen 57.50 4 47.50 4

Kosten Skilaufen 0 2 25.00 2

Abendgestaltung 0 2 45.00 2

Kaffee 1.50 7 2.50 14

Snacks 2.00 14 3.00 12

Bier 2.50 35 3.50 20

Abendessen 10.00 6 15.00 6

(a) Wie viel Geld hat G¨unther W. jeweils in den Jahren 1999 und 2019 f¨ur seine Skiurlaube mit seinen Kommilitonen ausgegeben? (2 Punkte)

(b) Wie groß ist der Ausgabenunterschied tats¨achlich? Berechnen Sie dazu die relativen Aus- gaben von 2019 zu 1999.(7 Punkte)

(c) Wie viel h¨atte G¨unther W. f¨ur den in 2019 unternommenen Urlaub in 1999 ausgegeben?

Berechnen Sie den Wert des Warenkorbs mit Hilfe des geeigneten Index.(9 Punkte) (d) Welche Probleme sehen Sie bei der Verwendung von Indexverfahren? (2 Punkte) Hinweise:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Verwenden Sie den Wechselkurs DM:EUR = 2:1.

Abbildung

Tabelle 1: Laufzeiten der ersten 30 L¨ auferinnen in Minuten
Tabelle 4: Hilfstabelle j a j h(a j ) f j u j a j ·h(a j ) ˜v j v j u j · v ˜ j u j−1 · v ˜ j 1 0.0964 0 2 0.0422 0.0337 3 0.0578 0.0482 4 0.0759 0.0650 5 0.1060 0.0928 6 0.3373 0.2698 P
Tabelle 5: Ausgaben Skiurlaub

Referenzen

ÄHNLICHE DOKUMENTE

Der Median ist unempfindlich gegenüber „Ausreißer“, daher müssen die Beobachtungs- werte zu einer Berechnung auch nicht der Größe nach sortiert werden... d) Der χ 2

a) Im Zuge einer Studie wird f¨ ur die Merkmale Schuhgr¨ oße und K¨ orpergr¨ oße der Korrelationsko- effizient r XY = 0.636 ermittelt. Addiert man zu jedem beobachteten Wert den

F¨ ur eine erneute Berechnung wurden die Jah- resums¨ atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an

Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie)

Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.. Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische