• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2018/2019 15.02.2019

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2018/2019 15.02.2019"

Copied!
9
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2018/2019

15.02.2019

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

(a) Der durchschnittliche Wachstumsfaktor kann nur f¨ur positive Wachstumsraten bestimmt werden.

Richtig Falsch

Der durchschnittliche Wachstumsfaktor wird mithilfe des geometrischen Mittels bestimmt.

Dieses ist nur f¨ur positive Beobachtungswerte definiert.

Negative Wachstumsraten m¨ussen immer so transformiert werden, dass man positi- ve Wachstumsraten erh¨alt. Diese k¨onnen dann zur Bestimmung des durchschnittlichen Wachstumsfaktors verwendet werden.

Negative Wachstumsraten (nehmen sie an rt>−1) spielen f¨ur die Berechnung des durch- schnittlichen Wachstumsfaktors keine Rolle.

(b) Falls im einfachen linearen Regressionsmodell die Zielgr¨oße und die Einflussgr¨oße ver- tauscht werden, ¨andern sich die ermittelten Regressionskoeffizienten nicht.

Richtig Falsch

Die Regressionskoeffizienten ¨andern sich nicht, da die in das Modell eingehenden Daten- reihen sich nicht ver¨andert haben.

Die Regressionskoeffizienten ¨andern ihren Wert, da der unterstellte Zusammenhang ein anderer ist.

Der Betrag der Regressionskoeffizienten bleibt gleich, jedoch ¨andern sich die Vorzeichen, da Ziel- und Einflussgr¨oße vertauscht wurden.

(c) Bei linearer Transformation gilt: xi 7→yi =a·xi+bsey =a2·sex. Richtig

Falsch

Es gilt: xi 7→yi =a·xi+bsey =a·sex+b.

Es gilt: xi 7→yi =a·xi+bsey =|a| ·sex.

Die Standardabweichung vonx muss mita2 multipliziert werden, da auch die Varianz auf quadrierten Werten beruht.

(3)

(d) Die folgende Abbildung zeigt ein Streudiagramm zwischen einem Merkmal X und einem Merkmal Y. Der Korrelationskoeffizient nach Bravais-Pearson ist 0.0309.

−1 0 1 2 3

−2024

x

y

Zwischen X und Y ist kein Zusammenhang zu erkennen.

Richtig Falsch

Der Korrelationskoeffizient nach Bravais-Pearson ist nahe Null. Daher liegt eine Schein- korrelation vor und es besteht kein Zusammenhang zwischen X und Y.

In der Abbildung ist eine verdeckte Korrelation zwischen X und Y zu erkennen.

Die Abbildung l¨asst keine Aussage ¨uber den Zusammenhang zu. Es sollte der korrigierte Kontingenzkoeffizient berechnet werden.

(e) F¨ur die Abbildung einer Verlaufsentwicklung von beispielweise Aktienkursen kann man den wesentlichen Verlauf durch den gleitenden Durchschnitt abbilden.

Richtig Falsch

Im wesentlichen werden bei der Bildung des gleitenden Durchschnitts die lokalen Mediane

¨

uber eine bestimmte Anzahl an Datenpunkten gebildet. Dadurch erfolgt eine Gl¨attung der Ursprungsdaten.

Im wesentlichen werden bei der Bildung des gleitenden Durchschnitts die lokalen Modi

¨

uber eine bestimmte Anzahl an Datenpunkten gebildet. Dadurch erfolgt eine Gl¨attung der Ursprungsdaten.

Im wesentlichen werden bei der Bildung des gleitenden Durchschnitts die lokalen arith- metischen Mittel ¨uber eine bestimmte Anzahl an Datenpunkten gebildet. Dadurch erfolgt eine Gl¨attung der Ursprungsdaten.

(4)

Aufgabe 2: (20 Punkte)

In Tabelle 1 finden Sie Informationen zum Bierkonsum in den neuen Bundesl¨andern. In dieser Tabelle wurden Berlin und Brandenburg zusammengefasst. Dargestellt ist sowohl der gesamte Bierkonsum in Hektolitern1, als auch der Pro-Kopf-Konsum. Leider fehlen einige Werte. Au- ßerdem liegen Ihnen in Tabelle 2 Informationen zur Einwohnerzahl der einzelnen Bundesl¨ander vor (jeweils Stand 2017).

Tabelle 1: Bierkonsum in den neuen Bundesl¨andern

Bundesland Bierkonsum in Hektolitern Bierkonsum pro Kopf in Litern

Berlin und Brandenburg 61.49

Mecklenburg-Vorpommern 158.80

Sachsen 7 363 359 180.43

Sachsen-Anhalt 1 981 178 89.12

Th¨uringen 2 584 376

Quelle: https://de.statista.com/statistik/daten/studie/28932/umfrage/

bierabsatz-nach-bundeslaendern/, abgerufen am 19.12.2018.

Tabelle 2: Einwohnerzahlen nach Bundesl¨andern

Bundesland Einwohnerzahl

(in Tausend)

Berlin 3 613

Brandenburg 2 504

Mecklenburg-Vorpommern 1 611

Sachsen 4 081

Sachsen-Anhalt 2 223

Th¨uringen 2 151

Quelle: https://de.statista.com/statistik/daten/studie/71085/umfrage/

verteilung-der-einwohnerzahl-nach-bundeslaendern/, abgerufen am 19.12.2018.

(a) Berechnen Sie den durchschnittlichen Pro-Kopf-Konsum von Bier in den neuen Bun- desl¨andern (inklusive Berlin). (6 Punkte)

(b) Der durchschnittliche Bierkonsum in Deutschland im Jahr 2017 betrug 93.26 Liter pro Kopf. Wie hoch war der Bierkonsum in den alten Bundesl¨andern pro Kopf? Gehen sie dabei davon aus, dass das Ergebnis in (a) 112.80 Liter betr¨agt (dies ist nicht notwendi- gerweise das richtige Ergebnis).(5 Punkte)

1Ein Hektoliter = 100 Liter

(5)

(c) Einen risikofreien Konsum von Alkohol gibt es nicht, allerdings wird eine Menge von unter 12g reinen Alkohols pro Tag bei Frauen und 24g bei M¨annern als risikoarmer Konsum bezeichnet.2 Gehen Sie davon aus, dass ein Liter Bier 40g Alkohol enth¨alt, und berechnen Sie, wie viel Alkohol pro Tag in Deutschland im Durchschnitt pro Person durch Bier konsumiert wird. K¨onnen Sie aus den gegebenen Daten schließen, wie viele Menschen einen Alkoholkonsum haben, der nicht mehr risikoarm ist? Begr¨unden Sie ihre Entscheidung.

(6 Punkte)

(d) Drei verschiedene Zeitungen titeln mit folgenden Schlagzeilen:

Zeitung 1:

”Alkoholkonsum in Deutschland steigt, Komasaufen unter Sch¨ulern nimmt wieder zu”

Zeitung 2:

”Alkoholkonsum in Deutschland sinkt, immer weniger der unter 20-J¨ahrigen trinken regelm¨aßig Alkohol”

Zeitung 3:

”Alkoholkonsum in Deutschland unver¨andert, Studierende trinken genauso viel Bier wie im Vorjahr”

Sehen Sie einen Widerspruch in den Schlagzeilen? Erkl¨aren Sie ihre Entscheidung. (3 Punkte)

Hilfsgr¨oßen:

Einwohnerzahl in den alten Bundesl¨andern (in Tausend): 66 608 Einwohnerzahl in Deutschland (in Tausend): 82 791

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 2 Nachkommastellen.

2Quelle:https://www.kenn-dein-limit.info/alkohol-ohne-risiko.html, abgerufen am 10.01.2018.

(6)

Aufgabe 3: Konzentrationsmaße (20 Punkte)

Ein unabh¨angiges Forschungsinstitut soll die Konzentration des Bierabsatzes von Brauereien im Jahr 2017 auf dem Weltmarkt untersuchen. Leider liegen keine Daten f¨ur die genauen Absatz- mengen an Bier f¨ur die einzelnen Brauereien vor, weshalb sich das Institut dazu entschließt, die Bierproduktion als geeigneten Ersatz zu verwenden. In Tabelle 3 sind die dem Forschungsinsti- tut bekannten Daten aufgef¨uhrt. Wie Sie erkennen, fehlen hier einzelne Werte. Gl¨ucklicherweise wurden schon Klassen gebildet, und die Merkmalssummen der Produktionsmengen der einzel- nen Klassen sind fast vollst¨andig.

Tabelle 3: Brauereien mit h¨ochster Bierproduktion weltweit 2017

Brauerei Bierausstoß in Mio.hl Klasse Merkmalssumme

Anheuser-Busch InBev 612.5 (114,613] 956.5

Heineken (114,613] 956.5

China Resource Brewery (114,613] 956.5

Carlsberg 113.4 (60,114] 291

Molson-Coors (60,114] 291

Tsingtao Brewery Group (60,114] 291

Asahi 58.2 (30,60]

Yanjing 43.0 (30,60]

BGI/Group Castle 38.8 (30,60]

Kirin (21,30] 76

Petropolis (21,30] 76

Efes Group 21.1 (21,30] 76

Constellation Brands (0,21] 56.5

San Miguel Corp. 18.3 (0,21] 56.5

Saigon Beverage (0,21] 56.5

Quelle: https://de.statista.com/statistik/daten/studie/199560/umfrage/

groesste-bierbrauer-weltweit-nach-ausstoss/, abgerufen am 19.12.2018.

(a) Berechnen Sie ein geeignetes Maß zur Beurteilung der relativen Konzentration auf dem Markt und interpretieren Sie das Ergebnis. Nutzen Sie zur Berechnung die gegebene Hilfstabelle. (8 Punkte)

(b) In Abbildung 1 ist die Lorenzkurve f¨ur die Daten der Urliste abgetragen. Zeichnen Sie die Lorenzkurve f¨ur die klassierten Daten ein. Begr¨unden Sie, warum sich die beiden Kurven unterscheiden. Wie w¨urde der Gini-Koeffizient der Urlistendaten im Vergleich zum Gini-Koeffizienten der klassierten Daten aussehen? (5 Punkte)

(c) Ein Mitarbeiter des Forschungsinstitutes ist der Meinung, dass zus¨atzlich ein Maß der absoluten Konzentration berechnet werden sollte. Berechnen Sie ein Maß der absoluten Konzentration. Erl¨autern Sie kurz, weshalb sich das Maß der relativen vom Maß der absoluten Konzentration unterscheidet.(7 Punkte)

Hilfsgr¨oßen:

˜

s= 112.1568; x= 101.3333

(7)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Tabelle 4: Hilfstabelle

j Klasse nq xq fq uq v˜q vq

1 3

2 3

3 3

4 3

5 3

P 15

Abbildung 1: Lorenzkurve der Urlistendaten

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

u

v

(8)

Aufgabe 4: Mehrdimensionale Merkmale (20 Punkte)

Eine studentische Vereinigung richtet eine Veranstaltung mit Freigetr¨anken aus. Bis zur Sperr- stunde werden von den G¨asten insgesamt 216 Becher Schwarzbier und 288 Becher Cola-Bier getrunken. Die Organisatoren z¨ahlen w¨ahrend der Veranstaltung 260 Studentinnen, wovon sich 159 f¨ur Cola-Bier entscheiden. Jeder Gast erh¨alt genau ein Freigetr¨ank. Nach der Veranstal- tung fragen sich die Organisatoren, ob es allgemeine geschlechtsspezifische Vorlieben bei der Getr¨ankewahl gibt.

(a) Welches statistische Maß erscheint Ihnen zur Beantwortung der obigen Fragestellung grunds¨atzlich geeignet und warum? Wo sehen Sie ggf. Probleme? (5 Punkte)

(b) Stellen Sie die im Text angegebenen Daten in Form einer Kreuztabelle dar. Nutzen Sie da- zu die unten vorgegebene Tabelle 5. Welche Rechenschritte sind erforderlich, um auf Basis einer Kreuztabelle denχ2-Koeffizienten zu ermitteln? Beschreiben Sie diese inhaltlich.(6 Punkte)

(c) Berechnen Sie unter Verwendung von χ2 = 3.528 ein aussagekr¨aftiges Zusammenhangs- maß zwischen den Merkmalen “Getr¨ank“ und “Geschlecht“. Interpretieren Sie Ihr Ergeb- nis. Ber¨ucksichtigen Sie dabei Ihre ¨Uberlegungen zu Teilaufgabe (a). (7 Punkte)

(d) Die Cola ist alle. Es gibt nur noch Schwarzbier. Es stellt sich die Frage, ob die konsumierte Menge mit dem Geschlecht zusammenh¨angt. Nehmen Sie an, die Getr¨ankemenge w¨urde in Litern statt in Bechern gemessen. Was bedeutet das f¨ur die ¨Uberpr¨ufung des oben benannten Zusammenhangs? (2 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Tabelle 5: Kreuztabelle

Schwarzbier Cola-Bier P

weiblich m¨annlich

P

(9)

Aufgabe 5: Analyse zeitlicher Verl¨aufe (20 Punkte)

Ein großes deutsches Brauereiunternehmen plant f¨ur 2020 eine umfassende strukturelle Ver¨an- derung seines Sortiments. Als gesundheits- und verantwortungsbewusstes Unternehmen hat die Brauerei nicht nur die Umsatzzahlen im Blick. Eine der erarbeiteten Marketingstrategien umfasst die Ausweitung des alkoholfreien und isotonischen Segments, um die Biermarke bei- spielsweise f¨ur Sportler attraktiver zu machen. In Tabelle 6 finden sich die Absatzmengen der in Deutschland verkauften alkoholhaltigen Biere und Biermischgetr¨anke sowie die Zahlen f¨ur alkoholbedingte Unfallopfer in Deutschland in den Jahren 2009 bis 2017. F¨ur 2018 liegen die Daten noch nicht vor.

Tabelle 6: Entwicklungszahlen

Jahr Absatzmengen in Tsd. hl alkoholbedingte Unfallopfer in Dtl.

2009 85 900 22 200

2010 83 400 19 200

2011 82 800 20 200

2012 81 000 19 300

2013 79 700 17 800

2014 80 000 17 100

2015 79 500 16 700

2016 79 100 17 000

2017 77 200 16 800

Quelle:https://de.statista.com/statistik/daten/studie/3406/umfrage/

bierabsatz-in-deutschland-seit-dem-jahr-1999/ und

https://www.dvr.de/unfallstatistik/de/alkohol/, abgerufen am 19.12.2018.

(a) Stellen Sie ein geeignetes Modell zur Berechnung eines Trends f¨ur die Absatzmengen von Bier und Biermischgetr¨anken in Deutschland f¨ur die Jahre 2009 bis 2017 auf. Begr¨unden Sie Ihre Wahl des Modells. Welchen Verlauf des Trends erwarten Sie f¨ur die Absatzmengen von Bier und Biermischgetr¨anken in Deutschland? Begr¨unden Sie Ihre Einsch¨atzung.

(Bitte nicht rechnen!) (7 Punkte)

(b) Sch¨atzen Sie die Parameter a und b des von Ihnen in Aufgabe (a) aufgestellten Modells und interpretieren Sie diese. (8 Punkte)

(c) Sch¨atzen Sie mit dem in Aufgabe (a) aufgestellten Modell die Absatzmengen von Bier und Biermischgetr¨anken in Deutschland f¨ur das Jahr 2018.

Gehen Sie davon aus, dass ˆa einen Wert von−922 und ˆbeinen Wert von 1 936 298 anneh- men (dies ist nicht notwendigerweise das richtige Ergebnis).

Die Brauereiinnung Deutschlands meldete in den ersten drei Quartalen im Jahr 2018 stei- gende Ums¨atze. Wie passen Ihre Prognose und die Umsatzzahlen der Brauerreiinnung zusammen? Begr¨unden Sie Ihre Einsch¨atzung. Gehen Sie dabei auf m¨ogliche Schw¨achen der Datengrundlage und Ihres gew¨ahlten Modells ein. (5 Punkte)

Hilfsgr¨oßen:

P2017

t=2009t·Absatzmenget= 1 466 616 500; P2017t=2009t2 = 36 469 581

P2017

t=2009Absatzmenge2t = 59 040 200 000; t = 2013; Absatzmenge= 80 955.5556

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Abbildung

Tabelle 2: Einwohnerzahlen nach Bundesl¨ andern
Tabelle 3: Brauereien mit h¨ ochster Bierproduktion weltweit 2017
Tabelle 4: Hilfstabelle j Klasse n q x q f q u q v ˜ q v q 1 3 2 3 3 3 4 3 5 3 P 15
Tabelle 5: Kreuztabelle
+2

Referenzen

ÄHNLICHE DOKUMENTE

Der Median ist unempfindlich gegenüber „Ausreißer“, daher müssen die Beobachtungs- werte zu einer Berechnung auch nicht der Größe nach sortiert werden... d) Der χ 2

a) Im Zuge einer Studie wird f¨ ur die Merkmale Schuhgr¨ oße und K¨ orpergr¨ oße der Korrelationsko- effizient r XY = 0.636 ermittelt. Addiert man zu jedem beobachteten Wert den

F¨ ur eine erneute Berechnung wurden die Jah- resums¨ atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

b) Es liegt eine Datenreihe vor, auf deren Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini-

Im Vergleich zu den befragten Studenten machen sich doppelt so viele Studentinnen manchmal oder oft Sorgen ¨ uber ihre Klausuren.

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an