• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2015/2016 03.02.2016

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2015/2016 03.02.2016"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2015/2016

03.02.2016

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Lage-, Streuungs-, Schiefemaße (20 Punkte)

Der Habicht wurde zum Vogel des Jahres 2015 gek¨urt. Diesen Greifvogel kann man, neben wei- teren Greifvogel-Arten (bspw. Falke, Uhu), in einem Wildpark bei einer Flugschau beobachten.

Anfang des Jahres hat ein Falkner im Wildpark seine Greifv¨ogel vermessen und gewogen. Das ermittelte Gewicht (X) (in kg) der V¨ogel hat er aufgezeichnet und zur ¨Ubersicht einen Boxplot erstellt. Leider sind in der Urliste der Minimal- und Maximalwert unkenntlich (symbolisiert durch ∼) und auch im Boxplot sind Informationen verloren gegangen.

Gewicht in kg 1.9 ∼ 1.4 0.7 1.5 ∼ 1.2 0.9 1.1 0.8 1.1 1.0 0.7 0.9 (a) Ermitteln Sie aus den gegebenen Daten die 5-Punkte Zusammenfassung und vervollst¨andi-

gen Sie die vorgegebene Abbildung. (10 Punkte)

(b) Welche Aussage k¨onnen Sie auf Grund der Grafik ¨uber die Schiefe der Daten machen?

Uberpr¨¨ ufen Sie Ihre Vermutung rechnerisch. (7 Punkte)

(c) Zwischen zwei Falknern entbrennt am Mittagstisch eine heftige Diskussion, als Falkner A in der Mittagspause zu seinem Kollegen sagt, das Gewicht der m¨annlichen Greifv¨ogel sei im Schnitt h¨oher als das der Weibchen. Falkner B erwidert, die vermessenen Weibchen seien im Mittel schwerer, da der Median der m¨annlichen Habichte gr¨oßer sei als der der Weibchen. Beide beharren auf ihrer Meinung. Wo liegt das Problem und welcher Ansatz ist aus statistisch-theoretischer Sicht zum Vergleich des Gewichts der angemessenere?

(3 Punkte)

Hilfsgr¨oßen:

Pn

i=1(xix)¯ 3 = 0.8258; Pni=1x2i = 20.28 Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

x(1) x0.25 x(n)

(3)

Aufgabe 2: Konzentrationsmaße (20 Punkte)

Die folgende Abbildung zeigt die Lorenzkurve der f¨unf gr¨oßten Automobilhersteller (alphabe- tisch: General Motors, Honda, Hyundai Kia, Toyota, VW) basierend auf deren PKW-Produktion im Jahr 2012 (Daten:https://de.wikipedia.org/wiki/Wirtschaftszahlen zum Automobil, Abruf am 11.01.2016).

0.0 0.2 0.4 0.6 0.8 1.0

0.0 0.2 0.4 0.6 0.8 1.0

Lorenzkurve

uj

vj

0.12 0.31 0.51 0.75

(a) Die f¨unf genannten Hersteller haben im Jahr 2012 insgesamt 34.4 Mio. Fahrzeuge produ- ziert. Wie viele Fahrzeuge (in absoluten Zahlen) produzierten die f¨unf Hersteller davon jeweils einzeln? K¨onnen Sie die einzelnen Produktionszahlen explizit den Herstellern zu- ordnen? Falls ja, f¨uhren Sie die Zuordnung durch. Falls nein, begr¨unden Sie, warum dies nicht m¨oglich ist. (7 Punkte)

(b) Berechnen Sie den zur oben gezeigten Lorenzkurve geh¨orenden normierten Gini-Koeffizien- ten. Wie beurteilen Sie die Konzentration am Markt? (11 Punkte)

(c) Ein Experte behauptet, dass zur Beurteilung der Konzentration am PKW-Markt es nicht ausreicht, nur die f¨unf gr¨oßten Hersteller zu betrachten. Dazu m¨ussten alle Hersteller ber¨ucksichtigt werden. In diesem Fall sind das noch 35 zus¨atzliche Hersteller mit insgesamt 23.3 Mio. Fahrzeugen im Jahr 2012. Angenommen, man w¨urde den Gini-Koeffizienten f¨ur den vom Experten vorgeschlagenen Ansatz berechnen. Welches Ergebnis (aus Teilaufgabe (b) oder (c)) hat eine h¨ohere Aussagekraft und warum?(2 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(4)

Aufgabe 3: Analyse zeitlicher Verl¨aufe (20 Punkte)

Die folgende Tabelle zeigt die Entwicklung der PKW-Produktion (in Mio. Fahrzeugen) des VW Konzerns von 2006 bis 2014 (Daten: http://de.statista.com/statistik/daten/studie/

181503/, Abruf am 11.01.2016).

Jahr Produzierte Fahrzeuge (in Mio.)

1 2006 5.660

2 2007 6.213

3 2008 6.347

4 2009 6.055

5 2010 7.358

6 2011 8.494

7 2012 9.255

8 2013 9.728

9 2014 10.213

(a) Ermitteln Sie f¨ur die oben angegebenen Daten ein einfaches lineares Trendmodell und interpretieren Sie die ermittelten Koeffizienten. Mit welchem Maß w¨urden Sie die G¨ute des Modells beurteilen? Begr¨unden Sie Ihre Wahl. (Bitte nur argumentieren, nicht rechnen.) (9 Punkte)

(b) Prognostizieren Sie mit dem in Teilaufgabe (a) ermittelten Modell die Produktionszahl f¨ur das Jahr 2015. Im Vergleich spricht ein gerade erschienener Bericht von VW (http://

www.volkswagenag.com/content/vwcorp/info center/de/news/2016/01/VW Group A aK.html, Abruf am 11.01.2016) von 9.93 Mio. Fahrzeugen f¨ur das Jahr 2015. Warum stimmt die Prognose nicht mit dem tats¨achlichen Wert ¨uberein? Welches generelle Pro- blem sehen Sie bei der Verwendung des Modells zur Prognose der Entwicklung der Produk- tionszahl? Machen Sie einen Vorschlag, wie man dieses Problem l¨osen k¨onnte.(11 Punkte) Hilfsgr¨oßen:

P9

t=1J ahrt·P roduktiont= 139 376.2420; P9t=1J ahr2t = 36 360 960;

P9

t=1P roduktion2t = 558.4670; J ahr= 2010;P roduktion= 7.7026 Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Aufgabe 4: Zusammenhangsanalyse (20 Punkte)

Das folgende Streudiagramm stellt den Zusammenhang zwischen Alter und Bruttojahresein- kommen f¨ur 30 zuf¨allig ausgew¨ahlte Hallenser dar.

20 30 40 50 60

2000030000400005000060000

Alter

Bruttojahreseinkommen

(a) F¨ur obige Daten ergeben sich folgende Werte:rSp=−0.0541 undrXY = 0.1335. Interpre- tieren Sie diese Kennzahlen inhaltlich. Was bedeutet dies f¨ur den Zusammenhang zwischen den Merkmalen Alter und Bruttojahreseinkommen? Wie l¨asst sich diese Schlussfolgerung mit dem Streudiagramm vereinbaren?(4 Punkte)

(b) Ein weiteres Maß f¨ur den Zusammenhang zwischen zwei Merkmalen ist der korrigierte Kontingenzkoeffizient. Wie unterscheidet sich diese Kennzahl theoretisch von den unter Teilaufgabe (a) genannten Korrelationskoeffizienten? Nehmen Sie an, dass die Daten als Kontingenztafel vorliegen. Welchen Wert w¨urden Sie f¨ur den korrigierten Kontingenzko- effizienten erwarten und warum?(4 Punkte)

(c) ¨Uberf¨uhren Sie die Daten aus dem Streudiagramm in eine 2×3-Kontingenztafel. Bilden Sie dabei f¨ur das Merkmal Alter (X) drei Auspr¨agungen: X <30, 30 ≤X <50 undX ≥50, und f¨ur das Merkmal Bruttojahreseinkommen (Y) zwei Auspr¨agungen: Y <40 000 und Y ≥ 40 000. Beurteilen Sie mit Hilfe des korrigierten Kontingenzkoeffizienten den Zu- sammenhang zwischen den beiden Merkmalen. Wird Ihre Vermutung aus Teilaufgabe (b) dabei best¨atigt? (12 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(6)

Aufgabe 5: Querbeet (20 Punkte) Vorname

Nachname

Matrikelnummer

Unterschrift

Wichtige Hinweise: Dieser Bogen (Vor- und R¨uckseite) wird maschinell ausge- wertet. Es werden nur Markierungen innerhalb der K¨astchen ber¨ucksichtigt. Mar- kieren Sie jeweils, ob die angegebene Aussage zutrifft oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht. Falls Sie korrigieren m¨ussen, schw¨arzen Sie bitte das falsche K¨astchen komplett aus und kreuzen Sie das richtige K¨astchen an.

Begr¨undung Begr¨undung

Beispiel

2

Richtig

2

1 Korrektur

2

Richtig

2

1

2

Falsch

2

2

2

Falsch

2

2

2

3

2

3

a) Der Median eines ordinalskalierten Merkmals X kommt stets in der Urliste zu X vor.

(4 Punkte)

2

Richtig

2

Das Lagemaß ist bei gerader Anzahl an Merkmalsauspr¨agungen immer in der Urliste enthalten.

2

Falsch

2

Falls keine Bindungen in den Daten vorhanden sind, ist das La- gemaß ausschließlich in der Urliste enthalten, wenn n·p ganz- zahlig ist.

2

Falls keine Bindungen in den Daten vorhanden sind, ist das La- gemaß ausschließlich in der Urliste enthalten, wenn n ·p nicht ganzzahlig ist.

b) F¨ur Merkmale mit negativen Werten eignet sich das geometrische Mittel am besten, um die Lage der Verteilung zu beschreiben. (4 Punkte)

2

Richtig

2

Das arithmetische Mittel ist f¨ur Merkmale mit negativen Werten nicht definiert.

2

Falsch

2

Das geometrische Mittel ist f¨ur Merkmale mit negativen Werten nicht definiert.

2

Das geometrische Mittel ist ein Maß f¨ur die Schiefe einer Ver-

(7)

c) Zur grafischen Darstellung eines qualitativen Merkmals ist ein Balkendiagramm dem S¨aulendiagramm vorzuziehen. (4 Punkte)

2

Richtig

2

Bei einem Balkendiagramm ist die Fl¨ache der Balken proportio- nal zur H¨aufigkeit.

2

Falsch

2

Bei einem S¨aulendiagramm ist die L¨ange der S¨aulen proportio- nal zur H¨aufigkeit.

2

Beide Diagramme sind zur Darstellung qualitativer und quanti- tativer Merkmale gleich gut geeignet.

d) Die grafische Darstellung einer empirischen Verteilungsfunktion erfolgt immer als Trep- penfunktion. (4 Punkte)

2

Richtig

2

Die Darstellungsart der Verteilungsfunktion h¨angt von der Art des Merkmals ab.

2

Falsch

2

Die empirische Verteilungsfunktion kann auch als Stabdia- gramm grafisch dargestellt werden.

2

Die empirische Verteilungsfunktion kann nur f¨ur klassierte Da- ten grafisch dargestellt werden.

e) Unterstellen Sie ein metrisches Merkmal. Dann k¨onnen klassierte H¨aufigkeitsverteilungen immer in unklassierte H¨aufigkeitsverteilungen umgewandelt werden, aber unklassierte H¨aufigkeitsverteilungen k¨onnen nicht immer in klassierte H¨aufigkeitsverteilungen umge- wandelt werden.(4 Punkte)

2

Richtig

2

Unklassierte H¨aufigkeitsverteilungen k¨onnen immer in klassier- te H¨aufigkeitsverteilungen umgewandelt werden, aber klassier- te H¨aufigkeitsverteilungen k¨onnen nicht immer in unklassierte H¨aufigkeitsverteilungen umgewandelt werden.

2

Falsch

2

Urlistendaten k¨onnen immer in unklassierte H¨aufigkeitsverteilungen umgewandelt werden und unklas- sierte H¨aufigkeitsverteilungen k¨onnen immer in Urlistendaten umgewandelt werden.

2

Unklassierte H¨aufigkeitsverteilungen k¨onnen immer in klas- sierte H¨aufigkeitsverteilungen umgewandelt werden und klas- sierte H¨aufigkeitsverteilungen k¨onnen immer in unklassierte H¨aufigkeitsverteilungen umgewandelt werden.

14778485

Referenzen

ÄHNLICHE DOKUMENTE

b) Es liegt eine Datenreihe vor, auf dessen Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini-

Im Vergleich zu den befragten Studenten machen sich doppelt so viele Studentinnen manchmal oder oft Sorgen ¨ uber ihre Klausuren.

Um die Höhe der Streuung zu beurteilen, muss der normierte MAD berechnet wer- den... d) Bei Vorliegen einer symmetrischen Verteilung (d.h., Median und arithmetisches Mittel

Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie)

32 Besch¨ aftigte erhielten eine Gratifikation, waren aber gleichzeitig mit ihrer Arbeitssituation nicht zufrieden. (a) Stellen Sie die genannten H¨ aufigkeiten in einer 2

Dabei bedeutet Y = 1, dass im Familienkreis des Befragten eine Person an Lungenkrebs erkrankt ist, Y = 2, dass ein Lungenkrebsfall im Bekanntenkreis auftritt, und Y = 3, dass weder

Dabei muss der Studierende jeweils zun¨ achst die Richtigkeit einer Aus- sage einsch¨ atzen (zwei Antwortm¨ oglichkeiten: richtig/falsch) und anschließend die passende Begr¨ undung

(a) Durch welche Modellsituation (d.h., durch welche Verteilung mit welchen Parametern) l¨asst sich die Frage nach der Wahrscheinlichkeit, dass genau ein erfahrener Mitarbeiter