• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2017/2018 27.03.2018

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2017/2018 27.03.2018"

Copied!
6
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2017/2018

27.03.2018

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

a) Die drei Grundaufgaben der Statistik sind das Beschreiben des Datenmaterials, das Suchen nach Strukturen und die Gewinnung neuer Forschungshypothesen sowie das Schließen von Experiment bzw. Stichprobe auf die Grundgesamtheit.

Richtig Falsch

Die Statistik dient einzig der Beschreibung, Komprimierung und Visualisierung von Daten.

Die drei Grundaufgaben sind die deskriptive, explorative und induktive Analyse von Daten.

Die einzige Aufgabe der Statistik ist es, allgemeine Schlussfolgerungen ¨uber die Grundgesamtheit zu ziehen.

b) Das arithmetische Mittel und der Median sind Lagemaße, die das Zentrum einer Verteilung beschreiben.

Richtig Falsch

Lagemaße beschreiben immer das Zentrum einer Verteilung.

Der Median ist das einzige Lagemaß, das das Zentrum einer Verteilung beschreibt. Er wird aus diesem Grund auch als Zentralwert bezeichnet.

Ob ein Lagemaß das Zentrum einer Verteilung beschreibt, ist von den Eigenschaften des Lage- maßes abh¨angig. Das arithmetische Mittel und der Median besitzen diese Eigenschaften.

c) Untersuchungseinheiten werden auch als Merkmalstr¨ager bezeichnet.

Richtig Falsch

Merkmalstr¨ager beschreiben ein Einzelobjekt einer statistischen Untersuchung.

Merkmalstr¨ager werden hinsichtlich des erhobenen Merkmals beschrieben und d¨urfen deshalb nicht mit dem Begriff Untersuchungseinheit vermischt werden.

Merkmalstr¨ager werden nur durch Merkmal und Merkmalsauspr¨agung definiert.

d) Sei y=a·x+b+εein einfaches lineares Modell. Dann hat das Sch¨atzen der Regressionskoeffi- zienten mithilfe der Kleinsten Quadrate Methode zum Ziel,Pni=1(yiyˆi)2 zu minimieren.

Richtig Falsch

Die Kleinste Quadrate Methode bestimmt die Regressionskoeffizienten so, dass Pn

i=1(yi−(ˆa·xi+ ˆb))2 minimiert wird.

Die Kleinste Quadrate Methode bestimmt die Regressionskoeffizienten so, dass Pni=1(yiy)¯2 minimiert wird.

Die Kleinste Quadrate Methode bestimmt die Regressionskoeffizienten so, dass Pni=1( ˆyiy)¯2 minimiert wird.

(3)

e) Die Kovarianz der Merkmale X und Y kann nicht interpretiert werden und dient lediglich der Berechnung des Korrelationskoeffizienten nach Bravais-Pearson.

Richtig Falsch

Die Kovarianz kann hinsichtlich der Richtung des Zusammenhangs interpretiert werden.

Im Gegensatz zur Varianz werden die Gr¨oßeneinheiten der Merkmale bei der Berechnung der Kovarianz nicht quadriert, sodass die Kovarianz eine genaue Auskunft ¨uber St¨arke und Richtung des Zusammenhangs gibt.

Die Kovarianz kann nicht interpretiert werden, da sie die Summe des Produktes der Abweichungen zweier MerkmaleX und Y von ihrem Mittelwert ist.

Aufgabe 2: Eindimensionale Merkmale (20 Punkte)

In einer Online-Erhebung zum Hochschulsport wird, neben weiteren Merkmalen, auch das K¨orpergewicht (in kg) von Studierenden abgefragt. Aus einer Vorstudie sind folgende 20 Werte bekannt:

79 73 70 71 80 70 68 66 80 80 74 80 70 76 75 84 83 73 76 69 (a) Stellen Sie die abgebildete Urliste in einem Histogramm dar und beschreiben Sie Ihr

Vorgehen. W¨ahlen Sie dabei eine Klassenbreite von 3 und eine Untergrenze von 65 kg.

(11.5 Punkte)

(b) Ist die grafische Darstellung mittels Histogramm f¨ur das Merkmal K¨orpergewicht geeig- net? Erl¨autern Sie Ihre Meinung.(2.5 Punkte)

(c) Die Statistik ist die Grundlage aller empirischen Wissenschaften. In welche drei Teilbe- reiche wird die Statistik untergliedert? Nennen Sie jeweils die grundlegenden Aufgaben.

Notieren Sie dazu jeweils eine Beispielfrage bzw. Problemstellung, die f¨ur diesen Teilbe- reich typisch ist. (6 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen

(4)

Aufgabe 3: Zusammenhangsanalyse (20 Punkte) Das international t¨atige Unternehmen

”Pear Inc.“ arbeitet an einer Neuauflage seines belieb- ten Produktes

”aPad“. Leider sind die Verkaufszahlen f¨ur einzelne M¨arkte nicht so detailliert archiviert, wie das Unternehmen sie gern f¨ur die Planung h¨atte. Das Unternehmen geht davon aus, dass das aPad II ¨ahnlich beliebt sein wird wie das aPad. Im Zuge der Produktions- und Finanzplanung geht man dabei von den vorhandenen Verkaufszahlen aus.

Es ist bekannt, dass das aPad 850 000 Mal verkauft wurde. Das aPad wurde in 76 Prozent der F¨alle von M¨annern gekauft. Die H¨alfte des Verkaufs wurde durch die Farbe

”Weiß“ generiert.

Anl¨asslich des Valentinstages gab es eine Sonderedition des Pads in

”Rosa“ i.H.v. 10 000 St¨uck, welche restlos ausverkauft wurde. Die 10 000 St¨uck der limitierten Weihnachtssonderedition in

”Gold“ konnten ebenfalls restlos abgesetzt werden.

(a) Mit welchen Verkaufszahlen kann

”Pear Inc.“ f¨ur die einzelnen Farben bei weiblichen und bei m¨annlichen K¨aufern rechnen? Nehmen Sie an, es herrscht Unabh¨angigkeit zwischen dem Geschlecht des K¨aufers X und der Farbe des aPad II Y. (8 Punkte)

(b) In einer Bachelorarbeit zum Thema

”Genderorientiertes Marketing“ wurde eine Tabelle mit der tats¨achlichen Verteilung der verkauften aPads gefunden:

Tabelle 1:Verkaufszahlen f¨ur das aPad aus 2029 Farbe Frauen M¨anner

Schwarz 105 000 300 000 Weiß 90 000 335 000 Rosa 8 500 1 500

Gold 500 9 500

Berechnen Sie mit Hilfe eines geeigneten Koeffizienten, ob ein Zusammenhang zwischen den Variablen

”Farbe“ und

”Geschlecht“ besteht. Interpretieren Sie ihr Ergebnis. Nutzen Sie f¨ur Ihre Berechnungen die bereit gestellten Hilfsgr¨oßen. (12 Punkte)

Hilfsgr¨oßen:

χ2 = 25060.5578; ¯x= 105250; ¯y= 105250; ˜s2x= 1440000.125; ˜s2y = 1440000.125

Hinweise:Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Re- chenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Aufgabe 4: Konzentrationsmaße (20 Punkte) Das Unternehmen

”Pear Inc.“ hat sein Produkt aPad II erfolgreich im heimischen Markt ein- gef¨uhrt. Es konnte tats¨achlich die gleiche Gesamtverkaufsmenge wie f¨ur das aPad verzeichnet werden. Da der heimische Markt sehr großund heterogen ist, wurde eine Teilung des gesamten Marktes in 4 Teilm¨arkte im Hinblick auf optimiertes Marketing, Logistik und Controlling als sinnvoll empfunden. Die Verkaufszahlen liegen daher in Form der folgenden Tabelle 2 vor.

Tabelle 2:Verkaufszahlen f¨ur das aPad II aus 2030 auf 4 Teilm¨arkten

1 2 3 4

Schwarz 55 500 109 500 12 500 8 000 Weiß 155 000 100 500 199 000 201 000

Rosa 1 500 2 000 500 3 000

Gold 500 500 500 500

(a) Wenn Sie die Verkaufszahlen des aPad II den Verkaufszahlen des aPad gegen¨uberstellen, was f¨allt Ihnen dabei auf? Nutzen Sie f¨ur Ihre Einsch¨atzung die angegebene Arbeitstabelle.

Stellen Sie Ihr Ergebnis in geeigneter Form graphisch dar.(15 Punkte) Tabelle 3: Arbeitstabelle

aPad aPad II

q fq uq x(q) v˜q vq x(q) v˜q vq

1

2

3

4

P

(b) Ermitteln Sie f¨ur die vorliegenden Daten den Gini-Koeffizienten. Stimmen Ihre Einsch¨atzungen aus (a) mit dem Ergebnis aus Ihrer Berechnung und Interpretation des Koeffizienten

¨uberein? (5 Punkte) Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(6)

Aufgabe 5: Analyse zeitlicher Verl¨aufe (20 Punkte)

SPIEGEL ONLINE ver¨offentlichte am 20.04.2017 einen Artikel mit dem Titel “Vernetflixt”.

Das Thema dieses Artikels war Video-on-Demand und die Frage, ob das Kino bald ausstirbt.

Bei der Betrachtung der Ums¨atze des Streamingdienstes Netflix liegt die Vermutung nahe, dass die Nachfrage nach Video-on-Demand in den letzten Jahren enorm gestiegen ist. Abbildung 1 zeigt den Umsatz von Netflix in Millionen US-Dollar von 2004 bis 2017.

Abbildung 1: Der Umsatz von Netflix in Mio. US-Dollar von 2004 bis 2017

2004 2006 2008 2010 2012 2014 2016

20004000600080001000012000

Jahr

Umsatz in Mio. US−Dollar

Quelle: Eigene Darstellung in Anlehnung an https://de.statista.com/statistik/daten/

studie/183336/umfrage/umsatz-von-netflix-seit-2002/, Abruf am 28.02.2018.

(a) Ein Experte vermutet, dass der Verlauf des Umsatzes von Netflix in Mio. US-Dollar nicht linear ist. Hat er damit recht? Begr¨unden Sie Ihre Entscheidung. Um den Verlauf zu linearisieren, vermutet der Experte, dass der Umsatz logarithmiert werden muss. Er formuliert folgende lineare Funktion: ln(U msatz) = a·J ahr+b+ε. Bestimmen Sie die Regressionskoeffizienten. Das BestimmheitsmaßR2 des Modells ist 0.9952. Interpretieren Sie diesen Wert.(10 Punkte)

(b) Sch¨atzen Sie mithilfe der in (a) bestimmten Regressionskoeffizienten den von Netflix ge- nerierten Umsatz in Mio. US-Dollar im Jahr 2002. Beachten Sie dabei, dass der logar- tihmierte Umsatz gesch¨atzt wird (Hinweis: x =ln(ex)). Die tats¨achlichen Umsatzzahlen von Netflix betrugen im Jahr 2002 150.8 Mio. US-Dollar. Vergleichen Sie den Wert mit dem gesch¨atzten Wert. Erkl¨aren Sie, weshalb die Werte nicht ¨ubereinstimmen. Welches generelle Problem besteht?(10 Punkte)

Hilfsgr¨oßen:

P14

i=1J ahri·U msatzi = 105 878 685; P14i=1J ahr2i = 56 589 771;

P14

i=1U msatzi2 = 345 889 008; J ahr= 2010.5;

U msatz = 3 755.608; P14i=1J ahri·ln(U msatzi) = 220 390.5;

P14

i=1ln(U msatzi)2 = 870.2105; ln(U msatz) = 7.8281.

Hinweise:Geben Sie jeweils zun¨achst die allgemeinen Formeln an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Abbildung

Tabelle 1: Verkaufszahlen f¨ ur das aPad aus 2029 Farbe Frauen M¨ anner
Tabelle 2: Verkaufszahlen f¨ ur das aPad II aus 2030 auf 4 Teilm¨ arkten
Abbildung 1: Der Umsatz von Netflix in Mio. US-Dollar von 2004 bis 2017

Referenzen

ÄHNLICHE DOKUMENTE

Der Median ist unempfindlich gegenüber „Ausreißer“, daher müssen die Beobachtungs- werte zu einer Berechnung auch nicht der Größe nach sortiert werden... d) Der χ 2

a) Im Zuge einer Studie wird f¨ ur die Merkmale Schuhgr¨ oße und K¨ orpergr¨ oße der Korrelationsko- effizient r XY = 0.636 ermittelt. Addiert man zu jedem beobachteten Wert den

(2 Punkte) Allerdings wäre die Klausur dadurch bereits zum ersten Termin bestanden und er hätte dadurch den zweiten Termin nicht gebraucht.

F¨ ur eine erneute Berechnung wurden die Jah- resums¨ atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der

Für eine erneute Berech- nung wurden die Jahresumsätze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an