• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2016/2017 08.02.2017

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2016/2017 08.02.2017"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2016/2017

08.02.2017

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

a) Auf Basis des Jahresumsatzes von 5 in einem Markt konkurrierenden Unternehmen wurde ein normierter Gini-Koeffizient von 0.5 ermittelt. F¨ur eine erneute Berechnung wurden die Jahres- ums¨atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll).

Der Gini-Koeffizient auf Basis der Ums¨atze in Dollar ist identisch zu dem auf Basis der Ums¨atze in Euro.

Richtig Falsch

Ein normierter Gini-Koeffizient von 0.5 deutet darauf hin, dass alle Unternehmen den gleichen Umsatz erzielen. Daher bleibt der Gini-Koeffizient auch nach der Umrechnung in Dollar konstant.

Die absoluten Umsatzunterschiede werden durch die Umrechnung gr¨oßer (z.B. zwei Unternehmen mit 1 und 10 Mio. Euro Umsatz: 10 – 1 = 9 Mio. Euro; nach Umrechnung: 11 – 1.1 = 9.9 Mio. Dollar) Das Ungleichgewicht am Markt nimmt somit zu. Daher wird der Gini-Koeffizient gr¨oßer.

Da sich die relativen Merkmalsanteile durch die Umrechnung nicht ¨andern, bleibt der Gini- Koeffizient konstant.

b) Auf Basis des Jahresumsatzes von 5 in einem Markt konkurrierenden Unternehmen wurde ein Schiefekoeffizient nach Pearson von 0.5 ermittelt. F¨ur eine erneute Berechnung wurden die Jah- resums¨atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der Ums¨atze in Dollar ist identisch zu dem auf Basis der Ums¨atze in Euro.

Richtig Falsch

Ein Schiefekoeffizient von 0.5 deutet darauf hin, dass die Ums¨atze symmetrisch verteilt sind.

Daher bleibt der Schiefekoeffizient auch nach der Umrechnung in Dollar konstant.

Die Schiefe bleibt konstant, da die Form der Verteilung der Ums¨atze bei der Umrechnung gleich bleibt.

Die Schiefe nimmt zu, da durch die Umrechnung die neuen Ums¨atze betragsm¨aßig gr¨oßer als die urspr¨unglichen Ums¨atze sind.

c) Auf Basis des Jahresumsatzes von 5 in einem Markt konkurrierenden Unternehmen wurde ein Variationskoeffizient von 0.5 ermittelt. F¨ur eine erneute Berechnung wurden die Jahresums¨atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Va- riationskoeffizient auf Basis der Ums¨atze in Dollar ist identisch zu dem auf Basis der Ums¨atze in Euro.

Richtig Falsch

Die Umrechnung hat einen Einfluss sowohl auf die Streuung (d.h. den Z¨ahler des Variationskoef- fizienten) als auch die Lage (d.h. den Nenner). Die Effekte heben sich allerdings auf. Daher bleibt der Variationskoeffizient konstant.

Ein Variationskoeffizient < 1 deutet darauf hin, dass alle Unternehmen den gleichen Umsatz erzielen. Daher bleibt der Variationskoeffizient auch nach der Umrechnung in Dollar konstant.

Die Umrechnung hat einen Einfluss sowohl auf die Streuung (d.h. den Z¨ahler des Variationskoef- fizienten) als auch die Lage (d.h. den Nenner). Da bei linearen Transformationen ˜s2y =a2·s˜2xund y¯=a·x¯ gilt und weil hier a= 1.1, ist der Nettoeffekt 1.1. Daher wird der Variationskoeffizient gr¨oßer.

(3)

d) Auf Basis des Jahresumsatzes von 5 in einem Markt konkurrierenden Unternehmen wurde ein Interquartilsabstand von 0.5 ermittelt. F¨ur eine erneute Berechnung wurden die Jahresums¨atze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Inter- quartilsabstand auf Basis der Ums¨atze in Dollar ist identisch zu dem auf Basis der Ums¨atze in Euro.

Richtig Falsch

Der Interquartilsabstand basiert auf Quartilen und ist deshalb ein robustes Streuungsmaß. Daher bleibt der Interquartilsabstand auch nach der Umrechnung in Dollar konstant.

Sofern der urspr¨ungliche Interquartilsabstand >0 ist, vergr¨oßert sich durch die Umrechnung in Dollar der Interquartilsabstand.

Sowohl das obere als auch das untere Quartil machen die Umrechnung (d.h. die lineare Trans- formation) mit. Die Differenz zwischen den Quartilen ist somit konstant. Daher bleibt auch der Interquartilsabstand konstant.

e) F¨ur einen Datensatz bestehend aus 5 Beobachtungen (z.B. der Jahresumsatz von 5 in einem Markt konkurrierenden Unternehmen) k¨onnen der Variationskoeffizient und der Interquartils- abstand nicht gleichzeitig einen Wert von 0.5 annehmen.

Richtig Falsch

Rechtsschiefe und ein positiver Interquartilsabstand sind nicht gleichzeitig m¨oglich.

Die Beobachtungenx1 = 0.25, x2= 0.75, x3 = 1, x4 = 1.25 undx5 = 1.75 erf¨ullen die Bedingung.

Ein positiver Variationskoeffizient und ein positiver Interquartilsabstand sind nicht gleichzeitig m¨oglich.

Aufgabe 2: Lage-, Streuungs-, Schiefemaße (20 Punkte)

Im Rahmen einer Abschlussarbeit interessiert sich eine Studentin f¨ur die Servicequalit¨at von Arztpraxen aus Sicht von Patienten. Dazu erhebt sie u.a. die Anzahl der Hausarztbesuche im Jahr 2016. F¨ur 10 ausgew¨ahlte Personen erh¨alt sie folgende Werte:

Person 1 2 3 4 5 6 7 8 9 10

Anzahl Hausarztbesuche 0 3 0 7 20 8 1 4 6 5

(a) Berechnen Sie die Lagemaße der Datenreihe, die f¨ur das vorliegende Skaleniveau zul¨assig sind, und interpretieren Sie diese jeweils.(8 Punkte)

(b) Ein Studienkollege empfiehlt auf Grund der vorliegenden Rohdaten, den Median zur Be- schreibung der Daten heranzuziehen. Wie sch¨atzen Sie diesen Ratschlag ein? Begr¨unden Sie kurz Ihre Meinung.(3 Punkte)

(c) Zeichnen Sie den entsprechenden Boxplot f¨ur die Verteilung. Bestimmen Sie hierzu die notwendigen Kennwerte. (6 Punkte)

(d) Auf Basis der bisher bearbeiteten Teilaufgaben k¨onnen Sie eine Aussage zur Schiefe der Daten machen. Wie lautet Ihr Urteil und auf welche Informationen k¨onnen Sie Ihre Aus- sage st¨utzen? (3 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an.

(4)

Aufgabe 3: Konzentrationsmaße (20 Punkte)

Der Markt f¨ur Unterhaltungsangebote ist nicht erst seit gestern durch kostenlose und frei zug¨angliche Angebote wie YouTube wesentlich erweitert worden. Vor allem das j¨ungere Pu- blikum ist mit dem Medium Internet aufgewachsen und sieht Online-Plattformen wie YouTube oder Twitch als echte Alternativen zu konventionellen Unterhaltungsmedien an.

F¨ur Unternehmen mit einer j¨ungeren Zielgruppe f¨uhrt daher kein Weg daran vorbei, sich mit solchen Alternativen auseinander zu setzen, um auch dort ihre Werbung zu platzieren.

Um sich einen ¨Uberblick ¨uber den deutschen Markt an Unterhaltungsangeboten auf YouTube zu verschaffen, fragt sich ein Unternehmer, wie sich die Views (Videoaufrufe) auf die deutschen YouTuber (Anbieter von Videos auf YouTube) aufteilen.

F¨ur seine Analyse verwendet er die in der folgenden Tabelle enthaltenen Daten.

Tabelle 1: Die 10 erfolgreichsten deutschen YouTuber

Kanal Abonnenten Views (in Mio.) ver¨offentlichte Videos

freekickerz 4 983 621 1 143.0 1 022

Gronkh 4 314 556 1 918.0 8 413

Bibisbeautypalace 4 116 239 3 551.0 1 606

kontor.tv 3 938 978 909.0 390

ApeCrime 3 508 355 675.5 593

YTITTY 3 125 755 750.0 375

DieAussenseiter 2 474 000 564.8 439

iBlali 2 404 585 370.7 323

Kurzgesagt - In a Nutshell 2 329 512 118.4 48

Julien Bam 2 289 581 285.9 162

Quelle: http://de.youtube.wikia.com/wiki/Top_100/Deutschland, abgerufen am 16.01.2017.

(a) Auf Anfrage des Unternehmers behauptet ein Experte, dass zur Analyse der Konzentra- tion der Views auf dem deutschen YouTube-Markt die Lorenzkurve herangezogen werden kann. Er stellt dem Unternehmer Abbildung 1 (siehe n¨achste Seite) zur Verf¨ugung. Wie sch¨atzen Sie die Behauptung des Experten ein? K¨onnen Sie mit Hilfe dieser Abbildung eine Aussage ¨uber die Konzentration treffen? Begr¨unden Sie Ihre Einsch¨atzung.(4 Punk- te)

(b) Zeichnen Sie Ihrerseits die zu den in Tabelle 1 genannten Daten geh¨orende Lorenzkurve und ermitteln Sie ein geeignetes Maß f¨ur die relative Konzentration auf dem Markt. In- terpretieren Sie Ihr Ergebnis formal und inhaltlich. (Verwenden Sie f¨ur Ihre Berechnung und Zeichnung die bereits zum Teil ausgef¨ullte Tabelle 2 und das Koordinatensystem in Abbildung 1!)(14 Punkte)

(c) Ein zweiter Experte wird f¨ur die Analyse herangezogen. Er behauptet, dass die Analyse aus (b) nicht daf¨ur ausreicht, um die Situation auf YouTube Deutschland einzusch¨atzen.

Hat er mit seinen Behauptungen recht? Begr¨unden Sie.(2 Punkte) Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Abbildung 1: Lorenzkurve der Views laut Angabe eines Experten

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

Tabelle 2: Vorlage f¨ur Berechnungen zur Ermittlung vom Gini-Koeffizienten und Lorenzkurve aus Aufgabe 3(b)

i xi fi ui v˜i vi ui·v˜i ui−1·v˜i

1 118.4 0.1

2 285.9 0.1 0.0278 0.0393

3 370.7 0.1 0.0360 0.0753

4 564.8 0.1 0.1302

5 675.5 0.1 6 750.0 0.1

7 909.0 0.1 0.0884

8 1 143.0 0.1 0.1111 0.4683

9 1 918.0 0.1 0.1865 0.6548

10 3 551.0 0.1

P 10 286.3 1

(6)

Aufgabe 4: Regressionsanalyse (20 Punkte)

Die folgende Abbildung zeigt das K¨orpergewicht y (in kg) von 50 Frauen in Abh¨angigkeit von deren Alter x.

0 20 40 60 80

020406080

Alter in Jahren

Körpergewicht in kg

(a) Berechnen Sie ein einfaches lineares Regressionsmodell, erg¨anzen Sie dieses in der Grafik und interpretieren Sie die ermittelten Koeffizienten. (8 Punkte)

(b) F¨ur wie sinnvoll erachten Sie ein einfaches lineares Regressionsmodell in der gegebenen Situation? Welches Problem sehen Sie und wie k¨onnte man es adressieren? (2 Punkte) (c) Angenommen, in der oberen Abbildung w¨are das K¨orpergewicht in Unzen anstatt in

Kilogramm angegeben (wobei vereinfachend 1 kg = 35 Unzen sein soll). Leiten Sie formal her, wie sich die berechneten Koeffizienten im einfachen linearen Regressionsmodell bei einer derartigen Transformation der Daten ver¨andern.(10 Punkte)

Hilfsgr¨oßen: P50i=1xi · yi = 79038.9; P50i=1x2i = 61659.29; P50i=1yi2 = 125897.4; x = 27.4494;

y= 46.1777.

Hinweise:Geben Sie jeweils zun¨achst die allgemeinen Formeln an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(7)

Aufgabe 5: Zusammenhangsanalyse (20 Punkte)

Betrachten Sie erneut die Daten aus Aufgabe 4.

(a) ¨Uberf¨uhren Sie die Daten in eine 2×2-Kontingenztafel. Bilden Sie dazu f¨ur das Merkmal

”K¨orpergewicht” zwei Auspr¨agungen: leicht (< 50 kg) und schwer (≥ 50 kg), und f¨ur das Merkmal ”Alter” ebenfalls zwei Auspr¨agungen: jung (< 20 Jahre) und alt (≥ 20 Jahre). Beurteilen Sie anschließend den Zusammenhang der beiden Merkmale anhand des korrigierten Kontingenzkoeffizienten. (12 Punkte)

(b) Ein Experte meldet sich und behauptet, dass die Wahl der Grenzen in den beiden Merk- malen (50 kg bzw. 20 Jahre) zu dem hohen Wert des korrigierten Kontingenzkoeffizienten in (a) gef¨uhrt hat und dass bei anders gesetzten Grenzen auch ein niedrigerer Wert m¨oglich ist. Hat der Experte damit Recht? Begr¨unden Sie Ihre Entscheidung. (3 Punkte)

(c) Welche Eigenschaft muss eine Kontingenztafel aufweisen, damit der zugeh¨orige korrigierte Kontingenzkoeffizient den Wert 0 annimmt? (5 Punkte)

Hinweise:Geben Sie jeweils zun¨achst die allgemeinen Formeln an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Abbildung

Tabelle 1: Die 10 erfolgreichsten deutschen YouTuber
Tabelle 2: Vorlage f¨ ur Berechnungen zur Ermittlung vom Gini-Koeffizienten und Lorenzkurve aus Aufgabe 3(b)

Referenzen

ÄHNLICHE DOKUMENTE

Dann k¨ onnen klassierte H¨ aufigkeitsverteilungen immer in unklassierte H¨ aufigkeitsverteilungen umgewandelt werden, aber unklassierte H¨ aufigkeitsverteilungen k¨ onnen nicht

x Unklassierte Häufigkeitsverteilungen können immer in klassierte Häufigkeits- verteilungen umgewandelt werden, aber klassierte Häufigkeitsverteilungen können nicht immer

Wachstumsraten sind nur ordinal skaliert, daher kann das arithmetische Mittel nicht benutzt werden.. Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel

Die Verteilungen des Familienstands in den beiden unteren Altersklassen sind sich eher ¨ahnlich (0.5 Punkte), die in den beiden oberen sind sich auch eher ¨ahnlich (0.5

Der Zusammenhang besteht nicht zwischen der Impfung gegen die normale Grippe und der Anzahl der Schweinegrippe-F¨alle, son- dern beispielsweise zwischen der Impfung gegen die

x Das arithmetische Mittel darf nur f¨ur metrisch skalierte Merkmale berechnet werden, jedoch nicht f¨ur ordinal oder nominal skalierte Merkmale2. Das arithmetische Mittel darf nur

(b) Wie ¨andert sich der Wert der absoluten Konzentration f¨ur Staat 2, wenn eine neue Verwaltungsregion eingerichtet wird, die nicht verschuldet ist.. Zeigen Sie das Ergebnis

F¨ur die Dauer der Arbeitssuche betrach- ten Sie die beiden folgenden Varianten der Rangvergabe: Version 1 vergibt den ersten Rang f¨ur die k¨urzeste Dauer, Version 2 dagegen