• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2016/2017 29.03.2017

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2016/2017 29.03.2017"

Copied!
6
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2016/2017

29.03.2017

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

a) Im Zuge einer Studie wird f¨ur die Merkmale Schuhgr¨oße und K¨orpergr¨oße der Korrelationsko- effizientrXY = 0.636 ermittelt. Werden die Variablen z-transformiert, so nimmt die empirische Kovarianz vonX undY den Wert 0.636 an.

Richtig Falsch

In diesem Fall entspricht die Kovarianz nicht dem Korrelationskoeffizienten, da f¨ur die Kovarianz einer z-standardisierten Variable gilt 0≤esXY ≤1.

Nach der Standardisierung gilt esX =seY = 0, sodass die Kovarianz den Wert 0.636 annimmt.

F¨ur z-transformierte Variablen entspricht die Kovarianz der Korrelation, da nach der Standar- disierungseX =esY = 1 gilt.

b) F¨ur eine Datenreihe wird die zentrale Tendenz beschrieben. Addiert man zu jedem beobachteten Wert den Wert ‘10‘ hinzu, dann ¨andert sich das arithmetische Mittel nicht.

Richtig Falsch

Das arithmetische Mittel ist empfindlich gegen¨uber Ausreißern, daher wird es durch diese Trans- formation ver¨andert.

Das arithmetische Mittel erh¨oht sich um den entsprechenden Wert.

Da sich die relativen Merkmalsanteile durch die Addition nicht ¨andern, bleibt das arithmetische Mittel konstant.

c) Das politische Interesse der Bev¨olkerung wird in einer repr¨asentativen Umfrage durch eine 4- stufige Skala (von 1. . .

”¨uberhaupt nicht“ bis 4. . .

”stark“) erhoben. Zur deskriptiven Darstellung der absoluten H¨aufigkeiten empfiehlt sich ein Histogramm.

Richtig Falsch

In einem Histogramm kann die Verteilung eines diskreten Rangmerkmals besonders ¨ubersichtlich dargestellt werden.

Zur Darstellung dieses Rangmerkmals sind einfache Balken- oder S¨aulendiagramme angemessen.

Zur Gegen¨uberstellung diskreter Daten in zwei oder mehr Teilstichproben ist ein Boxplot sehr gut geeignet.

d) Zur Bestimmung der durchschnittlichen Wachstumsrate wird das geometrische Mittel benutzt.

Richtig Falsch

Wachstumsraten sind metrisch skaliert, daher ist das arithmetische Mittel geeignet.

Bei Wachstumsraten mit negativen Beobachtungswerten kann das geometrische Mittel nicht verwendet werden.

Wachstumsraten werden durch Multiplikation bestimmt, daher kommt das geometrische Mittel zur Anwendung.

(3)

e) Ein metrisches Merkmal kann nur bedingt in ein ordinales Merkmal umgewandelt werden. Um- gekehrt ist es hingegen immer m¨oglich.

Richtig Falsch

Merkmale k¨onnen ausschließlich in eine niedrigere Skala ¨uberf¨uhrt werden.

Lediglich diskrete Merkmale k¨onnen in eine h¨ohere Skala ¨uberf¨uhrt werden.

Die Art der Erhebung von Merkmalen bedingt die sp¨atere M¨oglichkeit einer Umwandlung.

Aufgabe 2: Regressionsanalyse (20 Punkte)

Anhand der ALLBUS-Daten 2014 kann bestimmt werden, inwiefern die Dauer der schulischen Ausbildung x (in Jahren) die durchschnittliche Fernsehgesamtdauer pro Tag y (in Minuten) vorhersagt. F¨ur die Analyse werden 1 649 F¨alle ber¨ucksichtigt.

(a) Berechnen Sie ein einfaches lineares Regressionsmodell und interpretieren Sie die ermittel- ten Koeffizienten. Wie hoch ist die durchschnittliche Fernsehgesamtdauer pro Tag anhand der gesch¨atzten Regressionsgleichung bei 10 Jahren schulischer Ausbildung? (9 Punkte) (b) Nun interessieren geschlechtsspezifische Unterschiede hinsichtlich der Fernsehgesamtdau-

er pro Tag y. Dazu liegt folgende Sch¨atzgleichung vor: ˆy = 228− 12.29· D. Die un- abh¨angige Variable D entspricht dem Geschlecht, wobei M¨annern die Auspr¨agung

”0“

und Frauen die Auspr¨agung

”1“ zugewiesen wurde (sogenannte Dummy-Kodierung). Zu diesem Regressionsmodell folgen nun einige Aussagen, bei denen Sie sich f¨ur eine der Ant- wortm¨oglichkeiten richtig, falsch oder keine Aussage m¨oglich entscheiden m¨ussen.

Begr¨unden Sie Ihre Wahl! (6 Punkte)

1. Der Fernsehkonsum bei M¨annern pro Tag ist im Schnitt h¨oher als bei Frauen.

2. Die Differenz zwischen M¨annern und Frauen liegt im Schnitt bei 215.71 Minuten Fernsehkonsum.

3. Frauen schauen im Schnitt 228 Minuten am Tag fern.

(c) Angenommen, die Dauer der schulischen Ausbildung w¨urde in Monaten statt in Jahren gemessen, begr¨unden Sie, welche Auswirkung dies auf den Regressionskoeffizienten ˆa im einfachen linearen Regressionsmodell aus Teilaufgabe (a) h¨atte. (5 Punkte)

Hilfsgr¨oßen: P1 649i=1 xi ·yi = 2 957 245; P1 649i=1 x2i = 272 992; P1 649i=1 yi2 = 51 464 393; x = 12.3069;

y= 152.7502.

Hinweise:Geben Sie jeweils zun¨achst die allgemeinen Formeln an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(4)

Aufgabe 3: Kennzahlen (20 Punkte)

Die folgende Abbildung zeigt das Ergebnis der Analyse der Konzentration von 5 an einem Markt konkurrierenden Unternehmen. Leider sind sowohl in der Abbildung als auch in der zugrunde liegenden Tabelle einige Angaben verloren gegangen.

0.0 0.2 0.4 0.6 0.8 1.0

0.0 0.2 0.4 0.6 0.8 1.0

ui

vi

i xi fi ui v˜i vi

1 0.05

2 3 30

4 0.3

5 80

P

(a) Rekonstruieren Sie die verloren gegangenen Angaben in der Tabelle. Stellen Sie deren Ermittlung nachvollziehbar dar. Vervollst¨andigen Sie schließlich die Lorenzkurve in der gegebenen Abbildung.(10 Punkte)

(b) Berechnen Sie den zu den in (a) rekonstruierten Daten geh¨orenden normierten Gini- Koeffizienten. Wie beurteilen Sie die Konzentration am Markt?(7 Punkte)

(c) Angenommen, zur Rekonstruktion der in der oberen Abbildung gegebenen Lorenzkurve w¨urden die Angaben der Tabelle nicht zur Verf¨ugung stehen. Auf welche Weise ließe sich die Lorenzkurve (n¨aherungsweise) dennoch rekonstruieren? Welche Annahme w¨urden Sie dabei implizit ¨uber die fehlenden Unternehmen treffen? W¨are der Gini-Koeffizient der n¨aherungsweisen Lorenzkurve genauso groß, gr¨oßer oder kleiner als der Gini-Koeffizient aus (b)? Begr¨unden Sie Ihre Entscheidung. (3 Punkte)

Hinweise:Geben Sie jeweils zun¨achst die allgemeinen Formeln an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Aufgabe 4: Zusammenhangsanalyse (20 Punkte)

In einer Untersuchung zu Lerngewohnheiten von Erstsemester Studierenden des Wirtschafts- wissenschaftlichen Bereichs wurden im Sommersemester 2016 folgende Daten erfasst. In der Tabelle finden Sie zu 20 Studierenden des Moduls Statistik II deren Geschlecht, Klausurergeb- nis (bestanden/nicht bestanden) und die investierte Vorbereitungszeit in Tagen.

Tabelle: Daten zu 20 Erstsemester Studierenden des Moduls Statistik II

1 2 3 4 5 6 7 8 9 10

Geschlecht 1 1 1 1 1 1 1 1 1 1

Klausurergebnis 0 1 0 1 0 1 0 1 0 1

Vorbereitungszeit 1 3 3 4 2 5 2 2 1 3

11 12 13 14 15 16 17 18 19 20

Geschlecht 2 2 2 2 2 2 2 2 2 2

Klausurergebnis 0 1 1 1 0 0 0 0 0 1

Vorbereitungszeit 3 1 2 2 5 2 2 3 4 4

(Geschlecht: 1=weiblich / 2=m¨annlich, Klausurergebnis: 1=bestanden / 0=nicht bestanden, Vorbereitungszeit in Tagen)

(a) Zeichnen Sie die Boxplots f¨ur die investierte Vorbereitungszeit getrennt f¨ur die Gruppe der Studierenden, die die Klausur bestanden haben, und f¨ur die Gruppe der Nichtbestande- nen. Vergleichen Sie die Verteilungen miteinander. Was vermuten Sie f¨ur den Zusammen- hang zwischen Vorbereitungszeit und Klausurergebnis? Gibt es hierf¨ur Anhaltspunkte in Ihren Boxplots?(14 Punkte)

(b) Ermitteln Sie f¨ur die Variablen Erfolg und Vorbereitungszeit den korrigierten Kontin- genzkoeffizienten (Hilfsgr¨oße: K = 0.1982). Interpretieren Sie Ihr Ergebnis formal und inhaltlich. Wird Ihre Vermutung aus Teilaufgabe (a) best¨atigt? (4 Punkte)

(c) F¨ur die zehn Studentinnen erh¨alt man f¨ur den Zusammenhang zwischen Erfolg und Vorbe- reitungszeitK = 0.7977. Vergleichen Sie diesen Wert mit Ihrem Ergebnis aus Teilaufgabe (b). Welcher Effekt tritt hier auf? Beschreiben Sie ihn theoretisch.(2 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(6)

Aufgabe 5: Indexzahlen (20 Punkte)

Ein BWL-Student m¨ochte sein Lernverhalten optimieren. Hierzu betrachtet er die erzielten Punktzahlen pro Aufgabe in der Klausur zu Statistik I zum ersten und zweiten Termin. Aus seinem Lerntagebuch entnimmt er die nach Aufgabentypus aufgeschl¨usselten investierten Lern- zeiten (in Stunden).

Tabelle mit Lernzeiten und Punkte/Zeiteinheit

Aufgabe i Basiszeitraum Berichtszeitraum

1. Termin 2. Termin

Punkte/Lern- Lernstunden Punkte/Lern- Lernstunden

stunde stunde

p0(i) q0(i) pt(i) qt(i)

Aufgabe 1 10 1 7 2

Aufgabe 2 8 1 5 3

Aufgabe 3 3 3 3 5

Aufgabe 4 2 4 2.5 6

Aufgabe 5 2 0.5 3 6

P 9.5 22

(a) Wie hoch ist die relative Entwicklung seiner erreichten Punktzahl vom ersten zum zweiten Termin insgesamt? Interpretieren Sie Ihr Ergebnis inhaltlich. (6 Punkte)

(b) Wenn er zum ersten Termin den gleichen Einsatz gezeigt h¨atte wie zum zweiten Ter- min, wie h¨atte sich seine Punktzahl relativ und absolut entwickelt? Interpretieren Sie Ihr Ergebnis inhaltlich. (9 Punkte)

(c) F¨ur die Berechnung wurde eine Annahme ¨uber die Abh¨angigkeit der Punktzahl von der investierten Lernzeit getroffen. Wie beurteilen Sie diese Annahme? Sehen Sie darin ein Problem? Wenn ja, welches? (5 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Abbildung

Tabelle mit Lernzeiten und Punkte/Zeiteinheit

Referenzen

ÄHNLICHE DOKUMENTE

Für eine erneute Berech- nung wurden die Jahresumsätze von Euro in Dollar umgerechnet (wobei vereinfachend 1 Euro = 1.1 Dollar sein soll). Der Schiefekoeffizient auf Basis der

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Dann k¨ onnen klassierte H¨ aufigkeitsverteilungen immer in unklassierte H¨ aufigkeitsverteilungen umgewandelt werden, aber unklassierte H¨ aufigkeitsverteilungen k¨ onnen nicht

x Unklassierte Häufigkeitsverteilungen können immer in klassierte Häufigkeits- verteilungen umgewandelt werden, aber klassierte Häufigkeitsverteilungen können nicht immer

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an

Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie)

Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.. Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische