• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2014/2015 31.03.2015

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2014/2015 31.03.2015"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2014/2015

31.03.2015

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

a) Liegt eine Datenreihe mit positiven und negativen Wachstumsraten vor, sollte zur Berech- nung der durchschnittlichen Wachstumsrate das geometrische Mittel verwendet werden.

Richtig Falsch

Wachstumsraten sind metrisch skaliert, daher wird das arithmetische Mittel verwen- det.

Wachstumsraten werden durch Multiplikationen bestimmt, daher wird das geometri- sche Mittel verwendet.

Sind einzelne Wachstumsraten negativ, kann das geometrische Mittel erst nach einer Transformation der Daten verwendet werden.

b) Es liegt eine Datenreihe vor, auf deren Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini- Koeffizient erneut berechnet, dann ¨andert sich dessen Wert nicht.

Richtig Falsch

Da die Gesamtmerkmalssumme gr¨oßer wird, nimmt die Konzentration ab. Daher wird der Gini-Koeffizient kleiner.

Da die relativen Merkmalsanteile an der Gesamtmerkmalssumme kleiner werden, nimmt die Konzentration zu. Daher wird der Gini-Koeffizient gr¨oßer.

Die relativen Merkmalsanteile an der Gesamtmerkmalssumme ¨andern sich nicht, daher

¨

andert sich der Gini-Koeffizient ebenfalls nicht.

c) Bei Verwendung des einfachen gleitenden Durchschnitts sollte die minimal m¨ogliche Fen- sterbreite verwendet werden.

Richtig Falsch

Durch die Verwendung breiter Fenster gehen, aufgrund der Verk¨urzung der Beobach- tungsreihe, zu viele Informationen verloren, daher sollte die Fensterbreite so klein wie m¨oglich gew¨ahlt werden.

Erst durch die Verwendung großer Fenster erfolgt eine Gl¨attung der Beobachtungs- reihe, daher sollte die Fensterbreite so groß wie m¨oglich gew¨ahlt werden.

Die Wahl der Fensterbreite sollte je Datenlage individuell erfolgen.

(3)

d) Die folgende Abbildung zeigt einen Datensatz und die f¨ur diesen Datensatz ermittelte Regressionsgerade.

−0.5 0.0 0.5 1.0

−0.20.00.20.40.60.81.0

x

y

Das Bestimmtheitsmaß w¨urde in diesem Fall einen Wert nahe 1 annehmen.

Richtig Falsch

Das Bestimmtheitsmaß ist vom Korrelationskoeffizienten abh¨angig. Da dieser nicht angegeben ist, kann keine Aussage zum Wert des Bestimmtheitsmaßes gemacht wer- den.

Da die Beobachtungswerte deutlich von der Regressionsgeraden abweichen, w¨urde das Bestimmtheitsmaß einen Wert nahe 0 annehmen.

Da die Regressionsgerade einen steigenden Verlauf aufweist, w¨urde das Bestimmt- heitsmaß einen Wert nahe 1 annehmen.

e) Der KontingenzkoeffizientK l¨asst eine belastbare Aussage dar¨uber zu, ob zwei kategoriale Merkmale miteinander stark oder eher schwach zusammen h¨angen.

Richtig Falsch

K basiert auf dem Vergleich von tats¨achlich ermittelten H¨aufigkeiten zweier Merkmale mit den H¨aufigkeiten, die man bei Unabh¨angigkeit dieser Merkmale erwartet h¨atte.

Es gilt z.B. K ≥0.8→ starker Zusammenhang.

Der KontingenzkoeffizientK l¨asst ausschließlich Aussagen ¨uber die Richtung des Zu- sammenhangs qualitativer Merkmale zu.

Zur Bestimmung der St¨arke des Zusammenhangs zwischen zwei nominal oder ordinal skalierten Merkmalen ist der korrigierte Kontingenzkoeffizient K besser geeignet.

(4)

Aufgabe 2: Empirische Verteilungsfunktion (20 Punkte)

Die folgende Tabelle zeigt die monatlichen Nettoeinkommen der 250 Angestellten eines Mittel- standsunternehmens.

Einkommensklasse Anzahl der

(in Euro) Personen

[0; 450) 32

[450; 750) 64

[750; 1 000) 56

[1 000; 1 500) 69

[1 500; 2 500) 24

[2 500; 5 000] 5

(a) Ermitteln Sie formal die zu den oben angegebenen Daten geh¨orende empirische Vertei- lungsfunktion und stellen Sie diese in geeigneter Weise grafisch dar. Welcher Annahme unterliegt Ihre Zeichung?(12 Punkte)

(b) Wieviel Prozent der Angestellten verdienen 1. zwischen 600 und 1 000 Euro? (2 Punkte) 2. mehr als 2 000 Euro? (2 Punkte)

(c) Angenommen, das Einkommen aller Angestellten innerhalb einer Einkommensklasse ent- spricht jeweils exakt der jeweiligen Klassenmitte. Ein Student behauptet, dass diese In- formation die Darstellung der empirischen Verteilungsfunktion nicht beeinflusst. Hat der Student mit der Behauptung recht? Falls ja, begr¨unden Sie, warum dies keinen Einfluss hat. Falls nein, erkl¨aren Sie, wie sich die Darstellung der empirischen Verteilungsfunktion ver¨andert. (4 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Aufgabe 3: Zusammenhangsanalyse (20 Punkte)

Im vergangenen Wintersemester wurden insgesamt 19 Teilnehmer einer ¨Ubung befragt, mit wel- chem Klausurergebnis (erwartete Punktzahl X, von 0 bis 100) sie rechneten und wie hoch sie ihre Vorbereitungszeit Y (in Stunden) f¨ur die Klausur einsch¨atzten. Zus¨atzlich wurde das ak- tuelle Fachsemester und die Anzahl der bisherigen Pr¨ufungsversuche f¨ur dieses Modul erhoben.

Einen Auszug der Ergebnisse der befragten Studenten (Geschlecht Z; 1= m¨annlich, 2=weiblich) entnehmen Sie der folgenden Tabelle.

erwartete Punktzahl 70 77 75 80 80 80 80 55 75 Vorbereitungszeit (in h) 10 15 20 20 30 60 30 35 10

Geschlecht 1 1 1 1 1 1 1 1 1

Fachsemester 1 1 1 1 1 1 1 3 1

Wiederholer 0 0 0 0 0 0 0 1 0

(a) Bilden Sie die in der Tabelle angegebenen Werte f¨ur die Merkmale X und Y in einer geeigneten Grafik ab. Nutzen Sie dazu das unten angegebene Koordinatensystem. Inter- pretieren Sie die Grafik kurz!(5 Punkte)

(b) Berechnen Sie den Korrelationskoeffizienten zur Beurteilung des linearen Zusammenhangs zwischen den beiden Merkmalen Vorbereitungszeit und erwartete Punktzahl unter den befragten Studierenden.(8 Punkte)

(c) Besteht aus Ihrer Sicht ein Zusammenhang zwischen den beiden Merkmalen in der Stich- probe und wenn ja, welcher Art? Greifen Sie in Ihrer Antwort die in Teilaufgabe (a) ge- zeichnete Grafik und das Ergebnis aus (b) auf. Welches weitere statistische Maß kennen Sie, um ¨uber die Art und St¨arke des Zusammenhangs zwischen erwarteter Punktzahl und Vorbereitungszeit eine Aussage zu treffen? Begr¨unden Sie stichwortartig, warum es f¨ur die vorliegende Fragestellung anwendbar w¨are und wie Sie vorgehen w¨urden. (7 Punkte) Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Hilfsgr¨oßen:P9i=1xi = 672;P9i=1x2i = 50 704; P9i=1yi = 230; P9i=1y2i = 7 850;

P9

i=1xi·yi = 17 230;

(6)

Aufgabe 4: Analyse zeitlicher Verl¨aufe (20 Punkte)

Die folgende Abbildung zeigt die Anzahl der Apps im Google Play Store (y) zu 18 ausgew¨ahlten Zeitpunkten (t= 1, . . . ,18).

050000010000001500000

y: Anzahl der Apps im Google Play Store Dez 09 Mrz 10 Apr 10 Jul 10 Okt 10 Apr 11 Jul 11 Aug 11 Dez 11 Feb 12 Mai 12 Jun 12 Sep 12 Okt 12 Apr 13 Jul 13 Jul 14 Feb 15

16000 30000 38000 70000 100000 200000 250000 300000 400000 450000 500000 600000 675000 700000 850000 1000000 1300000 1400000

Quelle:http://www.statista.com/statistics/266210/

number-of-available-applications-in-the-google-play-store/

(a) Ermitteln Sie f¨ur die oben angegebenen Daten ein einfaches lineares Trendmodell. Beur- teilen Sie die G¨ute des Modells mit Hilfe eines geeigneten Maßes. (14 Punkte)

(b) Ein Google-Manager stellt auf einer Aktion¨arskonferenz die oben gezeigte Grafik vor und behauptet, der Play Store verzeichne insbesondere in den Jahren 2014 und 2015 ein ¨uberproportionales Wachstum. Wieso hat er damit unrecht? Welcher Fehler ist ihm unterlaufen und welche Auswirkungen hat dieser ggf. auf das in (a) ermittelte Modell?

Wie k¨onnte man das Problem l¨osen? (6 Punkte)

Hilfsgr¨oßen:P18t=1t·yt= 121 745 000;P18t=1t2 = 2 109;P18t=1yt2 = 7.5·1012; t= 9.5;

y= 493 277.8 Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(7)

Aufgabe 5: Konzentrationsmaße (20 Punkte)

In einem vom Lehrstuhl Statistik angebotenen Modul werden jedes Semester drei vom Inhalt her identische ¨Ubungen angeboten. Diese Veranstaltungen unterscheiden sich darin, dass sie zu unterschiedlichen Zeiten und von unterschiedlichen Dozenten gehalten werden. Im Sinne einer gleichm¨aßigeren Auslastung der Ressourcen w¨are eine Gleichverteilung der Studierenden auf die angebotenen ¨Ubungen w¨unschenswert. Da sich Studierende nach pers¨onlichen Vorlieben und zeitlichen Einschr¨ankungen ihre Veranstaltungen selbst ausw¨ahlen d¨urfen, zeigt die Realit¨at ein anderes Bild.

Um eine Analyse der gegenw¨artigen Situation zu erm¨oglichen, wurden die Anmeldedaten dieser Ubungen in den letzten beiden Semestern erfasst. Die folgende Tabelle fasst die Anzahl der¨ angemeldeten Studierenden in den einzelnen Veranstaltungen zusammen.

Semester WS1314 WS1415 Ubung A¨ 504 288

Ubung B¨ 78 93

Ubung C¨ 163 109

(a) Betrachten Sie die obigen Anmeldedaten f¨ur beide Semester. Was erwarten Sie bez¨uglich der Konzentration der Studierenden auf die einzelnen ¨Ubungen? Vergleichen Sie dabei die Situation in beiden Semestern miteinander. (2 Punkte)

(b) Ermitteln Sie f¨ur die oben angegebenen Daten die Lorenzkurven und stellen Sie diese grafisch dar. Berechnen Sie außerdem den normierten Gini-Koeffizienten f¨ur das jeweilige Semester. Wie beurteilen Sie die Konzentration? Werden Ihre Vermutungen aus Teilauf- gabe (a) dadurch best¨atigt? (15 Punkte)

(c) Um den ¨Ubungen ihren ¨Ubungscharakter wieder zu verleihen, wurde vorgeschlagen, dass ein weiterer Termin angeboten wird. Da leider keine passenden R¨aumlichkeiten in der Wo- che verf¨ugbar sind, k¨onnte diese zus¨atzliche Veranstaltung allenfalls sonntags stattfinden.

Uberlegen Sie, wie sich Lorenzkurve und normierter Gini-Koeffizient ver¨¨ andern, wenn die Veranstaltung zwar angeboten, aber nicht besucht wird. W¨urde diese zus¨atzliche ¨Ubung demzufolge ein m¨ogliches Konzentrationsproblem l¨osen?(3 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Referenzen

ÄHNLICHE DOKUMENTE

Um die Höhe der Streuung zu beurteilen, muss der normierte MAD berechnet wer- den... d) Bei Vorliegen einer symmetrischen Verteilung (d.h., Median und arithmetisches Mittel

Wird auf diesen Daten der Rangkorrelationskoeffizient mit Hilfe der allgemeinen Formel berech- net, ist das Ergebnis größer, als wenn die Formel „ohne Bindungen“ verwendet

Einer bestimmten Lorenzkurve kann immer ein eindeutiger Wert des Gini-Koeffizienten zugeordenet werden.. x Richtig

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an

Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie)

Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.. Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische

“Wahl-O-Mat” die rechtsextremistische NPD als Partei empfohlen werde, lautet die Be- gr¨undung der f¨ur das Internet-Angebot verantwortlichen Landeszentrale f¨ur politische Bil-