• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2012/2013 02.04.2013

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2012/2013 02.04.2013"

Copied!
6
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2012/2013

02.04.2013

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨ andert, keine Hervorhebungen, keine Zus¨ atze, keine losen Bl¨ atter) Nicht zugelassen sind:

• eigenes Papier

• Skript, Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, ¨ Zusatzmaterialien zur Vorlesung, eigene Aufzeichnungen

• Lehrb¨ ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle unf Aufgaben enth¨ alt.

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Aufgabe 1: Querbeet (20 Punkte)

Betrachten Sie die folgenden Aussagen. Markieren Sie jeweils, ob die angegebene Aussage zutrifft oder nicht(jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung(jeweils 3 Punkte).

Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

1. Ein ordinales Merkmal kann immer in ein metrisches Merkmal umgewandelt werden. Um- gekehrt ist es nur bedingt m¨oglich.

Richtig Falsch Begr¨undung:

Merkmale k¨onnen ausschließlich in eine niedrigere Skala ¨uberf¨uhrt werden.

Merkmale k¨onnen ausschließlich in eine h¨ohere Skala ¨uberf¨uhrt werden.

Die Art der Erhebung von Merkmalen bedingt die sp¨atere M¨oglichkeit einer Umwandlung.

2. In Ausnahmef¨allen kann zur Bestimmung der Varianz der Verschiebungssatz verwendet werden.

Richtig Falsch Begr¨undung:

Nur wenn Hilfsgr¨oßen wie Pni=1x2i und Pni=1xi angegeben werden, kann der Verschiebungssatz verwendet werden.

Der Verschiebungssatz ist lediglich eine mathematische Umformung der allgemeinen Formel und kann immer verwendet werden.

Der Verschiebungssatz kann nur zur Bestimmung der Varianz bei diskreten Merkmalen verwendet werden.

3. Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden.

Richtig Falsch Begr¨undung:

Der Boxplot ist die grafische Darstellung der 5-Punkte-Zusammenfassung und ist deswegen ausschließlich zur Beurteilung der Lage eines Datensatzes einsetzbar.

Der Boxplot ist die grafische Darstellung der 5-Punkte-Zusammenfassung und kann durch die Breite und Position der Box und Striche sowie die Entfernung der Striche zueinander Informationen ¨uber Lage, Streuung und Schiefe liefern.

Ein Boxplot kann erst bei ordinalen Merkmalen eingesetzt werden und ist deswegen kein Instrument f¨ur die Beurteilung von Lage, Streuung und Schiefe bei metrischen Merkmalen.

(3)

4. Zu einem bestimmten Wert des Gini-Koeffizienten existiert immer eine eindeutige Lorenz- kurve.

Richtig Falsch Begr¨undung:

Der Gini-Koeffizient ergibt sich als die doppelte Fl¨ache zwischen Lorenzkurve

und Winkelhalbierender und kann demnach einer eindeutigen Lorenzkurve zugeordnet werden.

Unterschiedliche Lorenzkurven k¨onnen zum selben Wert des Gini-Koeffizienten f¨uhren.

Lorenzkurve und Gini-Koeffizient haben keine Beziehung zueinander.

5. Das Histogramm ist eine m¨ogliche grafische Darstellung der empirischen Dichtefunktion und folgt dem Prinzip der L¨angentreue.

Richtig Falsch Begr¨undung:

Beim Histogramm ist die L¨ange der einzelnen S¨aulen proportional zu den relativen H¨aufigkeiten der Klassen. Also folgt es dem Prinzip der L¨angentreue.

F¨ur das Histogramm werden die kumulierten H¨aufigkeiten ben¨otigt. Also ist es eine m¨ogliche grafische Darstellung der empirischen Verteilungsfunktion.

Beim Histogramm ist die Fl¨ache der einzelnen S¨aulen proportional zu den relativen H¨aufigkeiten der Klassen. Also folgt es dem Prinzip der Fl¨achentreue.

(4)

Aufgabe 2: Analyse zeitlicher Verl¨aufe (20 Punkte)

Die folgende Abbildung dokumentiert das Wachstum eines 10j¨ahrigen Jungen ¨uber ein Schul- jahr. Die K¨orpergr¨oße des Jungen wurde an 30 (verschiedenen) Tagen ¨uber das Schuljahr verteilt gemessen. Aufgrund der Schulferien und Wochenenden liegt nicht f¨ur jeden Tag eine Messung vor.

0 50 100 150 200 250 300

124125126127128129130

Tag

Größe in cm

(a) Wie sch¨atzen Sie die Qualit¨at der Daten ein? Was f¨allt Ihnen auf? (2 Punkte)

(b) Berechnen Sie ein einfaches lineares Trendmodell, erg¨anzen Sie dieses in der oberen Grafik und interpretieren Sie die ermittelten Koeffizienten. (8 Punkte)

(c) Beurteilen Sie die G¨ute des Modells mit Hilfe eines geeigneten Maßes. (8 Punkte)

(d) Welche Probleme sehen Sie, wenn das Modell zur Prognose der Gr¨oßenentwicklung des Jungen verwendet wird?(2 Punkte)

Hilfsgr¨oßen: P30i=1T agi ·Gr¨oßei = 620 084.4; P30i=1T ag2i = 1 000 343; P30i=1Gr¨oße2i = 485 840.6;

T ag = 161.3;Gr¨oße = 127.2467 Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

(5)

Aufgabe 3: Zusammenh¨ange zwischen Merkmalen(20 Punkte) Betrachten Sie erneut die Daten aus Aufgabe 2.

(a) ¨Uberf¨uhren Sie die Daten in eine 2×2-Kontingenztafel. Bilden Sie dazu f¨ur das Merkmal

”Tag” zwei Auspr¨agungen: erste Jahresh¨alfte (≤ 150. Tag) und zweite Jahresh¨alfte (>

150. Tag), und f¨ur das Merkmal ”Gr¨oße” ebenfalls zwei Auspr¨agungen: klein (≤ 127cm) und groß (>127cm). (4 Punkte)

(b) Beurteilen Sie mit Hilfe eines geeigneten Maßes den Zusammenhang zwischen den beiden Merkmalen in der Kontingenztafel.(10 Punkte)

(c) Berechnen Sie f¨ur die urspr¨unglichen Daten aus Aufgabe 2 den Rangkorrelationskoeffizi- enten nach Spearman. Nutzen SiePni=1rg(T agirg(Gr¨oßei) = 9 361, Pni=1(rg(T agi))2 = 9 455 undPni=1(rg(Gr¨oßei))2 = 9 451.5. Unter der Kenntnis des Ergebnisses aus Aufgabe 2 (c) ist das Ergebnis f¨ur den Rangkorrelationskoeffizienten nicht ¨uberraschend! Wieso?

(6 Punkte)

Hinweis:

Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

Aufgabe 4: Indexzahlen (20 Punkte)

In einem Unternehmen gibt es 3 Hierarchieebenen. In den Jahren 2000, 2005 und 2010 ergab sich die folgende Entwicklung der Bruttogeh¨alter (in 1 000 Euro pro Jahr und Mitarbeiter) und der Zahl der Mitarbeiter in jeder Ebene:

2000 2005 2010

Ebene Gehalt Mitarbeiter Gehalt Mitarbeiter Gehalt Mitarbeiter

1 30 1 000 32 800 35 900

2 80 200 85 200 90 220

3 200 5 220 6 300 8

(a) Berechnen Sie f¨ur das Jahr 2010 einen Laspeyres-Index mit Basis 2000, der den Einfluss der Ver¨anderung der Bruttogeh¨alter/Mitarbeiter auf die Entwicklung des Gehaltsniveaus im Unternehmen verdeutlicht. (5 Punkte)

(b) Berechnen Sie einen Index f¨ur die Lohnkosten des Unternehmens im Jahr 2005 zur Basis 2000.(5 Punkte)

(c) Wie hoch war der durchschnittliche Gehaltsanstieg pro Jahr (2000-2010) in der h¨ochsten Hierarchieebene in Euro und prozentual? Hinweis: Denken Sie daran, was Sie ¨uber Lage- maße wissen.(6 Punkte)

(d) Angenommen, alle Geh¨alter werden in DM umgerechnet (zur Vereinfachung: 1 Euro = 2 DM). Wie ¨andern sich jeweils Ihre Ergebnisse in den Teilaufgaben a) bis c)? Bitte nicht rechnen, sondern nur argumentieren.(4 Punkte)

Hinweis:

Geben Sie zun¨achst die allgemeine Formel an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkom- mastellen.

(6)

Aufgabe 5: Empirische Verteilungsfunktion (20 Punkte)

In der folgenden Tabelle wird das monatliche Nettoeinkommen von Personen in Sachsen-Anhalt im Jahr 2004 dargestellt (Quelle: Statistisches Landesamt).

Einkommensklasse Personen (in Euro) (in 1 000)

[0; 300) 540

[300; 700) 534

[700; 1 100) 665

[1 100; 1 500) 428

[1 500; 2 000) 142

[2 000; 2 600) 88

(a) Stellen Sie die empirische Verteilungsfunktion zu den obigen Daten grafisch dar. Ver- wenden Sie f¨ur Ihre Zeichung das unten stehende Koordinatensystem. Welcher Annahme unterliegt Ihre Zeichung?(10 Punkte)

(b) Beantworten Sie die folgenden Fragen mit Hilfe Ihrer grafischen Darstellung:

Rund wie viel Prozent der Personen in Sachsen-Anhalt verdienten im Jahr 2004 (1) h¨ochstens 1 000 Euro,

(2) ¨uber 1 500 Euro,

(3) zwischen 1 000 und 1 500 Euro? (6 Punkte)

(c) Nehmen Sie an, dass das Einkommen aller Personen innerhalb einer Klasse der unteren Grenze der jeweiligen Klasse entspricht. Wie w¨urde hier die empirische Verteilungsfunk- tion verlaufen? (Den Verlauf k¨onnen Sie auch gern anhand einer Skizzedemonstrieren!) (4 Punkte)

0 500 1000 1500 2000 2500 3000

0.00.20.40.60.81.0

Einkommen

F(x)

Referenzen

ÄHNLICHE DOKUMENTE

b) Es liegt eine Datenreihe vor, auf deren Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini-

Im Vergleich zu den befragten Studenten machen sich doppelt so viele Studentinnen manchmal oder oft Sorgen ¨ uber ihre Klausuren.

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Wird auf diesen Daten der Rangkorrelationskoeffizient mit Hilfe der allgemeinen Formel berech- net, ist das Ergebnis größer, als wenn die Formel „ohne Bindungen“ verwendet

Geben Sie die verwendeten Rechenregeln in allge- meiner Form an. Runden Sie Ihre

Einer bestimmten Lorenzkurve kann immer ein eindeutiger Wert des Gini-Koeffizienten zugeordenet werden.. x Richtig

Ein Boxplot kann erst bei ordinalen Merkmalen eingesetzt werden und ist deswegen kein Instrument für die Beurteilung von Lage, Streuung und Schiefe bei metrischen

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an