Klausur zu Statistik I Prof. Dr. Claudia Becker
Wintersemester 2012/13 06.02.2013
Name: ...
Matrikelnummer: ...
Bearbeitungszeit: 2 Stunden
Erlaubte Hilfsmittel:
• Taschenrechner (keine alphanumerische Tastatur)
• standardisierte Formelsammlung Statistik vom WS 11/12 in gehefteter Form (unver¨andert, keine Hervorhebungen, keine Zus¨atze, keine losen Bl¨atter)
Nicht zugelassen sind:
• eigenes Papier
• Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen
• Lehrb¨ ucher, Verteilungstabellen
Es sind insgesamt 100 Punkte zu erreichen.
Uberpr¨ ¨ ufen Sie, ob Ihre Klausur alle f¨ unf Aufgaben enth¨alt.
Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!
Aufgabe 1 2 3 4 5
Perreichbare
Punkte 20 20 20 20 20 100
erreichte
Punkte
Korrektur Richtig Falsch
Martin-Luther-Universität Halle-Wittenberg
Juristische und Wirtschaftswissenschaftliche Fakultät Wirtschaftswissenschaftlicher Bereich
Statistik I - WS 2012/13 - 1. Termin 06.02.2013
Aufgabe 1: Multiple Choice (20 Punkte)
Vorname
Nachname
Matrikelnummer Unterschrift
Wichtige Hinweise: Dieser Bogen (Vor- und Rückseite) wird maschinell ausgewertet. Es werden nur Markierungen innerhalb der Kästchen berücksichtigt. Markieren Sie jeweils, ob die angegebene Aussage zutrifft oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begründung (jeweils 3 Punkte).
Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht. Falls Sie korrigieren müssen, schwärzen Sie bitte das falsche Kästchen komplett aus und kreuzen Sie das richtige Kästchen an.
Antwortbeispiel Richtig Falsch
Aussage 1: Im Boxplot kann man Mittelwert und Standardabweichung der Häufigkeitsverteilung ablesen. (4 Punkte)
Begründung 1 2 3
Begründung 1 2 3
Richtig Falsch
Der innere Strich und die Breite der Box entsprechen Mittelwert und Standardabweichung.
Der innere Strich und die Breite der Box entsprechen Median und MAD.
Der innere Strich und die Breite der Box entsprechen Median und Interquartilsabstand.
bitte wenden!
Aussage 2: Beim gleitenden Durchschnitt der Ordnung p = 2q+1 sollte man immer den maximal zulässigen Wert für p wählen. (4 Punkte)
Richtig Falsch
Je größer p, desto mehr Werte gehen am Anfang und Ende der Reihe verloren.
Damit wird der gleitende Durchschnitt weniger aussagekräftig.
Je größer p, desto "glatter" wird der gleitende Durchschnitt. Der maximale Wert von p zeigt daher den Trend am deutlichsten.
Je größer p, desto weniger folgt der gleitende Durchschnitt der Originalreihe.
Daher sollte man besser den minimal zulässigen Wert für p wählen.
172897
Aussage 3: Der Rangkorrelationskoeffizient nach Spearman ist ausschließlich für ordinal skalierte Merkmale anwendbar. (4 Punkte)
Richtig Falsch
Das ordinale Skalenniveau ist die Minimalanforderung an die Merkmale. Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.
Das ordinale Skalenniveau ist die Minimalanforderung an die Merkmale. Der Rangkorrelationskoeffizient nach Spearman darf daher auch für höher skalierte Merkmale berechnet werden.
Das ordinale Skalenniveau ist die Minimalanforderung an die Merkmale. Da die ordinale Skalierung das höchste Skalenniveau darstellt, kann der Rangkorrela- tionskoeffizient nach Spearman ausschließlich für ordinal skalierte Merkmale berechnet werden.
Richtig Falsch
Richtig Falsch
Aussage 4: Die Methode der kleinsten Quadrate kann auch bei der Analyse zeitlicher Verläufe eingesetzt werden. (4 Punkte)
Die Methode dient zur Bestimmung einer Regressionsfunktion. Eine derartige Funktion ist bei zeitlichen Daten etwa eine lineare Trendgerade.
Die Methode dient zur Bestimmung einer Regressionsfunktion. Eine derartige Funktion gibt es bei zeitlichen Daten nicht.
Die Methode dient zur Bestimmung einer Regressionsfunktion. Hierzu werden Einfluss- und Zielgrößen benötigt. Bei zeitlichen Daten gibt es aber keine Einflussgröße.
Aussage 5: Der Umsatz- oder Wertindex setzt den Wert zweier unterschiedlicher Warenkörbe zu zwei unterschiedlichen Zeiten miteinander ins Verhältnis. (4 Punkte)
Dieser Index nutzt zur Basiszeit den für diese Zeit aktuellen Warenkorb und zur Berichtszeit den zu dieser Zeit aktuellen Warenkorb.
Dieser Index nutzt denselben Warenkorb zu zwei unterschiedlichen Zeiten.
Dieser Index nutzt zwei unterschiedliche Warenkörbe für dieselbe Zeit.
172897
Aufgabe 2: Lage- und Streuungsmaße (20 Punkte)
Steigende Kraftstoffpreise f¨uhren i.d.R. langfristig dazu, dass der Kraftstoffverbrauch beim Kauf eines PKWs eine wichtige Rolle spielt. Dies h¨angt allerdings von den Pr¨aferenzen der K¨aufer ab. Automobilhersteller ber¨ucksichtigen dieses Kriterium mehr oder weniger stark bei ihren angebotenen Modellen und versuchen somit, ihre jeweiligen Zielgruppen zufrieden zu stellen. In den folgenden Tabellen sind f¨ur zwei Anbieter die durchschnittlichen Kraft- stoffverbr¨auche (in l/100km) f¨ur alle aktuell angebotenen Modelle erfasst.
Automobilhersteller 1 (A1)
i 1 2 3 4 5 6 7 8 9 10
Modelli A B C D E F G H J K
Benzinverbrauch xi (in l/100km) 5.5 5.0 6.1 7.2 5.2 10.6 8.5 7.4 6.8 6.5 Automobilhersteller 2 (A2)
i 11 12 13 14 15 16 17 18 19 20
Modell i L M N O P Q R S T U
Benzinverbrauchxi (in l/100km) 4.6 3.4 5.0 4.8 5.5 4.8 4.0 5.6 4.2 4.0 (a) Berechnen Sie f¨ur jeden Hersteller den durchschnittlichen Verbrauch und die Standard-
abweichung seiner Modelle. Interpretieren Sie Ihre Ergebnisse inhaltlich. Was sagen diese ¨uber die Zielgruppen der Automobilanbieter aus?(8 Punkte)
(b) Im unten stehenden Diagramm sehen Sie den Boxplot f¨ur den Automobilhersteller 1.
Vervollst¨andigen Sie das Diagramm, indem Sie den Boxplot f¨ur den zweiten Automo- bilhersteller zeichnen. Best¨atigen die Boxplots die Eindr¨ucke, die Sie unter Teilaufgabe (a) gewonnen haben?(8 Punkte)
(c) Betrachten Sie die Boxplots von Teilaufgabe (b) erneut. Wenn Sie f¨ur den jeweiligen Hersteller den Schiefekoeffizienten nach Pearson bestimmen w¨urden, welches Vorzei- chen w¨urden Sie jeweils erwarten? Begr¨unden Sie Ihre Wahl. (4 Punkte)
Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen. Nutzen Sie zur Berechnung die folgenden Hilfsgr¨oßen:
P10
i=1xi = 68.8;P20i=11xi = 45.9;P10i=1x2i = 499.2;P20i=11x2i = 215.05
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 11.0
Kraftstoffverbrauch in l/100km
Hersteller 1Hersteller 2
Aufgabe 3: Konzentrationsmaße (20 Punkte)
Die folgende Tabelle zeigt den Absatz an Fahrzeugen (in Mio. Einheiten) der 10 gr¨oßten Automobilhersteller der Welt im Jahr 2011.
Absatz (je Hersteller) Hersteller
8 General Motors, Toyota, Volkswagen
7 Hyundai
5 Ford, Nissan
4 PSA
3 Honda, Renault, Suzuki
(a) Ermitteln Sie f¨ur die oben angegebenen Daten die Lorenzkurve und stellen Sie die- se grafisch dar. Berechnen Sie außerdem ein geeignetes Maß zur Quantifizierung der (relativen) Konzentration am Automobilmarkt. Wie beurteilen Sie die Konzentration?
Sehen Sie ein Problem darin, dass nur die 10 gr¨oßten Unternehmen zur Beurteilung der Konzentration herangezogen wurden?(17 Punkte)
(b) Angenommen, man w¨urde aus der oberen Tabelle die Urliste der Daten rekonstruie- ren und die Lorenzkurve dann auf Basis der Urliste berechnen. Inwieweit w¨urden sich die auf diese Weise ermittelte Lorenzkurve und die in Teilaufgabe (b) ermittelte Lo- renzkurve unterscheiden/¨ahneln? Bitte nicht rechnen, sondern nur argumentieren. (3 Punkte)
Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in all- gemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.
Aufgabe 4: Korrelationsmaße (20 Punkte)
Die Analyse der Wirtschaftsstruktur und -entwicklung in den einzelnen Bundesl¨andern ist ein wichtiges Mittel, um wirtschafts- und finanzpolitische Entscheidungen begr¨unden zu k¨onnen.
Als Grundlage dienen hierzu u.a. Arbeitsmarkt- sowie Beherbergungungsstatistiken. In der folgenden Tabelle sind die Anzahl der in Sachsen-Anhalt registrierten G¨aste¨ubernachtungen (X) sowie die Arbeitslosenzahlen in Sachsen-Anhalt (Y) f¨ur ausgew¨ahlte Monate der letzten 2 Jahre (t) aufgef¨uhrt.
t M¨arz 11 Juni 11 Sept. 11 Dez. 11 M¨arz 12 Juni 12 Sept. 12 Dez. 12
xt in Mio. 4.67 6.87 7.76 4.16 4.99 7.31 8.28 4.51
yt in 1000 428 347 349 377 383 304 304 329
(a) In der Vorlesung haben Sie zwei verschiedene Korrelationskoeffizienten kennengelernt, mit denen Sie den Zusammenhang zwischen zwei Merkmalen charakterisieren k¨onnen.
Welcher Koeffizient w¨urde Ihnen in diesem Fall mehr Informationen liefern? Begr¨unden Sie Ihre Entscheidung. (3 Punkte)
(b) Bestimmen Sie die Korrelation zwischen X und Y mit dem von Ihnen gew¨ahlten Zu- sammenhangsmaß. Interpretieren Sie Ihr Ergebnis formal und inhaltlich. (11 Punkte) (c) Welches Problem sehen Sie bei der inhaltlichen Interpretation des Ergebnisses? Auf
welchen Effekt l¨asst sich das zur¨uckf¨uhren? (6 Punkte) Hinweis:
Geben Sie in (b) zun¨achst die allgemeine Formel an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nach- kommastellen. Nutzen Sie zur Berechnung die folgenden Hilfsgr¨oßen:
P8
t=1xt= 48.55,P8t=1yt= 2 821,P8t=1xt·yt= 16 793.53,P8t=1x2t = 313.7637,P8t=1y2t = 1 007 285
Aufgabe 5: Analyse zeitlicher Verl¨aufe (20 Punkte)
Die folgende Tabelle zeigt eine Aufstellung von sehr popul¨aren Sportwagen, die zu ihrer jeweiligen Zeit die schnellsten straßenzugelassenen Fahrzeuge waren. Angegeben sind jeweils das Einf¨uhrungsjahr und die nachweislich erbrachte H¨ochstgeschwindigkeit vmax (in Meilen pro Stunde).
Jahr vmax Mercedes Velocipede 1894 12 Jaguar XK120 1949 125 Mercedes-Benz 300SL 1955 140 Aston Martin DB4 GT Zagato 1961 154 Iso Rivolta Grifo A3/L 327 1963 161 Lamborghini Miura P400 1967 171 Ferrari 365 GTB/4 Daytona 1968 174 Ferrari 288 GTO 1984 188 Porsche 959 1986 195 Ferrari F40 1987 203 Bugatti EB110 GT 1991 209 Jaguar XJ220 1992 213 McLaren F1 1993 231 Bugatti Veyron 16.4 2005 254 Bugatti Veyron 16.4 Super Sport 2010 258
Quelle: http://en.wikipedia.org/wiki/List of fastest production cars (a) Stellen Sie Daten in geeigneter Weise grafisch dar. Bestimmen Sie ein einfaches lineares
Trendmodell, erg¨anzen Sie dieses in Ihrer Grafik und interpretieren Sie die ermittelten Koeffizienten.(8 Punkte)
(b) Berechnen Sie die zu erwartende H¨ochstgeschwindigkeit f¨ur das Jahr 1886. Im Jahr 1886 stellte Carl Benz seinen Patent-Motorwagen Nummer 1 vor, welcher gemeinhin als erstes Automobil angesehen wird. Es hatte eine H¨ochstgeschwindigkeit von 10 Meilen pro Stunde. Warum unterscheiden sich der prognostizierte und der tats¨achliche Wert?
(2 Punkte)
(c) Angenommen, die obere Tabelle w¨urde die H¨ochstgeschwindigkeiten anstatt in Meilen pro Stunde in Kilometer pro Stunde enthalten (wobei vereinfachend 1 Meile pro Stunde
= 1.6 Kilometer pro Stunde sein soll). Leiten Sie her, wie sich die berechneten Koef- fizienten im einfachen linearen Trendmodell bei einer derartigen Transformation der Daten ver¨andern. Hinweis: Denken Sie daran, was Sie ¨uber das arithmetische Mittel bei linearen Transformationen der Daten wissen. (10 Punkte)
Hinweis:
Stellen Sie zun¨achst die ben¨otigten Gr¨oßen bereit. Geben Sie die verwendeten Rechenregeln in allgemeiner Form an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen. Nutzen Sie zur Berechnung die folgenden Hilfsgr¨oßen:
P15
i=1J ahri·vmaxi = 5 329 150;P15i=1J ahr2i = 58 441 805;J ahr= 1 973.6667; vmax= 179.2