Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2011/12 28.03.2012

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker

Wintersemester 2011/12 28.03.2012

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden

Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlung Statistik vom WS 11/12 in gehefteter Form (unverändert, keine Hervorhebungen, keine Zusätze, keine losen Blätter)

Nicht zugelassen sind:

• eigenes Papier

• Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen

• Lehrb¨ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberprüfen Sie, ob Ihre Klausur alle fünf Aufgaben enthält. ¨

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

^P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 4 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

1. Die Varianz ist ein direkt interpretierbares Streuungsmaß. (5 Punkte) Richtig

Falsch Begr¨undung:

Die Varianz liegt in der gleichen Maßeinheit vor wie die Beobachtungen.

Die Varianz muss quadriert werden, um interpretierbar zu sein.

Die Varianz wird in der quadrierten Maßeinheit der Beobachtungen berechnet.

Die Varianz muss durch die Standardabweichung dividiert werden, um interpretierbar zu sein.

2. Die Berechnung von Durchschnittsnoten mit Hilfe des arithmetischen Mittels ist aus statistischer Sicht sinnvoll. (5 Punkte)

Richtig Falsch Begr¨undung:

Noten sind nominal skaliert, das arithmetische Mittel ist also ein geeignetes Lagemaß.

Noten sind ordinal skaliert, das arithmetische Mittel ist also kein geeignetes Lagemaß.

Noten sind metrisch skaliert, das arithmetische Mittel ist also ein geeignetes Lagemaß.

Noten sind kardinal skaliert, das arithmetische Mittel ist also kein geeignetes Lagemaß.

3. Der Wertebereich des Gini-Koeffizienten Ghat die Obergrenze (n−1)/n. (5 Punkte) Richtig

Falsch Begr¨undung:

G kann maximal den Wert G= 1 annehmen.

Die Obergrenze von (n−1)/n gilt f¨ur G^∗.

G^∗ =n/(n−1)·Ghat als Obergrenze den Wert 1.

Die Obergrenze von (n−1)/n gilt f¨ur den Herfindahl-Index.

4. Ist der Schiefekoeffizient deutlich kleiner als Null, so ist die Verteilung symmetrisch.

(5 Punkte) Richtig Falsch Begr¨undung:

In diesem Fall ist die Verteilung rechtssteil.

In diesem Fall ist die Verteilung linkssteil.

Nur f¨ur eine symmetrische Verteilung kann ein negativer Schiefewert entstehen.

Eine symmetrische Verteilung h¨atte einen deutlich positiven Schiefewert.

(3)

Nachdem die Bundesregierung den Ausstieg aus der Atomenergie beschlossen hatte, wurde in den Medien viel über die möglichen Folgen diskutiert. Unter anderem wurde die Befürch- tung laut, dass die konventionellen Kraftwerke in Kombination mit erneuerbaren Energien nicht in der Lage sein würden, den Energiebedarf für die Bundesrepublik zu decken. Um zunächst festzustellen, wie variabel der Energiebedarf überhaupt ist, wurden von 7 zufällig ausgewählten deutschen konventionellen Kraftwerken die abgeforderten Leistungen (in Mio.

kWh) eines Stichzeitraums erhoben. Die entsprechenden Daten sind in der folgenden Tabelle dargestellt.

Kraftwerk 1 2 3 4 5 6 7

Leistung (Mio. kWh) 5.7 2.2 1.7 2.2 2.2 6.8 2.2

(a) Zur Messung dieser Variabilität können verschiedene Ansätze genutzt werden. Ein Ansatz ist es, eine Streubreite ohne Bezug auf ein Lagemaß zu bestimmen. In der Vorlesung haben Sie zwei Verfahren kennen gelernt, die diesem Ansatz folgen. Welche Verfahren sind das? Diskutieren Sie kurz (in Stichworten) Vor- und Nachteile dieser beiden Methoden im Vergleich zueinander. (10 Punkte)

(b) Ein anderer Ansatz ist die Bestimmung der Variabilit¨at mit Bezug auf ein Lagemaß.

Für die gegebenen Daten ergibt sich die Standardabweichung se als ein solches Maß zuse= 1.9052. Bestimmen Sie für diese Daten als zweites Streuungsmaß nach diesem Prinzip den MAD. Welches dieser beiden Maße würden Sie in diesem Fall vorziehen?

Begr¨unden Sie Ihr Urteil. (10 Punkte) Hinweis:

Geben Sie zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

Aufgabe 3 (20 Punkte)

In diesem Winter gab es in Deutschland einen kurzen Zeitraum extrem niedriger Tempera- turen, in dem der Energiebedarf ungewöhnlich hoch war. In den Nachrichten konnte man verfolgen, dass die Energiekonzerne in dieser Phase mit der Energieversorgung spekuliert und so die Bundesrepublik nahe an einen Blackout gebracht haben. Die Tatsache, dass dies möglich war, wird nicht zuletzt der Marktkonzentration im Energiemarkt zugeschrieben. In der folgenden Tabelle ist dargestellt, wie sich die Umsätze in diesem Markt auf die Konzerne verteilen.

Konzern 1 2 3 4

Umsatz (Mrd. Euro) 92.9 70.9 17.6 14.5

(a) Bestimmen Sie die relative Marktkonzentration mit Hilfe eines geeigneten Maßes. In- terpretieren Sie das Ergebnis formal und inhaltlich. (10 Punkte)

(b) Bestimmen Sie zusätzlich die absolute Marktkonzentration. Welchen Ansatz (relative / absolute Konzentration) halten Sie für diese Anwendung für sinnvoller und warum?

Bitte antworten Sie nur in Stichworten. (10 Punkte) Hinweis:

Geben Sie jeweils zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

(4)

Nach der Energiewende (Abschaltung der Kernkraftwerke) werden die Stromversorgungsnet- ze anderen Anforderungen genügen müssen als bisher. Insbesondere wird Strom verstärkt von denjenigen Orten aus verteilt werden müssen, wo mit Technologien für erneuerbare Energien (insbesondere Wind- und Sonnenenergie) Strom produziert wird. Um eine Vorstellung davon zu bekommen, wie sich der Bedarf an Strom regional verteilt, wurde in einem ersten Schritt der durchschnittliche Stromverbrauch privater Haushalte pro Bundesland für das Jahr 2011 erhoben. Die Ergebnisse sind in der folgenden Tabelle dargestellt.

Rohdaten zum durchschnittlichen Stromverbrauch privater Haushalte

Bundesland B SH H N MV BB BE TH

durchschn. Stromverbrauch 1.8 1.7 1.8 2.0 1.5 1.7 1.7 1.4 (Tsd. kWh)

Bundesland SN ST BN BW S RP NW H

durchschn. Stromverbrauch 1.8 1.6 2.0 1.8 2.0 1.9 1.9 2.0 (Tsd. kWh)

(a) Stellen Sie die angegebenen Daten in Form einer Kontingenztafel dar. Nutzen Sie da- zu die unten links vorgegebene Tabelle. Bestimmen Sie im Anschluss die unter Un- abhängigkeit der Merkmale “Stromverbrauch” und “Region” erwartete Tafel. Tragen Sie Ihr Ergebnis in die unten rechts vorgegebene Tafel ein. Zur Region “Nord” zählen die Bundesländer B, SH, H, N, MV, BB, BE, TH, S, ST. Die restlichen Bundesländer werden zur Region “Süd” gerechnet. (8 Punkte)

(b) Berechnet man für die nach den Vorgaben aus (a) bestimmte Kontingenztafel den Wert des χ²-Koeffizienten, so ergibt sich χ² = 5.76. Wie stark hängt der durchschnittliche Stromverbrauch pro Haushalt demnach mit der Region (Nord, Süd) zusammen, in der der Haushalt angesiedelt ist? (6 Punkte)

(c) Zwei verschiedene Institute, denen die Daten pro Bundesland (vgl. Tabelle der Rohda- ten) vorliegen, kommen auf Basis eigener Berechnungen des korrigierten Kontingenz- koeffizienten zu zwei unterschiedlichen Einschätzungen über die Stärke des Zusammen- hangs. Man kann davon ausgehen, dass kein Rechenfehler vorliegt. Wie erklären Sie diesen Effekt? (6 Punkte)

Hinweis:

Geben Sie in (b) zun¨achst die allgemeine Formel an.

Runden Sie ggf. Ihre Ergebnisse auf vier Nachkommastellen.

Tabelle der gemeinsamen absoluten H¨aufigkeiten

Stromverbrauch (Y)

Region niedrig hoch

(X) (≤1.7) (>1.7) Nord

S¨ud

Tabelle der unter Unabh¨angigkeit erwarteten H¨aufigkeiten

Stromverbrauch (Y)

Region niedrig hoch

(X) (≤ 1.7) (>1.7) Nord

S¨ud

(5)

Für die Planung der künftigen Energieversorgung (Kraftwerke, Windparks usw.) für Deutsch- land wird eine Prognose des Stromverbrauchs benötigt. In der folgenden Tabelle ist der jähr- liche Stromverbrauch Y (in TWh) aller Stromkunden in der Bundesrepublik für die Jahre 2001 bis 2010 (t= 1, . . . ,10) angegeben.

Jahr 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Zeitpunkt t 1 2 3 4 5 6 7 8 9 10

Stromverbrauch Y 585 587 599 608 612 617 618 615 579 604 (a) Bestimmen Sie eine lineare Trendfunktion f¨ur den j¨ahrlichen Stromverbrauch. (6 Punk-

te)

(b) Berechnen Sie yb²⁰, d.h. den Prognosewert f¨ur t = 20. Was sagt er inhaltlich aus? (4 Punkte)

(c) Beurteilen Sie mit einem geeigneten Maß die Anpassungsg¨ute der Trendfunktion. Ist die Prognose mit diesem Modell sinnvoll? (10 Punkte)

Hinweis:

Geben Sie jeweils zun¨achst die ben¨otigten allgemeinen Formeln an.

Runden Sie ggf. auf vier Nachkommastellen.

Nutzen Sie zur Berechnung die folgenden Hilfsgr¨oßen:

XT

t=1

yt= 6 024, XT

t=1

t·yt= 33 247, XT

t=1

t² = 385