• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2011/12 28.03.2012

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2011/12 28.03.2012"

Copied!
5
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker

Wintersemester 2011/12 28.03.2012

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden

Erlaubte Hilfsmittel:

Taschenrechner (keine alphanumerische Tastatur)

standardisierte Formelsammlung Statistik vom WS 11/12 in gehefteter Form (unver¨andert, keine Hervorhebungen, keine Zus¨atze, keine losen Bl¨atter)

Nicht zugelassen sind:

eigenes Papier

Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen

Lehrb¨ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ufen Sie, ob Ihre Klausur alle f¨unf Aufgaben enth¨alt. ¨

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5

P

erreichbare

Punkte 20 20 20 20 20 100

erreichte

Punkte

(2)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 4 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

1. Die Varianz ist ein direkt interpretierbares Streuungsmaß. (5 Punkte) Richtig

Falsch Begr¨undung:

Die Varianz liegt in der gleichen Maßeinheit vor wie die Beobachtungen.

Die Varianz muss quadriert werden, um interpretierbar zu sein.

Die Varianz wird in der quadrierten Maßeinheit der Beobachtungen berechnet.

Die Varianz muss durch die Standardabweichung dividiert werden, um inter- pretierbar zu sein.

2. Die Berechnung von Durchschnittsnoten mit Hilfe des arithmetischen Mittels ist aus statistischer Sicht sinnvoll. (5 Punkte)

Richtig Falsch Begr¨undung:

Noten sind nominal skaliert, das arithmetische Mittel ist also ein geeignetes Lagemaß.

Noten sind ordinal skaliert, das arithmetische Mittel ist also kein geeignetes Lagemaß.

Noten sind metrisch skaliert, das arithmetische Mittel ist also ein geeignetes Lagemaß.

Noten sind kardinal skaliert, das arithmetische Mittel ist also kein geeignetes Lagemaß.

3. Der Wertebereich des Gini-Koeffizienten Ghat die Obergrenze (n−1)/n. (5 Punkte) Richtig

Falsch Begr¨undung:

G kann maximal den Wert G= 1 annehmen.

Die Obergrenze von (n−1)/n gilt f¨ur G.

G =n/(n−1)·Ghat als Obergrenze den Wert 1.

Die Obergrenze von (n−1)/n gilt f¨ur den Herfindahl-Index.

4. Ist der Schiefekoeffizient deutlich kleiner als Null, so ist die Verteilung symmetrisch.

(5 Punkte) Richtig Falsch Begr¨undung:

In diesem Fall ist die Verteilung rechtssteil.

In diesem Fall ist die Verteilung linkssteil.

Nur f¨ur eine symmetrische Verteilung kann ein negativer Schiefewert entstehen.

Eine symmetrische Verteilung h¨atte einen deutlich positiven Schiefewert.

(3)

Nachdem die Bundesregierung den Ausstieg aus der Atomenergie beschlossen hatte, wurde in den Medien viel ¨uber die m¨oglichen Folgen diskutiert. Unter anderem wurde die Bef¨urch- tung laut, dass die konventionellen Kraftwerke in Kombination mit erneuerbaren Energien nicht in der Lage sein w¨urden, den Energiebedarf f¨ur die Bundesrepublik zu decken. Um zun¨achst festzustellen, wie variabel der Energiebedarf ¨uberhaupt ist, wurden von 7 zuf¨allig ausgew¨ahlten deutschen konventionellen Kraftwerken die abgeforderten Leistungen (in Mio.

kWh) eines Stichzeitraums erhoben. Die entsprechenden Daten sind in der folgenden Tabelle dargestellt.

Kraftwerk 1 2 3 4 5 6 7

Leistung (Mio. kWh) 5.7 2.2 1.7 2.2 2.2 6.8 2.2

(a) Zur Messung dieser Variabilit¨at k¨onnen verschiedene Ans¨atze genutzt werden. Ein Ansatz ist es, eine Streubreite ohne Bezug auf ein Lagemaß zu bestimmen. In der Vorlesung haben Sie zwei Verfahren kennen gelernt, die diesem Ansatz folgen. Welche Verfahren sind das? Diskutieren Sie kurz (in Stichworten) Vor- und Nachteile dieser beiden Methoden im Vergleich zueinander. (10 Punkte)

(b) Ein anderer Ansatz ist die Bestimmung der Variabilit¨at mit Bezug auf ein Lagemaß.

F¨ur die gegebenen Daten ergibt sich die Standardabweichung se als ein solches Maß zuse= 1.9052. Bestimmen Sie f¨ur diese Daten als zweites Streuungsmaß nach diesem Prinzip den MAD. Welches dieser beiden Maße w¨urden Sie in diesem Fall vorziehen?

Begr¨unden Sie Ihr Urteil. (10 Punkte) Hinweis:

Geben Sie zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

Aufgabe 3 (20 Punkte)

In diesem Winter gab es in Deutschland einen kurzen Zeitraum extrem niedriger Tempera- turen, in dem der Energiebedarf ungew¨ohnlich hoch war. In den Nachrichten konnte man verfolgen, dass die Energiekonzerne in dieser Phase mit der Energieversorgung spekuliert und so die Bundesrepublik nahe an einen Blackout gebracht haben. Die Tatsache, dass dies m¨oglich war, wird nicht zuletzt der Marktkonzentration im Energiemarkt zugeschrieben. In der folgenden Tabelle ist dargestellt, wie sich die Ums¨atze in diesem Markt auf die Konzerne verteilen.

Konzern 1 2 3 4

Umsatz (Mrd. Euro) 92.9 70.9 17.6 14.5

(a) Bestimmen Sie die relative Marktkonzentration mit Hilfe eines geeigneten Maßes. In- terpretieren Sie das Ergebnis formal und inhaltlich. (10 Punkte)

(b) Bestimmen Sie zus¨atzlich die absolute Marktkonzentration. Welchen Ansatz (relative / absolute Konzentration) halten Sie f¨ur diese Anwendung f¨ur sinnvoller und warum?

Bitte antworten Sie nur in Stichworten. (10 Punkte) Hinweis:

Geben Sie jeweils zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

(4)

Nach der Energiewende (Abschaltung der Kernkraftwerke) werden die Stromversorgungsnet- ze anderen Anforderungen gen¨ugen m¨ussen als bisher. Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie) Strom produziert wird. Um eine Vorstellung davon zu bekommen, wie sich der Bedarf an Strom regional verteilt, wurde in einem ersten Schritt der durchschnittliche Stromverbrauch privater Haushalte pro Bundesland f¨ur das Jahr 2011 erhoben. Die Ergebnisse sind in der folgenden Tabelle dargestellt.

Rohdaten zum durchschnittlichen Stromverbrauch privater Haushalte

Bundesland B SH H N MV BB BE TH

durchschn. Stromverbrauch 1.8 1.7 1.8 2.0 1.5 1.7 1.7 1.4 (Tsd. kWh)

Bundesland SN ST BN BW S RP NW H

durchschn. Stromverbrauch 1.8 1.6 2.0 1.8 2.0 1.9 1.9 2.0 (Tsd. kWh)

(a) Stellen Sie die angegebenen Daten in Form einer Kontingenztafel dar. Nutzen Sie da- zu die unten links vorgegebene Tabelle. Bestimmen Sie im Anschluss die unter Un- abh¨angigkeit der Merkmale “Stromverbrauch” und “Region” erwartete Tafel. Tragen Sie Ihr Ergebnis in die unten rechts vorgegebene Tafel ein. Zur Region “Nord” z¨ahlen die Bundesl¨ander B, SH, H, N, MV, BB, BE, TH, S, ST. Die restlichen Bundesl¨ander werden zur Region “S¨ud” gerechnet. (8 Punkte)

(b) Berechnet man f¨ur die nach den Vorgaben aus (a) bestimmte Kontingenztafel den Wert des χ2-Koeffizienten, so ergibt sich χ2 = 5.76. Wie stark h¨angt der durchschnittliche Stromverbrauch pro Haushalt demnach mit der Region (Nord, S¨ud) zusammen, in der der Haushalt angesiedelt ist? (6 Punkte)

(c) Zwei verschiedene Institute, denen die Daten pro Bundesland (vgl. Tabelle der Rohda- ten) vorliegen, kommen auf Basis eigener Berechnungen des korrigierten Kontingenz- koeffizienten zu zwei unterschiedlichen Einsch¨atzungen ¨uber die St¨arke des Zusammen- hangs. Man kann davon ausgehen, dass kein Rechenfehler vorliegt. Wie erkl¨aren Sie diesen Effekt? (6 Punkte)

Hinweis:

Geben Sie in (b) zun¨achst die allgemeine Formel an.

Runden Sie ggf. Ihre Ergebnisse auf vier Nachkommastellen.

Tabelle der gemeinsamen absoluten H¨aufigkeiten

Stromverbrauch (Y)

Region niedrig hoch

(X) (≤1.7) (>1.7) Nord

S¨ud

Tabelle der unter Unabh¨angigkeit erwarteten H¨aufigkeiten

Stromverbrauch (Y)

Region niedrig hoch

(X) (≤ 1.7) (>1.7) Nord

S¨ud

(5)

F¨ur die Planung der k¨unftigen Energieversorgung (Kraftwerke, Windparks usw.) f¨ur Deutsch- land wird eine Prognose des Stromverbrauchs ben¨otigt. In der folgenden Tabelle ist der j¨ahr- liche Stromverbrauch Y (in TWh) aller Stromkunden in der Bundesrepublik f¨ur die Jahre 2001 bis 2010 (t= 1, . . . ,10) angegeben.

Jahr 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Zeitpunkt t 1 2 3 4 5 6 7 8 9 10

Stromverbrauch Y 585 587 599 608 612 617 618 615 579 604 (a) Bestimmen Sie eine lineare Trendfunktion f¨ur den j¨ahrlichen Stromverbrauch. (6 Punk-

te)

(b) Berechnen Sie yb20, d.h. den Prognosewert f¨ur t = 20. Was sagt er inhaltlich aus? (4 Punkte)

(c) Beurteilen Sie mit einem geeigneten Maß die Anpassungsg¨ute der Trendfunktion. Ist die Prognose mit diesem Modell sinnvoll? (10 Punkte)

Hinweis:

Geben Sie jeweils zun¨achst die ben¨otigten allgemeinen Formeln an.

Runden Sie ggf. auf vier Nachkommastellen.

Nutzen Sie zur Berechnung die folgenden Hilfsgr¨oßen:

XT

t=1

yt= 6 024, XT

t=1

t·yt= 33 247, XT

t=1

t2 = 385

Abbildung

Tabelle der gemeinsamen absoluten H¨ aufigkeiten

Referenzen

ÄHNLICHE DOKUMENTE

Dann k¨ onnen klassierte H¨ aufigkeitsverteilungen immer in unklassierte H¨ aufigkeitsverteilungen umgewandelt werden, aber unklassierte H¨ aufigkeitsverteilungen k¨ onnen nicht

b) Es liegt eine Datenreihe vor, auf deren Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini-

Im Vergleich zu den befragten Studenten machen sich doppelt so viele Studentinnen manchmal oder oft Sorgen ¨ uber ihre Klausuren.

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Ein Boxplot kann erst bei ordinalen Merkmalen eingesetzt werden und ist deswegen kein Instrument für die Beurteilung von Lage, Streuung und Schiefe bei metrischen

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an

x Noten sind ordinal skaliert, das arithmetische Mittel ist also kein geeignetes Lagemaß.. Noten sind metrisch skaliert, das arithmetische Mittel ist also ein