Klausur zu Grundz¨ uge der Statistik: Statistik I PD Dr. Joachim Wilde
Wintersemester 2006/07 13.02.2007
Name: ...
Matrikelnummer: ...
Bearbeitungszeit: 2 Stunden Erlaubte Hilfsmittel:
• Taschenrechner (keine alphanumerische Tastatur)
• Standardisierte Formelsammlungen Statistik I und II in gehefteter Form (unver¨andert, keine Hervorhebungen, keine Zus¨atze, keine losen Bl¨atter) Nicht zugelassen sind:
• Eigenes Papier
• Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen
• Lehrb¨ucher, Verteilungstabellen
Es sind insgesamt 100 Punkte zu erreichen.
Uberpr¨ufen Sie, ob Ihre Klausur alle ¨ sechs Aufgaben enth¨alt.
Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!
Aufgabe 1 2 3 4 5 6 P
erreichbare
Punkte 15 24 12 16 18 15 100
erreichte
Punkte
Aufgabe 1 (15 Punkte)
In einer Firma seien die Bruttomonatsgeh¨alter wie folgt verteilt:
Euro je 0 bis 1500 bis 2000 bis 2500 bis 3500 bis Besch¨aftigtem unter 1500 unter 2000 unter 2500 unter 3500 unter 5500 Anzahl
Besch¨aftigte 150 300 350 150 50
(a) Was ist f¨ur die grafische Darstellung dieser H¨aufigkeitsverteilung besser geeignet: Ein Stabdiagramm oder ein Histogramm (mit Begr¨undung)? (3 Punkte)
(b) Stellen Sie die H¨aufigkeitsverteilung mittels der von Ihnen in a) gew¨ahlten Metho- de grafisch dar. Dazu k¨onnen Sie die unterhalb der Aufgabe vorbereitete Abbildung nutzen. (8.5 Punkte)
(c) Angenommen, Sie h¨atten in b) ein Histogramm gezeichnet, dabei aber als S¨aulenh¨ohen die relativen H¨aufigkeiten verwendet. Welche Klasse w¨are dadurch am st¨arksten ¨uberbetont worden (mit Begr¨undung)? (3.5 Punkte)
- 6
Der kurzfristige Lieferstopp von russischem Erd¨ol am Anfang des Jahres hatte ganz Westeu- ropa ¨uberrascht. Auch der f¨ur die Roh¨olbeschaffung verantwortliche Manager einer mittel- deutschen Raffinerie, welche ¨uber eine andere russische Erd¨ol-Pipeline versorgt wird, macht sich nun große Sorgen. Er ¨uberlegt, ob die eigenen Tankbest¨ande der Raffinerie ausreichen w¨urden, um solche kurzfristigen Lieferausf¨alle zu kompensieren. Denn die Raffinerie verf¨ugt zur ¨Olbevorratung nur ¨uber einen Tank mit einer maximalen F¨ullmenge von 100 000 Tonnen.
Der Manager druckt sich mit Hilfe der Managementsoftware der Raffinerie eine Liste mit den Tankbest¨anden f¨ur die letzten 300 Tage des Jahres 2006 aus. Der Tankstand wird 1-mal pro Tag automatisch gemessen und an das System gemeldet:
F¨ullmenge des Tanks/Tag Anzahl (1 000 Tonnen/Tag) Tage
0.01 3
20 15
50 24
75 48
80 72
85 96
90 30
100 12
300
(a) Berechnen Sie die durchschnittliche F¨ullmenge des Tanks/Tag. Wie viele Tage k¨onnte die Raffinerie bei einem Erd¨ol-Lieferausfall unter Annahme der durchschnittlichen F¨ullmenge/Tag weiterarbeiten, wenn pro Tag rund 38 000 t Roh¨ol verarbeitet werden?
(5 Punkte)
(b) Berechnen Sie die 5-Punkte-Zusammenfassung und stellen Sie diese in einem Boxplot dar. Beurteilen Sie an Hand des Boxplots die Schiefe des Datensatzes. (11 Punkte) (c) Ermitteln Sie die Standardabweichung der F¨ullmenge des Tanks/Tag unter Nutzung
des Verschiebungssatzes. Welche Auswirkungen h¨atte theoretisch eine hohe Standard- abweichung f¨ur die Raffinerie? (5 Punkte)
(d) Im gesamten Jahr 2000 wurden in der Raffinerie insgesamt 9 500 000 t Roh¨ol verar- beitet. Im Jahr 2005 dagegen schon 12 124 675 t. Berechnen Sie die durchschnittliche Wachstumsrate der ¨Olverarbeitung pro Jahr in der Raffinerie. (3 Punkte)
Hinweis:
Geben Sie in (a), (c) und (d) jeweils zun¨achst die allgemeinen Formeln an.
Die f¨ur die Berechnung der Varianz im Verschiebungssatz ben¨otigte Summe der Quadrate betr¨agt 1 853 400.
Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.
Aufgabe 3 (12 Punkte)
Vor kurzem waren in Deutschland die hohen Strompreise in der Diskussion, welche zuneh- mend die Unternehmen mit hohen Kosten belasten. Als Ursache f¨ur die hohen Preise werden neben hohen staatlichen Abgaben auch hohe Netzentgelte f¨ur die Stromdurchleitung, eine Abh¨angigkeit von knappen fossilen Rohstoffen bei der Stromerzeugung, hohe Kosten bei der Nutzung der erneuerbaren Energien und mangelnder Wettbewerb der Energieerzeuger untereinander gesehen. Um sich einen ¨Uberblick ¨uber die Markt- und Wettbewerbsstruktur bei den Energieerzeugern zu verschaffen, erstellt der in der Bundesnetzagentur zust¨andige Mitarbeiter folgende Liste, welche alle Energieerzeuger und die produzierte Strommenge in Mrd. kWh des Jahres 2004 darstellt:
Unternehmen 1 2 3 4 Summe
Stromerzeugung 160 180 90 70 500 (Mrd. kWh 2004)
Um diese Daten besser einsch¨atzen zu k¨onnen, vergleicht er die Zahlen aus dem Jahr 2004 mit den Angaben ¨uber die produzierte Strommenge aller Energieerzeuger des Jahres 1999:
Unternehmen 1 2 3 4 5 6 7 8 Summe
Stromerzeugung 70 100 90 30 10 10 30 60 400 (Mrd. kWh 1999)
(a) Erl¨autern Sie kurz, welche Aspekte allgemein zu einem Ansteigen der absoluten Kon- zentration f¨uhren k¨onnen. (3 Punkte)
(b) Berechnen Sie f¨ur das Jahr 1999 und das Jahr 2004 die absolute Konzentration im Markt der Energieerzeuger mit Hilfe eines geeigneten Maßes. Vergleichen Sie anschlie- ßend die Werte f¨ur die beiden Jahre. (6 Punkte)
(c) Die Politik schl¨agt nach der Analyse der Ergebnisse des Jahres 2004 vor, die Energie- konzerne 1 bis 4 zur Steigerung des Wettbewerbs zu zerschlagen. Erl¨autern Sie, wie sich auf Basis der Daten des Jahres 2004 die absolute Konzentration ver¨andert, wenn je- der der 4 Energieerzeuger in jeweils 2 gleich große Unternehmenseinheiten zerschlagen w¨urde. (Bitte NICHT rechnen, nur erl¨autern) (3 Punkte)
Hinweis:
Geben Sie in (b) zun¨achst die allgemeine Formel an. Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.
Die voraussichtlich im April in Kraft tretende Gesundheitsreform wird ¨Anderungen sowohl f¨ur die Versicherten als auch f¨ur die Gesetzlichen Krankenkassen mit sich bringen. Obwohl die Eckpunkte der Reform bekannt sind, gestaltet sich die Absch¨atzung der auf die Kranken- kassen zukommenden Kosten als schwierig. Dies hat dazu beigetragen, dass viele Gesetzliche Krankenkassen zum 01.01.2007 ihre Beitr¨age erh¨oht haben.
Die Gesundheitsministerin m¨ochte nun wissen, wie viele der in einem regional abgegrenzten Gebiet t¨atigen Gesetzlichen Kassen ihre Beitr¨age erh¨oht haben und wie viele nicht. Dazu wird ihr vom Staatssekret¨ar folgende Liste zur Verf¨ugung gestellt, welche neben dem Merkmal
”Beitragserh¨ohung” (mit den Auspr¨agungen ”ja” und ”nein”) auch noch die Variable ”Art der Krankenkasse” erfasst (mit den Auspr¨agungen ”Allgemeine Ortskrankenkassen (AOK)”
/ ”Ersatzkrankenkassen (EK)” / ”Betriebskrankenkassen (BKK)” / ”Innungskrankenkassen (IKK)”):
Art der Krankenkasse Summe AOK EK BKK IKK
Beitrags- ja 14 9 105 4
erh¨ohung nein 2 1 95 12
Summe 16 10 200 16 242
(a) Wie viel Prozent der Krankenkassen haben insgesamt in dieser Region die Beitr¨age erh¨oht bzw. nicht erh¨oht? (2 Punkte)
(b) Berechnen Sie ebenso die Verteilung des Merkmals Beitragserh¨ohung f¨ur die einzelnen Krankenkassenarten. Erl¨autern Sie kurz, ob Sie an Hand der Verteilung des Merkmals
’Beitragserh¨ohung f¨ur die einzelnen Krankenkassenarten’ auf einen Zusammenhang zwischen dem Merkmal Beitragserh¨ohung und Art der Krankenkasse schließen k¨onnen.
(6 Punkte)
(c) Berechnen Sie mit einem geeigneten Maß den Zusammenhang zwischen den 2 Merk- malen und interpretieren Sie diesen. (8 Punkte)
Hinweis:
Geben Sie in (c) jeweils zun¨achst die ben¨otigten allgemeinen Formeln an.
Runden Sie ggf. Ihre Ergebnisse auf 4 Nachkommastellen.
Greifen Sie f¨ur Ihre Berechnungen auf die unter Unabh¨angigkeit erwartete Tafel mit gerun- deten Werten zur¨uck:
Art der Krankenkasse AOK EK BKK IKK Beitrags- ja 8.7 5.5 109.1 8.7 erh¨ohung nein 7.3 4.5 90.9 7.3
Aufgabe 5 (18 Punkte)
Der Hotelbesitzer Insol Went ist verzweifelt. In Erwartung eines kalten Winters mit viel Schnee und vielen G¨asten hat er f¨ur sein Hotel im ber¨uhmten Wintersportort L’Alpe d’Harz viele Saisonarbeitskr¨afte und feste Mitarbeiter eingestellt. Doch das Wetter hat ihm einen Strich durch die Rechnung gemacht: Ohne Schnee kommen keine G¨aste und der Hotelbesit- zer sitzt auf den Lohnkosten f¨ur sein Personal fest.
Der Hotelbesitzer fragt sich nun, ob es irgendeine M¨oglichkeit gibt, bereits im Herbst voraus- zusagen, ob der Winter viel Schnee bringt oder nicht. So k¨onnte er im Vorfeld absch¨atzen, wie viele G¨aste in sein Hotel kommen werden und wie viel Personal er einstellen muss. Bei seinen ¨Uberlegungen st¨oßt er auf folgende Bauernregel:
”Je mehr der Sommer ist heiß, je mehr der Winter wird dann weiß.”
Um die Aussagekraft dieser Bauernregel zu ¨uberpr¨ufen, erfasst der Hotelbesitzer f¨ur die letzten 10 Saisons die Durchschnittstemperatur im Sommer (in◦C) und die durchschnittliche Schneeh¨ohe (in Meter) im darauffolgenden Winter:
Saison 1996/ 1997/ 1998/ 1999/ 2000/ 2001/ 2002/ 2003/ 2004/ 2005/
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
i 1 2 3 4 5 6 7 8 9 10
Tempera-
tur im Som- 22 20 27 21 30 29 23 33 26 35
mer (◦C) Schneeh¨ohe
im darauf-
folgenden 1.90 2.00 1.40 1.80 1.20 1.65 1.70 1.30 1.95 1.45 Winter (m)
(a) Wie sind die Merkmale skaliert? (2 Punkte)
(b) Berechnen Sie f¨ur den Datensatz den Korrelationskoeffizienten nach Spearman. Was k¨onnen Sie ¨uber den Zusammenhang der Merkmale aussagen? Kann der Hotelbesitzer die Bauernregel f¨ur seine Personalplanung nutzen? (11 Punkte)
(c) Erl¨autern Sie kurz, warum Sie f¨ur die vorliegenden Merkmale auch den Korrelations- koeffizienten nach Bravais-Pearson h¨atten berechnen k¨onnen. In welchen Situationen und zu welchem Zweck w¨urden Sie den Korrelationskoeffizienten nach Bravais-Pearson errechnen und wann w¨urden Sie den Korrelationskoeffizienten nach Spearman nutzen?
(5 Punkte) Hinweis:
Geben Sie in (b) zun¨achst die ben¨otigte allgemeine Formel an. Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.
In einem westdeutschen Bundesland ist die bislang alleinregierende K¨onigspartei in schwere Turbulenzen geraten. Die Anh¨anger der Oppositionspartei Graue Maus wittern deshalb die Chance auf einen Machtwechsel. 80 % von ihnen pl¨adieren f¨ur vorgezogene Neuwahlen. Dem- gegen¨uber lehnen 70 % der Anh¨anger der K¨onigspartei vorgezogene Neuwahlen ab. Insgesamt sind 5 Mio. Menschen wahlberechtigt, 60 % von ihnen sind Anh¨anger der K¨onigspartei, die
¨ubrigen 40 % stehen der Partei Graue Maus nahe.
(a) Stellen Sie den beschriebenen Sachverhalt in einer Kontingenztafel f¨ur die absoluten H¨aufigkeiten dar. (6 Punkte)
(b) Zeichnen Sie ein Venn-Diagramm. Bilden Sie dabei in den Ellipsen die Ereignisse
”Anh¨anger der K¨onigspartei” und ”Bef¨urwortung von Neuwahlen” ab. (2 Punkte) (c) Nehmen Sie nun an, dass ein Wahlberechtigter zuf¨allig gezogen wird.
1. Wie groß ist die Wahrscheinlichkeit, dass er sich f¨ur Neuwahlen ausspricht?
(2 Punkte)
2. Wie groß ist die Wahrscheinlichkeit, dass der Befragte ein Anh¨anger der Grauen Maus ist und Neuwahlen ablehnt? (2 Punkte)
3. Angenommen, Sie wissen bereits, dass es sich bei dem Befragten um einen Bef¨urworter von Neuwahlen handelt. Wie groß ist dann die Wahrscheinlichkeit, dass er ein Anh¨anger der K¨onigspartei ist? (3 Punkte)
Hinweis:
Runden Sie Ihre Ergebnisse ggf. auf 2 Nachkommastellen.