• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2009/10 08.02.2010

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2009/10 08.02.2010"

Copied!
9
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker

Wintersemester 2009/10 08.02.2010

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden

Erlaubte Hilfsmittel:

Taschenrechner (keine alphanumerische Tastatur)

standardisierte Formelsammlung Statistik vom WS 09/10 in gehefteter Form (unver¨andert, keine Hervorhebungen, keine Zus¨atze, keine losen Bl¨atter)

Nicht zugelassen sind:

eigenes Papier

Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen

Lehrb¨ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ufen Sie, ob Ihre Klausur alle sechs Aufgaben enth¨alt. ¨

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5 6

P

erreichbare

Punkte 15 20 15 17 17 16 100

erreichte

Punkte

(2)
(3)

Aufgabe 1 (15 Punkte)

Betrachten Sie die folgende Abbildung. Markieren Sie, ob die angegebenen f¨unf Aussagen je- weils zutreffen oder nicht, und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte).

Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

Abbildung: Schneeh¨ohen in cm in Halle, Januar 2010

01020304050

Tag

Schneehöhe in cm

1 5 10 15 20 25 30

01020304050

1. Der Modus der Schneeh¨ohe liegt bei 45 cm. (3 Punkte) Richtig

Falsch Begr¨undung:

45 cm ist die h¨ochste gemessene Schneeh¨ohe.

45 cm ist die am h¨aufigsten gemessene Schneeh¨ohe.

Es gibt Schneeh¨ohen, die an mehr Tagen gemessen wurden als die H¨ohe von 45 cm.

2. Der Mittelwert der Schneeh¨ohe liegt bei 45 cm. (3 Punkte) Richtig

Falsch Begr¨undung:

45 cm ist nicht der Mittelwert, sondern das Maximum der Schneeh¨ohe.

Am 16. Tag, also in der Monatsmitte, war die Schneeh¨ohe 45 cm.

45 cm ist nicht der Mittelwert, sondern der Median der Schneeh¨ohe.

3. Der Median der Schneeh¨ohe liegt bei 45 cm. (3 Punkte) Richtig

Falsch Begr¨undung:

Am 16. Tag, also in der Monatsmitte, war die Schneeh¨ohe 45 cm.

Weniger als die H¨alfte der Schneeh¨ohen sind gr¨oßer oder gleich 45 cm.

Es m¨usste mindestens eine Schneeh¨ohe von 50 cm geben, damit 45 cm der Median ist.

(4)

4. Die Spannweite der Schneeh¨ohe betr¨agt 35 cm. (3 Punkte) Richtig

Falsch Begr¨undung:

Die maximale Schneeh¨ohe ist 45 cm, die minimale H¨ohe 10 cm.

35 cm wurden am 04.01. zum ersten Mal, am 25.01. zum letzten Mal gemessen.

Die Spannweite ist aus der Abbildung nicht ersichtlich.

5. An knapp 10% der Tage lagen weniger als 25 cm Schnee. (3 Punkte) Richtig

Falsch Begr¨undung:

An 7 Tagen lagen bis zu 25 cm Schnee, das sind 22.6%.

Es waren 3 Tage, das entspricht 9.7%.

Es waren 3 Tage, das entspricht 12%.

(5)

Aufgabe 2 (20 Punkte)

Ein Immobilienbesitzer hat je ein Mietshaus in Dortmund und in Halle. Die Hausverwaltun- gen legen ihm mit der Kostenabrechnung jedes Jahr unter Anderem die Abrechnung ¨uber das im Winter verbrauchte Streusalz vor. In der folgenden Tabelle sind die angegebenen Verbr¨auche (in kg) f¨ur die beiden H¨auser in den vergangenen 8 Jahren angegeben.

Jahr 2002 2003 2004 2005 2006 2007 2008 2009

Dortmund 10 12 20 13 15 18 9 25

Halle 25 15 17 13 17 23 15 30

(a) In der unten gezeigten Abbildung sind die Boxplots der verbrauchten Streusalzmengen dargestellt. Interpretieren Sie die Boxplots: Was k¨onnen Sie ¨uber Lage und Streuung des Salzverbrauchs in den beiden H¨ausern sagen? Gehen Sie f¨ur diese Aufgabe davon aus, dass die in der Abbildung dargestellten Boxplots korrekt sind. (6 Punkte)

(b) ¨Uberpr¨ufen Sie, ob die Boxplots korrekt gezeichnet sind. Korrigieren Sie die Abbildung gegebenenfalls. (14 Punkte)

Hinweis:

Geben Sie in (b) zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

Dortmund Halle

051015202530350102030

(6)

In Dortmund machte in diesem Winter ein Tankstellenp¨achter Schlagzeilen, der die Streu- salzkrise (es gab in den deutschen Gesch¨aften kein Streusalz mehr zu kaufen) durch einen Direktimport aus Rum¨anien bew¨altigte. Aus diesem Anlass wurde die Produktion von Streu- salz in Deutschland einmal genauer unter die Lupe genommen. In der folgenden Tabelle ist zusammengestellt, wie viele Produzenten von Streusalz jeweils welche Mengen (in Millionen Tonnen pro Jahr) in Deutschland vertreiben.

Streusalzmenge Anzahl Produzenten (in Mio. t)

[0; 0.2) 30

[0.2; 0.6) 25

[0.6; 1.0) 3

[1.0; 3.0) 2

(a) Beurteilen Sie die Konzentration der Streusalzproduktion anhand der Lorenzkurve.

Nutzen Sie f¨ur die Zeichnung das unten vorgegebene Koordinatensystem. (7 Punkte) (b) Laut Berechnungen einer amtlichen Stelle betr¨agt der normierte Gini-Koeffizient G

f¨ur diese Daten G = 0.4538. Wie stark ist demnach die Konzentration? (1 Punkt) (c) Wie groß ist der Wert des nicht normierten Gini-Koeffizienten, wenn Sie die Angabe

aus (b) zur Berechnung nutzen? (3 Punkte)

(d) Pr¨ufen Sie anhand der Daten, ob Ihre Umrechnung aus (c) stimmt. (4 Punkte) Hinweis:

Geben Sie in (a), (c) und (d) jeweils zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf 4 Nachkommastellen.

Abbildung: Lorenzkurve der Streusalzproduktion

0 0.2 0.4 0.6 0.8 1

00.20.40.60.81

(7)

Aufgabe 4 (17 Punkte)

Ein Hotel in Halle m¨ochte seinen G¨asten speziell auf sie zugeschnittene Angebote ma- chen. Insbesondere im Winter wollen sich die G¨aste nach einem Aufenthalt im Freien gerne aufw¨armen. Dazu sollen im Hotel Zimmer mit besonderen Angeboten geschaffen werden:

die so genannten Exotic-Zimmer, in denen eine heiße Dusche “Tropenregen” zur Verf¨ugung steht; die Island-Suiten, wo die G¨aste ein heißes Bad im Dampf-Whirlpool nehmen k¨onnen;

die Finnland-Apartments mit eigener Sauna. Unter den zur Zeit 300 G¨asten des Hotels wird eine Umfrage durchgef¨uhrt, um die Pr¨aferenzen (X) der G¨aste zu erfahren. Dabei wird zu- gleich die Nationalit¨at (Y) der G¨aste erhoben, da der Hotelier glaubt, dass es hier einen Zusammenhang geben k¨onnte. Die folgende Tabelle zeigt das Ergebnis der Befragung in Form der bedingten Verteilung von Y gegeben X. Insgesamt ergaben sich 90 Stimmen f¨ur die Tropenregen-Dusche, 95 Personen bevorzugten den Dampf-Whirlpool, und f¨ur die Sauna stimmten 115 G¨aste.

Nationalit¨at (Y) gegeben die Pr¨aferenz deutsch englisch franz¨osisch Dusche Tropenregen 10/18 3/18 5/18 Pr¨aferenz (X) Dampf-Whirlpool 5/19 11/19 3/19

Sauna 15/23 6/23 2/23

(a) Angenommen, auch k¨unftige G¨aste h¨atten ¨ahnliche Pr¨aferenzen. Kann der Hotelier mit der oben angegebenen Tabelle eine Aussage dar¨uber treffen, welchen Zimmertyp er einem englischen Gast anbieten sollte? Begr¨unden Sie Ihre Antwort. Bitte f¨ur die Antwort nichts ausrechnen, lediglich argumentieren! (3 Punkte)

(b) Rekonstruieren Sie die Tabelle der gemeinsamen relativen H¨aufigkeiten der beiden Merkmale. Nutzen Sie dazu den unten vorgegebenen Tabellenrahmen. (7 Punkte) (c) Der χ2-Wert f¨ur die Kontingenztafel betr¨agt 54.1387. Wie beurteilen Sie den Zusam-

menhang der beiden Merkmale? Welche Konsequenzen sollte der Hotelier bei der Ver- gabe von Hotelzimmern ziehen? (7 Punkte)

Hinweis:

Geben Sie in (b) und (c) zun¨achst die allgemeine Formel an.

Runden Sie ggf. Ihre Ergebnisse auf vier Nachkommastellen.

Tabelle der gemeinsamen relativen H¨aufigkeiten Nationalit¨at (Y)

deutsch englisch franz¨osisch Dusche Tropenregen

Pr¨aferenz (X) Dampf-Whirlpool Sauna

(8)

Durch die große mediale Aufmerksamkeit f¨ur die Schweinegrippe ist in diesem Winter die

“normale” Grippe etwas aus dem Blickfeld der ¨Offentlichkeit geraten. Daher haben Wissen- schaftler das Impfverhalten gegen¨uber der normalen Influenza untersucht. Und dabei haben sie ¨Uberraschendes festgestellt: mit der Anzahl der Impfungen gegen die normale Grippe geht auch das Auftreten der Schweinegrippe zur¨uck! In der folgenden Tabelle sind die w¨ochentli- chen Zahlen (X = Anzahl der Impfungen gegen normale Grippe, Y = Anzahl der F¨alle von Schweinegrippe) f¨ur die Monate Oktober bis einschließlich Dezember aufgef¨uhrt.

Beobachtung 1 2 3 4 5 6

Anzahl GrippeimpfungenX (in 1 000) 3.2 4.5 2.1 1.2 0.9 2.7 F¨alle von Schweinegrippe Y 224 201 239 250 268 229

Beobachtung 7 8 9 10 11 12

Anzahl GrippeimpfungenX (in 1 000) 3.8 2.2 3.6 4.1 2.4 1.5 F¨alle von Schweinegrippe Y 218 226 201 195 245 270

(a) Vollziehen Sie das Ergebnis der Wissenschaftler nach, indem Sie zun¨achst die Kor- relation zwischen X und Y bestimmen. Interpretieren Sie das Ergebnis formal und inhaltlich. (9 Punkte)

(b) Die Wissenschaftler geben ihre Ergebnisse bekannt. In der Presse heißt es darauf hin:

“Aufregung um Impfstoff f¨ur Schweinegrippe – Normale Impfung h¨atte auch gereicht!”

Geben Sie zwei Argumente an, warum diese Aussage nicht unbedingt zutrifft. (8 Punk- te)

Hinweis:

Geben Sie in (a) zun¨achst die ben¨otigte allgemeine Formel an. Runden Sie ggf. auf vier Nachkommastellen.

Nutzen Sie zur Berechnung die folgenden Hilfsgr¨oßen:

X12

i=1

xi = 32.2,

X12

i=1

x2i = 101.5,

X12

i=1

yi = 2 766,

X12

i=1

yi2 = 644 414,

X12

i=1

xi·yi = 7 124.4

(9)

Aufgabe 6 (16 Punkte)

Die Betreiber von Getr¨ankest¨anden auf Weihnachtsm¨arkten versuchen, ihre Einkaufsmen- gen optimal zu gestalten. Dazu beobachten sie zun¨achst das Kaufverhalten ihrer Kunden.

F¨ur den Absatz an Heißgetr¨anken spielt die Außentemperatur (gemessen als Tagesdurch- schnittstemperatur) eine entscheidende Rolle. In der folgenden Tabelle sind Daten f¨ur einen Getr¨ankestand des Halleschen Weihnachtsmarkts von 2009 aufgef¨uhrt. Angegeben ist je- weils die durchschnittliche Tagestemperatur (in C) und die verkaufte Menge einer Sorte von Heißgetr¨anken (in Mengeneinheiten, ME).

Temperatur X (C) 8 -2 0 -5 12 -11 6 -1 4 2 Verkauf Y (ME) 7 10 9 10 3 9 7 10 8 9

(a) Der Betreiber des Standes geht davon aus, dass die verkaufte Menge linear von der Temperatur abh¨angt. Stellen Sie ein entsprechendes Modell auf und bestimmen Sie die Modellparameter. Geben Sie abschließend die berechnete Modellgleichung zur Vorher- sage des Verkaufs an. (7 Punkte)

(b) Der berechnete Regressionsparameter ab hat ein negatives Vorzeichen. Erscheint Ihnen dies aus inhaltlicher Sicht plausibel? Begr¨unden Sie Ihre Ansicht. (4 Punkte)

(c) In der unten stehenden Abbildung sind die Residuen der berechneten Regressions- geraden f¨ur die vorliegenden Temperaturwerte abgetragen. Was f¨allt Ihnen an dieser Abbildung auf? Was schließen Sie daraus: als wie gut ist die Anpassung der beobach- teten Daten durch die Gerade zu bezeichnen? (5 Punkte)

Hinweis:

Geben Sie in (a) zun¨achst die allgemeine Formel an.

Verwenden Sie zur Berechnung die folgenden Hilfsgr¨oßen:

X10

i=1

xi = 13,

X10

i=1

x2i = 415,

X10

i=1

yi = 82,

X10

i=1

yi2 = 714,

X10

i=1

xi·yi = 5 Runden Sie ggf. auf vier Nachkommastellen.

Abbildung: Residuen der einfachen linearen Regression

−10 −5 0 5 10

−3−2−10123

Temperatur

Residuen

Abbildung

Tabelle der gemeinsamen relativen H¨ aufigkeiten Nationalit¨at ( Y )

Referenzen

ÄHNLICHE DOKUMENTE

Dann k¨ onnen klassierte H¨ aufigkeitsverteilungen immer in unklassierte H¨ aufigkeitsverteilungen umgewandelt werden, aber unklassierte H¨ aufigkeitsverteilungen k¨ onnen nicht

b) Es liegt eine Datenreihe vor, auf deren Grundlage der Gini-Koeffizient berechnet wur- de. Werden alle Beobachtungswerte dieser Datenreihe verdoppelt und wird der Gini-

Im Vergleich zu den befragten Studenten machen sich doppelt so viele Studentinnen manchmal oder oft Sorgen ¨ uber ihre Klausuren.

Stellen Sie zun¨ achst die ben¨ otigten Gr¨ oßen bereit?. Geben Sie die verwendeten Rechenregeln in allgemeiner

Ein Boxplot kann als Grundlage zur Beurteilung der Lage, Streuung und Schiefe eines Datensatzes eingesetzt werden5. Richtig Falsch

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an

Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie)

Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.. Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische