• Keine Ergebnisse gefunden

Klausur zu Grundz¨uge der Statistik: Statistik I Prof. Dr. Claudia Becker Wintersemester 2005/06 10.02.2006

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Grundz¨uge der Statistik: Statistik I Prof. Dr. Claudia Becker Wintersemester 2005/06 10.02.2006"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Grundz¨ uge der Statistik: Statistik I Prof. Dr. Claudia Becker

Wintersemester 2005/06 10.02.2006

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden

Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlung Statistik vom WS 05/06 in gehefteter Form (unver¨andert, keine Hervorhebungen, keine Zus¨atze, keine losen Bl¨atter)

Nicht zugelassen sind:

• eigenes Papier

• Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen

• Lehrb¨ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ufen Sie, ob Ihre Klausur alle sechs Aufgaben enth¨alt. ¨

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5 6

P

erreichbare

Punkte 18 20 17 17 18 10 100

erreichte

Punkte

(2)

Aufgabe 1 (18 Punkte)

Markieren Sie, ob die folgenden sechs Aussagen jeweils zutreffen oder nicht, und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte).

1. Der Modus teilt die geordnete Datenreihe in zwei H¨alften.

Richtig Falsch Begr¨undung:

Der Modus entspricht dem 50%-Quantil.

Der Modus ist definiert als durchschnittliche Merkmalsauspr¨agung in der Stichprobe.

Der Modus ist die am h¨aufigsten vorkommende Auspr¨agung.

2. F¨ur diskrete Merkmale ist eine Klassierung wegen der unendlich vielen Merkmals- auspr¨agungen unerl¨asslich.

Richtig Falsch Begr¨undung:

Eine Klassierung der Auspr¨agungen ist grunds¨atzlich nur bei stetigen Merkmalen m¨oglich.

F¨ur ein diskretes Merkmal werden die Auspr¨agungen immer klassiert.

Ein diskretes Merkmal muss nicht notwendig unendlich viele Auspr¨agungen besitzen.

3. Beim Histogramm wird ¨uber jeder Klasse ein Rechteck mit der H¨ohe der korrigierten kumulierten Klassenh¨aufigkeit gezeichnet.

Richtig Falsch Begr¨undung:

Die Verwendung der korrigierten H¨aufigkeit sichert die Fl¨achentreue.

Die Verwendung der korrigierten kumulierten H¨aufigkeit sichert die L¨angentreue.

Beim Histogramm werden keine Rechtecke gezeichnet.

4. Das Histogramm wird nach dem Prinzip der Fl¨achentreue konstruiert.

Richtig Falsch Begr¨undung:

Nur das Kreisdiagramm wird nach dem Prinzip der Fl¨achentreue konstruiert.

Die Rechtecke werden so konstruiert, dass ihre Fl¨achen den Klassenh¨aufigkeiten entsprechen.

Das Histogramm folgt dem Prinzip der L¨angentreue.

5. Ein metrisch skaliertes Merkmal kann in ein nominal skaliertes, nicht aber in ein ordi- nal skaliertes Merkmal umgewandelt werden.

Richtig Falsch Begr¨undung:

Eine metrische Skalierung kann in keine andere Skalierung umgewandelt werden.

Die Ordnung der Skalen von niedrig nach hoch ist nominal→ metrisch → ordinal.

Eine metrische Skalierung kann in jede niedrigere Skalierung umgewandelt werden.

(3)

Richtig Falsch Begr¨undung:

Der Median entspricht dem ersten Quartil.

Der Median entspricht dem zweiten Quartil.

Der Median wird auch alsx0.75 bezeichnet, entspricht also dem oberen oder dritten Quartil.

Aufgabe 2 (20 Punkte)

Der Kaffeh¨andler “Schobi” verkauft neben Kaffee auch andere Artikel, etwa hochwertigen Diamantschmuck. Bisher bezog Schobi 1 000 Diamanten pro Jahr direkt aus einer Diamant- mine A. Die Abbaumethoden in dieser Mine werden in letzter Zeit jedoch zunehmend in der Offentlichkeit kritisiert. Schobi will daher in Zukunft seine Diamanten vom Amsterdamer¨ Diamanthaus “Der B¨ar” beziehen, das seinerseits aus drei Minen B1, B2, B3 beliefert wird.

Um die Qualit¨at der Steine aus Amsterdam zu pr¨ufen, wird eine Probelieferung von insge- samt 1 000 Diamanten aus den neuen Minen B1, B2, B3 mit der letzten Lieferung aus Mine A verglichen. Das zu untersuchende Merkmal ist das Diamantgewicht X (in Karat).

In der folgenden Tabelle sind die mittleren Gewichte der von den verschiedenen Minen ge- lieferten Steine, die Anzahl der aus der jeweiligen Mine stammenden Steine und zus¨atzlich die Variationskoeffizienten angegeben.

Mine n x v

A 1 000 0.55 0.5 Mine nj xj vj

B1 250 0.20 0.7 B2 350 0.40 0.8 B3 400 0.90 0.6

(a) Bestimmen Sie das durchschnittliche Diamantgewicht f¨ur die Steine der Gesamtliefe- rung von “Der B¨ar”. Liefert “Der B¨ar” im Schnitt Steine vom gleichen Gewicht wie die bisherige Mine A? (4 Punkte)

(b) Bestimmen Sie die empirischen Standardabweichungen des Diamantgewichts f¨ur alle vier Minen. Ber¨ucksichtigen Sie dabei, was Sie ¨uber die Definition des Variationskoef- fizienten wissen. (6 Punkte)

(c) Vergleichen Sie die Standardabweichung des Diamantgewichts f¨ur die Lieferung aus Mine A mit der Standardabweichung der Gesamtlieferung aus Amsterdam. Gehen Sie hierzu davon aus, dass die drei Standardabweichungense1,se2,se3 der Minen B1, B2 und B3 alsse1 = 0.14, se2 = 0.32 und se3 = 0.54 gegeben sind. (10 Punkte)

Hinweis:

Geben Sie in (a), (b) und (c) jeweils zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

(4)

Aufgabe 3 (17 Punkte)

Die Bundesregierung ¨uberlegt, unter gewissen Umst¨anden Familien die Kosten f¨ur die Kin- derbetreuung zu erstatten. Dazu muss das monatliche Gesamteinkommen der Familie unter- halb eines Betrags von 5 000 Euro (brutto) liegen. Um einen Eindruck von der Einkommens- verteilung der Familien zu bekommen, erhebt eine deutsche Stadt mit 500 000 gegebenenfalls anspruchsberechtigten Familien die monatlichen Familienbruttoeinkommen in Euro. In der folgenden Tabelle sind die klassierten Ergebnisse der Erhebung zusammengestellt:

Einkommensklasse Anzahl Familien Einkommenssumme

(in Euro) (in Mio. Euro)

[0; 300) 240 000 30

[300; 800) 160 000 90

[800; 1 500) 80 000 90

[1 500; 5 000) 20 000 90

(a) Beurteilen Sie die Konzentration des monatlichen Bruttoeinkommens auf die Fami- lien anhand der Lorenzkurve. Nutzen Sie f¨ur die Zeichnung das unten vorgegebene Koordinatensystem. (7 Punkte)

(b) Beschreiben Sie, wie sich Ihre Herleitung der Koordinaten der Lorenzkurve ¨andern w¨urde, wenn die dritte Spalte der obigen Tabelle nicht angegeben w¨are. Bitte nur kurz beschreiben, nicht rechnen! (3 Punkte)

(c) Bestimmen Sie außerdem den Wert des Gini-Koeffizienten G. (3 Punkte)

(d) Warum ist es f¨ur diese Daten eher unwichtig, ob Sie den Gini-Koeffizienten oder den normierten Gini-Koeffizienten zur Beurteilung der Konzentration heranziehen?

(4 Punkte) Hinweis:

Geben Sie in (c) und (d) zun¨achst die allgemeinen Formeln an.

Runden Sie ggf. Ihre Ergebnisse auf 3 Nachkommstellen.

Abbildung: Lorenzkurve des monatlichen Bruttoeinkommens

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

(5)

Eine Statistikerin ist zugleich eine begeisterte Leseratte und hat in ihren B¨ucherregalen 1 000 B¨ucher stehen. Sie liest nur Romane der Gattungen “Thriller”, “Liebesroman”, “hi- storischer Roman” und “Science Fiction”. Als neugierige Statistikerin m¨ochte sie nun f¨ur ihre 1 000 B¨ucher ¨uberpr¨ufen, ob der Buchtyp und das Geschlecht des Autors miteinander zusammenh¨angen. Dazu stellt sie die folgende Tabelle auf:

Buchtyp

Thriller Liebesroman histor. Roman Science Fiction

m¨annl. 150 150 20 180

Geschl. Autor

weibl. 200 80 140 80

1 000 (a) Stellen Sie die bedingten Verteilungen des Merkmals “Buchtyp” auf, gegeben das Merk- mal “Geschlecht des Autors”. Stellen Sie einen Zusammenhang zwischen den beiden Merkmalen fest? (7 Punkte)

(b) Stellen Sie die unter Unabh¨angigkeit der beiden Merkmale erwartete Kontingenztafel auf. (3 Punkte)

(c) Zur Pr¨ufung der St¨arke des Zusammenhangs der beiden Variablen kann man aus der in (b) erstellten Tafel den Wert des KontingenzkoeffizientenK bestimmen. Dieser ergibt sich zuK = 0.368. Demnach w¨urde man lediglich auf einen schwachen Zusammenhang zwischen dem Geschlecht des Autors und der Art des Buches schließen. Stimmen Sie dieser Auffassung zu? Begr¨unden Sie Ihre Antwort und treffen Sie ggf. eine eigene Aussage ¨uber den Zusammenhang. (7 Punkte)

Hinweis:

Geben Sie in (b) und ggf. (c) zun¨achst die ben¨otigten allgemeinen Formeln an.

Runden Sie, falls n¨otig, auf 3 Nachkommastellen.

(6)

Aufgabe 5 (18 Punkte)

Um zu untersuchen, ob bei Diabetikerinnen zwischen den durchschnittlichen Blutzuckerwer- ten (in mg / dl) in der Schwangerschaft und dem Geburtsgewicht der Kinder (in g) eine Abh¨angigkeit besteht, werden aus Patientenunterlagen die entsprechenden Werte von Dia- betikerinnen ermittelt. Die Angaben finden sich in der folgenden Tabelle:

Patientin 1 2 3 4 5 6 7 8 9 10

Blutzucker (X) 114 130 120 160 99 184 118 172 96 108

Geburtsgewicht (Y) 3 725 3 770 3 690 4 160 3 640 4 285 3 770 4 220 3 580 3 740 (a) Zeichnen Sie ein Streudiagramm der Wertepaare in die unten vorgegebene Abbildung.

Beurteilen Sie den Zusammenhang zwischen den Merkmalen anhand des Diagramms.

(6 Punkte)

(b) Wird Ihre Vermutung aus (a) durch den Wert des Korrelationskoeffizienten nach Bra- vais und Pearson untermauert? Berechnen SierXY und interpretieren Sie das Ergebnis inhaltlich. Runden Sie auf drei Nachkommastellen. (7 Punkte)

(c) Zur Bestimmung des Wertes des Spearman’schen Rangkorrelationskoeffizienten rech- nen zwei Studenten in folgender Weise:

Student 1 rechnet rSp=

Pn

i=1(rg(xi)−n+12 )·(rg(yi)− n+12 )

q

(Pni=1(rg(xi))2n·(n+1)4 2)·(Pni=1(rg(yi))2n·(n+1)4 2) = 0.9057793.

Student 2 rechnet

rSp = 1− 6·Pni=1d2i

n·(n2−1) = 0.9060606.

Beide Resultate sind entsprechend der benutzten Formeln richtig errechnet worden.

Wer von beiden hat Recht und warum? Bitte nur begr¨unden, nicht rechnen! (5 Punkte) Hinweis:

Geben Sie in (b) zun¨achst die ben¨otigte allgemeine Formel an.

Nutzen Sie folgende Hilfsgr¨oßen:

X10 i=1

xi = 1 301,

X10 i=1

yi = 38 580,

X10 i=1

xi ·yi = 5 090 250,

vu ut1

n ·

X10 i=1

x2i −x2 =seX = 29.463,

vu ut1

n ·

X10 i=1

yi2−y2 =esY = 245.909

Abbildung: Durchschnittl. Blutzuckerwerte von M¨uttern und Geburtsgewicht der Kinder

Blutzuckerwerte in mg/dl

80 90 100 110 120 130 140 150 160 170 180 190 200

3500 3600 3700 3800 3900 4000 4100 4200 4300 4400 4500 Geburtsgewicht in g

(7)

Ein Versandhaus schickt seinen Kunden zusammen mit einem aktuellen Warenkatalog ein Preisausschreiben. Die Teilnahme am Preisausschreiben (P) ist von einer Bestellung (B) un- abh¨angig, aber nat¨urlich verspricht sich das Versandhaus von dem Preisausschreiben einen Anreiz f¨ur eine Bestellung. Es wurden an 1 000 Kunden die Kataloge zusammen mit dem Preisausschreiben verschickt. Von diesen Kunden reagierten 250 weder mit einer Bestellung noch mit einer Teilnahme am Preisausschreiben, 150 Kunden nutzten beide Optionen. Ins- gesamt nahmen 650 Kunden am Preisausschreiben teil.

(a) Stellen Sie den beschriebenen Sachverhalt in einem Venn-Diagramm dar. (3 Punkte) (b) Wie groß ist die Wahrscheinlichkeit, dass

1. ein zuf¨allig ausgew¨ahlter Kunde eine Bestellung aufgegeben hat? (2 Punkte) 2. ein zuf¨allig ausgew¨ahlter Kunde nur etwas bestellt, aber nicht am Preisausschrei-

ben teilgenommen hat? (2 Punkte)

3. ein unter den Teilnehmern des Preisausschreibens zuf¨allig ausgew¨ahlter Kunde nur am Preisausschreiben teilgenommen hat? (3 Punkte)

Hinweis:

Runden Sie Ihre Ergebnisse ggf. auf 2 Nachkommastellen.

Referenzen

ÄHNLICHE DOKUMENTE

Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.. Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische

“Wahl-O-Mat” die rechtsextremistische NPD als Partei empfohlen werde, lautet die Be- gr¨undung der f¨ur das Internet-Angebot verantwortlichen Landeszentrale f¨ur politische Bil-

F¨ur ein quantitatives, stetiges Merkmal wie das hier betrachtete ist ein S¨aulendiagramm geeignet.. F¨ur ein qualitatives, stetiges Merkmal wie das hier betrachtete ist

Auf der Leip- ziger Buchmesse sind B¨ucher dieser Autorin aus beiden Genres am Stand eines Verlages vertreten. Von 250 Besuchern, die sich an diesem Stand f¨ur B¨ucher der

Dabei wird zu- gleich die Nationalit¨at ( Y ) der G¨aste erhoben, da der Hotelier glaubt, dass es hier einen Zusammenhang geben k¨onnte.. Die folgende Tabelle zeigt das Ergebnis

F¨ur die Dauer der Arbeitssuche betrach- ten Sie die beiden folgenden Varianten der Rangvergabe: Version 1 vergibt den ersten Rang f¨ur die k¨urzeste Dauer, Version 2 dagegen

(c) Wie groß ist die Wahrscheinlichkeit, dass kein Krippenplatz zur Verf¨ugung steht, unter der Bedingung, dass das Kind aus Westdeutschland kommt.

Vor kurzem waren in Deutschland die hohen Strompreise in der Diskussion, welche zuneh- mend die Unternehmen mit hohen Kosten belasten. Als Ursache f¨ur die hohen Preise werden