• Keine Ergebnisse gefunden

Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2007/08 19.03.2008

N/A
N/A
Protected

Academic year: 2022

Aktie "Klausur zu Statistik I Prof. Dr. Claudia Becker Wintersemester 2007/08 19.03.2008"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zu Statistik I Prof. Dr. Claudia Becker

Wintersemester 2007/08 19.03.2008

Name: ...

Matrikelnummer: ...

Bearbeitungszeit: 2 Stunden

Erlaubte Hilfsmittel:

• Taschenrechner (keine alphanumerische Tastatur)

• standardisierte Formelsammlung Statistik vom WS 07/08 in gehefteter Form (unver¨andert, keine Hervorhebungen, keine Zus¨atze, keine losen Bl¨atter)

Nicht zugelassen sind:

• eigenes Papier

• Skript, ¨ Ubungsaufgaben, alte Klausuren, andere Formelsammlungen, eigene Aufzeichnungen

• Lehrb¨ucher, Verteilungstabellen

Es sind insgesamt 100 Punkte zu erreichen.

Uberpr¨ufen Sie, ob Ihre Klausur alle sechs Aufgaben enth¨alt. ¨

Geben Sie die Aufgaben bitte zusammen mit Ihrer L¨ osung ab!

Aufgabe 1 2 3 4 5 6

P

erreichbare

Punkte 16 19 15 19 15 16 100

erreichte

Punkte

(2)

Markieren Sie bei den folgenden Fragen jeweils, ob die vorgesehenen Antworten richtig oder falsch sind. Nutzen Sie die vorgesehenen Felder f¨ur Ihre Markierung.

Es k¨onnen jeweils eine oder mehrere Antworten korrekt sein, mindestens eine Antwort ist auf jeden Fall richtig. Eine Antwort wird nur bewertet, wenn f¨ur sie genau ein Feld markiert ist (entweder “richtig” oder “falsch”). F¨ur jedes korrekt markierte Feld gibt es 1 Punkt.

1. (8 Punkte) Welche Aussagen sind richtig, welche falsch?

richtig falsch

Ein stetiges Merkmal kann diskret erhoben werden.

Ein diskretes Merkmal kann sowohl stetig als auch diskret erhoben werden.

Ein stetiges Merkmal muss stetig erhoben werden.

Ein stetiges Merkmal besitzt endlich viele oder abz¨ahlbar viele Auspr¨agungen.

Das Geschlecht ist ein qualitatives Merkmal.

Das Geschlecht ist ein metrisch skaliertes, diskretes Merkmal.

Das Geschlecht ist ein ordinal skaliertes Merkmal.

Das Geschlecht ist ein nominal skaliertes Merkmal mit endlich vielen Auspr¨agungen.

2. (8 Punkte) Gegeben ist die folgende Abbildung.

Abbildung: Kreisdiagramm der K¨orpergr¨oßen in cm von 1 087 Personen

weniger als 160 160 bis unter 180

180 bis unter 200

200 und mehr

Welche Aussagen sind richtig, welche falsch? Angaben, die aus der Abbildung gar nicht ablesbar sind, sind als falsch zu werten.

richtig falsch

Rund 50% der Personen haben eine Gr¨oße von 1.60 m bis unter 1.80 m.

Es gibt keine Person, die 2 m oder gr¨oßer ist.

Der Anteil an Personen unter 160 cm ist wesentlich gr¨oßer als der Anteil an Personen von 180 bis unter 200 cm.

Alle Personen sind kleiner als 1.90 m.

Es stehen Daten von weniger als 160 Personen zur Verf¨ugung Die durchschnittliche K¨orpergr¨oße ist 180 m.

Es gibt etwas mehr als doppelt so viele Personen von 1.60 m bis unter 1.80 m wie Personen unter 160 cm.

Einige wenige Personen wurden 200-mal und mehr vermessen.

(3)

Der Kleing¨artnerverein “Gr¨une Laube” veranstaltet jedes Jahr einen Wettbewerb um die schwerste Zucchini. Im letzten Jahr nahmen neun Hobbyg¨artner an diesem Wettbewerb teil.

Die von ihnen zum Wettbewerb eingereichten Zucchini erreichten die in der folgenden Tabelle angegebenen Gewichte (in g).

G¨artner 1 2 3 4 5 6 7 8 9

Zucchinigewicht (g) 650 610 650 750 3 000 650 625 650 650

(a) Das durchschnittliche Zucchinigewicht der neun Zucchini betr¨agt 915 Gramm. Beur- teilen Sie die Streuung des Zucchinigewichts anhand von s. Halten Sie die Streuunge

eher f¨ur groß oder f¨ur klein? Was k¨onnte der Grund sein? (7 Punkte)

(b) Beurteilen Sie weiterhin die Streuung des Zucchinigewichts anhand des MAD. Halten Sie die Streuung anhand dieses Maßes eher f¨ur groß oder f¨ur klein? Was k¨onnte hier der Grund sein? (8 Punkte)

(c) Das 25%-Quantil der oben angegebenen Daten entspricht der dritten Ordnungsstati- stik. Bestimmen Sie als drittes Streuungsmaß den Interquartilsabstand. Was stellen Sie fest? (4 Punkte)

Hinweis:

Geben Sie jeweils zun¨achst die allgemeinen Formeln an.

Nutzen Sie in (a) den Verschiebungssatz zur Berechnung von s.e

Runden Sie ggf. Ihre Ergebnisse auf vier Stellen nach dem Komma.

Hilfsgr¨oße:

X9

i=1

x2i = 12 437 725

(4)

In einer Studie zum Vergleich von Regionen werden drei Staaten gegen¨ubergestellt, die alle eine vergleichbare Organisationsform haben. Betrachtet wird jeweils die Verschuldung der einzelnen Regionen eines Staates. Es interessiert dabei, wie stark die Gesamtverschuldung (in Mrd. Euro) der einzelnen Staaten auf die Regionen konzentriert ist. Die Daten sind in den folgenden Tabellen zusammengestellt.

Staat 1

Region 1 2 3 4 5 6

Verschuldung (Mrd. Euro) 1.0 4.0 0.5 0.5 2.0 1.0 Staat 2

Region 1 2 3

Verschuldung (Mrd. Euro) 5.0 1.0 3.0 Staat 3

Region 1 2 3 4 5 6

Verschuldung (Mrd. Euro) 0.5 2.0 0.25 0.25 1.0 0.5

(a) Bestimmen Sie f¨ur jeden der drei Staaten ein Maß f¨ur die absolute Konzentration der Verschuldung. Gibt es Zusammenh¨ange zwischen den drei Resultaten, und wie sind sie ggf. erkl¨arbar? (9 Punkte)

(b) Wie ¨andert sich der Wert der absoluten Konzentration f¨ur Staat 2, wenn eine neue Verwaltungsregion eingerichtet wird, die nicht verschuldet ist? Zeigen Sie das Ergebnis sowohl rechnerisch als auch argumentativ. (2 Punkte)

(c) Welches Maß w¨urden Sie zur Bestimmung der relativen Konzentration der Verschul- dung eines Staates heranziehen und warum (nur nennen, nicht ausrechnen)? W¨urden Sie f¨ur die Daten von Staat 2 eher einen hohen oder eher einen niedrigen Wert dieses Maßes erwarten? Begr¨unden Sie Ihre Ansicht. (4 Punkte)

Hinweis:

Geben Sie in (a) zun¨achst die allgemeine Formel an.

Verwenden Sie in (a) das nicht normierte Maß f¨ur die absolute Konzentration.

Runden Sie ggf. Ihre Ergebnisse auf 4 Nachkommastellen.

(5)

In der Spielshow “Wer wird Million¨ar?” gibt es f¨ur die Kandidaten seit einiger Zeit die M¨oglichkeit, zwischen zwei Spielvarianten zu w¨ahlen. Bei der herk¨ommlichen Variante stehen ihnen drei Joker zur Verf¨ugung, daf¨ur haben sie bei Erreichen der Spielstufe von 16 000 Euro diesen Betrag sicher. Bei der neuen so genannten Risikovariante f¨allt die Sicherheitsstufe bei 16 000 Euro weg, daf¨ur gibt es einen Joker mehr. Ein Kandidat stellte k¨urzlich die Hypothese auf, dass die erzielten Gewinne bei der Risikovariante deutlich geringer sind im Vergleich zur herk¨ommlichen Variante. Zur ¨Uberpr¨ufung dieser Aussage kann man die in der folgenden Tabelle zusammengestellte Gewinnstatistik mit den Anzahlen der Gewinner betrachten.

Gewinn (in Euro)

0 bis 500 uber 500 bis 16 000¨ uber 16 000 bis 1 000 000¨

herk¨ommlich 3 18 9

Variante

Risiko 10 80 10

130 (a) Wie hoch ist unter den Kandidaten mit einem Gewinn aus der h¨ochsten Kategorie

(¨uber 16 000 bis 1 000 000 Euro) der Anteil derjenigen, die die Risikovariante spielen?

(2 Punkte)

(b) Betrachten Sie die bedingten Verteilungen des Merkmals “Gewinn”, gegeben das Merk- mal “Variante”. Lohnt sich die Riskovariante f¨ur die Kandidaten? (5 Punkte)

(c) Unten sind zwei Kontingenztafeln angegeben. Welche der beiden ist die unter Un- abh¨angigkeit der beiden Merkmale erwartete Tafel und warum? (3 Punkte)

(d) Der Kontingenzkoeffizient K zur Messung der St¨arke des Zusammenhangs der beiden Merkmale betr¨agt K = 0.2341. Wie stark ist der Zusammenhang? (4 Punkte)

(e) Ein anderes Maß zur Bestimmung des Zusammenhangs zwischen zwei Merkmalen ist der Rangkorrelationskoeffizient nach Spearman. Wie w¨urden Sie ihn f¨ur diese Daten berechnen? Beschreiben Sie Ihr Vorgehen (aber rechnen Sie bitte nicht). (5 Punkte) Hinweis:

Geben Sie in (c) und (d) zun¨achst die ben¨otigten allgemeinen Formeln an.

Runden Sie, falls n¨otig, auf 4 Nachkommastellen.

M¨ogliche Tafeln der unter Unabh¨angigkeit erwarteten H¨aufigkeiten:

Kontingenztafel 1

Gewinn (in Euro)

0 bis 500 ¨uber 500 bis 16 000 ¨uber 16 000 bis 1 000 000

herk¨ommlich 3 22.6154 4.3846

Variante

Risiko 10 75.3846 14.6154

Kontingenztafel 2

Gewinn (in Euro)

0 bis 500 ¨uber 500 bis 16 000 ¨uber 16 000 bis 1 000 000

herk¨ommlich 2 22.6154 5.3846

Variante

Risiko 11 75.3846 13.6154

(6)

In einer Untersuchung zur Ged¨achtnisleistung wird ein Experiment mit 8 Personen durch- gef¨uhrt. Jeder Testperson wird ein Tablett mit unterschiedlichen Gegenst¨anden gezeigt. Es gibt 3 Minuten Zeit, sich alle gezeigten Gegenst¨ande zu merken. Anschließend wird das Tablett abgedeckt, die Testperson muss eine Rechenaufgabe l¨osen und danach aus dem Ged¨achtnis die Gegenst¨ande von dem Tablett aufz¨ahlen, an die sie sich noch erinnert. In der folgenden Tabelle ist f¨ur jede Testperson das Alter und die Anzahl der richtig wiederge- gebenen Gegenst¨ande angegeben.

Testperson 1 2 3 4 5 6 7 8

Alter in Jahren (X) 5 45 8 7 40 55 6 50

Anzahl richtig wiedergegebener Gegenst¨ande (Y) 10 12 13 12 15 6 11 9 (a) Beurteilen Sie den Zusammenhang zwischen Alter und Ged¨achtnisleistung (also zwi-

schenX und Y) anhand des Korrelationskoeffizienten nach Bravais-Pearson. (7 Punk- te)

(b) Ordnen Sie die Beobachtungspaare nach dem Alter der Testpersonen. Betrachten Sie die Ged¨achtnisleistung in dieser Anordnung. Was stellen Sie ¨uber den Zusammenhang zwischen Alter und Ged¨achtnisleistung fest? (3 Punkte)

(c) Wenn Sie die ¨Uberlegungen aus (b) bedenken, spiegelt der Wert von rX Y, wie Sie ihn in (a) berechnet haben, den Zusammenhang der beiden Merkmale angemessen wider?

Welchen Effekt vermuten Sie hier? (5 Punkte) Hinweis:

Geben Sie in (a) zun¨achst die ben¨otigte allgemeine Formel an.

Runden Sie ggf. auf 4 Nachkommastellen.

Hilfsgr¨oßen:

X8

i=1

xi = 216,

X8

i=1

yi = 88,

X8

i=1

x2i = 9 324,

X8

i=1

yi2 = 1 020,

X8

i=1

xi·yi = 2 224

(7)

In der Studie aus Aufgabe 5 sind Daten f¨ur weitere erwachsene Testpersonen erhoben worden.

Insgesamt sieht der Datensatz der Erwachsenen folgendermaßen aus:

erwachsene Testperson 1 2 3 4 5 6 7 8 9 10

Alter in Jahren (X) 25 30 35 40 45 50 55 60 65 70

Anzahl richtig wiedergegebener Gegenst¨ande (Y) 16 16 15 15 12 9 6 5 5 4 (a) Bestimmt man f¨ur diese Daten eine einfache lineare Regressionsgerade, so hat die

berechnete Steigung ba einen betragsm¨aßigen Wert von 0.3212. Ist das Vorzeichen von ba positiv oder negativ? Begr¨unden Sie Ihre Ansicht. (3 Punkte)

(b) Wie groß ist der berechnete Achsenabschnittbb? Nutzen Sie zur Berechnung die ¨Uber- legung aus (a). (3 Punkte)

(c) In der folgenden Tabelle sind die mittels der berechneten Regressionsgerade vorherge- sagten Ged¨achtnisleistungen angegeben. Beurteilen Sie die G¨ute der Regressionsgerade mit Hilfe eines geeigneten Maßes. (8 Punkte)

Person 1 2 3 4 5

Anzahl richtig wiedergeg. Gegenst¨ande 16 16 15 15 12 vorhergesagte Anz. Gegenst¨ande 17.527 15.921 14.315 12.709 11.103

Person 6 7 8 9 10

Anzahl richtig wiedergeg. Gegenst¨ande 9 6 5 5 4

vorhergesagte Anz. Gegenst¨ande 9.497 7.891 6.285 4.679 3.073 (d) Wie viele Gegenst¨ande kann sich nach der oben hergeleiteten Regressionsrechnung

eine 100j¨ahrige Testperson merken? Beurteilen Sie die Aussagekraft dieser Vorhersage.

(2 Punkte) Hinweis:

Geben Sie in (b) bis (d) zun¨achst jeweils die verwendete allgemeine Formel an.

Nutzen Sie ggf. die folgenden Hilfsgr¨oßen:

X10

i=1

xi = 475,

X10

i=1

x2i = 24 625,

X10

i=1

yi = 103,

X10

i=1

yi2 = 1 289,

X10

i=1

xi·yi = 4 230.

Runden Sie Ihre Ergebnisse ggf. auf 4 Nachkommastellen.

In (c) gibt es zwei m¨ogliche Wege zur Berechnung. Zur Vereinfachung kann ggf. f¨ur Z¨ahler und Nenner des zu berechnenden Maßes der Verschiebungssatz zur Berechnung herangezogen werden.

Referenzen

ÄHNLICHE DOKUMENTE

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. Das ordinale Skalenniveau ist die Minimalanforderung an

Insbesondere wird Strom verst¨arkt von denjenigen Orten aus verteilt werden m¨ussen, wo mit Technologien f¨ur erneuerbare Energien (insbesondere Wind- und Sonnenenergie)

Wachstumsraten sind gar nicht skaliert, daher kommt das geometrische Mittel zur Anwendung.. Wachstumsraten werden durch Multiplikationen bestimmt, daher kommt das geometrische

“Wahl-O-Mat” die rechtsextremistische NPD als Partei empfohlen werde, lautet die Be- gr¨undung der f¨ur das Internet-Angebot verantwortlichen Landeszentrale f¨ur politische Bil-

F¨ur ein quantitatives, stetiges Merkmal wie das hier betrachtete ist ein S¨aulendiagramm geeignet.. F¨ur ein qualitatives, stetiges Merkmal wie das hier betrachtete ist

Bei klassierten Daten darf f¨ur das arithmetische Mittel nicht ¨uber die Klassenmitten gerechnet werden.... Richtig

Da die zur Konstruktion eines Histogramms verwendeten Klassen nicht aneinanderstoßen, stoßen auch die Rechtecke nicht aneinander.. Das Kreisdiagramm wird nach dem Prinzip

Das arithmetische Mittel darf nur f¨ur metrisch skalierte Merkmale berechnet werden, jedoch nicht f¨ur ordinal oder nominal skalierte Merkmale.. Das arithmetische Mittel darf nur