• Keine Ergebnisse gefunden

Lösung zur Klausur zu Statistik I

N/A
N/A
Protected

Academic year: 2022

Aktie "Lösung zur Klausur zu Statistik I"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Lösung zur Klausur zu Statistik I

Prof. Dr. Claudia Becker Wintersemester 2015/2016

03.02.2016

Aufgabe 1: (insgesamt 20 Punkte) Aufgabe 1 (a):(insgesamt 15 Punkte)

Gesucht: 5-Punkte-Zusammenfassung für klassierte Häufigkeitsverteilung(1 Punkt) Zur Bestimmung der Quantile: (1 Punkt für Formel)

(1) Bestimme Klasse, in der kum fj =perstmals überschritten wird (2) xp =xuj + (p−kum fj−1dfj

j

Tabelle für Kinder

(insgesamt 3 Punkte für letzte 3 Spalten) j xuj dj fj kum fj

1 0 250 0.0 0.0

2 250 250 0.2 0.2 3 500 500 0.4 0.6 4 1000 500 0.2 0.8 5 1500 500 0.1 0.9 6 2000 500 0.1 1.0

5-Punkte-Zusammenfassung für Kinder:

(insgesamt 5 Punkte) xmin =

250 + (0−0)· 250 0.2

= 250 x0.25 = 500 + (0.25−0.2)· 500

0.4 = 562.5 x0.5 = 500 + (0.5−0.2)·500

0.4 = 875 x0.75 = 1000 + (0.75−0.6)· 500

0.2 = 1375 xmax = 2500

Grafik: (insgesamt 5 Punkte)

05001000150020002500

Erwachsene Kinder

(2)

Aufgabe 1 (b): (insgesamt 2 Punkte)

• Boxplot der Kinder weiter oben(1 Punkt)

• Kinder machen mehr Fehler als Erwachsene(1 Punkt) Aufgabe 1 (c):(insgesamt 3 Punkte)

• Berechnung der Quantile bei klassierten Daten unterliegt Annahme der Gleichvertei- lung innerhalb der Klassen (1 Punkt)

• Wenn Urliste gegeben, müssen keine Annahmen getroffen werden(1 Punkt)

• Daher ist die zweite Variante zu wählen, da genauer (1 Punkt)

Aufgabe 2: Empirische Dichte und Verteilungsfunktion (20 Punkte) Aufgabe 2 (a):(insgesamt 13 Punkte)

folgende Daten der Dichte sind unmittelbar aus der Grafik ersichtlich:

f(x) =

?1 für x≤0

1/7 für 0<x≤0.5

?2 für 0.5<x≤1 1/14 für 1<x≤2

?3 für 2<x≤2.5 2/7 für 2.5<x≤3 4/7 für 3<x≤3.5

?4 für 3.5<x

folgende Daten der Verteilung sind unmittelbar aus der Grafik ersichtlich:

F(x) =

0 für x≤0

0 + x−00.5 · ?5 für 0<x≤0.5

?6 + x−0.50.5 · ?7 für 0.5<x≤1 1/14 + x−11 ·1/14 für 1<x≤2

1/7 + x−20.5 · ?8 für 2<x≤2.5 4/7 + x−2.50.5 · ?9 für 2.5<x≤3

?10 +x−30.5 · ?11 für 3<x≤3.5 1 für 3.5<x

• 1: 0, daF(x= 0) = 0(0.5 Punkte)

• 4: 0, daF(x= 3.5) = 1 (0.5 Punkte)

• 5: 1/14, dafj(x)/dj = 1/7 für 0< x≤0.5 und d1 = 0.5(1 Punkt)

• 2: 0, daF(x= 0.5) = 1/14 (aus 5) und F(x= 1) = 1/14(1 Punkt)

• 6: 1/14, aus (2) (1 Punkt, nur falls nicht bereits in (2) gegeben)

(3)

• 7: 0, dafj(x)/dj = 0 für 0.5< x≤1 (aus 2) (1 Punkt)

• 3: 6/7, dafj(x)/dj = (F(xoj)−F(xuj))/(xoj−xuj) = (4/7−1/7)/(2.5−2) für 2< x≤2.5 (1 Punkt)

• 8: 3/7, da fj(x)/dj = 6/7 für 2< x≤2.5 (aus 3) undd4 = 0.5 (1 Punkt)

• 9: 1/7, da fj(x)/dj = 2/7 für 2.5< x≤3 undd5 = 0.5(1 Punkt)

• 10: 5/7, da F(x= 3) = 5/7 (aus 9) (1 Punkt)

• 11: 2/7, da fj(x)/dj = 4/7 für 3< x≤3.5 und d6 = 0.5(1 Punkt) insgesamt max. 4 Punkte für Grafiken

Aufgabe 2 (b): (insgesamt 7 Punkte) arithmetisches Mittel: (insgesamt 2 Punkte)

x¯=Pkj=1mj ·fj

x¯= 0.25·1/14 + 1.5·1/14 + 2.25·3/7 + 2.75·1/7 + 3.25·2/7 = 135/56≈2.4107 Median: (insgesamt 2 Punkte)

• diejenige Klasse, in der F(x) = 0.5 überschritten wird →j = 4

• dann:x0.5 =xuj + (p−kumfj−1dj/fj

x0.5 = 2 + (0.5−1/7)·(1/2)/(3/7) = 29/12≈2.4167 Modus/Modalklasse:(insgesamt 2 Punkte)

• diejenige Klasse mit größter Besetzungsdichte (fj/dj) →j = 4

• dann:xmod = (xoj +xuj)/2

xmod= (2.5 + 2)/2 = 2.25

xmod <x < x¯ med → keine der Lageregeln trifft zu, daher keine Entscheidung zur Schiefe möglich (1 Punkt)

Aufgabe 3: Konzentrationsmaße (20 Punkte) Aufgabe 3 (a):(insgesamt 9 Punkte)

i ui vi vei xi Flugplatz

1 0.167 0.082 0.082 61 254 Stuttgart

2 0.333 0.181 0.099 73 953 Hamburg

3 0.500 0.304 0.123 91 881 Berlin Tegel

4 0.667 0.444 0.140 104 580 Düsseldorf

5 0.833 0.689 0.245 183 015 München

6 1.000 1.000 0.311 232 317 Frankfurt a. M.

P 1 747.000 (aus Text)

(aus Grafik) (aus Grafik) (3 Punkte) (3 Punkte) (1 Punkt)

veq = Pxq(q)

i=1xix(q) =veq·Pqi=1xi (1 Punkt)

(4)

• Zuordnung der absoluten Anzahl an Starts, da Reihenfolge der sechs Flugplätze gege- ben und da Beobachtungswerte geordnet in Berechnung der Lorenzkurve eingehen (1 Punkt)

Aufgabe 3 (b): (insgesamt 11 Punkte)

• Def. und Formel Gini-Koeffizient als rel. Maß der Konzentration (2 Punkte)

Gentspricht dem Doppelten der Fläche zw. Winkelhalbierender und Lorenzkurve DaG von Anzahln der Beobachtungen abhängt: normierter Gini-Koeffizient G (For- mel) sodass Wertebereich von 0 bis 1 (mit 0= keine Konzentration d.h. gleichmäßige Verteilung und 1= maximale Konzentration)

Unterschiedliche Lorenzkurven können gleichenG und Gergeben, daher zur Interpre- tation der Werte immer Lorenzkurve betrachten

(3 Punkte)

• Vorgehen: Ermittle aus Abbildung ui und vi und bestimme wie oben vei ; berechne entsprechend Formel G; dann zwecks Interpretation G aus Gmit n= 6 (4 Punkte)

• Lorenzkurve lässt schwache Konzentration vermuten, da Fläche zwischen Lorenzkurve und Diagonale rel. klein (Hinweis: G = 0.32) (2 Punkte)

Aufgabe 4: Zusammenhangsanalyse und lineare Regression (20 Punkte) Aufgabe 4 (a):(insgesamt 2 Punkte)

Verschiedene Alternativen denkbar:

• Kurven haben sehr unterschiedliche Verläufe (kein Gleichlauf oder Gegenlauf erkenn- bar), daher eher kein monotoner oder linearer Zusammenhang(2 Punkte) oder

• Kurven haben ähnliche Verläufe nur zeitlich verschoben, daher monotoner oder gar linearer Zusammenhang (2 Punkte)

Aufgabe 4 (b): (insgesamt 6 Punkte)

rXY =

Pn

i=1xi·yi−n·¯x·¯y

Pn

i=1x2i−n·¯x2·Pn

i=1y2i−n·¯y2 (1 Punkt)

rXY = 76 337.37−12·628.2612 ·1 457.612

q

33 592.4−12·(628.2612 )2·q177 111.6−12·(1 457.612 )2 (1 Punkt)= 0.1189 (1 Punkt)

• |0.1189| <0.2 (1 Punkt), daher kein wesentlicher linearer Zusammenhang feststellbar (1 Punkt)

• Vermutung aus 4 (a) bestätigt oder nicht(1 Punkt) Aufgabe 4 (c):(insgesamt 9 Punkte)

• gegeben: lineares Regressionsmodell:yt+2 =a·xt+b+εt,

wobeiyt+2. . .Verbraucherpreisindext+2, xt. . .Rohölpreist und t . . .Monat;

gesucht:a und b (1 Punkt)

(5)

• nutze KQ-Methode zur Bestimmung von a und b:

ˆ a=

Pn

i=1xi·yi−n·¯x·¯y

Pn

i=1x2i−n·¯x2 =

P10

t=1xt·yt+2−10·

P10 t=1xt

10 ·

P12 t=3yt

10

P10 t=1x2t−10·

P10 t=1xt

10

2 (1 Punkt) ˆb= ¯y−ˆa·x¯=

P12 t=3yt

10 −ˆa·

P10 t=1xt

10 (1 Punkt)

• ˆa = 66 659.36−10·546.0210 ·1 219.110

30 190.85−10·(546.0210 )2 = 0.2495 → Erhöhung des Rohölpreises um US$ 1 führt zwei Monate später zu einer Erhöhung des Vebraucherpreisindex im Luftverkehr um 0.2495(3 Punkte)

• ˆb= 1 219.110 −0.2495·546.0210 = 108.2868 →Wenn Rohöl umsonst wäre, hätte man zwei Monate später einen Wert von 108.2868 beim Verbraucherpreisindex zu erwarten (→

Flugticketpreise um ca. 8% teurer als im Basisjahr!!)(3 Punkte) Aufgabe 4 (d): (insgesamt 3 Punkte)

• weniger als 50% der Streuung in den Daten wird durch Modell erklärt(1 Punkt)

• daher scheinen Flugticketpreise nicht nur von Rohölpreisen abzuhängen(1 Punkt)

• Mögliche Besonderheiten (1 Punkt für eine Erklärung):

Flüge werden häufig sehr früh gebucht. Preise können demnach nicht nur auf den tatsächlich eingetretenen Ölpreisen basieren, sondern eher auf Prognosen

Es gibt andere Faktoren, die einen Einfluss auf Flugpreise haben (z.B. Sommer- ferien, bestimmte Veranstaltungen: Oktoberfest, Messen, usw.)

Preise sind in US Dollar angegeben. Wechselkurs müsste berücksichtigt werden, da der Verbraucherindex nur für Flüge in Deutschland angegeben ist

usw.

(6)

Aufgabe 5: Multiple Choice (20 Punkte)

Richtige Entscheidung Zutreffen(jeweils 1 Punkt), richtige Begründung(jeweils 3 Punkte).

a) Für eine Datenreihe (x1, . . . , xn) wurde ein Wert des Schiefekoeffizienten nach Pearson von 0.8 ermittelt. Anschließend wurde eine neue Reihe von Beobachtungen (y1, . . . , yn) erzeugt, wobei yi = 2·xi −10 gilt. Der Schiefekoeffizient nach Pearson der neuen Be- obachtungsreihe ist größer als 0.8.

Richtig x Falsch

Die Schiefe nimmt zu, da durch die Transformation die neuen Beobachtungen betragsmäßig größer als die ursprünglichen Beobachtungen sind.

Die Schiefe nimmt ab, da durch die Subtraktion von 10 die neuen Beobach- tungen nach links verschoben werden.

x Die Schiefe bleibt konstant, da die Form der Verteilung der Beobachtungen bei linearen Transformationen mit positivem Multiplikator gleich bleibt.

b) Ist der Schiefekoeffizient deutlich kleiner als Null, so ist die Verteilung rechtssteil.

x Richtig Falsch

In diesem Fall ist die Verteilung symmetrisch.

In diesem Fall ist die Verteilung linkssteil.

x In diesem Fall ist die Verteilung linksschief.

c) Zu einer bestimmten Lorenzkurve existiert immer ein eindeutiger Wert des Gini-Koef- fizienten.

x Richtig Falsch

Unterschiedliche Lorenzkurven können zum selben Wert des Gini-Koeffizi- enten führen.

x Der Gini-Koeffizient ergibt sich als die doppelte Fläche zwischen Lorenzkur- ve und Winkelhalbierender und kann demnach einer Lorenzkurve eindeutig zugeordnet werden.

Lorenzkurve und Gini-Koeffizient haben keine Beziehung zueinander.

(7)

d) A und B seien zwei metrisch skalierte Merkmale. Dem unten dargestellten Streudia- gramm kann entnommen werden, dass zwischen Merkmal A und B kein Zusammenhang besteht.

Richtig x Falsch

Das Streudiagramm zeigt keinen eindeutigen Trend, daher können A und B als unabhängig betrachtet werden.

x Eine Korrelation der Merkmale kann nicht ausgeschlossen werden.

Das hier abgebildete Streudiagramm ist ungeeignet, um eine Aussage über den Zusammenhang dieser zwei Merkmale zu treffen.

30 35 40 45

1020304050

B

A

e) Kommt zur Urliste eine weitere Beobachtung mit Ausprägung „0“ hinzu, sollte das Konzentrationsmaß erneut bestimmt werden.

Richtig x Falsch

Maße der relativen wie Maße der absoluten Konzentration ändern sich in diesem Fall.

x Dies gilt nur für Maße der relativen Konzentration.

Dies gilt nur bei unklassierten Häufigkeitsverteilungen unter Verwendung des standardisierten Gini-Koeffizienten.

Abbildung

Tabelle für Kinder

Referenzen

ÄHNLICHE DOKUMENTE

Der Rangkorrelationskoeffizient nach Spearman darf daher auch für niedriger skalierte Merkmale berechnet werden.. x Das ordinale Skalenniveau ist die Minimalanforderung an

Zu den doch eher beunruhigenden Berech- nungsergebnissen bei jüngeren Frauen unter HRT präzisierte die dänische Gynä- kologin, dass sie nicht sicher sein könne, ob die

Physikalisches Anf¨ angerpraktikum der Universit¨ at Heidelberg - Praktikum I Versuch 15 Schiefe

In diesem Versuchsteil soll am Fuß der geneigten Ebene auf einem horizontalen Teilst¨uck die Translations- geschwindigkeit der verschiedenen Rollk¨orper mit Hilfe von

Die oberste Grenze für den schiefen Seiltrieb ist diejenige, bei welcher die Seiltrümer senkrecht (die Parameter der Parabeln oo gross) werden.. Beim senk- rechten Seiltrieb kann

Die Entscheidung des Berufungs- ausschusses kann binnen Monats- frist durch Klage beim Sozialgericht angefochten werden 26).. Das Sozial- gericht prüft gemäß § 54 SGG die

aber nicht parallel zur Lastrichtung.. • Die Spannungsnulllinie

Analog gilt, dass entweder ein Moment oder eine Verdrehung vorgegeben werden kann, jedoch nicht bei- des gleichzeitig.. m¨oglich, gleichzeitig eine Kraft und eine