L¨ osung zur Klausur zu Statistik II
Prof. Dr. Claudia Becker Sommersemester 2016
30.09.2016
Aufgabe 1: Multiple Choice (20 Punkte)
Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.
a) Sei X eine Bernoulli-verteilte Zufallsvariable mitX ∼Bin(1,0.5). Es ist P(X = 2) = 0.
x Richtig Falsch
x f(2) =P(X = 2) = 0.
Die Punktwahrscheinlichkeit ist immer Null.
f(2) =p2·(1−p)1−2 = 0.5.
b) Wird bei einem statistischen Test zu einem Signifikanzniveau von 5% getestet, dann bedeutet dies, dassH0 mit h¨ochstens 5% Wahrscheinlichkeit f¨alschlicherweise verwor- fen wird.
x Richtig Falsch
x Das Signifikanzniveau sichert die Wahrscheinlichkeit f¨ur den Fehler 1. Art ab.
Ein Signifikanzniveau von 5% bedeutet, dass H0 mit h¨ochstens 5% Wahr- scheinlichkeit f¨alschlicherweise angenommen wird.
Ein Signifikanzniveau von 5% bedeutet, dass H0 mit 95%-iger Wahrschein- lichkeit gilt.
c) Anagramme sind W¨orter, die aus der Umstellung von Buchstaben aus einem ur- spr¨unglichen Wort entstehen. Zu einem Wort aus f¨unf Buchstaben existieren somit 5!−1 = 119 unterschiedliche Anagramme.
Richtig x Falsch
x Es kommt darauf an, aus welchen Buchstaben sich das Wort zusammensetzt.
Situation des Ziehens ohne Zur¨ucklegen mit Beachtung der Reihenfolge.
Situation des Ziehens ohne Zur¨ucklegen ohne Beachtung der Reihenfolge.
d) SeiXeine Zufallsvariable mitE(X) = µundV ar(X) = σ2. Sei weiterhinY = 3·X+c.
In diesem Fall gilt E(Y) = 3·µ+c und V ar(Y) = 9·σ2+c2.
Richtig x Falsch
Dies gilt nur, wenn Cov(X, Y) = 0.
X und Y sind normalverteilt.
x Y =a·X+b→E(Y) = a·E(X) +b und V ar(Y) = a2·V ar(X).
e) Die Zufallsvariable X beschreibt den Nettogewinn bei einem Gl¨ucksspiel. Hierbei wird eine faire M¨unze zweimal geworfen. F¨allt mindestens einmal Zahl, erh¨alt man einen Euro. Wenn zweimal Kopf geworfen wird, muss man hingegen zwei Euro bezahlen. Es lohnt sich f¨ur den risikoneutralen Spieler, dieses Spiel zu spielen.
x Richtig Falsch
P(X <0)>0.5.
x E(X)≥0.
P(X = 2) = 0.25.
Aufgabe 2: (insgesamt 20 Punkte) Aufgabe 2 (a):(insgesamt 2 Punkte)
• es wird Unabh¨angigkeit der beiden Ereignisse (richtige Einsch¨atzung und richtige Be- gr¨undung) geschlussfolgert (1 Punkt)
• Einsch¨atzung und Begr¨undung geh¨oren zur selben MC-Frage, daher kann vermutet werden, dass ein Studierender, der die richtige Einsch¨atzung trifft, eher die richtige Begr¨undung w¨ahlt (im Vergleich zu einem Studierenden, der die falsche Einsch¨atzung getroffen hat), daher sind die Ereignisse vermutlich nicht unabh¨angig (1 Punkt) Aufgabe 2 (b): (insgesamt 7 Punkte)
• P(X = 0) =P(Einsch=F) = 0.4(2 Punkte)
• P(X = 2) =P(Einsch=R, Begr=F) = 0.6·0.7 = 0.42(2 Punkte)
• P(X = 4) =P(Einsch=R, Begr=R) = 0.6·0.3 = 0.18(2 Punkte)
• f(x) =
0.4 f ¨ur x= 0 0.42 f ¨ur x= 2 0.18 f ¨ur x= 4
0 sonst
(1 Punkt)
Aufgabe 2 (c):(insgesamt 7 Punkte)
• 3 MC-Aufgaben koppeln
• Unabh¨angigkeit unterstellen (Ergebnis MC1 unabh. MC2 unabh. MC3)
• Beispiel:
● ● ●
● ● ●
● ● ●
4 4 4
2 2 2
0 0 0
0.4
0.42
0.18
Punkte MC1 Punkte MC2 Punkte MC3
• Pfade verfolgen
• Endergebnis als Summe der Punkte in MC1 bis MC3
• Wahrscheinlichkeiten multiplizieren
• f¨ur erreichte Punkte die Wahrscheinlichkeit der Pfade addieren (alle Pfade, die zu Null Punkten f¨uhren, 2 Punkten, etc.)
Aufgabe 2 (d): (insgesamt 4 Punkte)
• E(X) = P∞i=1xi·f(xi)
• E(X) = 0.0640·0 + 0.2016·2 + 0.2981·4 + 0.2555·6 + 0.1341·8 + 0.0408·10 + 0.0058·12
• E(X) = 4.679
• Im Mittel kann ein Studierender bei der Aufgabe mit einer Gesamtpunktzahl von 4.679 (≈5) Punkten rechnen.
Aufgabe 3: (insgesamt 20 Punkte) Aufgabe 3 (a):(insgesamt 8 Punkte)
VorbereitungsdauerX ∼N(44,21.16) (1 Punkt) Gesucht:P(X >72) (1 Punkt)
Es ist
P(X >72) = 1−P(X ≤72) (1 Punkt)
= 1−P
X−µ
σ ≤ 72−µ σ
= 1−P
Z ≤ 72−44 4.6
(1 Punkt)
= 1−Φ (6.087) (1 Punkt)
= 1−1≈0(1 Punkt)
Der Wert f¨ur Φ(6.087) kann der angegebenen Tabelle nicht entnommen werden. Man er- kennt jedoch: mit wachsendemxn¨ahern sich die Werte 1 an. (1 Punkt)Mit 0% ist es h¨ochst unwahrscheinlich, dass ein zuf¨allig ausgew¨ahlter Studierender sich l¨anger als drei Tage auf die Pr¨ufung vorbereitet hat.(1 Punkt).
Aufgabe 3 (b): (insgesamt 4 Punkte)
Die Aussage ist korrekt- es ist h¨ochst unwahrscheinlich. (1 Punkt) Begr¨undung durch Rechnung oder Argumentation. (3 Punkte)
Auf Grund der gegebenen Werte f¨urµund σ kann geschlussfolgert werden, dass es f¨ur einen zuf¨allig ausgew¨ahlten Studierenden unwahrscheinlich ist, dass er sich weniger als 36 Stunden vorbereitet hat. Entsprechend ist es f¨ur drei Studierende noch unwahrscheinlicher.
[P(X <36)]3 = 0.04113 = 0.0001 , berechne zun¨achst
P(X <36) = P
Z ≤ 36−µ σ
= Φ (−1.7391)
= 1−Φ (1.7391)
= 0.0411 Aufgabe 3 (c):(insgesamt 8 Punkte)
Diese Aussage k¨onnte mit einem statistischen Hypothesentest untermauert werden, Vorge- hen:
• Testproblem
• Passender Test
• Teststatistik ermitteln
• Vergleich mit kritischem Wert
• Entscheidung
Fehlende Informationen(2 Punkte)
• repr¨asentative Stichprobe bzw. Vollerhebung (keine Aussage im Text) bzw. x f¨ur Be- rechnung der Teststatistik
• alternativ: Annahme, dass gegebene Vorbereitungsdauer ( 44 Stunden) Erfahrungswert der letzten Jahre ist
Aufgabe 4: (insgesamt 20 Punkte) Aufgabe 4 (a):(insgesamt 3 Punkte)
Sch¨atzung der erwarteten Anzahl von t¨aglichen Besuchen mit Hilfe von X = n1 Pni=1Xi (1 Punkt f¨ur X und 1 Punkt f¨ur Formel)
Es ist
x= 214/10 = 21.4 (1 Punkt) Die erwartete Anzahl von t¨aglichen Besuchen liegt bei ca. 21.
Aufgabe 4 (b): (insgesamt 11 Punkte)
Anzahlen von t¨aglichen Besuchen Xi als normalverteilte Zufallsvariablen, Xi ∼N(µ, σ2) mit σ2 = 100.
Gesucht: 0.99-Konfidenzintervall f¨ur µ. (1 Punkt)
Im Normalverteilungsfall mit bekannter Varianz(1 Punkt) ist [X− σ
√n ·z1−α/2, X+ σ
√n ·z1−α/2] (1 Punkt) ein (1−α)-Konfidenzintervall f¨urµ.
Hier:
[21.4− 10
√10 ·z0.995, 21.4 + 10
√10·z0.995] (1 Punkt f¨ur σ und 1 Punkt f¨ur das Einsetzen) Mit z0.995 = 2.5758 (aus Hilfsgr¨oßen, 1 Punkt) ergibt sich das 0.99-Konfidenzintervall f¨ur µ als
[21.4−8.1454, 21.4 + 8.1454] (1 Punkt)= [13.2546, 29.5454] (1 Punkt).
Mit 99%-iger Wahrscheinlichkeit liegt die erwartete Anzahl von t¨aglichen Besuchen zwi- schen 13.2546 und 29.5454 Besuchen/Tag (1 Punkt). Das Konfidenzintervall f¨ur µ ist ein Intervallsch¨atzer und gibt einen Bereich an, in dem sich der wahre Parameter mit einer festgelegten Wahrscheinlichkeit befindet (1 Punkt). Es unterscheidet sich somit von dem in Teilaufgabe (a) verwendeten Punktsch¨atzer, der einen einzigen Wert als Sch¨atzung f¨ur den wahren Parameter angibt und keine Aussagen ¨uber die Wahrscheinlichkeit dieses Wertes machen kann (1 Punkt).
Aufgabe 4 (c):(insgesamt 6 Punkte)
• 73.7>21.4
• 73.7∈/ [13.2546, 29.5454]
(1 Punkt f¨ur Vergleich)
Die gesch¨atzte erwartete Anzahl von Besuchen/Tag weicht bei der neuen Stichprobe stark von der Sch¨atzung unter (a) ab und liegt weit außerhalb des unter (b) gesch¨atzten 0.99- Konfidenzintervalls (1 Punkt).
M¨ogliche Gr¨unde: (4 Punkte insgesamt m¨oglich → 2 Punkte pro Grund)
• Gesch¨atztes Konfidenzintervall schließt wahren Parameter mit 99%-iger Wahrschein- lichkeit ein. D.h. in 1% der F¨alle liegt er trotzdem außerhalb dieses Bereichs.
• Annahmen f¨ur das Konfidenzintervall sind fraglich (Unabh¨angigkeit der Zufallsvaria- blen Xi: Wenn ich bereits die Klausuren heruntergeladen habe, werde ich wom¨oglich die Seite nicht sp¨ater erneut aufsuchen / Normalverteilung der Zufallsvariablen Xi: Dabei sind theoretisch negative Werte f¨ur die Besucherzahl m¨oglich). M¨oglicherweise ist das gew¨ahlte Konfidenzintervall dadurch nicht geeignet, um einen Bereich f¨ur µ anzugeben.
• Zweite Stichprobe stammt aus einem speziellen Zeitraum, in dem mehr Aktivit¨at er- wartet wird.
• unterschiedliche Stichproben k¨onnen grunds¨atzlich zu unterschiedlichen Werten von Sch¨atzern f¨uhren; Gr¨oße des Unterschiedes h¨angt von Variabilit¨at in der Grundge- samtheit ab.
Aufgabe 5: (insgesamt 20 Punkte) Aufgabe 5 (a):(insgesamt 10 Punkte)
Gegeben: (k x m) Kontingenztafel und χ2 = 26.8581 , α= 0.1(1 Punkt)
Gesucht: Aussage zur Unabh¨angigkeit von X und Y und korr. Kontingenzkoeffizient Benutzeχ2-Unabh¨angigkeitstest (1 Punkt)
H0: X und Y sind unabh¨angig vs. H1: X und Y sind abh¨angig (1 Punkt) Teststatistik
χ2 =
k
X
i=1 m
X
j=1
(hij −eij)2 eij
,
wobeiH0 zum Niveau α zu verwerfen ist, falls
χ2 > χ2(k−1)·(m−1);1−α
Hier (k = 5, m= 2) f¨ur (k−1)·(m−1) = 4·1 = 4 kritischer Wert χ24;0.90= 7.7794 (1 Punkt)
χ2 = 26.8581>7.7794 (1 Punkt)
Damit kann die Hypothese der Unabh¨angigkeit von Geschlecht und Hochschulart zum Ni- veau α = 0.1 verworfen werden. Mit einer Sicherheit von 90% kann man davon ausgehen, dass die beiden Gr¨oßen voneinander abh¨angen.(1 Punkt)
St¨arke des Zusammenhanges:
K∗ = √K
M−1 M
(1 Punkt)
mit M = min(k, m) = min(5,2) = 2 und K =qχ2χ+n2 =q26.8581+1006926.8581 = 0.0516 (1 Punkt) K∗ = √0.0516
2−1 2
= 0.0729 (kein wesentlicher Zusammenhang)(2 Punkte)
Aufgabe 5 (b): (3 Punkte)
Mit Ver¨anderung des Signifikanzniveaus ¨andert sich generell der kritische Wert (1 Punkt) Hier: bei Verringern vonα = 10% wird das Quantil der χ2-Verteilung gr¨oßer (siehe Tabelle) (1 Punkt)
Bei sonst konstanten Werten, ¨andert sich selbst beiα = 1% nichts an der Testentscheidung, daχ24;0.99= 13.2767 und
χ2 >13.2767 (1 Punkt) Aufgabe 5 (c):(insgesamt 7 Punkte)
• Test auf einen Anteil:(1 Punkt)
p= Anteil bestandener Pr¨ufungen heute
p0= Anteil bestandener Pr¨ufungen im Vorjahr (1 Punkt)
• Testproblem aufstellen: formalH0: p=p0 vs. H1: p6=p0 und inhaltlich (1 Punkt)
• zwei Arten von Fehlern:
α -Fehler (H0 verwerfen, obwohl H0 gilt) d.h. Entscheidung p6=p0 obwohlp=p0 gilt (1 Punkt)
β -Fehler (H0 beibehalten, obwohl H1 gilt) d.h. Entscheidung p = p0 obwohl p 6= p0 gilt (1 Punkt)
• Signifikanzniveaus α sichert m¨ogliche Fehler beim Testen ab, wobei nur ein Fehler kontrolliert werden kann, daher mit α den Fehler 1. Art kontrollieren (1 Punkt) (je kleinerα desto st¨arker muss Ergebnis f¨urH1 sprechen, umH0 verwerfen zu k¨onnen(1 Punkt))