L¨osung zur Klausur zu Statistik II Prof. Dr. Claudia Becker Sommersemester 2016 30.09.2016

(1)

L¨ osung zur Klausur zu Statistik II

Prof. Dr. Claudia Becker Sommersemester 2016

30.09.2016

Aufgabe 1: Multiple Choice (20 Punkte)

Markieren Sie, ob die folgenden f¨unf Aussagen jeweils zutreffen oder nicht (jeweils 1 Punkt), und kennzeichnen Sie die passende Begr¨undung (jeweils 3 Punkte). Eine Wertung erfolgt nur, wenn korrekt markiert ist, ob die Aussage zutrifft oder nicht.

a) Sei X eine Bernoulli-verteilte Zufallsvariable mitX ∼Bin(1,0.5). Es ist P(X = 2) = 0.

x Richtig Falsch

x f(2) =P(X = 2) = 0.

Die Punktwahrscheinlichkeit ist immer Null.

f(2) =p²·(1−p)¹⁻² = 0.5.

b) Wird bei einem statistischen Test zu einem Signifikanzniveau von 5% getestet, dann bedeutet dies, dassH₀ mit h¨ochstens 5% Wahrscheinlichkeit f¨alschlicherweise verworfen wird.

x Richtig Falsch

x Das Signifikanzniveau sichert die Wahrscheinlichkeit f¨ur den Fehler 1. Art ab.

Ein Signifikanzniveau von 5% bedeutet, dass H₀ mit h¨ochstens 5% Wahr- scheinlichkeit f¨alschlicherweise angenommen wird.

Ein Signifikanzniveau von 5% bedeutet, dass H₀ mit 95%-iger Wahrschein- lichkeit gilt.

c) Anagramme sind Wörter, die aus der Umstellung von Buchstaben aus einem ur- sprünglichen Wort entstehen. Zu einem Wort aus fünf Buchstaben existieren somit 5!−1 = 119 unterschiedliche Anagramme.

Richtig x Falsch

x Es kommt darauf an, aus welchen Buchstaben sich das Wort zusammensetzt.

Situation des Ziehens ohne Zur¨ucklegen mit Beachtung der Reihenfolge.

Situation des Ziehens ohne Zur¨ucklegen ohne Beachtung der Reihenfolge.

d) SeiXeine Zufallsvariable mitE(X) = µundV ar(X) = σ². Sei weiterhinY = 3·X+c.

In diesem Fall gilt E(Y) = 3·µ+c und V ar(Y) = 9·σ²+c².

(2)

Richtig x Falsch

Dies gilt nur, wenn Cov(X, Y) = 0.

X und Y sind normalverteilt.

x Y =a·X+b→E(Y) = a·E(X) +b und V ar(Y) = a²·V ar(X).

e) Die Zufallsvariable X beschreibt den Nettogewinn bei einem Glücksspiel. Hierbei wird eine faire Münze zweimal geworfen. Fällt mindestens einmal Zahl, erhält man einen Euro. Wenn zweimal Kopf geworfen wird, muss man hingegen zwei Euro bezahlen. Es lohnt sich für den risikoneutralen Spieler, dieses Spiel zu spielen.

x Richtig Falsch

P(X <0)>0.5.

x E(X)≥0.

P(X = 2) = 0.25.

Aufgabe 2: (insgesamt 20 Punkte) Aufgabe 2 (a):(insgesamt 2 Punkte)

• es wird Unabhängigkeit der beiden Ereignisse (richtige Einschätzung und richtige Be- gründung) geschlussfolgert (1 Punkt)

• Einschätzung und Begründung gehören zur selben MC-Frage, daher kann vermutet werden, dass ein Studierender, der die richtige Einschätzung trifft, eher die richtige Begründung wählt (im Vergleich zu einem Studierenden, der die falsche Einschätzung getroffen hat), daher sind die Ereignisse vermutlich nicht unabhängig (1 Punkt) Aufgabe 2 (b): (insgesamt 7 Punkte)

• P(X = 0) =P(Einsch=F) = 0.4(2 Punkte)

• P(X = 2) =P(Einsch=R, Begr=F) = 0.6·0.7 = 0.42(2 Punkte)

• P(X = 4) =P(Einsch=R, Begr=R) = 0.6·0.3 = 0.18(2 Punkte)

• f(x) =











0.4 f ür x= 0 0.42 f ür x= 2 0.18 f ür x= 4

0 sonst

(1 Punkt)

(3)

Aufgabe 2 (c):(insgesamt 7 Punkte)

• 3 MC-Aufgaben koppeln

• Unabh¨angigkeit unterstellen (Ergebnis MC1 unabh. MC2 unabh. MC3)

• Beispiel:

● ● ●

4 4 4

2 2 2

0 0 0

0.4

0.42

0.18

Punkte MC1 Punkte MC2 Punkte MC3

• Pfade verfolgen

• Endergebnis als Summe der Punkte in MC1 bis MC3

• Wahrscheinlichkeiten multiplizieren

• f¨ur erreichte Punkte die Wahrscheinlichkeit der Pfade addieren (alle Pfade, die zu Null Punkten f¨uhren, 2 Punkten, etc.)

Aufgabe 2 (d): (insgesamt 4 Punkte)

• E(X) = ^P^∞_i=1x_i·f(x_i)

• E(X) = 0.0640·0 + 0.2016·2 + 0.2981·4 + 0.2555·6 + 0.1341·8 + 0.0408·10 + 0.0058·12

• E(X) = 4.679

• Im Mittel kann ein Studierender bei der Aufgabe mit einer Gesamtpunktzahl von 4.679 (≈5) Punkten rechnen.

(4)

VorbereitungsdauerX ∼N(44,21.16) (1 Punkt) Gesucht:P(X >72) (1 Punkt)

Es ist

P(X >72) = 1−P(X ≤72) (1 Punkt)

= 1−P

X−µ

σ ≤ 72−µ σ

= 1−P

Z ≤ 72−44 4.6

(1 Punkt)

= 1−Φ (6.087) (1 Punkt)

= 1−1≈0(1 Punkt)

Der Wert für Φ(6.087) kann der angegebenen Tabelle nicht entnommen werden. Man er- kennt jedoch: mit wachsendemxnähern sich die Werte 1 an. (1 Punkt)Mit 0% ist es höchst unwahrscheinlich, dass ein zufällig ausgewählter Studierender sich länger als drei Tage auf die Prüfung vorbereitet hat.(1 Punkt).

Aufgabe 3 (b): (insgesamt 4 Punkte)

Die Aussage ist korrekt- es ist h¨ochst unwahrscheinlich. (1 Punkt) Begr¨undung durch Rechnung oder Argumentation. (3 Punkte)

Auf Grund der gegebenen Werte fürµund σ kann geschlussfolgert werden, dass es für einen zufällig ausgewählten Studierenden unwahrscheinlich ist, dass er sich weniger als 36 Stunden vorbereitet hat. Entsprechend ist es für drei Studierende noch unwahrscheinlicher.

[P(X <36)]³ = 0.0411³ = 0.0001 , berechne zun¨achst

P(X <36) = P

Z ≤ 36−µ σ

= Φ (−1.7391)

= 1−Φ (1.7391)

= 0.0411 Aufgabe 3 (c):(insgesamt 8 Punkte)

Diese Aussage k¨onnte mit einem statistischen Hypothesentest untermauert werden, Vorge- hen:

• Testproblem

• Passender Test

• Teststatistik ermitteln

• Vergleich mit kritischem Wert

• Entscheidung

(5)

Fehlende Informationen(2 Punkte)

• repr¨asentative Stichprobe bzw. Vollerhebung (keine Aussage im Text) bzw. x f¨ur Be- rechnung der Teststatistik

• alternativ: Annahme, dass gegebene Vorbereitungsdauer ( 44 Stunden) Erfahrungswert der letzten Jahre ist

Schätzung der erwarteten Anzahl von täglichen Besuchen mit Hilfe von X = _n¹ ^Pⁿ_i=1X_i (1 Punkt für X und 1 Punkt für Formel)

Es ist

x= 214/10 = 21.4 (1 Punkt) Die erwartete Anzahl von t¨aglichen Besuchen liegt bei ca. 21.

Aufgabe 4 (b): (insgesamt 11 Punkte)

Anzahlen von t¨aglichen Besuchen X_i als normalverteilte Zufallsvariablen, X_i ∼N(µ, σ²) mit σ² = 100.

Gesucht: 0.99-Konfidenzintervall f¨ur µ. (1 Punkt)

Im Normalverteilungsfall mit bekannter Varianz(1 Punkt) ist [X− σ

√n ·z1−α/2, X+ σ

√n ·z1−α/2] (1 Punkt) ein (1−α)-Konfidenzintervall f¨urµ.

Hier:

[21.4− 10

√10 ·z_0.995, 21.4 + 10

√10·z_0.995] (1 Punkt für σ und 1 Punkt für das Einsetzen) Mit z_0.995 = 2.5758 (aus Hilfsgrößen, 1 Punkt) ergibt sich das 0.99-Konfidenzintervall f¨ur µ als

[21.4−8.1454, 21.4 + 8.1454] (1 Punkt)= [13.2546, 29.5454] (1 Punkt).

Mit 99%-iger Wahrscheinlichkeit liegt die erwartete Anzahl von täglichen Besuchen zwi- schen 13.2546 und 29.5454 Besuchen/Tag (1 Punkt). Das Konfidenzintervall f¨ur µ ist ein Intervallschätzer und gibt einen Bereich an, in dem sich der wahre Parameter mit einer festgelegten Wahrscheinlichkeit befindet (1 Punkt). Es unterscheidet sich somit von dem in Teilaufgabe (a) verwendeten Punktschätzer, der einen einzigen Wert als Schätzung für den wahren Parameter angibt und keine Aussagen über die Wahrscheinlichkeit dieses Wertes machen kann (1 Punkt).

Aufgabe 4 (c):(insgesamt 6 Punkte)

• 73.7>21.4

• 73.7∈/ [13.2546, 29.5454]

(6)

(1 Punkt f¨ur Vergleich)

Die geschätzte erwartete Anzahl von Besuchen/Tag weicht bei der neuen Stichprobe stark von der Schätzung unter (a) ab und liegt weit außerhalb des unter (b) geschätzten 0.99- Konfidenzintervalls (1 Punkt).

Mögliche Gründe: (4 Punkte insgesamt möglich → 2 Punkte pro Grund)

• Gesch¨atztes Konfidenzintervall schließt wahren Parameter mit 99%-iger Wahrschein- lichkeit ein. D.h. in 1% der F¨alle liegt er trotzdem außerhalb dieses Bereichs.

• Annahmen für das Konfidenzintervall sind fraglich (Unabhängigkeit der Zufallsvaria- blen X_i: Wenn ich bereits die Klausuren heruntergeladen habe, werde ich womöglich die Seite nicht später erneut aufsuchen / Normalverteilung der Zufallsvariablen Xi: Dabei sind theoretisch negative Werte für die Besucherzahl möglich). Möglicherweise ist das gewählte Konfidenzintervall dadurch nicht geeignet, um einen Bereich für µ anzugeben.

• Zweite Stichprobe stammt aus einem speziellen Zeitraum, in dem mehr Aktivit¨at er- wartet wird.

• unterschiedliche Stichproben können grundsätzlich zu unterschiedlichen Werten von Schätzern führen; Größe des Unterschiedes hängt von Variabilität in der Grundge- samtheit ab.

Gegeben: (k x m) Kontingenztafel und χ² = 26.8581 , α= 0.1(1 Punkt)

Gesucht: Aussage zur Unabh¨angigkeit von X und Y und korr. Kontingenzkoeffizient Benutzeχ²-Unabh¨angigkeitstest (1 Punkt)

H₀: X und Y sind unabh¨angig vs. H₁: X und Y sind abh¨angig (1 Punkt) Teststatistik

χ² =

k

X

i=1 m

X

j=1

(h_ij −e_ij)² eij

,

wobeiH₀ zum Niveau α zu verwerfen ist, falls

χ² > χ²(k−1)·(m−1);1−α

Hier (k = 5, m= 2) f¨ur (k−1)·(m−1) = 4·1 = 4 kritischer Wert χ²_4;0.90= 7.7794 (1 Punkt)

χ² = 26.8581>7.7794 (1 Punkt)

Damit kann die Hypothese der Unabhängigkeit von Geschlecht und Hochschulart zum Ni- veau α = 0.1 verworfen werden. Mit einer Sicherheit von 90% kann man davon ausgehen, dass die beiden Größen voneinander abhängen.(1 Punkt)

(7)

St¨arke des Zusammenhanges:

K^∗ = √^K

M−1 M

(1 Punkt)

mit M = min(k, m) = min(5,2) = 2 und K =^q_χ2^χ+n² =^q26.8581+10069^26.8581 = 0.0516 (1 Punkt) K^∗ = √^0.0516

2−1 2

= 0.0729 (kein wesentlicher Zusammenhang)(2 Punkte)

Aufgabe 5 (b): (3 Punkte)

Mit Veränderung des Signifikanzniveaus ändert sich generell der kritische Wert (1 Punkt) Hier: bei Verringern vonα = 10% wird das Quantil der χ²-Verteilung größer (siehe Tabelle) (1 Punkt)

Bei sonst konstanten Werten, ¨andert sich selbst beiα = 1% nichts an der Testentscheidung, daχ²_4;0.99= 13.2767 und

χ² >13.2767 (1 Punkt) Aufgabe 5 (c):(insgesamt 7 Punkte)

• Test auf einen Anteil:(1 Punkt)

p= Anteil bestandener Pr¨ufungen heute

p₀= Anteil bestandener Pr¨ufungen im Vorjahr (1 Punkt)

• Testproblem aufstellen: formalH₀: p=p₀ vs. H₁: p6=p₀ und inhaltlich (1 Punkt)

• zwei Arten von Fehlern:

α -Fehler (H₀ verwerfen, obwohl H₀ gilt) d.h. Entscheidung p6=p₀ obwohlp=p₀ gilt (1 Punkt)

β -Fehler (H₀ beibehalten, obwohl H₁ gilt) d.h. Entscheidung p = p₀ obwohl p 6= p₀ gilt (1 Punkt)

• Signifikanzniveaus α sichert mögliche Fehler beim Testen ab, wobei nur ein Fehler kontrolliert werden kann, daher mit α den Fehler 1. Art kontrollieren (1 Punkt) (je kleinerα desto stärker muss Ergebnis fürH₁ sprechen, umH₀ verwerfen zu können(1 Punkt))