Lösung zur Klausur zu Statistik II
Prof. Dr. Claudia Becker Sommersemester 2012
24.09.2012
Aufgabe 1: (insgesamt 20 Punkte)
Richtige Entscheidung Zutreffen(jeweils 1 Punkt), richtige Begründung(jeweils 3 Punkte).
1. Beim statistischen Testen wird der Fehler 1. Art kontrolliert.
Richtig Falsch Begründung:
Die Wahrscheinlichkeit für den Fehler 1. Art wird durch das Signifikanzniveau beschränkt.
Es wird der Fehler 2. Art kontolliert.
Die Wahrscheinlichkeit für den Fehler 1. Art wird nicht kontrolliert, sondern aus der Teststatstik berechnet.
2. Im Ziegenproblem ist “Wechseln” die bessere Strategie.
Richtig Falsch Begründung:
Da der Moderator die Ziegen und das Auto vertauschen kann, verliert der Kandidat in jedem Fall.
Wenn der Kandidat die Tür mit dem Auto gewählt hat, verliert er beim Wechseln.
Bei mehrfacher Wiederholung des Spiels führt Wechseln häufiger zum Gewinn.
3. Der Erwartungswert ist das theoretische Gegenstück zum Modus (wenn beide existie- ren).
Richtig Falsch Begründung:
Der Erwartungswert teilt die Dichte im Verhältnis 50:50, daher ist er das Gegenstück zum Median.
Der Erwartungswert ist der Schwerpunkt der Dichte, daher ist er das Gegenstück zum arithmetischen Mittel.
Der Erwartungswert ist die Stelle, an der die Dichte maximal ist, daher ist er das Gegenstück zum Modus.
4. Die stetige Gleichverteilung wird auch Rechteckverteilung genannt.
Richtig Falsch Begründung:
Die Gleichverteilung wird nur Gleichverteilung genannt, es gibt keine alternative Bezeichnung.
Da die Dichtefunktion die Form eines Rechtecks hat, nennt man die Verteilung auch Rechteckverteilung.
Da die Dichtefunktion auf einem Intervall definiert ist, nennt man die Verteilung auch Intervallverteilung.
5. Die empirische Varianz se2 schätzt die theoretische Varianz σ2 im Mittel besser als die Stichprobenvarianz s2.
Richtig Falsch Begründung:
se2 ist erwartungstreu für σ2, s2 aber nicht.
s2 ist erwartungstreu für σ2, se2 aber nicht.
Beide Schätzer sind erwartungstreu für σ2 und daher gleich gut.
Aufgabe 2: (insgesamt 20 Punkte)
Aufgabe 2 (a):(insgesamt 10 Punkte) Gesucht:P(IC|P A)
Gegeben:
P(IC) = 0.2 P(P A|IC) = 0.03 P(P A|I) = 0.005 Nutze Satz von Bayes:
P(Bi|A) = P(A|Bi)·P(Bi) P(A)
P(IC|P A) = P(P A|IC)·P(IC) P(P A)
UmP(P A) zu ermitteln, nutze Satz der totalen Wahrscheinlichkeit:
P(A) =
Xk i=1
P(A|Bi)·P(Bi)
P(P A) = P(P A|I)·P(I) +P(P A|IC)·P(IC) P(P A) = 0.005·(1−0.2) + 0.03·0.2
P(P A) = 0.01 Daraus folgt
P(IC|P A) = 0.03·0.2 0.01 P(IC|P A) = 0.6
Aufgabe 2 (b): (insgesamt 10 Punkte)
Gesucht: Wahrscheinlichkeit, dass eine Panne und ein anderer Verzögerungsgrund gleichzei- tig eingetreten sind →P(P A∩SG).
Gegeben:
P(V erspätung) =P(P A∪SG) = 0.015 P(SG) = 0.01
P(P A) = 0.01 (siehe 2 (a))
Da P(A∪B) =P(A) +P(B)−P(A∩B) gilt, ist P(A∩B) =P(A) +P(B)−P(A∪B).
Also
P(P A∩SG) =P(P A) +P(SG)−P(P A∪SG) P(P A∩SG) = 0.01 + 0.01−0.015 = 0.005 Aufgabe 3: (insgesamt 20 Punkte)
Aufgabe 3 (a):(insgesamt 7 Punkte)
Laplace-Wahrscheinlichkeit: Verhältnis der Anzahl der günstigen zur Anzahl der möglichen Ereignisse(1 Punkt); günstige Ereignisse = Anzahl der Möglichkeiten ein Paar zu ziehen (1 Punkt): das Paar kann 13 verschiedene Werte aufweisen(1 Punkt); es gibt42Möglichkeiten für die Farben der Karten des Paares (1 Punkt); es gibt 123 Möglichkeiten für die Werte der restlichen drei Karten (1 Punkt), wobei jede der Karten eine beliebige Farbe aufweisen kann (4·4·4) (1 Punkt); Anzahl der möglichen Ereignisse = Anzahl der Möglichkeiten 5 Karten aus 52 zu ziehen: insgesamt sind 525 Kartenhände möglich (1 Punkt)
Aufgabe 3 (b): (insgesamt 7 Punkte)
die Wahrscheinlichkeit für zwei Paare beträgt
13
2
·42
·42
·11·4
52
5
≈0.0475 (3 Punkte)
es gibt 132 Möglichkeiten für die Werte von a und b (1 Punkt); 42 Möglichkeiten für die Farben der Karten von Paara (1 Punkt);42 Möglichkeiten für die Farben der Karten von Paarb (1 Punkt); 44 Möglichkeiten für caus den verbleibenden Karten (1 Punkt)
Aufgabe 3 (c):(insgesamt 6 Punkte)
die Wahrscheinlichkeit für einen Flush (einschließlich Royal und Straight Flush) beträgt
13
5
·4
52
5
≈0.0020 (3 Punkte)
es gibt 135 Möglichkeiten für die Werte der Karten des Flush (1.5 Punkte) und 4 Möglich- keiten für die Farbe desFlush (1.5 Punkte)
Aufgabe 4: (insgesamt 20 Punkte) Aufgabe 4 (a):(insgesamt 5 Punkte)
gesucht ist P(Y ≥1) = 1−P(Y = 0) mit Y ∼Bin(n= 20, p= 0.1) (2 Punkte) P(Y =yi) =yni·pyi ·(1−p)(n−yi) (1 Punkt)
P(Y = 0) =200·0.10·0.920 (1 Punkt) P(Y = 0) ≈0.1216
P(Y ≥1) = 1−P(Y = 0)≈1−0.1216 ≈0.8784 (1 Punkt) Aufgabe 4 (b): (insgesamt 7 Punkte)
gesucht ist n für Y ∼Bin(n, p = 0.1), sodass P(Y ≥1)>0.9 (2 Punkte) P(Y ≥1)>0.9→P(Y = 0)<0.1 (1 Punkt)
P(Y =yi) =yni·pyi ·(1−p)(n−yi)
P(Y = 0) =n0·0.10·0.9n−0 <0.1(1 Punkt) 0.9n <0.1 (1 Punkt)
n > ln 0.1ln 0.9 ≈21.8543 (1 Punkt) n≥22 (1 Punkt)
Aufgabe 4 (c):(insgesamt 8 Punkte)
gesucht ist pfür Y ∼Bin(n= 20, p), sodass P(Y = 0) =P(Y = 1) (2 Punkte) P(Y =yi) =yn
i
·pyi ·(1−p)(n−yi)
P(Y = 0) =200·p0·(1−p)(20−0) = (1−p)20 (1 Punkt)
P(Y = 1) =201·p1·(1−p)(20−1) = 20·p·(1−p)19 (1 Punkt) (1−p)20= 20·p·(1−p)19 (1 Punkt)
1−p= 20·p (2 Punkte) p= 211 (1 Punkt)
Aufgabe 5: (insgesamt 20 Punkte)
Aufgabe 5 (a):(insgesamt 9 Punkte)
Modellsituation: X bezeichnet die Nachbereitungszeit X ∼N(µ, σ2),µ und σ2 unbekannt (1 Punkt)
Geeigneter Test (Normalverteilung, unbekannte Varianz): t-Test (1 Punkt) Testproblem:
H0 :p=p0 vs. H1 :p6=p0
H0 :p= 4 vs. H1 :p6= 4 (0.5 Punkte) Signifikanzniveau:
α= 0.01 →α/2 = 0.005 → 1−α/2 = 0.995 (0.5 Punkte) Entscheidungsregel:
Verwerfe H0, falls
√
n· X−Sµ0> tn−1;1−α/2 (1 Punkt) Teststatistik:
x= n1 ·Pni=1xi (0.5 Punkte)= 151 ·Pni=159.2 = 3.9467 (0.5 Punkte)
s2 = 1 n−1·
Xn i=1
(xi−x)2 (0.5 Punkte)
= 1
n−1·
Xn i=1
x2i −n·x2
!
= 1
14 ·
Xn i=1
259.46−15·3.94672
!
= 1
14 ·25.8173 = 1.8441(0.5 Punkte) s = √
s2 = 1.3580(0.5 Punkte)
√
n· X−Sµ0
=√
15· 3.94671.3580−4
=|−0.1521|= 0.1521(1 Punkt) Kritischer Wert:
tn−1;1−α/2 =t14;0.995 = 2.9768 (0.5 Punkte) Testentscheidung:
√
n· X−µS 0
= 0.1521> t14;0.995 = 2.9768 → falsche Aussage
H0 kann nicht verworfen werden (0.5 Punkte). Man kann nicht davon ausgehen, dass sich die wöchentliche Nachbereitungszeit für Statistik verändert hat(0.5 Punkte).
Aufgabe 5 (b): (insgesamt 6 Punkte) Neue Modellsituation:
jetztX ∼N(µ, σ2), σ2 bekannt
Gleiches Testproblem wie in (a), angemessener Test jetzt: Gauß-Test (1 Punkt) Entscheidungsregel:
Verwerfe H0, falls
√
n· X−Sµ0
> z1−α/2 (1 Punkt)
mit z1−α/2 =z0.995= 2.5758 (0.5 Punkte) Es ist x= 3.9467 (aus (a)) und σ=√
σ2 =√
0.005 = 0.0707 (1 Punkt) Teststatistik:
√
n· X−µσ 0=√
15· 3.94670.0707−4=|−2.9216|= 2.9216(1 Punkt) Testentscheidung:
√
n· X−σµ0= 2.9216> z1−α/2 = 2.5758→ wahre Aussage
Damit kann H0 hier verworfen werden (1 Punkt). Die wöchentliche Nachbereitungszeit für Statistik beträgt nicht 4 Stunden(0.5 Punkte).
Aufgabe 5 (c):(insgesamt 5 Punkte)
99%-Konfidenzintervall fürµ bei Normalverteilung mit bekannter Varianz:
hX−√σn ·z1−α/2, X+ √σn ·z1−α/2i (1 Punkt)
Es ist x= 0, σ =√
σ2 =√
4 = 2,α = 0.01 und damit z1−α/2 =z0.995 = 2.5758 (0.5 Punkte)
Intervall-Länge 0.2∼=±0.1≥ ±√σn ·z1−α/2 (1 Punkt)
±0.1≥ ±√2n ·2.5758 auflösen nach n:
√n≥ 0.12 ·2.5758 (1 Punkt)
√n≥51.516
n≥2653.8983 (1 Punkt)
Der Stichprobenumfang müsste mindestens 2654 betragen, damit ein 99%-Konfidenzintervall der Länge 0.2 angegeben werden kann (0.5 Punkte).