Lösung zur Klausur zu Statistik II Prof. Dr. Claudia Becker Sommersemester 2012 24.09.2012

(1)

Lösung zur Klausur zu Statistik II

Prof. Dr. Claudia Becker Sommersemester 2012

24.09.2012

Aufgabe 1: (insgesamt 20 Punkte)

Richtige Entscheidung Zutreffen(jeweils 1 Punkt), richtige Begründung(jeweils 3 Punkte).

1. Beim statistischen Testen wird der Fehler 1. Art kontrolliert.

Richtig Falsch Begründung:

Die Wahrscheinlichkeit für den Fehler 1. Art wird durch das Signifikanzniveau beschränkt.

Es wird der Fehler 2. Art kontolliert.

Die Wahrscheinlichkeit für den Fehler 1. Art wird nicht kontrolliert, sondern aus der Teststatstik berechnet.

2. Im Ziegenproblem ist “Wechseln” die bessere Strategie.

Da der Moderator die Ziegen und das Auto vertauschen kann, verliert der Kandidat in jedem Fall.

Wenn der Kandidat die Tür mit dem Auto gewählt hat, verliert er beim Wechseln.

Bei mehrfacher Wiederholung des Spiels führt Wechseln häufiger zum Gewinn.

3. Der Erwartungswert ist das theoretische Gegenstück zum Modus (wenn beide existie- ren).

Der Erwartungswert teilt die Dichte im Verhältnis 50:50, daher ist er das Gegenstück zum Median.

Der Erwartungswert ist der Schwerpunkt der Dichte, daher ist er das Gegenstück zum arithmetischen Mittel.

Der Erwartungswert ist die Stelle, an der die Dichte maximal ist, daher ist er das Gegenstück zum Modus.

4. Die stetige Gleichverteilung wird auch Rechteckverteilung genannt.

(2)

Die Gleichverteilung wird nur Gleichverteilung genannt, es gibt keine alternative Bezeichnung.

Da die Dichtefunktion die Form eines Rechtecks hat, nennt man die Verteilung auch Rechteckverteilung.

Da die Dichtefunktion auf einem Intervall definiert ist, nennt man die Verteilung auch Intervallverteilung.

5. Die empirische Varianz se² schätzt die theoretische Varianz σ² im Mittel besser als die Stichprobenvarianz s².

se² ist erwartungstreu für σ², s² aber nicht.

s² ist erwartungstreu für σ², se² aber nicht.

Beide Schätzer sind erwartungstreu für σ² und daher gleich gut.

Aufgabe 2 (a):(insgesamt 10 Punkte) Gesucht:P(I^C|P A)

Gegeben:

P(I^C) = 0.2 P(P A|I^C) = 0.03 P(P A|I) = 0.005 Nutze Satz von Bayes:

P(B_i|A) = P(A|Bi)·P(Bi) P(A)

P(I^C|P A) = P(P A|I^C)·P(I^C) P(P A)

UmP(P A) zu ermitteln, nutze Satz der totalen Wahrscheinlichkeit:

P(A) =

Xk i=1

P(A|Bi)·P(Bi)

P(P A) = P(P A|I)·P(I) +P(P A|I^C)·P(I^C) P(P A) = 0.005·(1−0.2) + 0.03·0.2

P(P A) = 0.01 Daraus folgt

P(I^C|P A) = 0.03·0.2 0.01 P(I^C|P A) = 0.6

(3)

Aufgabe 2 (b): (insgesamt 10 Punkte)

Gesucht: Wahrscheinlichkeit, dass eine Panne und ein anderer Verzögerungsgrund gleichzei- tig eingetreten sind →P(P A∩SG).

Gegeben:

P(V erspätung) =P(P A∪SG) = 0.015 P(SG) = 0.01

P(P A) = 0.01 (siehe 2 (a))

Da P(A∪B) =P(A) +P(B)−P(A∩B) gilt, ist P(A∩B) =P(A) +P(B)−P(A∪B).

Also

P(P A∩SG) =P(P A) +P(SG)−P(P A∪SG) P(P A∩SG) = 0.01 + 0.01−0.015 = 0.005 Aufgabe 3: (insgesamt 20 Punkte)

Aufgabe 3 (a):(insgesamt 7 Punkte)

Laplace-Wahrscheinlichkeit: Verhältnis der Anzahl der günstigen zur Anzahl der möglichen Ereignisse(1 Punkt); günstige Ereignisse = Anzahl der Möglichkeiten ein Paar zu ziehen (1 Punkt): das Paar kann 13 verschiedene Werte aufweisen(1 Punkt); es gibt⁴₂Möglichkeiten für die Farben der Karten des Paares (1 Punkt); es gibt ¹²₃ Möglichkeiten für die Werte der restlichen drei Karten (1 Punkt), wobei jede der Karten eine beliebige Farbe aufweisen kann (4·4·4) (1 Punkt); Anzahl der möglichen Ereignisse = Anzahl der Möglichkeiten 5 Karten aus 52 zu ziehen: insgesamt sind ⁵²₅ Kartenhände möglich (1 Punkt)

Aufgabe 3 (b): (insgesamt 7 Punkte)

die Wahrscheinlichkeit für zwei Paare beträgt

₁₃

2

·⁴2

·11·4

₅₂

5

≈0.0475 (3 Punkte)

es gibt ¹³₂ Möglichkeiten für die Werte von a und b (1 Punkt); ⁴₂ Möglichkeiten für die Farben der Karten von Paara (1 Punkt);⁴₂ Möglichkeiten für die Farben der Karten von Paarb (1 Punkt); 44 Möglichkeiten für caus den verbleibenden Karten (1 Punkt)

Aufgabe 3 (c):(insgesamt 6 Punkte)

die Wahrscheinlichkeit für einen Flush (einschließlich Royal und Straight Flush) beträgt

₁₃

5

·4

₅₂

5

≈0.0020 (3 Punkte)

es gibt ¹³₅ Möglichkeiten für die Werte der Karten des Flush (1.5 Punkte) und 4 Möglich- keiten für die Farbe desFlush (1.5 Punkte)

Aufgabe 4: (insgesamt 20 Punkte) Aufgabe 4 (a):(insgesamt 5 Punkte)

gesucht ist P(Y ≥1) = 1−P(Y = 0) mit Y ∼Bin(n= 20, p= 0.1) (2 Punkte) P(Y =yi) =_yⁿ_i·p^yⁱ ·(1−p)⁽ⁿ⁻^yⁱ⁾ (1 Punkt)

(4)

P(Y = 0) =²⁰₀·0.1⁰·0.9²⁰ (1 Punkt) P(Y = 0) ≈0.1216

P(Y ≥1) = 1−P(Y = 0)≈1−0.1216 ≈0.8784 (1 Punkt) Aufgabe 4 (b): (insgesamt 7 Punkte)

gesucht ist n für Y ∼Bin(n, p = 0.1), sodass P(Y ≥1)>0.9 (2 Punkte) P(Y ≥1)>0.9→P(Y = 0)<0.1 (1 Punkt)

P(Y =yi) =_yⁿ_i·p^yⁱ ·(1−p)⁽ⁿ⁻^yⁱ⁾

P(Y = 0) =ⁿ₀·0.1⁰·0.9ⁿ⁻⁰ <0.1(1 Punkt) 0.9ⁿ <0.1 (1 Punkt)

n > ^{ln 0.1}_{ln 0.9} ≈21.8543 (1 Punkt) n≥22 (1 Punkt)

gesucht ist pfür Y ∼Bin(n= 20, p), sodass P(Y = 0) =P(Y = 1) (2 Punkte) P(Y =yi) =_yⁿ

i

·p^yⁱ ·(1−p)⁽ⁿ⁻^yⁱ⁾

P(Y = 0) =²⁰₀·p⁰·(1−p)⁽²⁰⁻⁰⁾ = (1−p)²⁰ (1 Punkt)

P(Y = 1) =²⁰₁·p¹·(1−p)⁽²⁰⁻¹⁾ = 20·p·(1−p)¹⁹ (1 Punkt) (1−p)²⁰= 20·p·(1−p)¹⁹ (1 Punkt)

1−p= 20·p (2 Punkte) p= ₂₁¹ (1 Punkt)

Aufgabe 5 (a):(insgesamt 9 Punkte)

Modellsituation: X bezeichnet die Nachbereitungszeit X ∼N(µ, σ²),µ und σ² unbekannt (1 Punkt)

Geeigneter Test (Normalverteilung, unbekannte Varianz): t-Test (1 Punkt) Testproblem:

H0 :p=p0 vs. H1 :p6=p0

H0 :p= 4 vs. H1 :p6= 4 (0.5 Punkte) Signifikanzniveau:

α= 0.01 →α/2 = 0.005 → 1−α/2 = 0.995 (0.5 Punkte) Entscheidungsregel:

Verwerfe H0, falls

√

n· ^X⁻_S^µ⁰> tn−1;1−α/2 (1 Punkt) Teststatistik:

x= _n¹ ·^Pⁿi=1xi (0.5 Punkte)= ₁₅¹ ·^Pⁿi=159.2 = 3.9467 (0.5 Punkte)

(5)

s² = 1 n−1·

Xn i=1

(xi−x)² (0.5 Punkte)

= 1

n−1·

Xn i=1

x²_i −n·x²

!

= 1

14 ·

Xn i=1

259.46−15·3.9467²

!

= 1

14 ·25.8173 = 1.8441(0.5 Punkte) s = √

s² = 1.3580(0.5 Punkte)

√

n· ^X⁻S^µ⁰

=√

15· ^3.94671.3580⁻⁴

=|−0.1521|= 0.1521(1 Punkt) Kritischer Wert:

tn−1;1−α/2 =t14;0.995 = 2.9768 (0.5 Punkte) Testentscheidung:

√

n· ^X−µS ⁰

= 0.1521> t14;0.995 = 2.9768 → falsche Aussage

H0 kann nicht verworfen werden (0.5 Punkte). Man kann nicht davon ausgehen, dass sich die wöchentliche Nachbereitungszeit für Statistik verändert hat(0.5 Punkte).

Aufgabe 5 (b): (insgesamt 6 Punkte) Neue Modellsituation:

jetztX ∼N(µ, σ²), σ² bekannt

Gleiches Testproblem wie in (a), angemessener Test jetzt: Gauß-Test (1 Punkt) Entscheidungsregel:

Verwerfe H0, falls

√

n· ^X⁻S^µ⁰

> z1−α/2 (1 Punkt)

mit z1−α/2 =z0.995= 2.5758 (0.5 Punkte) Es ist x= 3.9467 (aus (a)) und σ=√

σ² =√

0.005 = 0.0707 (1 Punkt) Teststatistik:

√

n· ^X−µ_σ ⁰=√

15· ^3.9467_0.0707⁻⁴=|−2.9216|= 2.9216(1 Punkt) Testentscheidung:

√

n· ^X⁻_σ^µ⁰= 2.9216> z1−α/2 = 2.5758→ wahre Aussage

Damit kann H0 hier verworfen werden (1 Punkt). Die wöchentliche Nachbereitungszeit für Statistik beträgt nicht 4 Stunden(0.5 Punkte).

99%-Konfidenzintervall fürµ bei Normalverteilung mit bekannter Varianz:

hX−^√^σ_n ·z_1−α/2, X+ ^√^σ_n ·z_1−α/2ⁱ (1 Punkt)

Es ist x= 0, σ =√

σ² =√

4 = 2,α = 0.01 und damit z1−α/2 =z0.995 = 2.5758 (0.5 Punkte)

(6)

Intervall-Länge 0.2∼=±0.1≥ ±^√^σ_n ·z1−α/2 (1 Punkt)

±0.1≥ ±^√²_n ·2.5758 auflösen nach n:

√n≥ _0.1² ·2.5758 (1 Punkt)

√n≥51.516

n≥2653.8983 (1 Punkt)

Der Stichprobenumfang müsste mindestens 2654 betragen, damit ein 99%-Konfidenzintervall der Länge 0.2 angegeben werden kann (0.5 Punkte).