4. L¨osung weitere ¨ Ubungsaufgaben Statistik II WiSe 2019/2020
1. Aufgabe: Eine s¨achsische Molkerei f¨ullt Milch in Tetrapacks ab. Es wird vermutet, dass die F¨ullmenge normalverteilt ist mit einem Erwartungswert von 502 ml und einer Standardabweichung von 2 ml.
In der folgenden Tabelle ist die F¨ullmenge schon in 5 Klassen eingeteilt.
i F¨ullmenge x in ml H
ip
inp
i (Hi−npnpi i)21 x < 499 2 0,0668 3,34 0,54
2 499 ≤ x < 501 13 0,2417 12,085 0,07 3 501 ≤ x < 503 22 0,383 19,15 0,42 4 503 ≤ x < 505 8 0,2417 12,085 1,38
5 505 ≤ x 5 0,0668 3,34 0,83
a) Vervollst¨andigen Sie die Tabelle, bestimmen Sie also die fehlenden vier Werte!
b) Testen Sie die Vermutung zum Signifikanzniveau von α = 0,05!
L¨osung: Hypothetische Verteilung: X
0∼ N (502, 2
2) a) µ = 502 und σ = 2
p
3= P (501 ≤ X
0< 503) = Φ
µ 503 − 502 2
¶
− Φ
µ 501 − 502 2
¶
= Φ (0,5) − Φ (−0,5) = Φ (0,5) − (1 − Φ (0,5))
= 0,6915 − (1 − 0,6915) = 0,383 np
3= 50 · 0,383 = 19,15
p
4= P (503 ≤ X
0< 505) = Φ
µ 505 − 502 2
¶
− Φ
µ 503 − 502 2
¶
= Φ (1,5) − Φ (0,5) = 0,9332 − 0,6915 = 0,2417 np
4= 50 · 0,2417 = 12,085
Hinweis: Bei diesen Aufgabenteil ist auch ein (einfacherer) anderer L¨osungsweg m¨oglich.
Da X
0symmetrisch um den Erwartungswert µ = 40 verteilt ist gilt:
Und aus X
5i=1
p
i= 1 = ⇒ p
3= 1 − (p
1+ p
2+ p
4+ p
5)
= 1 − (0,0668 + 0,2417 + 0,2417 + 0,0668) = 0,383.
b) Hypothetische Verteilung: X
0∼ N (502, 2
2) X- zuf¨allige F¨ullmenge.
1.
H
0: F
X(t) = F
X0(t) f¨ur alle t gegen H
A: F
X(t) 6= F
X0(t) f¨ur mindestens ein t 2. α = 0,05
3. T = P
ki=1
(Hi−npi)2 npi
4. K = {t | t > χ
2k−m−1; 1−α= χ
25−0−1; 1−0,05= χ
24; 0,95= 9,49}
(k = 5 Klassen und m = 0 (beide Parameter sind vorgegeben)) 5. t = 0,54 + 0,07 + 0,42 + 1,38 + 0,83 = 3,24
6. t = 3,24 6> 9,49 = ⇒ H
0wird angenommen.
Die Verteilung der zuf¨alligen F¨ullmenge unterscheidet sich nicht signifikant von einer Normalverteilung mit einem Erwartungswert von 502 ml und einer Standardabweichung von 2 ml.
2. Aufgabe: 100 Leser eines Wirtschaftsmagazins wurden nach ihren durchschnitt- lichen Lesezeiten befragt. Es soll untersucht werden, ob die Lesezeit normalverteilt ist. Dazu liegt folgendes Testergebnis vor.
Goodness-of-Fit Tests for Lesezeit Chi-Square Test
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
at or below 48,0 1 2,06 0,55
48,0 60,0 3 3,00 0,00
60,0 72,0 6 5,75 0,01
72,0 84,0 10 9,39 0,04
84,0 96,0 12 13,08 0,09
96,0 108,0 19 15,52
108,0 120,0 15 15,71
120,0 132,0 12 13,55 0,18
132,0 144,0 12 9,97 0,41
144,0 156,0 4 6,25 0,81
156,0 168,0 2 3,34 0,54
a) Bestimmen Sie die 2 fehlenden Werte in der Tabelle (Spalte Chi-Square).
b) F¨uhren Sie den Test zu Ende und treffen Sie die Testentscheidung zum Niveau α = 0,05.
c) Mit den gleichen Daten wurde ein weiterer Test mit folgendem Ergebnis durch- gef¨uhrt.
Tests for Normality for Lesezeit
Test Statistic P-Value
Shapiro-Wilk W 0,986744 0,859585
Welche Hypothese wird getestet und wie lautet die Testentscheidung bei α = 0,05?
L¨osung: X- zuf¨allige durchschnittliche Lesezeit.
a)
i = 6 : (H
i− np
i)
2np
i= (19 − 15,52)
215,52 = 0,78 i = 7 : (H
i− np
i)
2np
i= (15 − 15,71)
215,71 = 0,03 b) H
0:
” durchschnittliche Lesezeit X ist normalverteilt“
H
A:
” durchschnittliche Lesezeit X ist nicht normalverteilt“
t = 0,55 + 0,00 + 0,01 + ... + 0,54 + 1,10 = 4,54 K = ©
t | t > χ
2k−m−1;1−αª
k = 12 und m = 2 χ
29,0.95= 16,92 t = 4,54 6> 16,92 = χ
29,0.95= ⇒ H
0wird angenommen.
Die durchschnittliche Lesezeit unterscheidet sich nicht signifikant von einer Normalverteilung.
c) H
0: ” durchschnittliche Lesezeit X ist normalverteilt“
H
A:
” durchschnittliche Lesezeit X ist nicht normalverteilt“
p = 0,859585 > 0,05 = α = ⇒ H
0wird angenommen.
Die durchschnittliche Lesezeit unterscheidet sich nicht signifikant von einer
Normalverteilung.
3. Aufgabe:
In der ersten Fußballbundesliga sind in der Saison 2015/2016 866 Tore gefallen. Das sind bei 306 Spielen im Schnitt 2,83 Tore pro Spiel. Dabei erzielten die Heimmann- schaften 479 Tore (Ø 1,57 pro Spiel) und die Gastmannschaften 387 (Ø 1,26 pro Spiel).
a) F¨ur die Tore der Heimmannschaft gibt es folgende H¨aufigkeitsverteilung:
Tore Heimmannschaft H¨aufigkeit
0 74
1 96
2 67
3 43
4 13
5 10
6 3
Testen Sie, zum Niveau α = 0,05, ob die Anzahl der Tore der Heimmannschaft pro Spiel Poisson-verteilt ist.
L¨osung:
Hypothetische Verteilung: X
0∼ Poi(λ)
X- zuf¨allige Anzahl der Tore der Heimmannschaft (pro Spiel).
1.
H
0: F
X(t) = F
X0(t) f¨ur alle t gegen H
A: F
X(t) 6= F
X0(t) f¨ur mindestens ein t
2. α = 0,05
5. EX
0= λ und damit wird λ wie folgt g esch¨atzt:
λ ˆ = x = 479
306 = 1,56536
i Tore Heimmannschaft H
ip
inp
i (Hi−npnp i)2i
1 0 74 0,2090 63,95 1,58
2 1 96 0,3272 100,12 0,17
3 2 67 0,2561 78,37 1,65
4 3 43 0,1336 40,88 0,11
5 4 13 0,0523 16 0,56
6 5 10 0,0164 5,02 4,94
7 6 und mehr 3 0,0054 1,65 1,1
p
1= P (X
0= 0) = λ
00! · e
−λ= 1,56536
00! · e
−1,56536= 0,2090 ...
p
6= P (X
0= 5) = λ
55! · e
−λ= 1,56536
55! · e
−1,56536= 0,0163 p
7= P (X
0≥ 6) = 1 − (p
1+ . . . + p
6) = 0,0054
t = 1,58 + 0,17 + 1,65 + 0,11 + 0,56 + 4,94 + 1,1 = 10,11 6. t = 10,11 6> 11,07 = ⇒ H
0wird angenommen.
Die Anzahl der Tore pro Spiel der Heimmannschaft unterscheidet sich nicht signifikant von einer Poisson-Verteilung, bei Signifikanzniveau α = 0,05.
Bemerkung: Legt man beim Test die letzten beiden Klassen zu einer (5 und mehr Tore) zusammen, so wird beim Signifikanzniveau α = 0, 05 H
0abgelehnt.
Beim Niveau α = 0, 01 wird auch bei dieser ge¨anderten Klasseneinteilung H
0angenommen.
b) Betrachtet man die H¨aufigkeiten der Tore der Gastmannschaft so erh¨alt man beim Test auf Poissonverteilung mit Statgraphics das folgende Ergebnis:
Goodness-of-Fit Tests for Tore Auswärtsmannschaft Chi-Square Test
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
at or below 0,0 89 86,39 0,08
1,0 1,0 110 109,26 0,01
2,0 2,0 56 69,09 2,48
3,0 3,0 40 29,13 4,06
4,0 4,0 10 9,21 0,07
5,0 1 2,93 1,27
Chi-Square = 7,95854 with 4 d.f. P-Value = 0,0931086