4. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2007/2008
1Univ.-Prof. DI Dr. Ernst Stadlober
1.) Lateinisches Quadrat. Montagemethoden, r= 4 [R 2.6.0].
Ein Ingenieur untersuchte den Einfluss von r= 4 Montagemethoden (A, B, C, D) bez¨uglich derMontagezeit Y f¨ur eine Komponente eines Farbfernsehers. Es wurden 4 Arbeiter ausgesucht. Außerdem ist bekannt, dass die Montage sehr anstrengend ist und die ben¨otigte Montagezeit zu Beginn einer Schicht des Arbeiters geringer ist als am Ende — unabh¨angig von der Methode. Also wird auch der Blockfaktor Montagereihenfolge in die Untersuchung mit einbezogen. Die Daten wurden nach dem folgenden Versuchsplan in Form eines Lateinischen Quadrates erhoben. (Mont- gomery (2005), S. 158, Problem 4-19).
Montage- Arbeiter
Reihenfolge 1 2 3 4
1 C = 10 D = 14 A = 7 B = 8 2 B = 7 C = 18 D = 11 A = 8 3 A = 5 B = 10 C = 11 D = 9 4 D = 10 A = 10 B = 12 C = 14
(a) Analysieren Sie die Daten (vgl. Handout zu Bsp. 6.1) und ziehen Sie die ent- sprechenden Schl¨usse aus den Ergebnissen.
(b) Falls einer der Faktoren keinen signifikanten Einfluss auf die Montagezeit hat, f¨uhre man eine doppelte ANOVA mit den restlichen beiden Faktoren durch.
2.) [T] Doppelte Varianzanalyse mit Wechselwirkung (zweifaktorieller VP).
Modell: Yijk =µ0+αi+βj +γij +ijk, i= 1, . . . , r;j = 1, . . . , s;k= 1, . . . , t; ijkiid∼N(0, σ), P
iαi =P
jβj = 0, P
iγij = 0, f¨ur allej,P
jγij = 0 f¨ur alle i.
Verifizieren Sie zumindest eine der folgenden Aussagen:
E(M SA) = σ2+ st r−1
r
X
i=1
α2i mit M SA= st r−1
r
X
i=1
Yi..−Y...2
E(M S(AB)) = σ2+ t (r−1)(s−1)
r
X
i=1 s
X
j=1
γij2 mit
M S(AB) = t
(r−1)(s−1)
r
X
i=1 s
X
j=1
Yij.−Yi..−Y.j.+Y...2
E(M SR) = σ2 mit M SR = 1 rs(t−1)
r
X
i=1 s
X
j=1 t
X
k=1
Yijk−Yij.2
.
4. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2007/2008
2 3.) 3–fache Varianzanalyse. Beispiel Radon [R 2.6.0].Analysieren Sie dieses Beispiel gem¨aß der in der Vorlesung vorgef¨uhrten Analyse.
Dabei wird Y = Score f¨ur die F¨arbequalit¨at in Abh¨angigkeit von den Faktoren Zykluszeit (A), Temperatur(B) und Arbeiter(C) betrachtet.
4.) 23–Versuchsplan. Abf¨ullung von Limonaden, t = 2 Wiederholungen [[R 2.6.0].
(a) Geben Sie die Daten von Bsp. 7.2 mit Y = Abweichung von der idealen F¨ullh¨ohe, den Faktoren Kohlens¨aureanteil (A), F¨ulldruck (B) und Geschwin- digkeit des Bandes(C) in der Kodierung ”−” = 1, ”+” = 2 ein und analysieren Sie diese gem¨ass der Vorlesung.
(b) Zeichnen Sie die Profilplots f¨ur die zweifachen Wechselwirkungen, analysieren Sie die standardisierten Residuen und interpretieren Sie die Ergebnisse.
(c) Berechnen Sie das Regressionsmodell ˆy= ˆβ0+ ˆβ1x1+ ˆβ2x2+ ˆβ3x3+ ˆβ4x1x2 mit den kodierten Variablen xi f¨ur die Faktoren A, B und C.
(d) Analysieren Sie die Residuen dieses Modells.
5.) 24–Versuchsplan. Chemischer Prozess, t = 2 Wiederholungen [R 2.6.0].
Das folgende Experiment wurde durchgef¨uhrt, um denErtrag eines chemischen Pro- zesses zu verbessern. Mit r = 4 Faktoren und t = 2 Wiederholungen eines rando- misierten Versuchsplanes erhielt man folgende Daten. (Montgomery (2005), S. 255, Problem 6-7).
Behandlung Wiederholung
A B C D Kombination I II
– – – – (1) 90 93
+ – – – a 74 78
– + – – b 81 85
+ + – – ab 83 80
– – + – c 77 78
+ – + – ac 81 80
– + + – bc 88 82
+ + + – abc 73 70
– – – + d 98 95
+ – – + ad 72 76
– + – + bd 87 83
+ + – + abd 85 86
– – + + cd 99 90
+ – + + acd 79 75
– + + + bcd 87 84
+ + + + abcd 80 80
(a) Berechnen Sie die Sch¨atzungen der Faktor–Effekte (siehe Skriptum, Kap. 7, S.
149).
4. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2007/2008
3 (b) Finden Sie mittels einer Varianzanalysetabelle (ANOVA) jene Faktoren heraus,die einen Einfluss auf den Ertrag haben.
(c) Geben Sie ein Regressionsmodell f¨ur die Vorhersage des Ertrags an. (Alle 4 Faktoren variieren zwischen 1 und 2.)
(d) F¨uhren Sie eine Residuenanalyse durch und geben Sie Profilplots aus.
(e) Die zwei DreifachwechselwirkungenABC undABD haben offensichtlich große Effekte. Zeichnen Sie einen W¨urfel in den Faktoren A, B, C mit den durch- schnittlichen Ertr¨agen an jedem Eckpunkt. Machen Sie das auch bzgl. der Faktoren A, B und D. Helfen diese beiden Darstellungen bei der Interpreta- tion der Daten? Welche Einstellungen der vier Faktoren w¨urden Sie demnach empfehlen?
6.) Fallbeispiel Luftschadstoffdaten (4. Teil) grazluft.xls; [R 2.6.0].
(a) Analysieren Sie zun¨achst die Daten bzgl.pm10mittels Boxplotserien in Abh¨angig- keit von den beiden Faktoren ortund periode.
(b) F¨uhren Sie eine doppelte Varianzanalyse mit Wechselwirkung f¨urpm10mit den Faktoren ort und periodedurch (siehe Handout zu Bsp. 6.1).
(c) Was kann man ¨uber eine Wechselwirkung der beiden Faktoren sagen? Ist die Annahme der Normalverteilung der Residuen gerechtfertigt? F¨uhren Sie ge- gebenenfalls eine Transformation der Variablen pm10 (z.B. Wurzel- oder Log- transformation) durch und analysieren Sie das Modell mit der transformierten Responsevariablen.
(d) F¨uhren Sie entsprechende Analysen f¨ur den SchadstoffKohlendioxidno2durch.
(e) Fassen Sie die Ergebnisse in Form eines Kurzberichts zusammen.
Speichern Sie Ihre ¨Ubungsaufgaben unter folgenden File–Namen ab:
Angstat Nachname1aufgabenr.*z.B. Angstat Schiefer41.pdf
und ¨ubermitteln Sie die Files mitSubject:Angstatper e-mail an statistik@tugraz.at.