3. Übungsblatt 507.051 Angewandte Statistik, WS 2003/2004
1Univ.-Prof. DI Dr. Ernst Stadlober
1.) [T] Einfache Varianzanalyse mit zwei Gruppen SeienYij i
∼N(βi, σ),i= 1,2;j= 1, . . . , ni.
(a) Zeigen Sie, dass SSA=kp1(Y)−p2(Y)k2 = n1nn2Y1.−Y2.
2
. (b) Weisen Sie nach, dass
E(SSA) =Ekp1(Y)−p2(Y)k2=σ2+n1n2
n (β1−β2)2.
(c) Zeigen Sie für den Erwartungswert der FStatistik F = M SAM SR die Approximation E(F)≈1 +n1n2
n
β1−β2
σ 2
. Hinweis: Entwickeln Sie den Quotienten der Form
µX + (X−µX)
µY + (Y −µY) mit X=M SA , Y =M SR . 2.) [T] Einfache Varianzanalyse mit r Gruppen
Sei Yij =µ0+αi+ij, i= 1, . . . , r;j= 1, . . . , ni;ij iid∼N(0, σ),Pri=1niαi = 0. (a) Zeigen Sie, dass (siehe Satz 4.2.1)
E(M SA) = σ2+ 1 r−1
r
X
i=1
niα2i mit M SA= 1 r−1
r
X
i=1
ni
Yi.−Y..
2
E(M SR) = σ2 mit M SR= 1 n−r
r
X
i=1 ni
X
j=1
Yij −Yi.
2
.
(b) KruskalWallisTest Seien Yi1, . . . , Yini
iid∼Fi,Fi stetig, i= 1, . . . , r, und R11, R12, . . . , Rrnr die Ränge der kombinierten geordneten Stichprobe. Weisen Sie nach, dass unter
H0 : Fi(z) =F(z), i= 1, . . . , r, gilt:
E(Ri.) =ni
n+ 1
2 , V ar(Ri.) = ni(n+ 1)(n−ni)
12 .
3.) [T] Varianzstabilisierende Transformationen.
SeiX eine Zufallsvariable mit E(X) =µ und V ar(X) =σ2(µ). Man suche eine varianz- stabilisierende Transformation Y = T(X) mit der Eigenschaft V ar(Y) ≈ c = constant.
Sei T(x) eine zweimal dierenzierbare Funktion.
(a) Zeigen sie mit Hilfe der TaylorFormel, dass
V ar(Y)≈E (T0(µ)(X−µ)2 = T0(µ)2σ2(µ).
(b) Wie lautet T(x) für X∼P oisson(λ) und X∼Bin(n, p) bei kleinem p?
3. Übungsblatt 507.051 Angewandte Statistik, WS 2003/2004
24.) Einfache Varianzanalyse; aimu.sav [SPSS 11.0, R 1.7]
Man untersuche das Merkmal fe_l in Abhängigkeit vom Faktor al_kl, welcher in Aufgabe 1.1 deniert wurde. Analysieren Sie die Daten mit graphischen und varianzanalytischen Methoden.
(a) Explorative Analyse mit Boxplotserien und Fehlerbalken.
(b) Aufruf des Menüs Analysieren −→ Mittelwerte vergleichen −→ Einfaktorielle ANO- VA mit Post-Hoc S-N-K, Tukey-B, Duncan. Setzen Sie die Optionen Deskriptive Statistik und Test auf Homogenität der Varianzen.
(c) Aufruf des Menüs Analysieren −→ Allgemeines Lineares Modell −→ Univariat, Ab- hängige Variable fe_l, Feste Faktoren al_kl, Diagramme Horizontale Achse al_kl, Post Hoc siehe (a), Speichern Vorhergesagte Werte Nicht standardisiert, Residen Standardisiert, Optionen (alles ankreuzen)
Analysieren Sie die Verteilung der standardisierten Residuen.
(d) Aufruf des Menüs Analysieren−→Nichtparametrische Tests−→K unabhängige Stich- proben Tests: Kruskal-Wallis-H, Median Optionen Descriptive Statistik, Quartile.
(e) Versuchen Sie Gemeinsamkeiten und Unterschiede der drei Anwendungen zu charak- terisieren. Fassen Sie die Ergebnisse in Form eines Reports zusammen.
5.) Einfache Varianzanalyse, Zement [SPSS 11.0, R 1.7]
Die Zugfestigkeit von PortlandZement soll untersucht werden. Vier verschiedene Misch- techniken liefern ein zufrieden stellendes Ergebnis. folgende Daten wurden für die Unter- suchung gesammelt (aus D.C. Montgomery, S.117, Bsp. 3-1 und 3-3).
Mischtechnik Zugfestigkeit (lb/in2)
1 3129 3000 2865 2890
2 3200 3300 2975 3150
3 2800 2900 2985 3050
4 2600 2700 2600 2765
(a) Geben Sie die Daten in SPSS ein und speichern Sie diese als File zement.sav ab.
(b) Hat die Mischtechnik einen Einuss auf die Zugfestigkeit des PortlandZements?
(c) Führen Sie eine Post Hoc Analyse mit dem Multiplen Spannweitentest von Duncan durch.
(d) Analysieren Sie die Residuen des Experiments.
(e) Interpretieren Sie die Ergebnisse auch mit Hilfe von Boxplots.
(f) Wie lauten die 95%Kondenzintervalle für die Mittelwerte jeder Mischtechnik?
(g) Wie lautet das 95%Kondenzintervall der Dierenz der Mittelwerte der Mischtech- niken 1 und 3?
(h) Führen Sie den KruskalWallisTest durch.
3. Übungsblatt 507.051 Angewandte Statistik, WS 2003/2004
36.) [T] Randomisierter vollständiger Blockversuchsplan Sei Yij =µ0+αi+βj+ij,i= 1, . . . , r;j= 1, . . . , s mit
ij iid∼ N(0, σ),
r
X
i=1
αi =
s
X
j=1
βj = 0.
(a) Stellen Sie die Designmatrix X auf und berechnen Sie die ML-Schätzer für die Para- meter µ0,αi,βj.
(b) Zeigen Sie (siehe Satz 5.1.2) E(M SB) = σ2+ r
s−1
s
X
j=1
βj2 mit M SB = r s−1
s
X
j=1
Y.j−Y..
2
,
E(M SR) = σ2 mit M SR= 1 (r−1)(s−1)
r
X
i=1 s
X
j=1
Yij −Yi.−Y.j−Y..
2
. 7.) Fallbeispiel Luftschadstodaten (3. Teil) grazluft.xls; [SPSS 11.0, R 1.7].
(a) Führen Sie eine einfache Varianzanalyse für pm10 mit dem Faktor ort durch. Hat der Faktor Messort einen Einuÿ auf denP M10Gehalt der Luft? An welchen Messorten ist derP M10Gehalt auällig hoch? Benutzen Sie in SPSS das Menü Analysieren−→
Allgemeines Lineares Modell−→ Univariat.
(b) Analysieren Sie die Residuen bzgl. pm10. Sind die Voraussetzungen für eine einfache ANOVA gegeben? Was liefern die nichtparametrischen Verfahren?
(c) Versuchen Sie gegebenenfalls eine Transformation für pm10 zu nden, welche die Vari- anz stabilisiert. Was kann man über die Verteilung der Residuen für die transformierte Variable sagen?
(d) Welche Methoden sind für den Vergleich der pm10Daten bzgl. des Faktors datum adäquat? Vergleichen Sie die transformierten datumDaten in ähnlicher Weise.
(e) Verfassen Sie einen kurzen Bericht Ihrer Analysen.
Hinweise:
Die Daten sind unter www.cis.tu-graz.ac.at/stat/angstat/data zu nden.
Speichern sie Ihre Übungsaufgaben (mit entsprechenden Kommentaren) unter folgenden File Namen ab: Nachname3aufgabenr.* z.B. stampf31.doc maximal 8 Zeichen!
und übermitteln sie die Files über anonymous ftp wie folgt an uns:
1. Starten des ftpProgramms (beispielweise ws_ftp95 le) 2. Name des Rechners eingeben: zid.tu-graz.ac.at 3. Username: abgabe
4. Password: ws03/04
5. Ablegen der Daten unter /incoming/angstat
Transfer der Files bis spätestens: Di. 16. 12. 2003, 20.00 Uhr