3. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002
1Univ.-Prof. DI Dr. Ernst Stadlober
1.) [T] Varianzstabilisierende Transformationen.
Sei X eine Zufallsvariable mit E(X) =µ und V ar(X) =σ2(µ). Man suche eine varianz- stabilisierende Transformation Y =T(X) mit der Eigenschaft V ar(Y) ≈ c = constant.
Sei T(x) eine zweimal differenzierbare Funktion.
(a) Zeigen sie mit Hilfe der Taylor–Formel, dass
V ar(Y)≈E (T0(µ)(X−µ)2= T0(µ)2σ2(µ).
(b) Wie lautet T(x) f¨ur X ∼P oisson(λ) und X ∼Bin(n, p) bei kleinem p?
2.) [T] Einfache Varianzanalyse mit r Gruppen.
Sei Yij =µ0+αi+ij, i= 1, . . . , r;j= 1, . . . , ni;ij iid
∼N(0, σ),Pri=1niαi = 0.
(a) Zeigen sie, dass (siehe Satz 4.2.1) E(M SA) = σ2+ 1
r−1
r
X
i=1
niα2i mit M SA= 1 r−1
r
X
i=1
niYi.−Y..2
E(M SR) = σ2 mit M SR= 1 n−r
r
X
i=1 ni
X
j=1
Yij−Yi.2 .
(b) Kruskal–Wallis–Test.
Seien Yi1, . . . , Yini
iid∼Fi,Fi stetig,i= 1, . . . , r und R11, R12, . . . , Rrnr die R¨ange der kombinierten geordneten Stichprobe, Ri.=Pnj=1i Rij.
i. Weisen sie nach, dass unter
H0: Fi(z) =F(z), i= 1, . . . , r gilt:
E(Ri.) =ni n+ 1
2 V ar(Ri.) = ni(n+ 1)(n−ni)
12 , E(H) =r−1. ii. Zeigen sie, dass f¨ur r = 2 gilt (mit WN Wilcoxon–Statistik nach Formel (2.22)):
H = (WN −E(WN))2
V ar(WN) mit E(WN) = n(N + 1)
2 , V ar(WN) = mn(N + 1)
12 .
3.) Einfache Varianzanalyse; aimu.asc[SPSS 11.0.]
Man untersuche das Merkmalfvc lin Abh¨angigkeit vom Faktoral kl, welcher inAufga- be 1.1definiert wurde. Analysieren sie die Daten mit graphischen und varianzanalytischen Methoden.
(a) Explorative Analyse mit Boxplotserien und Fehlerbalken.
(b) Aufruf des Men¨us Analysieren −→ Mittelwerte vergleichen−→Einfaktorielle ANO- VA...mitPost-HocS-N-K, Tukey-B, Duncan. Setzen Sie dieOptionenDeskriptive Statistikund Homogenit¨at der Varianzen.
3. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002
2(c) Aufruf des Men¨usAnalysieren−→Allgemeines lineares Modell−→univariat,Abh¨angige Variable fvc l, Feste Faktorenal kl,Plots horizontale Achse,Post Hoc siehe (a), Speichern Vorhergesagte Werte: nicht standardisiert, Residuen: standardisiert,Op- tionen (alles ankreuzen).
Analysieren Sie die Verteilung der standardisierten Residuen.
(d) Aufruf des Men¨us Analysieren −→ Nichtparametrische Tests −→ K unabh¨angige Stichproben Tests:Kruskal-Wallis-HOptionen Deskriptive Statistik, Quartile.
(e) Versuchen sie Gemeinsamkeiten und Unterschiede der drei Anwendungen zu charak- terisieren. Fassen sie die Ergebnisse in Form eines Reports zusammen.
4.) Einfache Varianzanalyse, Radon [SPSS 11.0.]
In einem Artikel der Zeitschrift Environment International, Vol.18, No.4., 1992, wird ein Experiment beschrieben bei dem die Menge von austretendem Radon in Duschen unter- sucht wurde. F¨ur das Experiment wurde mit Radon angereichertes Wasser verwendet.
Sechs verschiedene Offnungsdurchmesser¨ der Duschk¨opfe wurden getestet. Es liegen fol- gende Daten vor (Montgomery, 1997, S. 120, Aufgabe 3–9):
D¨usen– Freigesetztes durchmesser Radon in %
0.37 80 83 83 85
0.51 75 75 79 79
0.71 74 73 76 77
1.02 67 72 74 74
1.40 62 62 67 69
1.99 60 61 64 66
(a) Geben sie die Daten ein und speichern sie diese in SPSS unterradon.sav ab.
(b) Hat der ¨Offnungsdurchmesser der Duschk¨opfe einen Einfluss auf das durchschnittlich freigesetzte Radon (α= 0.05)?
(c) Welcher p–Wert ergibt sich f¨ur dieF–Statistik in (b)?
(d) Analysieren Sie die Residuen des Experiments.
(e) Wie lautet das 95%–Konfidenzintervall des Mittelwertes, wenn der Durchmesser 1.40 Einheiten betr¨agt?
(f) Was liefert der Kruskal–Wallis–Test?
5.) [T] Randomisierter vollst¨andiger Blockversuchsplan.
Sei Yij =µ0+αi+βj +ij,i= 1, . . . , r,j = 1, . . . , s mit ij iid∼N(0, σ),
r
X
i=1
αi=
s
X
j=1
βj = 0.
(a) Stellen sie die Designmatrix X auf und berechnen sie die ML-Sch¨atzer f¨ur die Para- meter µ0,αi,βj.
3. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002
3(b) Zeigen sie (sieheSatz 5.1.2) E(M SB) = σ2+ r
s−1
s
X
j=1
βj2 mit M SB= r s−1
s
X
j=1
Y.j−Y..
2
E(M SR) = σ2 mit M SR= 1 (r−1)(s−1)
r
X
i=1 s
X
j=1
Yij−Yi.−Y.j−Y..
2
.
6.) Fallbeispiel Luftschadstoffdaten (3. Teil)luft.sav; [SPSS 11.0].
(a) F¨uhren sie eine einfache Varianzanalyse f¨urcooderso2mit dem Faktorregzifdurch.
Hat der Faktor Regierungsbezirk einen Einfluss auf den CO(SO2)–Gehalt der Luft?
In welchen Regierungsbezirken ist derCO(SO2)–Gehalt auff¨allig hoch? Benutzen Sie in SPSS das Men¨uStatistik −→ Allgemeines lineares Modell −→ univariat.
(b) Vergleichen sie denCO(SO2)–Gehalt bzgl. des Faktorsfdatmit Hilfe von Methoden f¨ur das Zweistichprobenproblem und interpretieren sie die Ergebnisse.
(c) Analysieren sie die Residuen bzgl. co bzw. so2. Sind die Voraussetzungen f¨ur eine einfache ANOVA gegeben? Was liefern die nichtparametrischen Verfahren?
(d) Falls notwendig, versuchen sie eine Transformation f¨urcobzw.so2zu finden, welche die Varianz stabilisiert. Was kann man ¨uber die Verteilung der Residuen f¨ur die transformierte Variable sagen?
(e) Welche Methoden sind f¨ur den Vergleich der co bzw. so2–Daten bzgl. des Faktors fdat ad¨aquat? Vergleichen sie die transformierten co bzw. so2–Daten in ¨ahnlicher Weise.
(f) Verfassen sie einen kurzen Bericht Ihrer Analysen.
Hinweise: Zusammenarbeit in Zweiergruppen ist erw¨unscht.
Die Daten sind unter www.cis.tu-graz.ac.at/stat/angstat/data
zu finden. Speichern sie Ihre ¨Ubungsaufgaben (mit entsprechenden Kommentaren) unter folgen- den File–Namen ab: Nachname3aufgabenr.*z.B.stampf31.doc maximal 8 Zeichen!
und ¨ubermitteln sie die Files ¨uber anonymous ftp wie folgt an uns:
1. Starten des ftp–Programms (beispielweise das von Onnet angebotene) 2. Name des Rechners eingeben: statistik.tu-graz.ac.at
3. Username: anonymous 4. Password:guest
5. Ablegen der Daten unter statistik.tu-graz.ac.at/incoming/angstat Transfer der Files bis sp¨atestens: Di. 11. 6. 2002, 20.00 Uhr