3. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009
1Univ.-Prof. DI Dr. Ernst Stadlober
1.) [T] Einfache Varianzanalyse mit zwei Gruppen.
Seien Yij ∼i N(βi, σ), i= 1,2; j = 1, . . . , ni.
(a) Zeigen Sie, dass SSA=kp1(Y)−p2(Y)k2 = n1nn2 Y1.−Y2.
2
. (b) Weisen Sie nach, dass
E(SSA) =E kp1(Y)−p2(Y)k2
=σ2+n1n2
n (β1−β2)2.
(c) Zeigen Sie f¨ur den Erwartungswert der F–Statistik F = M SRM SA die Approxima- tion
E(F)≈1 + n1n2 n
β1−β2 σ
2
. Hinweis: Entwickeln Sie den Quotienten der Form
µX + (X−µX)
µY + (Y −µY) mit X =M SA , Y =M SR . 2.) [T] Einfache Varianzanalyse mit r Gruppen.
Sei Yij =µ0+αi+ij, i= 1, . . . , r;j = 1, . . . , ni; ij iid∼N(0, σ), Pr
i=1niαi = 0.
(a) Man zeige, dass die Linearkombinationen Pr
i=1eiαi mit Pr
i=1niαi = 0 den linearen Unterraum L1 L2 aufspannen.
(b) Zeigen Sie, dass (siehe Satz 4.2.1)
E(M SA) = σ2+ 1 r−1
r
X
i=1
niα2i mit M SA= 1 r−1
r
X
i=1
ni Yi.−Y..2
E(M SR) = σ2 mit M SR = 1 n−r
r
X
i=1 ni
X
j=1
Yij −Yi.2
.
(c) Kruskal–Wallis–Test.
Seien Yi1, . . . , Yini
iid∼ Fi, Fi stetig, i = 1, . . . , r, und R11, R12, . . . , Rrnr die R¨ange der kombinierten geordneten Stichprobe,Ri.=Pni
j=1Rij. i. Weisen Sie nach, dass unter H0 : Fi(z) = F(z), i= 1, . . . , r gilt:
E(Ri.) = ni n+ 1
2 , V ar(Ri.) = ni(n+ 1)(n−ni)
12 , E(H) =r−1. ii. Zeigen Sie, dass f¨ur r = 2 gilt (mit WN Wilcoxon–Statistik nach Formel
(2.22)):
H = (WN −E(WN))2
V ar(WN) mit E(WN) = n(N + 1)
2 , V ar(WN) = mn(N + 1)
12 .
3. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009
23.) [T] Varianzstabilisierende Transformationen.
Sei X eine Zufallsvariable mit E(X) = µ und V ar(X) = σ2(µ). Man suche eine varianzstabilisierende Transformation Y = T(X) mit der Eigenschaft V ar(Y) ≈ c= constant. Sei T(x) eine zweimal differenzierbare Funktion.
(a) Zeigen Sie mit Hilfe der Taylor–Formel, dass
V ar(Y)≈E((T0(µ)(X−µ))2 = (T0(µ))2σ2(µ).
(b) Wie lautet T(X) f¨ur X ∼P oisson(λ) und X ∼Bin(n, p) bei kleinem p?
4.) Einfache Varianzanalyse; aimu 85.dat [R 2.7]
Man untersuche das Merkmal fvc (i) in Abh¨angigkeit vom Faktor al kl, (ii) in Abh¨angigkeit vom Faktor gr kl, welche in Aufgabe 1.1 definiert wurden. Analy- sieren Sie die Daten mit graphischen und varianzanalytischen Methoden.
(a) Explorative Analyse mit Boxplotserien und Fehlerbalken.
(b) F¨uhren Sie eine einfache Varianzanalyse inRmit den Befehlen gem¨aßHand-Out Abschnitt 4.1-4.3 durch.
(c) Welche Parametrisierung liefert der Aufrufsummary(lm(fvc∼al kl))? Rufen Sie auch die Prozedur oneway.test() auf, die keine Homogenit¨at der Varian- zen voraussetzt.
(d) Mit dem Befehl TukeyHSD() kann eine Post-hoc-Analyse durchgef¨uhrt wer- den. Durch plot(TukeyHSD())werden die Konfidenzintervalle geplottet. Man f¨uhre auch die paarweisen t–Tests pairwise.t.test() durch und vergleiche die Ergebnisse.
(e) Welches Ergebnis liefert der Kruskal–Wallis-Testkruskal.test()?
(f) Fassen sie die Ergebnisse in Form eines Reports zusammen.
5.) Einfache Varianzanalyse, Radon [R 2.7]
In einem Artikel der Zeitschrift Environment International, Vol.18, No.4., 1992, wird ein Experiment beschrieben bei dem die Menge von austretendem Radon in Duschen untersucht wurde. F¨ur das Experiment wurde mit Radon angereichertes Wasserverwendet. Sechs verschiedeneOffnungsdurchmesser¨ der Duschk¨opfe wurden getestet. Es liegen folgende Daten vor (Montgomery, 1997, S. 120, Aufgabe 3–9):
D¨usen– Freigesetztes durchmesser Radon in %
0.37 80 83 83 85
0.51 75 75 79 79
0.71 74 73 76 77
1.02 67 72 74 74
1.40 62 62 67 69
1.99 60 61 64 66
3. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009
3(a) Geben Sie die Daten ein und speichern Sie diese in R unter radon.dat ab.
(b) Hat der ¨Offnungsdurchmesser der Duschk¨opfe einen Einfluss auf das durch- schnittlich freigesetzte Radon (α= 0.05)?
(c) Welcher p–Wert ergibt sich f¨ur die F–Statistik in (b)?
(d) Analysieren Sie die Residuen des Experiments.
(e) Wie lautet das 95%–Konfidenzintervall des Mittelwertes, wenn der Durchmes- ser 1.40 Einheiten betr¨agt?
(f) F¨uhren Sie eine Post-hoc-Analyse durch und plotten Sie die Konfidenzinterval- le. Man vergleiche die Resultate mit den Ergebnissen der paarweisen t–Tests.
(g) Was liefert der Kruskal–Wallis–Test?
6.) Fallbeispiel Luftschadstoffdaten (3. Teil) grazluft.dat; [R 2.7].
(a) F¨uhren Sie eine einfache Varianzanalyse f¨ur pm10 mit dem Faktor ort durch.
Hat der Faktor Messort einen Einfluss auf den PM10–Gehalt der Luft? An welchen Messorten ist der PM10–Gehalt auff¨allig hoch?
(b) Analysieren Sie die Residuen bzgl. pm10. Sind die Voraussetzungen f¨ur eine einfache ANOVA gegeben? Was liefern die nicht parametrischen Verfahren?
(c) Versuchen Sie gegebenenfalls eine Transformation f¨ur pm10 zu finden, welche die Varianz stabilisiert. Was kann man ¨uber die Verteilung der Residuen f¨ur die transformierte Variable sagen?
(d) Welche Methoden sind f¨ur den Vergleich der pm10–Daten bzgl. des Faktors periodead¨aquat? Vergleichen Sie die transformiertenperiode–Daten in ¨ahnli- cher Weise.
(e) Verfassen Sie einen kurzen Bericht Ihrer Analysen.
Herunter laden der Daten ¨uber die HomePage des Instituts: www.statistics.tugraz.at:
Speichern Sie alle ¨Ubungsaufgaben auf einem File ab: Angstat Nachname3.*
Ubermittlung der Files mit¨ Subject:Angstat an e-mail-Adresse statistik@tugraz.at.