4. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008
1Univ.-Prof. DI Dr. Ernst Stadlober
1.) [T] Student-t-Verteilung.
Man beweise Satz 4.5.3. (b):
Sind die Zufallsvektoren (Xi, Yi) unabh¨angig bivariat normalverteilt (Korrelations- parameter ρ= 0), dann ist die Zufallsvariable
T =√
n−2 R
√1−R2 ∼ tn−2–verteilt.
2.) [P] Korrelation.
Um zu testen, ob die Intelligenz X und die Ged¨achtnisleistung Y von Probanden korrelieren, wurden die Werte (xi, yi) f¨ur n = 10 ausgew¨ahlte Probanden ermittelt.
Paar i 1 2 3 4 5 6 7 8 9 10
xi 95 114 128 109 89 86 102 118 79 124 yi 84 90 73 91 98 76 112 101 94 100
(a) Man zeichne das Punktediagramm (xi, yi) und bestimme den Korrelations- koeffizienten rXY von Pearson. Man ermittle die R¨ange ri, si, zeichne das Punktediagramm (ri, si) und bestimme den Korrelationskoeffizienten rSP von Spearman.
(b) Man teste, ob die K¨orpergr¨oßen unabh¨angig voneinander sind, (i) unter An- nahme der Normalverteilung, (ii) unter Annahme einer stetigen Verteilung.
(c) Unter Annahme der Normalverteilung bestimme man ein 95%-Konfidenzinter- vall f¨ur den Parameter ρ.
3.) [TP] Test auf Symmetrie bei r×r–Kontingenztabellen.
(a) Man zeige, dass sich unter der Symmetriehypothese H0 :pij =pji f¨ur alle i, j folgende Likelihoodsch¨atzung f¨ur pij ergibt:
ˆ
pij = nij +nji 2n .
Wieviele Freiheitsgrade hat die dazugeh¨orige χ2–Testgr¨osse?
(b) Beim Vergleich von zwei Waschmitteln hat man folgende H¨aufigkeiten f¨ur die Einstufung in drei Qualit¨atsklassen erhalten:
Mittel 2
Mittel 1 schlecht mittel gut
schlecht 46 54 30
mittel 90 172 184
gut 18 220 230
4. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008
2F¨uhren Sie den Test auf Symmetrie durch. Wie w¨urden Sie entscheiden?
4.) [P] Kontingenztabellen.
(a) Die Ergebnisse einer Mathematik–Klausur und einer Pr¨ufung in Statistik von n = 180 Studenten sind wie folgt ausgefallen.
Punkte Mathematik Punkte Statistik 6 18 19-27 28-36 660 12 20 4
61-85 6 106 5
86-100 7 6 14
Zeichnen Sie den Assoziationsplot der Residuen und den Mosaikplot. Besteht ein signifikanter Zusammenhang zwischen den Ergebnissen des Mathematik- und Statistik-Tests?
(b) An einer Klinik werden die Erfolge und Misserfolge zweier verschiedener Ope- rationstechniken registriert.
Erfolg Misserfolg
Technik A 21 3
Technik B 15 5
Sind beide Techniken gleichwertig? Man verwende i. den χ2–Test mit Yates Korrektur und
ii. den exakten Test von Fisher (α= 0.05).
5.) [S] Verteilung des Korrelationskoeffizienten nach Bsp. 4.15 [R 2.6.0].
(a) Man erzeuge jeweils m = 32 Stichproben (xi, yi) aus einer zweidimensionalen Normalverteilung BN(0,0,1,1, ρ) mit den Stichprobenumf¨angen n = 10, 50 und ρ= 0, 0.5, 0,8 und berechne f¨ur jede Stichprobe den empirischen Korrela- tionskoeffizienten r(n, ρ). Fassen Sie die 6 Bl¨ocke von Korrelationskoeffizienten zu einer 32×6 Datenmatrix R zusammen.
(b) Stellen Sie die Verteilung der Korrelationskoeffizienten f¨ur n= 10 und n = 50 jeweils in Form von Histogrammen und Boxplotserien dar. Berechnen Sie auch die Mittelwerte, Standardabweichungen, Schiefe und Kurtosis.
(c) F¨uhren Sie die transformierten Variablen z = 12log 1+r1−r
ein und stellen sie deren Verteilung analog zu (b) dar.
(d) Was liefert die Analyse der entsprechenden Q–Q–Plots von z? Kann man von Normalverteilungen sprechen?
4. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008
36.) [C] Multiple lineare Regression bei Staubdaten GS 0506.sav [R 2.6.0].
Der File enth¨alt Luftschadstoffdaten aus Graz–S¨ud f¨ur die Wintersaison 2005/06 (Zeitraum: 1.10.2005 bis 31.3.2006).
(a) Speichern Sie den SPSS-Datenfile in ihr working-directory und lesen Sie dann den SPSS-Datenfile wie folgt ein:
> setwd("C:/...")
> library(foreign) # Notwendig, um SPSS-Files einlesen zu k¨onnen
> daten <- read.spss("Staubdaten_GS_0506.sav")
und analysieren Sie die eindimensionalen Verteilungen der Variablenpm10, no, nox,co, so2, o3 durch entsprechende Graphiken und Kenngr¨oßen.
(b) Berechnen Sie f¨ur alle Paare der in (a) angegebenen Merkmale die Korrelati- onskoeffizienten rXY und stellen Sie die Zusammenh¨ange durch eine Scatter- plotmatrix mit Gl¨attungsfunktionen dar.
(c) Analysieren Sie folgende Regressionsmodelle f¨ur pm10:
i. einfaches Regressionsmodell mit der Variablen x=nox bzw. x=co, ii. multiples lineares Regressionsmodell mit zwei Variablen:
x1 =co, x2 =so2.
iii. multiples lineares Regressionsmodell mit drei Variablen:
x1 =co, x2 =so2, x3 =o3.
(d) Interpretieren Sie die Ergebnisse bzgl. der Bestimmtheitsmaße radj2 , der Stan- dardabweichung ˆσ und der Verteilung der Residuen.
(e) Fassen Sie die Ergebnisse in Form eines Dokuments (max. 6 Seiten) zusammen.
Hinweis:
Speichern Sie Ihre ¨Ubungsaufgaben (mit entsprechenden Kommentaren) unter folgenden File–Namen ab:
Statistik Nachname1aufgabenr.* z.B. Statistik schiefer41.pdf
und ¨ubermitteln Sie die Files per e-mail mit dem Betreffstat an statistik@tugraz.at.