• Keine Ergebnisse gefunden

2. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009

N/A
N/A
Protected

Academic year: 2021

Aktie "2. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009"

Copied!
3
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

2. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009

1

Univ.-Prof. DI Dr. Ernst Stadlober

1.) [T] Charakterisierung von Projektionsmatrizen.

Beweisen Sie Lemma 3.2.2 (Skriptum):

(a) Die Hat–Matrix H = X(XTX)1XT ist symmetrisch (H = HT) und idempotent (H=H2).

(b) Sei H eine beliebige n×n–Matrix und L der Spaltenraum von H, dann ist H eine Projektionsmatrix (auf L), wenn H symmetrisch und idempotent ist.

2.) Simulation von Stichproben, Transformation zur Normalverteilung; [R 2.7].

(a) Erzeugen Sie jeweils einen Datenfile mit n = 32,64 und 128 Stichproben aus der Gamma-Verteilung mit den Parametern a= 3,5,10 und λ= 1 (f(x) =xa−1e−x, x >

0), sowie aus der Standard-Normal N(0,1)–Verteilung. Speichern Sie diese 4 Varia- blen auf die Datenfiles simgam32, simgam64 und simgam128 ab. Stellen Sie jedes Merkmal mittels Boxplot, Steam-Leaf-Display und Histogramm dar. Berechnen Sie statistische Kenngr¨oßen, f¨uhren Sie Tests auf Normalverteilung durch und stellen Sie die Situation durch Q-Q-Plots mit der N(0,1)-Verteilung als Referenz dar.

(b) Erstellen Sie f¨ur die Gamma–verteilten Stichproben die Q-Q-Plots bzgl. der Gamma(a,1)–

Verteilungen mit dem Befehlqqmath().

(c) Transformieren Sie die Stichproben (x1, . . . , xn) aus der Gamma-Verteilung nach der i. Fisher–Transformationyi =√

4xi−√ 4a−1, ii. Wilson–Hilferty–Transformationwi

¡xi

a

¢1/3

−µ´

/σmitµ= 1−91a,σ= q1

9a

zu ann¨ahernd N(0,1)–verteilten Stichproben und erweitern Sie die Datenfiles um diese sechs Variablen. Analysieren Sie die Verteilung der transformierten Merkmale wie in (a).

(d) Fassen Sie Ihre Ergebnisse und Interpretationen in Form einespdf–Dokuments (max.

4 Seiten) zusammen.

3.) [T] Einfache lineare Regression.

Sei Yii N(µi, σ), i= 1, . . . , n, mit

µi12xi12x¯+β2(xi−x) =¯ α+β2ti. Man l¨ose zwei der folgenden Aufgaben.

(a) Man berechne explizit die Hat–Matrix H= (hij) =X(XTX)1XT. (b) Man zeige, dass folgendes gilt:

ˆ α∼N

µ α, σ

√n

, βˆ2 ∼N µ

β2, σ

√St

und

ˆ

α und βˆ2 sind unabh¨angige Zufallsvariable.

(2)

2. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009

2

F¨ur ˆβ1 = ˆα−βˆ2x¯ gilt βˆ1 ∼N

β1, σ s

1 n+x¯2

St

 und ρ( ˆβ1,βˆ2) =− x¯ qSt

n + ¯x2 .

(c) Sei Ri=Yi−µˆi =Yi−αˆ−βˆ2ti dasi–te Residuum. Man zeige, dass E(Ri) = 0, Cov(Ri,α) =ˆ Cov(Ri,βˆ2) = 0,

Ri ∼ N

0, σ s

1− 1 n− t2i

St

=N³ 0, σp

1−hii´ ,

ρ(Ri, Rj) = − hij

p(1−hii)(1−hjj).

4.) Lineare Regressionsanalyse von Blutdruck–Daten (Riedwyl, 1997); [R 2.7].

Die Daten k¨onnen von der Homepage als Datei blutdruck.txt heruntergeladen werden.

Sie enth¨alt Daten von n= 53 Patienten, die w¨ahrend einer Operation erhoben wurden.

Die Patienten erhalten w¨ahrend der Operation ein blutdruckerh¨ohendes Medikament einer bestimmten Dosis [mg]. Weiters wird der mittlere systolische Blutdruck Druck [mmHg]

w¨ahrend der Operation bestimmt. Als Zielvariable dient die ErholungszeitZeit, das ist die Zeit [min], nach Absetzen des Medikaments bis zum Erreichen eines systolischen Blutdrucks von 100 mmHg. Auf Grund derDosisund desDrucksm¨ochte man dieZeiteines Patienten vorhersagen.

(3)

2. ¨ Ubungsblatt 506.051 Angewandte Statistik, WS 2008/2009

3

(a) Analysieren Sie die Daten mit geeigneten graphischen Verfahren.

(b) Stellen Sie ein (lineares) Regressionsmodell f¨ur Zeitin Abh¨angigkeit vonDosisund Druck auf. Erstellen Sie Residuenplots und beurteilen Sie die Resultate. Was kann man ¨uber die G¨ute eines solchen Modells sagen?

(c) Welches lineare Modell w¨urden sie f¨ur die Zielvariablelog(Zeit) vorschlagen?

Hinweis: Es k¨onnen auch transformierte unabh¨angige Variablen verwendet werden.

5.) [T] Lineare Modelle.

Seien Yii N(µi, σ),i= 1, . . . , n. Man betrachte das ModellL1

µi12xi, i= 1, . . . , n−1 ; µn3 mit Konstanten x1, . . . , xn1. Man l¨osezwei der folgenden Aufgaben.

(a) Man zeige, dass L1 linear ist, gebe die Design Matrix an und finde eine Orthogonal- basis f¨ur L1.

(b) Wie lauten die Sch¨atzer ˆβ1, ˆβ2, ˆβ3 und deren Verteilung?

(c) Wie lautet der Sch¨atzer ˜σ2 und seine Verteilung?

(d) Man gebe ein Konfidenzintervall f¨ur den Parameter β3 an.

(e) Sei xn ∈ R beliebig. Man leite einen Test f¨ur die Hypothese H0312xn unter L1 her.

(f) Wie lautet der F–Test f¨ur die Hypothese H0013 unter L1? 6.) Fallbeispiel Luftschadstoffdaten (2. Teil) grazluft; [R 2.7].

(a) Erstellen Sie ein Regressionsmodell f¨ur pm10 in Abh¨angigkeit von no,no2 und dem Faktor periode.

(b) Analysieren Sie die standardisierten Residuen mittels Histogramm, Q–Q-Plot und Scatterplot stdres gegen vorhersage. Erstellen Sie eine Graphik (4 Plots) zur Be- urteilung der Residuen mit dem Befehl plot(lm(pm10∼no+no2+periode)).

(c) Welches Bestimmtheitsmaß radj2 und welche Streuung ˜σ erreicht man f¨ur das Modell?

Wo tritt das gr¨oßte negative (positive) Residuum auf? Gibt es Ausreißer? Ist die Periode von Bedeutung?

Herunter laden der Daten ¨uber die HomePage des Instituts: www.statistics.tugraz.at:

Speichern Sie alle ¨Ubungsaufgaben auf einem Fileab: Angstat Nachname2.*

und ¨ubermitteln Sie die Files mitSubject:Angstatan die e-mail-Adresse statistik@tugraz.at.

Transfer der Files bis sp¨atestens: Di. 25. 11. 2008, 13.00 Uhr

Besprechungstermin: Mi. 26. 11. 2008, 8.30–10.00, SR Statistik

Referenzen

ÄHNLICHE DOKUMENTE

Man benutze da- zu das Men¨ u Analysieren (Analyze) −→ Regression −→ Linear mit den Einstellun- gen Abh¨ angige Variable (Dependent) d syst, unabh¨ angige Variable (Independent)

(a) Erstellen Sie einen Scatterplot der beiden Variablen und versuchen Sie, die Abh¨angigkeit der beiden Variablen durch eine Regressionsanalyse zu beschreiben.. (b) ¨ Uberpr¨ ufen

(d) Aufruf des Men¨ us Analysieren −→ Nichtparametrische Tests −→ K unabh¨ ang- ige Stichproben Tests: Kruskal-Wallis-H Optionen Deskriptive Statistik, Quar- tile.. (e)

(b) F¨ uhren Sie eine einfache Varianzanalyse in R mit den Befehlen gem¨ aß Hand- Out durch?. (c) Welche Parametrisierung liefert der Aufruf

(b) Hat der ¨ Offnungsdurchmesser der Duschk¨ opfe einen Einfluss auf das durch- schnittlich freigesetzte Radon (α = 0.05)?. (c) Welcher p–Wert ergibt sich f¨ ur die F –Statistik

(e) Die zwei Dreifachwechselwirkungen ABC und ABD haben offensichtlich große Effekte. Zeichnen Sie einen W¨ urfel in den Faktoren A, B, C mit den durch- schnittlichen Ertr¨ agen

(b) F¨ uhren Sie eine doppelte Varianzanalyse mit Wechselwirkung f¨ ur pm10 mit den Faktoren ort und periode durch (siehe Handout zu Bsp. 6.1).. (c) Was kann man ¨ uber

(b) Bilden Sie Box-Plot-Serien und Fehlerbalken f¨ur die Merkmale fvc l und fe l ge- meinsam, aber getrennt nach den Kategorien jung alt und gr kl.. (2 Serien; Optio- nen: