• Keine Ergebnisse gefunden

2. ¨ Ubungsblatt 506.715 Angewandte Statistik, WS 2009/2010

N/A
N/A
Protected

Academic year: 2021

Aktie "2. ¨ Ubungsblatt 506.715 Angewandte Statistik, WS 2009/2010"

Copied!
3
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

2. ¨ Ubungsblatt 506.715 Angewandte Statistik, WS 2009/2010

1

Univ.-Prof. DI Dr. Ernst Stadlober

1.) [T] Freiheitsgrad der Statistik TW des Welch–Tests.

Die Teststatistik

TW = X−Y qS2X

n + SmY2

as∼tν falls µD = 0,

des Welch–Tests hat den Freiheitsgrad ν=

S2 X

n +SmY22 1

n−1

S2 X

n

2

+m−11 S2

Y

m

2

Man zeige, dass

ν6n+m−2.

2.) Simulation von Stichproben, Transformation zur Normalverteilung; [R 2.9].

(a) Erzeugen Sie jeweils n= 64 bzw.n= 128 Stichproben aus der Gamma-Verteilung mit den Shape-Parametern a= 2,5,10 und der Rate λ= 1 (f(x) =xa−1e−x, x > 0), sowie aus der Standard-Normal N(0,1)–Verteilung (Aufruf f¨ur n Gamma-verteilte Zufallszahlen: rgamma(n,shape=a, rate=1)). Speichern Sie diese 4 Stichprobenvek- toren auf die Datenfiles simgam64 und simgam128 ab. Stellen Sie jedes Merkmal mittels Boxplot,Steam-Leaf-Display undHistogrammdar. Berechnen Sie statistische Kenngr¨oßen, f¨uhren Sie Tests auf Normalverteilung durch und stellen Sie die Situation durch Q-Q-Plots mit der N(0,1)-Verteilung als Referenz dar.

(b) Erstellen Sie f¨ur die Gamma–verteilten Stichproben die Q-Q-Plots bzgl. der Gamma(a,1)–

Verteilungen mit dem Befehl qqmath().

(c) Transformieren Sie die Stichproben (x1, . . . , xn) aus der Gamma-Verteilung nach der i. Fisher–Transformationyi =√

4xi−√ 4a−1, ii. Wilson–Hilferty–Transformationwi=

xi

a

1/3

−µ

/σmitµ= 1−9a1,σ= q1

9a

zu ann¨aherndN(0,1)–verteilten Stichproben und erweitern Sie die Datenfiles um die- se vier transformierten Vektoren. Analysieren Sie die Verteilung der transformierten Merkmale wie in (a).

(d) Fassen Sie Ihre Ergebnisse und Interpretationen in Form einespdf–Dokuments (max.

4 Seiten) zusammen.

3.) [T] Einfache lineare Regression.

Sei Yii N(µi, σ), i= 1, . . . , n, mit

µi12xi12x¯+β2(xi−x) =¯ α+β2ti. Man l¨osezwei der folgenden Aufgaben.

(2)

2. ¨ Ubungsblatt 506.715 Angewandte Statistik, WS 2009/2010

2

(a) Man berechne explizit die Hat–Matrix H= (hij) =X(XTX)−1XT. (b) Man zeige, dass folgendes gilt:

ˆ α∼N

α, σ

√n

, βˆ2 ∼N

β2, σ

√St

und

ˆ

α und βˆ2 sind unabh¨angige Zufallsvariable. F¨ur ˆβ1 = ˆα−βˆ2x¯ gilt

βˆ1 ∼N

β1, σ s

1 n+x¯2

St

 und ρ( ˆβ1,βˆ2) =− x¯ qSt

n + ¯x2 .

(c) Sei Ri=Yi−µˆi =Yi−αˆ−βˆ2ti dasi–te Residuum. Man zeige, dass E(Ri) = 0, Cov(Ri,α) =ˆ Cov(Ri,βˆ2) = 0,

Ri ∼ N

0, σ s

1− 1 n− t2i

St

=N 0, σp

1−hii ,

ρ(Ri, Rj) = − hij

p(1−hii)(1−hjj).

4.) Lineare Regressionsanalyse der Baum–Daten baum.txt; [R 2.9].

Die Datei baum.txt enth¨alt 3 Messungen an n = 31 Kirschb¨aumen aus dem Allegheny National Forest, Pennsylvania. Die erste Spalte gibt den DurchmesserdinInches =(0.0254 Meter), gemessen in einer H¨ohe von 1.37 Meter, die zweite die H¨ohe h in Feet (=0.3048 Meter) und die dritte das Volumenvin cubic feetan. Auf Grund der Messung von H¨ohe und Durchmesser m¨ochte man das Volumen eines Baumes vorhersagen.

(a) Vergeben Sie Labels und rechnen Sie die Einheiten in Meter (Kubikmeter) um. Ana- lysieren Sie die Daten mit geeigneten graphischen Verfahren.

(b) Stellen Sie ein (lineares) Regressionsmodell f¨urv in Abh¨angigkeit von d und h auf.

Erstellen Sie Residuenplots und beurteilen Sie die Resultate.

(c) Der geometrische Zusammenhang zwischen den Variablen d,hund vist durch v= π

12d2h (1)

gegeben (unter der Annahme der Baum habe eine konische Form). Welches lineare Modell w¨are geeignet diesen Zusammenhang zu beschreiben?

Hinweis: Man logarithmiere die Gleichung (1).

(3)

2. ¨ Ubungsblatt 506.715 Angewandte Statistik, WS 2009/2010

3

5.) [T] Lineare und quadratische Formen von normalverteilten Gr¨oßen Sei Yi iid∼ N(µ, σ),i= 1, . . . , n.

Zeigen Sie

√n(Y −µ) und

n

X

i=1

(Yi−Y)2 sind unabh¨angige Zufallsvariable und

√n(Y −µ)∼N(0, σ),

n

X

i=1

(Yi−Y)2 ∼σ2χ2n−1. Man benutze dazu Satz 3.3.1 und Satz 3.3.2aus dem Skriptum.

6.) Fallbeispiel Luftschadstoffdaten (2. Teil) grazluft; [R 2.9].

(a) Erstellen Sie ein Regressionsmodell f¨ur pm10 in Abh¨angigkeit von no,no2 und dem Faktor periode.

(b) Analysieren Sie die standardisierten Residuen mittels Histogramm, Q–Q-Plot und Scatterplot stdres gegen vorhersage. Erstellen Sie eine Graphik (4 Plots) zur Be- urteilung der Residuen mit dem Befehl plot(lm(pm10∼no+no2+periode)).

(c) Welches Bestimmtheitsmaß radj2 und welche Streuung ˜σ erreicht man f¨ur das Modell?

Wo tritt das gr¨oßte negative (positive) Residuum auf? Gibt es Ausreißer? Ist die Periode von Bedeutung?

Herunter laden der Daten ¨uber die HomePage des Instituts: www.statistics.tugraz.at Speichern Sie die gesamten ¨Ubungen in einem pdf-Filemit folgendem Namen ab:

Angstat Nachname1* z.B. Angstat Schiefer2.pdf

und ¨ubermitteln Sie einen File pro Gruppe mit Subject: Angstat an die e-mail-Adresse statistik@tugraz.at.

Transfer der Files bis sp¨ atestens: Fr. 20. 11. 2009, 16.00 Uhr

Besprechungstermin: Mo. 23. 11. 2009, 9.00–10.45, SR Statistik

Referenzen

ÄHNLICHE DOKUMENTE

(b) Man erzeuge Box-Plot-Serien und (Fehlerbalken in SPSS) f¨ ur die Merkmale fvc und fev1 gemeinsam, aber getrennt nach den Kategorien jung alt und gr kl..

(b) F¨ uhren Sie eine einfache Varianzanalyse in R mit den Befehlen gem¨ aß Hand-Out Abschnitt 4.1-4.3 durch?. (c) Welche Parametrisierung liefert der Aufruf

(b) Man erzeuge Box-Plot-Serien und Fehlerbalken f¨ur die Merkmale fvc l und fe l gemeinsam, aber getrennt nach den Kategorien jung alt und gr kl.. (2 Serien; Op- tionen:

Man benutze da- zu das Men¨ u Analysieren (Analyze) −→ Regression −→ Linear mit den Einstellun- gen Abh¨ angige Variable (Dependent) d syst, unabh¨ angige Variable (Independent)

(a) Erstellen Sie einen Scatterplot der beiden Variablen und versuchen Sie, die Abh¨angigkeit der beiden Variablen durch eine Regressionsanalyse zu beschreiben.. (b) ¨ Uberpr¨ ufen

(b) Stellen Sie ein (lineares) Regressionsmodell f¨ ur Zeit in Abh¨angigkeit von Dosis und Druck auf. Erstellen Sie Residuenplots und beurteilen Sie die Resultate. Teil) grazluft;

(b) Hat der ¨ Offnungsdurchmesser der Duschk¨ opfe einen Einfluss auf das durch- schnittlich freigesetzte Radon (α = 0.05)?. (c) Welcher p–Wert ergibt sich f¨ ur die F –Statistik

(b) F¨ uhren Sie eine doppelte Varianzanalyse mit Wechselwirkung f¨ ur pm10 mit den Faktoren ort und periode durch (siehe Handout zu Bsp. 6.1).. (c) Was kann man ¨ uber