• Keine Ergebnisse gefunden

2. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002

N/A
N/A
Protected

Academic year: 2021

Aktie "2. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002"

Copied!
3
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

2. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002

1

Univ.-Prof. DI Dr. Ernst Stadlober

1.) Charakterisierung von Projektionsmatrizen.

Beweisen Sie Lemma 3.2.2(Skriptum):

(a) Die Hat–Matrix H =X(XTX)−1XT ist symmetrisch (H =HT) und idempo- tent (H =H2).

(b) Sei H eine beliebige n×n–Matrix und L der Spaltenraum von H, dann ist H eine Projektionsmatrix (auf L), wenn H symmetrisch und idempotent ist.

2.) Simulation von Stichproben, Transformation zur Normalverteilung,[SPSS 9.0]

(a) Erzeugen Sie einen Datenfile mitn = 40 (n= 80) Stichproben aus der Gamma- Verteilung mit den Parametern a = 2,5,10 und λ = 1 und aus der N(0,1)–

Verteilung. Speichern Sie diese 4 Variablen auf die Datenfiles simgam40.sav und simgam80.sav ab. Stellen Sie jedes Merkmal mittels Boxplot, Stengel- Blatt-Diagrammund Histogrammdar. Berechnen Sie statistische Kenngr¨oßen, f¨uhren Sie Tests auf Normalverteilung durch und stellen Sie die Situation durch Q-Q-Plots mit derN(0,1)-Verteilung als Referenz dar.

(b) Transformieren Sie die Stichproben (x1, . . . , xn) nach der i. Fisher–Transformation yi =√

4xi−√

4a−1, ii. Wilson–Hilferty–Transformation wi =

x

i

a

1/3

−µ

/σ mit µ = 1− 9a1, σ =q9a1

zu ann¨ahernd N(0,1)–verteilten Stichproben und erweitern Sie die Datenfiles um diese sechs Variablen. Analysieren Sie die Verteilung der transformierten Merkmale wie in (a).

Hinweis: Definieren Sie in SPSS eine neue Datei mit einer (k¨unstlichen) Va- riablen, die aus 40 (80) Werten besteht. Gehen Sie dann in das Men¨u Trans- formieren −→ Startwert f¨ur Zufallszahlen und setzen den Startwert auf Ihre Matrikelnummer. F¨uhren Sie dann im Untermen¨u Berechnen... die Transfor- mationen RV.GAMMA(a,1) (a = 2,5,10) und RV.NORMAL(0,1) aus. Damit haben Sie die gew¨unschten Stichproben erzeugt.

(c) Fassen Sie Ihre Ergebnisse und Interpretationen in Form eineswinword–Dokuments (max. 4 Seiten) zusammen.

3.) Einfache lineare Regression.

Sei Yii N(µi, σ), i= 1, . . . , n, mit

µi12xi12x¯+β2(xi−x) =¯ α+β2ti. Man l¨ose zumindest zweider folgenden Aufgaben.

(2)

2. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002

2

(a) Man berechne explizit die Hat–Matrix H= (hij) =X(XTX)−1XT. (b) Man zeige, dass ˆα ∼ N(α,σn), ˆβ2 ∼ N(β2,σS

t) gilt und dass ˆα,βˆ2 un- abh¨angige Zufallsvariablen sind. F¨ur ˆβ1 = ˆα−βˆ2x¯ gilt ˆβ1 ∼Nβ1, σqn1 +x¯S2

t

und

ρ( ˆβ1,βˆ2) =− x¯

qSt

n + ¯x2.

(c) Sei Ri =Yi−µˆi =Yi−αˆ−βˆ2ti dasi–te Residuum. Man zeige, daß E(Ri) = 0, Cov(Ri,α) =ˆ Cov(Ri,βˆ2) = 0 und

Ri ∼N

0, σ

s

1− 1 n − t2i

St

=N(0, σq1−hii).

und

ρ(Ri, Rj) = − hij

q(1−hii)(1−hjj) .

4.) Yoga–Daten aus ¨Ubungsblatt 1.5, einfache lineare Regression. [SPSS 9.0]

Man untersuche, ob der Effekt der Yoga– ¨Ubung (Differenz der systolischen Blut- druckwerte d syst) vom Ausgangswert (systolischer Blutdruck vorher bd v sys) abh¨angt.

(a) Erstellen Sie einen Scatterplot der beiden Variablen und versuchen Sie, die Abh¨angigkeit der beiden Variablen durch eine Regressionsanalyse zu beschrei- ben. Man benutze dazu das Men¨u Analysieren (Analyze) −→ Regression −→

Linear mit den Einstellungen Abh¨angige Variable (Dependent) d syst, un- abh¨angige Variable (Independent) bd v sys, Speichern (Save) Vorhergesagte Werte (Predicted Values): Nicht standardisiert (Unstandardized),Residuen (Re- siduals): standardisiert (Standardized). Die Werte werden als pre 1, zre 1 im Datenfile abgespeichert.

(b) ¨Uberpr¨ufen Sie die standardisierten Residuen auf Normalverteilung und erstel- len Sie den Scatterplotzre 1gegen pre 1.

(c) Falls Ausreißer zu erkennen sind, f¨uhren Sie die gesamte Analyse auch ohne Ausreißer durch und vergleichen Sie die Ergebnisse.

5.) Lineare und quadratische Formen von normalverteilten Gr¨oßen Sei Yi iid∼ N(µ, σ), i= 1, . . . , n.

Zeigen Sie, dass

√n(Y −µ) und

n

X

i=1

(Yi −Y)2

(3)

2. ¨ Ubungsblatt 507.051 Angewandte Statistik, SS 2002

3

unabh¨angige Zufallsvariable sind, und dass folgende Verteilungseigenschaften gelten:

√n(Y −µ)∼N(0, σ) und Pni=1(Yi−Y)2 ∼σ2χ2n−1. Man benutze dazu Satz 3.3.1 und Satz 3.3.2 aus dem Skriptum.

6.) Fallbeispiel Luftschadstoffdaten (2. Teil) luft 2002.sav; [SPSS 9.0].

Vom Merkmal o3 (Ozon) liegen aus einigen Orten keine Beobachtungen vor. Be- trachten wiro3 als unabh¨angige Variable undso2,co, no,no2als abh¨angige Varia- ble, dann k¨onnen wir die fehlenden Werte (missing values) von 20 der 48 Datens¨atze mit Hilfe des Kleinste–Quadrate–Sch¨atzers βˆ approximieren. Die fehlenden Werte werden von den vollst¨andigen n= 26 Datens¨atzen approximiert durch

o3 = ˆˆ β0+ ˆβ1so2 + ˆβ2no+ ˆβ3no2 + ˆβ4co+ ˆβ5staub .

(a) F¨uhren Sie die oben angegebene Regessionsanalyse durch. Speichern Sie die nicht standardisierten Vorhersagewerte pre 1von o3 und die standardisierten Residuenzre 1. Definieren Sie eine neue Variable o3 1 ¨uber das Men¨uTrans- form −→ Compute, wobei o3 1 = max(pre 1,0), falls o3 missing (d.h. sys- mis(o3)), ansonsten gilt o3 1 = o3. Speichern Sie den modifizierten Datenfile alsluft2.sav ab.

(b) Wie lauten die Vorhersagewerte f¨ur Augsburg und Ingolstadt? Wie hoch ist das BestimmtheitsmaßR2 und die Streuung ˜σder Regression? ¨Uberpr¨ufen Sie die standardisierten Residuen auf Normalverteilung (Q–Q–Plot, K–S-Test). Wo tritt das gr¨oßte negative (positive) Residuum auf? Erstellen Sie einen Scatter- plot zre 1gegen pre 1.

Hinweise: Zusammenarbeit in Zweiergruppen ist erw¨ unscht.

Die Daten sind unter www.cis.tu-graz.ac.at/stat/angstat/data

zu finden. Speichern sie Ihre ¨Ubungsaufgaben (mit entsprechenden Kommentaren) unter folgenden File–Namen ab: Nachname2aufgabenr.*z.B.stampf21.doc maximal 8 Zeichen!

und ¨ubermitteln sie die Files ¨uber anonymous ftp wie folgt an uns:

1. Starten des ftp–Programms (beispielweise das von Onnet angebotene) 2. Name des Rechners eingeben: statistik.tu-graz.ac.at

3. Username: anonymous 4. Password: guest

5. Ablegen der Daten unter statistik.tu-graz.ac.at/incoming/angstat

Transfer der Files bis sp¨ atestens: Mi. 15. 5. 2002, 20.00 Uhr

Besprechungstermin: Do. 16. 5. 2002, 15.00 SR C208

Referenzen

ÄHNLICHE DOKUMENTE

Ubungen zur Linearen Algebra I ¨ Bergische Universit¨ at Wuppertal. Blatt

Die Metrik wird im Be- weis nie erw¨ ahnt, aber die Begriffe von offenen Umgebungen und Konvergenz von Folgen m¨ ussen klar definiert sein, und dazu braucht man die ¨ Aquivalenz

Wir m¨ ochten also verstehen, was in Beispiel 1 bei x = 0 schief geht, und wie das im Allgemeinen vermieden werden kann, um die Formel (1) zu beweisen. Wenn wir wirklich nur

(c) bestimme, wie viele Sekunden vor Beginn des Experiment der K¨ orper frei fallengelassen wurde, um die berechnete Anfangsgeschwindigkeit erreichen zu k¨ onnen.. Stelle

(c) Aufruf des Men¨ us Analysieren −→ Allgemeines lineares Modell −→ univariat, Abh¨ angige Variable fvc l, Feste Faktoren al kl, Plots horizontale Achse, Post Hoc siehe

(b) Aufruf des Men¨ us Analysieren −→ Allgemeines Lineares Modell −→ Univariat, Ab- h¨ angige Variable so2, Feste Faktoren regzif, fdat, Modell.... ges¨

Man benutze da- zu das Men¨ u Analysieren (Analyze) −→ Regression −→ Linear mit den Einstellun- gen Abh¨ angige Variable (Dependent) d syst, unabh¨ angige Variable (Independent)

Man benutze da- zu das Men¨ u Analysieren (Analyze) −→ Regression −→ Linear mit den Einstellun- gen Abh¨ angige Variable (Dependent) d syst, unabh¨ angige Variable (Independent)