• Keine Ergebnisse gefunden

Lineare Regression: Tests

N/A
N/A
Protected

Academic year: 2022

Aktie "Lineare Regression: Tests"

Copied!
25
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Lineare Regression: Tests

Statistik (Biol./Pharm./HST) – Herbst 2013

TexPoint fonts used in EMF.

Read the TexPoint manual before you delete this box.: AAAAAAAAAA

(2)

Ersatz: Cooper & Shuttle

12-Minuten Test nach Cooper (1968)

20m-Shuttle-Test nach Leger (1982)

(3)

𝛽 = −19.460 𝛽1

= 5.86 𝜎 = 5.4

Methode der kleinsten Quadrate

(4)

y = 45

y = -19.46 + 5.86 * 11

𝛽 = −19.460 𝛽1

= 5.86 𝜎 = 5.4

Wie genau stimmen Parameter?

Wie genau stimmt Vorhersage?

(5)

t-Test in der Linearen Regression: 1/2

1. Modell:

Yi = ¯0 + ¯1xi + Ei; E1; : : : ; En iid N(0; ¾2):

2. Nullhypothese: H0 : ¯1 = 0

Alternative: HA : ¯1 6= 0 (Es wird hier Äublicherweise ein zwei-seitiger Test durchgefÄuhrt)

3. Teststatistik:

T = beobachtet ¡ erwartet

geschÄatzter Standardfehler = ¯^1 ¡ 0 c

s.e.( ^¯1): Dabei ist der geschÄatzte Standardfehler

c

s.e.( ^¯1) =

qV ar( ^d ¯1) = ¾^ pPn

i=1(xi ¡ x¹n)2: Verteilung der Teststatistik unter H0: T » tn¡2

(6)

t-Test in der Linearen Regression: 2/2

4. Signi¯kanzniveau: ®

5. Verwerfungsbereich fr die Teststatistik:

K = (¡1;¡tn¡2;1¡®

2 ] [ [tn¡2;1¡®

2 ; 1)

6. Testentscheid: UberprÄÄ ufe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt.

(7)

Lineare Regression in R

6

Modell: 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝐸𝑖, 𝐸𝑖~𝑁 0,𝜎2 𝑖. 𝑖. 𝑑

Modell: 𝑌𝑖 = −19.46+ 5.86𝑥𝑖 + 𝐸𝑖, 𝐸𝑖~𝑁 0,5.432 𝑖. 𝑖. 𝑑

P-Wert:

Angenommen 𝛽1 = 0;

wie wa. ist Beobachtung oder etwas extremeres?

Beobachtete Teststatistik im Test 𝐻0: 𝛽1 = 0 vs.

𝐻𝐴: 𝛽1 ≠ 0

Standardfehler von 𝛽1 Approx. 95%-VI:

5.86 ± 2 ∗ 0.41 Exaktes 95%-VI:

5.86 ± 1.99 ∗ 0.41

Freiheitsgrade: n – (Anz. 𝛽’s) = 91 – 2 = 89

𝑡89;0.975

(8)
(9)

approx. 95%-VI: [-29; -10]

approx. 95%-VI: [5.0; 6.7]

(10)

45

(11)

45

95%

Vertrauensintervall:

[43.8; 46.2]

Für den Erwartungswert von VO2max bei vmax=11

(12)

45

95%

Vorhersageintervall:

[34; 56]

Für eine Einzelbeobachtung von VO2max bei vmax=11

(13)

“Essentially, all models are wrong,

but some are useful.“

George E.P. Box

(14)

Residuenanalyse: Wie gut stimmt das Modell ?

13

𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖 ; 𝜀𝑖 ~ 𝑁 0, 𝜎2 𝑖𝑖𝑑

Form des funktionellen Zusammenhangs

Varianz der Fehler ist konstant

Fehler sind normalverteilt

Einfache Regression:

Streudiagramm

Multiple Regression:

Tukey-Anscombe Plot

QQ-Plot der Residuen

(15)

Streudiagramm bei einfacher linearer Regression

14

0.0 0.5 1.0 1.5 2.0 2.5 3.0

24681012

x

y OK

(16)

Streudiagramm bei einfacher linearer Regression

15

Systematischer Fehler Krümmung:

𝑦 = 𝑏0 + 𝑏1𝑥 + 𝑏2𝑥2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

051015202530

x

y

(17)

Streudiagramm bei einfacher linearer Regression

16

Fehlervarianz nicht konstant

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0102030

x

y

(18)

Beispiel für guten Tukey-Anscombe Plot

17

(19)

Beispiele für schlechte Tukey-Anscombe Plots

18

Systematischer Fehler Fehlervarianz nicht konstant

(20)

Residuenanalyse: QQ-Plot

19

S-Form

Krümmung OK

Gerade

(21)

QQ-Plots: Streuung von “guten” QQ-Plots (𝒏 = 𝟑𝟎, 𝑹𝒊~𝑵 𝟎, 𝟏 )

20

(22)

Falls Residuenplots schlecht

Oft helfen Transformationen von x oder y

Achtung: Vorsicht beim Interpretieren der neuen Parameter

Bsp: log 𝑦 statt 𝑦

Vorher: 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖

Wenn x durch x+1 ersetzt wird, ändert sich 𝑌 im Mittel zu 𝑌 + 𝛽1

Nachher:

log 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖 ↔ 𝑌𝑖 = exp (𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖)

Wenn x durch x+1 erstetzt wird, ändert sich 𝑌 “im Mittel” zu 𝑌 ∗ exp (𝛽1)

21

(23)

Bsp: Ohne Log-Transformation

22

OK

log 𝑦 𝑦

(24)

Residuenanalyse: Supermarkt

23

OK OK

(25)

Residuenanalyse: Beep-Test

24

OK OK

Referenzen

ÄHNLICHE DOKUMENTE

Testentscheid: Überprüfe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich

 Bisher: Population wird mit einer Verteilung beschrieben Bsp: Medikament wirkt mit 30% Wa.. hängt von Dosis

Testentscheid: Überprüfe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt.... “Essentially, all models

 Konvention: Falls eine Wechselwirkung im Modell ist, müssen auch die beteiligten Haupteffekte im Modell sein. Wechselwirkung: Notation

Testentscheid: UberprÄ Ä ufe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt... Testentscheid: UberprÄ Ä ufe, ob der beobachtete Wert der Teststatistik

Testentscheid: UberprÄ Ä ufe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt.... Beispiel für guten

 Neu: Population wird mit einer Verteilung beschrieben, die von einem (oder mehreren) Parametern abhängt?.

Testentscheid: UberprÄ Ä ufe, ob der beobachtete Wert der Teststatistik im