• Keine Ergebnisse gefunden

Wachstumskurven Mixed Effects Models:

N/A
N/A
Protected

Academic year: 2022

Aktie "Wachstumskurven Mixed Effects Models:"

Copied!
25
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Mixed Effects Models:

Wachstumskurven

(2)

 Wiederholte Messungen (z.B. Wachstumskurven):

Korrelierte Beobachtungen

 Random Intercept Model (RI)

 Random Intercept and Random Slope Model (RIRS)

Überblick

(3)

0 2 4 6 8 10

100120140

Gewicht [kg]

Wdh: Lineare Regression

 Bsp: Kraftzuwachs durch Krafttraining

 Für eine einzelne Person:

𝑦𝑗 = 𝛽0 + 𝛽1𝑥𝑗 + 𝜀𝑗 , 𝜀𝑗~𝑁 0, 𝜎2 𝑖. 𝑖. 𝑑

“fixe” Effekte

(4)

Viele Personen: Wiederholte Messungen

 Problem:

Die Parameter (Achsenabschnitt und Steigung) jeder Person sind leicht unterschiedlich

 Wie beschreibt man diese Situation möglichst kompakt ?

(5)

0 2 4 6 8 10

100140180

Woche

Gewicht [kg]

Zurück zum Krafttraining

Jede Person hat eine

unterschiedliche Kraft zu Beginn

Unterschiedliche Kraft zu Beginn

&

Spricht unterschiedlich auf Training an

0 2 4 6 8 10

100120140160

Woche

Gewicht [kg]

(6)

Wiederholte Messungen 1/3: Block Effekte

 Möglichkeit 1: Block Effekte

𝑦𝑖𝑗 = 𝛽0 + 𝛽0,𝑖 + 𝛽1𝑥𝑗 + 𝜀𝑖𝑗, 𝜀𝑖𝑗~𝑁 0, 𝜎2 𝑖. 𝑖. 𝑑

 Schätze: 𝛽0, 𝛽0,𝑖, 𝛽1, 𝜎

 Erlaubt Aussagen über Individuen: Z.B. “Herr Meier hatte eine signifikant grössere Anfangskraft als Herr Müller”

 Erlaubt keine direkte Aussage über Population: Z.B. “Die typische Streuung der Anfangskraft in der Bevölkerung ist ca. 20 kg”

“fixe” Effekte

i: Person j: Woche

(7)

Wiederholte Messungen 2/3:

Random Intercept (RI)

 Möglichkeit 2: Mixed Effects Model 𝑦𝑖𝑗 = 𝛽0 + 𝑢𝑖 + 𝛽1𝑥𝑗 + 𝜀𝑖𝑗,

𝜀𝑖𝑗~𝑁 0, 𝜎2 , 𝑢𝑖~𝑁 0, 𝜎𝑢2 𝑖. 𝑖. 𝑑

 Schätze: 𝛽0, 𝛽1, 𝜎, 𝜎𝑢

 Erlaubt keine direkten Aussagen über Individuen: Z.B.

“Herr Meier hatte eine signifikant grössere Anfangskraft als Herr Müller”

 Erlaubt direkte Aussage über Population: Z.B. “Die

typische Streuung der Anfangskraft in der Bevölkerung ist ca. 20 kg”

“fixe” Effekte

“zufälliger” Effekt

Fixed + Random

= Mixed

i: Person j: Woche

(8)

Wiederholte Messungen 3/3:

Random Slope and Random Intercept (RIRS)

 Möglichkeit 2: Mixed Effects Model

𝑦𝑖𝑗 = 𝛽0 + 𝑢1,𝑖 + (𝛽1 + 𝑢2,𝑖)𝑥𝑗 + 𝜀𝑖𝑗, 𝜀𝑖𝑗~𝑁 0, 𝜎2 𝑖. 𝑖. 𝑑

𝑢1,𝑖~𝑁 0, 𝜎12 , 𝑢2,𝑖~𝑁 0, 𝜎22 , 𝑐𝑜𝑟 𝑢1, 𝑢2 = 𝜌

 Schätze: 𝛽0, 𝛽1, 𝜎, 𝜎1, 𝜎2, 𝜌

“fixe” Effekte “zufällige” Effekte

i: Person j: Woche

(9)

Wiederholte Messungen 3/3:

Random Slope and Random Intercept (RIRS)

 𝑦𝑖𝑗 = 𝛽0 + 𝑢1,𝑖 + (𝛽1 + 𝑢2,𝑖)𝑥𝑗 + 𝜀𝑖𝑗, 𝜀𝑖𝑗~𝑁 0, 𝜎2 𝑖. 𝑖. 𝑑

𝑢1,𝑖~𝑁 0, 𝜎12 , 𝑢2,𝑖~𝑁 0, 𝜎22 , 𝑐𝑜𝑟 𝑢1, 𝑢2 = 𝜌

 Angenommen folgende Werte werden geschätzt: 𝛽0 = 100, 𝛽1 = 5, 𝜎 = 1, 𝜎1 = 10, 𝜎2 = 1, 𝜌 = −0.7

 Stimmt folgende Aussage (gegeben diese Schätzwerte):

“Personen mit einer unterdurchschnittlichen Anfangskraft profitieren überdurchschnittlich von dem

Trainingsprogramm.”

i: Person j: Woche

(10)

Zusammenfassung: Wiederholte Messungen

 Block Effekte (fixe Effekte):

Statistische Aussage für Individuen, aber nicht Bevölkerung

 Mixed effects:

Statistische Aussage für Bevölkerung, aber nicht Individuen

- Random Intercept (RI): Individueller Achsenabschnitt - Random Intercept and Random Slope (RIRS):

Individueller Achsenabschnitt und Steigung

Komplexere Modelle sind möglich, aber schwieriger zu fitten

(11)

Fix oder Random ?

 Wie wirkt Krafttraining bei den 11 Spielern der Fussball- Nati? → fixe Effekte, da Information über genau diese 11 Spieler gewünscht wird

 11 zufällige Probanden; wie stark streut der Kraftzuwachs durch unser Trainingsprogramm in der Bevölkerung →

zufällige Effekte (mixed models), da Information über die zu Grunde liegende Bevölkerung gewünscht wird

(12)

Schätzen von Mixed Effects Modellen

 Maximum Likelihood (ML):

- Varianzschätzungen haben Bias

+ Tests zw. Modellen mit verschiedenen fixen Effekten möglich

 Restricted Maximum Likelihood (REML):

+ Varianzschätzungen haben keinen Bias

- Kann nur Modelle mit gleichen fixen Effekten vergleichen

Empfohlen für den endgültigen Fit

(default in R)

(13)

Mixed Effects Modelle in R

 Funktion “lmer” in Paket “lme4”

 Paket “lmerTest” enthält verbesserte Routinen zum Berechnen von p-Werten (der fixen Effekte).

 Paket “lattice” hilft beim plotten von wiederholten Messungen

(14)

Bsp: Reaktionszeit

 18 Fernfahrer mit Schlafentzug (3h Schlaf pro Nacht)

 Wie ändert sich Reaktionszeit im Verlauf der Tage ?

 Siehe “?sleepstudy” in R

(15)

Reaktionszeit - Überblick

Average reaction time (ms)

200 250 300 350 400 450

0 2 4 6 8

310 309

0 2 4 6 8

370 349

0 2 4 6 8

350 334

308 371 369 351 335

200 250 300 350 400 450

332

200 250 300 350 400 450

372

0 2 4 6 8

333 352

0 2 4 6 8

331 330

0 2 4 6 8

337

(16)

RIRS Modell in R: Input

Achsenabschnitt und Steigung für Gesamtbevölkerung

Zufällige Schwankung in

Achsenabschnitt und Steigung pro Person

(17)

RIRS Modell in R: Output

𝑦𝑖𝑗 = 251.4 + 𝑢1,𝑖 + (10.5 + 𝑢2,𝑖)𝑥𝑗 + 𝜀𝑖𝑗, 𝜀𝑖𝑗~𝑁 0,25.62 𝑖. 𝑖. 𝑑

𝑢1,𝑖~𝑁 0,24.72 , 𝑢2,𝑖~𝑁 0,5.92 , 𝑐𝑜𝑟 𝑢1, 𝑢2 = 0.07

(18)

Residuenanalyse

 Residuenanalyse wie in Linearer Regression:

- Tukey-Anscombe Plot - QQ-Plot der Residuen

 Zusätzlich: Zufällige Schwankungen des Achsenabschnitts und der Steigung

müssen normalverteilt sein

→ QQ-Plots der zufälligen Schwankungen (mit Funktion “ranef”)

(19)

 Passt das RIRS-Modell signifikant besser als das RI- Modell?

 Fazit: RIRS-Modell passt besser als RI-Modell

RIRS oder RI ?

fm1 passt sign. besser fm1 hat

tieferes (=besseres) AIC und BIC

(20)

RIRS Modell in R: Zufällige Schwankungen

Z.B. Geradengleichung für Person 308:

𝑦𝑖𝑗 = 251.4 + 2.3 + (10.5 + 9.2)𝑥𝑗 + 𝜀𝑖𝑗 (andere Parameter wie bisher)

(21)

RIRS Modell in R: Vertrauensintervalle

𝜎1 𝜌 𝜎2 𝜎

𝛽0, 𝛽1

(22)

Bessere Genauigkeit

Wir haben gesehen: Die Streuung für personenabhängige Schwankung der Steigung (𝜎1) ist im Bereich ca. 14.4 bis 37.7 (95%-VI). Angenommen, wir wollen diesen Bereich in einer neuen Studie verkleinern. Welche Massnahme ist dazu sinnvoll?

1) Gleich viele Personen, mehr Wochen pro Person 2) Mehr Personen, gleich viele Wochen pro Person

(23)

RIRS Modell: Interpretation

• Die mittlere Reaktionszeit (zu Beginn des Experiments) ist 251 ms (95%-VI: [238 ms, 265 ms] – Genauigkeit der Schätzung)

• Eine typische Schwankung der (anfänglichen) Reaktionszeit in der Bevölkerung ist ca. 25 ms (95%-VI: [14 ms, 38 ms] – Streuung in der Bevölkerung)

• Pro Nacht mit Schlafentzug wird die Reaktionszeit im Mittel um 10 ms schlechter (95%-VI: [7 ms/Tag, 14 ms/Tag] – Genauigkeit der Schätzung)

• Eine typische Schwankung der Reaktion auf Schlafentzug ist ca. 6 ms/Tag (95%-VI: [3.8 ms/Tag, 8.8 ms/Tag] – Streuung in der Bevölkerung)

• Es gibt keinen signifikanten Zshg zwischen anfänglicher Reaktionszeit und Wirkung des Schlafentzugs (95%-VI für 𝜌: [-0.48; 0.68])

(24)

Wichtige Konzepte

 Formel und Interpretation von RI und RIRS Modell

 Residuenanalyse

(25)

Wichtige R Funktionen

 Paket “lme4” bzw. “lmerTest”:

“lmer”, “anova”, “ranef”, “confint”

Referenzen

ÄHNLICHE DOKUMENTE

The second row of panels in Figure 1 presents the autocorrelation functions for the residuals of a linear mixed-effects model fitted to the word naming latencies with random

Majority of leading statistical software packages use REML as default method of estimating covariance parameters and fixed effects in mixed mod- els (SAS version 8.2 — procedure

This would have been an unfair procedure if there had been a real person named Jack

18 UNIFORMLY VALID INFERENCE BASED ON THE LASSO For a classical linear Gaussian regression model, [11] showed that limiting versions lim β →±∞ Q(β, I n ) can be used to

 In the restricted model we assume that the interaction effects add to zero when summed across a fixed effect (they are random but restricted!).  The alternative is the

+ Tests between two models with differing fixed and random effects are possible.  Restricted Maximum

The common procedure to estimate gravity equations with panel data is based on the ordinary (or weighted if we model possible time dependence) least squares estimation of