• Keine Ergebnisse gefunden

Multiple Lineare Regression

N/A
N/A
Protected

Academic year: 2022

Aktie "Multiple Lineare Regression"

Copied!
19
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Multiple Lineare Regression

Statistik (Biol./Pharm./HST) – FS 2014

(2)

Wdh: Einfache lineare Regression

 Modell: 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖, 𝜀𝑖~𝑁 0, 𝜎2 𝑖. 𝑖. 𝑑

 Finde 𝛽 , 𝛽0 1: Methode der kleinsten Quadrate 𝜎2 ist geschätzte Varianz der Residuen

𝑠.𝑒.𝛽 𝛽𝑘−𝛽𝑘

𝑘 ~𝑡𝑛−2 → t-Test: 𝐻0: 𝛽𝑘 = 0, 𝐻𝐴: 𝛽𝑘 ≠ 0

 R: Funktion ‘lm’

(3)

Wdh: Residuenanalyse

Sind Modellannahmen erfüllt?

 Tukey-Anscombe Plot: Modellwert vs. Residuen (Fehlervarianz konstant, systematische Fehler)

 QQ-Plot: Empirische Quantile vs. theoretische Quantile (Residuen normalverteilt)

2

OK

Gerade Krümmung

(4)

Falls Residuenanalyse schlecht: Transformationen

3

Zusammenhang:

Hirnmasse und

Körpermasse

(5)

Bsp: Hirnmasse vs. Körpermasse

4

(6)

Bsp: log(Hirnmasse) vs. Körpermasse

5

(7)

Bsp: log(Hirnmasse) vs. log(Körpermasse)

6

(8)

7

Bsp: log(Hirnmasse) vs. log(Körpermasse)

log 𝐻 = 𝛽 + 𝛽0 ∗ log 𝐾1

𝛽 = 2.19 (95%-VI: [1.89; 2.49]); 𝛽0 = 0.75 (95%-VI: [0.67; 0.83]) 1

𝑎 = exp 𝛽 = 8.94 (95%-VI: [exp 1.89 ; exp (2.49)] = [6.60; 12.02] 0 𝑏 = 𝛽1 (95%-VI: [0.67; 0.83])

𝐻 = exp 𝛽 + 𝛽0 ∗ log 𝐾1

→ 𝐻 = 𝑎 ∗ 𝐾𝑏

(9)

Übersicht über nützliche Transformationen

 Linearer Zusammenahng:

𝑦 = 𝑎 + 𝑏𝑥 (keine Transofrmation nötig)

 Exponentieller Zusammenhang:

log 𝑦 = 𝑎 + 𝑏𝑥 → 𝑦 = exp 𝑎 ∗ exp (𝑏𝑥)

 Polynomieller Zusammenhang:

log 𝑦 = 𝑎 + 𝑏 ⋅ log 𝑥 → y = exp a + b ⋅ log 𝑥

→ 𝑦 = exp 𝑎 ⋅ 𝑥𝑏

8

(10)

9

Multiple Lineare Regression:

Wie hängt Energie von Eiweiss, Kohlehydraten und Fett ab?

(11)

Multiple Lineare Regression: Interpretation

 Energie (E), Eiweiss (EW), Kohlehydrate (K), Fett (F)

 Modell:

𝐸[𝑘𝑐𝑎𝑙] = 𝛽0 + 𝛽1𝐸𝑊[𝑔] + 𝛽2𝐾[𝑔] + 𝛽3𝐹[𝑔] + 𝜀, 𝜀~𝑁(0, 𝜎2)

10

Was bedeutet es, wenn in diesem Modell 𝛽3 = 8?

A: Wenn ein Nahrungsmittel ein Gramm mehr Fett als ein anderes hat, enthält es im Schnitt 8 kcal mehr Energie.

B: Wenn ein Nahrungsmittel ein Gramm mehr Fett als ein anderes hat und gleich viel Eiweiss und Kohlehydrate enthält,

enthält es im Schnitt 8 kcal mehr Energie.

(12)

Einfache oder Multiple Regression

(Gilt für alle GLMs; hier am Bsp der linearen Regression)

 Einfache Regression:

“Totaler Effekt”

y ~ x → “Wenn sich x um eine Einheit erhöht, erhöht sich y um 𝛽1

 Multiple Regression

“Bereinigter Effekt”

y ~ x1 + x2 → “Wenn sich x1 um eine Einheit erhöht und x2 konstant bleibt, erhöht sich y um 𝛽1.

 Kein “richtig” oder “falsch”; eher zwei verschiedene Sichtweisen auf das gleiche Problem

11

(13)

Vorteil von Multipler Regression

 Andere Einflüsse werden ausgeschaltet

Bsp: Diskriminierung

 Einfache Regression:

Zulassung ~ Geschlecht

 Multiple Regression:

Zulassung ~ Geschlecht + Job

Berühmtes Beispiel: Simpson’s Paradox

12

(14)

Bestimmtheitsmass 𝑹

𝟐

13

𝑅2 = 1 − 𝑆𝑆𝑒𝑟𝑟 𝑆𝑆𝑡𝑜𝑡

𝑅2: “Wie nahe liegen Punkte auf der Geraden?”

(im Vergleich zur ursprünglichen Streuung der y-Werte)

(15)

Signifikanz vs. Relevanz

14

Signifikant, aber evtl. nicht relevant 𝐻0: 𝛽1 = 0 → 𝑝 = 0.00008

𝑅2 = 0.15 𝑜𝑑𝑒𝑟 |𝛽 𝑠𝑒ℎ𝑟 "𝑘𝑙𝑒𝑖𝑛" 1|

Signifikant und wohl auch relevant (?) 𝐻0: 𝛽1 = 0 → 𝑝 = 0.00002

𝑅2 = 0.98 𝑜𝑑𝑒𝑟 |𝛽 "𝑔𝑟𝑜𝑠𝑠" 1|

Statistik: Entscheidet Signifikanz Wissenschaft: Entscheidet Relevanz

(je nach Fach: Unterschiedliche Werte von 𝑅2 gefordert)

(16)

Energiegehalt von 20 Lebensmitteln

(17)

Daten (pro 100 g)

16

(18)

Multiple Lineare Regression

17

Ein Lebensmittel, das ein Gramm mehr Fett

aber gleich viel Eiweis und Kohlenhydrate enthält,

enthält im Schnitt 8.8 kcal (95%-VI: [7.8; 9.8]) mehr Energie.

Die Punkte liegen äusserst genau auf der geschätzten Geraden.

(verglichen mit der ursprünglichen Streuung der Energiewerte)

(19)

Residuenanalyse

18

Im Allgemeinen sind die Modellannahmen erfüllt. Allerdings fallen Beobachtungen 2 (Lätta) und 13 (Brot) etwas aus dem Rahmen (5-10 kcal mehr als vorhergesagt).

Referenzen

ÄHNLICHE DOKUMENTE

Mehr als ein Drittel der Haushalte haben nach eigenen Angaben das eigene Einkaufs- verhalten verändert: Sie ver- zichten demnach teils auf Pro- dukte oder Dienstleistungen, die

Eine neuere Übersichtsar- beit zeigte, dass eine vermehrte Zufuhr von industriell her- gestellten Trans-Fettsäuren das Risiko für eine KHK und für die Sterblichkeit an KHK

Wenn eine Frau lange die Pille genommen hat, kann sie danach nur schwer schwanger werden. Viele Frauen werden sehr schnell direkt in ihrem ersten natürlichen Zyklus nach dem

Fettzellen als Diäthelfer Seit eini- ger Zeit ist bekannt, dass weiße Adi- pozyten sich durch Kälte in beiges Fett verwandeln.. Das ist von Vorteil, weil die beigen Zellen

Gelbe Köpfchen oder weiße Kugel Der Löwenzahn ist eine aus- dauernde Pflanze aus der Familie der Korbblütler (Asteraceae), Unter- familie Cichorioideae.. Ihre Blätter bilden

Mittler- weile gibt es einige hochwertige apothekenexklusive Kosmetik- serien speziell für die trockene Haut, viele Produkte sind auch für die Basispflege bei Hauter- krankungen

public static void main(String[] args) throws IOException { LineNumberReader ein = new LineNumberReader(. new

Von Bruronnut entdeckt. —— Sägespäne, oder Leinenlumpen werden rnit Schwefelsäure befeuchtet, in einem Porcellanmörser zu einem gleich- formigeu Brei zerrieben, nach Zusatz von