• Keine Ergebnisse gefunden

Wirtschaftsmathematik Einführung in einige Teilbereiche der Wirtschaftsmathematik

N/A
N/A
Protected

Academic year: 2021

Aktie "Wirtschaftsmathematik Einführung in einige Teilbereiche der Wirtschaftsmathematik"

Copied!
20
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)Wirtschaftsmathematik Einführung in einige Teilbereiche der Wirtschaftsmathematik. Wintersemester 2016. Prof. Dr. Stefan Etschberger HSA.

(2) Darstellung der Daten in Streuplot. Wirtschaftsmathematik Etschberger - WS2016. 70. Bundesliga 2008/09 1. Finanzmathematik. 60. 2. Lineare Programme 3. DGLs 4. Einführung 5. Deskriptive Statistik. 50. Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes. 40. Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. 30. Punkte. Häufigkeiten. 20. 40. 60. 80. Etat [Mio. Euro]. 176.

(3) Trend als lineares Modell. Wirtschaftsmathematik Etschberger - WS2016. Kann man die Tabellenpunkte näherungsweise über einfache Funktion in Abhängigkeit des Vereinsetats darstellen? Allgemein: Darstellung einer Variablen Y als Funktion von X:. 1. Finanzmathematik 2. Lineare Programme. y = f(x). 3. DGLs 4. Einführung. Dabei:. 5. Deskriptive Statistik Häufigkeiten. X heißt Regressor bzw. unabhängige Variable Y heißt Regressand bzw. abhängige Variable. Wichtiger (und einfachster) Spezialfall: f beschreibt einen linearen Trend: y = a + bx. Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. Dabei anhand der Daten zu schätzen: a (Achsenabschnitt) und b (Steigung) Schätzung von a und b: Lineare Regression 177.

(4) 80. Fehlerquadratsumme. Wirtschaftsmathematik Etschberger - WS2016. 70. 60. 50. Pro Datenpunkt gilt mit Regressionsmodell:. 40. 30. 20. Dabei: ϵi ist jeweils Fehler (der Grundgesamtheit), ^ i ): Abweichung (Residuen) zwischen ^ + bx mit ei = yi − (a gegebenen Daten der Stichprobe und durch Modell geschätzten Werten. 2. Lineare Programme 3. DGLs 4. Einführung 5. Deskriptive Statistik Häufigkeiten Lage und Streuung. Modell gut wenn alle Residuen ei zusammen möglichst klein. Konzentration. Einfache Summe aber nicht möglich, denn ei positiv oder negativ. Korrelation. Deswegen: Summe der Quadrate von ei Prinzip der kleinsten Quadrate: Wähle a und b so, dass. 80. 60. 40. 20. 1. Finanzmathematik 0. yi = a + bxi + ϵi. Zwei Merkmale Preisindizes Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. n X Q(a, b) = [yi − (a + bxi )]2 → min i=1. 178.

(5) Beste Lösung. Wirtschaftsmathematik Etschberger - WS2016. Beste und eindeutige Lösung: n X (xi − x̄)(yi − ȳ). ^= b. i=1. n X (xi − x̄)2 i=1. n X. =. 1. Finanzmathematik 2. Lineare Programme 3. DGLs 4. Einführung 5. Deskriptive Statistik Häufigkeiten. xi yi − nx̄ȳ. i=1 n X. Lage und Streuung Konzentration Zwei Merkmale Korrelation. x2i − nx̄2. i=1. ^ x̄ ^ = ȳ − b a. Preisindizes Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. Regressionsgerade: ^x ^=a ^+b y 179.

(6) Bundesligabeispiel ^ = 25,443 + 0,634 · x Modell: y 80. Berechnung eines linearen Modells der Bundesligadaten. Wirtschaftsmathematik Etschberger - WS2016. 70. dabei: Punkte = ^y und Etat = ^ x:. 1. Finanzmathematik. 60. 2. Lineare Programme. P. x2i. 25209. xi yi. 31474. n. 18. 50. 46,89. 5. Deskriptive Statistik Häufigkeiten. 40. y P. 4. Einführung. Lage und Streuung Konzentration. 30. 33,83. Zwei Merkmale Korrelation Preisindizes. 20. x. Punkte. 3. DGLs. Lineare Regression. 0. ^ = 31474 − 18 · 33,83 · 46,89 ⇒b 25209 − 18 · 33,832 ≈ 0,634. 20. 40 Einkommen. 60. 80. 6. W-Theorie 7. Induktive Statistik Quellen. ^ · 33,83 ^ = 46,89 − b ⇒a ≈ 25,443 180.

(7)

(8) Bundesligabeispiel ^ = 25,443 + 0,634 · x Modell: y 80. Berechnung eines linearen Modells der Bundesligadaten. Wirtschaftsmathematik Etschberger - WS2016. 70. dabei: Punkte = ^y und Etat = ^ x:. 1. Finanzmathematik. 60. 2. Lineare Programme. P. x2i. 25209. xi yi. 31474. n. 18. 50. 46,89. 5. Deskriptive Statistik Häufigkeiten. 40. y P. 4. Einführung. Lage und Streuung Konzentration. 30. 33,83. Zwei Merkmale Korrelation Preisindizes. 20. x. Punkte. 3. DGLs. Lineare Regression. 0. ^ = 31474 − 18 · 33,83 · 46,89 ⇒b 25209 − 18 · 33,832 ≈ 0,634 ^ · 33,83 ^ = 46,89 − b ⇒a ≈ 25,443. 20. 40. 60. 80. Einkommen. 6. W-Theorie 7. Induktive Statistik Quellen. Prognosewert für Etat = 30: ^ (30) = 25,443 + 0,634 · 30 y ≈ 44,463 180.

(9) Varianz und Information. Wirtschaftsmathematik Etschberger - WS2016. Varianz der Daten in abhängiger Variablen yi als Repräsentant des Informationsgehalts ^ i abgebildet werden Ein Bruchteil davon kann in Modellwerten y 80. 1. Finanzmathematik 2. Lineare Programme. 70. 3. DGLs 4. Einführung. 60. 5. Deskriptive Statistik Häufigkeiten. 50. Lage und Streuung Konzentration Zwei Merkmale. 40. Korrelation Preisindizes 30. Lineare Regression. 6. W-Theorie 20 80. 60. 40. 20. 0. 7. Induktive Statistik Quellen. 181.

(10) Varianz und Information. Wirtschaftsmathematik Etschberger - WS2016. Varianz der Daten in abhängiger Variablen yi als Repräsentant des Informationsgehalts ^ i abgebildet werden Ein Bruchteil davon kann in Modellwerten y 80. 80. 70. 70. 1. Finanzmathematik 2. Lineare Programme 3. DGLs. 60. 4. Einführung. 60. 5. Deskriptive Statistik 50. Häufigkeiten. 50. Lage und Streuung Konzentration 40. Zwei Merkmale. 40. Korrelation Preisindizes 30. 30. Lineare Regression. 6. W-Theorie 80. 60. 40. 20. 7. Induktive Statistik 0. model. 20 points. 20. Quellen. Empirische Varianz (mittlere quadratische Abweichung) für „rot“ bzw. „grün“ ergibt jeweils 1 18. 18 X i=1. 2. (yi − y) ≈ 200,77. bzw.. 1 18. 18 X. (^ yi − y)2 ≈ 102,78. i=1 181.

(11) Determinationskoeffizient. Wirtschaftsmathematik Etschberger - WS2016. Gütemaß für die Regression: Determinationskoeffizient (Bestimmtheitskoeffizient): n P. R2 = i=1 n P. ^ i − ȳ) (y (yi −. i=1. n P. 2. ȳ)2. = i=1 n P i=1. 1. Finanzmathematik. ^ 2i − nȳ2 y = r2 ∈ [0; 1] y2i. −. nȳ2. 2. Lineare Programme 3. DGLs 4. Einführung 5. Deskriptive Statistik Häufigkeiten. Mögliche Interpretation von R2 : Durch die Regression erklärter Anteil der Varianz. Lage und Streuung Konzentration Zwei Merkmale Korrelation. R = 0 wird erreicht wenn X, Y unkorreliert ^ i = yi ∀ i (alle Punkte auf R2 = 1 wird erreicht wenn y 2. Regressionsgerade). Lineare Regression. 6. W-Theorie 7. Induktive Statistik. Im (Bundesliga-)Beispiel: 18 P. R2 =. Preisindizes. i=1 18 P. Quellen. ^ i − y)2 (y ≈ (yi − y)2. 102,78 ≈ 51,19 % 200,77. i=1 182.

(12) Regression: 4 eindimensionale Beispiele. Wirtschaftsmathematik Etschberger - WS2016. Berühmte Daten aus den 1970er Jahren: 1. Finanzmathematik. i. x1i. x2i. x3i. x4i. y1i. y2i. y3i. y4i. 2. Lineare Programme 3. DGLs. 1 2 3 4 5 6 7 8 9 10 11. 10 8 13 9 11 14 6 4 12 7 5. 10 8 13 9 11 14 6 4 12 7 5. 10 8 13 9 11 14 6 4 12 7 5. 8 8 8 8 8 8 8 19 8 8 8. 8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 10,84 4,82 5,68. 9,14 8,14 8,74 8,77 9,26 8,10 6,13 3,10 9,13 7,26 4,74. 7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73. 6,58 5,76 7,71 8,84 8,47 7,04 5,25 12,50 5,56 7,91 6,89. 4. Einführung 5. Deskriptive Statistik Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. (Quelle: Anscombe, (1973)). 183.

(13) Regression: 4 eindimensionale Beispiele. Wirtschaftsmathematik Etschberger - WS2016. In folgender Tabelle: Jeweils Ergebnisse der linearen Regressionsanalyse dabei: xk unabhängige Variable und yk abhängige Variable Modell jeweils: yk = ak + bk xk. 1. Finanzmathematik 2. Lineare Programme 3. DGLs 4. Einführung 5. Deskriptive Statistik Häufigkeiten Lage und Streuung. k. ^k a. ^k b. 1 2 3 4. 3,0001 3,0010 3,0025 3,0017. 0,5001 0,5000 0,4997 0,4999. R2k 0,6665 0,6662 0,6663 0,6667. Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. 184.

(14) Plot der Anscombe-Daten. 1. Finanzmathematik 6. y2. y1. 8. 7. 8. 10. 9. 10. Wirtschaftsmathematik Etschberger - WS2016. 6. 5. 2. Lineare Programme. 4. 3. DGLs. 4. 3. 4. Einführung 5. Deskriptive Statistik 4. 6. 8. 10. 12. 14. 4. 6. 8. x1. 10. 12. 14. x2. Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale. 12. 12. Korrelation Preisindizes. 6. W-Theorie 7. Induktive Statistik Quellen. 6. 6. 8. 8. y4. y3. 10. 10. Lineare Regression. 4. 6. 8. 10 x3. 12. 14. 8. 10. 12. 14. 16. 18. x4. 185.

(15) Beispieldaten. Wirtschaftsmathematik Etschberger - WS2016. ## ## ## ## ## ## ##. meineRegression = lm(AlterM ~ AlterV) meineRegression plot(AlterV, AlterM, xlab="Alter des Vaters", ylab="Alter der Mutter") abline(meineRegression). Call: lm(formula = AlterM ~ AlterV) Coefficients: (Intercept) 18.2234. 1. Finanzmathematik. AlterV 0.6159. 2. Lineare Programme 3. DGLs. 70. 4. Einführung 5. Deskriptive Statistik. 65. Häufigkeiten Lage und Streuung. 60. Zwei Merkmale Korrelation. 55. Preisindizes Lineare Regression. 50. 6. W-Theorie 7. Induktive Statistik. 45. Quellen. 40. Alter der Mutter. Konzentration. 40. 50. 60. 70. 80. Alter des Vaters 186.

(16) PLU. S Wirtschaftsmathematik Etschberger - WS2016. Cook’s Distanz. Oft Kritisch: Einzelne Punkte, die Modell stark beeinflussen Idee: Was würde sich ändern, wenn solche Punkte weggelassen würden? Cook-Distanz: Misst den Effekt eines gelöschten Objekts Formel für ein lineares Modell mit einem unabh. Merkmal:. 1. Finanzmathematik 2. Lineare Programme 3. DGLs 4. Einführung 5. Deskriptive Statistik. n P. Di =. Häufigkeiten. ^j − y ^ j(ohne i) ) (y. 2. j=1. Lage und Streuung Konzentration Zwei Merkmale. MSE. Korrelation Preisindizes Lineare Regression. Dabei bedeutet: ^ j : Prognosewert des kompletten Modells für das j-te Objekt y ^ j(ohne i) : Prognosewert des Modells ohne Objekt i für das j-te y. 6. W-Theorie 7. Induktive Statistik Quellen. Objekt P ^ i − yi )2 : Normierender Term (Schätzwert für MSE = n1 · (y Fehlerstreuung) 187.

(17) PLU. S Wirtschaftsmathematik Etschberger - WS2016. Ausreißer? Anscombe-Daten: Regressionsmodell Nr. 3 Darstellung der Cook-Distanz neben Punkten Faustformel: Werte über 1 sollten genau untersucht werden. 1. Finanzmathematik 2. Lineare Programme 1.39 12. 3. DGLs 4. Einführung 5. Deskriptive Statistik Häufigkeiten Lage und Streuung. 10. Konzentration Zwei Merkmale. y3. Korrelation. 0.3 8. 0.06. Preisindizes Lineare Regression. 6. W-Theorie. 0.03. 7. Induktive Statistik. 0.01 0.01. Quellen. 0 0 6. 0 0.01 0.03. 4. 6. 8. 10. 12. 14. x3 188.

(18) Residualanalyse. Wirtschaftsmathematik Etschberger - WS2016. Oft aufschlussreich: Verteilung der Residuen ei Verbreitet: Graphische Darstellungen der Residuen ^i Z.B.: ei über y 1. Finanzmathematik 3. 12. 3. 2. Lineare Programme. 1. 4. Einführung 5. Deskriptive Statistik Häufigkeiten. 0. 8. y3. Residuals. 10. 2. 3. DGLs. Konzentration. 9. −1. 6. Lage und Streuung 6. Zwei Merkmale Korrelation. 4. 6. 8. 10. 12. 14. 5. 6. x3. 7. 8. 9. 10. Fitted values. Preisindizes Lineare Regression. Residuals vs Fitted 2. 6. W-Theorie. 10. 9. 0. Quellen. −1. 6. y1. 8. Residuals. 1. 7. Induktive Statistik. 4. −2. 10. 4. 6. 8. 10 x1. 12. 14. 3. 5. 6. 7. 8. 9. 10. Fitted values. 189.

(19) Residualanalyse. Wirtschaftsmathematik Etschberger - WS2016. Wichtige Eigenschaften der Residuenverteilung Möglichst keine systematischen Muster ^i Keine Änderung der Varianz in Abhängigkeit von y (Homoskedastizität). 1. Finanzmathematik 2. Lineare Programme. Nötig für inferentielle Analysen: Näherungsweise Normalverteilung der Residuen (q-q-plots). 3. DGLs 4. Einführung 5. Deskriptive Statistik. 70. 20. Häufigkeiten Lage und Streuung. 371. 60. 10. Zwei Merkmale Korrelation Lineare Regression. 0. 6. W-Theorie 7. Induktive Statistik Quellen. 45. −10. 50. 55. Residuals. Preisindizes. 40. 339 451. −20. Alter der Mutter. 65. Konzentration. 40. 50. 60. 70. Alter des Vaters. 80. 45. 50. 55. 60. 65. 70. Fitted values 190.

(20) Kausalität versus Korrelation. Wirtschaftsmathematik Etschberger - WS2016. 1. Finanzmathematik. Exkurs: Kausalität vs. Korrelation. 2. Lineare Programme 3. DGLs. Meist wichtig für sinnvolle Regressionsanalysen: Kausale Verbindung zwischen unabhängigem und abhängigem Merkmal Sonst bei Änderung der unabhängigen Variablen keine sinnvollen Prognosen möglich Oft: Latente Variablen im Hintergrund. 4. Einführung 5. Deskriptive Statistik Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression. 6. W-Theorie 7. Induktive Statistik Quellen. 191.

(21)

Referenzen

ÄHNLICHE DOKUMENTE

Die Studierenden sind mit grundlegenden Begriffen der Mathematik und Statistik vertraut und können die im Folgenden beschriebenen Methoden auf betriebs- und

Beispiel: Hypergeometrische Verteilung Aus einem 32-Kartenblatt wird 3-mal eine Karte ohne Zurücklegen gezogen.. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit

2 Deskriptive Statistik Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression 3

Deskriptive Statistik Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression.. Induktive Statistik

Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression.. Induktive Statistik

Deskriptive Statistik Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression.. Induktive

Deskriptive Statistik Häufigkeiten Lage und Streuung Konzentration Zwei Merkmale Korrelation Preisindizes Lineare Regression.. Induktive Statistik

Situation: Alle unabhängigen Variablen sind kategorial, die Zielgröße Y ist metrisch/stetig. I Einfaktorielle Varianzanalyse: Eine unabhängige Variable (Faktor) mit Stufen i