• Keine Ergebnisse gefunden

Mittelwerte: Arithmetisches Mittel

N/A
N/A
Protected

Academic year: 2021

Aktie "Mittelwerte: Arithmetisches Mittel"

Copied!
8
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Wiederholung: Arithmetisches Mittel & Varianz

Grundlagen der Ökonometrie

herbert.stocker@uibk.ac.at www.hsto.info/econometrics

Mittelwerte: Arithmetisches Mittel

• Mittelwert: Überbegriff für verschiedene Lagemaße.

• Arithmetisches Mittel: am häufigsten verwendet Definition Arithmetisches Mittel

¯ x := 1

n

n

X

i=1

x

i

• nur für metrisch skalierte Variablen sinnvoll!

• empfindlich gegenüber Extremwerten.

1

Arithmetisches Mittel

Arithmetisches Mittel:besitzen einige der

n

Beobachtungen den gleichen numerischen Wert können diese zusammengefasst werden

¯ x = 1

n

x

1

+ · · · + x

1

| {z }

n1-mal

+ x

2

+ · · · + x

2

| {z }

n2-mal

+ · · · + x

k

+ · · · + x

k

| {z }

nk-mal

mit Häufigkeiten

n

1

, n

2

, . . . , n

k

¯ x = 1

n (x

1

n

1

+ · · · + x

k

n

k

) = 1 n

k

X

j=1

x

j

n

j

=

k

X

j=1

x

j

n

j

n

mit

P

k

j=1

n

j

= n

2

Arithmetisches Mittel

Arithmetisches Mittel:

¯ x = 1

n

k

X

j=1

x

j

n

j

=

k

X

j=1

x

j

n

j

n =

mit

j = 1, . . . , k

bzw. mit

f

j

:=

nnj (relativeHäufigkeiten)

¯ x =

k

X

j=1

x

j

f

j

gewogenes arithmetisches Mittel

3

(2)

Arithmetisches Mittel

Arithmetisches Mittel: 4 Eigenschaften

1. SchwerpunkteigenschaftDie Summe der Abweichungen der Einzelwerte vom arithm. Mittel

x ¯

sind Null:

n

X

i=1

(x

i

− ¯ x) = X

i

x

i

− X

i

¯

x = n¯ x − n¯ x = 0

weil

P

i

x

i

= n¯ x

(s.Def.

¯ v

) und

P

i

x ¯ = n¯ x

Schwerpunkt einer Verteilung.

4

Arithmetisches Mittel

Arithmetisches Mittel: 4 Eigenschaften

2. Die Summe der quadrierten Abweichungen von

x ¯

ist kleiner als von jedem beliebigen anderen Wert

z

n

X

i=1

(x

i

− x) ¯

2

<

n

X

i=1

(x

i

− z)

2 für

x ¯ 6 = z

• Warum?

X

i

(xi−z)2 = X

i

(xi−¯x+ ¯x−z)2=X

i

[(xi−x) + (¯¯ x−z)]2

= X

i

(xi−¯x)2+ 2(¯x−z)X

i

(xi−x)¯

| {z }

=0

+X

i

(¯x−z)2

= X

i

(xi−¯x)2+X

i

(¯x−z)2 mitX

i

(¯x−z)2>0

5

Arithmetisches Mittel

Arithmetisches Mittel: 4 Eigenschaften

3. Translationsäquivariant:werden die Einzelwerte linear transformiert

x

i

= β

1

+ β

2

x

i, dann gilt

¯

x

= β

1

+ β

2

¯ x

• Warum?

¯ x

= 1

n X

i

1

+ β

2

x

i

)

= 1

n nβ

1

+ β

2

X

i

x

i

!

= β

1

+ β

2

1 n

X

i

x

i

= β

1

+ β

2

x ¯

6

Arithmetisches Mittel

Arithmetisches Mittel: 4 Eigenschaften

4. gewichtetes arithm. Mittel:Zwei (oder mehrere) Teilgesamtheiten, deren Umfang und arithm. Mittel bekannt sind (

n

1

, x ¯

1

, n

2

, x ¯

2mit

n

1

+ n

2

= n

)

¯ x = 1

n x

1

x

1 n1

X

i=1

x

1i

+ n

2

n

2 n2

X

i=1

x

2i

!

= n

1

n 1 n

1

n1

X

i=1

x

1i

! + n

2

n 1 n

2

n2

X

i=1

x

2i

!

= n

1

n x ¯

1

+ n

2

n x ¯

2

• Warum?

Aus der Definition des arithm. Mittels n1

X

i=1

x

1i

= n

1

x ¯

1und n2

X

i=1

x

2i

= n

2

x ¯

2

7

(3)

Varianz

Definition Varianz

Varianz

s

2: mittlere quadratische Abweichung vom arithmetischen Mittel

x ¯

.

var(x) := s

2

= 1

n

n

X

i=1

(x

i

− x) ¯

2

= 1 n

n

X

i=1

x

2i

!

− x ¯

2

:= x

2

− ¯ x

2

nur für metrisch skalierte Variablen.

8

Varianz

Warum?

var(x) = 1 n

n

X

i=1

(x

i

− x) ¯

2

= 1 n

X

i

x

2i

− 2¯ x X

i

x

i

+ X

i

¯ x

2

!

= 1 n

X

i

x

2i

− 2¯ xn¯ x + n¯ x

2

!

= 1 n

n

X

i=1

x

2i

!

− x ¯

2

:= x

2

− x ¯

2

weil

P

i

x

i

= n¯ x

und

P

i

¯ x

2

= n¯ x

2

9

Varianz

Linear Transformierte Daten:

Sei

x

i

= β

1

+ β

2

x

ifür

i = 1, . . . , n var(x

) = 1

n

n

X

i=1

(x

i

− x ¯

)

2 Wir haben bereits früher gezeigt, dass

x ¯

= β

1

+ β

2

x ¯

.

var(x

) = 1 n

X

i

1

+ β

2

x

i

− β

1

− β

2

x) ¯

2

= 1 n

X

i

2

[x

i

− x]) ¯

2

= β

22

1 n

X

i

(x

i

− x) ¯

2

= β

22

var(x

i

)

Addition oder Subtraktion einer Konstante. hat keinen Einfluss auf die Varianz!

10

Varianz

Zwei Arten der Varianz

s

2

= 1

n

n

X

i=1

(x

i

− x) ¯

2 versus

s

2s

= 1 (n − 1)

n

X

i=1

(x

i

− ¯ x)

2

• die meisten Programme berechnen die Varianz nach der 2. Formel, d.h. sie verwenden den Vorfaktor

1/(n − 1)

• die Anwendung des Vorfaktor

1/(n − 1)

statt

1/n

ist angebracht, wenn die Varianz aus einer Stichprobe berechnet wird und alsSchätzungfür die Varianz der Grundgesamtheit dient.

• der Grund dafür liegt im Konzept der später diskutiertenErwartungstreue.

11

(4)

Standardabweichung

• Die Varianz ist manchmal schwierig zu interpretieren, wenn z.B.

x

in Euro gemessen wird, hat die Varianz die Dimension Euro2.

• DieStandardabweichunghat gegenüber der Varianz den Vorteil, dass sie in der gleichen Einheit wie die Beobachtungswerte gemessen wird.

Definition Standardabweichung

s = p var(x) =

v u u t 1 n

n

X

i=1

(x

i

− x) ¯

2

12

Metrisch skalierte Merkmale: Zusammenhangsmaß

Das wichtigste Zusammenhangsmaß fürmetrisch skalierte Merkmaleist die empirische Kovarianz.

Definition Kovarianz

Die Kovarianz ist eine (nicht standardisierte) Maßzahl für den Zusammenhang zwischen zwei metrisch skalierten statistischen Merkmalen

x

und

y

.

cov(x, y) = 1 n

n

X

i=1

(x

i

− x)(y ¯

i

− y) ¯

mit

x ¯ :=

n1

P

i

x

iund

y ¯ :=

1n

P

i

y

i

13

Kovarianz

Beispiel:

x y x − x ¯ y − y ¯ (x − x)(y ¯ − y) ¯

2 1 -3 -2 6

3 4 -2 1 -2

4 1 -1 -2 2

6 4 1 1 1

7 2 2 -1 -2

8 6 3 3 9

P

30 18 0 0 14

cov(x, y) = 1 n

n

X

i=1

(x

i

− x)(y ¯

i

− y) = ¯ 14 6 = 2.33

14

Kovarianz: Mittelwerttransformation

0 1 2 3 4 5 6 7 8

0 1 2 3 4 5 6 y

x

b b b b b b

A B

C

D

E F

bc(¯x,¯y)

15

(5)

Kovarianz: Mittelwerttransformation

0 1 2 3 4 5 6 7 8

0 1 2 3 4 5 6 y

x

b b b b b b

A B

E F

bc(¯x,¯y)

0 1 2 3

1

2

3

4 0

−1

2 1 2 3

¨ y

¨ x

16

Vorzeichen der Kovarianz

0 1 2 3 4 5 6 7 8

0 1 2 3 4 5 6 y

x

b b b b b b

A B

E F

bc(¯x,¯y)

0 1 2 3

1

2

3

4 0

−1

2 1 2 3

¨ y

¨ x +

+

17

Kovarianz

Kovarianz:

• Die Kovarianz ist positiv, wenn

x

und

y

tendenziell einen gleichgerichteten linearen Zusammenhang besitzen, d.h. hohe Werte von

x

gehen mit hohen Werten von

y

einher und niedrige mit niedrigen.

• Die Kovarianz ist negativ, wenn

x

und

y

einen gegengerichteten linearen Zusammenhang aufweisen.

• Ist die Kovarianz Null, so besteht keinlinearer Zusammenhang(es kann aber trotzdem oder ein nicht-linearer Zusammenhang bestehen, z.B. U-förmig).

18

Rechenregeln für empirische Kovarianzen

1) Symmetrie:

cov(x, y) = cov(y, x)

Warum?

cov(x, y) = 1 n

n

X

i=1

(x

i

− x)(y ¯

i

− y) ¯

= 1 n

n

X

i=1

(y

i

− y)(x ¯

i

− x) = cov(y, x) ¯

19

(6)

Rechenregeln für empirische Kovarianzen

2) Konstante Faktoren können ausgeklammert werden:für

x, y ∈

Rnund Zahlen

a, b ∈

R

cov(ax, by) = ab cov(x, y)

Warum?

cov(ax, by) = 1 n

n

X

i=1

(ax

i

− a¯ x)(by

i

− b¯ y)

= 1 n

n

X

i=1

a(x

i

− x)b(y ¯

i

− y) ¯

= ab 1 n

n

X

i=1

(x

i

− x)(y ¯

i

− y) ¯

= ab cov(x, y)

20

Rechenregeln für empirische Kovarianzen

3) Additivität:für

x, y, z ∈

Rn

cov[x, (y + z)] = cov(x, y) + cov(x, z)

Warum?

cov[x,(y+z)] = 1 n

n

X

i=1

(xi−x)[(y¯ i+zi)−(y+z)]

= 1

n

n

X

i=1

(xi−x)[(y¯ i+zi)−(¯y+ ¯z)]

= 1

n

n

X

i=1

(xi−x)[(y¯ i−y) + (z¯ i−z)]¯

= 1

n

n

X

i=1

(xi−x)(y¯ i−y) +¯ 1 n

n

X

i=1

(xi−x)(z¯ i−z)¯

= cov(x, y) + cov(x, z)

21

Rechenregeln für empirische Kovarianzen

4) Zusammenhang mit empirischer Varianz:für

x ∈

Rn

cov(x, x) = var(x)

Warum?

cov(x, x) = 1 n

n

X

i=1

(x

i

− x)(x ¯

i

− x) ¯

= 1 n

n

X

i=1

(x

i

− x) ¯

2

= var(x)

22

Rechenregeln für empirische Kovarianzen

5) Empirische Varianz einer Summe:für

x, y ∈

Rn

var(x + y) = var(x) + var(y) + 2 cov(x, y)

Warum?

var(x+y) = 1 n

n

X

i=1

[(xi+yi)−(¯x+ ¯y)]2

= 1

n

n

X

i=1

[(xi−x) + (y¯ i−¯y)]2

= 1

n

n

X

i=1

(xi−x)¯2+1 n

n

X

i=1

(yi−y)¯2+

+21 n

n

X

i=1

(xi−x)(y¯ i−y)¯

= var(x) + var(y) + 2 cov(x, y)

23

(7)

Kovarianz

Zwei Arten der Kovarianz

cov(x, y) = 1 n

n

X

i=1

(x

i

− x)(y ¯

i

− y) ¯

versus

cov

s

(x, y) = 1 (n − 1)

n

X

i=1

(x

i

− ¯ x)(y

i

− y) ¯

• die meisten Programme berechnen die Kovarianz nach der 2. Formel, d.h.

sie verwenden den Vorfaktor

1/(n − 1)

• die Anwendung des Vorfaktor

1/(n − 1)

statt

1/n

ist angebracht, wenn die Kovarianz aus einer Stichprobe berechnet wird und alsSchätzungfür die Kovarianz der Grundgesamtheit dient.

24

Korrelation

Korrelationen:

Kovarianzenhängen von Maßeinheiten ab! Um einen Zusammenhang vergleichbar zu machen, muss die Kovarianz normiert werden

Korrelationskoeffizienten

• Korrelationen sind eine Gruppe von statistischen Kennwerten, die den

“Zusammenhang”zwischen zwei Variablen messen sollen.

• Bewegen sich die Variablen in die selbe Richtung? Wie stark hängen sie zusammen?

25

Korrelationskoeffizient nach Bravais-Pearson

DefinitionKorrelationskoeffizient nach Bravais-Pearson

Der Korrelationskoeffizient

r

ist ein dimensionsloses Maß für den Grad des linearen Zusammenhangs zwischen zweimindestens intervallskalierten Merkmalen.

corr(x, y) := r

xy

= cov(x, y) p var(x) p

var(y)

• erfordert mindestensmetrischesSkalenniveau!

26

Korrelationskoeffizient nach Bravais-Pearson

Eigenschaften des Korrelationskoeffizient nach Bravais-Pearson:für Datenvektoren

x, y ∈

Rnund Zahlen

a, b, c, d ∈

Rgilt

1

r

x,ykann nur Werte zwischen

− 1

und

+1

annehmen

− 1 ≤ corr(x, y) ≤ +1

2

r

x,yändert sich nicht bei einer linearen Transformation

corr(ax + b, cy + d) = corr(x, y)

3 Wenn der

corr(x, y) = 0

sind die beiden Merkmale linear unabhängig (sie können aber trotzdem nicht-linear abhängig sein); wenn

| corr(x, y) | = 1

sind die Merkmale exakt linear abhängig

• corr(x, y) = +1wenny=a+bx

• corr(x, y) =−1wenny=a−bx

27

(8)

Korrelationskoeffizient nach Bravais-Pearson

Beispiel:mit

¨ x := x − x ¯

,

y ¨ := y − y ¯

x y x¨ x¨2 y¨ y¨2 x¨¨y

2 1 -3 9 -2 4 6

3 4 -2 4 1 1 -2

4 1 -1 1 -2 4 2

6 4 1 1 1 1 1

7 2 2 4 -1 1 -2

8 6 3 9 3 9 9

P 30 18 0 28 0 20 14

r

xy

= cov(x, y) p var(x) p

var(y) = 14

√ 28 · 20 = 0.591608

28

Korrelationskoeffizient nach Bravais-Pearson

Übung:Zeigen Sie, dass der Korrelationskoeffizient

r = cov(x, y) p var(x) var(y)

= P

i

(x

i

− x)(y ¯

i

− y)) ¯ pP

i

(x

i

− x) ¯

2

P

i

(y

i

− ¯ y)

2 alternativ berechnet werden kann als

r =

P

i

x

i

y

i

− n¯ x¯ y q

( P

i

x

2i

− n¯ x)( P

i

y

i2

− n¯ y

2

)

29

Referenzen

ÄHNLICHE DOKUMENTE

Berechnen  Sie  die  Reihen  ein  zweites  Mal,  indem  Sie  mit  den  konkreten  Zahlen  die   Schritte  der  Formelherleitung  nachvollziehen.. Bestimmen  Sie

[r]

Technische Universit¨ at Chemnitz Statistik, WS 12/13 Fakult¨ at f¨ ur

Lehrstuhl Theoretische Informatik Markus Lohrey und Moses Ganardi. Algorithmen

[r]

Dabei gilt das erste Gleichheitszeichen aufgrund der Definition von n+1, das zweite ist die Rekursionsformel in der Definition der Multiplikation, beim dritten wird

Nutzen Sie hierzu die Reihen f¨ur sinh x und sin x sowie die Rechengesetze f¨ur Reihen. Geben Sie die Glieder bis zur sechsten

Nutzen Sie hierzu die Reihen f¨ur sinh x und sin x sowie die Rechengesetze f¨ur Reihen. Geben Sie die Glieder bis zur sechsten