Wiederholung: Arithmetisches Mittel & Varianz
Grundlagen der Ökonometrie
herbert.stocker@uibk.ac.at www.hsto.info/econometrics
Mittelwerte: Arithmetisches Mittel
• Mittelwert: Überbegriff für verschiedene Lagemaße.
• Arithmetisches Mittel: am häufigsten verwendet Definition Arithmetisches Mittel
¯ x := 1
n
n
X
i=1
x
i• nur für metrisch skalierte Variablen sinnvoll!
• empfindlich gegenüber Extremwerten.
1
Arithmetisches Mittel
Arithmetisches Mittel:besitzen einige der
n
Beobachtungen den gleichen numerischen Wert können diese zusammengefasst werden¯ x = 1
n
x
1+ · · · + x
1| {z }
n1-mal
+ x
2+ · · · + x
2| {z }
n2-mal
+ · · · + x
k+ · · · + x
k| {z }
nk-mal
mit Häufigkeiten
n
1, n
2, . . . , n
k¯ x = 1
n (x
1n
1+ · · · + x
kn
k) = 1 n
k
X
j=1
x
jn
j=
k
X
j=1
x
jn
jn
mitP
kj=1
n
j= n
2
Arithmetisches Mittel
Arithmetisches Mittel:
¯ x = 1
n
k
X
j=1
x
jn
j=
k
X
j=1
x
jn
jn =
mitj = 1, . . . , k
bzw. mitf
j:=
nnj (relativeHäufigkeiten)¯ x =
k
X
j=1
x
jf
j⇒
gewogenes arithmetisches Mittel3
Arithmetisches Mittel
Arithmetisches Mittel: 4 Eigenschaften
1. SchwerpunkteigenschaftDie Summe der Abweichungen der Einzelwerte vom arithm. Mittel
x ¯
sind Null:n
X
i=1
(x
i− ¯ x) = X
i
x
i− X
i
¯
x = n¯ x − n¯ x = 0
weil
P
i
x
i= n¯ x
(s.Def.¯ v
) undP
i
x ¯ = n¯ x
→
Schwerpunkt einer Verteilung.4
Arithmetisches Mittel
Arithmetisches Mittel: 4 Eigenschaften
2. Die Summe der quadrierten Abweichungen von
x ¯
ist kleiner als von jedem beliebigen anderen Wertz
n
X
i=1
(x
i− x) ¯
2<
n
X
i=1
(x
i− z)
2 fürx ¯ 6 = z
• Warum?
X
i
(xi−z)2 = X
i
(xi−¯x+ ¯x−z)2=X
i
[(xi−x) + (¯¯ x−z)]2
= X
i
(xi−¯x)2+ 2(¯x−z)X
i
(xi−x)¯
| {z }
=0
+X
i
(¯x−z)2
= X
i
(xi−¯x)2+X
i
(¯x−z)2 mitX
i
(¯x−z)2>0
5
Arithmetisches Mittel
Arithmetisches Mittel: 4 Eigenschaften
3. Translationsäquivariant:werden die Einzelwerte linear transformiert
x
∗i= β
1+ β
2x
i, dann gilt¯
x
∗= β
1+ β
2¯ x
• Warum?
¯ x
∗= 1
n X
i
(β
1+ β
2x
i)
= 1
n nβ
1+ β
2X
i
x
i!
= β
1+ β
21 n
X
i
x
i= β
1+ β
2x ¯
6
Arithmetisches Mittel
Arithmetisches Mittel: 4 Eigenschaften
4. gewichtetes arithm. Mittel:Zwei (oder mehrere) Teilgesamtheiten, deren Umfang und arithm. Mittel bekannt sind (
n
1, x ¯
1, n
2, x ¯
2mitn
1+ n
2= n
)¯ x = 1
n x
1x
1 n1X
i=1
x
1i+ n
2n
2 n2X
i=1
x
2i!
= n
1n 1 n
1n1
X
i=1
x
1i! + n
2n 1 n
2n2
X
i=1
x
2i!
= n
1n x ¯
1+ n
2n x ¯
2• Warum?
Aus der Definition des arithm. Mittels n1
X
i=1
x
1i= n
1x ¯
1und n2X
i=1
x
2i= n
2x ¯
27
Varianz
Definition Varianz
Varianz
s
2: mittlere quadratische Abweichung vom arithmetischen Mittelx ¯
.var(x) := s
2= 1
n
n
X
i=1
(x
i− x) ¯
2= 1 n
n
X
i=1
x
2i!
− x ¯
2:= x
2− ¯ x
2nur für metrisch skalierte Variablen.
8
Varianz
Warum?
var(x) = 1 n
n
X
i=1
(x
i− x) ¯
2= 1 n
X
i
x
2i− 2¯ x X
i
x
i+ X
i
¯ x
2!
= 1 n
X
i
x
2i− 2¯ xn¯ x + n¯ x
2!
= 1 n
n
X
i=1
x
2i!
− x ¯
2:= x
2− x ¯
2weil
P
i
x
i= n¯ x
undP
i
¯ x
2= n¯ x
29
Varianz
Linear Transformierte Daten:
Sei
x
∗i= β
1+ β
2x
ifüri = 1, . . . , n var(x
∗) = 1
n
n
X
i=1
(x
∗i− x ¯
∗)
2 Wir haben bereits früher gezeigt, dassx ¯
∗= β
1+ β
2x ¯
.var(x
∗) = 1 n
X
i
(β
1+ β
2x
i− β
1− β
2x) ¯
2= 1 n
X
i
(β
2[x
i− x]) ¯
2= β
221 n
X
i
(x
i− x) ¯
2= β
22var(x
i)
⇒
Addition oder Subtraktion einer Konstante. hat keinen Einfluss auf die Varianz!10
Varianz
Zwei Arten der Varianz
s
2= 1
n
n
X
i=1
(x
i− x) ¯
2 versuss
2s= 1 (n − 1)
n
X
i=1
(x
i− ¯ x)
2• die meisten Programme berechnen die Varianz nach der 2. Formel, d.h. sie verwenden den Vorfaktor
1/(n − 1)
• die Anwendung des Vorfaktor
1/(n − 1)
statt1/n
ist angebracht, wenn die Varianz aus einer Stichprobe berechnet wird und alsSchätzungfür die Varianz der Grundgesamtheit dient.• der Grund dafür liegt im Konzept der später diskutiertenErwartungstreue.
11
Standardabweichung
• Die Varianz ist manchmal schwierig zu interpretieren, wenn z.B.
x
in Euro gemessen wird, hat die Varianz die Dimension Euro2.• DieStandardabweichunghat gegenüber der Varianz den Vorteil, dass sie in der gleichen Einheit wie die Beobachtungswerte gemessen wird.
Definition Standardabweichung
s = p var(x) =
v u u t 1 n
n
X
i=1
(x
i− x) ¯
212
Metrisch skalierte Merkmale: Zusammenhangsmaß
Das wichtigste Zusammenhangsmaß fürmetrisch skalierte Merkmaleist die empirische Kovarianz.
Definition Kovarianz
Die Kovarianz ist eine (nicht standardisierte) Maßzahl für den Zusammenhang zwischen zwei metrisch skalierten statistischen Merkmalen
x
undy
.cov(x, y) = 1 n
n
X
i=1
(x
i− x)(y ¯
i− y) ¯
mit
x ¯ :=
n1P
i
x
iundy ¯ :=
1nP
i
y
i13
Kovarianz
Beispiel:
x y x − x ¯ y − y ¯ (x − x)(y ¯ − y) ¯
2 1 -3 -2 6
3 4 -2 1 -2
4 1 -1 -2 2
6 4 1 1 1
7 2 2 -1 -2
8 6 3 3 9
P
30 18 0 0 14cov(x, y) = 1 n
n
X
i=1
(x
i− x)(y ¯
i− y) = ¯ 14 6 = 2.33
14
Kovarianz: Mittelwerttransformation
0 1 2 3 4 5 6 7 8
0 1 2 3 4 5 6 y
x
b b b b b b
A B
C
D
E F
bc(¯x,¯y)
15
Kovarianz: Mittelwerttransformation
0 1 2 3 4 5 6 7 8
0 1 2 3 4 5 6 y
x
b b b b b b
A B
E F
bc(¯x,¯y)
0 1 2 3
−1
−2
−3
−4 0
−1
−2 1 2 3
¨ y
¨ x
16
Vorzeichen der Kovarianz
0 1 2 3 4 5 6 7 8
0 1 2 3 4 5 6 y
x
b b b b b b
A B
E F
bc(¯x,¯y)
0 1 2 3
−1
−2
−3
−4 0
−1
−2 1 2 3
¨ y
¨ x +
+
−
−
17
Kovarianz
Kovarianz:
• Die Kovarianz ist positiv, wenn
x
undy
tendenziell einen gleichgerichteten linearen Zusammenhang besitzen, d.h. hohe Werte vonx
gehen mit hohen Werten vony
einher und niedrige mit niedrigen.• Die Kovarianz ist negativ, wenn
x
undy
einen gegengerichteten linearen Zusammenhang aufweisen.• Ist die Kovarianz Null, so besteht keinlinearer Zusammenhang(es kann aber trotzdem oder ein nicht-linearer Zusammenhang bestehen, z.B. U-förmig).
18
Rechenregeln für empirische Kovarianzen
1) Symmetrie:
cov(x, y) = cov(y, x)
Warum?
cov(x, y) = 1 n
n
X
i=1
(x
i− x)(y ¯
i− y) ¯
= 1 n
n
X
i=1
(y
i− y)(x ¯
i− x) = cov(y, x) ¯
19
Rechenregeln für empirische Kovarianzen
2) Konstante Faktoren können ausgeklammert werden:für
x, y ∈
Rnund Zahlena, b ∈
Rcov(ax, by) = ab cov(x, y)
Warum?
cov(ax, by) = 1 n
n
X
i=1
(ax
i− a¯ x)(by
i− b¯ y)
= 1 n
n
X
i=1
a(x
i− x)b(y ¯
i− y) ¯
= ab 1 n
n
X
i=1
(x
i− x)(y ¯
i− y) ¯
= ab cov(x, y)
20
Rechenregeln für empirische Kovarianzen
3) Additivität:für
x, y, z ∈
Rncov[x, (y + z)] = cov(x, y) + cov(x, z)
Warum?
cov[x,(y+z)] = 1 n
n
X
i=1
(xi−x)[(y¯ i+zi)−(y+z)]
= 1
n
n
X
i=1
(xi−x)[(y¯ i+zi)−(¯y+ ¯z)]
= 1
n
n
X
i=1
(xi−x)[(y¯ i−y) + (z¯ i−z)]¯
= 1
n
n
X
i=1
(xi−x)(y¯ i−y) +¯ 1 n
n
X
i=1
(xi−x)(z¯ i−z)¯
= cov(x, y) + cov(x, z)
21
Rechenregeln für empirische Kovarianzen
4) Zusammenhang mit empirischer Varianz:für
x ∈
Rncov(x, x) = var(x)
Warum?
cov(x, x) = 1 n
n
X
i=1
(x
i− x)(x ¯
i− x) ¯
= 1 n
n
X
i=1
(x
i− x) ¯
2= var(x)
22
Rechenregeln für empirische Kovarianzen
5) Empirische Varianz einer Summe:für
x, y ∈
Rnvar(x + y) = var(x) + var(y) + 2 cov(x, y)
Warum?
var(x+y) = 1 n
n
X
i=1
[(xi+yi)−(¯x+ ¯y)]2
= 1
n
n
X
i=1
[(xi−x) + (y¯ i−¯y)]2
= 1
n
n
X
i=1
(xi−x)¯2+1 n
n
X
i=1
(yi−y)¯2+
+21 n
n
X
i=1
(xi−x)(y¯ i−y)¯
= var(x) + var(y) + 2 cov(x, y)
23
Kovarianz
Zwei Arten der Kovarianz
cov(x, y) = 1 n
n
X
i=1
(x
i− x)(y ¯
i− y) ¯
versus
cov
s(x, y) = 1 (n − 1)
n
X
i=1
(x
i− ¯ x)(y
i− y) ¯
• die meisten Programme berechnen die Kovarianz nach der 2. Formel, d.h.
sie verwenden den Vorfaktor
1/(n − 1)
• die Anwendung des Vorfaktor
1/(n − 1)
statt1/n
ist angebracht, wenn die Kovarianz aus einer Stichprobe berechnet wird und alsSchätzungfür die Kovarianz der Grundgesamtheit dient.24
Korrelation
Korrelationen:
• Kovarianzenhängen von Maßeinheiten ab! Um einen Zusammenhang vergleichbar zu machen, muss die Kovarianz normiert werden
⇒
Korrelationskoeffizienten• Korrelationen sind eine Gruppe von statistischen Kennwerten, die den
“Zusammenhang”zwischen zwei Variablen messen sollen.
• Bewegen sich die Variablen in die selbe Richtung? Wie stark hängen sie zusammen?
25
Korrelationskoeffizient nach Bravais-Pearson
DefinitionKorrelationskoeffizient nach Bravais-Pearson
Der Korrelationskoeffizient
r
ist ein dimensionsloses Maß für den Grad des linearen Zusammenhangs zwischen zweimindestens intervallskalierten Merkmalen.corr(x, y) := r
xy= cov(x, y) p var(x) p
var(y)
• erfordert mindestensmetrischesSkalenniveau!
26
Korrelationskoeffizient nach Bravais-Pearson
Eigenschaften des Korrelationskoeffizient nach Bravais-Pearson:für Datenvektoren
x, y ∈
Rnund Zahlena, b, c, d ∈
Rgilt1
r
x,ykann nur Werte zwischen− 1
und+1
annehmen− 1 ≤ corr(x, y) ≤ +1
2
r
x,yändert sich nicht bei einer linearen Transformationcorr(ax + b, cy + d) = corr(x, y)
3 Wenn der
corr(x, y) = 0
sind die beiden Merkmale linear unabhängig (sie können aber trotzdem nicht-linear abhängig sein); wenn| corr(x, y) | = 1
sind die Merkmale exakt linear abhängig• corr(x, y) = +1wenny=a+bx
• corr(x, y) =−1wenny=a−bx
27
Korrelationskoeffizient nach Bravais-Pearson
Beispiel:mit
¨ x := x − x ¯
,y ¨ := y − y ¯
x y x¨ x¨2 y¨ y¨2 x¨¨y
2 1 -3 9 -2 4 6
3 4 -2 4 1 1 -2
4 1 -1 1 -2 4 2
6 4 1 1 1 1 1
7 2 2 4 -1 1 -2
8 6 3 9 3 9 9
P 30 18 0 28 0 20 14
r
xy= cov(x, y) p var(x) p
var(y) = 14
√ 28 · 20 = 0.591608
28
Korrelationskoeffizient nach Bravais-Pearson
Übung:Zeigen Sie, dass der Korrelationskoeffizient
r = cov(x, y) p var(x) var(y)
= P
i
(x
i− x)(y ¯
i− y)) ¯ pP
i
(x
i− x) ¯
2P
i
(y
i− ¯ y)
2 alternativ berechnet werden kann alsr =
P
i
x
iy
i− n¯ x¯ y q
( P
i
x
2i− n¯ x)( P
i
y
i2− n¯ y
2)
29