(Buch S. 24)

(1)

Vorlesung 5a

Varianz und Kovarianz

(2)

1. Varianz und Standardabweichung:

Elementare Eigenschaften

(Buch S. 24)

(3)

X sei reellwertige Zufallsvariable mit endlichem Erwartungswert µ.

Die Varianz von X ist definiert als Var_[X_{] :=} E_[(X ₋ _µ)²_],

die erwartete quadratische Abweichung

der Zufallsvariablen X von ihrem Erwartungswert µ.

(4)

Statt

Var

_[X_] schreiben wir auch Var_X

oder σ_X²

oder (wenn klar ist, welche Zufallsvariable gemeint ist) σ².

(5)

Wie ¨andert sich die Varianz,

wenn man X um eine Konstante verschiebt?

Var_[X ₊ _d] ₌

E

_[((X ₊ _d) ₋ _(µ ₊ _d))²_{] =} Var_X

Und wenn man X mit einer Konstanten multipliziert (“skaliert”)?

Var_[cX_] ₌

E

_[(cX ₋ _cµ)²_{] =} _c²Var_X

(6)

Die Standardabweichung (Streuung) von X ist die Wurzel aus der Varianz:

σ := σ_X := √

Var

_X

=

r

E

_[(X ₋ _µ)²_].

Sie gibt an, mit welcher

”typischen Abweichung“

der Zufallsvariablen X von ihrem Erwartungswert man rechnen sollte.

(7)

Es gilt:

σ_X_+d = σ_X,

σ_cX = c σ_X.

Man sagt: σ ist ein Skalenparameter.

(8)

F ¨ur Zufallsvariable mit endlichem Erwartungswert gilt:

Var_[X_{] = 0} _⇔ P_X ₌ E_[X_] _{= 1} _.

Die ¨Aquivalenz sieht man aus der Gleichheit Var_[X_{] =} E_[(X ₋ E_[X_])²_]

zusammen mit dem

Satz ¨uber die Positivit ¨at des Erwartungswertes.

Wenn es eine Zahl µ gibt mit P_X ₌ _µ _{= 1}

sagt man auch:

(9)

Wie der Erwartungswert ist auch die Varianz von X durch die Verteilung von X bestimmt:

Hat X die Verteilungsgewichte ρ(a), a ∈ S ⊆ R und Erwartungswert µ, so ist

Var

_X ₌ ^X

a∈S

(a − µ)² ρ(a) .

(10)

2. Einfache Beispiele

(11)

Beispiel 1:

Eine faire M ¨unze wird dreimal geworfen.

X = Z₁ + Z₂ + Z₃ . . . Anzahl K ¨opfe Var _[X_]

= 1

8(0 − 3

2)² + 3

8(1 − 3

2)² + 3

8(2 − 3

2)² + 1

8(3 − 3 2)²

= 1

8 · 9 + 3 + 3 + 9

4 = 3 · 1 4

(12)

Beispiel 2:

Eine p-M ¨unze wird einmal geworfen.

P

_(Z _{= 1) =} _p,

P

_(Z _{= 0) =} _q

Var_[Z_]

= q(0 − p)² + p(1 − p)² = qp² + p²

= pq(p + q) = pq.

(13)

Beispiel 3:

Anzahl der Erfolge beim zweimaligen p M ¨unzwurf.

Var

_[Z₁ ₊ _Z₂_{] =?}

Wir rechnen mit Zufallsvariablen:

E

_[(Z₁ ₊ _Z₂ ₋ _2p)²_{] =}

E

_[(Z₁ ₋ _p ₊ _Z₂ ₋ _p)²_]

=

E

_[(Z₁ ₋ _p)² _{+ (Z}₂ ₋ _p)² _{+ 2(Z}₁ ₋ _p)(Z₂ ₋ _p)]

=

E

_[(Z₁ ₋ _p)²_{] +}

E

_[(Z₂ ₋ _p)²_{] + 2}E_[(Z₁ ₋ _p)(Z₂ ₋ _p)]

=

Var

_[Z₁_{] +}

Var

_[Z₂_{] + 2}E_[Z₁ ₋ _p] E_[Z₂ ₋ _p]

wegen der Unabh ¨angigkeit von Z₁ und Z₂

(14)

Beispiel 3:

Anzahl der Erfolge beim zweimaligen p M ¨unzwurf.

Var_[Z₁ ₊ _Z₂_]

=

E

_[(Z₁ ₊ _Z₂ ₋ _2p)²_{] =}

E

_[(Z₁ ₋ _p ₊ _Z₂ ₋ _p)²_]

=

E

_[(Z₁ ₋ _p)² _{+ (Z}₂ ₋ _p)² _{+ 2(Z}₁ ₋ _p)(Z₂ ₋ _p)]

=

E

_[(Z₁ ₋ _p)²_{] +}

E

_[(Z₂ ₋ _p)²_{] + 2}E_[(Z₁ ₋ _p)(Z₂ ₋ _p)]

=

Var

_[Z₁_{] +}

Var

_[Z₂_] ₊ ₀

= 2pq

(15)

3. Die Varianz der Binomialverteilung

(Buch S. 50 und S. 26)

(16)

(Z₁, . . . , Z_n) sei n-facher p-M ¨unzwurf.

Var

_[Z₁ ₊ _{· · ·} ₊ _Z_n_{] =?}

Gehen wir genauso vor wie im vorigen Beispiel, so finden wir

Var

_[Z₁ ₊ _{· · ·} ₊ _Z_n_]

=

Var

_[Z₁_{] +} _{· · ·} ₊

Var

_[Z_n_]+0.

Fazit: Die Varianz der Bin(n, p)-Verteilung ist npq.

(17)

4. Zwei Formeln f ¨ur ^Var [X ]

(18)

Var

_[X_{] =}

E

_[X²_] ₋ ₍

E

_[X_])²

Denn:

E

_[(X ₋ _µ)²_{] =}

E

_[X² ₋ _2µX ₊ _µ²_]

=

E

_[X²_] ₋ _2µ

E

_[X_{] +} _µ² ₌

E

_[X²_] ₋ _µ² (wegen Linearit ¨at des Erwartungswertes)

(19)

Zwei (manchmal) hilfreiche Formeln:

(1)

Var

_[X_{] =}

E

_[X²_] ₋ ₍

E

_[X_])²

(2)

Var

_[X_{] =}

E

_[X_(X ₋ _1)] ₋ ₍

E

_[X_])² ₊

E

_[X_]

(2) folgt aus (1) durch Subtrahieren und Addieren von

E

_[X_]

(20)

5. Die Varianz der Poissonverteilung

(Buch S. 29)

(21)

Zur Erinnerung:

Die Poissonverteilung mit Parameter λ

entsteht als Grenzwert von Binomialverteilungen mit n → ∞, p → 0, np → λ.

Weil dann npq gegen λ konvergiert, steht zu vermuten:

Die Varianz einer Pois(λ)-verteilten Zufallsvariablen X ist λ.

(22)

Beweis durch Rechnung:

E

_[X_(X ₋ _{1)] =} ^X^∞

k=0

k(k − 1)λ^k

k!e⁻^λ

= λ² ^X^∞

k=2

λ^k⁻²

(k − 2)!e⁻^λ = λ². Nach der obigen Formel (2) gilt:

Var

_[X_{] =}

E

_[X_(X ₋ _1)] ₋ ₍

E

_[X_])² ₊

E

_[X_{] =} λ² − λ² + λ.

(23)

6. Die Varianz einer Summe von ZV’en und die Kovarianz von zwei ZV’en

(Buch S. 60)

(24)

Beim zweifachen p-M ¨unzwurf Z₁, Z₂ ergab sich aus der Unabh ¨angigkeit der Z_i:

Var

_[Z₁ ₊ _Z₂_{] =}

Var

_[Z₁_{] +}

Var

_[Z₂_].

Wie “streuen” Summen von

nicht unabh ¨angigen Zufallsgr ¨oßen?

Wie steht’s mit der

Varianz einer Summe von Zufallsvariablen?

(25)

Var

_[X ₊ _Y _{] =}

E

_[((X ₋ _µ_X_{) + (Y} ₋ _µ_Y ₎₎²_]

=

E

_[(X ₋_µ_X₎²_{] +}

E

_[(Y ₋_µ_Y ₎²_{] + 2}

E

_[(X ₋_µ_X_)(Y ₋_µ_Y _)]

Mit der Definition der Kovarianz

Cov_{[X, Y} _{] :=} E_[(X ₋ _µ_X_)(Y ₋ _µ_Y _)]

bekommen wir

Var

_[X ₊ _Y _{] =}

Var

_X ₊

Var

_Y _{+ 2}

Cov

_{[X, Y} _].

(26)

Die Kovarianz

Cov

_{[X, Y} _{] =}

E

_[(X ₋ _µ_X_)(Y ₋ _µ_Y _)]

ist positiv,

wenn X und Y die Tendenz haben, gemeinsam ¨uber bzw. gemeinsam unter

ihrem Erwartungswert auszufallen.

(Gr ¨oßere Abweichungen fallen dabei mehr ins Gewicht.)

(27)

(X, Y )

µ_X µ_Y

R

(28)

Ist

Cov

_{[X, Y} _]

= 0, dann nennt man X, Y unkorreliert

> 0, . . .AAAAAAAAAAAA positiv korreliert

< 0, . . . AAAAAAAAAAAA negativ korreliert.

Zum Spezialfall von Indikatorvatiablen I_E₁, I_E₂ siehe auch Abschnitt 6 in V4b.

(29)

Zwei weitere Spezialf ¨alle:

Y = X :

Cov

_{[X, Y} _{] =}

E

_[(X ₋ _µ_X_)(X ₋ _µ_X_{)] =}

Var

_[X_] Y = −X :

Cov

_{[X, Y} _{] =}

E

_[(X ₋ _µ_X₎₍₋_X ₊ _µ_X_{)] =} ₋

Var

_[X_]

(30)

Var

_[X ₊ _Y _{] =}

Var

_X ₊

Var

_Y _{+ 2}

Cov

_{[X, Y} _].

Ganz analog ergibt sich:

Var_[Z₁ ₊ _{· · ·} ₊ _Z_n_]

= Var _Z₁ ₊ _{· · ·} ₊ Var _Z_n _{+ 2} ^X

i<j

Cov_[Z_i_{, Z}_j_]

(31)

Eine n ¨utzliche Umformung von

Cov

_{[X, Y} _]:

E

_[(X ₋ _µ_X_)(Y ₋ _µ_Y _{)] =}

E

_[XY ₋ _µ_X_Y ₋ _Xµ_Y ₊ _µ_X_µ_Y _]

=

E

_[XY _] ₋ _µ_X_µ_Y

wegen der Linearit ¨at des Erwartungswertes.

Also:

Cov

_{[X, Y} _{] =}

E

_[XY _] ₋

E

_[X_]

E

_[Y _]

(32)

Cov

_{[X, Y} _{] =}

E

_[XY _] ₋

E

_[X_]

E

_[Y _]

Aus der Multiplikationsformel f ¨ur den Erwartungswert sehen wir

Unabh ¨angige Zufallsvariable X und Y sind unkorreliert.

(33)

Wir halten fest:

Sind X₁, . . . , X_n reellwertige Zufallsvariable mit endlicher Varianz und

Cov_[X_i_{, X}_j_{] = 0} _{f ¨ur} _i ₆₌ _j

(man sagt daf ¨ur auch: die X_i sind paarweise unkorreliert)

dann gilt:

Var

_[X₁ ₊ _{· · ·} ₊ _X_n_{] =}

Var

_X₁ ₊ _{· · ·} ₊

Var

_X_n Und allgemein gilt:

(34)

Var

_[Z₁ ₊ _{· · ·} ₊ _Z_n_{] =}

Var

_Z₁ ₊ _{· · ·} ₊

Var

_Z_n _{+ 2} ^X

i<j

Cov

_[Z_i_{, Z}_j_]

Speziell ist f ¨ur unabh ¨angige Zufallsvariable mit endlichen Varianzen

die Varianz der Summe gleich der Summe der Varianzen.

(35)

7. Die Varianz der hypergeometrischen Verteilung

(Buch S. 32 und S. 61)

(36)

Ein Beispiel f ¨ur die Anwendung der Formel

Var

_[Z₁ ₊ _{· · ·} ₊ _Z_n_{] =}

Var

_Z₁ ₊ _{· · ·} ₊

Var

_Z_n _{+ 2} ^X

i<j

Cov

_[Z_i_{, Z}_j_]:

Die Anzahl der “Erfolge” beim Ziehen ohne Zur ¨ucklegen.

In einer Urne sind r rote und b blaue Kugeln.

Es wird n-mal ohne Zur ¨ucklegen gezogen.

X := Anzahl der gezogenen roten Kugeln.

Var

_[X_{] =?}

(37)

Zur Erinnerung:

Mit g := r + b ist

P

_(X ₌ _{k) =}

r k

b n−k

g

n

, k = 0, . . . , r.

X heißt hypergeometrisch verteilt mit Parametern n, g und r.

Erwartungswert und Varianz kann man direkt

¨uber die Verteilungsgewichte ausrechnen (siehe Buch S. 32).

Es geht auch eleganter (vgl Buch S. 50/51):

(38)

Wir betrachten dazu die Zufallsvariable Z_i, die

. . . den Wert 1 annimmt, falls die i-te gezogene Kugel rot ist, . . . und sonst den Wert 0.

Man sagt daf ¨ur auch:

Z_i ist die Indikatorvariable (kurz: der Indikator)

des Ereignisses {i-te gezogene Kugel rot}.

(39)

X := Z₁ + · · · + Z_n

E

_[Z_i_{] =}

P

_(Z_i _{= 1) =} _p, _mit

p := r

g der Anteil der roten Kugeln in der Urne.

Also:

E

_[X_{] =} _np.

Und wie stehts mit der Varianz von X?

(40)

X := Z₁ + · · · + Z_n

Var

_X ₌

Var

_Z₁ ₊ _{· · ·} ₊

Var

_Z_n _{+ 2} ^X

1≤i<j≤n

Cov

_[Z_i_{, Z}_j_]

Sei g = r + b die Gesamtanzahl der Kugeln, p := r

g der Anteil der roten Kugeln in der Urne, q := 1 − p.

Var

_Z_i ₌ _pq_.

Cov

_[Z _{, Z} _{] =?}

(41)

Ein eleganter Weg zur Berechnung von

Cov

_[Z_i_{, Z}_j_]:

Wir ziehen in Gedanken, bis die Urne leer ist (d.h. wir setzen n = g.)

(42)

Wir ziehen in Gedanken, bis die Urne leer ist.

Dann ist

Z₁ + · · · + Z_g = r, also

Var

_[Z₁ ₊ _{· · ·} ₊ _Z_g_{] =} _0.

0 =

Var

_Z₁ ₊ _{· · ·} ₊

Var

_Z_g _{+ 2} ^X

1≤i<j≤g

Cov

_[Z_i_{, Z}_j_], _d.h.

0 = gpq + g(g − 1)

Cov

_[Z₁_{, Z}₂_], _d.h.

Cov

_[Z₁_{, Z}₂_{] =} ₋ ¹ _pq

(43)

X = Z₁ + · · · + Z_n

Var

_X ₌

Var

_Z₁ ₊ _{· · ·} ₊

Var

_Z_n _{+ 2} ^X

1≤i<j≤n

Cov

_[Z_i_{, Z}_j_]

= n

Var

_Z₁ ₊ _n(n ₋ ₁₎

Cov

_[Z₁_{, Z}₂_]

= npq − n(n − 1) 1

g − 1pq

= npq



1 − n − 1 g − 1



 = npq g − n

g − 1.

(44)

Fazit:

Die Varianz von Hyp(n, g, pg) ist npq g − n

g − 1.

(45)

8. Das √

n-Gesetz:

folgt aus der Additivit ¨at der Varianz unabh ¨angiger ZV’er:

Seien X₁, . . . , X_n unabh ¨angig und identisch verteilt mit Varianz σ².

Dann gilt f ¨ur die Varianz

des Mittelwerts M_n := _n¹(X₁ + · · · + X_n):

Var

_[M_n_{] =} ¹

n² · nσ² = ¹_nσ². Man hat somit das ber ¨uhmte √

n-Gesetz:

σ_M_n = √¹ nσ.

(46)

9. Die Die Ungleichung von Chebyshev

(Buch S. 74)

(47)

Es geht um die anschauliche Botschaft

“Je weniger eine reellwertige Zufallsvariable streut, mit um so gr ¨oßerer Wahrscheinlichkeit

f ¨allt sie nahe zu ihrem Erwartungswert aus.”

Quantifiziert wird das durch die

(48)

Die Ungleichung von Chebyshev:

Y sei eine reellwertige Zufallsvariable mit endlichem Erwartungswert µ.

Dann gilt f ¨ur alle ε > 0:

P₍_|_Y ₋ _µ_{| ≥} _ε) _≤ ¹ ε²

Var_[Y _] Beweis:

Mit X := (Y − µ)² ist die Behauptung ¨aquivalent zu P_(X _≥ _ε²₎ _≤ ¹

ε²

E_[X_].

Das aber folgt aus der Ungleichung von Markov.

(49)

10. Das Schwache Gesetz der Großen Zahlen

ist eine unmittelbare Folgerung aus dem √

n-Gesetz zusammen mit der Ungleichung von Chebyshev: Seien

X₁, X₂, . . . unabh ¨angig

(oder zumindest paarweise unkolleliert)

und identisch verteilt mit Erwartungswert µ und endlicher Varianz. Dann gilt f ¨ur die Mittelwerte

M_n := ¹_n(X₁ + · · · + X_n):

P₍_|_M_n ₋ _µ_{| ≥} _ε) _≤ ¹ ε²

Var

_[M_n_] _→ ₀ _{f ¨ur} _n _{→ ∞}_.

(50)

11. Zusammenfassung

(51)

Var

_[X_{] :=}

E

_[(X ₋ _µ)²_]

Var

_[X ₊ _Y _{] =}

Var

_[X_{] +}

Var

_[Y _{] + 2}

Cov

_{[X, Y} _]

Die Varianz einer Summe von unkorrelierten ZV’en ist gleich der Summe der Varianzen,

die Varianz einer Summe von negativ korrelierten ZV’en ist kleiner als die Summe der Varianzen.

(52)

Die Varianz von Bin(n, p) ist npq.

Die Varianz von Hyp (n, g, pg) ist npq g − n g − 1.

(53)

Die Varianz von Bin(n, p) ist npq.

Die Varianz von Hyp (n, g, pg) ist npq g − n g − 1.

Die Varianz einer Poisson(λ)-verteilten Zufallsvariablen ist so groß wie ihr Erwartungswert,

n ¨amlich λ.

Ungleichung von Chebyshev:

P

₍_|_Y ₋ _µ_{| ≥} _{ε σ}_Y ₎₎ _≤ ¹ ε²

(54)

Cov

_{[X, Y} _{] :=}

E

_[(X ₋ _µ_X_)(Y ₋ _µ_Y _)]

=

E

_[XY _] ₋

E

_[X_]

E

_[Y _]

Speziell f ¨ur Indikatorvariable:

Cov

_[I_E

1, I_E₂]

=

P

_(E₁ _∩ _E₂₎ ₋

P

_(E₁₎

P

_(E₂_).

(Buch S. 24)

Vorlesung 5a

Varianz und Kovarianz

1. Varianz und Standardabweichung:

Elementare Eigenschaften

(Buch S. 24)

Var

E

E

Var

E

Var

2. Einfache Beispiele

P

P

Var

E

E

E

E

E

Var

Var

E

E

E

E

E

Var

Var

3. Die Varianz der Binomialverteilung

(Buch S. 50 und S. 26)

Var

Var

Var

Var

4. Zwei Formeln f ¨ur Var [X ]

Var

E

E

E

E

E

E

E

Var

E

E

Var

E

E

E

E

5. Die Varianz der Poissonverteilung

(Buch S. 29)

E

Var

E

E

E

6. Die Varianz einer Summe von ZV’en und die Kovarianz von zwei ZV’en

(Buch S. 60)

Var

Var

Var

Var

E

E

E

E

Var

Var

Var

Cov

Cov

E

Cov

Cov

E

Var

4. Zwei Formeln f ¨ur ^Var [X ]