1. Zerlegung eines Erwartungswertes nach der ersten Stufe

(1)

Vorlesung 9a

Bedingte Erwartung

1

(2)

1. Zerlegung eines Erwartungswertes nach der ersten Stufe

(Buch S. 91)

(3)

Wie in der vorigen Vorlesung betrachten wir die

gemeinsame Verteilung von zwei Zufallsvariablen X₁, X₂, aufgebaut aus der Verteilung von X₁

und den Ubergangsverteilungen:¨ P_(X₁ ₌ _a₁_{, X}₂ ₌ _a₂₎ ₌ P_(X₁ ₌ _a₁₎ P_a

1(X₂ = a₂) ν(a₁, a₂) = ρ(a₁)P(a₁, a₂)

Auch der Erwartungswert

einer reellwertigen Zufallsvariablen g(X₁, X₂) kann nach der ersten Stufe zerlegt werden.

3

(4)

Sei g : S₁ × S₂ → R.

Wir betrachten die Zufallsvariable h(X₁, X₂).

F ¨ur a₁ ∈ S₁ setzen wir

E_a

1

hg(X₁, X₂)ⁱ := ^X

a₂∈S₂

g(a₁, a₂)P_a

1(X₂ = a₂)

und nennen diese Zahl den

(5)

Merke:

Der bedingte Erwartungswert

E

_a

1

hg(X₁, X₂)ⁱ

wird gebildet mit der ¨Ubergangsverteilung P (a₁, .), also mit den Wahrscheinlichkeitsgewichten,

die die Zeile P(a₁, .) der Matrix P bilden:

E

_a

1

hg(X₁, X₂)ⁱ = ^X

a₂∈S₂

g(a₁, a₂)P(a₁, a₂)

5

(6)

X₁

X₂

S₁ a₁

S₂

(a₁, a₂) 7→ g(a₁, a₂)

R

(7)

Ahnlich wie die Verteilungsgewichte von¨ (X₁, X₂)

l ¨asst sich auch der Erwartungswert

E

_[_g₍_X₁_{, X}₂_)]

nach den Ausg ¨angen von X₁ zerlegen.

(Zerlegung des Erwartungswerts nach der ersten Stufe)

7

(8)

E

^h_g₍_X₁_{, X}₂₎ⁱ

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂) P_(X₁ ₌ _a₁_{, X}₂ ₌ _a₂₎

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂) P_(X₁ ₌ _a₁₎ P_a

1(X₂ = a₂)

(9)

E

^h_g₍_X₁_{, X}₂₎ⁱ

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂)

P

_(X₁ ₌ _a₁_{, X}₂ ₌ _a₂₎

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂)

P

_(X₁ ₌ _a₁₎

P

_a

1(X₂ = a₂)

9

(10)

E

^h_g₍_X₁_{, X}₂₎ⁱ

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂)

P

_(X₁ ₌ _a₁_{, X}₂ ₌ _a₂₎

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂)

P

_(X₁ ₌ _a₁₎ P_a

1(X₂ = a₂)

= ^X

a₁∈S₁

P

₍_X₁ ₌ _a₁₎E_a

1

hg(a₁, X₂)ⁱ

(11)

E

^h_g₍_X₁_{, X}₂₎ⁱ

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂)

P

_(X₁ ₌ _a₁_{, X}₂ ₌ _a₂₎

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂)

P

_(X₁ ₌ _a₁₎ P_a

1(X₂ = a₂)

= ^X

a₁∈S₁

P

₍_X₁ ₌ _a₁₎E_a

1

hg(a₁, X₂)ⁱ

=

E

^h

E

_X

1[g(X₁, X₂)]ⁱ.

11

(12)

E

^h_g₍_X₁_{, X}₂₎ⁱ

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂) P_(X₁ ₌ _a₁_{, X}₂ ₌ _a₂₎

= ^X

a₁∈S₁

X

a₂∈S₂

g(a₁, a₂) P_(X₁ ₌ _a₁₎ P_a

1(X₂ = a₂)

= ^X

a₁∈S₁

P

₍_X₁ ₌ _a₁₎

E

_a

1

hg(a₁, X₂)ⁱ

=

E

^h

E

_X

1[g(X₁, X₂)]ⁱ.

“Zerlegung des Erwartungswertes nach der ersten Stufe”

(13)

Merke: Der bedingte Erwartungswert

E

_a

1

hg(X₁, X₂)ⁱ ist eine Zahl.

EX₁

hg(X₁, X₂)ⁱ ist eine Zufallsvariable.

Wir nennen diese Zufallsvariable die

bedingte Erwartung von g(X₁, X₂) gegeben X₁.

13

(14)

E^h_g₍_X₁_{, X}₂₎ⁱ ₌ E^hE_X

1[g(X₁, X₂)]ⁱ

Ist X₂ reellwertig (also S₂ ⊂ R),

dann ergibt sich als Spezialfall (mit g(a₁, a₂) := a₂) E_a

1[X₂] = ^X

a₂∈S₂

a₂ P_a

1(X₂ = a₂) , Wir haben dann die einpr ¨agsame Formel

E

_[_X₂_{] =}

E

_[

E

_X

1[X₂]]

(Zerlegung des Erwartungswertes von X₂ nach X₁.)

(15)

2. Ein Beispiel: Suchen in Listen.

(Buch S. 85-87)

15

(16)

n Namen werden in ℓ Listen einsortiert. Dadurch ergibt sich ein ℓ-Tupel k = (k₁, . . . , k_ℓ) von Listenl ¨angen

(eine “Besetzung” k der Pl ¨atze 1, . . . , ℓ)

Jeder Name steht in seiner Liste Nr. j an einer der Stellen i = 0, . . . , k_j − 1.

Dieses i bezeichnet man auch als (Such-)Tiefe des Namens.

(17)

Vorstellung: Die Listennummer j = 1, . . . , ℓ entspricht dem Anfangsbuchstaben des Namens.

Beispielsweise ist

f ¨ur ℓ = 4 m ¨ogliche Anfangsbuchstaben und n = 15 Namen

eine m ¨ogliche Besetzung:

17

(18)

0

1

2

3

4

4 5 i j

n = 15, ℓ = 4

(19)

0

1

2

3

4

4 5 i j

Erste Frage: Was ist f ¨ur gegebene Listenl ¨angen k = (k_j) der Erwartungswert der Tiefe T

eines rein zuf ¨allig aus den n herausgegriffenen Names?

19

(20)

0

1

2

3

4

4 5 i j

Liste j = 2,

(21)

0

1

2

3

4

4 5 i j

Liste j = 4, Tiefe i = 3.

21

(22)

0

1

2

3

4

4 5 i j

Was ist bei gegebenem k

der Erwartungswert der Suchtiefe T

(23)

0

1

2

3

4

4 5 i j

Die Antwort ist

E

k[T] = 1 n

ℓ

X

j=1

k_j−1

X

i=0

i = 1 n

ℓ

X

j=1

k_j(k_j − 1)

2 .

23

(24)

Wir betrachten jetzt ein

stochastisches Modell f ¨ur die erste Stufe:

Annahme:

Die zuf ¨allige Besetzung Z = (Z₁, . . . , Z_ℓ) kommt durch n-maliges W ¨urfeln

mit den Gewichten p₁, . . . , p_ℓ zustande.

Z ist multinomial (n, p₁, . . . , p_ℓ)-verteilt.

(Vorstellung: Die n Namen

(25)

Aus den n Namen wird rein zuf ¨allig einer herausgegriffen.

Es sei T die Tiefe des Namens in seiner Liste.

Aufgabe: Berechne E_[T_].

Diese Erwartungswert beschreibt die mittlere Suchzeit (Suchtiefe)

aller in den Listen vorhandenen Namen.

25

(26)

Der Erwartungswert von T, gegeben Z = k, war

E

_k_[_T_{] =} ¹ n

Xℓ j=1

k_j(k_j − 1)

2 .

Mit der oben hergeleitetet Zerlegung des Erwartungswertes

E

_[_T _{] =}

E

^h

E

_Z_[_T_]ⁱ

erhalten wir

1 ^ℓ Z (Z − 1)

(27)

E

_[T_{] =} ¹ n

Xℓ j=1

E

Z_j(Z_j − 1)

2

Nach Annahme ist Z_j Binomial(n, p_j)-verteilt.

Mit der Formel

Var

_[_Z_{] =}

E

_[_Z²_] ₋ ₍

E

_[_Z_])² _folgt

E_[Z_j_(Z_j ₋ _1)] ₌

Var

_[Z_j_{] +}

E

_[Z_j_]² ₋

E

_[Z_j_]

= np_j(1 − p_j) + (np_j)² − np_j = p²_j n(n − 1),

E_[T_{] =} ⁿ ⁻ ¹

2 (p²₁ + · · · + p²_ℓ ) .

27

(28)

E_[_T_{] =} ⁿ ⁻ ¹

2 (p²₁ + · · · + p²_ℓ ) . Im Fall uniformer Gewichte

p₁ = · · · = p_ℓ = 1/ℓ

ergibt sich

E

_[T _{] =} ⁿ ⁻ ¹ 2ℓ .

(29)

Eine Modifikation des vorigen Beispiels:

Sei Z wieder multinomial (n, p₁, . . . , p_ℓ)-verteilt,

J sei unabh ¨angig von Z, mit

P

₍_J ₌ _j_{) =} _p_j_, _j _{= 1}, . . . , ℓ.

Berechne den Erwartungswert von G := Z_J.

(Man kann dabei denken an den Erwartungswert der Suchzeit nach einem in den Listen nicht vorhandenen Namen.)

Wir fassen Z als erste Stufe auf, und Z_J als zweite, und . . .

29

(30)

. . . zerlegen

E

_[_Z_J_] nach den Ausg ¨angen von Z:

E

_{[G] =}

E

_[Z

J] = ^X

k

P

_(Z ₌ _k) E

k[Z_J]

= ^X

k

P

_(Z ₌ _k) E_k_[k_J_] ₌ ^X

k

P

_(Z ₌ _k)

Xℓ j=1

k_j p_j

= ^X^ℓ

j=1

p_j ^X

k

k_j P_(Z ₌ _k)

(31)

Im Fall uniformer Gewichte p₁ = · · · = p_ℓ = 1/ℓ

ergibt sich

E

_{[G] =} ⁿ

ℓ .

Im Vergleich dazu war (siehe voriges Besipiel) die erwartete Suchtiefe eines rein zuf ¨allig aus den n

herausgegriffenen Namens

E

_[_T _{] =} ⁿ ⁻ ¹ 2ℓ .

31