• Keine Ergebnisse gefunden

Lösungsansätze

Im Dokument Jahrgang 33 Heft 115 September 2013 (Seite 28-34)

Computersimulation

Bei komplexen Aufgabenstellungen in der Wahrscheinlichkeitsrechnung hilft oft eine kleine Computersimulation vorweg. Wir wollen jetzt die mittlere Anzahl an Zügen (Würfen etc.) bestimmen, bis wir eine Serie aus n Elementen vollständig erhalten. Mit anderen Worten geht es um die Bestimmung des Erwartungswertes.

Das Programm ARIBAS1 ist ein frei verfügbarer Zahleninterpreter, der sich für die Simulation des Problems eignet:

function serie(n, N :integer) : real;

var figur : array[n+1] of integer;

i,j,p,su : integer;

y : real;

begin

for i:=1 to n do figur[i]:=0; end;

su:=0;

for i:=1 to N do

for j:=1 to n do figur[j]:=0; end;

j:=0;

while sum(figur) < n do

1 Forster, Otto:http://www.mathematik.uni-muenchen.de/forster/sw/aribas.html

inc(j);

p:= random(n) + 1;

figur[p]:=1;

end;

su:= su + j;

end;

y:= su/N;

return y;

end;

Das Programm liefert uns den Erwartungswert für eine Serie aus n Figuren, wobei das Sammeln einer kompletten Serie N mal wiederholt wird. Wir wählen N sehr groß (N = 106), um einen plausiblen Mittelwert zu erhalten. Die folgende Tabelle zeigt die simulierten Erwartungswerte für n = 2, 3, ... , 12. Die Folge der Erwar-tungswerte ist monoton steigend, wie man aus den Differenzen erkennt. Im Falle der Serie aus 6 Figuren müssten wir also im Mittel 15 Überraschungseier kaufen.

Für den Rest des Artikels sei Xn die Zufallsvariable, welche die Anzahl der Züge (Würfe etc.) angibt, bis die Serie aus n Figuren vollständig ist.

n E(Xn) E(Xn)−E(Xn1)

2 3.0 2.0

3 5.5 2.5

4 8.34 2.84

5 11.41 3.07

6 14.71 3.30

7 18.153 3.442

8 21.686 3.53

9 25.47 3.78

10 29.2795 3.809 11 33.2175 3.938 12 37.2495 4.032 Markowkette

0 1 2 3 4 5 6

p1 = 1 p2 = 56 p3 = 46 p4 = 36 p5 = 26 p6 = 16

1

6 2

6 3

6

4

6 5

6

6 6

Markowkette für eine Serie aus sechs Figuren

Wir können den Erwartungswert für das Sammeln einer Serie der Länge n mit Hilfe einer Markowkette (Zl)l=0,1,... mit den Zuständen 0, 1, 2, . . .n berechnen, wobei „Zl = j“ bedeutet, dass wir nach l „Käufen“ j Figuren besitzen. Startpunkt ist der Zustand 0: „Z0 ≡ 0“, das heißt wir besitzen zunächst keine Figur. Beim ersten Kauf erhalten wir deswegen garantiert eine neue Figur, das heißt

p1 = P(Z1 = 1 | Z0 = 0) = 1.

Angenommen wir besitzen zu einem gewissen Zeitpunkt j Figuren. Die Wahr-scheinlichkeit, beim nächsten Kauf eine neue Figur zu erwerben, ist dann nnj, das heißt (Zl)l hat die Übergangswahrscheinlichkeiten

P(Zl+1 = j + 1| Zl = j) = n−j

n =: pj+1, 0 ≤ j ≤ n−1, P(Zl+1 = j | Zl = j) = j

n = 1−pj+1, 0≤ j ≤n −1.

Mit Wj,j = 0, 1, ... ,n−1, bezeichnen wir nun die Anzahl der weiteren Käufe, die wir benötigen, um eine weitere Figur zu erwerben, wenn wir gerade die j-te Figur erhalten haben, das heißt „Wj = k“ = „Zl = ... = Zl+k1 = j, Zl+k = j + 1“. alle Figuren erworben sind:

E(Xn) =

Hinweis: Harm(n) bezeichnet hier die n-te Partialsumme der harmonischen Reihe.

Sie ist in vielen Mathematikprogrammen fertig als Funktion enthalten, so zum Beispiel in Mathematica als HarmonicNumber[n].

Speziell für n = 6 (zum Beispiel „Würfeln“) ergibt sich also:

E(X6) = 6·

1 + 1 2 + 1

3 + 1 4 + 1

5 + 1 6

= 6· 147

60 = 14,7.

Man muss also im Mittel 15 Überraschungseier kaufen, um alle Figuren einer Serie von 6 zu erhalten.

Klassische Wahrscheinlichkeitstheorie

Die Problemstellung wurde in der Literatur schon vonde Moivre,EulerundLaplace behandelt. Sie taucht dort unter den Bezeichnungen Sammlerproblem, Coupon-Collector-Problem oderProblem der vollständigen Serieauf. In dem Buch Stochas-tik für Einsteiger2 findet sich eine verallgemeinerte Herleitung. Dort wird folgende Frage aufgeworfen: Wie groß schätzt Du die Chance ein, dass beim Samstagslotto (von den Zahlen 1 bis 49 werden sechs verschiedene zufällig gezogen) im Laufe eines Jahres (52 Ausspielungen) jede Zahl mindestens einmal Gewinnzahl gewesen ist?

In Einkleidung eines Teilchen-/Fächermodells gibt es beim Sammlerproblem n nummerierte Fächer, wobei ein Versuch darin besteht, s der n Fächer rein zufällig auszuwählen und mit je einem Teilchen zu besetzen. Dieser Besetzungsvorgang wird in unabhängiger Folge wiederholt. Wie viele Versuche sind nötig, bis jedes Fach (mindestens) ein Teilchen enthält?

Interpretieren wir die 6 Augenzahlen des Würfels beziehungsweise die 49 Lotto-zahlen als Fächer, so führen die eingangs gestellten Fragen zu Sammlerproble-men mit n = 6,s = 1 (Wie lange muss gewürfelt werden, bis jede Augenzahl mindestens einmal aufgetreten ist?) beziehungsweise n = 49,s = 6 (Wieviele Lotto-Ausspielungen müssen erfolgen, bis jede der 49 Zahlen mindestens einmal Gewinnzahl gewesen ist?).

In Norbert Henzes Stochastik für Einsteiger wird unter Anwendung der Formel des Ein- und Ausschließens (Siebformel) die Wahrscheinlichkeit berechnet, dass in den ersten k Versuchen mindestens ein Fach nie besetzt wird. Dies entspricht dem Ereignis, dass in den ersten k Versuchen noch nicht alle Fächer belegt werden, das heißt, dass „Xn > k“.A(i1, ... ,ir)sei das Ereigbnis, dass in den ersten k Versuchen keines der Fächer mit den Nummern i1, . . . ,ir besetzt wird. Die Wahrscheinlichkeit dafür, dass dieses bei einem Versuch geschieht, ist durch den Quotienten

qr =

nr s

n s

, n−r ≥ s,

2 Henze, Norbert: Stochastik für Einsteiger, 9. erweiterte Auflage, Vieweg + Teubener, Wiesbaden, 2012

gegeben (Laplace-Modell). Aufgrund der Unabhängigkeit von Ereignissen, welche sich auf verschiedene Versuche beziehen, gilt dann:

P(A(i1, ... ,ir)) = qrk. Mit der Siebformel erhält man

P(Xn > k) = P Durch Differenzbildung erhalten wir die Verteilungsfunktion für die Anzahl Xn der Versuche, bis alle Fächer belegt sind:

P(Xn = k) = P(Xn > k −1)−P(Xn > k) ergibt sich für den Erwartungswert:

E(Xn) =

Im Spezialfall s = 1 (also unserer ursprünglichen Aufgabenstellung) ist a = n und qr = 1− rn. Für den Erwartungswert ergibt sich deshalb die Formel

E(Xn) = n

Durch trickreiches Umformen weist man nach, dass die Formeln (1) und (2) über-einstimmen.

Hierzu sind folgende Identitäten von Nutzen:

a)

c) Wir zeigen den Fall j = 1:

In einer Ebene, die mit einem (x,y)-Koordinatensystem versehen ist, sitzt ein Frosch, der sein Sprungtraining nach mathematischen Regeln betreibt.

(1) Sein erstes Trainingsprogramm besteht aus Sprüngen längs der x-Achse, wobei er weder vom Punkt (0 | 0) noch vom Punkt (1 | 0) startet. Sei-ne Sprungregel lautet: Springe vom Punkt (x | 0) zum Punkt (11x | 0).

Die nach dieser Regel möglichen Sprungfolgen findet er allesamt langweilig.

Warum wohl?

(2) Sein nächstes Übungsprogramm läuft nach der folgenden Regel ab: Springe vom Punkt (x | y) zum nächsten Punkt (y | y−x). Auch bei so möglichen Sprungfolgen ist der Frosch bald gelangweilt. Weshalb diesmal?

(3) Wenn die Sprungregel lautet: Springe von einem Punkt (x | y) – der auf keiner Koordinatenachse liegt – zum nächsten Punkt

y er dann nicht beliebig viele Sprünge machen, falls die y-Koordinate seines Startpunktes 6= 1 ist?

Lösung

Nach drei Sprüngen ist der Frosch wieder am Startpunkt.

(2) Eine Sprungfolge mit dem Startpunkt (x | y) ist nach der Sprungregel:

(x | y) −→ (y | y −x) −→ (y −x | −x) −→ (−x | −y)

−→(−y | x −y) −→ (x −y | x) −→(x | y) .

Im Dokument Jahrgang 33 Heft 115 September 2013 (Seite 28-34)

ÄHNLICHE DOKUMENTE