• Keine Ergebnisse gefunden

L¨osung 10 GrundlagenderMathematikII(LVA401-0622-00U)

N/A
N/A
Protected

Academic year: 2021

Aktie "L¨osung 10 GrundlagenderMathematikII(LVA401-0622-00U)"

Copied!
6
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Dr. Marcel Dettling 14.05.2010

Dr. Daniel Haase FS 2010

daniel.haase@math.ethz.ch

Grundlagen der Mathematik II (LVA 401-0622-00 U)

L¨ osung 10

Zur ¨Ubungsstunde vom 14.05.2010

Aufgabe 28 (Die Gleichverteilung)

(a) Die Wahrscheinlichkeitsfunktion f¨ur die ZufallsvariableX =

”Anzahl der geworfenen Augen mit einem regul¨aren W¨urfel“ ist eine Uniform-Verteilung. Nun wird ein solcher regul¨arer W¨urfel aber 2x geworfen undY =

”Summe der Augenzahlen aus den beiden W¨urfen“. Es handelt sich nun nicht mehr um eine Uniform-Verteilung. Bestimme und zeichne die entsprechende diskrete Wahrscheinlichkeitsfunktion.

auf. Beachte dass die Summe ¨uber alle Wahrscheinlichkeiten gleich Eins sein muss.

(b) Nun haben wir es mit einem gef¨alschten W¨urfel zu tun. Er ist so gef¨alscht, dass die Wahrscheinlichkeit f¨ur eine bestimmte Augenzahl umgekehrt proportional zur Augenzahl ist. Es sei nun X =

”Anzahl der geworfenen Augen“. Bestimme und zeichne die entsprechende Wahrscheinlichkeitsfunktion. Der gef¨alschte W¨urfel wird nun 2x geworfen. Bestimme und zeichne die Wahrscheinlichkeitsverteilung f¨ur Y =

”Summe der Augenzahlen aus den beiden W¨urfen“.

(c) Ein auf der Strasse gefundener Franken ist leicht verbogen. Er wird 10mal geworfen, und das dreimal hintereinander. Die W¨urfe lauten

KZZKKZZZKK , KZZZZZZZZZ , ZZZZZZZZZZ .

Berechne die relative H¨aufigkeit der Kopf-W¨urfe separat f¨ur die drei Folgen. Danach berechne die Wahrscheinlichkeit f¨ur diese Folgen unter der Annahme, dass die M¨unze fair ist (also 50% Wahr- scheinlichkeit f¨ur Kopf), und dann unter der Annahme, dass der Kopf eine Wahrscheinlichkeit von nur 0.4 besitzt. Beachte dass es hier auf die korrekte Reihenfolge ankommt.

L¨osung

Zu a): Da nur die Augensumme gez¨aht wird sind die m¨oglichen Ergebnisse 2,3,4, . . . ,12, die haben allerdings unterschiedliche Wahrscheinlichkeiten, weil die Augensumme 3 beispielsweise durch die W¨urfe (1,2) und (2,1) erreicht werden kann, die Summe 2 aber nur durch den einzigen Wurf (1,1). Jedes Paar (x1, x2) hat die gleiche Wahrscheinlichkeit (weilx1 undx2 jeweils uniform verteilt sind). Da es 6·6 = 36 m¨ogliche Paare gibt, ist die Einzelwahrscheinlichkeit f¨ur jedes Paar 361 ≈0.277. Wir z¨ahlen wieviele Paare zu einer gegebenen Augensumme f¨uhren:

(2)

Wert vonY Ergebnisse von (X1, X2) zuY Wahrscheinlichkeit

2 Augen (1,1) P(Y = 2) = 361

3 Augen (1,2),(2,1) P(Y = 3) = 362

4 Augen (1,3),(2,2),(3,1) P(Y = 4) = 363 5 Augen (1,4),(2,3),(3,2),(4,1) P(Y = 5) = 364 6 Augen (1,5),(2,4),(3,3),(4,2),(5,1) P(Y = 6) = 365 7 Augen (1,6),(2,5),(3,4),(4,3),(5,2),(6,1) P(Y = 7) = 366 8 Augen (2,6),(3,5),(4,4),(5,3),(6,2) P(Y = 8) = 365 9 Augen (3,6),(4,5),(5,4),(6,3) P(Y = 9) = 364 10 Augen (4,6),(5,5),(6,4) P(Y = 10) = 363

11 Augen (5,6),(6,5) P(Y = 11) = 362

12 Augen (6,6) P(Y = 12) = 361

Als Histogramm:

Zu b): Hier m¨ussen wir zuerst die nicht-uniforme Verteilung von X bestimmen, der Anzahl der Augen eines Wurfes mit einem (gef¨alschten) W¨urfel. Laut Aufgabe soll sie antiproportional zur Augenzahl sein, alsoP(X= k) = c· 1k f¨ur eine unbekannte Konstante c. Die ist dann aber durch die Normierungsbedingung P(Alles) = 1 festgelegt, wie in in Aufgabe 27 nur dass wir hier mit Summen statt Integralen arbeiten. Die Summe ¨uber alle m¨oglichen Ergebnisse des Wurfes ist

P(Alles) =

6

X

k=1

P(X =k) =

6

X

k=1

c k = c·

1 1 +1

2 +1 3+1

4+1 5 +1

6

= c·60 + 30 + 20 + 15 + 12 + 10

60 = c·147

60 = c·2.45.

Damit die Gesamtwahrscheinlichkeit Eins ist, m¨ussen wir den Kehrwertc=14760 ≈0.408 einsetzen. Damit steht die Verteilung des gef¨alschten W¨urfels fest:

P(X = 1) = c

1 = 0.408 , P(X = 2) = c

2 = 0.204 , P(X = 3) = c

3 = 0.136 , P(X = 4) = c

4 = 0.102 , P(X= 5) = c

5 = 0.081 , P(X= 6) = c

6 = 0.068. Als Histogramm also

(3)

Aus dieser Verteilung berechnen wir wieder die Doppelwurf-Verteilung f¨ur Y, jetzt sind aber nicht mehr alle Paare (x1, x2) gleichwahrscheinlich, wir m¨ussen die Summen aus Teil (a) weiter auftrennen. Dazu ¨uberlegt man sich, dass wegen der Unabh¨angigkeit der W¨urfe gelten muss

P(Paar (x1, x2) gew¨urfelt) = P(X1=x1 undX2=x2) = P(X=x1)·P(X =x2)

= c x1 · c

x2 = 0.1664· 1 x1·x2 .

F¨ur jede m¨ogliche Augenzahl m¨ussen wir die verschiedenen Wahrscheinlichkeiten ¨uber die Einzelpaare aufad- dieren:

Wert vonY Ergebnisse von (X1, X2) zuY Wahrscheinlichkeit

2 Augen (1,1) P(Y = 2) =c2·1 = 0.166

3 Augen (1,2),(2,1) P(Y = 3) =c2·(12+12) = 0.166

4 Augen (1,3),(2,2),(3,1) P(Y = 4) =c2·(13+14+13) = 0.152 5 Augen (1,4),(2,3),(3,2),(4,1) P(Y = 5) =c2·(14+16+16+14) = 0.138 6 Augen (1,5),(2,4),(3,3),(4,2),(5,1) P(Y = 6) =c2·(15+18+19+18+15) = 0.126 7 Augen (1,6),(2,5),(3,4),(4,3),(5,2),(6,1) P(Y = 7) =c2·(16+101 +121 +121 +101 +16) = 0.116 8 Augen (2,6),(3,5),(4,4),(5,3),(6,2) P(Y = 8) =c2·(121 +151 +161 +151 +121) = 0.060 9 Augen (3,6),(4,5),(5,4),(6,3) P(Y = 9) =c2·(181 +201 +201 +181) = 0.035 10 Augen (4,6),(5,5),(6,4) P(Y = 10) =c2·(241 +251 +241) = 0.020 11 Augen (5,6),(6,5) P(Y = 11) =c2·(301 +301) = 0.011

12 Augen (6,6) P(Y = 12) =c2·361 = 0.005

Als Histogramm:

(4)

Zu c): Die relative H¨aufigkeit der Kopf-W¨urfe ist einfach deren Anzahl geteilt durch die Gesamtzahl der W¨urfe:

FolgeKZZKKZZZKK : h = 5

10 = 0.5 FolgeKZZZZZZZZZ : h = 1

10 = 0.1 FolgeZZZZZZZZZZ : h = 0

10 = 0.0

Diese H¨aufigkeiten sind als Aussage grunds¨atzlich verschieden von den Wahrscheinlichkeiten f¨ur das Auftre- ten dieser W¨urfe: Es sei X = (X1, . . . , X10) die Zufallsvariable die eine Wurffolge beschreibt, und Xj die Zufallsvariable mit Werten {0,1} mit X = 1 f¨ur Kopf im j-ten Wurf. Dann ist bei einer fairen M¨unze P(Xj = 0) =P(Xj = 1) = 12, und wegen der Unabh¨angigkeit der Einzelw¨urfe folglich

P(X = (x1, . . . , x10)) = P(X1=x1undX2=x2und . . . undX10=x10)

= P(X1=x1)·P(X2=x2)· · ·P(X10=x10) = 1 2 ·1

2· · ·1

2 = 1

1024 = 0.00097.

Dabei ist es ganz egal welche Werte wir in die Zielwertexj schreiben, weil Kopf und Zahl in jedem Einzelwurf die gleiche Wahrscheinlichkeit haben. Jede der drei Wurffolgen hat also die gleiche Wahrscheinlichkeit 10241 . Jetzt nehmen wir an, dass die M¨unze nicht fair ist mit Kopf-Wahrscheinlichkeit P(Xj = 1) = 0.4 und dem Gegenereignis ZahlP(Xj= 0) = 0.6 in einem Einzelwurf. Dann haben wir f¨ur die drei Folgen:

P(X = (KZZKKZZZKK)) = 0.45·0.65 = 0.00079 P(X= (KZZZZZZZZZ)) = 0.41·0.69 = 0.004

P(X = (ZZZZZZZZZZ)) = 0.610 = 0.006. Hier ist es also wahrscheinlicher, eine Folge mit hohem Zahl-Anteil zu bekommen.

Aufgabe 29 (Die Binomialverteilung)

(a) Wie hoch ist die Wahrscheinlichkeit, mit einer fairen M¨unze bei 5 W¨urfen genau zweimal Kopf zu werfen?

(b) Wie hoch ist die Wahrscheinlichkeit, mit einer unfairen M¨unze (Kopf hat Wahrscheinlichkeit 0.4) bei 5 W¨urfen h¨ochstens zweimal Kopf zu werfen?

(c) Wie hoch ist die Wahrscheinlichkeit, genau 500mal Kopf zu werfen wenn man 1000mal werfen darf?

Beantworte die Frage f¨ur den Fall dass die M¨unze fair ist (also echte 50%-Chance auf Kopf), und dass sie unfair ist (Wahrscheinlichkeit nur 0.4 f¨ur den Kopf). Bearbeite diese Frage nicht per Hand, sondern verwendeMathematica: der ZufallsvariablenX ordnet man die BinomialverteilungB(n, p) zu mit dem KommandoX = BinomialDistribution[n,p], danach kann man mitPDF[X][k]die Wahr- scheinlichkeitP(X=k) abfragen.

(5)

(d) Wie hoch ist bei einer fairen M¨unze die Wahrscheinlichkeit, bei 1’000’000’000 W¨urfen h¨ochstens 500’000’000 mal den Kopf zu erhalten?

L¨osung

Die Binomialverteilung misst die Wahrscheinlichkeit eine Anzahl von Erfolgen zu erzielen wie beim M¨unzwurf, nur dass es nicht mehr auf die Reihenfolge der einzelnen W¨urfe ankommt. Beim M¨unzwurf fallen beispielsweise die Ergebnisse KZZZZZZZZZ und ZZZZZZZZZK zusammen. Ist die Erfolgswahrscheinlichkeit im Wurf p ∈ [0,1], so ist die geordnete Erfolgswahrscheinlichkeit f¨ur die Folge von n W¨urfen pk(1−p)n−k, genau k Erfolge in n W¨urfen zu haben. Jetzt fallen alle Sortierungen der Folge zu einem einzigen Ereignis zusammen, es gibt

n k

= n!

k!(n−k)!

M¨oglichkeiten die Folge anzuordnen wenn k Erfolge und n−k Fehlschl¨age zu sortieren sind. Daher ist die Binomialverteilung gegeben durch

X ∼ B(n, p) , P(X=k) = n

k

pk(1−p)n−k. Zu a): Bei einer fairen M¨unze istp= (1−p) =12, also haben wir

P(X= 2) = 5

2

·0.52·0.53 = 5!

2!·3!·0.55 = 0.3125.

Zu b): Bei der unfairen M¨unze haben wirp= 0.4 Erfolgswahrscheinlichkeit, und 1−p= 0.6 Fehlschlagswahr- scheinlichkeit. Die Wahrscheinlichkeit h¨ochstens zweimal Kopf zu bekommen ist

P(X ≤2) = P(X= 0) +P(X = 1) +P(X= 2) =

2

X

k=0

5 k

·0.4k·0.65−k

= 1·0.40·0.65 + 5·0.41·0.64 + 10·0.42·0.63 = 0.68256.

Zu c): Diese Werte berechnetMathematicanat¨urlich nicht mit den Binomialkoeffizienten (die werden f¨urn≥10 so groß dass man nicht mehr anst¨andig damit rechnen kann, sondern mit einer ausgefeilten N¨aherungsformel.

F¨ur die unfaire M¨unze gibt Mathematica einen Wert aus der ann¨ahernd Null ist, bei der fairen M¨unze dagegen den WertPDF[X][500]=0.025. Diese Chance von ca. 2% ist ¨uberraschend hoch wenn man bedenkt dass es sich um ein Einzelergebnis unter 21000 m¨oglichen Wurffolgen handelt. Das liegt daran, dass die Wurffolge bei der Binomialverteilung ungeordnet ist, und die geringe Einzelwahrscheinlichkeit durch die extrem hohe Anzahl an m¨oglichen Umordnungen kompensiert wird (ein ¨ahnlicher Kompensationseffekt findet im Teil a) der vorigen Aufgabe in der Tabelle f¨ur Y statt). Bei der unfairen M¨unze versagt die Kompensation (wie in Teil b) der vorigen Aufgabe), bei tausend W¨urfen dominiert die Verzerrung richtung Zahl einfach zu sehr.

Zu d): Hier kann man auch Mathematica fragen, die analytische N¨aherung f¨ur B(n, p) ist so effizient, dass auch diese großen Werte problemlos verarbeitet werden. Mit ein wenig Nachdenken kommen man aber auch ohne Rechnung darauf, dass die Wahrscheinlichkeit ≈ 12 sein muss, weil die Beschreibung aus der Aufgabe genau die H¨alfte der ungeordneten Wurffolgen beschreibt. Die hat dann auch nach der Zusammenfassung zu den ungeordneten Ereignissen die Wahrscheinlichkeit 12. Das der Wahrscheinlichkeitswert denMathematicahier produziert nicht exakt.5 ist liegt daran, dass 1000000000 eine gerade Zahl ist: ein Ereignis liegt genau auf der Mitte, und man kann es leider nicht zerteilen.

Aufgabe 30 (Eine Korrelation)

Lade den Datensatz zur Serie 10 von der Homepage, und bearbeite dann die folgenden Aufgaben mit Mathe- matica:

(6)

(a) Auftrennung der Blumensorten: Sind es die Sepal- oder die Petalbl¨atter, welche die verschiedenen Blumensorten am besten unterscheiden k¨onnen? Probiere zur Beantwortung dieser Frage alle 4 quan- titativen Variablen einzeln mit einem geeigneten Plot durch.

(b) Scatterplot der Sepalbl¨atter: Erstelle einen Scatterplot von L¨ange und Breite der Sepalbl¨atter, ohne Regressions- und Gl¨attungsgerade.

(c) Separate Scatterplots: Nun drei separate Scatterplots jeweils f¨ur die drei Blumensorten, indem Du die Stichprobe auftrennst.

(d) Berechnung der Korrelation: Berechne die Korrelation zwischen L¨ange und Breite der Sepalbl¨atter sowohl mit der Methode von Pearson, wie auch mit der Methode von Spearman, ¨uber die gesamte Stichprobe.

(e) Berechnen die Korrelation zwischen L¨ange und Breite f¨ur jede einzelne Blumensorte.

Die Datens¨atze beschreiben die L¨angen und Breiten der verschiedenen Blatttypen dreier Blumensorten. Ziel ist es, Anhand der Blatteigenschaften die Art der Blume zu bestimmen.

Die Struktur der Datens¨atze ist:

(1) Sepal (L¨ange) (2) Sepal (Breite) (3) Petal (L¨ange) (4) Petal (Breite) (5) Blumensorte

L¨osung

Vergleiche das NB-File auf der Homepage.

(a) Die vier Plots der Variablen jeweils mit der Sorte zeigen, dass die Petalbl¨atter durch die Sorte st¨arker beeinflusst werden als die Sepalbl¨atter, wobei es nicht viel Unterschied macht ob man die L¨ange oder Breite verwendet.

(b) Die drei Scatterplots der Sepalbl¨atter sind f¨ur die drei Sorten ziemlich ¨ahnlich.

(c) Die Pearson-Korrelation zwischen Sepalbreite und Sepall¨ange ¨uber alle Sorten ist%P =−0.11757, das ist sehr gering. Das verwundert da die Breite und die L¨ange eines Blattes normalerweise voneinander abh¨angen. Die Spearman-Korrelation zwischen Sepalbreite und Sepall¨ange ¨uber alle Sorten ist mit

%P =−0.16677 nur wenig besser.

(d) Mit ρ1 = 0.7425 ist der Korrelationskoeffizient der Sepalbl¨atter der Sorte 1 recht hoch, auch ρ2 = 0.5259 f¨ur die zweite Sorte ist gut, ebensoρ3= 0.4572. Alle drei Werte liegen weit ¨uber der Korrelation

¨uber die gesamte Stichprobe, d. h. die Bl¨attl¨angen und Blattbreiten h¨angen schon stark voneinander ab, nur ist die Art des Zusammenhangs bei jeder Sorte anders. Bei der Korrelationsprobe ¨uber die gesamte Stichprobe ist das aber nicht mehr erkennbar.

Referenzen

ÄHNLICHE DOKUMENTE

Ein Ger¨ at zur Messung des pH-Wertes einer L¨ osung gibt Werte aus die fehlerhaft sind, und durch eine normal- verteilte Zufallsvariable modelliert werden mit Mittelwert µ (der

Der Bleigehalt wird durch eine normalverteilte Zufallsvariable X mit Standardabweichung σ[X] = 6ppb, also Varianz Var[X] = 36ppb 2 modelliert: X ∼ N (µ, 36) f¨ ur einen

Die Fahrg¨ aste wundern sich: im Mittel m¨ usste die Wartezeit genau 5 Minuten betragen (wenn man annimmt, dass die Fahrg¨ aste zu zuf¨ alligen Zeitpunkten an der

Beispiele: LinearModelFit[Liste,{x1, x2},{x1, x2}] erzeugt ein Modell mit zwei Eingabevariablen x1 und x2, die in der Reihenfolge y = b0 + b1 ∗ x1 + b2 ∗ x2 auftreten, dagegen

Bringe die augmentierte Matrix auf Zeilenstufenform, bestimme den Rang sowie eine ¨ Basis des Vektorraums, der von den Zeilen der Matrix erzeugt wird.. Entscheide, ob das LGS l¨

Das doppelte Gleich- heitszeichen ist Absicht, sonst interpretiert Mathematica die Zeile als eine Zuweisung.. Der Befehl zum Aufl¨ osen lautet

Allerdings sind weder der Ortsvektor noch die Richtungsvektoren eindeutig bestimmt, sie beschreiben aber immer die gleiche L¨ osungsmenge L.... Lese aus dem Output von Mathematica

Zu c): Da das Reaktionsverm¨ ogen der Testpersonen relativ zueinander beurteilt wurde (also danach, welche Gruppe im Vergleich zu den anderen besser abgeschnitten hat) wird der