L¨ osungen Vorpr¨ ufung Statistik
Adrianus Kleemans Februar 2016
Einleitung
Nachstehend die detaillierten L¨osungen zur Vorpr¨ufung von Peter M¨urner, welche hier erh¨altlich sind:
• Aufgabenblatt: http://peter-muerner.ch/phwstat.pdf
• Resultate: http://peter-muerner.ch/phwstat1.pdf
Ich ¨ubernehme keine Garantie f¨ur die Korrektheit oder Vollst¨andigkeit der L¨osungswege, oft sind auch andere Methoden denkbar.
1 Datenparameter
Daten: [7.1,6.3,5.4,4.7,4.5,9.2,3.5,7.9,5.4]. Anzahl Elemente n = 9 mit Summe 54. Es macht bei solchen Berechnungen Sinn, die Daten vorzusortieren: [3.5,4.5,4.7,5.4,5.4,6.3,7.1,7.9,9.2]
• Mittelwert: Summe / Anzahl Elemente: 54/9 = 6.00
• Median: Mittleres (= 5.) Element in sortierter Menge1: 5.40
• Spannweite: Gr¨osstes - kleinstes Element: 9.2−3.5 = 5.70
• empirische Standardabweichung:
S= v u u t
1 n−1
n
X
i=1
(Xi−X)¯ 2= v u u t 1 8
9
X
i=1
(Xi−6)2
= r1
8·((3.5−6)2+ (4.5−6)2+...+ (9.2−6)2)
= r1
8·26.06≈1.80
Aufl¨osung der Formel f¨ur die empirische Standardabweichung mit Mittelwert ¯X = 6, Anzahl Datens¨atzen= 9, StichprobenXi=i-te Stichprobe
1Bei einer geraden Anzahl Datens¨atze w¨urde man ¨ublicherweise das Mittel der beiden angrenzenden Werte aus der sortierten Stichprobe nehmen.
2 Gewicht von Neugeborenen
Durchschnittsgewicht berechnen. 6 Kategorien mit deren jeweiliger H¨aufigkeit, in Klammern der Mittelwert der Kategorie:
• 2250-2750 (2500): 3
• 2750-3000 (2875): 11
• 3000-3250 (3125): 17
• 3250-3500 (3375): 33
• 3500-3750 (3625): 9
• 3750-4250 (4000): 1
Wir nehmen von jeder Kategorie den Mittelwert, multiplizieren mit der Anzahl in jeder Kate- gorie und teilen am Schluss durch die Gesamtanzahl (n=74). So erhalten wir einen relativ guten Sch¨atzwert f¨ur das durchschnittliche Gewicht eines Neugeborenen. Man beachte die etwas weiter gefassten ¨aussersten Kategorien (je 500g statt 250g wie die mittleren Kategorien).
(2500·3 + 2875·11 + 3125·17 + 3375·33 + 3625·9 + 4000·1) 1
3 + 11 + 17 + 33 + 9 + 1
= 240250
74 ≈3246.62g
3 Kombinatorik
Es macht bei den Kombinatorik-Aufgaben generell Sinn zuerst zu ¨uberlegen, ob Reihenfolge eine Rolle spielt und ob das Mehrfachziehen (mit Zur¨ucklegen) erlaubt ist.
3.a Rennwagen
22 Fahrer k¨ampfen um 6 Pl¨atze, wie viele verschiedene Verteilungen auf den ersten sechs Pl¨atzen sind m¨oglich?
Reihenfolge spielt eine Rolle. Wir w¨ahlen zuerst einmal aus den 22 Fahrern 6 aus, mit denen wir unsere Pl¨atze besetzen wollen: Wir ziehen 6 aus 22 (⇒ Binomialkoeffizient, siehe Aufgabe 11c). Danach m¨ussen wir uns ¨uberlegen, wie viele M¨oglichkeiten es gibt, 6 Fahrer auf 6 Pl¨atze zuzuweisen: Wir haben 6 Fahrer zur Auswahl f¨ur den ersten Platz, 5 Fahrer f¨ur den zweiten Platz, usw., d.h. 6·5·4·3·2·1 = 6!, d.h.
22 6
·6! = 74613·720 = 5307210360 Uber 53 Millionen m¨¨ ogliche Kombinationen!
Alternativ kann man auch direkt mit der Zuweisung der einzelnen Pl¨atze beginnen, f¨ur den ersten Platz hat man 22 Fahrer zur Auswahl, f¨ur den zweiten 21, usw. bis zum sechsten Platz, wo man noch 17 Fahrer zur Auswahl hat. Dies entspricht der Formel wo Reihenfolge eine Rolle spielt:
n!
(n−k)! = 22!
(22−6)! =22!
16! = 5307210360
3.b Personen in einer Reihe
11 Personen in einer Reihe, wovon 2 unbedingt nebeneinander sitzen wollen, wie viele M¨oglichkeiten gibt es?
Reihenfolge spielt eine Rolle. Hier sind wir schon soweit, dass wir (wie oben im zweiten Schritt) gleich viele Personen wie Pl¨atze haben. Wir setzen zuerst mal zwei hin und ¨uberlegen uns, wie viele M¨oglichkeiten es gibt, diese zwei noch auf den 11 St¨uhlen herumzuschieben. Grunds¨atzlich gibt es 10 M¨oglichkeiten, und wenn die beiden Personen noch tauschen das doppelte, also 20. Die restlichen Personen verteilen wir auf die noch leeren Pl¨atze: 9!, d.h.
9!∗20 = 702570600
3.c Sch¨ ulerdelegation
10 Sch¨uler bilden eine Delegation von 4 Sch¨ulern, welche einen Sprecher bestimmen. Auf wie viele Arten ist dies m¨oglich?
Reihenfolge spielt diesmal keine Rolle. Wir w¨ahlen 4 aus 10 Sch¨ulern aus und da jeder von diesn 4 auch noch Sprecher werden kann, multiplizieren wir mit 4:
10 4
∗4 = 840
4 Regression, Korrelation
4.a Gleichung der Regressionsgeraden
Eingabe der Daten z.B. ¨uber die TI-Nspire Tabellenkalkulation - lineare Regression ergibt:
[ [ 2 , 8 , 4 , 9 , 9 , 4 , 8 , 4 , 6 , 2 , 1 1 , 1 0 ] , [ 3 , 5 , 4 , 7 , 8 , 5 , 7 , 3 , 4 , 2 , 7 , 9 ] ]
2 4 6 8 10
2 4 6 8
Physik (x)
Mathe(y)
Messpunkte
0.64·x+ 1.25 lin. Regression
Die Funktion sieht wie folgt aus:
y= 0.636572·x+ 1.248661
4.b Prognose
Student erreicht in Physik 12 Punkte, wie viel kann er in Mathematik erwarten?
Anwendung der Geradenfunktion:
y= 0.636572∗12 + 1.24866≈8.887529 Der Student kann 8.888≈9 Punkte erwarten.
4.c Korrelationskoeffizienten
Berechnung des (empirischen) Pearson-Korrelationskoeffizienten:
r=
Pn
i=1(xi−¯x)(yi−y)¯ pPn
i=1(xi−x)¯ 2·pPn
i=1(yi−y)¯2 Wir berechnen zuerst die Mittelwerte:
¯ x= 1
n
n
X
i=1
xi= 1
12·77 = 6.4167
¯ y= 1
n
n
X
i=1
xi= 1
12·64 = 5.33
Aufl¨osung der Formel (¨ahnlich wie bei 1. empirische Standardabweichung) durch Ausrechung der einzelnen Summenwerte.
n
X
i=1
(xi−x)(y¯ i−y) = 69.33¯
n
X
i=1
(xi−x)¯ 2= 108.9167
n
X
i=1
(yi−y)¯2= 54.67
Einsetzen ergibt:
69.33
√108.9167·√
54.67 ≈0.8985≈0.90
5 Unfairer W¨ urfel
Anzahl Augen und Wahrscheinlichkeit: x 1 2 3 4 5 6
P(x) 0.28 0.15 0.07 0.07 0.15 0.28
5.a P (A)
P(A) = P(geworfene Zahl ist ungerade)
5.b P (B)
P(B) = P(geworfene Zahl ist eine Dreierpotenz). Dreierpotenzen: 30= 1,31= 3,32= 9, ...
P(B) =P({1,3}) =P({1}) +P({3}) = 0.28 + 0.07 = 0.35 = 35%
5.c P (B ∩ C)
Schnittmenge von B und C heisst, die Zahl muss eine Dreierpotenz und gleichzeitig eine Quadratzahl sein. Quadratzahlen: 12= 1,22= 4,32= 9, ...
P(B∩C) =P({1,3} ∩ {1,4}) =P({1}) = 0.28 = 28%
5.d P (B ∪ C)
Vereinigung statt wie vorher Schnittmenge.
P(B∪C) =P({1,3} ∪ {1,4}) =P({1,3,4}) = 0.28 + 0.07 + 0.07 = 42%
Alternativ k¨onnen wir auch mit der folgenden Formel arbeiten:
P(B∪C) =P(B) +P(C)−P(B∩C)
Dazu m¨ussen wir zuerst P(C) berechnen und k¨onnen dann einsetzen, da aus b) und c) bereits Resultate vorliegen:
P(C) =P({1,4}) =P({1}) +P({4}) = 0.28 + 0.07 = 0.35 P(B∪C) = 0.35 + 0.35−0.28 = 42%
5.e Elemente von D
Primzahlen unter 12: 2, 3, 5, 7, 11. Aus den zwei W¨urfen qualifizieren sich folgende Ele- mente, gruppiert nach Primzahl: D = {(1,1)} ∪ {(1,2),(2,1)} ∪ {(1,4),(4,1),(2,3),(3,2)} ∪ {(1,6),(6,1),(2,5),(5,2),(3,4),(4,3)} ∪ {(5,6),(6,5)}. Insgesamt enth¨altD also 15 Elemente.
6 Urne
Urne enth¨alt 1 schwarze, 4 rote, 3 weisse Kugeln, es wird nacheinander und ohne Zur¨ucklegen zwei Kugeln gezogen. Mit welcher Wahrscheinlichkeit wird man zwei verschiedenfarbige Kugeln ziehen?
Wenn man die verschiedenen F¨alle durchdenkt f¨allt auf, dass man unterscheiden kann, womit man mit dem Ziehen beginnt:
• Zieht man zu Beginn die schwarze, wird man beim zweiten ziehen immer eine andere Farbe haben. Jackpot!
• Bei einer roten Kugel zu Beginn muss man danach eine schwarze oder weisse ziehen, und
• bei einer weissen muss eine rote oder schwarze folgen.
Diese drei F¨alle (oder m¨ogliche Zweige, wenn man die eintreffenden F¨alle als Baum betrachtet) kann man nun beschreiben (so dass sie die schlussendlich die Bedingung erf¨ullen) und addieren, um am Schluss das Gesamtresultat zu erhalten.
Etwas formeller ausgedr¨uckt heisst das P(schwarze Kugel) + P(rote Kugel)*P(schwarze Kugel oder weisse Kugel) + P(weisse Kugel)*P(schwarze oder weisse Kugel).
Dabei muss man beachten, dass die Grundgesamtheit der verf¨ugbaren Kugeln beim zweiten Ziehen um eins abnimmt (man hat ja schon eine Kugel gezogen), also nur noch 7 Kugeln im Spiel sind.
1 8 +4
8· 4 7+3
8· 5 7 = 1
8+16 56+15
56
≈0.125 + 0.285714 + 0.267857≈0.6785714≈67.86%
7 Fallende W¨ urfel
Wie gross ist die Wahrscheinlichkeit, dass von zehn W¨urfeln, die Sie gleichzeitig fallen lassen, wenigstens drei eine Sechs zeigen?
”Wenigstens” drei = 3, 4, 5, ... 10 W¨urfel zeigen eine 6. Dies ist gleichbedeutend mit der Wahrscheinlichkeit 1 - P(genau 0, 1, oder 2 W¨urfel zeigen eine Sechs) = 1 - (P(0 W¨urfel mit Sechs) + P(1 W¨urfel mit Sechs) + P(2 W¨urfel mit Sechs))
Schauen wir uns diese drei F¨alle an:
• P(A) = P(kein W¨urfel zeigt eine Sechs) = 5610
• P(B) = P(1 W¨urfel zeigt eine Sechs) = ein W¨urfel muss genau Sechs zeigen (Wahrschein- lichkeit 16), es spielt aber keine Rolle welcher (W’keit 101
= 10) = 16· 569
· 101
• P(C) = P(2 W¨urfel zeigen eine Sechs) = 2 W¨urfel m¨ussen genau eine Sechs zeigen, es spielt aber keine Rolle welche, 2 aus 10 w¨ahlen = 162
· 568
· 102
1−(P(A) +P(B) +P(C))
= 1− 5
6 10
+1 6 ·
5 6
9
· 10
1
+ 1
6 2
· 5
6 8
· 10
2 !
≈1−(0.1615 + 0.323 + 0.29071)≈0.2247732≈22.48%
8 Urne zum zweiten
Eine Urne mit vielen Kugeln, p = 0.7 eine schwarze und q = 0.3 eine weisse zu ziehen.
8.a H¨ ochstens sechs schwarze Kugeln in 10 Z¨ ugen
Wie vorher kann man die F¨alle einzeln betrachten:
• P(0 schwarze Kugeln) = P(10 weisse Kugeln) =q10
• P(1 schwarze Kugel) =q9·p1· 101
• P(2 schwarze Kugel) =q8·p2· 102
• P(3 schwarze Kugel) =q7·p3· 103 usw.
Zusammengefasst kann man dies auch so ausdr¨ucken:
6
X
i=0
q10−iri 10
i
≈0.350389≈35.04%
Dies entspricht der Binomialverteilung, also k Erfolge in n Versuchen, wobei die Wahrschein- lichkeiten gegeben sind mit p = 0.7 (Erfolg/schwarze Kugel) und q = 1−p = 0.3 (Misserfolg,
8.b Mindestens vier schwarze Kugeln in 10 Z¨ ugen
Gleich wie oben, nur dass wir jetzt mindestens 4 Kugeln (oder auch mehr) haben m¨ussen, also mit 4 bis 10 rechnen:
10
X
i=4
q10−iri 10
i
≈0.9894079≈98.94%
9 Kupferrohre
Normalverteilte Kupferrohre mitµ= 20.15 undσ= 0.12
9.a Abweichung weniger als 0.03
Formulierung l¨asst darauf schliessen, dass das Rohr in beide Richtungen abweichen kann, also bis zu 0.03cm k¨urzer oder l¨anger sein darf. Vom ganzen Integral brauchen wir also den Teil um die Mitte, genauer gesagt was n¨aher als 14σanµliegt:
20.15 y
Wir k¨onnen das Intervall auf Φ nicht direkt berechnen, sondern m¨ussen von links her zuerst das gr¨ossere nehmen und das kleinere abziehen, damit der Teil in der Mitte ¨ubrig bleibt.
Φ(20.18)−Φ(20.12) = Φ(µ+ 0.25σ)−Φ(µ−0.25σ)
≈0.19741265136584329
≈19.74%
9.b Gr¨ osse ¨ uber 20cm
Hier brauchen wir die einseitige Berechnung von Φ. Dieser Wert wird sicher ¨uber 50% sein, da der Mittelwertµ= 20.15 mit drin ist.
20.15 y
Da wir ¨uber Φ nur von der linken Seite her berechnen k¨onnen, ziehen wir alles vor 20 von 1 ab:
1−Φ(20) = 1−Φ(µ−1.25σ)≈0.89435≈89.44%
10 Pr¨ ufung
Normalverteilte Punktezahl mitµ = 36 undσ = 8, wie viele Punkte braucht es um in den Top 10% zu sein?
Dies ist der inverse Fall zur letzten Aufgabe: Wir wissen, wie viel Prozent ”unter der Kurve”
liegen m¨ussen und suchen den Wert, bei dem dieser Wert erreicht ist. Wir suchen also die Anzahl Punktex, sodass 90% unter der markierten Fl¨ache ist:
36 x y
Da Normalverteilung gegeben ist, suchen wir Φ(x) = 90% f¨ur ein x = Anzahl ben¨otigte Punkte.
Grob absch¨atzen k¨onnen wir das x sicher ¨uberµ = 36 Punkten liegen muss (50%-Marke), aber unterµ+ 2σ= 26 + 2·8 = 50 Punkten (da 97.5% unterµ+ 2σliegt).
Aus der Tabelle https://de.wikipedia.org/wiki/Tabelle Standardnormalverteilung sehen wir, dass 90% bei 1.29 ¨uberschritten is (mit linearer Interpolation etwas genauer: 1.2816, oder mit entsprechenden Tools wie Python: scipy.stats.norm(36, 8).ppf(0.9)) d.h.
x=µ+ 1.2816·σ= 36 + 10.2528 = 46.2528
Wenn mindestens die besten 10% der Studierenden ausgezeichnet werden sollen reichen 46 Punkte, wenn maximal 10% ausgezeichnet werden sollen braucht es etwas mehr, also 47 Punkte.
11 Feuerwerkraketen
Ein Produzent von Feuerwerkraketen behauptet, 95% seiner Produkte seien in Ordnung. Ein Eink¨aufer testet 20 zuf¨allig ausgew¨ahlte Raketen. Ermitteln Sie die folgenden Wahrscheinlichkeiten unter der Voraussetzung, dass die Behauptung des Verk¨aufers zutrifft.
11.a Beliebige Rakete funktioniert nicht
Direkt aus Aufgabenstellung, 1 - 95% = 5.00%.
11.b Alle Raketen funktionieren
Alle 20 Raketen funktionieren heisst, dass die erste Rakete funktioniert (was mit 95% der Fall ist), multipliziert mit dem Fall, dass die zweite Rakete funktioniert, und so weiter.
95%·95%·95%·...·95% = (95%)20= 0.9520≈0.3584859≈35.85%
11.c Genau 2 Raketen funktionieren nicht
Genau 2 Raketen funktionieren nicht heisst ebenso, dass genau 18 funktionieren m¨ussen. Da aber nicht genau festgelegt ist, welche von den Raketen denn nun funktionieren m¨ussen und welche nicht, k¨onnen wir uns ¨uberlegen:
• Wie wahrscheinlich ist die Konstellation, dass genau zwei auserw¨ahlte Raketen nicht funk- tionieren und der Rest schon?
• Wie viele dieser Konstellationen (18 ja - 2 nein) kann es geben mit 20 Raketen?
Am Schluss k¨onnen wir die Wahrscheinlichkeit multiplizieren mit den Anzahl M¨oglichkeiten, in der sie auftreten kann.
F¨ur den ersten Teil wissen wir ja was die jeweiligen Wahrscheinlichkeiten sind, 5% und 95%.
D.h. f¨ur zuerst zwei funktionierende und dann 18 nicht funktionierende Raketen zu haben ist die Wahrscheinlichkeit 5%·5%·95%·95%·...·95%.
F¨ur den zweiten Teil der Anzahl M¨oglichkeiten k¨onnen wir uns auf die zwei Raketen konzen- trieren, die nicht funktionieren, und berechnen, wie viele M¨oglichkeiten es gibt, aus 20 m¨oglichen Raketen genau diese zwei auszuw¨ahlen. Denn damit sind auch die anderen 18 schon festgelegt.
Wir m¨ussen also 2 aus 20 ausw¨ahlen. Dies k¨onnen wir mit dem Binomialkoeffizient berechnen, dieser ist definiert als
n k
= n!
k!(n−k)!
Das heisst, f¨ur 2 aus 20 auszuw¨ahlen gibt es so viele M¨oglichkeiten:
20 2
= 20!
2!18!= 2432902008176640000 2·6402373705728000 = 190 Das ergibt schlussendlich:
0.9518·0.052· 20
2
= 0.9518·0.052·190≈0.1886768≈18.87%