Statistik IT4
Dozent: Prof. Dr. Heinz-Willi Goelden
Mitschrift der Vorlesung SS 2002
Lemberger Timo
(lemberger@sodenet.de)
www.thunder.li/statistik
Statistik für Informatiker Inhaltsübersicht
1. Deskriptive Statistik
Merkmale
Häufigkeiten und deren Darstellung
Statistische Parameter
Zweidimensionale Stichproben
Robustheit von Maßzahlen
2. Grundzüge der Wahrscheinlichkeitsrechnung
Zufallsexperimente
Ereignisse und Ereignisalgebren
Die klassische Wahrscheinlichkeitsdefinition
Statistische Wahrscheinlichkeiten
Die axiomatische Begründung der Ws-Theorie
Charakterisierung diskreter Ws-Räume
Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen
3. Zufallsvariable und deren Verteilungen
Der Begriff der Zufallsvariablen
Diskrete Zufallsvariable und spezielle diskrete Verteilungen
Stetige Zufallsvariable und spezielle stetige Verteilungen
Momente einer Verteilung
4. Mehrdimensionale Verteilungen
Zweidimensionale Verteilungen
Randverteilungen – Unabhängigkeit von Zufallsvariablen
Funktionen mehrerer Zufallsvariablen
Stichprobenvariable und Testverteilungen
Zufallsmatrizen - Zufallsgraphen
5. Induktive Statistik: Schätzen und Testen
Schätzfunktionen
Die Maximum-Likelihood-Methode
Konfidenzintervalle
Testen von Hypothesen
I. Deskriptive (beschreibende) Statistik
1. Merkmale
Gesammelt werden Daten über ein Merkmal X, das an den Elementen einer umfangreichen Beobachtungsmenge (von Individuen und Objekten) in unterschiedlicher Ausprägung zu erkennen ist.
Beobachtungsmenge = Grundgesamtheit Ziel der Datenanalyse:
Beschreibung der Verteilung dieser Ausprägung über die Beobachtungsmenge.
Beispiel:
Fragen an ehemalige Studenten der Informatik, die in den letzten 5 Jahren den Abschluß als Diplom-Informatiker gemacht haben (Grundgesamtheit):
(1) Wieviel Monate dauerte es vom Erwerb des Diploms bis zur ersten Anstellung?
quantitatives Merkmal (N0)
(2) War ihre erste Anstellung an einem Hochschulinstitut, einem sonstigen Forschungsinstitut, in einer Großfirma (mehr als 200 Mitarbeiter), in einem mittelgroßen Betrieb (30-200
Mitarbeiter) oder in einer Kleinfirma (weniger als 30 Mitarbeiter)?
qualitatives Merkmal ({Hochschulinstitut, sonstiges Forschungsinstitut, Groß-, Mittel-, Kleinfirma})
(3) Wie schätzen sie ihr Gehalt ein? Besser als das Gehalt von Mathematikern in ihrer oder einer vergleichbaren Firma, etwa gleich oder niedriger?
Rangmerkmal
quantitatives Merkmal diskretes Merkmal stetiges Merkmal
2. Häufigkeiten und deren Darstellung
Sei x ein quantitatives Merkmal, das an den Elementen einer Beobachtungsmenge zu erkennen ist.
Ergebnis: Stichprobe (Meßreihe) x1, x2, …, xn vom Umfang n (Die Stichprobenwerte müßen nicht verschieden sein)
Beispiel (aus Abschnitt 1):
Wartezeit (in Monaten)
absolute Häufigkeit
relative Häufigkeit
0 32 0,10 1 23 0,07 2 48 0,15 3 162 0,50
4 0 0,00
5 18 0,06 6 10 0,03
7 0 0,00
8 10 0,03
9 0 0,00
10 0 0,00
11 0 0,00
12 0 0,00
>12 18 0,06
321 1
Häufigkeitstabelle
Stabdiagramm
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0 1 2 3 4 5 6 7 8 9 10 11 12 >12
Histogramm
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0 1 2 3 4 5 6 7 8 9 10 11 12 >12
Def.: Für x∈R sei g(x) die Anzahl der Werte in der Stichprobe, die gleich x sind (also 0
) (x ≠
g , falls x∈
{
x1,x2,...,xn}
) g(x) absolute Häufigkeitn x x g
h ( )
)
( = relative Häufigkeit
Die Funktion h heißt Häufigkeitsfunktion oder empirische Dichte des Merkmals x (bei der Stichprobe x1, x2, …, xn)
empirische Dichte
0 0,1 0,2 0,3 0,4 0,5 0,6
20.03.2002 Def.: Sei G(x) die Anzahl der Werte in der Stichprobe, die kleiner oder gleich x sind.
G(x) heißt Summenhäufigkeit,
H(x)=1/n G(x) relative Summenhäufigkeit.
Die Fkt. H heißt empirische Verteilungsfunktion (Vf)
Eigenschaften der empirischen Vf:
• H(x) ist monoton steigend
• 0<=H(x)<=1
• lim ( )=0
−∞
>
− H x
x lim ( )=1
∞
>
− H x
x
Bei einer umfangreichen Statistik, in der sehr viele unterschiedliche Werte mit kleinen rel.
Häufigkeiten auftreten, ist es günstiger, diese Werte in Klassen K1,K2,…,Kl
zusammenzufassen. Die Klassenmitte m j wird meist als Mitte des Intervalls festgelegt.
Klassenhäufigkeit
n K x hj i i j
| }
| {
|
~ ∈
=
Faustregel für die Wahl der Klassenanzahl: l≤ n
1 2 3
0,1 1
3. Statistische Parameter
Def.: Sei x1,x2,…,xn eine Stichprobe.
∑
== + + +
= n
i i
n x
x n x
n x x
1 2
1
) 1 ...
1(
heißt arith. Mittel der Stichprobe (Stichprobenmittel) Ordnet man die Zahlen der Größe nach, so heißt die entstehende Zahlenreihe
x(1), x(2),.., x(n) geordnete Stichprobe
Die Zahl
= +
=
=
+ +
) ).(
2( 1
) (
) 2 1 ( 2) (
2 ) ( 1
~
gerade n
x x
ungerade n
x x
n n
n
Beispiele: 2, 5, 12, 20, 22, 30, 32 x~ =20x~=20
2, 5, 12, 20, 22, 30
x~ =16
25.03.2002 Def.: Sei x1, x2, …, xn eine Stichprobe.
Die Zahl ( ) (1)
1 { }
max
: x x x
v i n
n
i = −
= ≤≤ heißt Spannweite der Stichprobe.
Die Zahl
∑
=
− −
= n
i i
x x x
s n
1
2
2 ( )
1
1 heißt Stichprobenvarianz
Die Zahl
∑
=
− −
= n
i i
x x x
s n
1
)2
1 (
1 heißt Stichprobenstreuung
Bemerkung:
1)
−
= −
− +
= − +
− −
=
∑ ∑ ∑ ∑
=
=
=
=
2 1
2 2 1
1 2 1
2 2 2
1 2 1
1 ) 1
2 1 (
1 x nx
x n n x x n x
x x x n x
s n
i i n
i i n
i i n
i
i i x
2)
x i
x x i
x n
j j
i
s n x x s n x
s n x x
s n x
x x
x
1 1
1
) 1 ( ) (
)
( 2
1
2 2
− +
≤
≤
−
−
−
≤
−
−
=
−
≤
−
∑
=
4. Zweidimensionale Stichproben Meßreihe (x1,y1), (x2,y2), …, (xn,yn)
Def.: Sei g(x,y) die Anzahl der Stichprobenwerte, die gleich (x,y) sind.
g(x,y) heißt absolute Häufigkeit. * )
, 1 ( ) ,
( g x y
y n x
h = heißt relative Häufigkeit bzw. empirische Dichte
Sei G(x,y) die Anzahl der Stichprobenwerte, die kleiner gleich x bzw. in der zweiten Komponente kleiner gleich y sind.
G(x,y) heißt Summenhäufigkeit.
) , 1 ( ) ,
( G x y
y n x
H = heißt empirische Verteilungsfunktion.
*)
Häufigkeitstabelle oder Kontingenztabelle
Besteht ein linearer Zusammenhang zwischen den Merkmalen X und Y ?
Regressionsgerade y=bx+k
Maß für die „Güte“ der Geraden:
x1 x2 xn
y1
yn
y2 g (x1,y1) g
(x2,y1) g
(x1,y2)
Randhäufigkeiten
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
(x1, y1)
(x2, y2) (x3, y3)
∑
=+
−
=
∆ n
i
i
i bx k
y
1
2
2 ( ( ))
Dieser Ausdruck wird minimal, falls 2 ( ) 0
1
2 =− − − =
∂
∆
∂
∑
= n
i
i i
i y bx k
b x 0
) (
2
1
2 =− − − =
∂
∆
∂
∑
= n
i
i
i bx k
k y
∑
∑
∑
= = ==
+ n
i i i n
i i n
i
i k x x y
x b
1 1
1 2
∑
∑
= ==
+ n
i i
n
i xi kn y
b
1 1
Sei
∑
=
−
− −
= n
i
i i
xy x x y y
s n
1
) )(
1 (
1 dann gilt:
2 x xy
s
b= s , 2
x xy
s xs y k = −
27.03.2002 Regressionsgerade x x y
s y s
x
xy − +
= 2 ( ) verläuft durch den Punkt (x, ) y sxy heißt Stichprobenkovarianz. Eine leichte Umrechnung führt auf:
) 1(
1
∑
1=
− −
= n
i i i
xy x y nxy
s n
Kovarianzmatrix
2 2
y xy
xy x
s s
s
s = cov(x,y) (Matlab)
empirischer Korrelationskoeffizient
y x
xy
xy s s
r = s
Es gilt: 1) rxy ≤1
2) 1rxy = genau dann, wenn alle Punkte (x1, y1), …, (xn, yn) auf einer Geraden liegen.
corrcoef(x,y)=
1 1
xy xy
r r
5. Robustheit von Maßzahlen
α= gestutztes MittelSei 50<α <0, ;k =[α*n] (Bsp.: [2,3]=2)
[
xk xn k]
k
x n + + + −
= − ...
2 1
α 1
Bsp.: n=5; α =20%
5 2
1 x ... x
x ≤ ≤ ≤ ; k=1
(
2 3 4)
%
20 3
1 x x x
x = + +
II. Grundzüge der Wahrscheinlichkeitsrechnung
1. Zufallsexperiment
Grundbegriffe:Ereignis: Jeder mögliche Ausgang eines Versuchs (einer Beobachtung, Untersuchung, eines Tests, einer Probe, …).
Maßgebend ist die Versuchsanordnung (der Bedingungskomplex) Ereignisse sind zufällig
Beispiele: Münzwurf, Würfelspiel, Lotto, Qualitätskontrolle Ergebnismenge: Zu jedem Versuch gehört eine Ergebnismenge Ω. Elementarereignisse: Die Ergebnisse heißen auch Elementarereignisse.
2. Ereignisse und Ereignisalgebra
Ω: ErgebnismengeΩ
⊂
A , Ereignis A
Liegt das zufällige Ereignis ω∈Ω vor und gilt ω∈A, so sagt man, das Ereignis A ist eingetreten. Ist ω∉A, so sagt man A ist nicht eingetreten.
Beispiele:
1) Würfelspiel: Ω = {1, 2, 3, 4, 5, 6}
A = {2, 4, 6} „Werfen einer geraden Zahl“
A = {1, 2, 3} „Werfen einer Zahl kleiner 4“
08.04.2002 2) Qualitätskontrolle einer Ware durch Gewichtskontrolle
(Nenngewicht: 1000g, Toleranz ±δ):
[
1000 α,1000 α]
Ω = − + ; α δ> geeignet [1000 ,1000 )
A= −α −δ “zu leicht”
[
1000 ,1000]
B= −δ +δ “normal”
(1000 ,1000 ]
C = +δ +α “zu schwer”
∈B ω
3) Zählung der Wählerstimmen bei 5 kandidierenden Parteien
( )
∈ ≤
=
Ω
∑
=
WB x N
x x x x x
i i 5
1 5 0 5 4 3 2
1, , , , |
absolute Mehrheit für Partei 1
( )
{
x1,x2,x3,x4,x5 N05 |x1 x2 x3 x4 x5}
A= ∈ > + + +
relative Mehrheit für Partei 1
( ) { }
{
1 2 3 4 5}
5 0 5 4 3 2
1,x ,x ,x ,x N |x max x ,x ,x ,x
x
B = ∈ >
Stimmengleichheit der „Linksparteien“ 1 bis 3 und der „Rechtsparteien“ 4 und 5
( )
{
1 2 3 4 5}
5 0 5 4 3 2
1,x ,x ,x ,x N |x x x x x
x
C = ∈ + + = +
10.04.2002
∅ unmögliches Ereignis Ω sicheres Ereignis
Def.: Seien A,B⊂Ω Ereignisse.
(1) Das durch den Durchschnitt A∩B repräsentierte Ereignis heißt Produkt von A und B und wird als „A und B“ gelesen.
(2) Das durch die Vereinigung A∪B repräsentierte Ereignis heißt Summe von A und B und wird als „A oder B“ gelesen.
(3) Sei A:=Ω− A=Ω/A=
{
ω|ω∈Ω,ω∉A}
Das Ereignis A heißt entgegengesetztes oder komplementäres Ereignis und wird als „nicht A“ gelesen.
Menge aller Teilmengen von Ω: Potenzmenge 2 Ω Bsp.:
1) Ω=
{ }
0,1 ; 2Ω ={
∅,Ω,{0},{1}}
2) Ω={A,B,C}; 2Ω =
{
∅,Ω,{A},{B},{C},{A,B},{A,C},{B,C}}
Def.: Ω sei eine gegebene Menge. Eine Ereignisalgebra oder σ-Algebra A über Ω ist eine Teilmenge von 2 mit den Eigenschaften Ω
(1) Ω∈A
(2) A∈ A für alle A∈A
(3) Ist An∈A für alle n∈N, so ist auch ∞ ∈A
∪
= 1 nAn
Folgerungen:
(1) ∅∈A
(2) A,B∈A⇒A∪B∈A (3) A,B∈A⇒A∩B∈A Bsp.:
Würfelspiel (mit einem Würfel) }
6 , 5 , 4 , 3 , 2 , 1
={ Ω
Nehmen wir an, uns interessiert nur die Frage, ob eine gerade oder ungerade Augenzahl geworfen wird.
Wähle A={2,4,6}, dann ist A={∅,A,A,Ω} eine Ereignisalgebra.
Def.: Sei Ω eine beliebige Menge und E ={A,B,C,...} eine Menge von Teilmengen von Ω.
Die kleinste Ereignisalgebra über Ω, die alle Elemente von E enthält, heißt die von E erzeugte Ereignisalgebra und wird mit A(E) bezeichnet.
Bemerkung: Die kleinste σ-Algebra über R(||Menge R), die alle offenen, abgeschlossenen, halboffenen und einseitig unbegrenzte Intervalle enthält, heißt Borel’sche Menge
Zusatzblatt: Anhang A: Ereignisse
A.1) DefinitionenΩ sei eine Menge und 2 die dazugehörige Potenzmenge, i.e. die Menge aller Teilmengen Ω von Ω.
Für A,B∈2Ω heißen
• A∩B:=
{
ω∈Ωω∈A∧ω∈B}
Durchschnitt von A und B• A∪B:=
{
ω∈Ωω∈A∨ω∈B}
Vereinigung von A und B• A−B:=
{
ω∈Aω∉B}
Differenz von A und B• A:=Ω−A Komplement von A in Ω
• A∆B:=
(
A−B) (
∪ B−A)
symmetrische Differenz von A und B• A∩B,A∩B,A∩B,A∩B Vollkonjunktionen über A und B Zur graphischen Veranschaulichung dienen die sogenannten Venn-Diagramme:
Man stellt dazu die Ausgangsmengen Ω, A, B als einfache Teilmengen der Zeichenebene dar, etwa durch Rechtecke oder Ovale, und kennzeichnet zusammengesetzte Ereignisse durch entsprechende Färbung oder Schraffierung.
Für den Durchschnitt bzw. die Vereinigung von A und B erhält man dann beispielsweise:
Ω Ω
bzw.
A A
B
B
A.2) Rechenregeln Für A,B,C∈2Ω gilt:
A B B A
A B B A
∩
=
∩
∪
=
∪ (Kommutativgesetze)
( ) ( )
(
B C) (
A B)
CA
C B A C B A
∩
∩
=
∩
∩
∪
∪
=
∪
∪ (Assoziativgesetze)
( ) ( ) ( )
(
B C) (
A B) (
A C)
A
C A B A C B A
∩
∪
∩
=
∪
∩
∪
∩
∪
=
∩
∪ (Distributivgesetze)
B A B A
B A B A
∪
=
∩
∩
=
∪ (Gesetze von De Morgan)
A∪ =A A, A∩ =A A (Idempotenzgesetze)
( )
A∩ A B∪ = A, A∪
(
A B∩)
=A (Absorptionsgesetze)A∪ = ΩA , A∩ = ∅A , A=A (Gesetze für Komplementärereignisse) A∪ Ω = Ω, A∩ ∅ = ∅ (Dominante Elemente)
A∩ Ω =A, A∪ ∅ =A (Neutrale Elemente)
A B− = ∩A B (Gesetz für die Mengendifferenz)
( ) ( )
( ) ( )
A B A B A B
A B A B
A B A B A B
= ∪ − ∩
=
= ∩ ∪ ∩
(Gesetze für die symmetrische Differenz)
2.3. Die klassische Wahrscheinlichkeitsdefinition
Bei der klassischen Definition der Wahrscheinlichkeit legen wir die Gleichwahrscheinlichkeit aller Elementarereignisse zugrunde. (Laplace-Annahme)
Ω: Menge der Elementarereignisse (endlich) Ω
⊂
A Ereignis
von_Ω _Elemente_
Anzahl_der
A _ von _ Elemente _
Anzahl_der )
( =
= ΩA A P
(Laplace-Wahrscheinlichkeit)
Nennen wir ein Elementarereignis ω∈Ω ein für ein Ereignis günstigen Fall, falls ω∈A ist.
_Fälle _möglichen Anzahl_der
le stigen_Fäl _für_A_gün
Anzahl_der )
(A = P
Bsp.: Zwei Personen würfeln
Elementarereignisse (x,y) x: Augenzahl der Person X
y: Augenzahl der Person Y
{
(1,1),(1,2),...}
=
Ω ; Ω =36
=2Ω
A
A „x ist größer als y“
B „y ist doppelt so groß wie x“
=
) 5 , 6 ( ), 4 , 6 ( ), 3 , 6 ( ), 2 , 6 ( ), 1 , 6 (
) 4 , 5 ( ), 3 , 5 ( ), 2 , 5 ( ), 1 , 5 (
) 3 , 4 ( ), 2 , 4 ( ), 1 , 4 (
) 2 , 3 ( ), 1 , 3 (
) 1 , 2 (
A ; A =15;
12 5 36 ) 15 (A = = P
B={(1,2), (2,4), (3,6)}
12 1 36 ) 3
(B = = P
15.04.2002 (Ω, A, P)
Das Prinzip der Gleichwahrscheinlichkeit kann nicht in allen zu betrachtenden Fällen aufrechterhalten werden.
Beispiel:
R Fläche der
Inhalt
Q Fläche der
Inhalt A
P _ _ _
_ _
) _
( = (geometrische Wahrscheinlichkeit)
R
Q
Wiederholung: Kombinatorik Def.: n,k∈N0 mit k ≤n
1)
∏
=
= n
k
k n
1
! (n≥1) 0!=1
2) ( )! !
! k k n
n k
n
= −
Bemerkung:
1) Für Nn,k∈ mit k ≤n gilt:
k k n n
n n k n
* ...
* 3
* 2
* 1
) 1 )...(
2 )(
1
( − − − +
=
2) Für n,k∈N0 mit k ≤n gilt:
a)
= −
k n
n k
n
b)
+
= +
+ +
1 1
1 k
n k
n k
n
c)
( ) ( )
−
=
+ +
k k n k n
k n 1 1
Def.: Jede Zusammenstellung von k Elementen aus n gegebenen Elementen heißt Kombination k-ter Ordnung
I Kombinationen mit Berücksichtigung der Anordnung (Permutationen) a) Kombinationen mit Berücksichtigung der Anordnung ohne Wiederholung
n k ≤
Bsp.: M={a, b, c, d}; n=4; k=2 (a, b) (b, a) (c, a) (d, a) (a, c) (b, c) (c, b) (d, b) (a, d) (b, d) (c, d) (d, c) 4*3=12 Möglichkeiten
(
n 1) (
...n k 1)
kn k!(
nn!k)
!n = −
= +
−
−
Spezialfall (k=n): n!
Bsp.: In wieviel verschiedenen Reihenfolgen können 5 verschiedene Personen auf einer Bank sitzen?
5!=120
Auf wieviel Arten kann man 4 Hotelgäste auf 8 freie Einzelzimmer verteilen?
n=8; k=4; 5*6*7*8 1680
! 4
!
8 = =
b) Kombinationen mit Berücksichtigung der Anordnung mit Wiederholung Bsp.: M={a, b, c, d}; n=4; k=2
(a, a) (b, a) (c, a) (d, a) (a, b) (b, b) (c, b) (d, b) (a, c) (b, c) (c, c) (d, c) (a, d) (b, d) (c, d) (d, d)
42
4
*
4 = Möglichkeiten nk
Bsp.: Wieviel 4-stellige Zahlen mit ungeraden Ziffern gibt es?
54 =625 Zahlen
Auf wieviel Arten kann man 3 Hotelgäste auf 2 freie Vierbettzimmer verteilen?
8
23 = Möglichkeiten
II Kombinationen k-ter Ordnung ohne Berücksichtigung der Anordnung a) Kombinationen k-ter Ordnung ohne Berücksichtigung der Anordnung ohne Wiederholung
n k ≤
Bsp.: M={a, b, c, d}; n=4; k=2 (a, b)
(a, c) (b, c)
(a, d) (b, d) (c, d) 3*2*1=6 Möglichkeiten
= −
k n
n k
n
Bsp.: Wieviel Möglichkeiten gibt es für 6 Richtige im Lotto?
13.983.816
6 49=
Möglichkeiten
17.04.2002 b) Kombinationen k-ter Ordnung ohne Berücksichtigung der Anordnung
mit Wiederholung
Bsp.: M={a, b, c, d}; n=4; k=2 (a, a)
(a, b) (b, b)
(a, c) (b, c) (c, c)
(a, d) (b, d) (c, d) (d, d)
−
−
= +
+ −
1 1 1
n k n k
k n
Bsp.: Wieviel Steine enthält ein Dominospiel?
Zahlen von 0 bis 6.
n=7; k=2;
28
2 8=
Mit Hilfe der Formeln I a,b und II a,b lassen sich Verteilungsprobleme wie folgt lösen:
Satz1: Die Anzahl der möglichen Verteilungen von k verschiedenen Objekten in n≥k verschiedene Fächer, bei denen in jedes Fach höchstens ein Objekt kommt, beträgt
)!
(
! k n
n
−
Satz2: Die Anzahl der möglichen Verteilungen von k versciedenen Objekten in n verschiedene Fächer mit unbegrenzter Kapazität beträgt nk.
1.Obj 2.Obj
...
k.Obj1 5
3
n
Fächer 1 2 n
…
…
2 4 5
3 7 1
...
...
Satz2b: Die Anzahl der möglichen Verteilungen von k verschiedenen Objekten in n verschiedene Fächer Fi (i=1,2,…,n), bei denen in das Fach Fi genau ki Objekte kommen (beachte: k=k1+k2+…+kn) beträgt
!
!...
!
!
... 1 2
2
1 n k k kn
k k
k k
k =
Satz3: Die Anzahl der möglichen Verteilungen von k nicht unterscheidbaren Objekten in k
n≥ verschiedene Fächer, bei denen in jedes Fach höchstens ein Objekt kommt, beträgt
k n
Obj Obj
...
Obj1 5
3
n
Fächer 1 2 n
…
…
2 4 5
3 7 1
...
...
1.Obj 2.Obj
...
k.Obj1 7
5
n
Fächer 1 2 n
…
…
2 2 4
3 5 5
...
...
Satz4: Die Anzahl der möglichen Verteilungen von k nicht unterscheidbaren Objekten in n verschiedene Fächer mit unbegrenzter Kapazität beträgt
+ − k
k
n 1
.
Obj Obj
...
Obj1 7
5
n
Fächer 1 2 n
…
…
2 2 4
3 5 5
...
...
2. 4. Statistische Wahrscheinlichkeiten
Bsp.: Jemand wirft eine Münze hoch. Nach 50 Versuchen mit 45 mal Adler und fünfmal Zahl erschienen.
relative Häufigkeit für „Adler“ 0,9 50 45 =
=
allg.: Versuch V mit einer Menge Ω von Elementarereignissen. A sei ein zu V gehörendes Ereignis. Bei n-maliger Wiederholung des Versuchs sei das Ereignis A nA-mal eingetreten.
relative Häufigkeit
( )
n A n hn = A
statistische Wahrscheinlichkeit P
( )
A hn( )
An→∞
=lim
2. 5. Die axiomatische Begründung der Wahrscheinlichkeit
Def.: Es sei Ω eine beliebige Menge und A eine Ereignisalgebra auf Ω. EinWahrscheinlichkeitsmaß (W-Maß) auf A ist eine Abbildung P:A->[0,1], welche die folgenden Bedingungen erfüllt:
(W1) P(Ω)=1
(W2) Sind die Ereignisse An (n∈N) paarweise unvereinbar, d.h. Ai ∩Aj =∅ )
,
;
(i≠ j i j∈N , so ist
∑
∞( )
=
∞
=
=
1
1 i
i i
i P A
A P
∪
Statt Wahrscheinlichkleitsmaß sagt man auch Verteilungsgesetz. Das Tripel (Ω, A, P) bezeichnet man als Wahrscheinlichkeitsraum (W-Raum).
29.04.2002 Regeln: 1.) P
( )
∅ =02.) A B∩ = ∅ ⇒P A B
(
∪)
=P A( )
+P B( )
Beweis:
A1=A; A2=B; Ai = ∅ (i≤3)
( ) ( ) ( ) ( )
1 1
i i
i i
P ∞ A P A B ∞ P A P A P B
=
=
= ∪ = = +
∪
∑
3.) A1, A2, …, Ak paarweise unvereinbare Ereignisse
( )
1 1
k k
i i
i i
P A P A
=
=
⇒ =
∪
∑
4.) P A
( )
+P A( )
=1, wobei A das zu A gehörende komplementäre Ereignis ist.5.) Additionssatz für Wahrscheinlichkeiten P A B
(
∪)
=P A( )
+P B( )
−P A B(
∩)
Verallgemeinerung:
( ) ( ) ( ) ( ) ( )
P A B∪ ∪C =P A +P B +P C −P A B∩ −
( ) ( ) ( )
P A C P B C P A B C
− ∩ − ∩ + ∩ ∩
A B C∩ ∩ 6.) A⊂ ⇒B P A
( )
≤P B( )
7.) Siebformel von Poincaré-Sylvester:
Seien A1, A2, …, Ak Ereignisse
( ) (
1 2) (
1 2)
1 2
1 1 1
... ( 1) ...
k
k k
l
i i i i i i i
i i i
i
P A P A P A A + P A A A
= <
=
= − ∩ + + − ∩ ∩ ∩ +
∪
∑ ∑ ∑
( )
1 k+1P A(
1 A2 ... Ak)
+ − ∩ ∩ ∩ wobei i i1 2, ,...,ik∈
{
1,2,...,k}
8.) Boole’sche Ungleichung:
Seien A1, A2, …, Ak Ereignisse
( )
1 1
k k
i i
i i
P A P A
=
=
≤
∪
∑
9.) Für eine beliebige Folge
{ }
An ;n N∈ von Ereignissen gilt:( )
1 1
i i
i i
P A P A
∞ ∞
= =
≤
∪
∑
Definition: Eine Folge
{ }
An ;n N∈ von Ereignissen heißt monoton wachsend (monoton fallend), falls An ⊂An+1 (An+1⊂ An) n N∈A B
C
Bemerkung: 1.) Jede Vereinigung
1 i i
C
∞
∪
= kann als Vereinigung einer monoton wachsenden Folge von Ereignissen geschrieben werden:1 1
j
j i j
i
A C A+
=
=
∪
⊂ ;1 j 1 i
j i
A ∞ A ∞ C
= =
=
∪
=∪
Schreibweise: A limj
( )
Aj= →∞ bzw. Aj ↑A
2.) Jeder Durchschnitt
1 i i
C
∞
∩
= kann als Durchschnitt einer monoton fallenden Folge von Ereignissen geschrieben werden.1 1
j
j i j
i
A C A+
=
=
∩
> ;1 1
j i
j i
A ∞ A ∞ C
= =
=
∩
=∩
Schreibweise: A limj
( )
Aj= →∞ bzw. Aj ↓A
10.) Sei
{ }
An n N∈ eine monotone Folge von ereignissen, dann gilt:(
limj( )
j)
limj( ( )
j)
P A P A
→∞ = →∞
2.6. Charakterisierung diskreter W-Räume
Ω heißt diskret, falls Ω höchstens abzählbar viele Elemtarereignisse besitzt.
Satz: Sei Ω =
{
ωi i I∈ ⊂N}
, seien p i Ii(
∈)
reelle nicht negative Zahlen mit i 1i I
p
∈
∑
= . Dann wird durch P: 2Ω →[ ]
0,1 mit( )
{ i }
i
i A
P A p
ω∈
=
∑
ein diskretes Wahrscheinlichkeitsmaß auf 2Ω definiert. Insbesondere gilt P( ) { }
ωi = pi06.05.2002
2.7. Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen
Beispiel: Würfelspiel mit 2 Spielern X und Y:X beginnt: Würfelt X eine 1, 2 oder 3, so zahlt Y unabhängig von seinem eigenen Wurf 1€ an X.
Würfelt X eine Zahl größer als 3, so wird das Wurfergebnis y von Y mit
x verglichen.
Ist x≤ y, so erhält Y von X 3€. Ist x>y, so erfolgt keine Auszahlung.
( ) { }
{
ω ω i j i j, ; , 1,2,...,6}
Ω = = ∈
2Ω
=
A , Laplace-Modell
Mit welcher Wahrscheinlichkeit gewinnt A ? A X=
{ ( )
, 3}
A= i j i> ⊂ Ω; A=
{ ( )
i j i, ≤3}
⊂ Ω( ) ( )
12P A =P A =
Mit welcher Wahrscheinlichkeit gewinnt Y ?
{ ( )
,}
B= i j i≤ j ⊂ Ω
( )
6 136 6 P A B∩ = =
Mit welcher Wahrscheinlichkeit gewinnt Y, unter der Bedingung, daß X eine Zahl größer als 3 gewürfelt hat?
( )
A B 186 13P B A
A
= ∩ = = („B unter der Bedingung A“) neue Ergebnismenge Ω =A A
( )
A B P A B( ( ) )
P B A
A P A
∩
∩ Ω
= =
Ω
Definition: Es sei V irgendein Versuch und A ein damit verbundenes Ereignis mit P A
( )
>0.Ist B ein weiteres beliebiges zu V gehörendes Ereignis, so verstehen wir unter
( )
P B A die Wahrscheinlichkeit von B unter der Bedingung A und berechnen diese nach der Formel:
( )
P A B( ( ) )
P B A
P A
= ∩
Bemerkung: Ist
(
Ω, ,A P)
ein Wahrscheinlichkeitsraum, A ein Ereignis mit P A( )
>0, so istmit Ω =A A; AA=
{
A B B∩ ∈A}
;(
ΩA,AA,P( )
i,A)
einWahrscheinlichkeitsraum.
Ist auch P B
( )
>0, so gilt P A B( )
= P A B(
P B( )
∩)
Multiplikationssatz für Wahrscheinlichkeiten / Gleichung von Bayes:
( ) ( ) ( ) ( ) ( )
P A B∩ =P A B P B =P B A P A Verallgemeinerung: P A
(
∩(
B C∩) )
=P B C A P A(
∩) ( )
( ) ( ) ( )
P B C A∩ =P B A P C A B∩
( ) ( ) ( ) ( )
P A B C∩ ∩ =P A P B A P C A B∩
08.05.2002 Bsp. 2: A „kein Erfolg beim ersten Versuch“
B „kein Erfolg beim zweiten Versuch“
gesucht: P A B
(
∩)
gegeben: P A
( )
=0,6 also P A( )
=0,4( )
0,9P B A = also P B A
( )
=0,1also P A B
(
∩)
=P A P B A( ) ( )
=0,04Bsp. 3: Ai „Vollkommene Bearbeitung von Schritt i“ (i=1, 2, 3) gesucht: P A
(
1∩A2∩A3)
gegeben: P A
( )
i =0,3 also P A( )
i =0,7(
2 1)
0,7P A A = also P A A
(
2 1)
=0,3(
2 1 2)
0,8P A A ∩A = also P A A
(
3 1∩A2)
=0,2(
1 2 3) ( )
1(
2 1) (
3 1 2)
0,042P A ∩A ∩A =P A P A A P A A ∩A = Bsp. 4: A „eine Goldmünze wird gezogen“
Ei „gewählte Schachtel hat i Goldmünzen“ (i= 0, 1, 2) gesucht: P E A
(
2)
gegeben:
( )
1i 3
P E = (i= 0, 1, 2)
( )
1P A = 2
(
2)
1 P A E =( ) ( ) ( ) ( )
2 2 22 3 P A E P E P E A
= P A =
Verallgemeinerung der Formel
( ) ( ) ( )
( )
P B A P A P A B
= P B :
Regel von Bayes: Für paarweise unvereinbare Ereignisse A1, A2, …, An mit
2 1 i
A
∞
=
Ω =
∪
und P B( )
>0 gilt:( ) ( ) ( ) ( ) ( )
1
i i
i n
j j
j
P B A P A P A B
P B A P A
=
=
∑
(i= 1, 2, …, n)Satz von der totalen Wahrscheinlichkeit:
Für paarweise unvereinbare Ereignisse A1, A2, …, An mit
1 n
i i
A
=
Ω =
∪
gilt:( ) ( ) ( )
1 n
j j
j
P B P B A P A
=
=
∑
Spezialfall: n=2; A1=A; A2 = A
( ) ( ) ( ) ( ) ( )
P B =P B A P A +P B A P A Def.: Seien A, B Ereignisse.
Die Ereignisse A und B unabhängig, falls P A B
(
∩)
=P A P B( ) ( )
Folgerung: 1.) Ist P B
( )
>0 bzw. P A( )
>0, so ist, falls A, B unabhängig sind,( ) ( )
P A B =P A bzw. P B A
( )
=P B( )
2.) Wenn A und B unabhängig sind, so sind auch A und B, A und B sowie A und B unabhängig. (Aufgabe)
Bsp. 5: A „Studierender hat regelmäßig Hausaufgaben gemacht“
B „Studierender hat die Prüfung nicht bestanden“
gesucht: P B A
( )
gegeben:
( )
1P A =10; P A B
( )
=501Da A und B sicherlich nicht unabhängig sind (P A B
( )
≠P A( )
!!), hat A einen Einfluß auf B.( ) ( )
( ) ( ) ( )
( )
49
( )
50 9 10 P A B P A B P B P B
P B A
P A P A
= ∩ = =
Zusatzangabe: P B A
( )
=201( ) ( ) ( )
( )
1 1 20 10 1
1 4
50 P B A P A
P B = P A B = = P B A
( )
=27,2%13.05.2002 Def.: Sei A1, A2, …, Ak Ereignisse
Diese heißen unabhängig, wenn für jede Teilmenge
1, 2,...,
i i il
A A A mit 2≤ ≤l k gilt:
(
i1 i2 ... il) ( ) ( ) ( )
i1 i2 ... il P A ∩A ∩ ∩A P A P A P A Spezialfall: k=3A1, A2, A3 unabhängig, falls
(
1 2) ( ) ( )
1 2P A ∩A =P A P A und
(
1 3) ( ) ( )
1 3P A ∩A =P A P A und
(
2 3) ( ) ( )
2 3P A ∩A =P A P A und
(
1 2 3) ( ) ( ) ( )
1 2 3P A ∩A ∩A =P A P A P A
Beispiel: (Zuverlässigkeit von Systemen) Sseriell
Sparallel
Sei pi die Wahrscheinlichkeit, daß das System Si ausfällt (Ausfallwahrscheinlichkeit)
Ai „System Si fällt aus.“ (i= 1, 2, …, m) ASparallel „System Sparallel fällt aus.“
ASseriell „System Sseriell fällt aus.“
Voraussetzung: Der Ausfall der Systeme Si geschieht unabhängig voneinander
(
Sparallel) (
1 2 ... m)
1 2... mP A =P A ∩A ∩ ∩A = p p p
(
Sseriell) (
1 2 ... m)
P A =P A ∪A ∪ ∪A
(
Sseriell)
1(
Sseriell) (
1 2 ... m)
P A = −P A =P A ∪A ∪ ∪A
(
1 2 ... m) ( ) ( ) ( )
1 2 ... mP A A A P A P A P A
= ∩ ∩ ∩ =
S1 S2 Sn
S1
S2
Sn
22.05.2002
III. Zufallsvariable und deren Verteilung
3.1. Der Begriff der Zufallsvariablen
Def.: Seien
(
Ω, ,A P)
und(
Ω′ ′ ′, ,A P)
zwei Wahrscheinlichkeitsräume. Eine Abbildung :X Ω → Ω′ heißt Zufallsvariable (ZVa).
{ ( ) }
( )
X 1 A
X A
ω ω
− ′
∈ ′ ∈A
(
A′∈A′)
Ist Ω =′ R, so heißt X reelle oder numerische Zufallsvariable.
Bsp.: (Qualitätskontrolle)
Aus 100 gleichartigen Einheiten eines Produkts wird eine Stichprobe von 8 Einheiten gezogen. Ergebnis ω1 „brauchbar“, ω2nicht brauchbar.
( ) { }
{
a a1, ,...,2 a a8 i ω ω1, 2}
Ω = ∈
2Ω A=
:
X Ω → R
(
1 2 8)
81
, ,..., i
i
X a a a k
=
=
∑
mit 1 1
2
1;
0;
i i
k a
a ω ω
=
= =
3.2. Diskrete Zufallsvariable
Def.: Eine Zufallsvariable, deren Wertebereich endlich oder abzählbar unendlich ist, heißt diskrete Zufallsvariable.
Sei X eine diskrete Zufallsvariable mit WX =
{
x x1, ,...2}
Nehmen wir an, daß pi =P X
(
=xi)
(i=1,2,…) bekannt ist. Setzen wir für eine beliebige Teilmenge A W⊂ X( ) ( )
{:i }
i i x A
P A P X x
∈
=
∑
= so ist damit ein Wahrscheinlichkeitsmaß auf 2WXA= gegeben.
Def.: (Dichte, Verteilungsfunktion, Verteilung) Die Funktion fX :R→R, ;
0;
i i
X
p x x
x x W
=
→ ∉ heißt Wahrscheinlichkeitsfunktion (diskrete Dichte (-funktion) bzw. Zähldichte) der Zufallsvariablen X.
27.05.2002 Wir definieren die Verteilungsfunktion (Vf) Fx von X durch
x:
F → ;
( ) ( ) ( )
{:i }
x x i
i x x
F x P X x f x
≤
= ≤ =
∑
(Abkürzung: "X ≤x"=
{
ω X( )
ω ≤x}
; analog: "a≤ X ≤b"={
ω a≤ X( )
ω ≤b}
)Bemerkung: Es gilt:
(1) P X
(
= xi)
= pi = f xx( )
i(2) Fx ist monoton wachsend Fx=1 für x≥sup
{
x x1, ,...2}
Fx=0 für x<inf
{
x x1, ,...2}
Fx ist rechtsseitig stetig
Beispiel: Unabhängig vom Wochentag und unabhängig von der Uhrzeit seien alle Arbeitsplätze in einem Rechnerraum mit der Wahrscheinlichkeit p∈
( )
0,1besetzt.
ωi= „Ein Student S findet im i-ten Versuch einen freien Arbeitsplatz“
(
1≤ ≤i n)
ω0= „Student S findet nach n Versuchen keinen freien Arbeitsplatz“
{
ω ω0, ,...,1 ωn}
Ω = ; X :Ω → ; X
( )
ωi =i; (i=0,1,2,…,n)( )
i 1(
1)
P X = =i p− − p ; (i= 1, 2, …, n)
(
0)
nP X = = p
x1 x2 x3 x4 x5
p1
p2
p3
p4
p5
x1 x2 x3 x4
p1
p2
p3
p4
Definition: Sei X eine diskrete Zufallsvariable mit WX =
{
x x1, 2,...} [ ]
i(
i)
i
E X =
∑
x P X =x Erwartungswert von X falls diese Reihe absolut konvergiert[ ] (
i[ ] )
2(
i)
i
Var X =
∑
x −E X P X =x Varianz von X falls diese Reihe absolut konvergiertRegeln: (1) Ist g eine beliebige reellwertige Funktion, deren Definitionsbereich den Wertebereich von X enthält, so gilt:
( ) ( ) (
i i)
i
E g X =
∑
g x P X = x(2) Mit g x
( )
=ax b+ , wobei ,a b∈ sind, gilt E aX b[
+]
=aE X[ ]
+b(3) Var X
[ ]
=E X 2−E X[ ]
2 =E X(
−E X[ ] )
2(4) Var aX b
[
+]
=a Var X2[ ]
Beispiel: Würfelspiel mit einem Würfel
ωi= Würfeln der Zahl i (i= 1, 2, …, 6) :
X Ω → ; X
( )
ωi =i; (i= 1, 2, …, 6)( )
1P X = =i 6
[ ]
61
1 1 6*7 6 6 2 3,5
i
E X i
=
=
∑
= =[ ]
6( )
21
3,5 1
i 6 Var X i
=
=
∑
−2 6 2
1
1 91
6 6
i
E X i
=
= =
∑
[ ]
91 49 356 4 12
Var X = − =
Standartabweichung
[ ]
X = Var X[ ]
=1,713.3. Spezielle diskrete Verteilungen 3.3.1. Diskrete Gleichverteilung
X Zufallsvariable mit Wx={
x x1, ,...,2 xn}
( )
1;0;
x x
f x n x W sonst
∈
=
Für xi =i (i= 1, 2, …, n) gilt:
[ ] ( )
1
1 1 1 1
* 2 2
n
i
n n n
E X i
n n
=
+ +
=