• Keine Ergebnisse gefunden

Statistik IT4

N/A
N/A
Protected

Academic year: 2021

Aktie "Statistik IT4 "

Copied!
46
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Statistik IT4

Dozent: Prof. Dr. Heinz-Willi Goelden

Mitschrift der Vorlesung SS 2002

Lemberger Timo

(lemberger@sodenet.de)

www.thunder.li/statistik

(2)
(3)

Statistik für Informatiker Inhaltsübersicht

1. Deskriptive Statistik

ƒ Merkmale

ƒ Häufigkeiten und deren Darstellung

ƒ Statistische Parameter

ƒ Zweidimensionale Stichproben

ƒ Robustheit von Maßzahlen

2. Grundzüge der Wahrscheinlichkeitsrechnung

ƒ Zufallsexperimente

ƒ Ereignisse und Ereignisalgebren

ƒ Die klassische Wahrscheinlichkeitsdefinition

ƒ Statistische Wahrscheinlichkeiten

ƒ Die axiomatische Begründung der Ws-Theorie

ƒ Charakterisierung diskreter Ws-Räume

ƒ Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen

3. Zufallsvariable und deren Verteilungen

ƒ Der Begriff der Zufallsvariablen

ƒ Diskrete Zufallsvariable und spezielle diskrete Verteilungen

ƒ Stetige Zufallsvariable und spezielle stetige Verteilungen

ƒ Momente einer Verteilung

4. Mehrdimensionale Verteilungen

ƒ Zweidimensionale Verteilungen

ƒ Randverteilungen – Unabhängigkeit von Zufallsvariablen

ƒ Funktionen mehrerer Zufallsvariablen

ƒ Stichprobenvariable und Testverteilungen

ƒ Zufallsmatrizen - Zufallsgraphen

5. Induktive Statistik: Schätzen und Testen

ƒ Schätzfunktionen

ƒ Die Maximum-Likelihood-Methode

ƒ Konfidenzintervalle

ƒ Testen von Hypothesen

(4)

I. Deskriptive (beschreibende) Statistik

1. Merkmale

Gesammelt werden Daten über ein Merkmal X, das an den Elementen einer umfangreichen Beobachtungsmenge (von Individuen und Objekten) in unterschiedlicher Ausprägung zu erkennen ist.

Beobachtungsmenge = Grundgesamtheit Ziel der Datenanalyse:

Beschreibung der Verteilung dieser Ausprägung über die Beobachtungsmenge.

Beispiel:

Fragen an ehemalige Studenten der Informatik, die in den letzten 5 Jahren den Abschluß als Diplom-Informatiker gemacht haben (Grundgesamtheit):

(1) Wieviel Monate dauerte es vom Erwerb des Diploms bis zur ersten Anstellung?

quantitatives Merkmal (N0)

(2) War ihre erste Anstellung an einem Hochschulinstitut, einem sonstigen Forschungsinstitut, in einer Großfirma (mehr als 200 Mitarbeiter), in einem mittelgroßen Betrieb (30-200

Mitarbeiter) oder in einer Kleinfirma (weniger als 30 Mitarbeiter)?

qualitatives Merkmal ({Hochschulinstitut, sonstiges Forschungsinstitut, Groß-, Mittel-, Kleinfirma})

(3) Wie schätzen sie ihr Gehalt ein? Besser als das Gehalt von Mathematikern in ihrer oder einer vergleichbaren Firma, etwa gleich oder niedriger?

Rangmerkmal

quantitatives Merkmal diskretes Merkmal stetiges Merkmal

(5)

2. Häufigkeiten und deren Darstellung

Sei x ein quantitatives Merkmal, das an den Elementen einer Beobachtungsmenge zu erkennen ist.

Ergebnis: Stichprobe (Meßreihe) x1, x2, …, xn vom Umfang n (Die Stichprobenwerte müßen nicht verschieden sein)

Beispiel (aus Abschnitt 1):

Wartezeit (in Monaten)

absolute Häufigkeit

relative Häufigkeit

0 32 0,10 1 23 0,07 2 48 0,15 3 162 0,50

4 0 0,00

5 18 0,06 6 10 0,03

7 0 0,00

8 10 0,03

9 0 0,00

10 0 0,00

11 0 0,00

12 0 0,00

>12 18 0,06

321 1

Häufigkeitstabelle

Stabdiagramm

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

0 1 2 3 4 5 6 7 8 9 10 11 12 >12

(6)

Histogramm

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

0 1 2 3 4 5 6 7 8 9 10 11 12 >12

Def.: Für xR sei g(x) die Anzahl der Werte in der Stichprobe, die gleich x sind (also 0

) (x

g , falls x

{

x1,x2,...,xn

}

) g(x) absolute Häufigkeit

n x x g

h ( )

)

( = relative Häufigkeit

Die Funktion h heißt Häufigkeitsfunktion oder empirische Dichte des Merkmals x (bei der Stichprobe x1, x2, …, xn)

empirische Dichte

0 0,1 0,2 0,3 0,4 0,5 0,6

(7)

20.03.2002 Def.: Sei G(x) die Anzahl der Werte in der Stichprobe, die kleiner oder gleich x sind.

G(x) heißt Summenhäufigkeit,

H(x)=1/n G(x) relative Summenhäufigkeit.

Die Fkt. H heißt empirische Verteilungsfunktion (Vf)

Eigenschaften der empirischen Vf:

• H(x) ist monoton steigend

• 0<=H(x)<=1

• lim ( )=0

−∞

>

H x

x lim ( )=1

>

H x

x

Bei einer umfangreichen Statistik, in der sehr viele unterschiedliche Werte mit kleinen rel.

Häufigkeiten auftreten, ist es günstiger, diese Werte in Klassen K1,K2,…,Kl

zusammenzufassen. Die Klassenmitte m j wird meist als Mitte des Intervalls festgelegt.

Klassenhäufigkeit

n K x hj i i j

| }

| {

|

~

=

Faustregel für die Wahl der Klassenanzahl: ln

1 2 3

0,1 1

(8)

3. Statistische Parameter

Def.: Sei x1,x2,…,xn eine Stichprobe.

=

= + + +

= n

i i

n x

x n x

n x x

1 2

1

) 1 ...

1(

heißt arith. Mittel der Stichprobe (Stichprobenmittel) Ordnet man die Zahlen der Größe nach, so heißt die entstehende Zahlenreihe

x(1), x(2),.., x(n) geordnete Stichprobe

Die Zahl





= +

=

=

+ +

) ).(

2( 1

) (

) 2 1 ( 2) (

2 ) ( 1

~

gerade n

x x

ungerade n

x x

n n

n

Beispiele: 2, 5, 12, 20, 22, 30, 32 x~ =20x~=20

2, 5, 12, 20, 22, 30

x~ =16

25.03.2002 Def.: Sei x1, x2, …, xn eine Stichprobe.

Die Zahl ( ) (1)

1 { }

max

: x x x

v i n

n

i = −

= heißt Spannweite der Stichprobe.

Die Zahl

=

− −

= n

i i

x x x

s n

1

2

2 ( )

1

1 heißt Stichprobenvarianz

Die Zahl

=

− −

= n

i i

x x x

s n

1

)2

1 (

1 heißt Stichprobenstreuung

Bemerkung:

1) 



 −

= −





 − +

= − +

− −

=

∑ ∑ ∑ ∑

=

=

=

=

2 1

2 2 1

1 2 1

2 2 2

1 2 1

1 ) 1

2 1 (

1 x nx

x n n x x n x

x x x n x

s n

i i n

i i n

i i n

i

i i x

2)

x i

x x i

x n

j j

i

s n x x s n x

s n x x

s n x

x x

x

1 1

1

) 1 ( ) (

)

( 2

1

2 2

− +

=

=

(9)

4. Zweidimensionale Stichproben Meßreihe (x1,y1), (x2,y2), …, (xn,yn)

Def.: Sei g(x,y) die Anzahl der Stichprobenwerte, die gleich (x,y) sind.

g(x,y) heißt absolute Häufigkeit. * )

, 1 ( ) ,

( g x y

y n x

h = heißt relative Häufigkeit bzw. empirische Dichte

Sei G(x,y) die Anzahl der Stichprobenwerte, die kleiner gleich x bzw. in der zweiten Komponente kleiner gleich y sind.

G(x,y) heißt Summenhäufigkeit.

) , 1 ( ) ,

( G x y

y n x

H = heißt empirische Verteilungsfunktion.

*)

Häufigkeitstabelle oder Kontingenztabelle

Besteht ein linearer Zusammenhang zwischen den Merkmalen X und Y ?

Regressionsgerade y=bx+k

Maß für die „Güte“ der Geraden:

x1 x2 xn

y1

yn

y2 g (x1,y1) g

(x2,y1) g

(x1,y2)

Randhäufigkeiten

(x1, y1)

(x2, y2) (x3, y3)

(10)

=

+

=

n

i

i

i bx k

y

1

2

2 ( ( ))

Dieser Ausdruck wird minimal, falls 2 ( ) 0

1

2 =− − − =

= n

i

i i

i y bx k

b x 0

) (

2

1

2 =− − − =

= n

i

i

i bx k

k y

= = =

=

+ n

i i i n

i i n

i

i k x x y

x b

1 1

1 2

= =

=

+ n

i i

n

i xi kn y

b

1 1

Sei

=

− −

= n

i

i i

xy x x y y

s n

1

) )(

1 (

1 dann gilt:

2 x xy

s

b= s , 2

x xy

s xs y k = −

(11)

27.03.2002 Regressionsgerade x x y

s y s

x

xy − +

= 2 ( ) verläuft durch den Punkt (x, ) y sxy heißt Stichprobenkovarianz. Eine leichte Umrechnung führt auf:

) 1(

1

1

=

− −

= n

i i i

xy x y nxy

s n

Kovarianzmatrix 



2 2

y xy

xy x

s s

s

s = cov(x,y) (Matlab)

empirischer Korrelationskoeffizient

y x

xy

xy s s

r = s

Es gilt: 1) rxy ≤1

2) 1rxy = genau dann, wenn alle Punkte (x1, y1), …, (xn, yn) auf einer Geraden liegen.

corrcoef(x,y)= 

 

1 1

xy xy

r r

5. Robustheit von Maßzahlen

α= gestutztes Mittel

Sei 50<α <0, ;k =[α*n] (Bsp.: [2,3]=2)

[

xk xn k

]

k

x n + + +

= − ...

2 1

α 1

Bsp.: n=5; α =20%

5 2

1 x ... x

x ≤ ≤ ≤ ; k=1

(

2 3 4

)

%

20 3

1 x x x

x = + +

(12)

II. Grundzüge der Wahrscheinlichkeitsrechnung

1. Zufallsexperiment

Grundbegriffe:

Ereignis: Jeder mögliche Ausgang eines Versuchs (einer Beobachtung, Untersuchung, eines Tests, einer Probe, …).

Maßgebend ist die Versuchsanordnung (der Bedingungskomplex) Ereignisse sind zufällig

Beispiele: Münzwurf, Würfelspiel, Lotto, Qualitätskontrolle Ergebnismenge: Zu jedem Versuch gehört eine Ergebnismenge Ω. Elementarereignisse: Die Ergebnisse heißen auch Elementarereignisse.

2. Ereignisse und Ereignisalgebra

Ω: Ergebnismenge

A , Ereignis A

Liegt das zufällige Ereignis ω∈Ω vor und gilt ω∈A, so sagt man, das Ereignis A ist eingetreten. Ist ω∉A, so sagt man A ist nicht eingetreten.

Beispiele:

1) Würfelspiel: Ω = {1, 2, 3, 4, 5, 6}

A = {2, 4, 6} „Werfen einer geraden Zahl“

A = {1, 2, 3} „Werfen einer Zahl kleiner 4“

08.04.2002 2) Qualitätskontrolle einer Ware durch Gewichtskontrolle

(Nenngewicht: 1000g, Toleranz ±δ):

[

1000 α,1000 α

]

Ω = − + ; α δ> geeignet [1000 ,1000 )

A= −α −δ “zu leicht”

[

1000 ,1000

]

B= −δ +δ “normal”

(1000 ,1000 ]

C = +δ +α “zu schwer”

B ω

3) Zählung der Wählerstimmen bei 5 kandidierenden Parteien

( )





 ∈ ≤

=

=

WB x N

x x x x x

i i 5

1 5 0 5 4 3 2

1, , , , |

(13)

absolute Mehrheit für Partei 1

( )

{

x1,x2,x3,x4,x5 N05 |x1 x2 x3 x4 x5

}

A= ∈ > + + +

relative Mehrheit für Partei 1

( ) { }

{

1 2 3 4 5

}

5 0 5 4 3 2

1,x ,x ,x ,x N |x max x ,x ,x ,x

x

B = ∈ >

Stimmengleichheit der „Linksparteien“ 1 bis 3 und der „Rechtsparteien“ 4 und 5

( )

{

1 2 3 4 5

}

5 0 5 4 3 2

1,x ,x ,x ,x N |x x x x x

x

C = ∈ + + = +

10.04.2002

∅ unmögliches Ereignis Ω sicheres Ereignis

Def.: Seien A,B⊂Ω Ereignisse.

(1) Das durch den Durchschnitt AB repräsentierte Ereignis heißt Produkt von A und B und wird als „A und B“ gelesen.

(2) Das durch die Vereinigung AB repräsentierte Ereignis heißt Summe von A und B und wird als „A oder B“ gelesen.

(3) Sei A:=Ω− A=Ω/A=

{

ω|ω∈Ω,ω∉A

}

Das Ereignis A heißt entgegengesetztes oder komplementäres Ereignis und wird als „nicht A“ gelesen.

Menge aller Teilmengen von Ω: Potenzmenge 2 Bsp.:

1) Ω=

{ }

0,1 ; 2 =

{

∅,Ω,{0},{1}

}

2) Ω={A,B,C}; 2 =

{

∅,Ω,{A},{B},{C},{A,B},{A,C},{B,C}

}

Def.: Ω sei eine gegebene Menge. Eine Ereignisalgebra oder σ-Algebra A über Ω ist eine Teilmenge von 2 mit den Eigenschaften

(1) Ω∈A

(2) A∈ A für alle A∈A

(3) Ist An∈A für alle nN, so ist auch ∈A

= 1 n

An

Folgerungen:

(1) ∅∈A

(2) A,B∈A⇒AB∈A (3) A,B∈A⇒AB∈A Bsp.:

Würfelspiel (mit einem Würfel) }

6 , 5 , 4 , 3 , 2 , 1

={ Ω

Nehmen wir an, uns interessiert nur die Frage, ob eine gerade oder ungerade Augenzahl geworfen wird.

Wähle A={2,4,6}, dann ist A={∅,A,A,Ω} eine Ereignisalgebra.

(14)

Def.: Sei Ω eine beliebige Menge und E ={A,B,C,...} eine Menge von Teilmengen von Ω.

Die kleinste Ereignisalgebra über Ω, die alle Elemente von E enthält, heißt die von E erzeugte Ereignisalgebra und wird mit A(E) bezeichnet.

Bemerkung: Die kleinste σ-Algebra über R(||Menge R), die alle offenen, abgeschlossenen, halboffenen und einseitig unbegrenzte Intervalle enthält, heißt Borel’sche Menge

Zusatzblatt: Anhang A: Ereignisse

A.1) Definitionen

Ω sei eine Menge und 2 die dazugehörige Potenzmenge, i.e. die Menge aller Teilmengen von Ω.

Für A,B∈2 heißen

AB:=

{

ωωAωB

}

Durchschnitt von A und B

AB:=

{

ωωAωB

}

Vereinigung von A und B

AB:=

{

ωAωB

}

Differenz von A und B

A:=Ω−A Komplement von A in Ω

AB:=

(

AB

) (

BA

)

symmetrische Differenz von A und B

AB,AB,AB,AB Vollkonjunktionen über A und B Zur graphischen Veranschaulichung dienen die sogenannten Venn-Diagramme:

Man stellt dazu die Ausgangsmengen Ω, A, B als einfache Teilmengen der Zeichenebene dar, etwa durch Rechtecke oder Ovale, und kennzeichnet zusammengesetzte Ereignisse durch entsprechende Färbung oder Schraffierung.

Für den Durchschnitt bzw. die Vereinigung von A und B erhält man dann beispielsweise:

Ω Ω

bzw.

A A

B

B

(15)

A.2) Rechenregeln Für A,B,C∈2 gilt:

A B B A

A B B A

=

=

∪ (Kommutativgesetze)

( ) ( )

(

B C

) (

A B

)

C

A

C B A C B A

=

=

∪ (Assoziativgesetze)

( ) ( ) ( )

(

B C

) (

A B

) (

A C

)

A

C A B A C B A

=

=

∪ (Distributivgesetze)

B A B A

B A B A

=

=

∪ (Gesetze von De Morgan)

A∪ =A A, A∩ =A A (Idempotenzgesetze)

( )

AA B∪ = A, A

(

A B

)

=A (Absorptionsgesetze)

A∪ = ΩA , A∩ = ∅A , A=A (Gesetze für Komplementärereignisse) A∪ Ω = Ω, A∩ ∅ = ∅ (Dominante Elemente)

A∩ Ω =A, A∪ ∅ =A (Neutrale Elemente)

A B− = ∩A B (Gesetz für die Mengendifferenz)

( ) ( )

( ) ( )

A B A B A B

A B A B

A B A B A B

= ∪ − ∩

=

= ∩ ∪ ∩

(Gesetze für die symmetrische Differenz)

(16)

2.3. Die klassische Wahrscheinlichkeitsdefinition

Bei der klassischen Definition der Wahrscheinlichkeit legen wir die Gleichwahrscheinlichkeit aller Elementarereignisse zugrunde. (Laplace-Annahme)

Ω: Menge der Elementarereignisse (endlich) Ω

A Ereignis

von_Ω _Elemente_

Anzahl_der

A _ von _ Elemente _

Anzahl_der )

( =

= ΩA A P

(Laplace-Wahrscheinlichkeit)

Nennen wir ein Elementarereignis ω∈Ω ein für ein Ereignis günstigen Fall, falls ω∈A ist.

_Fälle _möglichen Anzahl_der

le stigen_Fäl _für_A_gün

Anzahl_der )

(A = P

Bsp.: Zwei Personen würfeln

Elementarereignisse (x,y) x: Augenzahl der Person X

y: Augenzahl der Person Y

{

(1,1),(1,2),...

}

=

Ω ; Ω =36

=2

A

A „x ist größer als y“

B „y ist doppelt so groß wie x“





=

) 5 , 6 ( ), 4 , 6 ( ), 3 , 6 ( ), 2 , 6 ( ), 1 , 6 (

) 4 , 5 ( ), 3 , 5 ( ), 2 , 5 ( ), 1 , 5 (

) 3 , 4 ( ), 2 , 4 ( ), 1 , 4 (

) 2 , 3 ( ), 1 , 3 (

) 1 , 2 (

A ; A =15;

12 5 36 ) 15 (A = = P

B={(1,2), (2,4), (3,6)}

12 1 36 ) 3

(B = = P

15.04.2002 (Ω, A, P)

Das Prinzip der Gleichwahrscheinlichkeit kann nicht in allen zu betrachtenden Fällen aufrechterhalten werden.

Beispiel:

(17)

R Fläche der

Inhalt

Q Fläche der

Inhalt A

P _ _ _

_ _

) _

( = (geometrische Wahrscheinlichkeit)

R

Q

(18)

Wiederholung: Kombinatorik Def.: n,kN0 mit kn

1)

=

= n

k

k n

1

! (n≥1) 0!=1

2) ( )! !

! k k n

n k

n

= −



 

Bemerkung:

1) Für Nn,k∈ mit kn gilt:

k k n n

n n k n

* ...

* 3

* 2

* 1

) 1 )...(

2 )(

1

( − − − +

=

 

2) Für n,kN0 mit kn gilt:

a) 

 

= −



 

k n

n k

n

b) 

 

 +

= +



 

 + +



 

1 1

1 k

n k

n k

n

c)

( ) ( )



 

− 

=

 

 + +

k k n k n

k n 1 1

Def.: Jede Zusammenstellung von k Elementen aus n gegebenen Elementen heißt Kombination k-ter Ordnung

I Kombinationen mit Berücksichtigung der Anordnung (Permutationen) a) Kombinationen mit Berücksichtigung der Anordnung ohne Wiederholung

n k

Bsp.: M={a, b, c, d}; n=4; k=2 (a, b) (b, a) (c, a) (d, a) (a, c) (b, c) (c, b) (d, b) (a, d) (b, d) (c, d) (d, c) 4*3=12 Möglichkeiten

(

n 1

) (

...n k 1

)

kn k!

(

nn!k

)

!

n  = −

 

= +

Spezialfall (k=n): n!

Bsp.: In wieviel verschiedenen Reihenfolgen können 5 verschiedene Personen auf einer Bank sitzen?

5!=120

(19)

Auf wieviel Arten kann man 4 Hotelgäste auf 8 freie Einzelzimmer verteilen?

n=8; k=4; 5*6*7*8 1680

! 4

!

8 = =

b) Kombinationen mit Berücksichtigung der Anordnung mit Wiederholung Bsp.: M={a, b, c, d}; n=4; k=2

(a, a) (b, a) (c, a) (d, a) (a, b) (b, b) (c, b) (d, b) (a, c) (b, c) (c, c) (d, c) (a, d) (b, d) (c, d) (d, d)

42

4

*

4 = Möglichkeiten nk

Bsp.: Wieviel 4-stellige Zahlen mit ungeraden Ziffern gibt es?

54 =625 Zahlen

Auf wieviel Arten kann man 3 Hotelgäste auf 2 freie Vierbettzimmer verteilen?

8

23 = Möglichkeiten

II Kombinationen k-ter Ordnung ohne Berücksichtigung der Anordnung a) Kombinationen k-ter Ordnung ohne Berücksichtigung der Anordnung ohne Wiederholung

n k

Bsp.: M={a, b, c, d}; n=4; k=2 (a, b)

(a, c) (b, c)

(a, d) (b, d) (c, d) 3*2*1=6 Möglichkeiten



 

= −



 

k n

n k

n

Bsp.: Wieviel Möglichkeiten gibt es für 6 Richtige im Lotto?

13.983.816

6 49=

 

 Möglichkeiten

(20)

17.04.2002 b) Kombinationen k-ter Ordnung ohne Berücksichtigung der Anordnung

mit Wiederholung

Bsp.: M={a, b, c, d}; n=4; k=2 (a, a)

(a, b) (b, b)

(a, c) (b, c) (c, c)

(a, d) (b, d) (c, d) (d, d)



 

= +



 

 + −

1 1 1

n k n k

k n

Bsp.: Wieviel Steine enthält ein Dominospiel?

Zahlen von 0 bis 6.

n=7; k=2;

28

2 8=

 

Mit Hilfe der Formeln I a,b und II a,b lassen sich Verteilungsprobleme wie folgt lösen:

Satz1: Die Anzahl der möglichen Verteilungen von k verschiedenen Objekten in nk verschiedene Fächer, bei denen in jedes Fach höchstens ein Objekt kommt, beträgt

)!

(

! k n

n

Satz2: Die Anzahl der möglichen Verteilungen von k versciedenen Objekten in n verschiedene Fächer mit unbegrenzter Kapazität beträgt nk.

1.Obj 2.Obj

...

k.Obj

1 5

3

n

Fächer 1 2 n

2 4 5

3 7 1

...

...

(21)

Satz2b: Die Anzahl der möglichen Verteilungen von k verschiedenen Objekten in n verschiedene Fächer Fi (i=1,2,…,n), bei denen in das Fach Fi genau ki Objekte kommen (beachte: k=k1+k2+…+kn) beträgt

!

!...

!

!

... 1 2

2

1 n k k kn

k k

k k

k =

 

Satz3: Die Anzahl der möglichen Verteilungen von k nicht unterscheidbaren Objekten in k

n≥ verschiedene Fächer, bei denen in jedes Fach höchstens ein Objekt kommt, beträgt 

 

k n

Obj Obj

...

Obj

1 5

3

n

Fächer 1 2 n

2 4 5

3 7 1

...

...

1.Obj 2.Obj

...

k.Obj

1 7

5

n

Fächer 1 2 n

2 2 4

3 5 5

...

...

(22)

Satz4: Die Anzahl der möglichen Verteilungen von k nicht unterscheidbaren Objekten in n verschiedene Fächer mit unbegrenzter Kapazität beträgt 

 

 + − k

k

n 1

.

Obj Obj

...

Obj

1 7

5

n

Fächer 1 2 n

2 2 4

3 5 5

...

...

(23)

2. 4. Statistische Wahrscheinlichkeiten

Bsp.: Jemand wirft eine Münze hoch. Nach 50 Versuchen mit 45 mal Adler und fünfmal Zahl erschienen.

relative Häufigkeit für „Adler“ 0,9 50 45 =

=

allg.: Versuch V mit einer Menge Ω von Elementarereignissen. A sei ein zu V gehörendes Ereignis. Bei n-maliger Wiederholung des Versuchs sei das Ereignis A nA-mal eingetreten.

relative Häufigkeit

( )

n A n hn = A

statistische Wahrscheinlichkeit P

( )

A hn

( )

A

n

=lim

2. 5. Die axiomatische Begründung der Wahrscheinlichkeit

Def.: Es sei Ω eine beliebige Menge und A eine Ereignisalgebra auf Ω. Ein

Wahrscheinlichkeitsmaß (W-Maß) auf A ist eine Abbildung P:A->[0,1], welche die folgenden Bedingungen erfüllt:

(W1) P(Ω)=1

(W2) Sind die Ereignisse An (nN) paarweise unvereinbar, d.h. AiAj =∅ )

,

;

(ij i jN , so ist

( )

=

=

=

 

1

1 i

i i

i P A

A P

Statt Wahrscheinlichkleitsmaß sagt man auch Verteilungsgesetz. Das Tripel (Ω, A, P) bezeichnet man als Wahrscheinlichkeitsraum (W-Raum).

(24)

29.04.2002 Regeln: 1.) P

( )

∅ =0

2.) A B∩ = ∅ ⇒P A B

(

)

=P A

( )

+P B

( )

Beweis:

A1=A; A2=B; Ai = ∅ (i≤3)

( ) ( ) ( ) ( )

1 1

i i

i i

P A P A B P A P A P B

=

=

 = ∪ = = +

 

3.) A1, A2, …, Ak paarweise unvereinbare Ereignisse

( )

1 1

k k

i i

i i

P A P A

=

=

 

⇒  =

4.) P A

( )

+P A

( )

=1, wobei A das zu A gehörende komplementäre Ereignis ist.

5.) Additionssatz für Wahrscheinlichkeiten P A B

(

)

=P A

( )

+P B

( )

P A B

(

)

Verallgemeinerung:

( ) ( ) ( ) ( ) ( )

P A B∪ ∪C =P A +P B +P CP A B∩ −

( ) ( ) ( )

P A C P B C P A B C

− ∩ − ∩ + ∩ ∩

A B C∩ ∩ 6.) A⊂ ⇒B P A

( )

P B

( )

7.) Siebformel von Poincaré-Sylvester:

Seien A1, A2, …, Ak Ereignisse

( ) (

1 2

) (

1 2

)

1 2

1 1 1

... ( 1) ...

k

k k

l

i i i i i i i

i i i

i

P A P A P A A + P A A A

= <

=

 = − ∩ + + − ∩ ∩ ∩ +

 

∑ ∑ ∑

( )

1 k+1P A

(

1 A2 ... Ak

)

+ − ∩ ∩ ∩ wobei i i1 2, ,...,ik

{

1,2,...,k

}

8.) Boole’sche Ungleichung:

Seien A1, A2, …, Ak Ereignisse

( )

1 1

k k

i i

i i

P A P A

=

=

 ≤

 

9.) Für eine beliebige Folge

{ }

An ;n N∈ von Ereignissen gilt:

( )

1 1

i i

i i

P A P A

= =

 

 ≤

Definition: Eine Folge

{ }

An ;n N∈ von Ereignissen heißt monoton wachsend (monoton fallend), falls AnAn+1 (An+1An) n N

A B

C

(25)

Bemerkung: 1.) Jede Vereinigung

1 i i

C

= kann als Vereinigung einer monoton wachsenden Folge von Ereignissen geschrieben werden:

1 1

j

j i j

i

A C A+

=

=

;

1 j 1 i

j i

A A C

= =

=

=

Schreibweise: A limj

( )

Aj

= →∞ bzw. AjA

2.) Jeder Durchschnitt

1 i i

C

= kann als Durchschnitt einer monoton fallenden Folge von Ereignissen geschrieben werden.

1 1

j

j i j

i

A C A+

=

=

> ;

1 1

j i

j i

A A C

= =

=

=

Schreibweise: A limj

( )

Aj

= →∞ bzw. AjA

10.) Sei

{ }

An n N∈ eine monotone Folge von ereignissen, dann gilt:

(

limj

( )

j

)

limj

( ( )

j

)

P A P A

→∞ = →∞

2.6. Charakterisierung diskreter W-Räume

Ω heißt diskret, falls Ω höchstens abzählbar viele Elemtarereignisse besitzt.

Satz: Sei Ω =

{

ωi i I∈ ⊂N

}

, seien p i Ii

(

)

reelle nicht negative Zahlen mit i 1

i I

p

= . Dann wird durch P: 2

[ ]

0,1 mit

( )

{ i }

i

i A

P A p

ω

=

ein diskretes Wahrscheinlichkeitsmaß auf 2 definiert. Insbesondere gilt P

( ) { }

ωi = pi

06.05.2002

2.7. Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen

Beispiel: Würfelspiel mit 2 Spielern X und Y:

X beginnt: Würfelt X eine 1, 2 oder 3, so zahlt Y unabhängig von seinem eigenen Wurf 1€ an X.

Würfelt X eine Zahl größer als 3, so wird das Wurfergebnis y von Y mit

x verglichen.

Ist xy, so erhält Y von X 3€. Ist x>y, so erfolgt keine Auszahlung.

( ) { }

{

ω ω i j i j, ; , 1,2,...,6

}

Ω = = ∈

2

=

A , Laplace-Modell

Mit welcher Wahrscheinlichkeit gewinnt A ? A X=

{ ( )

, 3

}

A= i j i> ⊂ Ω; A=

{ ( )

i j i, 3

}

⊂ Ω

(26)

( ) ( )

12

P A =P A =

Mit welcher Wahrscheinlichkeit gewinnt Y ?

{ ( )

,

}

B= i j ij ⊂ Ω

( )

6 1

36 6 P A B∩ = =

Mit welcher Wahrscheinlichkeit gewinnt Y, unter der Bedingung, daß X eine Zahl größer als 3 gewürfelt hat?

( )

A B 186 13

P B A

A

= ∩ = = („B unter der Bedingung A“) neue Ergebnismenge Ω =A A

( )

A B P A B

( ( ) )

P B A

A P A

∩ Ω

= =

Definition: Es sei V irgendein Versuch und A ein damit verbundenes Ereignis mit P A

( )

>0.

Ist B ein weiteres beliebiges zu V gehörendes Ereignis, so verstehen wir unter

( )

P B A die Wahrscheinlichkeit von B unter der Bedingung A und berechnen diese nach der Formel:

( )

P A B

( ( ) )

P B A

P A

= ∩

Bemerkung: Ist

(

, ,A P

)

ein Wahrscheinlichkeitsraum, A ein Ereignis mit P A

( )

>0, so ist

mit Ω =A A; AA=

{

A B B∩ ∈A

}

;

(

A,AA,P

( )

i,A

)

ein

Wahrscheinlichkeitsraum.

Ist auch P B

( )

>0, so gilt P A B

( )

= P A B

(

P B

( )

)

Multiplikationssatz für Wahrscheinlichkeiten / Gleichung von Bayes:

( ) ( ) ( ) ( ) ( )

P A B∩ =P A B P B =P B A P A Verallgemeinerung: P A

(

(

B C

) )

=P B C A P A

(

) ( )

( ) ( ) ( )

P B C A∩ =P B A P C A B

( ) ( ) ( ) ( )

P A B C∩ ∩ =P A P B A P C A B

(27)

08.05.2002 Bsp. 2: A „kein Erfolg beim ersten Versuch“

B „kein Erfolg beim zweiten Versuch“

gesucht: P A B

(

)

gegeben: P A

( )

=0,6 also P A

( )

=0,4

( )

0,9

P B A = also P B A

( )

=0,1

also P A B

(

)

=P A P B A

( ) ( )

=0,04

Bsp. 3: Ai „Vollkommene Bearbeitung von Schritt i“ (i=1, 2, 3) gesucht: P A

(

1A2A3

)

gegeben: P A

( )

i =0,3 also P A

( )

i =0,7

(

2 1

)

0,7

P A A = also P A A

(

2 1

)

=0,3

(

2 1 2

)

0,8

P A AA = also P A A

(

3 1A2

)

=0,2

(

1 2 3

) ( )

1

(

2 1

) (

3 1 2

)

0,042

P AAA =P A P A A P A AA = Bsp. 4: A „eine Goldmünze wird gezogen“

Ei „gewählte Schachtel hat i Goldmünzen“ (i= 0, 1, 2) gesucht: P E A

(

2

)

gegeben:

( )

1

i 3

P E = (i= 0, 1, 2)

( )

1

P A = 2

(

2

)

1 P A E =

( ) ( ) ( ) ( )

2 2 2

2 3 P A E P E P E A

= P A =

Verallgemeinerung der Formel

( ) ( ) ( )

( )

P B A P A P A B

= P B :

Regel von Bayes: Für paarweise unvereinbare Ereignisse A1, A2, …, An mit

2 1 i

A

=

Ω =

und P B

( )

>0 gilt:

( ) ( ) ( ) ( ) ( )

1

i i

i n

j j

j

P B A P A P A B

P B A P A

=

=

(i= 1, 2, …, n)

Satz von der totalen Wahrscheinlichkeit:

Für paarweise unvereinbare Ereignisse A1, A2, …, An mit

1 n

i i

A

=

Ω =

gilt:

( ) ( ) ( )

1 n

j j

j

P B P B A P A

=

=

(28)

Spezialfall: n=2; A1=A; A2 = A

( ) ( ) ( ) ( ) ( )

P B =P B A P A +P B A P A Def.: Seien A, B Ereignisse.

Die Ereignisse A und B unabhängig, falls P A B

(

)

=P A P B

( ) ( )

Folgerung: 1.) Ist P B

( )

>0 bzw. P A

( )

>0, so ist, falls A, B unabhängig sind,

( ) ( )

P A B =P A bzw. P B A

( )

=P B

( )

2.) Wenn A und B unabhängig sind, so sind auch A und B, A und B sowie A und B unabhängig. (Aufgabe)

Bsp. 5: A „Studierender hat regelmäßig Hausaufgaben gemacht“

B „Studierender hat die Prüfung nicht bestanden“

gesucht: P B A

( )

gegeben:

( )

1

P A =10; P A B

( )

=501

Da A und B sicherlich nicht unabhängig sind (P A B

( )

P A

( )

!!), hat A einen Einfluß auf B.

( ) ( )

( ) ( ) ( )

( )

49

( )

50 9 10 P A B P A B P B P B

P B A

P A P A

= ∩ = =

Zusatzangabe: P B A

( )

=201

( ) ( ) ( )

( )

1 1 20 10 1

1 4

50 P B A P A

P B = P A B = = P B A

( )

=27,2%

13.05.2002 Def.: Sei A1, A2, …, Ak Ereignisse

Diese heißen unabhängig, wenn für jede Teilmenge

1, 2,...,

i i il

A A A mit 2≤ ≤l k gilt:

(

i1 i2 ... il

) ( ) ( ) ( )

i1 i2 ... il P AA ∩ ∩A P A P A P A Spezialfall: k=3

A1, A2, A3 unabhängig, falls

(

1 2

) ( ) ( )

1 2

P AA =P A P A und

(

1 3

) ( ) ( )

1 3

P AA =P A P A und

(

2 3

) ( ) ( )

2 3

P AA =P A P A und

(

1 2 3

) ( ) ( ) ( )

1 2 3

P AAA =P A P A P A

(29)

Beispiel: (Zuverlässigkeit von Systemen) Sseriell

Sparallel

Sei pi die Wahrscheinlichkeit, daß das System Si ausfällt (Ausfallwahrscheinlichkeit)

Ai „System Si fällt aus.“ (i= 1, 2, …, m) ASparallel „System Sparallel fällt aus.“

ASseriell „System Sseriell fällt aus.“

Voraussetzung: Der Ausfall der Systeme Si geschieht unabhängig voneinander

(

Sparallel

) (

1 2 ... m

)

1 2... m

P A =P AA ∩ ∩A = p p p

(

Sseriell

) (

1 2 ... m

)

P A =P AA ∪ ∪A

(

Sseriell

)

1

(

Sseriell

) (

1 2 ... m

)

P A = −P A =P AA ∪ ∪A

(

1 2 ... m

) ( ) ( ) ( )

1 2 ... m

P A A A P A P A P A

= ∩ ∩ ∩ =

S1 S2 Sn

S1

S2

Sn

(30)

22.05.2002

III. Zufallsvariable und deren Verteilung

3.1. Der Begriff der Zufallsvariablen

Def.: Seien

(

, ,A P

)

und

(

′ ′ ′, ,A P

)

zwei Wahrscheinlichkeitsräume. Eine Abbildung :

X Ω → Ω′ heißt Zufallsvariable (ZVa).

{ ( ) }

( )

X 1 A

X A

ω ω

∈ ′ ∈A

(

A′A

)

Ist Ω =′ R, so heißt X reelle oder numerische Zufallsvariable.

Bsp.: (Qualitätskontrolle)

Aus 100 gleichartigen Einheiten eines Produkts wird eine Stichprobe von 8 Einheiten gezogen. Ergebnis ω1 „brauchbar“, ω2nicht brauchbar.

( ) { }

{

a a1, ,...,2 a a8 i ω ω1, 2

}

Ω = ∈

2 A=

:

X Ω → R

(

1 2 8

)

8

1

, ,..., i

i

X a a a k

=

=

mit 1 1

2

1;

0;

i i

k a

a ω ω

 =

=  =

3.2. Diskrete Zufallsvariable

Def.: Eine Zufallsvariable, deren Wertebereich endlich oder abzählbar unendlich ist, heißt diskrete Zufallsvariable.

Sei X eine diskrete Zufallsvariable mit WX =

{

x x1, ,...2

}

Nehmen wir an, daß pi =P X

(

=xi

)

(i=1,2,…) bekannt ist. Setzen wir für eine beliebige Teilmenge A WX

( ) ( )

{:i }

i i x A

P A P X x

=

= so ist damit ein Wahrscheinlichkeitsmaß auf 2WX

A= gegeben.

Def.: (Dichte, Verteilungsfunktion, Verteilung) Die Funktion fX :RR, ;

0;

i i

X

p x x

x x W

 =

→  ∉ heißt Wahrscheinlichkeitsfunktion (diskrete Dichte (-funktion) bzw. Zähldichte) der Zufallsvariablen X.

(31)

27.05.2002 Wir definieren die Verteilungsfunktion (Vf) Fx von X durch

x:

F → ;

( ) ( ) ( )

{:i }

x x i

i x x

F x P X x f x

= ≤ =

(Abkürzung: "X x"=

{

ω X

( )

ω x

}

; analog: "a X b"=

{

ω a X

( )

ω b

}

)

Bemerkung: Es gilt:

(1) P X

(

= xi

)

= pi = f xx

( )

i

(2) Fx ist monoton wachsend Fx=1 für x≥sup

{

x x1, ,...2

}

Fx=0 für x<inf

{

x x1, ,...2

}

Fx ist rechtsseitig stetig

Beispiel: Unabhängig vom Wochentag und unabhängig von der Uhrzeit seien alle Arbeitsplätze in einem Rechnerraum mit der Wahrscheinlichkeit p

( )

0,1

besetzt.

ωi= „Ein Student S findet im i-ten Versuch einen freien Arbeitsplatz“

(

1≤ ≤i n

)

ω0= „Student S findet nach n Versuchen keinen freien Arbeitsplatz“

{

ω ω0, ,...,1 ωn

}

Ω = ; X :Ω → ; X

( )

ωi =i; (i=0,1,2,…,n)

( )

i 1

(

1

)

P X = =i pp ; (i= 1, 2, …, n)

(

0

)

n

P X = = p

x1 x2 x3 x4 x5

p1

p2

p3

p4

p5

x1 x2 x3 x4

p1

p2

p3

p4

(32)

Definition: Sei X eine diskrete Zufallsvariable mit WX =

{

x x1, 2,...

} [ ]

i

(

i

)

i

E X =

x P X =x Erwartungswert von X falls diese Reihe absolut konvergiert

[ ] (

i

[ ] )

2

(

i

)

i

Var X =

xE X P X =x Varianz von X falls diese Reihe absolut konvergiert

Regeln: (1) Ist g eine beliebige reellwertige Funktion, deren Definitionsbereich den Wertebereich von X enthält, so gilt:

( ) ( ) (

i i

)

i

E g X =

g x P X = x

(2) Mit g x

( )

=ax b+ , wobei ,a b sind, gilt E aX b

[

+

]

=aE X

[ ]

+b

(3) Var X

[ ]

=E X 2E X

[ ]

2 =E X

(

E X

[ ] )

2

(4) Var aX b

[

+

]

=a Var X2

[ ]

Beispiel: Würfelspiel mit einem Würfel

ωi= Würfeln der Zahl i (i= 1, 2, …, 6) :

X Ω → ; X

( )

ωi =i; (i= 1, 2, …, 6)

( )

1

P X = =i 6

[ ]

6

1

1 1 6*7 6 6 2 3,5

i

E X i

=

=

= =

[ ]

6

( )

2

1

3,5 1

i 6 Var X i

=

=

2 6 2

1

1 91

6 6

i

E X i

=

  = =

 

[ ]

91 49 35

6 4 12

Var X = − =

Standartabweichung

[ ]

X = Var X

[ ]

=1,71

3.3. Spezielle diskrete Verteilungen 3.3.1. Diskrete Gleichverteilung

X Zufallsvariable mit Wx=

{

x x1, ,...,2 xn

}

( )

1;

0;

x x

f x n x W sonst

 ∈

= 



Für xi =i (i= 1, 2, …, n) gilt:

[ ] ( )

1

1 1 1 1

* 2 2

n

i

n n n

E X i

n n

=

+ +

=

= =

Referenzen

ÄHNLICHE DOKUMENTE

Jedesmal wenn in einem Versuch die l erscheint wird das momentane Vermögen verdreifacht und jedesmal wenn 0 erscheint, wird das momentane Vermögen gedrittelt.. Wie gross ist

Ziehe aus einer Urne mit n weißen und g − 1 schwarzen Kugeln sukzessive ohne Zur ¨ucklegen. Notiere 0 beim Zug einer schwarzen und 1 beim Zug einer

Ein weiteres einpr ¨agsames Beispiel ist die rein zuf ¨allige Wahl eines Punktes aus dem

Zeichnen Sie auch die Verteilungsfunktion und Vergleichen Sie sie mit der vorgegebenen Verteilungsfunktion (die Verteilungsfunktion kann mit plot(ecdf(X)) gezeich- net werden,

Eine (diskrete) Zufallsvariable X heißt hypergeometrisch verteilt mit Parametern n ∈

[r]

Marco Cattaneo @ LMU M¨ unchen Einf¨ uhrung in

Marco Cattaneo @ LMU M¨ unchen Einf¨ uhrung in