• Keine Ergebnisse gefunden

Dr. Christof Luchsinger Frühjahrsemester 2011 Olivier Warin Seite 1 von 7

N/A
N/A
Protected

Academic year: 2021

Aktie "Dr. Christof Luchsinger Frühjahrsemester 2011 Olivier Warin Seite 1 von 7"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungsblatt 6 zur Vorlesung ¨

”Statistische Methoden”

Testtheorie: θ∈[θ1, θ2] vsθ /∈[θ1, θ2], UMPU-Tests, Cox-Hinkley

Herausgabe des ¨Ubungsblattes: Woche 14, Abgabe der L¨osungen: Woche 16 (bis Donnerstag, 1615 Uhr), Besprechung: Woche 17

Must Aufgabe 24 [diese sieben Bedingungen...]

Zeigen Sie im Fall einer Stichprobe ausN(µ,1), dass die sieben Bedingungen aus Satz 4.12 erf¨ullt sind.

Standard Aufgabe 25 [unbiased bei Tests][2+2 Punkte]

Sei x1, ..., x4 eine Stichprobe aus einer Be(p)-Verteilung. Wir testen H0 : p = 12 gegen H1 : p 6= 12 mit folgendem Test:

d1(x) =I[x1+x2+x3+x46= 2].

a) Ist dieser Test unverf¨alscht?

b) Gibt es einp0∈(0,1), sodass der Test

d2(x) =I[x1+x2+x3+x4∈ {/ 2,3}] unverf¨alscht ist f¨urH0:p=p0 gegenH1:p6=p0?

Aufgabe 26 [mit Hilfe von R/S-PLUS; UMPU bei Symmetrie][2 Punkte]

Sei x1, . . . , x10 eine Stichprobe aus einerN(θ,1)-Verteilung. H0 :θ∈[1,2] vsH1 :θ /∈[1,2]. Konstruieren Sie einen UMPU-Test nach Satz 4.12 (exakt!) zum Niveau 0.1.

Aufgabe 27 [mit Hilfe von Rechnern; UMPU vs Cox-Hinkley] [2+1+2+1 Punkte]

a) Sei xeine Einerstichprobe aus einer Exponentialverteilung mit Parameterθ. H0 :θ= 1 vs H1 :θ 6= 1.

Konstruieren Sie einen UMPU-Test nach Satz 4.12 (exakt!) zum Niveau 0.1.

b) L¨osen Sie a) mit Cox-Hinkley und vergleichen Sie.

c) Sei x1, . . . , x10 eine Stichprobe aus einer Exponentialverteilung mit Parameter θ. H0 : θ ∈ [1,2] vs H1:θ /∈[1,2]. Konstruieren Sie einen UMPU-Test nach Satz 4.12 (exakt!) zum Niveau 0.05.

d) L¨osen Sie c) mit Cox-Hinkley und vergleichen Sie.

Tipp zu c): Beginnen Sie mit dem Intervall [0, t2] so, dassE1[d(X)] =αund berechnen Sie dann E2[d(X)].

E2[d(X)] wird kleiner alsαsein. Dann nehmen Sie in kleinen Iterationsschritten (t1erh¨ohen) [t1, t2] immer jeweils so, dass E1[d(X)] =α. Man kann zeigen (siehe Vlsg), dassE2[d(X)] wachsend ist - brechen Sie ab, sobald Sie auch hierαhaben.

(2)

Übungsblatt 6 zur Vorlesung “Statistische Methoden”

Olivier Warin 24. April 2011

Aufgabe 24 [diese sieben Bedingungen. . . ]

Behauptung: Bei einerN(µ,1)-Verteilung sind alle sieben Bedingungen von Satz 4.12 erfüllt.

Beweis: Eine minimal suffiziente Statistik fürµlautet bekanntlichT(x) =Pn i=1xi. Nun zu den sieben Bedingungen:

1. Da die Entscheidungsfunktion ddie Formd(x) = 1 ⇔t 6∈[t1, t2], t1, t2 ∈R, t1 < t2 hat, ist diese Entscheidungsfunktion klar messbar. Denn dies ist nichts anderes als eine Indikatorfunktion einer Borel-messbaren Menge (nämlichR\[t1, t2]), welche bekanntlich messbar ist.

2. MLQ ist erfüllt, daN(µ,1)zur exponentiellen Familie gehört. Alternativ berechnen wir hier direkt (mit den Notationen aus der Vorlesung):

gµ0µ1(t(x)) = fµ1(x) fµ0(x) =

Qn i=1 1

e12(xi−µ1)2 Qn

i=1

1

e12(xi−µ0)2 = e1−µ0)t(x)+n/220−µ21).

Dies ist fürµ1> µ0klar int(x)streng monoton wachsend, also ist die MLQ-Eigenschaft erfüllt.

3. Seiµ0∈R. Weiter definiereN(µ0) :={µ∈R| |µ−µ0|<1}. Nun gilt für alleµ∈N(µ0):

gµ0µ(t1) +gµµ0(t2) =e(µ−µ0)t1+n/220−µ2)+e0−µ)t2+n/22−µ20) 6 2e|µ−µ0|t2+n/22−µ20| 62et2+n/2|µ−µ0||µ+µ0| 6 2et2+n2|µ+µ0| 6 et2+n|µ0|<∞.

Damit ist gezeigt, dass die dritte Bedingung aus der Vorlesung erfüllt ist.

4. Die Dichtefunktionf(x, µ) = 1e12(x−µ)2 ist klar stetig inµ.

5. Der Ausdruck

gµµ0(t) =e0−µ)t+n/22−µ02) ist offenbar stetig in µ.

6. Die minimal suffiziente StatistikT hat hier eineN(nµ, n)-Verteilung. Damit ist die Dichtefunktion davon klar niemals Null.

7. Für alle µ, µ0 ∈Rmitµ6=µ0 gilt dgµµ0(t)

dt = (µ0−µ)e0−µ)t+n/22−µ02) d2gµµ0(t)

dt2 = (µ0−µ)2e0−µ)t+n/22−µ02)>0.

Also ist dgµµdt0(t) streng monoton wachsend int.

Aufgabe 25 [unbiased bei Tests]

Seix= (x1, . . . , x4)eine Stichprobe aus einerBe(p)-Verteilung.

Frühjahrsemester 2011 Olivier Warin Seite 2 von 7

(3)

a) Wir testenH0:p= 12 gegenH1:p6= 12 mit folgendem Test:

d1(x) =I[x1+x2+x3+x46= 2].

Behauptung: Dieser Test ist unverfälscht.

Beweis: Nach Definition 4.11 müssen wir zeigen, dass Machtfunktionπ:p∈[0,1]7→Ep[d1(X)]an der Stelle p= 12 (also inH0) minimal ist. Dazu berechnen wir erst diese Machtfuktion:

π(p) =Ep[d1(X)] = Pp[X1+X2+X3+X46= 2] = 1−P[Bin(4, p) = 2]

= 1− 4

2

p2(1−p)4−2 = 1−6p2(1−p)2.

Nun leiten wir diese Funktion ab und erhalten so

π0(p) =−12p(1−p)2+ 12p2(1−p) = −12p(p−1)(2p−1).

Die Nullstellen davon sind 0,12 und1. Daπstetig und [0,1]kompakt ist, mussπ auf [0,1]sowohl ein Maximum als auch ein Minimum annehmen. Da weiter π(12)< π(0) =π(1), folgt daraus dass πdas Minimum an der Stelle 12 annimmt.

Wir schliessen: Für allep∈ H1(alsop6=12) gilt:

π(p)>π(1/2) = sup

θ∈H0

π(θ) = α,

wobei αdie Grösse des Tests bezeichnet. Nach Definition 4.11 ist die Behauptung damit gezeigt.

b) Behauptung: Es gibt einp0∈(0,1), so dass der Test

d2(x) = I[x1+x2+x3+x46∈ {2,3}] für die HypothesenH0: p=p0gegenH1:p6=p0 unverfälscht ist.

Beweis: Wir bestimmen wie in a) zuerst die Machtfunktionπ:

π(p) =Ep[d2(X)] = P[X1+X2+X3+X46∈ {2,3}] = 1−P[Bin(4, p) = 2]−P[Bin(4, p) = 3]

= 1− 4

2

p2(1−p)4−2− 4

3

p3(1−p)4−3

= 1−6p2(1−p)2−4p3(1−p).

Da π stetig und [0,1] kompakt, nimmt π sicher an einer Stelle p0 ein Minimum an. Da weiter π(12) =38 <1 =π(0) =π(1)wird dieses Minimum sicher nicht am Rand des Intervalls angenommen.

Wir schliessen p0∈(0,1).

Daπ(p0)minimal ist, folgt für allep∈ H1:

π(p)>π(p0).

Dies bedeutet, dass der Test d2 für diesesp0unverfälscht ist.

Bemerkung: Man kann diesesp0 natürlich konkret bestimmen und erhält dann p0=3

2 −

√3 2 .

(4)

Aufgabe 26 [mit Hilfe von R/S-PLUS; UMPU bei Symmetrie]

Sei x = (x1, . . . x10) eine Stichprobe aus einer N(θ,1)-Verteilung. Wir suchen nun einen UMPU-Test nach Satz 4.12 zum Niveauα= 0.1für die Hypothesen

H0: θ∈[1,2] vs. H1:θ6∈[1,2].

Setzen= 10,θ1= 1undθ2= 2.

Nach Vorlesung ist t(x) =x1+· · ·+xn eine minimal suffiziente Statistik fürθ. Laut Satz 4.12 hat der gesuchte UMPU-Test die folgende Form:

d(t) = 1

0

⇔t(x)

6∈[t1, t2]

∈[t1, t2]

,

wobei t1 < t2 zwei reelle Zahlen, mit Eθ1[d(t(X))] = Eθ2[d(t(X))] = α, sind. Wir erhalten also das folgende Gleichungssystem (beachte dasst(X)eineN(nθ, n)-Verteilung hat):

1−α= 1−Eθ1[d(t(X))] = P[N(nθ1, n)∈[t1, t2]]

1−α= 1−Eθ2[d(t(X))] = P[N(nθ2, n)∈[t1, t2]].

Aus Symmetriegründen gilt hier klart1= 1+nθ2 2−τundt2= 1+nθ2 2+τ für ein gewissesτ ∈R. Somit reicht es, wenn wir

P[N(nθ1, n)∈[t1, t2]]

| {z }

=:ψ(τ)

= 1−α.

als Gleichung fürτ lösen. Wir tun dies nun mit einem Intervallverschachtelungsverfahren:

p s i <− function( n , t h e t a 1 , t h e t a 2 , t a u ) { nmtheta <− n∗mean(c( t h e t a 1 , t h e t a 2 ) ) ;

# nmtheta =n/2( theta1 + theta2 );

t 1 <− nmtheta − t a u ;

5 t 2 <− nmtheta + t a u ;

return(pnorm( t2 , n∗t h e t a 1 ,sqrt( n))−pnorm( t1 , n∗t h e t a 1 ,sqrt( n ) ) ) ; }

t a u c a l c <− function( alpha , n , t h e t a 1 , t h e t a 2 , taumin =0 , taumax =100 ,

10 t o l =1e−9){

t a u <− mean(c( taumin , taumax ) ) ; p s i t r y <− p s i ( n , t h e t a 1 , t h e t a 2 , t a u ) ; i f (abs( p s i t r y − (1−a l p h a ) ) < t o l ) {

return( t a u )

15 }

i f ( p s i t r y > 1− a l p h a ) {

return( t a u c a l c ( alpha , n , t h e t a 1 , t h e t a 2 , taumin , t a u ) ) ; }

e l s e {

20 return( t a u c a l c ( alpha , n , t h e t a 1 , t h e t a 2 , tau , taumax ) ) ; }

}

a u f g 2 6 <− function( a l p h a = 0 . 1 , n=10 , t h e t a 1 =1 , t h e t a 2 =2){

25 t a u <− t a u c a l c ( alpha , n , t h e t a 1 , t h e t a 2 ) ; nmtheta <− n∗mean(c( t h e t a 1 , t h e t a 2 ) ) ; return(c( nmtheta − tau , nmtheta+t a u ) ) }

Dieses kleine R-Programm liefert (t1, t2)=.

R

aufg26() =.

R (5.947299,24.052701),

also haben wir mitt1= 5.947299. undt2= 24.052701. den gesuchten UMPU-Test gefunden.

Frühjahrsemester 2011 Olivier Warin Seite 4 von 7

(5)

Aufgabe 27 [mit Hilfe von Rechnern; UMPU vs Cox-Hinkley]

a) Seixeine Einerstichprobe aus einer Exponentialverteilung mit Parameterθ. Nun suchen wir einen UMPU-Test nach Satz 4.12 fürH0:θ= 1vsH1:θ6= 1. Setzeθ0= 1.

Offenbar ist hier t(x) =xeine minimal suffiziente Statistik. Nach Satz 4.12 hat der gesuchte Test ddie Form

d(t) = 1 0

⇔t(x)

6∈[t1, t2]

∈[t1, t2]

,

wobei t1< t2 zwei reelle Zahlen sind, so dass das Gleichungssystem Eθ0[d(X)] =α d

dθEθ[d(X)]

θ=θ0

= 0

erfüllt ist. Durch Einsetzen der Definitionen erhalten wir so das Gleichungssystem 1 +e−θ0t2−e−θ0t1

t1e−θ0t1−t2e−θ0t2 = 0.

Dieses nicht-lineare Gleichungssystem lösen wir nun numerisch mit dem Newton-Verfahren. Dazu schreiben wir es in der Form (t= (t1, t2)t)

F(t) = 0, wobei F :R2→R2 mit

F(t) = 1−α+e−θ0t2−e−θ0t1 t1e−θ0t1−t2e−θ0t2

.

Das Newton-Verfahren funktioniert nun wie folgt: Wir geben einen Startwertt0vor und berechnen dann iterativ fürn= 0,1,2, . . .

tn+1=tn−(dF(tn))−1F(tn),

wobei dF(tn)die Jacobi-Matrix vonF an der Stelletn bezeichnet. Es gilt also dF(t) =

θ0e−θ0t1 −θ0e−θ0t2 (1−θ0t1)e−θ0t10t2−1)e−θ0t2.

Natürlich berechnen wir den Ausdruckxn = (dF(tn))−1F(tn)durch lösen des lineares Gleichungs- systems

dF(tn)xn = F(tn)

und nicht durch explizites berechnen der entsprechenden inversen Matrix (siehe Numerik). Als Startwert verwenden wir(0,1)t.

Wir brechen das Verfahren ab wenn der Fehler kleiner als eine gewisse Toleranz (tol) ist.

F<− function(t, alpha , t h e t a 0 ) {

return(c(1−a l p h a+exp(−t h e t a 0∗t[ 2 ] )−exp(−t h e t a 0∗t[ 1 ] ) , t[ 1 ]∗exp(−t h e t a 0∗t[ 1 ] )−t[ 2 ]∗exp(−t h e t a 0∗t[ 2 ] ) ) ) ; }

5 dF <− function(t, t h e t a 0 ) {

return(matrix(c( t h e t a 0∗exp(−t h e t a 0∗t[ 1 ] ) , (1−t h e t a 0∗t[ 1 ] )∗exp(−t h e t a 0∗t[ 1 ] ) ,

−t h e t a 0∗exp(−t h e t a 0∗t[ 2 ] ) ,

( t h e t a 0∗t[ 2 ]−1 )∗exp(−t h e t a 0∗t[ 2 ] )

10 ) , 2 , 2 ) ) ; }

(6)

a u f g 2 7 a <− function( a l p h a = 0 . 1 ,t=c( 0 , 1 ) , t h e t a 0 =1 , t o l =1e−9) { Ftry <− F(t, alpha , t h e t a 0 )

15 while (max(abs( Ftry ) ) > t o l ) {

t <− t − solve( dF (t, t h e t a 0 ) , Ftry ) Ftry <− F(t, alpha , t h e t a 0 )

}

return(t) ;

20 }

Dieses kleine R-Programm liefert nun (t1, t2)=.

R

aufg27a() =.

R

(0.08381479,3.93214595).

Damit haben wir den gesuchten UMPU-Test gefunden.

b) Wir lösen nun nochmals die Teilaufgabe a). Dieses mal gehen wir aber nicht genau nach Satz 4.12 vor, sondern benutzen Cox-Hinkley. In (fast) denselben Notationen wie in a) müssen wir also ein˜t1

und eint˜2in Rfinden, so dass

Pθ0[X6˜t1] =α/2 Pθ0[X>˜t2] =α/2 gilt. R liefert hier sofort

1=.

R

qexp(0.1/2,1) =.

R 0.05129329 t˜2=.

R

qexp(0.1/2,1,lower.tail=FALSE) =.

R 2.995732.

Cox-Hinkley und UMPU liefern verschiedene Loesungen. Kein Annahmebereich vonH0 des einen ist im Annahmebereich vonH0des anderen enthalten.

c) Seix= (x1, . . . , x10)eine Stichprobe aus einer Exponentialverteilung mit Parameterθ. Jetzt suchen wir einen UMPU-Test nach Satz 4.12 zum Niveauα:= 0.05fürH0:θ∈[1,2]vsθ6∈[1,2].

Setze n = 10, θ1 = 1 und θ2 = 2. Bekanntlich ist t(x) = x1+· · ·+x10 eine minimal suffiziente Statistik fürθ.

Nach Satz 4.12 hat der UMPU-Test ddie folgende Form d(t) =

1 0

⇔t(x)

6∈[t1, t2]

∈[t1, t2]

,

wobei t1< t2 zwei reelle Zahlen sind mit

1−α= 1−Eθ1[d(X)] = P[Γ(n, θ1)∈[t1, t2]]

1−α= 1−Eθ2[d(X)] = P[Γ(n, θ2)∈[t1, t2]].

Beachte, dasst(X)eineΓ(n, θ)-Verteilung hat.

Wir lösen dieses Gleichungssystem mit einem Intervallschachtelungsverfahren fürt1: p s i <− function( n , t h e t a 2 , t1 , t 2 ) {

return(pgamma( t2 , n , t h e t a 2 )

−pgamma( t1 , n , t h e t a 2 ) ) ; }

5 a u f g 2 7 c <− function( a l p h a = 0 . 0 5 , n=10 , t h e t a 1 =1 , t h e t a 2 =2 , t1min =0 , t1max =100 , t o l =1e−9) { t 1 <− mean(c( t1min , t1max ) ) ;

p <−pgamma( t1 , n , t h e t a 1 )

# Falls p > alpha ist t1 klar zu gross :

10 i f ( p>a l p h a ) return(

a u f g 2 7 c ( alpha , n , t h e t a 1 , t h e t a 2 ,

Frhjahrsemester 2011 Olivier Warin Seite 6 von 7

(7)

t1min , t1max/2 , t o l ) ) ;

t 2 <− qgamma( p+1−alpha , n , t h e t a 1 )

15 p s i t r y <− p s i ( n , t h e t a 2 , t1 , t 2 )

i f (abs( p s i t r y − (1−a l p h a ) ) < t o l ) { return(c( t1 , t 2 ) )

}

i f ( p s i t r y <1− a l p h a ) {return(

20 a u f g 2 7 c ( alpha , n , t h e t a 1 , t h e t a 2 , t1min , t1 , t o l )

) ; }

e l s e return(

a u f g 2 7 c ( alpha , n , t h e t a 1 , t h e t a 2 ,

25 t1 , t1max , t o l )

) ; }

Dieses kleine R-Programm liefert nun (t1, t2)=.

R

aufg27c() =.

R

(2.712678,15.726777).

Damit haben wir den gesuchten UMPU-Test gefunden.

d) Jetzt lösen wir nochmals c) mit Cox-Hinkley. In (fast) denselben Notationen wie in c) suchen wir hier zwei reelle Zahlen˜t1 und˜t2, so dass gilt:

Pθ1[t(X)6˜t2] = α 2 Pθ2[t(X)>˜t1] = α 2.

(Beachte, dass wir hier MLQ mit “monoton fallend” statt “monoton steigend” haben!) R liefert sofort

˜t1=.

R

qgamma(0.05/2,10,2) =.

R 2.397694

˜t2=.

R

qgamma(0.05/2,10,1,lower.tail=FALSE) =.

R 17.08480.

In dieser Teilaufgabe haben wir das “häufige” Resultat, dass beim UMPU das Inverall des Annah- mebereich vonH0 Teilmenge des entsprechenden Intervalles bei Cox-Hinkley ist. Der anschauliche Grund für dieses Phänomen wurde graphisch in der Vorlesung gezeigt: Cox-Hinkley nimmt sicher- heitshalber je ein halbes αan den Grenzen. “Meist” waere so 0.8αauch noch gut gegangen, aber ohne genaue Untersuchung der Steigung der Machtfunktionen kann man das nicht wissen. UMPU nützt dafür alles voll aus.

Referenzen

ÄHNLICHE DOKUMENTE

Denn auch hier ist a priori die Unabhängigkeit nicht klar und damit auch nicht die t n−2 -Verteilung. Im freiwilligen Teil von Kapitel 7 werden wir diesen Test nochmals in einer

(Bei mehr als zwei Matrizen wäre dies allerdings im Allgemeinen nur bei zyklischen Vertauschungen erlaubt.).. Übungsblatt 11 zur Vorlesung “Statistische Methoden” Seite 5 von

Bei den folgenden Aufgaben wird (noch) nicht verlangt, dass Sie allf¨allige Beweise v¨ollig exakt f¨ uhren mit Resultaten aus der WT (die Sie ja eh noch nicht haben). L¨osen Sie

Geben Sie zu jedem der 6 F¨alle von Ereignisr¨aumen aus 1.1 ein neues Beispiel aus der ”realen Welt” an, welches man ”sinnvollerweise” mit dem jeweiligen Fall modelliert.

Frühjahrsemester 2012 Olivier Warin Seite 1 von 4... Denn

Hat nun eine dieser Frauen in der Tat Brustkrebs, so ist die Wahrscheinlichkeit eines positiven Mammographiebefundes 80 % (positiv heisst hier, dass der medizinische Apparat

Zeigen Sie: ein Mass µ ist genau dann σ-endlich, wenn es eine abz¨ahlbare Folge (E i ) i ≥ 1 von disjunkten Mengen gibt, sodass E = ∪ E i mit µ[E i ] &lt; ∞ f¨ ur alle i ≥

Da f monoton wachsend ist, muss A also nach oben