3.3.1Kondenzintervallefür µ ,falls σ bekannt 3.3Intervallschätzer

(1)

3.3 Intervallschätzer

Mit Hilfe einer Punktschätzung T(X₁, . . . , X_n) erhält man genau einen Schätzwert für den Parameterθ. Berücksichtigt man auch die Variabilität der Schätzgröÿe T und deren Verteilung, dann kann man sogenannte Kondenzintervalle oder Vertrauensintervalle für den unbekannten Parameter θ angeben.

Denition 3.6 Kondenzintervall

Xi seien Stichprobenvariable aus einer Verteilung F mit unbekanntem Parameter θ. K₁(X₁, . . . , X_n) und K₂(X₁, . . . , X_n) seien zwei Stichprobenfunktionen mit

P_θ(K₁(X₁, . . . , X_n)≤θ ≤K₂(X₁, . . . , X_n))≥1−α. (1) Das zufällige Intervall [K1, K2] heiÿt (zweiseitige) Kondenzschätzung für den Parameter θ zum Niveau 1−α. Es überdeckt den wahren Parameter θ mit einer Wahrscheinlichkeit von mindestens 1−α.

(−∞, K₂] mit P_θ(θ ≤K₂(X₁, . . . , X_n))≥1−α und

[K1,∞) mit Pθ(θ≥K1(X1, . . . , Xn))≥1−α heiÿen einseitige Kondenzschätzung für θ zum Niveau 1−α.

Liegt eine Realisierung (x₁, . . . , x_n) von (X₁, . . . , X_n) vor, so nennen wir das zweiseitige Intervall der Form

[k₁(x₁, . . . , x_n), k₂(x₁, . . . , x_n)]

und die einseitigen Intervalle

(−∞, k₂(x₁, . . . , x_n) ] bzw. [k₁(x₁, . . . , x_n),∞) konkrete (1−α)Kondenzintervalle für θ ((1−α)KONF für θ).

In den folgenden Abschnitten 3.3.1 bis 3.3.3 seien die Stichprobenvariablen X_i aus der Normalverteilung N(µ, σ).

3.3.1 Kondenzintervalle für µ , falls σ

²

bekannt

Aus X_i ∼N(µ, σ) folgt X ∼N(µ,^√^σ_n). Dann ist der Pivot

Z = X−µ σ/√

n ∼ N(0,1).

(2)

Dieser Ansatz liefert

P_µ(z_α/2 ≤Z ≤z1−α/2) = P_µ

√σ

nz_α/2 ≤ X−µ ≤ ^√^σ_nz1−α/2

zα/2=−z_1−α/2

= P_µ

−X− ^√^σ_nz1−α/2 ≤ −µ ≤ −X+ ^√^σ_nz1−α/2

=P_µ

X−^√^σ_nz1−α/2 ≤ µ ≤ X+^√^σ_nz1−α/2

= 1−α.

Das konkrete zweiseitige (1−α)Kondenzintervall für µ lautet somit.

Zweiseitiges(1−α)KONF für µ, falls σ² bekannt:

h

x−^√^σ_nz1−α/2, x+ ^√^σ_nz1−α/2

i oder x± ^√^σ_nz1−α/2

(2)

Einseitige (1−α)Kondenzintervalle ergeben sich aus

P_µ(Z ≥z_α) = 1−α =⇒ P_µ(µ≤X− ^√^σ_nz_α) = 1−α , und aus

P_µ(Z ≤z1−α) = 1−α =⇒ P_µ(µ≥X− ^√^σ_nz1−α) = 1−α . Einseitige(1−α)KONF für µ, falls σ² bekannt:

− ∞, x+ ^√^σ_nz1−α

i und h

x− ^√^σ_nz1−α, ∞ (3) Das Quantil der N(0,1)Verteilung z_α aus Tabelle A.2.

Beispiel 17 Es liege eine Stichprobe aus einer N(µ,3)Verteilung vom Umfang n = 25 vor. Das Stichprobenmittel beträgt x = 5. Wie lauten die zweiseitigen und einseitigen (1−α)Kondenzintervalle für µ, falls das Kondenzniveau 1−α = 0.95 (0.99) beträgt?

(a) Zweiseitige Intervalle: x ± ^√^σ_nz1−α/2, z_0.975 = 1.960, z_0.995 = 2.576,

95%KONF: 5± ³₅1.960 ⇐⇒ 5 ± 1.1760 ⇐⇒ [3.8240,6.1760], 99%KONF: 5± ³₅2.576 ⇐⇒ 5 ± 1.5456 ⇐⇒ [3.4544,6.5456]. (b) Einseitige Intervalle:(−∞, x+^√^σ_nz1−α] bzw. [x− ^√^σ_nz1−α, ∞).

Die Quantile aus Tabelle A2 sind z_0.95= 1.645, z_0.99= 2.326. 95%KONF: (−∞,5 + ³₅1.645] = (−∞,5.9870],

[5− ³₅1.645, ∞) = [4.0130, ∞).

99%KONF: (−∞,5 + ³₅2.326] = (−∞,6.3956], [5− ³₅2.326, ∞) = [3.6044, ∞).

(3)

3.3.2 Kondenzintervalle für µ , falls σ

²

unbekannt

Da der Parameter σ² nicht bekannt ist, muss er durch den Schätzer S² ersetzt werden.

Wir betrachten daher den Pivot

T = X−µ S/√

n,

der nach Korollar A.4 tn−1verteilt ist. Analog zu Abschnitt 3.3.1 erhält man ersetze Z durch T und das N(0,1)Quantil z_α durch das tn−1Quantil tn−1;α folgende (1−α)Kondenzintervalle.

Zweiseitiges(1−α)KONF für µ, falls σ² unbekannt:

h

x−^√^s_ntn−1;1−α/2, x+^√^s_ntn−1;1−α/2

i (4)

Einseitige(1−α)KONF für µ, falls σ² unbekannt:

− ∞, x+^√^s_nt_n−1;1−αi

und h

x−^√^s_nt_n−1;1−α, ∞ (5) Das αQuantil der tn−1Verteilung tn−1;α aus Tabelle B.

Fortsetzung von Beispiel 17

X_i ∼N(µ, σ); n= 25, x= 5, s² = 9. 0.95 (0.99)Kondenzintervalle für µ? (a) Zweiseitige Intervalle: x± ^√^s_ntn−1;1−α/2.

Die Quantile sindt_24;0.975 = 2.064, t_24;0.995= 2.797. 95%KONF: 5±1.2383 ⇐⇒ [3.7617,6.2383], 99%KONF: 5±1.6782 ⇐⇒ [3.3218,6.6782]. (b) Einseitige Intervalle:

− ∞, x+^√^s_ntn−1;1−α

i bzw. h

x− ^√^s_ntn−1;1−α, ∞ , t_24;0.95 = 1.711, t_24;0.99 = 2.492.

95%KONF: (−∞,5 + 1.0265) = (−∞,6.0265] bzw.[3.9735,∞), 99%KONF: (−∞,5 + 1.4953) = (−∞,6.4953] bzw.[3.5047,∞).

Da hier das unbekannte σ² durch seine Schätzung s² ersetzt werden musste und damit das Quantil z_α durch das Quantil tn−1;α, haben sich die Kondenzintervalle gegenüber Beispiel 17 vergröÿert.

(4)

3.3.3 Kondenzintervalle für σ

²

, falls µ unbekannt

Wegen

Y = n−1

σ² S² ∼ χ²_n−1 (siehe Anhang A: Bemerkung zu Korollar A4) wählt man den Ansatz

P_σ² χ²_n−1;α/2 ≤Y ≤χ²_{n−1;1−α/2}

= 1−α, was zu folgenden Kondenzintervallen führt.

Zweiseitiges(1−α)KONF für σ², falls µ unbekannt:

"

(n−1)s²

χ²_{n−1;1−α/2} , (n−1)s² χ²_n−1;α/2

# (6)

Einseitige(1−α)KONF für σ², falls µ unbekannt:

0, (n−1)s² χ²_n−1;α

und

"

(n−1)s² χ²_n−1;1−α ,∞

! (7)

Die Quantile χ²_n−1;α der χ²_n−1Verteilung aus Tabelle C.

Fortsetzung von Beispiel 17

X_i ∼N(µ, σ) : n= 25, x= 5, s² = 9. 0.95(0.99)Kondenzintervalle für σ²? (a) Zweiseitige Intervalle:

"

(n−1)s²

χ²_{n−1;1−α/2} , (n−1)s² χ²_n−1;α/2

# .

χ²_24;0.975 = 39.36, χ²_24;0.025 = 12.40, χ²_24;0.995= 45.56, χ²_24;0.005 = 9.89, 95%KONF: ₂₁₆

39.36, _12.40²¹⁶

= [5.49,17.42], 99%KONF: ₂₁₆

45.56, _9.89²¹⁶

= [4.74,21.84].

(b) Einseitige Intervalle:

0,(n−1)s² χ²_n−1;α

bzw.

(n−1)s² χ²_n−1;1−α ,∞

. χ²_24;0.95= 36.42, χ²_24;0.05= 13.85, χ²_24;0.99= 42.98, χ²_24;0.01= 10.86, 95%KONF: [0,15.60] bzw. [5.93,∞),

99%KONF: [0,19.89] bzw. [5.03,∞) .

(5)

3.3.4 Kondenzintervalle für das Quantil x

_p

Sei Xi

iid∼ F mit Verteilungsfunktion F monoton wachsend und F(xp) = p. Man sucht jene k und ` , ` < k, mit (`−k) minimal für die

P(X_(k) < x_p < X_(`))≈1−α gilt. Man kann zeigen, dass

P X_(k) < x_p < X_(`)

=

`−1

X

i=k

n i

pⁱ(1−p)ⁿ⁻ⁱ (Binomialverteilung B(n, p)). (8) Für n≥20 kann man die B(n, p)Verteilung (8) durch die N(0,1)Verteilung approxi- mieren:

P(X_(k) < x_p < X_(`)) =

`−1

X

i=k

n i

pⁱ(1−p)ⁿ⁻ⁱ

≈ Φ `−np−1/2 pnp(1−p)

!

| {z }

≥1−α/2

−Φ k−np−1/2 pnp(1−p)

!

| {z }

≤α/2

≈1−α .

Aus

Φ `−np−1/2 pnp(1−p)

!

≥1−α/2 folgt `≥np+ 1/2 +p

np(1−p)z_1−α/2 und daraus

` =dnp+ 1/2 +p

np(1−p)z1−α/2e. Analog folgt für k mit z_α =−z1−α

k =bnp+ 1/2−p

np(1−p)z1−α/2c. Für n≥20 erhält man somit

Approximatives zweiseitiges(1−α)KONF für das Quantil xp : X_(k), X_(`)

: k =j

np+ ¹₂ −p

np(1−p)z1−α/2

k

, `=l

np+ ¹₂ +p

np(1−p)z1−α/2

m , Approximatives einseitiges(1−α)KONF für das Quantil x_p : (9)

−∞, X_(`)

: `= l

np+¹₂ +p

np(1−p)z1−α

m

X_(k),∞

: k =j

np+¹₂ −p

np(1−p)z1−α

k .

(10)

(6)

3.3.5 Approximative Kondenzintervalle für den Median x

_0.5

Sei X_i ^iid∼ F mit Verteilungsfunktion F monoton wachsend, F(x_0.5) = 0.5 und s_q = iqr/(1.359) die Quantilsschätzung für die unbekannte Streuung σ. Nach Satz 3.2 ergibt sich für n ≥20:

Approximatives zweiseitiges(1−α)KONF für x_0.5 : h

x_med− ^1.253s^√_n^q z_1−α/2, x_med+ ^1.253s^√_n^q z_1−α/2i

oder x_med± ^1.253s^√_n^q z_1−α/2 (11) Approximative einseitige(1−α)KONF für x0.5 :

− ∞, x_med+^1.253s^√_n^q z_1−αi

und h

x_med− ^1.253s^√_n^q z_1−α,∞ (12) Das Quantil der N(0,1)Verteilung z_α aus Tabelle A.2.

Beispiel 18 aimu_85.sav, fvc, Approximative 0.95KONF für den Median x_0.5. Nach (9) ergibt sich k =b39.5 + 0.5−√

19.75×1.96c=b31.28c= 31 und analog `= 49. Daraus folgt das approximative 0.95KONF für den Median als [x(31)= 5.3, x(49)= 5.7]. Nach Approximation (11) hat man: x_med = 5.50, s_q = 0.85 und ^1.253s^√₇₉^q = 0.12, woraus das approximative 0.95KONF für den Median folgt: 5.50±0.12×1.96⇔[5.26,5.74].

3.3.6 Approximative Kondenzintervalle für µ und σ

²

: beliebige Verteilungen

Die Stichprobenvariablen X_i besitzen eine diskrete oder stetige Verteilung mit E(X_i) = µ, V ar(X_i) = σ². Für das arithmetische Mittel

X = 1 n

n

X

i=1

X_i gilt E(X) =µ, V ar(X) = σ² n .

Nach dem zentralen Genzwertsatz folgt Z = X−µ

σ/√ n

as.∼ N(0,1).

Somit kann man bei grossem n angenäherte Kondenzintervalle für µ und σ² angeben: Für µ benutze man bei bekanntem σ Formel (2), bei unbekanntem σ Formel (4) als angenäherte zweiseitige Kondenzintervalle. (6) ist bei groÿem n näherungsweise ein zweiseitiges Kondenzintervall für σ² falls µ unbekannt.

Für den benötigten Stichprobenumfang kann man folgende Faustregel angeben. Ist aus der Stichprobe anzunehmen, dass die zugrundeliegende Verteilung nicht allzu unsymmetrisch ist, so erhält man für den Mittelwert µ brauchbare Ergebnisse ab n = 30 und für die Varianz σ² ab n = 60.

(7)

3.3.7 Approximative Kondenzintervalle für den Parameter p Binomialverteilung

Es werden n unabhängige BernoulliVersuche durchgeführt mit PXi(Xi = 1) =p, PXi(Xi = 0) = 1−p; i= 1, . . . , n.

Gesucht ist ein(1−α)Kondenzintervall für p, den durchschnittlichen Anteil der Erfolge.

X = _n¹ Pn

i=1X_i ist erwartungstreuer Schätzer für p: E(X) = p, V ar(X) = p(1−p)

n =⇒ Z = X−p

pp(1−p)/n

∼as N(0,1).

Aus P_p(z_α/2 ≤Z ≤z1−α/2)≈1−α folgt, dass mit Wahrscheinlichkeit 1−α gilt X−p

≤z1−α/2

qp(1−p) n

und somit

X−p2

≤z²_1−α/2 ^p(1−p)_n .

Die Lösungen p₁(X) und p₂(X) erfüllen die quadratische Gleichung

(n+z_1−α/2² )p²−(2nX+z_1−α/2² )p+nX² = 0 (13) bzw.

p²−2nX +z_1−α/2²

n+z_1−α/2² p+ nX²

n+z_1−α/2² = 0. Für genügend groÿe n erhält man als angenäherte Lösungen

p₁(X) ≈ X−σ(X)ˆ z1−α/2 , p₂(X) ≈ X+ ˆσ(X) z1−α/2, mit σ(X) =ˆ

qX(1−X) n .

Das approximative zweiseitige(1−α)Kondenzintervall für p lautet.

Zweiseitiges(1−α)KONF für Parameter p aus B(n, p) :

x−

qx(1−x)

n z1−α/2, x+

qx(1−x) n z1−α/2

(14)

Analog kann man einseitige Kondenzintervalle für p herleiten.

Einseitige(1−α)KONF für Parameter p aus B(n, p) :

0, x+

qx(1−x) n z1−α

bzw.

x−

qx(1−x)

n z1−α, 1

(15)

Das αQuantil der N(0,1)Verteilung aus Tabelle A1.2.

(8)

Beispiel 19 Von n = 500 zufällig ausgewählten Männern sind 200 kleiner als1.74 [m]. Wie gross ist ein 0.95Kondenzintervall für den wahren Anteil p der Männer, die kleiner sind als 1.74?

(a) Zweiseitiges Intervall: x ±

qx(1−x)

n z1−α/2, z_0.975 = 1.96, 95%KONF: ²₅ ±q

6

12500 1.96 = ²₅ ±0.043 ⇐⇒ [0.357,0.443]. (b) Einseitige Intervalle:[0, x+ ˆσ(x)z_1−α] bzw. [x−σ(x)ˆ z_1−α, 1],

ˆ σ(x) =

qx(1−x)

n , z_0.95 = 1.645,

95%KONF: [0, 0.430] bzw. [0.364, 1].

Beispiel 20 Wie groÿ muss n sein, damit man für den Anteil p von Personen, die eine bestimmte Partei wählen, ein 0.95Kondenzintervall erhält, das höchstens die Länge l= 0.04 erreicht? Aus

l = 2×1.96

qx(1−x)

n = 0.04 folgt die Gleichung ^0.02_1.962

n =x(1−x), wobei x unbekannt ist;

Der Term x(1−x) ist maximal für x= ˆp= ¹₂. Aus ^0.02_1.962

n = ¹₄ folgt als obere Schranke für n: n≤2401.

Wenn man annehmen kann, dass x sehr stark von ¹₂ abweicht, ist es ökonomischer, x aus einer kleinen Stichprobe zu schätzen; man wird dann sehr wahrscheinlich mit einem Stichprobenumfang ans Ziel kommen, der kleiner ist als n = 2401. Folgende Tabelle veranschaulicht für 0.1 ≤ x ≤ 0.5 und l = 0.04 den benötigten Stichprobenumfang n und zeigt die Längen l für festes n und 0.1≤ x ≤0.5.

Tab. 3.2: 0.95KONF für p; l ≤ 0.04, n≤ 2401

x 0.10 0.20 0.25 0.30 0.40 0.50

n(l) =n(0.04) 865 1537 1801 2017 2305 2401 l(n) = l(2401) 0.024 0.032 0.035 0.037 0.039 0.04

Bemerkung Verbesserung der Approximation durch Agresti/Cao (2000) 1. Der Koezient von p in der quadratischen Gleichung wird approximiert:

2nX+z_1−α/2²

n+z²_1−α/2 ≈ 2nX+ 4 n+ 4

2. pˆ=X wird ersetzt durch p˜= ^nX+2_n+4 und σ(˜˜ p) =

qp(1−˜˜ p n+4 .

(9)

Zweiseitiges(1−α)KONF für Parameter p aus B(n, p) :

˜ p±q

p(1−˜˜ p)

n+4 z_1−α/2 (16)

Einseitige(1−α)KONF für Parameter p aus B(n, p) :

0, p˜+

qp(1−˜˜ p) n+4 z_1−α

bzw.

˜ p−

qp(1−˜˜ p)

n z_1−α, 1

(17)

Vorteile dieser Approximation

• Verbesserung der Approximation für kleinep und/oder n.

• Liefert sehr gute Überdeckungswahrscheinlichkeit.

3.3.8 Kondenzintervalle beim Zweistichprobenproblem

NormalverteilungX_i ^iid∼ N(µ_X, σ_X), Y_i ^iid∼N(µ_Y, σ_Y), X_i, Y_j unabhängig für alle i, j. (a) (1−α)KONF für µ_D =µ_X −µ_Y, wenn σ=σ_X =σ_Y bekannt

(X−Y)±σ r1

n + 1

mz1−α/2

mit StandardNormalQuantil zα aus Tabelle A1.2.

(b) (1−α)KONF für µ_D =µ_X −µ_Y, wenn σ=σ_X =σ_Y unbekannt

(X−Y)±sp

r1 n + 1

mtn+m−2;1−α/2

mit Student tn+m−2Quantil tn+m−2;α aus Tabelle B.

(c) KONF für θ = σ_X² σ_Y² : K₁ =

θˆ Fn−1,m−1;1−α/2

, K₂ =

θˆ Fn−1,m−1;α/2

= ˆθ Fm−1,n−1;1−α/2 mit θˆ= S_X² S_Y² und F_n−1,m−1Quantilen F_{n−1,m−1;α} aus Tabelle D.

3.3.1Kondenzintervallefür µ ,falls σ bekannt 3.3Intervallschätzer

3.3 Intervallschätzer

3.3.1 Kondenzintervalle für µ , falls σ

bekannt

3.3.2 Kondenzintervalle für µ , falls σ

unbekannt

3.3.3 Kondenzintervalle für σ

, falls µ unbekannt

3.3.4 Kondenzintervalle für das Quantil x

3.3.5 Approximative Kondenzintervalle für den Median x

3.3.6 Approximative Kondenzintervalle für µ und σ

: beliebige Verteilungen

3.3.7 Approximative Kondenzintervalle für den Parameter p Binomialverteilung

3.3.8 Kondenzintervalle beim Zweistichprobenproblem

3.3.1Kondenzintervallefür µ ,falls σ bekannt 3.3Intervallschätzer