3.3 Intervallschätzer
Mit Hilfe einer Punktschätzung T(X1, . . . , Xn) erhält man genau einen Schätzwert für den Parameterθ. Berücksichtigt man auch die Variabilität der Schätzgröÿe T und deren Verteilung, dann kann man sogenannte Kondenzintervalle oder Vertrauensintervalle für den unbekannten Parameter θ angeben.
Denition 3.6 Kondenzintervall
Xi seien Stichprobenvariable aus einer Verteilung F mit unbekanntem Parameter θ. K1(X1, . . . , Xn) und K2(X1, . . . , Xn) seien zwei Stichprobenfunktionen mit
Pθ(K1(X1, . . . , Xn)≤θ ≤K2(X1, . . . , Xn))≥1−α. (1) Das zufällige Intervall [K1, K2] heiÿt (zweiseitige) Kondenzschätzung für den Parameter θ zum Niveau 1−α. Es überdeckt den wahren Parameter θ mit einer Wahrscheinlichkeit von mindestens 1−α.
(−∞, K2] mit Pθ(θ ≤K2(X1, . . . , Xn))≥1−α und
[K1,∞) mit Pθ(θ≥K1(X1, . . . , Xn))≥1−α heiÿen einseitige Kondenzschätzung für θ zum Niveau 1−α.
Liegt eine Realisierung (x1, . . . , xn) von (X1, . . . , Xn) vor, so nennen wir das zweiseitige Intervall der Form
[k1(x1, . . . , xn), k2(x1, . . . , xn)]
und die einseitigen Intervalle
(−∞, k2(x1, . . . , xn) ] bzw. [k1(x1, . . . , xn),∞) konkrete (1−α)Kondenzintervalle für θ ((1−α)KONF für θ).
In den folgenden Abschnitten 3.3.1 bis 3.3.3 seien die Stichprobenvariablen Xi aus der Normalverteilung N(µ, σ).
3.3.1 Kondenzintervalle für µ , falls σ
2bekannt
Aus Xi ∼N(µ, σ) folgt X ∼N(µ,√σn). Dann ist der Pivot
Z = X−µ σ/√
n ∼ N(0,1).
Dieser Ansatz liefert
Pµ(zα/2 ≤Z ≤z1−α/2) = Pµ
√σ
nzα/2 ≤ X−µ ≤ √σnz1−α/2
zα/2=−z1−α/2
= Pµ
−X− √σnz1−α/2 ≤ −µ ≤ −X+ √σnz1−α/2
=Pµ
X−√σnz1−α/2 ≤ µ ≤ X+√σnz1−α/2
= 1−α.
Das konkrete zweiseitige (1−α)Kondenzintervall für µ lautet somit.
Zweiseitiges(1−α)KONF für µ, falls σ2 bekannt:
h
x−√σnz1−α/2, x+ √σnz1−α/2
i oder x± √σnz1−α/2
(2)
Einseitige (1−α)Kondenzintervalle ergeben sich aus
Pµ(Z ≥zα) = 1−α =⇒ Pµ(µ≤X− √σnzα) = 1−α , und aus
Pµ(Z ≤z1−α) = 1−α =⇒ Pµ(µ≥X− √σnz1−α) = 1−α . Einseitige(1−α)KONF für µ, falls σ2 bekannt:
− ∞, x+ √σnz1−α
i und h
x− √σnz1−α, ∞ (3) Das Quantil der N(0,1)Verteilung zα aus Tabelle A.2.
Beispiel 17 Es liege eine Stichprobe aus einer N(µ,3)Verteilung vom Umfang n = 25 vor. Das Stichprobenmittel beträgt x = 5. Wie lauten die zweiseitigen und einseitigen (1−α)Kondenzintervalle für µ, falls das Kondenzniveau 1−α = 0.95 (0.99) beträgt?
(a) Zweiseitige Intervalle: x ± √σnz1−α/2, z0.975 = 1.960, z0.995 = 2.576,
95%KONF: 5± 351.960 ⇐⇒ 5 ± 1.1760 ⇐⇒ [3.8240,6.1760], 99%KONF: 5± 352.576 ⇐⇒ 5 ± 1.5456 ⇐⇒ [3.4544,6.5456]. (b) Einseitige Intervalle:(−∞, x+√σnz1−α] bzw. [x− √σnz1−α, ∞).
Die Quantile aus Tabelle A2 sind z0.95= 1.645, z0.99= 2.326. 95%KONF: (−∞,5 + 351.645] = (−∞,5.9870],
[5− 351.645, ∞) = [4.0130, ∞).
99%KONF: (−∞,5 + 352.326] = (−∞,6.3956], [5− 352.326, ∞) = [3.6044, ∞).
3.3.2 Kondenzintervalle für µ , falls σ
2unbekannt
Da der Parameter σ2 nicht bekannt ist, muss er durch den Schätzer S2 ersetzt werden.
Wir betrachten daher den Pivot
T = X−µ S/√
n,
der nach Korollar A.4 tn−1verteilt ist. Analog zu Abschnitt 3.3.1 erhält man ersetze Z durch T und das N(0,1)Quantil zα durch das tn−1Quantil tn−1;α folgende (1−α)Kondenzintervalle.
Zweiseitiges(1−α)KONF für µ, falls σ2 unbekannt:
h
x−√sntn−1;1−α/2, x+√sntn−1;1−α/2
i (4)
Einseitige(1−α)KONF für µ, falls σ2 unbekannt:
− ∞, x+√sntn−1;1−αi
und h
x−√sntn−1;1−α, ∞ (5) Das αQuantil der tn−1Verteilung tn−1;α aus Tabelle B.
Fortsetzung von Beispiel 17
Xi ∼N(µ, σ); n= 25, x= 5, s2 = 9. 0.95 (0.99)Kondenzintervalle für µ? (a) Zweiseitige Intervalle: x± √sntn−1;1−α/2.
Die Quantile sindt24;0.975 = 2.064, t24;0.995= 2.797. 95%KONF: 5±1.2383 ⇐⇒ [3.7617,6.2383], 99%KONF: 5±1.6782 ⇐⇒ [3.3218,6.6782]. (b) Einseitige Intervalle:
− ∞, x+√sntn−1;1−α
i bzw. h
x− √sntn−1;1−α, ∞ , t24;0.95 = 1.711, t24;0.99 = 2.492.
95%KONF: (−∞,5 + 1.0265) = (−∞,6.0265] bzw.[3.9735,∞), 99%KONF: (−∞,5 + 1.4953) = (−∞,6.4953] bzw.[3.5047,∞).
Da hier das unbekannte σ2 durch seine Schätzung s2 ersetzt werden musste und damit das Quantil zα durch das Quantil tn−1;α, haben sich die Kondenzintervalle gegenüber Beispiel 17 vergröÿert.
3.3.3 Kondenzintervalle für σ
2, falls µ unbekannt
Wegen
Y = n−1
σ2 S2 ∼ χ2n−1 (siehe Anhang A: Bemerkung zu Korollar A4) wählt man den Ansatz
Pσ2 χ2n−1;α/2 ≤Y ≤χ2n−1;1−α/2
= 1−α, was zu folgenden Kondenzintervallen führt.
Zweiseitiges(1−α)KONF für σ2, falls µ unbekannt:
"
(n−1)s2
χ2n−1;1−α/2 , (n−1)s2 χ2n−1;α/2
# (6)
Einseitige(1−α)KONF für σ2, falls µ unbekannt:
0, (n−1)s2 χ2n−1;α
und
"
(n−1)s2 χ2n−1;1−α ,∞
! (7)
Die Quantile χ2n−1;α der χ2n−1Verteilung aus Tabelle C.
Fortsetzung von Beispiel 17
Xi ∼N(µ, σ) : n= 25, x= 5, s2 = 9. 0.95(0.99)Kondenzintervalle für σ2? (a) Zweiseitige Intervalle:
"
(n−1)s2
χ2n−1;1−α/2 , (n−1)s2 χ2n−1;α/2
# .
χ224;0.975 = 39.36, χ224;0.025 = 12.40, χ224;0.995= 45.56, χ224;0.005 = 9.89, 95%KONF: 216
39.36, 12.40216
= [5.49,17.42], 99%KONF: 216
45.56, 9.89216
= [4.74,21.84].
(b) Einseitige Intervalle:
0,(n−1)s2 χ2n−1;α
bzw.
(n−1)s2 χ2n−1;1−α ,∞
. χ224;0.95= 36.42, χ224;0.05= 13.85, χ224;0.99= 42.98, χ224;0.01= 10.86, 95%KONF: [0,15.60] bzw. [5.93,∞),
99%KONF: [0,19.89] bzw. [5.03,∞) .
3.3.4 Kondenzintervalle für das Quantil x
pSei Xi
iid∼ F mit Verteilungsfunktion F monoton wachsend und F(xp) = p. Man sucht jene k und ` , ` < k, mit (`−k) minimal für die
P(X(k) < xp < X(`))≈1−α gilt. Man kann zeigen, dass
P X(k) < xp < X(`)
=
`−1
X
i=k
n i
pi(1−p)n−i (Binomialverteilung B(n, p)). (8) Für n≥20 kann man die B(n, p)Verteilung (8) durch die N(0,1)Verteilung approxi- mieren:
P(X(k) < xp < X(`)) =
`−1
X
i=k
n i
pi(1−p)n−i
≈ Φ `−np−1/2 pnp(1−p)
!
| {z }
≥1−α/2
−Φ k−np−1/2 pnp(1−p)
!
| {z }
≤α/2
≈1−α .
Aus
Φ `−np−1/2 pnp(1−p)
!
≥1−α/2 folgt `≥np+ 1/2 +p
np(1−p)z1−α/2 und daraus
` =dnp+ 1/2 +p
np(1−p)z1−α/2e. Analog folgt für k mit zα =−z1−α
k =bnp+ 1/2−p
np(1−p)z1−α/2c. Für n≥20 erhält man somit
Approximatives zweiseitiges(1−α)KONF für das Quantil xp : X(k), X(`)
: k =j
np+ 12 −p
np(1−p)z1−α/2
k
, `=l
np+ 12 +p
np(1−p)z1−α/2
m , Approximatives einseitiges(1−α)KONF für das Quantil xp : (9)
−∞, X(`)
: `= l
np+12 +p
np(1−p)z1−α
m
X(k),∞
: k =j
np+12 −p
np(1−p)z1−α
k .
(10)
3.3.5 Approximative Kondenzintervalle für den Median x
0.5Sei Xi iid∼ F mit Verteilungsfunktion F monoton wachsend, F(x0.5) = 0.5 und sq = iqr/(1.359) die Quantilsschätzung für die unbekannte Streuung σ. Nach Satz 3.2 ergibt sich für n ≥20:
Approximatives zweiseitiges(1−α)KONF für x0.5 : h
xmed− 1.253s√nq z1−α/2, xmed+ 1.253s√nq z1−α/2i
oder xmed± 1.253s√nq z1−α/2 (11) Approximative einseitige(1−α)KONF für x0.5 :
− ∞, xmed+1.253s√nq z1−αi
und h
xmed− 1.253s√nq z1−α,∞ (12) Das Quantil der N(0,1)Verteilung zα aus Tabelle A.2.
Beispiel 18 aimu_85.sav, fvc, Approximative 0.95KONF für den Median x0.5. Nach (9) ergibt sich k =b39.5 + 0.5−√
19.75×1.96c=b31.28c= 31 und analog `= 49. Daraus folgt das approximative 0.95KONF für den Median als [x(31)= 5.3, x(49)= 5.7]. Nach Approximation (11) hat man: xmed = 5.50, sq = 0.85 und 1.253s√79q = 0.12, woraus das approximative 0.95KONF für den Median folgt: 5.50±0.12×1.96⇔[5.26,5.74].
3.3.6 Approximative Kondenzintervalle für µ und σ
2: beliebige Verteilungen
Die Stichprobenvariablen Xi besitzen eine diskrete oder stetige Verteilung mit E(Xi) = µ, V ar(Xi) = σ2. Für das arithmetische Mittel
X = 1 n
n
X
i=1
Xi gilt E(X) =µ, V ar(X) = σ2 n .
Nach dem zentralen Genzwertsatz folgt Z = X−µ
σ/√ n
as.∼ N(0,1).
Somit kann man bei grossem n angenäherte Kondenzintervalle für µ und σ2 ange- ben: Für µ benutze man bei bekanntem σ Formel (2), bei unbekanntem σ Formel (4) als angenäherte zweiseitige Kondenzintervalle. (6) ist bei groÿem n näherungsweise ein zweiseitiges Kondenzintervall für σ2 falls µ unbekannt.
Für den benötigten Stichprobenumfang kann man folgende Faustregel angeben. Ist aus der Stichprobe anzunehmen, dass die zugrundeliegende Verteilung nicht allzu unsymmetrisch ist, so erhält man für den Mittelwert µ brauchbare Ergebnisse ab n = 30 und für die Varianz σ2 ab n = 60.
3.3.7 Approximative Kondenzintervalle für den Parameter p Binomialverteilung
Es werden n unabhängige BernoulliVersuche durchgeführt mit PXi(Xi = 1) =p, PXi(Xi = 0) = 1−p; i= 1, . . . , n.
Gesucht ist ein(1−α)Kondenzintervall für p, den durchschnittlichen Anteil der Erfolge.
X = n1 Pn
i=1Xi ist erwartungstreuer Schätzer für p: E(X) = p, V ar(X) = p(1−p)
n =⇒ Z = X−p
pp(1−p)/n
∼as N(0,1).
Aus Pp(zα/2 ≤Z ≤z1−α/2)≈1−α folgt, dass mit Wahrscheinlichkeit 1−α gilt X−p
≤z1−α/2
qp(1−p) n
und somit
X−p2
≤z21−α/2 p(1−p)n .
Die Lösungen p1(X) und p2(X) erfüllen die quadratische Gleichung
(n+z1−α/22 )p2−(2nX+z1−α/22 )p+nX2 = 0 (13) bzw.
p2−2nX +z1−α/22
n+z1−α/22 p+ nX2
n+z1−α/22 = 0. Für genügend groÿe n erhält man als angenäherte Lösungen
p1(X) ≈ X−σ(X)ˆ z1−α/2 , p2(X) ≈ X+ ˆσ(X) z1−α/2, mit σ(X) =ˆ
qX(1−X) n .
Das approximative zweiseitige(1−α)Kondenzintervall für p lautet.
Zweiseitiges(1−α)KONF für Parameter p aus B(n, p) :
x−
qx(1−x)
n z1−α/2, x+
qx(1−x) n z1−α/2
(14)
Analog kann man einseitige Kondenzintervalle für p herleiten.
Einseitige(1−α)KONF für Parameter p aus B(n, p) :
0, x+
qx(1−x) n z1−α
bzw.
x−
qx(1−x)
n z1−α, 1
(15)
Das αQuantil der N(0,1)Verteilung aus Tabelle A1.2.
Beispiel 19 Von n = 500 zufällig ausgewählten Männern sind 200 kleiner als1.74 [m]. Wie gross ist ein 0.95Kondenzintervall für den wahren Anteil p der Männer, die kleiner sind als 1.74?
(a) Zweiseitiges Intervall: x ±
qx(1−x)
n z1−α/2, z0.975 = 1.96, 95%KONF: 25 ±q
6
12500 1.96 = 25 ±0.043 ⇐⇒ [0.357,0.443]. (b) Einseitige Intervalle:[0, x+ ˆσ(x)z1−α] bzw. [x−σ(x)ˆ z1−α, 1],
ˆ σ(x) =
qx(1−x)
n , z0.95 = 1.645,
95%KONF: [0, 0.430] bzw. [0.364, 1].
Beispiel 20 Wie groÿ muss n sein, damit man für den Anteil p von Personen, die eine bestimmte Partei wählen, ein 0.95Kondenzintervall erhält, das höchstens die Länge l= 0.04 erreicht? Aus
l = 2×1.96
qx(1−x)
n = 0.04 folgt die Gleichung 0.021.962
n =x(1−x), wobei x unbekannt ist;
Der Term x(1−x) ist maximal für x= ˆp= 12. Aus 0.021.962
n = 14 folgt als obere Schranke für n: n≤2401.
Wenn man annehmen kann, dass x sehr stark von 12 abweicht, ist es ökonomischer, x aus einer kleinen Stichprobe zu schätzen; man wird dann sehr wahrscheinlich mit einem Stichprobenumfang ans Ziel kommen, der kleiner ist als n = 2401. Folgende Tabelle veranschaulicht für 0.1 ≤ x ≤ 0.5 und l = 0.04 den benötigten Stichprobenumfang n und zeigt die Längen l für festes n und 0.1≤ x ≤0.5.
Tab. 3.2: 0.95KONF für p; l ≤ 0.04, n≤ 2401
x 0.10 0.20 0.25 0.30 0.40 0.50
n(l) =n(0.04) 865 1537 1801 2017 2305 2401 l(n) = l(2401) 0.024 0.032 0.035 0.037 0.039 0.04
Bemerkung Verbesserung der Approximation durch Agresti/Cao (2000) 1. Der Koezient von p in der quadratischen Gleichung wird approximiert:
2nX+z1−α/22
n+z21−α/2 ≈ 2nX+ 4 n+ 4
2. pˆ=X wird ersetzt durch p˜= nX+2n+4 und σ(˜˜ p) =
qp(1−˜˜ p n+4 .
Zweiseitiges(1−α)KONF für Parameter p aus B(n, p) :
˜ p±q
p(1−˜˜ p)
n+4 z1−α/2 (16)
Einseitige(1−α)KONF für Parameter p aus B(n, p) :
0, p˜+
qp(1−˜˜ p) n+4 z1−α
bzw.
˜ p−
qp(1−˜˜ p)
n z1−α, 1
(17)
Vorteile dieser Approximation
• Verbesserung der Approximation für kleinep und/oder n.
• Liefert sehr gute Überdeckungswahrscheinlichkeit.
3.3.8 Kondenzintervalle beim Zweistichprobenproblem
NormalverteilungXi iid∼ N(µX, σX), Yi iid∼N(µY, σY), Xi, Yj unabhängig für alle i, j. (a) (1−α)KONF für µD =µX −µY, wenn σ=σX =σY bekannt
(X−Y)±σ r1
n + 1
mz1−α/2
mit StandardNormalQuantil zα aus Tabelle A1.2.
(b) (1−α)KONF für µD =µX −µY, wenn σ=σX =σY unbekannt
(X−Y)±sp
r1 n + 1
mtn+m−2;1−α/2
mit Student tn+m−2Quantil tn+m−2;α aus Tabelle B.
(c) KONF für θ = σX2 σY2 : K1 =
θˆ Fn−1,m−1;1−α/2
, K2 =
θˆ Fn−1,m−1;α/2
= ˆθ Fm−1,n−1;1−α/2 mit θˆ= SX2 SY2 und Fn−1,m−1Quantilen Fn−1,m−1;α aus Tabelle D.