Methoden zur Parameterschätzung

(1)

Statistik

Parameterschätzung

Einführung

Beobachtete Datenx1, . . . ,x_nwerden aufgefasst alsRealisierun- gen von i.i.d. ZufallsvariablenX₁, . . . ,X_n.

Für dieX_i’s nehmen wir eineVerteilungsfamiliemit Parameter(n) θan, z.B. Normalverteilung:θ= (µ,σ²).

Grafische Tools zur Überprüfung sind z.B. QQ-Plots.

Grundfrage: Gegeben einer Stichprobex₁, . . . ,x_n, welches ist der

“plausibelste” Wert eines unbekannten Parametersθ? Wir versu- chen also,θzuschätzen(Punktschätzung).

Die geschätzten Parameter bezeichnen wir mitθb.

Merke: Die geschätzten Parameterθbändern von Stichprobe zu Stichprobe (“the data could have been different”) und entsprechen in der Regelnichtden wahren Parameternθ.

Allgemeines

Solange die Daten nicht realisiert sind, ist ein Schätzer eine Zu- fallsvariable.

Der sogenannteStandardfehlervonθbist definiert als Ç

Var θb . Ein Schätzer heissterwartungstreu(unbiased), falls

E θb

=θ.

Für erwartungstreue Schätzer ist die Varianz gerade ein Mass für die Genauigkeit, denn

Var θb

=E (θb−θ)²

(erwartete quadratische Abweichung vom wahren Wertθ).

Wir können den Erwartungswert bzw. die Varianz einer Verteilung als Modellparameter auffassen und haben dann die entsprechenden erwartungstreuen Schätzer

µbX=1 n

Xn

i=1

X_i, σb²_X= 1 n−1

Xn

i=1

(X_i−µbX)² (egal, was die Verteilungsfamilie ist).

Methoden zur Parameterschätzung

Momentenmethode

Idee: Wähle die geschätzten Parameterθbso, dass gewisse empiri- sche Größen mit den entsprechenden Größen aus dem Modell (der Verteilung) übereinstimmen.

k-tesMoment einer ZufallsvariableX(“aus Modell”):

µk=E X^k ,k≥1.

k-tesempirisches Moment(“aus Daten”):

m_k=1 n

n

X

i=1

x_i^k,k≥1.

Das Moment einer Zufallsvariable hängt von den Parametern ab, d.h.

µk=µk(θ).

Wähle nunθbso, dass folgendes Gleichungssystem erfüllt ist:

µ1(θb) =m1

µ2(θb) =m2

.. . µr(θb) =m_r

Die Anzahl Gleichungen entspricht der Anzahl Parameter (z.B.

zwei bei der Normalverteilung).

Bsp. Normalverteilung:

µ1=µ=m₁ µ2=σ²+µ²=m₂ Dies gibt die Lösung:

bµ=m₁ σb²=m₂−m²₁

Maximum-Likelihood-Methode

Idee: Wähle die geschätzten Parameterθbso, dass die beobachteten Daten unter diesem Modell (Verteilung) möglichst plausibel (wahrscheinlich) erscheinen.

Likelihood-FunktionL(·):

Parameter7−→W’keit der beob. Daten unter diesem Parameter Diskrete Verteilungen:L(·)ist das Produkt der Einzelw’keiten

L(θ) =

n

Y

i=1

pX(xi|θ) =pX(x1|θ)· · ·pX(xn|θ). Stetige Verteilungen:L(·)ist das Produkt der Dichten

L(θ) =

n

Y

i=1

fX(xi|θ) =fX(x1|θ)· · ·fX(xn|θ). Merke: Datenx1, . . . ,xnsind nach Beobachtungfix, man variiert in der Likelihood-Funktion die Parameter!

DerMaximum-Likelihood-Schätzervonθist θb=argmax_θL(θ). Oft ist es einfacher, dielog-Likelihood-Funktion

`(θ) =log(L(θ))

zu maximieren, denn das Maximum vonL(·)und`(·)ist an der gleichen Stelle. Also

θb=argmax_θ`(θ).

v1.1.3 Lukas Meier, meier@stat.math.ethz.ch

(2)

Statistische Tests

Allgemein

Grundfrage: Ist ein bestimmter Parameterwertθ0(z.B. Sollwert) mit den beobachteten Daten “verträglich” oder nicht?

Basierend auf einer Stichprobe soll also ein Entscheid gefällt wer- den. Spezifiziere hierzu dieNullhypotheseH0

H0:θ=θ0

und dieAlternativhypotheseH_A(je nach Fragestellung) H_A:θ6=θ0 (“zweiseitig”)

θ > θ0 (“einseitig nach oben”) θ < θ0 (“einseitig nach unten”). Folgende Fehlerarten sind möglich:

BelasseH0 VerwerfeH0

H0wahr Kein Fehler Fehler 1. Art H₀falsch Fehler 2. Art Kein Fehler

Ein statistischer Test kontrolliert gemäß Konstruktion die Wahr- scheinlichkeit für einen Fehler 1. Art durch dasSignifikanzniveau α, d.h.

P(VerwerfeH0fälschlicherweise)≤α.

Oft verwendet manα=0.05.

Wenn wir die Nullhypothese nicht verwerfen können, ist sie damit nichtbewiesen (“absence of evidence is not evidence of absence”).

Aufbau eines statistischen Tests

1. Wähle ein geeignetes Modell für die Daten.

2. Lege die NullhypotheseH0: θ=θ0fest.

Spezifiziere die AlternativeH_Aanhand der Problemstellung.

3. Wähle das Signifikanzniveauα, z.B.α=0.05 oder 0.01.

4. Konstruiere denVerwerfungsbereichfürH₀, so dass gilt Pθ0(Fehler 1. Art)≤α.

Die Form des Verwerfungsbereichs hängt von der Alternative HAab.

5. Betrachte, ob die Daten, bzw. eine Funktion davon, die sg.Test- statistikT, in den Verwerfungsbereich fällt. Falls ja, so verwer- feH₀zugunsten vonH_A. Man sagt dann auch, dass ein stati- stisch signifikantes Resultat vorliegt.

p-Wert

Frage: Wie “extrem” liegt der beobachtete Wert der Teststatistik in der Verteilung unter der Nullhypothese? Die “Richtung” ist durch die Alternativhypothese vorgegeben.

Der beobachtete Wert der Teststatistik seit(fix). Der p-Wert ist dann definiert als die Wahrscheinlichkeit für ein mindestens so ex- tremes Ereignis, wenn wir annehmen, dassH₀stimmt.

Bei einseitigen Alternativen betrachten wir die Ereignisse{T≥t} bzw.{T ≤t}. Bei einer zweiseitigen Alternative nimmt man die mindestens so extremen Ereignisse aufbeidenSeiten.

Anhand des p-Werts kann man direkt den Testentscheid ablesen:

VerwerfeH₀⇐⇒p-Wert≤α(Signifikanzniveau).

Man sieht zusätzlich, wiestarkdie Nullhypothese verworfen wird (oder nicht).

Alternative Interpretation: Der p-Wert ist daskleinsteSignifikanz- niveau, bei dem die Nullhypothesegerade nochverworfen wird.

Achtung: Der p-Wert istnichtdie Wahrscheinlichkeit, dass die Null- hypothese stimmt.

Macht

Frage: Wie wahrscheinlich ist es, dass wir die Nullhypothese verwerfen, wenn in der TatθA∈H_Agilt?

Die Macht ist also gemäß Definition 1−PθA(W’keit Fehler 2. Art). Zur Berechnung der Macht müssen wir also einenbestimmtenPa- rameterwertθ∈H_Aannehmen. Es gibt nicht “die” Macht.

Vertrauensintervalle

Allgemeines

Grundfrage: Welche Parameterwerteθsind mit den beobachteten Daten “verträglich”?

Ein(1−α)×100%-VertrauensintervallIfür den Parameterθ ist einzufälligesIntervallI, welches den Parameterθmit Wahrschein- lichkeit 1−α“einfängt”, d.h.

P(I3θ) =1−α.

Vertrauensintervalle haben oft (aber nicht immer) die Form θb± · · ·

Interpretation der Überdeckungswahrscheinlichkeit: Ein einzelnes Vertrauensintervall enthält den Parameterθ oder nicht (weil der Parameter fix) ist. Wenn wir aber ein “Experiment” viele Male wie- derholen könnten, dann würden im Schnitt(1−α)×100% der Vertrauensintervalle den wahren Parameterwert enthalten.

Hilfsbild:

−1.0 −0.5 0.0 0.5 1.0

µ Simulation 120406080100

Dualitätssatz:Das(1−α)×100% Vertrauensintervall besteht aus allen Parameterwerten, die im Sinne eines statistischen Tests zum Signifikanzniveauαmit den Daten verträglich sind (üblicherweise nimmt man den zweiseitigen Test). Mathematisch:

I={θ: NullhypotheseH₀:θ=θ0wirdnichtverworfen}. Anhand eines Vertrauensintervalls kann man also direkt den Te- stentscheid ablesen. Wenn ein Wert θ0 im (1−α)×100%- Vertrauensintervall enthalten ist, so wird die entsprechende Null- hypothese auf dem Signifikanzniveauαnichtverworfen, ansonsten schon.

Informationsgehalt:Testentscheid≺p-Wert≺VI