• Keine Ergebnisse gefunden

Methoden zur Parameterschätzung

N/A
N/A
Protected

Academic year: 2021

Aktie "Methoden zur Parameterschätzung"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Statistik

Parameterschätzung

Einführung

Beobachtete Datenx1, . . . ,xnwerden aufgefasst alsRealisierun- gen von i.i.d. ZufallsvariablenX1, . . . ,Xn.

Für dieXi’s nehmen wir eineVerteilungsfamiliemit Parameter(n) θan, z.B. Normalverteilung:θ= (µ,σ2).

Grafische Tools zur Überprüfung sind z.B. QQ-Plots.

Grundfrage: Gegeben einer Stichprobex1, . . . ,xn, welches ist der

“plausibelste” Wert eines unbekannten Parametersθ? Wir versu- chen also,θzuschätzen(Punktschätzung).

Die geschätzten Parameter bezeichnen wir mitθb.

Merke: Die geschätzten Parameterθbändern von Stichprobe zu Stichprobe (“the data could have been different”) und entsprechen in der Regelnichtden wahren Parameternθ.

Allgemeines

Solange die Daten nicht realisiert sind, ist ein Schätzer eine Zu- fallsvariable.

Der sogenannteStandardfehlervonθbist definiert als Ç

Var θb . Ein Schätzer heissterwartungstreu(unbiased), falls

E θb

=θ.

Für erwartungstreue Schätzer ist die Varianz gerade ein Mass für die Genauigkeit, denn

Var θb

=E (θb−θ)2

(erwartete quadratische Abweichung vom wahren Wertθ).

Wir können den Erwartungswert bzw. die Varianz einer Verteilung als Modellparameter auffassen und haben dann die entsprechen- den erwartungstreuen Schätzer

µbX=1 n

Xn

i=1

Xi, σb2X= 1 n−1

Xn

i=1

(XiµbX)2 (egal, was die Verteilungsfamilie ist).

Methoden zur Parameterschätzung

Momentenmethode

Idee: Wähle die geschätzten Parameterθbso, dass gewisse empiri- sche Größen mit den entsprechenden Größen aus dem Modell (der Verteilung) übereinstimmen.

k-tesMoment einer ZufallsvariableX(“aus Modell”):

µk=E Xk ,k≥1.

k-tesempirisches Moment(“aus Daten”):

mk=1 n

n

X

i=1

xik,k≥1.

Das Moment einer Zufallsvariable hängt von den Parametern ab, d.h.

µk=µk(θ).

Wähle nunθbso, dass folgendes Gleichungssystem erfüllt ist:

µ1(θb) =m1

µ2(θb) =m2

.. . µr(θb) =mr

Die Anzahl Gleichungen entspricht der Anzahl Parameter (z.B.

zwei bei der Normalverteilung).

Bsp. Normalverteilung:

µ1=µ=m1 µ2=σ2+µ2=m2 Dies gibt die Lösung:

bµ=m1 σb2=m2m21

Maximum-Likelihood-Methode

Idee: Wähle die geschätzten Parameterθbso, dass die beobachteten Daten unter diesem Modell (Verteilung) möglichst plausibel (wahr- scheinlich) erscheinen.

Likelihood-FunktionL(·):

Parameter7−→W’keit der beob. Daten unter diesem Parameter Diskrete Verteilungen:L(·)ist das Produkt der Einzelw’keiten

L(θ) =

n

Y

i=1

pX(xi|θ) =pX(x1|θ)· · ·pX(xn|θ). Stetige Verteilungen:L(·)ist das Produkt der Dichten

L(θ) =

n

Y

i=1

fX(xi|θ) =fX(x1|θ)· · ·fX(xn|θ). Merke: Datenx1, . . . ,xnsind nach Beobachtungfix, man variiert in der Likelihood-Funktion die Parameter!

DerMaximum-Likelihood-Schätzervonθist θb=argmaxθL(θ). Oft ist es einfacher, dielog-Likelihood-Funktion

`(θ) =log(L(θ))

zu maximieren, denn das Maximum vonL(·)und`(·)ist an der gleichen Stelle. Also

θb=argmaxθ`(θ).

v1.1.3 Lukas Meier, meier@stat.math.ethz.ch

(2)

Statistische Tests

Allgemein

Grundfrage: Ist ein bestimmter Parameterwertθ0(z.B. Sollwert) mit den beobachteten Daten “verträglich” oder nicht?

Basierend auf einer Stichprobe soll also ein Entscheid gefällt wer- den. Spezifiziere hierzu dieNullhypotheseH0

H0:θ=θ0

und dieAlternativhypotheseHA(je nach Fragestellung) HA:θ6=θ0 (“zweiseitig”)

θ > θ0 (“einseitig nach oben”) θ < θ0 (“einseitig nach unten”). Folgende Fehlerarten sind möglich:

BelasseH0 VerwerfeH0

H0wahr Kein Fehler Fehler 1. Art H0falsch Fehler 2. Art Kein Fehler

Ein statistischer Test kontrolliert gemäß Konstruktion die Wahr- scheinlichkeit für einen Fehler 1. Art durch dasSignifikanzniveau α, d.h.

P(VerwerfeH0fälschlicherweise)≤α.

Oft verwendet manα=0.05.

Wenn wir die Nullhypothese nicht verwerfen können, ist sie damit nichtbewiesen (“absence of evidence is not evidence of absence”).

Aufbau eines statistischen Tests

1. Wähle ein geeignetes Modell für die Daten.

2. Lege die NullhypotheseH0: θ=θ0fest.

Spezifiziere die AlternativeHAanhand der Problemstellung.

3. Wähle das Signifikanzniveauα, z.B.α=0.05 oder 0.01.

4. Konstruiere denVerwerfungsbereichfürH0, so dass gilt Pθ0(Fehler 1. Art)≤α.

Die Form des Verwerfungsbereichs hängt von der Alternative HAab.

5. Betrachte, ob die Daten, bzw. eine Funktion davon, die sg.Test- statistikT, in den Verwerfungsbereich fällt. Falls ja, so verwer- feH0zugunsten vonHA. Man sagt dann auch, dass ein stati- stisch signifikantes Resultat vorliegt.

p-Wert

Frage: Wie “extrem” liegt der beobachtete Wert der Teststatistik in der Verteilung unter der Nullhypothese? Die “Richtung” ist durch die Alternativhypothese vorgegeben.

Der beobachtete Wert der Teststatistik seit(fix). Der p-Wert ist dann definiert als die Wahrscheinlichkeit für ein mindestens so ex- tremes Ereignis, wenn wir annehmen, dassH0stimmt.

Bei einseitigen Alternativen betrachten wir die Ereignisse{Tt} bzw.{T ≤t}. Bei einer zweiseitigen Alternative nimmt man die mindestens so extremen Ereignisse aufbeidenSeiten.

Anhand des p-Werts kann man direkt den Testentscheid ablesen:

VerwerfeH0⇐⇒p-Wert≤α(Signifikanzniveau).

Man sieht zusätzlich, wiestarkdie Nullhypothese verworfen wird (oder nicht).

Alternative Interpretation: Der p-Wert ist daskleinsteSignifikanz- niveau, bei dem die Nullhypothesegerade nochverworfen wird.

Achtung: Der p-Wert istnichtdie Wahrscheinlichkeit, dass die Null- hypothese stimmt.

Macht

Frage: Wie wahrscheinlich ist es, dass wir die Nullhypothese ver- werfen, wenn in der TatθAHAgilt?

Die Macht ist also gemäß Definition 1−PθA(W’keit Fehler 2. Art). Zur Berechnung der Macht müssen wir also einenbestimmtenPa- rameterwertθHAannehmen. Es gibt nicht “die” Macht.

Vertrauensintervalle

Allgemeines

Grundfrage: Welche Parameterwerteθsind mit den beobachteten Daten “verträglich”?

Ein(1−α)×100%-VertrauensintervallIfür den Parameterθ ist einzufälligesIntervallI, welches den Parameterθmit Wahrschein- lichkeit 1−α“einfängt”, d.h.

P(I3θ) =1−α.

Vertrauensintervalle haben oft (aber nicht immer) die Form θb± · · ·

Interpretation der Überdeckungswahrscheinlichkeit: Ein einzelnes Vertrauensintervall enthält den Parameterθ oder nicht (weil der Parameter fix) ist. Wenn wir aber ein “Experiment” viele Male wie- derholen könnten, dann würden im Schnitt(1−α)×100% der Vertrauensintervalle den wahren Parameterwert enthalten.

Hilfsbild:

−1.0 −0.5 0.0 0.5 1.0

µ Simulation 120406080100

Dualitätssatz:Das(1−α)×100% Vertrauensintervall besteht aus allen Parameterwerten, die im Sinne eines statistischen Tests zum Signifikanzniveauαmit den Daten verträglich sind (üblicherweise nimmt man den zweiseitigen Test). Mathematisch:

I={θ: NullhypotheseH0:θ=θ0wirdnichtverworfen}. Anhand eines Vertrauensintervalls kann man also direkt den Te- stentscheid ablesen. Wenn ein Wert θ0 im (1−α)×100%- Vertrauensintervall enthalten ist, so wird die entsprechende Null- hypothese auf dem Signifikanzniveauαnichtverworfen, ansonsten schon.

Informationsgehalt:Testentscheid≺p-Wert≺VI

v1.1.3 Lukas Meier, meier@stat.math.ethz.ch

Referenzen

ÄHNLICHE DOKUMENTE

e) Angenommen, eine rote Zahl aus den Bereich von 1 bis 12 gewinnt. Wie groß ist die Wahrscheinlichkeit, dass es sich um eine gerade Zahl handelt? Was ist neuartig an dieser Aufgabe

Man kann darüber auch eine neue Funktion definieren: die (erste) Ableitung [derivative] f 0 der Funktion f :8. Alternative

Geben Sie eine geometrische Interpretation

Januar 2020 am Beginn der Vorlesung.. Besprechung in der ¨ Ubung

Treffen Sie eine Aussage dar¨ uber, mit welcher Wahrscheinlichkeit der Anteil der Mo- lek¨ ule in der linken H¨ alfte gr¨ oßer als (1 + 10 −8 )/2 ist. Hinweis: Nutzen Sie

Dann ergeben mit Aufgabe 3 d) folgende Wahrscheinlichkeiten dafür , dass, wenn die Schei- benwischer ersetzt werden müssen, die Scheibenwischer von der 1., der

 Reflexion der Aussagekraft von Datengrundlagen und Indikatoren für Gender-Analysen.  Weiterentwicklung

2 Wenn ich einen Schritt mache, muss die kleinste Frau der Welt (für die gleiche Weite) mindestens 2,5 Schritte machen.. 3 Der kleinsten Frau der Welt müsste Schuhe in der Größe