Konfidenzintervalle und
Limits
Konfidenzintervall
Gegeben: Wahrscheinlichkeitsdichte p(x) Intervall [xm i n , xm a x ] für Konfidenz C:
➔ Prob(xm i n ≤ x ≤ xm a x) = ∫X m i n X m a x p(x) dx = C
➢ x liegt mit Wahrscheinlichkeit C in [xm i n , xm a x ] Konfidenzintervall kann einseitig sein:
➢ ]-∞, xm a x ] → oberes Limit
➢ [xm i n , +∞[ → unteres Limit
Mögliche Wahl für zweiseitige Grenzen:
➢ Symmetrisch um Mittelwert: xm a x – = – xm i n
➢ Kürzestes Intervall: xm a x – xm i n → min
➢ Zentrales Intervall: Prob(x < xm i n) = Prob(x > xm a x) = (1 – C) / 2
Konfidenzintervalle der Normalverteilung
C 1 - C
1 68% 32%
2 95% 5%
3 99.7% 0.3%
Konfidenzintervalle der Normalverteilung
Integral der Normalverteilung durch Fehler-Funktion gegeben:
➔ Prob(|x| < x0) = erf(x0 / √2) Wichtige Werte:
Konfidenz für m-dimensionale Normalverteilung:
(Prob(|x| < r) in root: TMath::Prob(r*r, m))
m=1 m=2 m=3
1 68% 39% 20%
2 95% 86% 74%
3 99.7% 98.9% 97.1%
Konfidenzintervalle von Schätzern
Schätzer liefert: a = â ± â
➢ Was bedeutet das?
➔ Wahrer Wert a0 liegt mit 68% Wahrscheinlichkeit im Intervall [â - â , â + â ] ?
Frequentist: Nein!
Der wahre Wert ist keine Zufallsgröße
Bayesianer: Nein (im Allgemeinen)
Hängt vom Prior ab
Credibility-Intervalle
Bayes'sche Wahrscheinlichkeitsdichte für a:
➔ p(a) = [L(a) · fP r i o r (a)] / Normierung
➢ Wahrscheinlichkeitsaussage über wahren Wert möglich
Für ML-Schätzer, N → ∞, und flachen Prior:
Wahrer Wert a0 liegt mit 68% Wahrscheinlichkeit im Intervall [â - â , â + â ]
Ansonsten: Berechnung des Credibility-Wertes durch Integration der Posterior-Wahrscheinlichkeitsdichte
Coverage (Abdeckung, Überdeckung)
Frequentist'sche Interpretation von Parameterschätzungen
● Gegeben: Methode zur Bestimmung eines Intervalls [xm i n , xm a x ] aus gemessenen Daten (Schätzer)
● Anwendung der Methode auf ein Ensemble von gleichartigen Experimenten
➔ Coverage ist der Anteil der Experimente, deren Intervalle den wahren Wert enthalten
➢ Soll für alle möglichen wahren Werte gelten
Wahrscheinlichkeitsaussage über das Intervall, nicht über den wahren Wert, möglich:
[xm i n , xm a x ] enthält x0 mit Wahrscheinlichkeit
Over-/Under-Coverage: Anteil kann größer/kleiner werden als
Neymann-Konstruktion
● Für jeden Parameterwert a:
Bestimme Konfidenzintervall [xm i n (a), xm a x (a)] mit Konfidenz C
● Trage xm i n und xm a x gegenüber a auf (Konfidenzband)
● Für gemessenen Wert x, wähle Parameterintervall [am i n , am a x ], so dass
xm a x (am i n ) = x und
xm a x(am a x ) = x
➢ Konfidenzintervall [am i n , am a x ] mit Konfidenz-Level C
➔ Coverage = C
➢ Methode funktioniert auch für verzerrte Schätzer
Beispiel: Poisson-Verteilung
90% Konfidenzintervall bei n = 9 beobachteten Ereignissen?
Poisson-Wahrscheinlichkeit:
p(n|) = exp(-) n / n!
➔ m i n : Wahrscheinlichkeit für 9 oder
mehr Ereignisse soll 5% sein
∑k = n..∞ p(k|m i n ) = 1-∑k = 0..n - 1 p(k|m i n ) = 5%
➔ m a x : Wahrscheinlichkeit für 9 oder
weniger Ereignisse soll 5% sein
∑k = 0..n p(k|ma x ) = 5%
➢ ∈ [4.7, 15.7] @ 90% CL ( = 9 + 6 . 7)
● Gauß'sche Näherung für 90% Konfidenzintervall:
= 9 ± 1.645 √9 = 9 ± 4.9
– 4 . 3
Poisson-Verteilung mit Untergrund
Signal- und Untergrund-Anzahl Poisson-verteilt
➔ Gesamtanzahl Poisson-verteilt: p(n|S , B ) = p(n| = S + B ) ML-Schätzer:
S = n - B
Konfidenzintervall:
[S , m i n , S , m a x ] = [m i n - B , m a x - B ]
Problem: nB < B (stat. Fluktuation des Untergrunds nach unten)
Klassische obere Grenze kann kleiner werden als ohne Untergrund!
Bayes'scher Ansatz: fP r i o r (S ) = {1 für S > 0, 0 für S < 0}
Bemerkungen zu Limits
Wert des Limits hängt vom Glück des Experimentators ab
➔ Besser geeignet für Vergleich von Experimenten:
Sensitivität: erwartetes Limit für S = 0
Limits können nicht oder nur schlecht mit anderen Messungen oder Limits kombiniert werden
➔ Immer Schätz-Wert und Fehler angeben
➔ Oder besser (insbesondere bei nicht Gaußförmiger Likelihood):
Likelihood-Funktion angeben
Limits in der Praxis
Bestimmung von Konfidenzregionen aus F(a) oder 2(a)
Korrekte Wahl von F bzw. 2 bei Grenzen auf mehrere Parameter ist zu beachten
Test von Coverage durch Pseudoexperimente
➔ Korrektur der F-Werte um Under-Coverage zu vermeiden
Nuisance-Parameter bei Credibility-Intervallen
Neg. log-Likelihood F(t,r) abhängig von Parametern t und r, nur t interessant, r sind Störparameter
Profile-Likelihood
Minimierung bzgl. r → Fp r o f (t)
➔ Konstruktion des Credibility-Intervalls mit p(t) = Fp r o f (t) fP r i o r (t) / Normierung
Marginalisierung
Integration über Nuisance-Paramter
➔ Konstruktion des Credibility-Intervalls mit p(t) = fP r i o r (t) ∫F(t,r) fP r i o r (r) dr
➢ Benötigt Prior für r
Feldman-Cousins-Methode
Neyman-Konstruktion legt nicht fest, wie das Konfidenzband gewählt werden soll
Mögliche Probleme:
● Übergang Limit ↔ Messung
● Mehrdimensionale Konfidenzregionen
Feldman-Cousins-Methode:
➔ Ordnung nach Likelihood-Ratio:
= L(a0) / L(â) bzw.
R = - ln = F(a0) - F(â)
Beispiel: Materie-Antimaterie-Asymmetrie bei B
s-Mesonen
= 0.1 ps-1
s = 0
= 0.3 ps-1
s = /2
Bestimmung der R-Verteilung für „jedes“
(, s)-Paar durch Toy-Experimente
Test auf Abhängigkeit von Nuisancepar.
Vergleich mit R-Wert in Daten
Beispiel: B
s-Materie-Antimaterie-Asymmetrie
Empfehlungen
Welche Methode soll man wählen?
Soll man Frequentist oder Bayesianer sein?
➢ Seien Sie sich bewusst, welche Methode Sie wählen und was das Ergebnis bedeutet.
➢ Kommunizieren Sie eindeutig, welche Methode Sie gewählt haben.
➢ Wählen Sie die Methode, bevor Sie die Messung machen.
➢ Seien Sie pragmatisch in der Wahl der Methode.
Sie wollen sich und andere von der Richtigkeit Ihres Ergebnisses überzeugen und unnötigen Aufwand vermeiden.