• Keine Ergebnisse gefunden

Konfidenzintervalle und Limits

N/A
N/A
Protected

Academic year: 2022

Aktie "Konfidenzintervalle und Limits"

Copied!
17
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Konfidenzintervalle und

Limits

(2)

Konfidenzintervall

Gegeben: Wahrscheinlichkeitsdichte p(x) Intervall [xm i n , xm a x ] für Konfidenz C:

Prob(xm i n ≤ x ≤ xm a x) = ∫X m i n X m a x p(x) dx = C

x liegt mit Wahrscheinlichkeit C in [xm i n , xm a x ] Konfidenzintervall kann einseitig sein:

]-∞, xm a x ] → oberes Limit

[xm i n , +∞[ → unteres Limit

Mögliche Wahl für zweiseitige Grenzen:

Symmetrisch um Mittelwert: xm a x –  =  – xm i n

Kürzestes Intervall: xm a x – xm i n → min

Zentrales Intervall: Prob(x < xm i n) = Prob(x > xm a x) = (1 – C) / 2

(3)

Konfidenzintervalle der Normalverteilung

(4)

C 1 - C

1 68% 32%

2 95% 5%

3 99.7% 0.3%

Konfidenzintervalle der Normalverteilung

Integral der Normalverteilung durch Fehler-Funktion gegeben:

Prob(|x| < x0) = erf(x0 / √2) Wichtige Werte:

Konfidenz für m-dimensionale Normalverteilung:

(Prob(|x| < r) in root: TMath::Prob(r*r, m))

m=1 m=2 m=3

1 68% 39% 20%

2 95% 86% 74%

3 99.7% 98.9% 97.1%

(5)

Konfidenzintervalle von Schätzern

Schätzer liefert: a = â ± â

Was bedeutet das?

Wahrer Wert a0 liegt mit 68% Wahrscheinlichkeit im Intervall [â - â , â + â ] ?

Frequentist: Nein!

Der wahre Wert ist keine Zufallsgröße

Bayesianer: Nein (im Allgemeinen)

Hängt vom Prior ab

(6)

Credibility-Intervalle

Bayes'sche Wahrscheinlichkeitsdichte für a:

p(a) = [L(a) · fP r i o r (a)] / Normierung

Wahrscheinlichkeitsaussage über wahren Wert möglich

Für ML-Schätzer, N → ∞, und flachen Prior:

Wahrer Wert a0 liegt mit 68% Wahrscheinlichkeit im Intervall [â - â , â + â ]

Ansonsten: Berechnung des Credibility-Wertes durch Integration der Posterior-Wahrscheinlichkeitsdichte

(7)

Coverage (Abdeckung, Überdeckung)

Frequentist'sche Interpretation von Parameterschätzungen

Gegeben: Methode zur Bestimmung eines Intervalls [xm i n , xm a x ] aus gemessenen Daten (Schätzer)

Anwendung der Methode auf ein Ensemble von gleichartigen Experimenten

Coverage  ist der Anteil der Experimente, deren Intervalle den wahren Wert enthalten

Soll für alle möglichen wahren Werte gelten

Wahrscheinlichkeitsaussage über das Intervall, nicht über den wahren Wert, möglich:

[xm i n , xm a x ] enthält x0 mit Wahrscheinlichkeit 

Over-/Under-Coverage: Anteil kann größer/kleiner werden als 

(8)

Neymann-Konstruktion

Für jeden Parameterwert a:

Bestimme Konfidenzintervall [xm i n (a), xm a x (a)] mit Konfidenz C

Trage xm i n und xm a x gegenüber a auf (Konfidenzband)

Für gemessenen Wert x, wähle Parameterintervall [am i n , am a x ], so dass

xm a x (am i n ) = x und

xm a x(am a x ) = x

Konfidenzintervall [am i n , am a x ] mit Konfidenz-Level C

Coverage = C

Methode funktioniert auch für verzerrte Schätzer

(9)

Beispiel: Poisson-Verteilung

90% Konfidenzintervall bei n = 9 beobachteten Ereignissen?

Poisson-Wahrscheinlichkeit:

p(n|) = exp(-) n / n!

m i n : Wahrscheinlichkeit für 9 oder

mehr Ereignisse soll 5% sein

k = n..∞ p(k|m i n ) = 1-∑k = 0..n - 1 p(k|m i n ) = 5%

m a x : Wahrscheinlichkeit für 9 oder

weniger Ereignisse soll 5% sein

k = 0..n p(k|ma x ) = 5%

 ∈ [4.7, 15.7] @ 90% CL ( = 9 + 6 . 7)

Gauß'sche Näherung für 90% Konfidenzintervall:

 = 9 ± 1.645 √9 = 9 ± 4.9

– 4 . 3

(10)

Poisson-Verteilung mit Untergrund

Signal- und Untergrund-Anzahl Poisson-verteilt

Gesamtanzahl Poisson-verteilt: p(n|S , B ) = p(n| = S + B ) ML-Schätzer:

S = n - B

Konfidenzintervall:

[S , m i n , S , m a x ] = [m i n - B , m a x - B ]

Problem: nB < B (stat. Fluktuation des Untergrunds nach unten)

Klassische obere Grenze kann kleiner werden als ohne Untergrund!

Bayes'scher Ansatz: fP r i o r (S ) = {1 für S > 0, 0 für S < 0}

(11)

Bemerkungen zu Limits

Wert des Limits hängt vom Glück des Experimentators ab

Besser geeignet für Vergleich von Experimenten:

Sensitivität: erwartetes Limit für S = 0

Limits können nicht oder nur schlecht mit anderen Messungen oder Limits kombiniert werden

Immer Schätz-Wert und Fehler angeben

Oder besser (insbesondere bei nicht Gaußförmiger Likelihood):

Likelihood-Funktion angeben

(12)

Limits in der Praxis

Bestimmung von Konfidenzregionen aus F(a) oder 2(a)

Korrekte Wahl von F bzw. 2 bei Grenzen auf mehrere Parameter ist zu beachten

Test von Coverage durch Pseudoexperimente

Korrektur der F-Werte um Under-Coverage zu vermeiden

(13)

Nuisance-Parameter bei Credibility-Intervallen

Neg. log-Likelihood F(t,r) abhängig von Parametern t und r, nur t interessant, r sind Störparameter

Profile-Likelihood

Minimierung bzgl. r → Fp r o f (t)

Konstruktion des Credibility-Intervalls mit p(t) = Fp r o f (t) fP r i o r (t) / Normierung

Marginalisierung

Integration über Nuisance-Paramter

Konstruktion des Credibility-Intervalls mit p(t) = fP r i o r (t) ∫F(t,r) fP r i o r (r) dr

Benötigt Prior für r

(14)

Feldman-Cousins-Methode

Neyman-Konstruktion legt nicht fest, wie das Konfidenzband gewählt werden soll

Mögliche Probleme:

Übergang Limit ↔ Messung

Mehrdimensionale Konfidenzregionen

Feldman-Cousins-Methode:

Ordnung nach Likelihood-Ratio:

 = L(a0) / L(â) bzw.

R = - ln  = F(a0) - F(â)

(15)

Beispiel: Materie-Antimaterie-Asymmetrie bei B

s

-Mesonen

 = 0.1 ps-1

s = 0

 = 0.3 ps-1

s = /2

Bestimmung der R-Verteilung für „jedes“

(, s)-Paar durch Toy-Experimente

Test auf Abhängigkeit von Nuisancepar.

Vergleich mit R-Wert in Daten

(16)

Beispiel: B

s

-Materie-Antimaterie-Asymmetrie

(17)

Empfehlungen

Welche Methode soll man wählen?

Soll man Frequentist oder Bayesianer sein?

Seien Sie sich bewusst, welche Methode Sie wählen und was das Ergebnis bedeutet.

Kommunizieren Sie eindeutig, welche Methode Sie gewählt haben.

Wählen Sie die Methode, bevor Sie die Messung machen.

Seien Sie pragmatisch in der Wahl der Methode.

Sie wollen sich und andere von der Richtigkeit Ihres Ergebnisses überzeugen und unnötigen Aufwand vermeiden.

Referenzen

ÄHNLICHE DOKUMENTE

But compared with the successful innovati- ons in livestock production it was clear that acceptance of new systems was not so wide- spread in cropping. The introduction dyna- mic

Allgemein lässt sich die Ausgangssituation so beschreiben: Man möchte wissen, mit wel- cher Wahrscheinlichkeit p ein bestimmtes Merkmal einer Zufallsgröße in einer Gesamt-

In diesem Seminar erfahren Sie Grundlagen der Kommunikation und erlernen praktisches Handwerkszeug, um ein Gespräch freundlich und überzeugend zu führen?. Sie üben Gespräche

Nachdem davon auszugehen ist, dass eine dritte Start- und Landebahn am Münchner Flug- hafen nicht mehr gebaut wird, sieht das Bündnis nach dem S-Bahn Ringschluss keinen Be- darf

Der BUND Naturschutz in Bayern, der Verein „Lebenswertes Manching – Stopp B16 Ausbau e.V.“ und betroffene Landwirte stützen sich dabei auf ein Rechtsguthaben, welches vom

Auf der Ebene der einzelnen Projekte müssen alle Planungen gestoppt werden, deren Bedarfsbegründung auf dem aktuellen Bedarfsplan beruhen oder zu denen Alternativen nicht

Hintergrund: Laut Bundesverkehrswegeplan (BVWP) sollen in den kommenden Jahren neue Straßen und Straßen-Ausbauten mit einer Gesamtlänge von rund 1.500 Kilometern und

Wie hoch ist die Gesamtflächeninanspruchnahme für Straßenprojekte des Bundesverkehrswegeplans 2030 (bitte Gesamtangaben für jedes Bundesland aufgeschlüsselt nach