Entfaltung
Faltung
Häufige Situation:
Messung einer „wahren“ Verteilung mit begrenzter Auflösung Beispiel:
● Theoretische Verteilung:
f(t) = 1/ exp(-t/)
● Detektorauflösung:
g(t = to b s – t) =
1 / ((2)½ ) exp[ -t2 / 22 ]
➔ Gemessene Verteilung:
h(to b s = t + t) = ∫ f(t) g(to b s – t) dt
Allgemein: PDF der Summe zweier zufallsverteilter Größen x und y mit PDFs f(x) and g(y) gegeben durch Faltung:
➢ h(u = x + y) = ∫ f(x) g(u – x) dx = ∫ f(u – y) g(y) dy = f * g
Charakteristische Funktion
(k) = E[exp(ikx)] = ∫ exp(ikx) f(x) dx
➔ ~Fouriertransformation
Wichtige Eigenschaften:
● Momente: [dn / dkn]k = 0 = in ∫ xn f(x) dx
● Faltung: h = f * g => h = f g
Beispiel: Gaußverteilung
● f(x|,) = 1 / ((2)½ ) exp[ -(x – )2 / 22 ]
➔ (k|,) = exp(ik - ½2 k2 )
Entfaltung
Erwartete gemessene Verteilung g(y) bei wahrer Verteilung f(x):
g(y) = ∫ A(y|x) (x) f(x) dx + b(y)
● Effizient (Akzeptanz): (x), ∫ (x) dx ≤ 1
● Auflösungsfunktion: A(y|x), ∫ A(y|x) dy = 1
● Transferfunktion (response function): R(y|x) = A(y|x) (x)
● Untergrund: b(y)
Falls Form von f(x|a) bekannt → Bestimmung der Parameter
Nachteil wenn nur Parameter und gemessene Verteilung publiziert:
Kein Vergleich mit anderen Theorien möglich
Kein direkter Vergleich mit anderen Experimenten möglich
In diesem Fall besser: Entfalten der Detektoreffekte und publizieren von detektorunabhängigen Messungen
Diskretisierung
Histogramme mit N Bins in y und M Bins in x gi = ∑j = 1M Ri j fj + bi
● gi = ∫bin i g(y) dy, fj = ∫bin j f(x) dx, bi = ∫bin i b(y) dy
● Ri j = [ ∫bin i dy ∫bin j dx A(y|x) (x) f(x) ] / ∫bin j f(x) dx
= P(beobachtet in Bin i | wahrer Wert in Bin j)
→ modellabhängig, vernachlässigbar für kleine Binbreiten
➔ Matrixschreibweise: g = R f + b
Statistische Fluktuationen bei gemessenen Ereigniszahlen pro Bin:
➢ ni z.B. Poisson-verteilt: E[ni] = gi , ML-Schätzer: ĝi = ni
Korrekturverfahren
Bei gleichem Binning für Daten und Modell (N=M) und kleinen Auflösungseffekten:
➢ Korrekturfaktor aus Simulation:
Ci = NiMC(rek) / NiMC(gen)
➔ Schätzer für f: fi = (ni – bi ) / Ci
Ci hängen von angenommener wahrer Verteilung ab,
insbesondere wenn Auflösungseffekte nicht vernachlässigbar
➔ Ergebnis verzerrt,
oft in Richtung der angenommenen Verteilung
^
Entfaltung durch Matrixinversion
Inversion der Transfermatrix R für N = M:
➔ f = R– 1 (n – b)
✔ Erwartungstreu
✔ Effizient
✗ Aber oft unsinnig
oszillierende Lösung
ff fg
n f^
Entfaltung einer periodischen Funktion
● Wahre Funktion:
f(x) = a sin(x)
● Detektorauflösung:
g(x) = Gauß(=0, )
● Erwartete Messung:
h = f * g
= exp(-22/2) a sin(x)
= sin(x)
➢ Parameter bestimmt aus Daten mit
statistischem Fehler
➔ Transformation auf wahren Parameter: ()a = exp(22/2) ()
➢ Faktor sehr groß für große → großes a und a
Regularisierung
➢ Kleine Binbreite (hohe
Frequenz) führt zu großen Fehlern und Korrelationen
➔ Geeignete Wahl der Binbreite:
x 2
Regularisierung:
Unterdrückung hochfrequenter Anteile in f(x)
● Basiert auf Annahme von „flachem“ Verlauf
➔ Reduzierung der Varianz auf Kosten von Verzerrung
➢ Minimierung von (a) = F(a) + S(a)
Regularisierungsfunktionen
Tikhonov-Regularisierung
Sk = ∫ (dkf(x) / dxk )2 dx
➢ Oft verwendet: Globale Krümmung
➔ Für Histogramm: S2 = ∑j = 1M – 2 (-fj + 2fij+ 1 – fj + 2 )2
● Krümmung nicht definiert für j=1 und j=M
Prinzip der maximalen Entropie (MaxEnt)
„Shannon-Entropie“: S = – ∑ pj ln pj , pj = fj / ∑ fj
➢ S ln(Anzahl möglicher Anordnungen der Ereignisse)
➔ Entropie-Ansatz kann mit Bayes'scher Statistik motiviert werden
● Entropie-Prior führt aber zu verstärkter Verzerrung in Richtung einer Gleichverteilung bei steigender Ereigniszahl
Tikhonov-Regularisierung MaxEnt-Regularisierung
f f^
geschätzte Verzerrung
Beispiel Bildverarbeitung
Empfehlungen
➢ Überlegen Sie, ob eine Entfaltung angebracht ist
➔ Alternative: Veröffentlichung von Transfermatrix und Untergrund
➢ Wählen Sie eine geeignete Binbreite (x 2)
➢ Schätzen Sie die systematischen Fehler der Transfermatrix und des Untergrundes ab
➢ Wenden Sie eine Regularisierungsmethode an, wenn dies sinnvoll erscheint
➢ Schätzen Sie den systematischen Fehler (Verzerrung) durch die Regularisierung ab und wählen Sie den
Regularisierungsparameter so, dass er nicht dominant wird