Charakteristische Funktion

(1)

Entfaltung

(2)

Faltung

Häufige Situation:

Messung einer „wahren“ Verteilung mit begrenzter Auflösung Beispiel:

● Theoretische Verteilung:

f(t) = 1/ exp(-t/)

● Detektorauflösung:

g(t = t_{o b s} – t) =

1 / ((2)^½ ) exp[ -t² / 2²]

➔ Gemessene Verteilung:

h(t_{o b s} = t + t) = ∫ f(t) g(t_{o b s} – t) dt

Allgemein: PDF der Summe zweier zufallsverteilter Größen x und y mit PDFs f(x) and g(y) gegeben durch Faltung:

➢ h(u = x + y) = ∫ f(x) g(u – x) dx = ∫ f(u – y) g(y) dy = f * g

(3)

Charakteristische Funktion

(k) = E[exp(ikx)] = ∫ exp(ikx) f(x) dx

➔ ~Fouriertransformation

Wichtige Eigenschaften:

● Momente: [dⁿ / dkⁿ]_{k = 0} = iⁿ ∫ xⁿ f(x) dx

● Faltung: h = f * g => _h = _f _g

Beispiel: Gaußverteilung

● f(x|,) = 1 / ((2)^½ ) exp[ -(x – )² / 2²]

➔ (k|,) = exp(ik - ½²k²)

(4)

Entfaltung

Erwartete gemessene Verteilung g(y) bei wahrer Verteilung f(x):

g(y) = ∫ A(y|x) (x) f(x) dx + b(y)

● Effizient (Akzeptanz): (x), ∫ (x) dx ≤ 1

● Auflösungsfunktion: A(y|x), ∫ A(y|x) dy = 1

● Transferfunktion (response function): R(y|x) = A(y|x) (x)

● Untergrund: b(y)

Falls Form von f(x|a) bekannt → Bestimmung der Parameter

Nachteil wenn nur Parameter und gemessene Verteilung publiziert:

 Kein Vergleich mit anderen Theorien möglich

 Kein direkter Vergleich mit anderen Experimenten möglich

In diesem Fall besser: Entfalten der Detektoreffekte und publizieren von detektorunabhängigen Messungen

(5)

Diskretisierung

Histogramme mit N Bins in y und M Bins in x g_i = ∑_{j = 1}^M R_{i j}f_j + b_i

● g_i = ∫_{bin i} g(y) dy, f_j = ∫_{bin j} f(x) dx, b_i = ∫_{bin i} b(y) dy

● R_{i j} = [ ∫_{bin i} dy ∫_{bin j} dx A(y|x) (x) f(x) ] / ∫_{bin j} f(x) dx

= P(beobachtet in Bin i | wahrer Wert in Bin j)

→ modellabhängig, vernachlässigbar für kleine Binbreiten

➔ Matrixschreibweise: g = R f + b

Statistische Fluktuationen bei gemessenen Ereigniszahlen pro Bin:

➢ n_i z.B. Poisson-verteilt: E[n_i] = g_i , ML-Schätzer: ĝ_i = n_i

(6)

Korrekturverfahren

Bei gleichem Binning für Daten und Modell (N=M) und kleinen Auflösungseffekten:

➢ Korrekturfaktor aus Simulation:

C_i = N_i^MC(rek) / N_i^MC(gen)

➔ Schätzer für f: f_i = (n_i – b_i) / C_i

 C_i hängen von angenommener wahrer Verteilung ab,

insbesondere wenn Auflösungseffekte nicht vernachlässigbar

➔ Ergebnis verzerrt,

oft in Richtung der angenommenen Verteilung

^

(7)

Entfaltung durch Matrixinversion

Inversion der Transfermatrix R für N = M:

➔ f = R^{– 1} (n – b)

✔ Erwartungstreu

✔ Effizient

✗ Aber oft unsinnig

oszillierende Lösung

ff fg

n f^

(8)

Entfaltung einer periodischen Funktion

● Wahre Funktion:

f(x) = a sin(x)

● Detektorauflösung:

g(x) = Gauß(=0, )

● Erwartete Messung:

h = f * g

= exp(-²²/2) a sin(x)

=  sin(x)

➢ Parameter  bestimmt aus Daten mit

statistischem Fehler 

➔ Transformation auf wahren Parameter: ()a = exp(²²/2) ()

➢ Faktor sehr groß für große  → großes a und a

(9)

Regularisierung

➢ Kleine Binbreite (hohe

Frequenz) führt zu großen Fehlern und Korrelationen

➔ Geeignete Wahl der Binbreite:

x  2

Regularisierung:

Unterdrückung hochfrequenter Anteile in f(x)

● Basiert auf Annahme von „flachem“ Verlauf

➔ Reduzierung der Varianz auf Kosten von Verzerrung

➢ Minimierung von (a) = F(a) +  S(a)

(10)

Regularisierungsfunktionen

Tikhonov-Regularisierung

 S_k = ∫ (d^kf(x) / dx^k)² dx

➢ Oft verwendet: Globale Krümmung

➔ Für Histogramm: S₂ = ∑_{j = 1}^{M – 2} (-f_j + 2f_{ij+ 1} – f_{j + 2})²

● Krümmung nicht definiert für j=1 und j=M

Prinzip der maximalen Entropie (MaxEnt)

 „Shannon-Entropie“: S = – ∑ p_j ln p_j, p_j = f_j / ∑ f_j

➢ S  ln(Anzahl möglicher Anordnungen der Ereignisse)

➔ Entropie-Ansatz kann mit Bayes'scher Statistik motiviert werden

● Entropie-Prior führt aber zu verstärkter Verzerrung in Richtung einer Gleichverteilung bei steigender Ereigniszahl

(11)

Tikhonov-Regularisierung MaxEnt-Regularisierung

f f^

geschätzte Verzerrung

(12)

Beispiel Bildverarbeitung

(13)

Empfehlungen

➢ Überlegen Sie, ob eine Entfaltung angebracht ist

➔ Alternative: Veröffentlichung von Transfermatrix und Untergrund

➢ Wählen Sie eine geeignete Binbreite (x  2)

➢ Schätzen Sie die systematischen Fehler der Transfermatrix und des Untergrundes ab

➢ Wenden Sie eine Regularisierungsmethode an, wenn dies sinnvoll erscheint

➢ Schätzen Sie den systematischen Fehler (Verzerrung) durch die Regularisierung ab und wählen Sie den

Regularisierungsparameter so, dass er nicht dominant wird