Institut für Physik
Physikalisches Grundpraktikum
Einige Anmerkungen zur statistischen Behandlung von Messunsicherheiten aufgrund zufälliger Messabweichungen
und zur sog. „Fehlerfortpflanzung“
Quelle:
Energy & Environment Vol. 21 No. 8 (2010), pp. 969-989, Pat Frank, „Uncertainty in the global average surface air temperature index: representative lower limit“
Beispiel zur Relevanz der Fehleranalyse
Entwicklung der Globaltemperatur und Klimawandel?
Bisher aber Unsicherheit von ± 0,1 K angenommen…
Fortsetzung dazu
Übersetztes Zitat aus der Arbeit:
Die Messfühler(Sensor)-Messunsicherheit wurde nie umfassend in den früheren Arbeiten zur mittleren globalen bodennahen Lufttemperatur berücksichtigt. Der geschätzte durchschnittliche ± 0,2 K Stations-Fehler wurde fälschlicherweise als zufällig beurteilt, während der systematische Fehler, bestimmt durch unkontrollierte Variablen, immer vernachlässigt wurde.
Der systematische Fehler bei den Messungen von drei ideal gelegenen und (ideal) gewarteten Temperatursensoren wurde hier berechnet. Kombiniert mit ± 0,2 K als allgemein berichtetem (durchschnittlichen) Stations-Fehler, lässt sich eine repräsentative untere Grenze der Unsicherheit von ± 0,46 K für alle globalen jährlichen bodennahen Lufttemperatur-Anomalien finden. Diese ± 0,46 K zeigen, dass der Trend der globalen bodennahen Lufttemperatur-Anomalie von 1880 bis 2000 statistisch nicht von „0“ zu unterscheiden ist. Er stellt somit eine untere Grenze der Kalibrierungsunsicherheit für Klimamodelle und für jede mögliche physikalisch vertretbare Proxy-Rekonstruktion der Paläo-Temperatur dar. Die Geschwindigkeit und das Ausmaß der Erwärmung des 20. Jahrhunderts sind somit unbekannt, und Vermutungen von einer beispiellosen Entwicklung der globalen Lufttemperatur im 20.
Jahrhundert sind somit nicht nachhaltig (begründbar).
Eine streitbare Formulierung – die Argumentation ist aber ganz sicher nicht ganz abwegig!
Unterscheidung von systematischen und zufälligen Messabweichungen
Zufällige Messabweichungen liefern ein unsicheres, systematische
Messabweichungen ein falsches Ergebnis.
Zufällige Messabweichungen
Systematische Messabweichungen
Schätzung von Messunsicherheiten – ein Problem?
Ja! Oft ist eine einfache Abschätzung nicht möglich oder gar nicht „sachgerecht“…
anstelle einer Einzel- mehrere wiederholte Messungen, die dann mit Methoden der (mathematischen) Statistik untersucht werden können bzw. müssen
bei Messreihen ein und dieselbe Messung unter möglichst identischen Bedingungen (Achtung: Umwelteinflüsse!) im statistischen Sinne „genügend oft“
(d.h. mit ausreichendem Stichprobenumfang) wiederholen; hier im Praktikum i.d.R. mindestens 6 Messungen
Statistik bedeutet Erhöhung der Messzeit und des Aufwandes; also Relation zwischen Aufwand und Nutzen stets sehr genau abwägen (manchmal aber dennoch zwingend nötig!)
Zufällige Messabweichungen
Messwiederholungen (selbst unter identischen Bedingungen):
liefern i. A. nicht immer denselben Messwert, sondern haben Abweichungen!
Begriff „ zufällige Messabweichungen“:
wenn unterschiedlich in ihrer Größe und Richtung → zufällige Messabweichungen Eigenschaft "zufällig" = Ursachen nicht im Einzelnen zu verfolgen, stochastisches (d.h. dem Zufall unterworfenes) Verhalten der Messergebnisse → Messwerte haben Wahrscheinlichkeitscharakter
Ursachen a) statistische Messgröße
stochastischer Charakter von gemessenen Ereignissen (z.B. radioaktiver Zerfall,
„Rauschen“ in elektrischen Signalen)
b) Unzulänglichkeit des Experiments oder Experimentators
Schätzungen und Interpolationen auf Messskalen (Achtung: Parallaxenfehler) Messen einer Zeitdifferenz mit der Stoppuhr mit Reaktionszeit
Längenmessung mit Maßband unterschiedlicher Verbiegung c) äußere Einflüsse
zufällige unvorhersehbare äußere Einflüsse (z.B. wechselnde Luftströmungen, kurzzeitige Temperaturschwankungen etc.)
Aufgaben der mathematischen Statistik
Schätztheorie: Entwicklung geeigneter Schätzverfahren und Ableitung von Schätzfunktionen für statistische Untersuchungen; Bereichsschätzungen von Parametern einer Grundgesamtheit, aus der Stichproben gezogen werden (Konfidenzintervalle!); Bestätigung oder Verwerfen von Hypothesen durch geeignete statistische Testverfahren
Zielsetzungen:
empirische Verteilung der Merkmalswerte der Stichprobe → Abschätzung bzw.
Bestimmung der theoretischen Verteilung der Grundgesamtheit
Bestimmung der Parameter der theoretischen Verteilung mit optimaler Anpassung für die Stichprobenwerte; Ermittlung der Parameterabhängigkeiten für die Verteilung
Untersuchung der Korrelation zwischen verschiedenen Merkmalen gleicher Objekte oder zwischen dem gleichen Merkmal verschiedener Objekte
Entwicklung von Verfahren zur empirischen Bestimmung von „möglichst guten“
Näherungswerten und ihrer Streuung bzw. (statistischen) Unsicherheit
Mathematische Statistik: Analyse von Daten anhand mathematischer Modelle Stochastik
Mathematische Statistik Wahrscheinlichkeitstheorie
Vgl. Mathematik der Sekundarstufe II: Teilgebiet „Stochastik“
Grundbegriffe der Statistik
Mathematische Statistik:
Untersuchung zufälliger Ereignisse bezüglich eines oder mehrerer quantitativ erfassbarer Merkmale; Zuordnung von Zahlenwerten als sog. Zufallsvariable
Zufallsvariable
(als quantitatives Merkmal eines zufälligen Ereignisses)
Zufallsvariable
mit diskreten Merkmalswerten (z. B. Zerfallsrate eines Isotops)
Zufallsvariable
mit kontinuierlichen Merkmalswerten (z. B. Lebensdauer von Ladungsträgern) Grundgesamtheit:
Gesamtheit aller möglichen Realisierungen des zufallsbedingten Merkmals; kann endlich viele oder unendlich viele Elemente enthalten
Grundgesamtheit Stichprobe (endlich)
„Urliste“
Häufigkeitsverteilung
Erhebung einer Stichprobe:
Umfang N bezüglich des Merkmals x → Tabelle der beobachteten Merkmalswerte xi ("Urliste der Elemente")
Häufigkeitsverteilung:
Messwerte streuen → Veranschaulichung mit Häufigkeitsverteilung, d.h. Auftragung der Anzahl ni der in einem Intervall Δx gefundenen Messwerte („absolute Häufigkeit“) über Messwerten xi
relative Häufigkeit:
Normierte Verteilung:
fi(xi)·Δx ist die Wahrscheinlich- keit, ein Messergebnis xi im Intervall Δx zu finden
(statistische Aussage)
( ) i
i i
f x n
N
1
( ) 1
N
i i
i
f x
hier absolute Häufigkeit aufgetragen
?
Anmerkungen zur Klasseneinteilung
Allgemein:
Bereich möglicher Merkmalswerte → Einteilung in M gleichgroße Intervalle der Breite Δx (Klassen)
Mitte der Klasse → möglichst einfache Zahl xm (Klassenmitte) mit m = 1..M
Ermittlung der absoluten Häufigkeit der Merkmalswerte im Intervall (xm-Δx/2; xm+Δx/2) auf Klassengrenzen entfallende Merkmalswerte je zu 1/2 der rechten und der linken Klasse zugeordnet
Kriterien:
nicht zu eng (zu geringe Häufigkeiten → große Schwankungen; d.h. zu feine Diskretisierung)
nicht zu weit (drohender Informationsverlust; zu grobe Diskretisierung) Empfehlungen für sinnvolle Klassenzahl M und Klassenbreite Δx:
M ≈ 5·lg N und Δx ≈ (xmax-xmin)/N Generelle Anmerkung:
physikalische Größen oft kontinuierlich verteilt; Mess- und Ablesegenauigkeit aber begrenzt → Diskretisierung der Messergebnisse, z.T. mit gleichem Zahlenwert
Durch die Mess- und Ablesegenauigkeit feinste Klasseneinteilung gegeben, eine gröbere aber meistens sinnvoller!
Summenhäufigkeitsverteilung
Berechnung aus der relativen Häufigkeitsverteilung: ( ) ( )
i j
j i i
x x
F x f x
Summation der relativen Häufigkeiten bis zum Wert xj → statistische Interpretation als die Wahrscheinlichkeit, einen Wert xi im Intervall (0;xj) zu finden
1 F(x1)
F(x2)
Normierungseigenschaft
statistische Interpretation von F(x1)-F(x2) als Wahrscheinlichkeit, einen Wert xi im Intervall (x1,x2) vorzufinden
Übergang zu kontinuierlichen Verteilungen
Grenzwertbetrachtung:
unendlich große Stichprobe N → ∞ unendlich große Klassenzahl M → ∞
infinitesimal feine Intervalleinteilung Δx → 0 (Übergang zum Differential dx) Übergang von diskreten Verteilungen/Funktionen zu kontinuierlichen!
→ f(x) als Wahrscheinlichkeitsdichte → F(x) als integrale
Wahrscheinlichkeitsdichte
Wahrscheinlichkeitsverteilungen: Parameter
Definition des Mittelwertes:
erstes Moment einer Verteilung, beschreibt ihre Lage
Definition der Varianz:
zweites Moment einer Verteilung, beschreibt ihre Breite
Definition der Standardabweichung:
direktes Maß für die Breite der Verteilungsfunktion, d.h. die Streuung der Werte Für uns zweckmäßiger!
Beispiele für Verteilungsfunktionen
Maxwell-Boltzmannsche Geschwindigkeitsverteilung
Verteilungen in der (statistischen) Physik
Orbitale von Elektronen Gauß- oder Normalverteilung
Gleichverteilung Poissonverteilung
Geometrische Verteilung Binomial- bzw. Bernoulliverteilung Hypergeometrische Verteilung
Plancksches
Strahlungsgesetz Fermiverteilung
Zentraler Grenzwertsatz der Statistik
Die Verteilungen der Summen von stochastisch unabhängigen Zufallsvariablen streben mit wachsendem Stichprobenumfang gegen die Gaußsche Normalverteilung. (Faustregel: bei mehr als 30 stochastisch unabhängigen Zufallsvariablen schon sehr gute Näherung)
Diese Regel ermöglicht zum einen die Bestimmung von Wahrscheinlichkeiten unbekannt verteilter Zufallsvariablen, zum anderen kann die Bestimmung kompliziert zu berechnender Wahrscheinlichkeitswerte mit der Normalverteilung approximiert werden.
Gauß- oder Normalverteilung
f(x)
x-s x x+s x
2 2
1 ( )
( ) exp
2 2
x x
f x
s s
Eigenschaften:
•Maximum beim Mittelwert (Erwartungswert), Symmetrie bezüglich Mittelwert
•Konvergenz gegen Null im Unendlichen
•Wendepunkte für Mittelwert ± Standardabweichung
•Breite durch Standardabweichung bestimmt
•Normierung auf 1 (vgl. statistische Interpretation!)
Intervall um Mittelwert Wahrscheinlichkeit
±s 68,3%
±2s 95,4%
±3s 99,7%
Normierungseigenschaft der Normalverteilung
Die Parameter „Mittelwert“ und „Standardabweichung“ ermöglichen es, dass unterschiedliche Modellverteilungen durch die Gaußverteilung beschrieben werden können.
Gaußsche Fehlerfunktion
Eigenschaften:
•Statistische Interpretation als Wahrscheinlichkeit für Wert im Intervall
•Monotonieverhalten
•Wendepunkt für Mittel- bzw. Erwartungswert
Empirischer Zugang für Parameter der Normalverteilung
Definition des Mittelwertes:
Definition der Standardabweichung:
Definition des Vertrauensbereiches:
Unterschied zwischen
Standardabweichung und Vertrauensbereich
(experimentelle oder empirische) Standardabweichung:
Im Grenzübergang für n→∞ erhält man die Standardabweichung σ der Grundgesamtheit!
Der Wert von s nähert sich mit wachsender Anzahl von Messwerten einem endlichen Wert und ändert sich bei weiteren Messungen nicht mehr wesentlich.
(experimentelle oder empirische) Standardabweichung des Mittelwerts (für t=1) bzw.
Vertrauensbereich:
Der Zahlenwert wird durch Vergrößerung der Zahl der Messungen um den Faktor 1/√n kleiner.
Anwendung in der Praxis:
Verbesserung des „Signal-Rausch-Verhältnisses“ durch n-fache Akkumulation von Mess-Signalen,
„Integration“ von vielen Einzelmessungen (z.B. Digitalfotografie)
„Rauschen“ ist zufällig!
Anwendung von statistischen Methoden (Rauschen)
Lehr-Beispiel:
Versuch „F1 Fehlerverteilung“
Erzeugung von Zufallszahlen im Intervall (0;5) mit Rundung auf zwei Nachkommastellen Projektion der hier gezeigten Skale im Hörsaal
Aufgabe für Studierende: Schätzung von insgesamt 100 Werten auf 0,01 genau;
mit anschließender statistischer Auswertung der Abweichungen zwischen Schätzwert und (hier „ausnahmsweise“ bekanntem!) wahrem Wert
Reale Ergebnisse aus studentischen Daten
Abweichung vi relative Häufigkeit h(vi)
Summenhäufigkeit H(vi)
-0.5 0.01 0.01
-0.4 0.03 0.04
-0.3 0.04 0.08
-0.2 0.10 0.18
-0.1 0.26 0.44
0 0.25 0.69
0.1 0.17 0.86
0.2 0.08 0.94
0.3 0.02 0.96
0.4 0.04 1.00
0.00 0.10 0.20 0.30
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 Abweichung vi
rel. Häufigkeit h(vi)
Datensatz
Normalverteilung
0 0.5 1
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 Abweichung vi
Summenhäufigkeit H(vi) Datensatz
Nornalverteilung
Vorzeichentest: |n+ − n−| = |31 − 44| = 13
„erlaubt“: 10 = √100 = √n
→ klare Asymmetrie der Verteilung mit Verschiebung in negativer Richtung
Anmerkung: 100 Werte sind zu wenig!!!
(n → ∞ für Grenzübergang)
Dieser Studi „untertreibt“ offenbar lieber!
Verwerfen von Messwerten („Ausreißern“)
Frage bzw. Problem:
Darf man (einzelne) Messwerte, die innerhalb einer Messreihe signifikant abweichen, verwerfen? Zumindest kann in diesem Fall ein grober Fehler oder eine nur einmalig aufgetretene (z. B. durch Umwelteinflüsse) syste- matische Messabweichung vermutet werden.
Kritische Betrachtung:
Ein „Ausreißer“ in einer Messung kann das Ergebnis verfälschen. Aber: Ein neuer physikalischer Effekt kann dadurch leicht übersehen werden.
Jede Daten-Manipulation ist grundsätzlich fragwürdig. Eine starke Abweichung kann nur sachlich begründet als Fehlmessung interpretiert werden!
Schlussfolgerungen:
Es ist besser, die betreffende Messung zu wiederholen (Reproduzierbar- keitstest!). Eine Überprüfung und kurze Zwischenauswertung während der Messung ist immer ratsam!
Alle Kriterien, die entwickelt wurden, um große Messabweichungen zu ver- werfen, sind (ohne deren tieferes Verständnis) als fragwürdig anzusehen und besser nicht zu verwenden!
Vgl. auch Stichwort „Objektivität des Experimentators“
Darstellung des Messergebnisses einer direkt gemessenen physikalischen Größe
Messergebnis = (Mittelwert – Korrektur syst. Abweichungen) ± Messunsicherheit Vgl. vorige Vorlesung
Verschiedene Beiträge aus
systematischen und zufälligen Abweichungen Wie zusammenzufassen?
statistische Behandlung
?
Systematische und zufällige Messabweichungen sind statistisch nicht korreliert, d.h. unabhängige Größen. Eine gegenseitige Aufhebung beider Arten von Mess- abweichungen kann zwar nicht vorausgesetzt werden, ist aber möglich.
Bildhafter Vergleich mit Vektoraddition
syst. MA zuf. MA
Pythagoreische Summe der Beträge ≤ Summe der Beträge („Dreiecksungleichung“)
Ermittelung des Messergebnisses einer direkt gemessenen physikalischen Größe
Messung
Aufnahme der n Einzelmesswerte xi (i=1..n)
Mittelwert
xi x n1
Grobe Fehler Messabweichungen
Zufällige Messabweichungen Systematische
Messabweichungen
Korrektur eC
Restfehler eS
n≥6 Rechnung
( 1)
2
n n s v
eZ i
n<6 Abschätzung
x eZ
korrigiertes Ergebnis
C
C x e
x
Messunsicherheit
6
2 6
2
n x e u
n s e e u
e e e u
s s z
s z s
Vollständiges Messergebnis u
x x C
Vgl. Skript des GPR
Fortpflanzung der Unsicherheiten für eine mittelbar bestimmte (berechnete) physikalische Größe
G = G(x,y,z…)
2 2 2
...
G G G
G x y z
x y z
G G G ....
G x y z
x y z
Voraussetzungen:
1. Die Messwerte der direkt messbaren Größen x,y,z… sind normalverteilt und ihre zufälligen Ab- weichungen sind unabhängig voneinander (nicht korreliert).
2. Die systematischen Abweichungen sind vernachlässigbar und die zufälligen Abweichungen sind viel kleiner als die zugehörigen Mittelwerte der Messgrößen.
Anwendung der „Fehlerfortpflanzung“
Zylindervolumen:
Durchmesser d und Höhe h nicht beliebig genau messbar, unvermeidlich also mit den messtechnisch bedingten “Unsicherheiten” von
Δd = 0,01 mm und Δh = 0,1 mm
behaftet, die nicht “korreliert” sind (Gibt es einen Grund für Korrelation? Nein!) Fehlerfortpflanzung für unkorrelierte Größen (s. Skript):
h d
V
2 4
3 3
3 3
2 3 2
2 2
2
2 2
60) 42580
( 61) 42579
(
61 61.419314
51,6731123 33,1997228
2 4 4
mm V
besser noch
mm V
mm mm
V
mm V
h d
d d
h V
h h d V
d V V
Faust-Regel im Praktikum: Eine (höchstens zwei) signifikante Ziffern bei Unsicherheiten!
Fortpflanzung der Unsicherheiten bei vorliegender Korrelation zwischen den Eingangsgrößen?
Dieser Fall ist im Praktikum zwar i.a. eher selten, aber…
Achtung:
Die Kovarianz zwischen Eingangsgrößen muss bei existenter Korrelation unbedingt be- rücksichtigt werden. Eine Unterlassung führt zu einer Über- oder Unterschätzung (je nach Vorzeichen der Kovarianz bzw. partiellen Ableitungen) der resultierenden Un- sicherheit!
Praxisbeispiel:
Die Größe G wird aus dem Anstieg a und dem Achsenabschnitt b eines (existenten und physikalisch begründeten) linearen Zusammenhangs der Form y = ax + b berechnet.
Die Größen a und b sind hier ganz eindeutig linear korreliert (d.h. ρxy ≈ ± 1) …
Beachten Sie dazu ggf. entsprechende Hinweise der Versuchsbetreuer zum Versuch!