Summenhäufigkeit H(vi)

(1)

Institut für Physik

Physikalisches Grundpraktikum

Einige Anmerkungen zur statistischen Behandlung von Messunsicherheiten aufgrund zufälliger Messabweichungen

und zur sog. „Fehlerfortpflanzung“

(2)

Quelle:

Energy & Environment Vol. 21 No. 8 (2010), pp. 969-989, Pat Frank, „Uncertainty in the global average surface air temperature index: representative lower limit“

Beispiel zur Relevanz der Fehleranalyse

Entwicklung der Globaltemperatur und Klimawandel?

Bisher aber Unsicherheit von ± 0,1 K angenommen…

(3)

Fortsetzung dazu

Übersetztes Zitat aus der Arbeit:

Die Messfühler(Sensor)-Messunsicherheit wurde nie umfassend in den früheren Arbeiten zur mittleren globalen bodennahen Lufttemperatur berücksichtigt. Der geschätzte durchschnittliche ± 0,2 K Stations-Fehler wurde fälschlicherweise als zufällig beurteilt, während der systematische Fehler, bestimmt durch unkontrollierte Variablen, immer vernachlässigt wurde.

Der systematische Fehler bei den Messungen von drei ideal gelegenen und (ideal) gewarteten Temperatursensoren wurde hier berechnet. Kombiniert mit ± 0,2 K als allgemein berichtetem (durchschnittlichen) Stations-Fehler, lässt sich eine repräsentative untere Grenze der Unsicherheit von ± 0,46 K für alle globalen jährlichen bodennahen Lufttemperatur-Anomalien finden. Diese ± 0,46 K zeigen, dass der Trend der globalen bodennahen Lufttemperatur-Anomalie von 1880 bis 2000 statistisch nicht von „0“ zu unterscheiden ist. Er stellt somit eine untere Grenze der Kalibrierungsunsicherheit für Klimamodelle und für jede mögliche physikalisch vertretbare Proxy-Rekonstruktion der Paläo-Temperatur dar. Die Geschwindigkeit und das Ausmaß der Erwärmung des 20. Jahrhunderts sind somit unbekannt, und Vermutungen von einer beispiellosen Entwicklung der globalen Lufttemperatur im 20.

Jahrhundert sind somit nicht nachhaltig (begründbar).

Eine streitbare Formulierung – die Argumentation ist aber ganz sicher nicht ganz abwegig!

(4)

Unterscheidung von systematischen und zufälligen Messabweichungen

Zufällige Messabweichungen liefern ein unsicheres, systematische

Messabweichungen ein falsches Ergebnis.

(5)

Zufällige Messabweichungen

Systematische Messabweichungen

(6)

Schätzung von Messunsicherheiten – ein Problem?

Ja! Oft ist eine einfache Abschätzung nicht möglich oder gar nicht „sachgerecht“…

anstelle einer Einzel- mehrere wiederholte Messungen, die dann mit Methoden der (mathematischen) Statistik untersucht werden können bzw. müssen

bei Messreihen ein und dieselbe Messung unter möglichst identischen Bedingungen (Achtung: Umwelteinflüsse!) im statistischen Sinne „genügend oft“

(d.h. mit ausreichendem Stichprobenumfang) wiederholen; hier im Praktikum i.d.R. mindestens 6 Messungen

Statistik bedeutet Erhöhung der Messzeit und des Aufwandes; also Relation zwischen Aufwand und Nutzen stets sehr genau abwägen (manchmal aber dennoch zwingend nötig!)

(7)

Zufällige Messabweichungen

Messwiederholungen (selbst unter identischen Bedingungen):

liefern i. A. nicht immer denselben Messwert, sondern haben Abweichungen!

Begriff „ zufällige Messabweichungen“:

wenn unterschiedlich in ihrer Größe und Richtung → zufällige Messabweichungen Eigenschaft "zufällig" = Ursachen nicht im Einzelnen zu verfolgen, stochastisches (d.h. dem Zufall unterworfenes) Verhalten der Messergebnisse → Messwerte haben Wahrscheinlichkeitscharakter

Ursachen a) statistische Messgröße

stochastischer Charakter von gemessenen Ereignissen (z.B. radioaktiver Zerfall,

„Rauschen“ in elektrischen Signalen)

b) Unzulänglichkeit des Experiments oder Experimentators

Schätzungen und Interpolationen auf Messskalen (Achtung: Parallaxenfehler) Messen einer Zeitdifferenz mit der Stoppuhr mit Reaktionszeit

Längenmessung mit Maßband unterschiedlicher Verbiegung c) äußere Einflüsse

zufällige unvorhersehbare äußere Einflüsse (z.B. wechselnde Luftströmungen, kurzzeitige Temperaturschwankungen etc.)

(8)

Aufgaben der mathematischen Statistik

Schätztheorie: Entwicklung geeigneter Schätzverfahren und Ableitung von Schätzfunktionen für statistische Untersuchungen; Bereichsschätzungen von Parametern einer Grundgesamtheit, aus der Stichproben gezogen werden (Konfidenzintervalle!); Bestätigung oder Verwerfen von Hypothesen durch geeignete statistische Testverfahren

Zielsetzungen:

empirische Verteilung der Merkmalswerte der Stichprobe → Abschätzung bzw.

Bestimmung der theoretischen Verteilung der Grundgesamtheit

Bestimmung der Parameter der theoretischen Verteilung mit optimaler Anpassung für die Stichprobenwerte; Ermittlung der Parameterabhängigkeiten für die Verteilung

Untersuchung der Korrelation zwischen verschiedenen Merkmalen gleicher Objekte oder zwischen dem gleichen Merkmal verschiedener Objekte

Entwicklung von Verfahren zur empirischen Bestimmung von „möglichst guten“

Näherungswerten und ihrer Streuung bzw. (statistischen) Unsicherheit

Mathematische Statistik: Analyse von Daten anhand mathematischer Modelle Stochastik

Mathematische Statistik Wahrscheinlichkeitstheorie

Vgl. Mathematik der Sekundarstufe II: Teilgebiet „Stochastik“

(9)

Grundbegriffe der Statistik

Mathematische Statistik:

Untersuchung zufälliger Ereignisse bezüglich eines oder mehrerer quantitativ erfassbarer Merkmale; Zuordnung von Zahlenwerten als sog. Zufallsvariable

Zufallsvariable

(als quantitatives Merkmal eines zufälligen Ereignisses)

Zufallsvariable

mit diskreten Merkmalswerten (z. B. Zerfallsrate eines Isotops)

Zufallsvariable

mit kontinuierlichen Merkmalswerten (z. B. Lebensdauer von Ladungsträgern) Grundgesamtheit:

Gesamtheit aller möglichen Realisierungen des zufallsbedingten Merkmals; kann endlich viele oder unendlich viele Elemente enthalten

Grundgesamtheit Stichprobe (endlich)

„Urliste“

(10)

Häufigkeitsverteilung

Erhebung einer Stichprobe:

Umfang N bezüglich des Merkmals x → Tabelle der beobachteten Merkmalswerte x_i ("Urliste der Elemente")

Häufigkeitsverteilung:

Messwerte streuen → Veranschaulichung mit Häufigkeitsverteilung, d.h. Auftragung der Anzahl n_i der in einem Intervall Δx gefundenen Messwerte („absolute Häufigkeit“) über Messwerten x_i

relative Häufigkeit:

Normierte Verteilung:

f_i(x_i)·Δx ist die Wahrscheinlich- keit, ein Messergebnis xi im Intervall Δx zu finden

(statistische Aussage)

( ) ⁱ

i i

f x n

 N

1

( ) 1

N

i i

i

f x







hier absolute Häufigkeit aufgetragen

?

(11)

Anmerkungen zur Klasseneinteilung

Allgemein:

Bereich möglicher Merkmalswerte → Einteilung in M gleichgroße Intervalle der Breite Δx (Klassen)

Mitte der Klasse → möglichst einfache Zahl x_m (Klassenmitte) mit m = 1..M

Ermittlung der absoluten Häufigkeit der Merkmalswerte im Intervall (x_m-Δx/2; x_m+Δx/2) auf Klassengrenzen entfallende Merkmalswerte je zu 1/2 der rechten und der linken Klasse zugeordnet

Kriterien:

nicht zu eng (zu geringe Häufigkeiten → große Schwankungen; d.h. zu feine Diskretisierung)

nicht zu weit (drohender Informationsverlust; zu grobe Diskretisierung) Empfehlungen für sinnvolle Klassenzahl M und Klassenbreite Δx:

M ≈ 5·lg N und Δx ≈ (x_max-x_min)/N Generelle Anmerkung:

physikalische Größen oft kontinuierlich verteilt; Mess- und Ablesegenauigkeit aber begrenzt → Diskretisierung der Messergebnisse, z.T. mit gleichem Zahlenwert

Durch die Mess- und Ablesegenauigkeit feinste Klasseneinteilung gegeben, eine gröbere aber meistens sinnvoller!

(12)

Summenhäufigkeitsverteilung

Berechnung aus der relativen Häufigkeitsverteilung: ( ) ( )

i j

j i i

x x

F x f x







Summation der relativen Häufigkeiten bis zum Wert x_j → statistische Interpretation als die Wahrscheinlichkeit, einen Wert x_i im Intervall (0;x_j) zu finden

1 F(x₁)

F(x₂)

Normierungseigenschaft

statistische Interpretation von F(x₁)-F(x₂) als Wahrscheinlichkeit, einen Wert x_i im Intervall (x₁,x₂) vorzufinden

(13)

Übergang zu kontinuierlichen Verteilungen

Grenzwertbetrachtung:

unendlich große Stichprobe N → ∞ unendlich große Klassenzahl M → ∞

infinitesimal feine Intervalleinteilung Δx → 0 (Übergang zum Differential dx) Übergang von diskreten Verteilungen/Funktionen zu kontinuierlichen!

→ f(x) als Wahrscheinlichkeitsdichte → F(x) als integrale

Wahrscheinlichkeitsdichte

(14)

Wahrscheinlichkeitsverteilungen: Parameter

Definition des Mittelwertes:

erstes Moment einer Verteilung, beschreibt ihre Lage

Definition der Varianz:

zweites Moment einer Verteilung, beschreibt ihre Breite

Definition der Standardabweichung:

direktes Maß für die Breite der Verteilungsfunktion, d.h. die Streuung der Werte Für uns zweckmäßiger!

(15)

Beispiele für Verteilungsfunktionen

Maxwell-Boltzmannsche Geschwindigkeitsverteilung

Verteilungen in der (statistischen) Physik

Orbitale von Elektronen Gauß- oder Normalverteilung

Gleichverteilung Poissonverteilung

Geometrische Verteilung Binomial- bzw. Bernoulliverteilung Hypergeometrische Verteilung

Plancksches

Strahlungsgesetz Fermiverteilung

(16)

Zentraler Grenzwertsatz der Statistik

Die Verteilungen der Summen von stochastisch unabhängigen Zufallsvariablen streben mit wachsendem Stichprobenumfang gegen die Gaußsche Normalverteilung. (Faustregel: bei mehr als 30 stochastisch unabhängigen Zufallsvariablen schon sehr gute Näherung)

Diese Regel ermöglicht zum einen die Bestimmung von Wahrscheinlichkeiten unbekannt verteilter Zufallsvariablen, zum anderen kann die Bestimmung kompliziert zu berechnender Wahrscheinlichkeitswerte mit der Normalverteilung approximiert werden.

(17)

Gauß- oder Normalverteilung

f(x)

x-s x x+s x

2 2

1 ( )

( ) exp

2 2

x x

f x



s s

  

     

Eigenschaften:

•Maximum beim Mittelwert (Erwartungswert), Symmetrie bezüglich Mittelwert

•Konvergenz gegen Null im Unendlichen

•Wendepunkte für Mittelwert ± Standardabweichung

•Breite durch Standardabweichung bestimmt

•Normierung auf 1 (vgl. statistische Interpretation!)

Intervall um Mittelwert Wahrscheinlichkeit

±s 68,3%

±2s 95,4%

±3s 99,7%

(18)

Normierungseigenschaft der Normalverteilung

Die Parameter „Mittelwert“ und „Standardabweichung“ ermöglichen es, dass unterschiedliche Modellverteilungen durch die Gaußverteilung beschrieben werden können.

(19)

Gaußsche Fehlerfunktion

Eigenschaften:

•Statistische Interpretation als Wahrscheinlichkeit für Wert im Intervall

•Monotonieverhalten

•Wendepunkt für Mittel- bzw. Erwartungswert

(20)

Empirischer Zugang für Parameter der Normalverteilung

Definition des Mittelwertes:

Definition der Standardabweichung:

Definition des Vertrauensbereiches:

(21)

Unterschied zwischen

Standardabweichung und Vertrauensbereich

(experimentelle oder empirische) Standardabweichung:

Im Grenzübergang für n→∞ erhält man die Standardabweichung σ der Grundgesamtheit!

Der Wert von s nähert sich mit wachsender Anzahl von Messwerten einem endlichen Wert und ändert sich bei weiteren Messungen nicht mehr wesentlich.

(experimentelle oder empirische) Standardabweichung des Mittelwerts (für t=1) bzw.

Vertrauensbereich:

Der Zahlenwert wird durch Vergrößerung der Zahl der Messungen um den Faktor 1/√n kleiner.

Anwendung in der Praxis:

Verbesserung des „Signal-Rausch-Verhältnisses“ durch n-fache Akkumulation von Mess-Signalen,

„Integration“ von vielen Einzelmessungen (z.B. Digitalfotografie)

„Rauschen“ ist zufällig!

(22)

Anwendung von statistischen Methoden (Rauschen)

(23)

Lehr-Beispiel:

Versuch „F1 Fehlerverteilung“

Erzeugung von Zufallszahlen im Intervall (0;5) mit Rundung auf zwei Nachkommastellen Projektion der hier gezeigten Skale im Hörsaal

Aufgabe für Studierende: Schätzung von insgesamt 100 Werten auf 0,01 genau;

mit anschließender statistischer Auswertung der Abweichungen zwischen Schätzwert und (hier „ausnahmsweise“ bekanntem!) wahrem Wert

(24)

Reale Ergebnisse aus studentischen Daten

Abweichung v_i relative Häufigkeit h(vi)

Summenhäufigkeit H(v_i)

-0.5 0.01 0.01

-0.4 0.03 0.04

-0.3 0.04 0.08

-0.2 0.10 0.18

-0.1 0.26 0.44

0 0.25 0.69

0.1 0.17 0.86

0.2 0.08 0.94

0.3 0.02 0.96

0.4 0.04 1.00

0.00 0.10 0.20 0.30

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 Abweichung vi

rel. Häufigkeit h(vi)

Datensatz

Normalverteilung

0 0.5 1

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 Abweichung vi

Summenhäufigkeit H(vi) Datensatz

Nornalverteilung

Vorzeichentest: |n⁺ − n⁻| = |31 − 44| = 13

„erlaubt“: 10 = √100 = √n

→ klare Asymmetrie der Verteilung mit Verschiebung in negativer Richtung

Anmerkung: 100 Werte sind zu wenig!!!

(n → ∞ für Grenzübergang)

Dieser Studi „untertreibt“ offenbar lieber!

(25)

Verwerfen von Messwerten („Ausreißern“)

Frage bzw. Problem:

Darf man (einzelne) Messwerte, die innerhalb einer Messreihe signifikant abweichen, verwerfen? Zumindest kann in diesem Fall ein grober Fehler oder eine nur einmalig aufgetretene (z. B. durch Umwelteinflüsse) syste- matische Messabweichung vermutet werden.

Kritische Betrachtung:

Ein „Ausreißer“ in einer Messung kann das Ergebnis verfälschen. Aber: Ein neuer physikalischer Effekt kann dadurch leicht übersehen werden.

Jede Daten-Manipulation ist grundsätzlich fragwürdig. Eine starke Abweichung kann nur sachlich begründet als Fehlmessung interpretiert werden!

Schlussfolgerungen:

Es ist besser, die betreffende Messung zu wiederholen (Reproduzierbar- keitstest!). Eine Überprüfung und kurze Zwischenauswertung während der Messung ist immer ratsam!

Alle Kriterien, die entwickelt wurden, um große Messabweichungen zu ver- werfen, sind (ohne deren tieferes Verständnis) als fragwürdig anzusehen und besser nicht zu verwenden!

Vgl. auch Stichwort „Objektivität des Experimentators“

(26)

Darstellung des Messergebnisses einer direkt gemessenen physikalischen Größe

Messergebnis = (Mittelwert – Korrektur syst. Abweichungen) ± Messunsicherheit Vgl. vorige Vorlesung

Verschiedene Beiträge aus

systematischen und zufälligen Abweichungen Wie zusammenzufassen?

statistische Behandlung

?

Systematische und zufällige Messabweichungen sind statistisch nicht korreliert, d.h. unabhängige Größen. Eine gegenseitige Aufhebung beider Arten von Mess- abweichungen kann zwar nicht vorausgesetzt werden, ist aber möglich.

Bildhafter Vergleich mit Vektoraddition

syst. MA zuf. MA

Pythagoreische Summe der Beträge ≤ Summe der Beträge („Dreiecksungleichung“)

(27)

Ermittelung des Messergebnisses einer direkt gemessenen physikalischen Größe

Messung

Aufnahme der n Einzelmesswerte xi (i=1..n)

Mittelwert



 x_i x n1

Grobe Fehler Messabweichungen

Zufällige Messabweichungen Systematische

Messabweichungen

Korrektur e_C

Restfehler e_S

n≥6 Rechnung

 _



 ( 1)

2

n n s v

e_Z ⁱ

n<6 Abschätzung

x e_Z 

korrigiertes Ergebnis

C

C x e

x  

Messunsicherheit























 







6

2 6

2

n x e u

n s e e u

e e e u

s s z

s z s

Vollständiges Messergebnis u

x x  _C 

Vgl. Skript des GPR

(28)

Fortpflanzung der Unsicherheiten für eine mittelbar bestimmte (berechnete) physikalische Größe

G = G(x,y,z…)

2 2 2

...

G G G

G x y z

x y z

 

  

   

                G G G ....

G x y z

x y z

    

           

Voraussetzungen:

1. Die Messwerte der direkt messbaren Größen x,y,z… sind normalverteilt und ihre zufälligen Ab- weichungen sind unabhängig voneinander (nicht korreliert).

2. Die systematischen Abweichungen sind vernachlässigbar und die zufälligen Abweichungen sind viel kleiner als die zugehörigen Mittelwerte der Messgrößen.

(29)

Anwendung der „Fehlerfortpflanzung“

Zylindervolumen:

Durchmesser d und Höhe h nicht beliebig genau messbar, unvermeidlich also mit den messtechnisch bedingten “Unsicherheiten” von

Δd = 0,01 mm und Δh = 0,1 mm

behaftet, die nicht “korreliert” sind (Gibt es einen Grund für Korrelation? Nein!) Fehlerfortpflanzung für unkorrelierte Größen (s. Skript):

h d

V  

²

 4



   

3 3

2 3 2

2 2

2

2 2

60) 42580

( 61) 42579

(

61 61.419314

51,6731123 33,1997228

2 4 4

mm V

besser noch

mm V

mm mm

V

mm V

h d

d d

h V

h h d V

d V V





















 

 



   

 



 



    





 

 



  



 

 

 



  



 





Faust-Regel im Praktikum: Eine (höchstens zwei) signifikante Ziffern bei Unsicherheiten!

(30)

Fortpflanzung der Unsicherheiten bei vorliegender Korrelation zwischen den Eingangsgrößen?

Dieser Fall ist im Praktikum zwar i.a. eher selten, aber…

Achtung:

Die Kovarianz zwischen Eingangsgrößen muss bei existenter Korrelation unbedingt be- rücksichtigt werden. Eine Unterlassung führt zu einer Über- oder Unterschätzung (je nach Vorzeichen der Kovarianz bzw. partiellen Ableitungen) der resultierenden Un- sicherheit!

Praxisbeispiel:

Die Größe G wird aus dem Anstieg a und dem Achsenabschnitt b eines (existenten und physikalisch begründeten) linearen Zusammenhangs der Form y = ax + b berechnet.

Die Größen a und b sind hier ganz eindeutig linear korreliert (d.h. ρ_xy ≈ ± 1) …

Beachten Sie dazu ggf. entsprechende Hinweise der Versuchsbetreuer zum Versuch!