Medizinische Informatik 10. Medizinische Statistik 1
10. Medizinische Statistik
•
Projektplanung•
Deskriptive Statistik•
Inferenz-Statistik•
Literatur: Hüsler, J. und Zimmermann, H.: Statistische Prinzipien für medizinische Projekte, Verlag Hans Huber, 1993.Projektplanung
1. Fragestellung diskutieren: Ziele festlegen, alle relevanten Variablen und Einflussgrößen bestimmen, Modellüberlegun- gen mit Einbezug bekannter wissenschaftlicher Arbeiten.
2. Planung des Experimentes: sinnvolle Variablen und Einflussgrößen festlegen, Stichprobengröße bestimmen, Kosten und Zeitaufwand abklären.
3. Durchführung des Experimentes: Protokollierung, Kontrolle der Variablen und Einflussgrößen.
4. Statistische Auswertung: Graphiken erstellen und
Maßzahlen berechnen, Diskussion der Modellannahmen.
5. Diskussion der neuen Informationen: Validität bestimmen, Schlussfolgerungen herleiten, Bericht verfassen.
Medizinische Informatik 10. Medizinische Statistik 3
Population und Stichprobe
Die Stichprobe muss eine zufällige Auswahl der Population sein!
Probleme und Lösungen:
•
inhomogene Population–Aufteilung in Untergruppen (z.B. Männer und Frauen)
•
retrospektive Studie–prospektive Studie
•
Bias durch Auswahl–Zufallsauswahl (Problem bei Freiwilligen, eigenen Patienten, ..)
•
Bias durch Vermengung–Kausale Faktoren kennen und berücksichtigen (z.B. Alter, soziale Indikatoren, ...)
•
Informationsbias–klare Definitionen & Versuchprotokolle mit möglichst wenig Variationen (Problem z.B. bei Umfragen zu heiklen Themen)
Deskriptive Statistik: Maßzahlen
•
Umfang (Stichprobenumfang)•
Minimum•
Maximum•
Mittelwert (mean)⎯x : (x1 + ... + xn) / 2•
Median (median): (n+1)/2-te Wert bzw. Mittelwert•
1. Quartil: ≈ 25% der Werte sind kleiner•
3. Quartil: ≈ 75% der Werte sind kleiner•
Varianz s2: ((x1 -⎯x)2 + ... + (xn -⎯x)2 ) / (n - 1)•
Standardabweichung s (SD): √ Varianz–innerhalb⎯x + s sind ≈ 2/3 der Daten (bei Normalverteilung NV)
–innerhalb⎯x + 2s: ≈ 95% (bei NV; ohne > 75%)
–innerhalb⎯x + 3s: ≈ 99% (bei NV; ohne > 90%)
Medizinische Informatik 10. Medizinische Statistik 5
Deskriptive Statistik: Grafische Darstellungen
•
Balkendiagramm•
Sektorendiagramm•
Strichdiagramm•
Baumdiagramm•
Histogramm•
Häufigkeitspolygon•
Kistendiagramm (Boxplot)•
Punktediagramm (Scatter Plot)Visualisierung einiger Maßzahlen
Strich- diagramm
Q1: 1.Quartil Q3: 3.Quartil
~x: Median -x: Mittelwert s: Standard- abweichung
Boxplot: (Min, Q1, Median, Q3, Max)
Medizinische Informatik 10. Medizinische Statistik 7
Deskriptive Statistik (1)
•
Tabelle•
Kreisdiagramm / Sektorendiagramm•
Säulen-/BalkendiagrammDeskriptive Statistik (2)
•
(Tabelle)•
Histogramm•
Häufigkeitspolygon / LinieMedizinische Informatik 10. Medizinische Statistik 9
Deskriptive Statistik (3)
•
Häufigkeitspolygon zweier GruppenInferenz-Statistik: Wichtige Tests
•
Test auf Normalverteilung–visuell mit Wahrscheinlichkeitspapier
–durch Vergleich von Streubreite und Standardabweichung
•
Vergleich zweier Mittelwerte von Meßreihen–bei Normalverteilung: t-Tests
–ohne Normalverteilung: Wilcoxon- bzw. Rangsummentest
•
Vergleich von Häufigkeiten–Vierfeldertafel (Chi-Quadrat-Test)
–Kontingenztabellen
•
(linearer) Zusammenhang zwischen zufälligen Variablen–Korrelationskoeffizient
–lineare Regression
Medizinische Informatik 10. Medizinische Statistik 11
Varianten von T-Tests in Excel
•
Vergleich zweier unabhängiger Stichproben (wie signifikant ist die Differenz der Mittelwerte)–Beispiel: Vergleich Köpergröße von Männern und Frauen
–Formel: t mit x1, x2: Mittelwerte
mit s1, s2: Standardabweichungen mit n1, n2: Stichprobengröße
mit (n1+ n2 – 2) / 2 Freiheitsgraden (FG)
•
Falls Standardabweichungen ähnlich (homogen), bessere Formel möglich: F-Test•
Falls Stichproben abhängig: Bewertung der Differenzen•
Beispiel: Wirkung einer Blutdrucktherapie: vor/nach-Vergleich•
Formel: t = |Mittelwert der Differenzen| * √n / s mit (n-1) FG
Einseitig (Männer > Frauen?) oder zweiseitig (Unterschied?)Varianten von Chi-Quadrat-Tests in Excel
•
Vergleich einer gegebenen (beobachteten) Häufigkeitsverteilung mit einer erwarteten (theoretischen) Häufigkeitsverteilung•
Beispiel: Häufigkeiten eines Würfels (3000 Würfe)–beobachtet (hb): 1: 511; 2: 472; 3:572; 4:498; 5:513; 6:434
–erwartet (he): 1:500; 2:500; 3:500; 4:500; 5:500; 6:500
•
Prüfgröße: Summe der Abweichungsquadrate ∑ (hb – he)2 = χ2–mit Anzahl der Freiheitsgrade: Klassenzahl – 1 (hier 5)