Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 1
Einführung
In vielen Gebieten des öffentlichen Lebens, in der Wirtschaft, der Verwaltung, der Industrie, der Forschung, in der Medizin etc. werden Entscheidungen auf der Grundlage von bestimmten Daten getroffen.
Wir können somit „Daten“ ganz allgemein als ein Material verstehen, auf dessen Grundlage Informationen gewonnen und
Schlußfolgerungen gezogen werden.
Wie kommt man zu Daten?
1. Sie sind bereits da – aufgezeichnet in administrativen Registern, gespeichert auf Bändern und anderen Datenträgern; Vorliegen von Krankengeschichten, Krankheitsregistern etc.
2. Sie entstehen erst – durch Beobachtung, Erhebung, Befragung, Experiment
Doch reicht es nicht aus, schlechthin Daten über einen Gegenstand zu sammeln, sondern man muss objektiv beurteilen können, welche Schlüsse auf Basis der vorliegenden Daten überhaupt gerechtfertigt sind
STATISTIK
Die Aufgabe der Statistik besteht darin die relevanten Informationen aus der Fülle von Daten zu extrahieren.
Proportional zum Wachstum der Datenmengen hat auch die Anwendung statistischer Methoden in letzter Zeit enorm zugenommen. Egal ob ein Manager Erfolgsergebnisse seiner Firma präsentiert oder ein
Wissenschaftler Arbeitshypothesen verifiziert – in beiden Fällen werden statistische Methoden zu Hilfe genommen.
Statistik
„Statistik ist eine Zusammenfassung von Methoden, die uns erlauben, im Fall von Ungewissheit vernünftige und optimale Entscheidungen zu treffen“, (Abraham Wald 1902-1950)
Statistik ist eine Sammlung von Methoden zur Erhebung und Analyse von Daten.
Statistische Methoden werden beim
- Sammeln - Beschreiben - Organisieren
- Analysieren und beim - Interpretieren
verwendet.
Voraussetzung für das Erarbeiten von Problemlösungen ist die Beachtung bestimmter Kriterien bei der Planung, Gewinnung, Verarbeitung, Analyse und Interpretation der Daten.
Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 3
Biostatistik
Unter dem Begriff Biostatistik werden die vielfältigen Anwendungen der mathematischen Statistik in den biologischen und ihnen verwandten Wissenschaften zusammengefaßt
Man spricht auch von med. Statistik oder Biometrie.
Beobachtungen an lebenden Objekten liefern so gut wie nie die gleichen Ergebnisse, wenn man sie wiederholt d.h. jedes Resultat ist mit einer Variabilität verbunden. Man spricht von statistischer oder stochastischer Schwankung, Variabilität und Streuung.
- biologische Variabilität
- Messungenauigkeit (technisch, ablesebedingt)
Beispiele: Blutdruck bei einer Person, Personen;
Rauchen - Lungenkrebs
Damit sind Voraussagen oder allgemein Entscheidungen niemals mit Gewißheit zu treffen, sondern stets mit einem gewissen Risiko
behaftet - Wahrscheinlichkeitsaussagen. Die Anwendung statistischer Methoden erlaubt aber trotz dieser "Unsicherheit" optimale und
vernünftige Entscheidungen zu treffen. Aufgabe ist es, stets vorhandene zufällige Einflüsse von systematischen Effekten zu trennen - Herausfinden von Regelmäßigkeiten oder
Gesetzmäßigkeiten in Daten, die vom Zufall beeinflusst werden.
Projektdurchführung
1. Systemanalyse
-Formulierung des Problems - Ziel der Studie festlegen,
- relevante Variablen und Einflußgrößen bestimmen - Istzustand erheben (Literaturrecherche)
- Lösungsvariante
2. Untersuchungsplanung
- Analyse und Abstraktion - (statistische) Modellbildung
- Versuchs- und Erhebungsplanung
- Pilotstudie
3. Durchführung
- Fragenkatalog, Protokoll
- Randbedingungen, Aufwand
- Daten sammeln und überprüfen
4. Datenanalyse
- grafische Darstellungen und Maßzahlen - statistische Auswertungen (Regression etc.) - Präsentation der Ergebnisse
5. Entscheidungen und Schlußfolgerungen
- Diskussion der neuen Informationen - Validität der Entscheidungen
Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 5
Statistische Datenanalyse
In diesem Punkt läßt sich die Statistik sowohl bezüglich Zielsetzung als auch Methodik in 3 Bereiche gliedern:
Deskriptive Statistik
Um aus einer großen Menge von Daten etwas herauslesen zu können, bedarf es einer zusammenfassenden, übersichtlichen Darstellung und Präsentation derselben in Form weniger und einfacher Angaben, die man „mit einem Blick“ oder in wenigen Schritten erfassen kann. Das Ergebnis ist eine „Statistik“.
Aufgabe der deskriptiven (beschreibenden) Statistik ist es, Methoden zur Aufbereitung und Darstellung von Daten zur Verfügung zu stellen.
Inferenz-Statistik (analytische, schließende Statistik)
Selten hat die Gewinnung und Verarbeitung von Daten nur zum Ziel, einen Istzustand, d.h. einen abgeschlossenen Sachverhalt
wiederzugeben.
Die analytische Statistik schließt anhand geeigneter
Beobachtungsdaten (=Zufallsstichproben) auf allgemeine Gesetzmäßigkeiten (welche Aussagen lassen zufallsbehaftete Stichproben über zugrunde liegende Grundgesamtheiten oder Populationen zu?) - Wahrscheinlichkeitstheorie.
Wichtige Aufgaben sind u.a.:
- Einflussgrößenermittlung - Zusammenhangsanalysen - Testen von Hypothesen
Explorative Statistik
Die explorative Statistik unterwirft Daten, über deren
Gesetzmäßigkeiten noch wenig bekannt ist, verschiedenen Verfahren, um Zusammenhänge und Strukturen zu finden
- die vom betreffenden Fachgebiet her verstehbar, erklärbar, plausibel sein könnten -
und so eventuell
zur Vermutung oder Entdeckung allgemeiner Gesetzmäßigkeiten führen.
Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 7
Grundbegriffe
Merkmal:
Gegenstand einer statistischen Analyse sind Beobachtungseinheiten, die durch Merkmale oder Variable charakterisiert sind.
Eine statistische Untersuchung ist nicht in der Lage, die untersuchten Personen oder Objekte in ihrer "Gesamtheit" zu erfassen, sondern beschränkt sich auf einzelne Merkmale wie beispielsweise Symptome und Laborwerte eines Patienten.
(1) Ermittlung jener Merkmale, von denen man annimmt, dass sie zur Lösung der Problemstellung beitragen
(2) Geforderte Merkmalseigenschaften: Objektivität
Zuverlässigkeit
Gültigkeit
Objektivität:
Das Merkmal muss unabhängig von der messenden/beurteilenden Person sein.
Zuverlässigkeit (reliability):
Die Erfassungsmethode der Daten soll zuverlässig sein, dass unter gleichen Randbedingungen jeweils das gleiche erfaßt wird.
Gültigkeit (validity):
Ein Beobachtungswert ist dann gültig, wenn er den interessierenden Sachverhalt auch wirklich erfaßt.
Beobachtungseinheit - Merkmalsträger
Das Objekt der Untersuchung wird als Beobachtungseinheit
bezeichnet (Patienten, Probanden, Tiere, biologisches Material: z.B.
Urin, Blut).
Merkmalsausprägungen:
Werte, die ein Merkmal annehmen kann, heißen Ausprägungen des Merkmals.
Unter Merkmalsausprägungen versteht man die beobachteten Werte wie z.B. Art der Operation, Name und Dosierung der Medikamente, die Höhe der Laborwerte usw.
Merkmalstypen - Datenskalen:
Die Unterscheidung von Merkmalstypen (Messniveaus) ist bedeutsam, da die Anwendbarkeit bestimmter biometrischer Verfahren vom Typ des untersuchten Merkmals abhängt.
(1) Nominalskala
Zwischen den einzelnen Merkmalsausprägungen sind weder eine Rangfolge noch ein Abstand definiert. Die Ausprägungen zweier Untersuchungseinheiten werden entweder als identisch oder als nicht identisch eingestuft bzw. klassifiziert (qualitative Merkmale).
Beispiele: Farbe, Blutgruppe, Autonummern, Geschlecht, Operationsart
(2) Ordinalskala
Zwischen den Merkmalsausprägungen besteht eine Rangordnung, die durch die Relationen "<, =, >" zum Ausdruck gebracht wird. Es ist jedoch kein Abstand zwischen jeweils zwei Ausprägungen des Merkmals definiert.
Beispiele: Noten, Nebenwirkungen eines Medikaments, Karnofsky-Index
(3) metrische Skalen
Es sind sowohl Rangfolge als auch Abstand zwischen den Merkmalsausprägungen definiert. Bei den metrischen Skalen unterscheidet man noch zwischen
Intervallskala: freie Wahl der Maßeinheit und des Nullpunktes.
Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 9
Grundgesamtheit - Stichprobe
Der Begriff der Population ist eng mit der Definition des Merkmalsbegriffs verbunden.
Die Gesamtheit aller gleichartigen statistischen Objekte, die hinsichtlich eines Merkmals untersucht werden, fasst man in einer Menge zusammen, die als Grundgesamtheit bzw. Population bezeichnet wird. Mit der Durchführung einer Untersuchung möchte man Aufschlüsse über diese Population gewinnen.
Nur in seltenen Fällen wie z.B. bei einer Volkszählung wird die interessierende Grundgesamtheit vollständig erfasst. Man spricht von Voll- oder Totalerhebung. In der Regel werden die Daten anhand von Stichproben erhoben. Das Ziel dieser Teilerhebung ist es aber weiterhin, Aufschlüsse über die gesamte Population zu erhalten. Die Auswahl der Stichprobe muss daher repräsentativ erfolgen, d.h. die Stichprobe muss die Verteilung der Untersuchungsmerkmale in der Grundgesamtheit getreu widerspiegeln. Die Zufalls- oder Random- Verfahren basieren auf dem Gleichheitsprinzip, d.h. für jedes Element besteht die gleiche Chance, gezogen zu werden.