• Keine Ergebnisse gefunden

Statistische Datenanalyse

N/A
N/A
Protected

Academic year: 2021

Aktie "Statistische Datenanalyse "

Copied!
9
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 1

Einführung

In vielen Gebieten des öffentlichen Lebens, in der Wirtschaft, der Verwaltung, der Industrie, der Forschung, in der Medizin etc. werden Entscheidungen auf der Grundlage von bestimmten Daten getroffen.

Wir können somit „Daten“ ganz allgemein als ein Material verstehen, auf dessen Grundlage Informationen gewonnen und

Schlußfolgerungen gezogen werden.

Wie kommt man zu Daten?

1. Sie sind bereits da – aufgezeichnet in administrativen Registern, gespeichert auf Bändern und anderen Datenträgern; Vorliegen von Krankengeschichten, Krankheitsregistern etc.

2. Sie entstehen erst – durch Beobachtung, Erhebung, Befragung, Experiment

Doch reicht es nicht aus, schlechthin Daten über einen Gegenstand zu sammeln, sondern man muss objektiv beurteilen können, welche Schlüsse auf Basis der vorliegenden Daten überhaupt gerechtfertigt sind

 STATISTIK

Die Aufgabe der Statistik besteht darin die relevanten Informationen aus der Fülle von Daten zu extrahieren.

Proportional zum Wachstum der Datenmengen hat auch die Anwendung statistischer Methoden in letzter Zeit enorm zugenommen. Egal ob ein Manager Erfolgsergebnisse seiner Firma präsentiert oder ein

Wissenschaftler Arbeitshypothesen verifiziert – in beiden Fällen werden statistische Methoden zu Hilfe genommen.

(2)

Statistik

„Statistik ist eine Zusammenfassung von Methoden, die uns erlauben, im Fall von Ungewissheit vernünftige und optimale Entscheidungen zu treffen“, (Abraham Wald 1902-1950)

Statistik ist eine Sammlung von Methoden zur Erhebung und Analyse von Daten.

Statistische Methoden werden beim

- Sammeln - Beschreiben - Organisieren

- Analysieren und beim - Interpretieren

verwendet.

Voraussetzung für das Erarbeiten von Problemlösungen ist die Beachtung bestimmter Kriterien bei der Planung, Gewinnung, Verarbeitung, Analyse und Interpretation der Daten.

(3)

Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 3

Biostatistik

Unter dem Begriff Biostatistik werden die vielfältigen Anwendungen der mathematischen Statistik in den biologischen und ihnen verwandten Wissenschaften zusammengefaßt

Man spricht auch von med. Statistik oder Biometrie.

Beobachtungen an lebenden Objekten liefern so gut wie nie die gleichen Ergebnisse, wenn man sie wiederholt d.h. jedes Resultat ist mit einer Variabilität verbunden. Man spricht von statistischer oder stochastischer Schwankung, Variabilität und Streuung.

- biologische Variabilität

- Messungenauigkeit (technisch, ablesebedingt)

Beispiele: Blutdruck bei einer Person, Personen;

Rauchen - Lungenkrebs

Damit sind Voraussagen oder allgemein Entscheidungen niemals mit Gewißheit zu treffen, sondern stets mit einem gewissen Risiko

behaftet - Wahrscheinlichkeitsaussagen. Die Anwendung statistischer Methoden erlaubt aber trotz dieser "Unsicherheit" optimale und

vernünftige Entscheidungen zu treffen. Aufgabe ist es, stets vorhandene zufällige Einflüsse von systematischen Effekten zu trennen - Herausfinden von Regelmäßigkeiten oder

Gesetzmäßigkeiten in Daten, die vom Zufall beeinflusst werden.

(4)

Projektdurchführung

1. Systemanalyse

-Formulierung des Problems - Ziel der Studie festlegen,

- relevante Variablen und Einflußgrößen bestimmen - Istzustand erheben (Literaturrecherche)

- Lösungsvariante

2. Untersuchungsplanung

- Analyse und Abstraktion - (statistische) Modellbildung

- Versuchs- und Erhebungsplanung

- Pilotstudie

3. Durchführung

- Fragenkatalog, Protokoll

- Randbedingungen, Aufwand

- Daten sammeln und überprüfen

4. Datenanalyse

- grafische Darstellungen und Maßzahlen - statistische Auswertungen (Regression etc.) - Präsentation der Ergebnisse

5. Entscheidungen und Schlußfolgerungen

- Diskussion der neuen Informationen - Validität der Entscheidungen

(5)

Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 5

Statistische Datenanalyse

In diesem Punkt läßt sich die Statistik sowohl bezüglich Zielsetzung als auch Methodik in 3 Bereiche gliedern:

Deskriptive Statistik

Um aus einer großen Menge von Daten etwas herauslesen zu können, bedarf es einer zusammenfassenden, übersichtlichen Darstellung und Präsentation derselben in Form weniger und einfacher Angaben, die man „mit einem Blick“ oder in wenigen Schritten erfassen kann. Das Ergebnis ist eine „Statistik“.

Aufgabe der deskriptiven (beschreibenden) Statistik ist es, Methoden zur Aufbereitung und Darstellung von Daten zur Verfügung zu stellen.

Inferenz-Statistik (analytische, schließende Statistik)

Selten hat die Gewinnung und Verarbeitung von Daten nur zum Ziel, einen Istzustand, d.h. einen abgeschlossenen Sachverhalt

wiederzugeben.

Die analytische Statistik schließt anhand geeigneter

Beobachtungsdaten (=Zufallsstichproben) auf allgemeine Gesetzmäßigkeiten (welche Aussagen lassen zufallsbehaftete Stichproben über zugrunde liegende Grundgesamtheiten oder Populationen zu?) - Wahrscheinlichkeitstheorie.

Wichtige Aufgaben sind u.a.:

- Einflussgrößenermittlung - Zusammenhangsanalysen - Testen von Hypothesen

(6)

Explorative Statistik

Die explorative Statistik unterwirft Daten, über deren

Gesetzmäßigkeiten noch wenig bekannt ist, verschiedenen Verfahren, um Zusammenhänge und Strukturen zu finden

- die vom betreffenden Fachgebiet her verstehbar, erklärbar, plausibel sein könnten -

und so eventuell

zur Vermutung oder Entdeckung allgemeiner Gesetzmäßigkeiten führen.

(7)

Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 7

Grundbegriffe

Merkmal:

Gegenstand einer statistischen Analyse sind Beobachtungseinheiten, die durch Merkmale oder Variable charakterisiert sind.

Eine statistische Untersuchung ist nicht in der Lage, die untersuchten Personen oder Objekte in ihrer "Gesamtheit" zu erfassen, sondern beschränkt sich auf einzelne Merkmale wie beispielsweise Symptome und Laborwerte eines Patienten.

(1) Ermittlung jener Merkmale, von denen man annimmt, dass sie zur Lösung der Problemstellung beitragen

(2) Geforderte Merkmalseigenschaften: Objektivität

Zuverlässigkeit

Gültigkeit

Objektivität:

Das Merkmal muss unabhängig von der messenden/beurteilenden Person sein.

Zuverlässigkeit (reliability):

Die Erfassungsmethode der Daten soll zuverlässig sein, dass unter gleichen Randbedingungen jeweils das gleiche erfaßt wird.

Gültigkeit (validity):

Ein Beobachtungswert ist dann gültig, wenn er den interessierenden Sachverhalt auch wirklich erfaßt.

Beobachtungseinheit - Merkmalsträger

Das Objekt der Untersuchung wird als Beobachtungseinheit

bezeichnet (Patienten, Probanden, Tiere, biologisches Material: z.B.

Urin, Blut).

Merkmalsausprägungen:

Werte, die ein Merkmal annehmen kann, heißen Ausprägungen des Merkmals.

Unter Merkmalsausprägungen versteht man die beobachteten Werte wie z.B. Art der Operation, Name und Dosierung der Medikamente, die Höhe der Laborwerte usw.

(8)

Merkmalstypen - Datenskalen:

Die Unterscheidung von Merkmalstypen (Messniveaus) ist bedeutsam, da die Anwendbarkeit bestimmter biometrischer Verfahren vom Typ des untersuchten Merkmals abhängt.

(1) Nominalskala

Zwischen den einzelnen Merkmalsausprägungen sind weder eine Rangfolge noch ein Abstand definiert. Die Ausprägungen zweier Untersuchungseinheiten werden entweder als identisch oder als nicht identisch eingestuft bzw. klassifiziert (qualitative Merkmale).

Beispiele: Farbe, Blutgruppe, Autonummern, Geschlecht, Operationsart

(2) Ordinalskala

Zwischen den Merkmalsausprägungen besteht eine Rangordnung, die durch die Relationen "<, =, >" zum Ausdruck gebracht wird. Es ist jedoch kein Abstand zwischen jeweils zwei Ausprägungen des Merkmals definiert.

Beispiele: Noten, Nebenwirkungen eines Medikaments, Karnofsky-Index

(3) metrische Skalen

Es sind sowohl Rangfolge als auch Abstand zwischen den Merkmalsausprägungen definiert. Bei den metrischen Skalen unterscheidet man noch zwischen

Intervallskala: freie Wahl der Maßeinheit und des Nullpunktes.

(9)

Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 9

Grundgesamtheit - Stichprobe

Der Begriff der Population ist eng mit der Definition des Merkmalsbegriffs verbunden.

Die Gesamtheit aller gleichartigen statistischen Objekte, die hinsichtlich eines Merkmals untersucht werden, fasst man in einer Menge zusammen, die als Grundgesamtheit bzw. Population bezeichnet wird. Mit der Durchführung einer Untersuchung möchte man Aufschlüsse über diese Population gewinnen.

Nur in seltenen Fällen wie z.B. bei einer Volkszählung wird die interessierende Grundgesamtheit vollständig erfasst. Man spricht von Voll- oder Totalerhebung. In der Regel werden die Daten anhand von Stichproben erhoben. Das Ziel dieser Teilerhebung ist es aber weiterhin, Aufschlüsse über die gesamte Population zu erhalten. Die Auswahl der Stichprobe muss daher repräsentativ erfolgen, d.h. die Stichprobe muss die Verteilung der Untersuchungsmerkmale in der Grundgesamtheit getreu widerspiegeln. Die Zufalls- oder Random- Verfahren basieren auf dem Gleichheitsprinzip, d.h. für jedes Element besteht die gleiche Chance, gezogen zu werden.

Referenzen

ÄHNLICHE DOKUMENTE

Die Einstufung in Besoldungs-, Vergütungs-, Entgelt- oder Lohngruppen richtet sich nach den gesetzlichen bzw. tariflichen Regelungen für die verschiedenen Personalgruppen. an

Der Auftragseingang wird in der Aufteilung nach In- und Auslandsaufträgen in ausgewählten Wirt- schaftszweigen des Verarbeitenden Gewerbes mit dem „Monatsbericht für Betriebe“

Zur laufenden Rechnung gehören alle Ausgaben und Einnahmen, die im Rahmen des Verwaltungsvollzugs sowie des Betriebes von Einrichtungen und Anstalten anfallen und

Da für die Einwohnerzahl (Bevölkerung insgesamt) besonders strenge Qualitätsanforderungen gelten, wird diese nach einem anderen Verfahren berechnet als die übrigen

In der Übersicht 2 erscheinen auf den Zeilen für die Kreise (kreisfreie Stadt oder Landkreis) nur die ersten 3 Stellen. Als Gemeindeschlüssel sind bei den kreisfreien Städten

In der Übersicht 2 erscheinen auf den Zeilen für die Kreise (kreisfreie Stadt oder Landkreis) nur die ersten 3 Stellen. Als Gemeindeschlüssel sind bei den kreisfreien Städten

Bayerisches Landesamt für Statistik und Datenverarbeitung 9.. Landwirtschaftliche Betriebe mit Ackerland und Anbau von Getreide zur Körnergewinnung 1) 2013 nach Getreidearten

Umsatzentwicklung im Einzelhandel nach Wirtschaftszweigen in jeweiligen Preisen und in Preisen des Jahres 2005 (prozentuale Veränderungen) .... Entwicklung der Beschäftigtenzahl