• Keine Ergebnisse gefunden

Statistik I f¨ur Betriebswirte Vorlesung 7

N/A
N/A
Protected

Academic year: 2021

Aktie "Statistik I f¨ur Betriebswirte Vorlesung 7"

Copied!
16
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Statistik I f¨ ur Betriebswirte Vorlesung 7

Dr. Andreas W¨ unsche

TU Bergakademie Freiberg Institut f¨ur Stochastik

20. Mai 2019

(2)

2. Deskriptive Statistik

2.1. Grundbegriffe der Statistik

I

Der Begriff Statistik wurde Ende des 17. Jahrhunderts gepr¨ agt f¨ ur die verbale oder numerische Beschreibung eines bestimmten Staates oder den Inbegriff der

” Staatsmerkw¨ urdigkeiten“ eines Landes oder Volkes (er hat dieselbe Wortwurzel wie

” Staat“ oder

” Staatsmann“).

I

Statistik ist ein Hilfsmittel f¨ ur viele Wissenschaften.

I

Die Menge aller potenziellen Untersuchungsobjekte, ¨ uber die man Aussagen machen m¨ ochte, heißt Grundgesamtheit oder auch Population.

I

Zur m¨ oglichst eindeutigen Definition einer Grundgesamtheit sollten die Kriterien

I

sachlich, wer und was soll untersucht werden

I

r¨ aumlich, wo soll die Untersuchung stattfinden und

I

zeitlich, wann soll das Ganze stattfinden

beachtet werden.

(3)

Stichproben

I

Eine Stichprobe ist eine beschr¨ ankte Auswahl aus der Grundgesamtheit.

I

F¨ ur Stichtprobenuntersuchungen stellt sich h¨ aufig die Frage, wie und mit welchen m¨ oglichen Fehlern die aus der Stichprobe gewonnenen Ergebnisse bzw. Aussagen auf die Grundgesamtheit ¨ ubertragen werden k¨ onnen.

I

Es ist von enormer Bedeutung, dass die Stichprobe repr¨ asentativ ist,

d.h., dass man von den Untersuchungsergebnissen der Stichprobe

sp¨ ater ggf. auch auf ein gr¨ oßeres Ganzes (also die Grundgesamtheit)

schließen kann.

(4)

Das Problem der Repr¨ asentativit¨ at

Die Repr¨ asentativit¨ at spielt f¨ ur statistische Auswertungen und Aussagen eine sehr große Rolle. Bei Teilerhebungen unterscheiden wir zwei F¨ alle.

I

Das Auswahlverfahren der Individuen aus der Grundgesamtheit (das Ziehen der Stichprobe): Dieses sollte so organisiert sein, dass

I

jedes Individuum die gleiche Chance hat, ausgew¨ ahlt zu werden, und

I

die Individuen unabh¨ angig voneinander ausgew¨ ahlt werden.

Zu beachten ist, dass zu jedem Individuum auch mehrere Merkmale beobachtet werden k¨ onnen.

I

Die Erhebung einer Stichprobe aus Zufallsexperimenten: Dabei sollte gew¨ ahrleistet sein, dass

I

die Versuche unter gleichbleibenden Versuchsbedingungen und

I

die Zufallsexperimente unabh¨ angig voneinander durchgef¨ uhrt werden.

Auch in diesem Fall k¨ onnen mehrere Merkmale von Interesse sein.

(5)

Einzelobjekte und Merkmale

I

Ein Einzelobjekt aus der Grundgesamtheit oder aus der Stichprobe bezeichnet man als statistische Einheit, die ein bestimmtes Merkmal oder eine bestimmte Merkmalskombination aufweist.

I

Ein Objekt wird dann auch als Merkmalstr¨ ager bezeichnet.

I

Die Merkmale, auch Variablen genannt (z.B. Geschlecht, Ein- kommen, Autofarbe, Studiennoten, ...), sind jene Eigenschaften,

¨ uber deren Verteilung man Informationen erhalten m¨ ochte.

I

Die m¨ oglichen Werte dieser Merkmale bezeichnet man als Merkmals- auspr¨ agungen (z.B. f¨ ur das Merkmal Geschlecht: m¨ annlich, weiblich, f¨ ur das Merkmal Studiennote in Statistik I: 1, 1.3, 1.7, . . . 3.7, 4, 5).

I

Erhobene Merkmalsauspr¨ agungen bezeichnet man als statistische

Daten.

(6)

Vorgehen bei statistischen Untersuchungen 1

I

Studienplanung (Vorbereitung und Planung): u.a. mit

I

der exakten Formulierung des Untersuchungsziels;

I

der Festlegung der Art der Untersuchung, der Bestimmung der Stichprobengr¨ oße;

I

der Kl¨ arung organisatorischer und technischer Fragen (z.B. ¨ uber die Verwendung welcher Tests, Ein- bzw. Ausschlusskriterien);

I

der Ber¨ ucksichtigung der entstehenden Kosten.

I

Durchf¨ uhrung (Erhebung, Datenerfassung): Man unterscheidet

I

Prim¨ ardaten (die Daten werden eigens f¨ ur den Untersuchungszweck erhoben – mittels Vollerhebungen oder Teilerhebungen) bzw.

I

Sekund¨ ardaten (vorhandenes Datenmaterial wird genutzt).

Erhebungsarten bei prim¨ arstatistischen Untersuchungen sind z.B.

I

die schriftliche bzw. m¨ undliche Befragung;

I

die Beobachtung;

I

das Experiment;

I

die automatische Erfassung.

(7)

Vorgehen bei statistischen Untersuchungen 2

I

Datenmanagement (Datenkontrolle und -aufbereitung):

Hier k¨ onnen z.B. die Verkodierung, die Vorgehensweise mit

Ausreißern oder Pr¨ ufungen zur sachlichen Richtigkeit (Plausibilit¨ at), Vollz¨ ahligkeit oder Vollst¨ andigkeit eine Rolle spielen.

I

Analyse (Datenauswertung und-analyse): z.B.

I

Beschreibung der Stichprobe (deskriptive Statistik);

I

Schluss auf die Grundgesamtheit (schließende, induktive, analytische, beurteilende Statistik).

I

Pr¨ asentation, Interpretation und Diskussion der Ergebnisse:

z.B. zur Ableitung von Kernaussagen aus der Analyse der Daten.

(8)

Mathematische Bezeichnungen

I

Grundgesamtheit: Ω .

I

Untersuchungseinheit: ω oder i .

I

Merkmale: X , Y , Z oder auch X

1

, X

2

, X

3

, . . . .

I

Menge der Merkmalsauspr¨ agungen: S .

I

Merkmalsauspr¨ agungen oder -werte: x = X (ω) oder x

i

= X (i) .

I

Mathematisch betrachtet ist ein Merkmal eine Funktion X : Ω → S , die jeder Untersuchungseinheit die zugeh¨ orige Merkmalsauspr¨ agung zuordnet.

I

In der schließenden Statistik wird das Merkmal dann als Zufallsgr¨ oße

X aufgefasst und die beobachtete Merkmalsauspr¨ agung x = X (ω)

als Realisierung von X .

(9)

Mathematische Stichprobe

I

Die Zufallsvariablen X

1

, . . . , X

n

heißen mathematische Stichprobe, falls

I

alle X

i

(i = 1, . . . , n) dieselbe Verteilung besitzen (identsch verteilt sind) und

I

X

1

, . . . , X

n

stochastisch unabh¨ angig sind.

I

Kurzschreibweise: X

i

iid. i = 1, . . . , n.

Dabei steht iid f¨ ur independent identically distributed und der Stichprobenumfang ist n.

I

Eine konkrete Stichprobe x

1

, . . . , x

n

wird dann als Realisierung der

mathematischen Stichprobe X

1

, . . . , X

n

betrachtet.

(10)

Skalenniveaus

I

Je nach Art des Merkmals werden die Merkmalsauspr¨ agungen anhand verschiedener Skalen gemessen:

I

Nominalskala (lat. nomen = Name);

I

Ordinalskala (lat. ordinare = ordnen, auch Rangskala);

I

Intervallskala;

I

Verh¨ altnisskala (auch Ratioskala, Rationalskala, Proportionalskala);

I

Absolutskala.

I

Intervall-, Verh¨ altnis- und Absolutskala werden auch in dem Oberbegriff metrische Skala (oder Kardinalskala; griech.

metron = Maß) zusammengefasst.

I

Auch feinere oder andere Unterteilungen und spezielle Skalen

werden genutzt.

(11)

Nominalskala

I

Die Merkmalsauspr¨ agungen entsprechen begrifflichen Kategorien.

I

Es gibt keine nat¨ urliche Ordnungsrelation.

I

Sind nur zwei Auspr¨ agungen vorhanden, spricht man auch von dichotomen Merkmalen, z.B.

I

Geschlecht (

” m¨ annlich“,

” weiblich“);

I

Zustimmung (

” Ja“,

” Nein“).

I

Gibt es eine vor der Datenerhebung feststehende Einteilung der Grundgesamtheit in endlich viele disjunkte Klassen und wird jede Untersuchungseinheit eindeutig in eine der Klassen eingeordnet, spricht man auch von einer kategoriellen Skala. Die Auspr¨ agungen heißen dann auch Kategorien oder Stufen des Merkmals.

I

Beispiele sind

I

Familienstand (

” ledig“,

” verheiratet“,

” geschieden“,

” verwitwet“);

I

Status (

” Eigent¨ umer“,

” Hauptmieter“,

” Untermieter“);

I

Status (

” Azubi“,

” Geselle“,

” Meister“);

(12)

Ordinalskala

I

Zwischen den Merkmalsauspr¨ agungen besteht eine nat¨ urliche Reihenfolge (Ordnungsrelation, Anordnung).

I

Abst¨ ande zwischen zwei Auspr¨ agungen (oder Quotienten) haben keine inhaltliche Bedeutung.

I

Beispiele sind

I

H¨ ochster Schulabschluss (

” Keiner“,

” Hauptschule“,

” Mittlere Reife“,

” Hochschulreife“);

I

Status (

” Eigent¨ umer“,

” Hauptmieter“,

” Untermieter“);

I

Status (

” Azubi“,

” Geselle“,

” Meister“);

I

Bewertung (

” gut“,

” mittel“,

” schlecht“).

I

Eine Ordinalskala mit ganzzahligen Ordungsziffern (R¨ angen,

Rangziffern), die mit 1 beginnend in ununterbrochener Reihenfolge

hintereinander stehen, heißt auch Rangskala, z.B. Rangpl¨ atze in der

Bundesliga.

(13)

Intervallskala

I

Merkmalsauspr¨ agungen (Merkmalswerte) sind reelle Zahlen.

I

Neben der Ordnungsrelation zwischen den Merkmalsauspr¨ agungen lassen sich auch deren Abst¨ ande interpretieren. Es existiert allerdings ein willk¨ urlich gesetzter Nullpunkt.

I

Beispiel: Temperatur in

C .

I

Quotienten d¨ urfen nicht gebildet werden, so ist z.B. die Aussage

” 20

C ist doppelt so warm wie 10

C “ sinnlos.

I

Eine Intervallskala wird auch reelle Skala genannt.

(14)

Verh¨ altnisskala

I

Bei einer Verh¨ altnisskala (auch ratio, positiv reell, relativen Skala) k¨ onnen nur positive Zahlen beobachtet werden.

I

Zus¨ atzlich zu den Eigenschaften der Intervallskala gibt es einen nat¨ urlichen Nullpunkt.

I

Multiplikation und Division sind inhaltlich sinnvolle Operationen, der Quotient von zwei Werten ist inhaltlich sinnvoll (4 ist doppelt so groß wie 2).

I

Beispiele: Gewichte, L¨ angen.

I

Bei stetigen Merkmalen in der relativen Skala kann man ¨ uberlegen

(und eventuell versuchen), durch Logarithmieren der Daten zu einer

reellen Skala zu gelangen. Oft kann man dann zugrundeliegende

Gesetzm¨ aßigkeiten viel besser erkennen.

(15)

Absolutskala

I

Zus¨ atzlich zu den Forderungen der Verh¨ altnisskala ist neben dem nat¨ urlichen Nullpunkt hier auch eine nat¨ urliche Einheit zwingend vorgeschrieben.

I

Dies ist zum Beispiel bei Merkmalen der Fall, wenn die Merkmalsauspr¨ agungen Anzahlen sind.

I

Beispiel Anzahl von Kindern in einem Haushalt.

(16)

Bemerkungen

I

Auch andere bzw. weitere Einteilungen und spezielle Skalen werden genutzt, z.B. die Anteilskala.

I

Bei einer Variablen in der Anteilskala (auch

Wahrscheinlichkeitsskala) k¨ onnen nur Werte zwischen 0 und 1 beobachtet werden. Die Werte sind als Anteile interpretierbar.

I

Unter einer Skalentransformation versteht man die ¨ Ubertragung der Skalenwerte in Werte einer anderen Skala, wobei die

Ordnungseigenschaften der Skala erhalten bleiben m¨ ussen.

I

Mit Kodierung bezeichnet man die Transformation der Merkmalsauspr¨ agungen, ohne dass dabei das Messniveau der erhobenen Daten ge¨ andert wird.

I

Es gibt weitere Klassifikationen von Merkmalen, wie zum Beispiel:

I

qualitative und quantitative Merkmale;

I

diskrete und stetige Merkmale.

Referenzen

ÄHNLICHE DOKUMENTE

I Gesucht ist also eine Funktion f , die aus der Pr¨ adiktorvariablen Verkaufsfl¨ ache (X ) eine Vorhersage f¨ ur die abh¨ angige Variable Jahresumsatz (Y ) liefert.... Streudiagramm

I Ist die gesuchte Abh¨ angigkeitsfunktion eine nichtlineare Funktion (eine Gerade ist schlecht an die Daten anpassbar), kann man mitunter durch geeignete Variablentransformationen

I Sind zus¨ atzliche Informationen zu einem Zufallsexperiment verf¨ ugbar (oder werden diese hypothetisch angenommen), k¨ onnen sich die Wahrscheinlichkeiten f¨ ur die zuf¨

I Oft sind Ergebnisse von Zufallsversuchen in Form von Zahlen gegeben oder es ist f¨ ur eine mathematische Behandlung g¨ unstig, den elementaren Versuchsausg¨ angen Zahlen

I Die wichtigste Kenngr¨ oße f¨ ur die Variabilit¨ at von Zufallsgr¨ oßen ist die Varianz der Zufallsgr¨ oße, auch Streuung oder Dispersion genannt.. Diese Eigenschaft gilt aber

Die t¨ aglichen Kurs¨ anderungen einer Aktie seien unabh¨ angig und die Wahrscheinlichkeit daf¨ ur, dass der Kurs an einem Tag w¨ achst oder h¨ ochstens um 5% f¨ allt, betrage 0.8.

I H¨ aufig ergeben sich Zufallsgr¨ oßen (z.B. Messfehler) durch (additive) Uberlagerung vieler kleiner stochastischer Einfl¨ ¨ usse.. Beispiel 1.15: Zentraler

I Die Weibullverteilung kann als Grenzverteilung f¨ ur das Minimum einer großen Zahl von unabh¨ angigen Zufallsgr¨ oßen auftreten (Verteilung des schw¨ achsten Kettengliedes).