• Keine Ergebnisse gefunden

5.1 Statistische Verfahren

5.1.1 Deskriptive Statistik

„Die deskriptive Statistik dient zunächst zur beschreibenden und graphischen Aufbe-reitung und Komprimierung von Daten. Dies ist vor allem zur Präsentation von um-fangreichem Datenmaterial von Bedeutung.“43 Gleichzeitig dient die deskriptive Sta-tistik auch der Datenvalidierung, d.h., Fehler im Datensatz lassen sich relativ leicht und frühzeitig identifizieren und beheben. Ansonsten müssen bereits durchgeführte Analysen wiederholt werden, was einen erheblichen Zeitaufwand mit sich bringt.44 Allerdings erlaubt die deskriptive Statistik keine formalen Rückschlüsse auf die Grundgesamtheit, dies behandelt ausschließlich die induktive Statistik.45

Zur graphischen Darstellung der Erhebungsresultate steht eine Reihe von Diagram-men, Verlaufskurven, Tabellen zur Zusammenfassung von Häufigkeiten und Kenn-größen wie Mittelwert oder Median zur Verfügung.46

41 Koch, J., Marktforschung, 2004, S. 219f.

42 Vgl. Berekoven, L., Eckert, W., Ellenrieder, P., Marktforschung, 2009, S. 187ff.

43 Fahrmeir, L., et al., Statistik, 2004, S. 11.

44 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 11-12.

45 Vgl. Berekoven, L., Eckert, W., Ellenrieder, P., Marktforschung, 2009, S. 187.

46 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 11.

Im Rahmen der deskriptiven Statistik kann weiterhin zwischen der univariaten und der bi- bzw. multivariaten Datenanalyse differenziert werden, wobei die Anzahl der untersuchten Variablen das Hauptdifferenzierungsmerkmal darstellt.47

Univariate Datenanalyse

„Die univariate Analyse untersucht die Verteilung einer einzelnen Variablen bzw. ei-nes Merkmals über alle Merkmalsausprägungen (Messwerte) hinweg.“48 Eine Aus-wertung der Daten erfolgt dabei entweder in graphischer oder in tabellarischer Dar-stellung.

Zur tabellarischen Darstellung werden insbesondere eindimensionale Häufigkeitsver-teilungen verwendet, welche neben der absoluten Häufigkeit und der relativen Häu-figkeit (Anteil der untersuchten Merkmalsträger, der auf einen Wert entfällt) der Merkmalsausprägungen auch deren kumulierte Häufigkeiten anzeigen können.49 „Die Menge aller Merkmalsausprägungen eines nominal bzw. ordinal skalierten Merkmals bildet zusammen mit den zugehörigen Häufigkeiten die Häufigkeitsverteilung für die-ses Merkmal; dasselbe gilt für metrische diskrete Variablen mit nur sehr wenigen Ausprägungen (z.B. Kinderzahl).“50 Im Gegensatz dazu ist bei Vorliegen einer metri-schen diskreten Variablen mit sehr vielen möglichen Merkmalsausprägungen (z.B.

Einwohnerzahl) oder aber einer stetigen bzw. annähernd stetigen metrischen Variab-len, wie beispielsweise das Einkommen der Befragten, eine Klassenbildung bzw. Ka-tegorisierung erforderlich. Zwar ist mit der Klassenbildung einerseits ein Informati-onsverlust verbunden, andererseits trägt sie zu einer übersichtlicheren Darstellung bei.51

Neben der tabellarischen Veranschaulichung von Häufigkeitsverteilungen werden diese üblicherweise in Form von Stabdiagrammen oder Histogrammen dargestellt.52 Ersteres beinhaltet die verschiedenen Merkmalsausprägungen einer Variablen auf

47 Vgl. Berekoven, L., Eckert, W., Ellenrieder, P., Marktforschung, 2009, S. 188.

48 Koch, J., Marktforschung, 2004, S. 222.

49 Vgl. Berekoven, L., Eckert, W., Ellenrieder, P., Marktforschung, 2009, S. 188f.

50 Altobelli, C. F., Marktforschung, 2007, S. 222.

51 Vgl. Altobelli, C. F., Marktforschung, 2007, S. 222ff.

52 Vgl. Hartung, J., Elpelt, B., Klösener, K.-H., Statistik, 2005, S. 21.

der Abszisse und deren absolute Häufigkeiten, welche auf der Ordinate als senkrech-te Strecke in Form eines Stabes abgetragen werden. Hierbei kann weisenkrech-terhin zwi-schen und Balkendiagrammen differenziert werden. Während beim Säulen-diagramm Rechtecke bzw. Säulen statt Stäben verwendet werden, handelt es sich bei einem Balkendiagramm um ein gedrehtes Säulendiagramm, dessen X-Achse horizontal gelegt ist.53 Bei einem Histogramm erfolgt zusätzlich eine flächenpropor-tionale Darstellung der Häufigkeiten.54 Liegen weniger als vier Merkmalsausprä-gungen vor, eignet sich außerdem die Darstellung mittels Kreisdiagrammen, wobei die Flächenanteile der Kreissektoren proportional zur Häufigkeit sind.55 Aufgrund der Visualisierung der Daten erleichtern Diagramme die Interpretation im Vergleich zur tabellarischen Darstellung erheblich.

Desweiteren gibt es eine Reihe von Maßzahlen, die zur Beschreibung der Eigen-schaften von univariaten Häufigkeitsverteilungen nützlich sind, sog. Lageparameter.

„Die bekanntesten Maßzahlen sind die Mittelwerte. Sie bestimmen die Position meh-rerer Merkmalswerte auf einer Merkmalsdimension durch einen einzigen Wert.“56 Zur Datenanalyse wurde insbesondere der arithmetische Mittelwert (Durchschnittswert) und der Median (zentraler Wert) verwendet. Das arithmetische Mittel ist das bekann-teste Lagemaß und ergibt sich durch Addition aller beobachteten Werte und an-schließende Division durch die Anzahl der Beobachtungen.57 Er wird anhand der fol-genden Formel ermittelt:

Der Median ist hingegen derjenige Wert, der eine der Größe nach geordnete Reihe von Merkmalswerten halbiert und die Grenze zwischen den oberen und den unteren 50 % der Häufigkeitsverteilung markiert. Bei einer geraden Anzahl von Merkmals-ausprägungen ist zu beachten, dass der Median derjenigen Zahl zwischen den

53 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 35.

54 Vgl. Zucchini, W., et al, Statistik für Bachelor- und Masterstudenten, 2009, S. 63.

55 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 35.

56 Koch, J., Marktforschung, 2004, S. 223.

57 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 53.

den mittleren Werten entspricht.58 Während der Median ein zumindest ordinal-skaliertes Merkmal voraussetzt, erfordert die Berechnung des arithmetischen Mittels nach der Theorie ein metrisches Skalenniveau.59 Allerdings ist es in der Marktfor-schung üblich, auch bei ordinalskalierten Daten, wie z.B. der auf einer Fünfer-Skala gemessenen Bewertung der Attraktivität der Birkenfelder Innenstadt, den Mittelwert zu berechnen.60

Inwieweit die Merkmalswerte in einer Häufigkeitsverteilung vom Mittelwert abweichen bzw. streuen, wird mit Hilfe von sogenannten Streuparametern (auch Dispersions-maße) angegeben.61 Die bekanntesten Streuparameter sind die Varianz bzw. ihre Wurzel, die Standardabweichung, welche beide ein metrisches Skalenniveau vor-aussetzen.62 Erstere ergibt sich aus der Summe der durchschnittlichen quadrati-schen Abweichung vom Mittelwert, dividiert durch die Anzahl der Merkmalswerte:

( )

2 Varianz. Sie beschreibt die mittlere Abweichung und dient der Identifikation von Feh-ler-Intervallen um den Mittelwert.63

„Der Streubereich einer Häufigkeitsverteilung ist derjenige Wertebereich, in dem alle Merkmalswerte einer Beobachtungsreihe liegen.“ Die Breite des Streubereichs von der kleinsten bis zur größten beobachteten Merkmalsausprägung bezeichnet man als Spannweite bzw. Range:

60 Vgl. Berekoven, L., Eckert, W., Ellenrieder, P., Marktforschung, 2009, S. 190.

61 Vgl. Koch, J., Marktforschung, 2004, S. 224.

62 Vgl. Altobelli, C. F., Marktforschung, 2007, S. 226f.

63 Vgl. Koch, J., Marktforschung, 2004, S. 48.

Ein Vergleich zwischen den Spannweiten zweier oder mehrerer Beobachtungsreihen kann nur unter der Voraussetzung erfolgen, dass diese die gleiche Länge haben.64 Sie erfordert zumindest ordinalskalierte Daten.65

Weitere Streuungsparameter in der Statistik sind Quantile. Das sogenannte p-Quantil ist eine reelle Zahl zwischen null und eins und trennt die Verteilung einer Variablen in zwei Teile. Während p⋅100% der Daten darunter liegen, liegen entsprechend 50 %-Quantil, welches dem Median entspricht. Neben dem Median sind Quartile und Dezile weitere spezielle Quantile.66 Quantile setzen ein ordinales Skalenniveau vor-aus.67

Bi- und multivariate Datenanalyse

Während univariate Verfahren die Merkmalsausprägungen der Untersuchungseinhei-ten entlang einer Merkmalsdimension analysieren, beziehen sich die bi- bzw. multiva-riaten Verfahren auf die Analyse von Zusammenhängen zwischen den Messdaten zweier bzw. mehrerer Variablen. Dadurch können zwei bzw. mehrere Variablen si-multan in die Untersuchung mit einbezogen und ihre Beziehung nach Art und Aus-maß untersucht werden.68 Da bei der Auswertung keine multivariate Datenanalyse durchgeführt wird, wird nachfolgend nicht näher darauf eingegangen.

Eine der wichtigsten und einfachsten bivariaten Methoden ist die Kreuztabellierung, welche kein bestimmtes Skalenniveau voraussetzt. Sämtliche Merkmalsausprägun-gen von zwei Variablen (absolute und/oder relative Häufigkeiten) werden in einer zweidimensionalen Matrix, der sog. Kreuztabelle, dargestellt. Ob der Zusammenhang zwischen den Merkmalsausprägungen nur zufällig eingetreten oder statistisch

64 Vgl. Hartung, J., Elpelt, B., Klösener, K.-H., Statistik, 2005, S. 40f.

65 Vgl. Altobelli, C. F., Marktforschung, 2007, S. 226.

66 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 64f.

67 Vgl. Fahrmeir, L., et al., Statistik, 2004, S. 248.

68 Vgl. Berekoven, L., Eckert, W., Ellenrieder, P., Marktforschung, 2009, S. 192f.

chert ist, d.h., auf die Grundgesamtheit übertragen werden kann, kann mit Hilfe spe-zifischer Testverfahren der induktiven Statistik überprüft werden.69