Springer-Lehrbuch
Springer-Verlag Berlin Heidelberg GmbH
Helge Tautenburg
Deskriptive Statistik
Eine Einführung mit SPSS für Windows mit Übungsaufgaben und Lösungen
Mit Beiträgen von
Andreas Fieger und Christian Kastner
Dritte, neubearbeitete und erweiterte Auflage
Mit 146 Abbildungen und 34 Tabellen
i Springer
Professor Dr. Dr. Helge Toutenburg Universität München
Institut für Statistik Akademiestraße 1/1 80799 München
Die 2. Auflage erschien bei Prentice Hall, München, 1998, ISBN 978-3-540-67169-5
ISBN 978-3-540-67169-5
Die Deutsche Bibliothek - CIP-Einheitsaufnahme
Toutenburg, Helge: Deskriptive Statistik: eine Einführung mit SPSS für Windows und Übungsaufgaben, 3., neu bearb. u. erw. Auf!. I Helge Toutenburg.
(Springer-Lehrbuch)
ISBN 978-3-540-67169-5 ISBN 978-3-662-06565-5 (eBook) DOI 10.1007/978-3-662-06565-5
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen We- gen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugswei- ser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Ur- heberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes.
© Springer-Verlag Berlin Heidelberg 2000
Ursprünglich erschienen bei Springer-Verlag Berlin Heidelberg New York 2000
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.
SPIN 10761852 42/2202-5 4 3 2 1 0 - Gedruckt auf säurefreiem Papier
Vorwort
In der Tagespresse und in den TV-Nachrichten sowie durch die zunehmende Verbreitung von Computern in Ausbildung und Beruf begegnen uns statisti- sche Ausdrücke wie Trends, Mittelwerte, Häufigkeiten usw. täglich.
Der Begriff Statistik wird heute in mehreren Bedeutungen verwendet:
• synonym zum Begriff der amtlichen Statistik,
• als wissenschaftliche Disziplin,
• als praxisorientierte Methode zur Entscheidungshilfe.
Umgangssprachlich ist die Statistik die Lehre der Analyse von Massen- erscheinungen. Die Statistik wird methodisch gegliedert in deskriptive und induktive Statistik. Ziel der deskriptiven Statistik ist die Aufbereitung und grafische Darstellung von Daten und damit die Konzentration von Daten- mengen auf aussagefähige Maßzahlen und Plots. In der induktiven Statistik werden die notwendigen Verfahren zur statistischen Absicherung von Model- len und zur Prüfung von Hypothesen bereitgestellt.
Es gibt eine Vielzahl deutschsprachiger Bücher zur Statistik, wobei die Autoren unterschiedliche Schwerpunkte gesetzt haben- von der Darstellung spezifischer Lehrinhalte in ausgewählten Fachdisziplinen (Statistik für So- ziologen, Zahnmediziner, Mediziner etc.) bis hin zu ausgefeilten Methoden- sammlungen (Explorative Datenanalyse) oder erweiterten Handbüchern von Standard-Software.
Das vorliegende Buch soll insbesondere
• den Stoff der Vorlesung Statistik I in wesentlichen Teilen abdecken,
• eine Verbindung zwischen den Methoden der deskriptiven Statistik und ihrer Umsetzung mit Standard-Software, hier am Beispiel von SPSS, her- stellen,
• als Lehr- und Übungsmaterial durch Einschluß von Aufgaben mit Mu- sterlösungen die Ausbildung der Studenten unterstützen.
Der Lehrstoff zum Gebiet Induktive Statistik wird in einem weiteren Band behandelt (Toutenburg, 1999). Der Autor und seine Mitarbeiter haben sich bemüht, ihre Erfahrungen aus dem Lehr- und Übungsbetrieb so umzusetzen, daß der Text den Anforderungen eines begleitenden Lehr- und Übungsma- terials gerecht wird. Die Einbeziehung von SPSS soll eine Ergänzung zum
VI Vorwort
üblichen Taschenrechnereinsatz sein und den Weg zur modernen Arbeitswei- se bei der Datenanalyse mit dem Computer ebnen.
Der vorliegende Band stellt eine grundlegende Überarbeitung und Erwei- terung des Buches Deskriptive Statistik dar und entstand auf Einladung des Springer Verlags, Heidelberg. Wir danken Herrn Dr. Werner A. Müller für seine Unterstützung. Frau Dr. Christina Schneider, Frau Dr. Andrea Schöpp, Frau Dr. Angie Rösch, Herr Dr. Thomas Augustin, Herr Dr. Christian Heu- mann und Herr Dr. Erich-Otto Maschke haben durch zahlreiche kritische Hinweise die Gestaltung des Inhalts wesentlich unterstützt. Weiterhin dan- ken wir allen Tutoren, die bei der Gestaltung der Musterlösungen mitgewirkt haben. Frau cand. stat. Nina Lieske und Frau cand. stat. Angela Dörfler ha- ben das Manuskript in hervorragender Qualität hergestellt. Natürlich sind wir für alle enthaltenen Fehler selbst verantwortlich.
Helge Tautenburg
Inhaltsverzeichnis
Vorwort . . . V
1. Grundlagen... 1
1.1 Grundgesamtheit und Untersuchungseinheit... 1
1.2 Merkmal oder statistische Variable. . . 2
1.3 Datenerhebung . . . 7
1.4 Datenaufbereitung . . . 13
1.5 Aufgaben und Kontrollfragen . . . 18
2. Häufigkeitsverteilungen . . . 21
2.1 Absolute und relative Häufigkeiten. . . 21
2.2 Empirische Verteilungsfunktion. . . 25
2.3 Grafische Darstellung . . . 30
2.3.1 Stab- oder Balkendiagramme . . . 31
2.3.2 Kreisdiagramme. . . 32
2.3.3 Stamm-und-Blatt-Diagramme. . . 32
2.3.4 Histogramme . . . 35
2.3.5 Kerndichteschätzer . . . 36
2.4 Aufgaben und Kontrollfragen . . . 38
3. Maßzahlen für eindimensionale Merkmale . . . 43
3.1 Lagemaße . . . 43
3.1.1 Modus oder Modalwert . . . 44
3.1.2 Median und Quantile . . . 46
3.1.3 Quantil-Quantil-Diagramme (Q-Q-Plots) . . . 51
3.1.4 Arithmetisches Mittel.... . . 53
3.1.5 Geometrisches Mittel . . . 59
3.1.6 Harmonisches Mittel . . . 63
3.2 Streuungsmaße... 66
3.2.1 Spannweite und Quartilsabstand . . . 67
3.2.2 Mittlere absolute Abweichung vom Median . . . 68
3.2.3 Varianz und Standardabweichung. . . 69
3.2.4 Variationskoeffizient . . . 74
3.3 Schiefe und Wölbung . . . 75
VIII Inhaltsverzeichnis
3.3.1 Schiefe . . . 75
3.3.2 Wölbung . . . 76
3.4 Box-Plots . . . 77
3.5 Konzentrationsmaße . . . 78
3.5.1 Lorenzkurven... 80
3.5.2 Gini-Koeffizient . . . 81
3.6 Aufgaben und Kontrollfragen . . . 85
4. Maßzahlen für den Zusammenhangzweier Merkmale ... 91
4.1 Darstellung der Verteilung zweidimensionaler Merkmale . . . 91
4.1.1 Kontingenztafeln bei diskreten Merkmalen.. . . 91
4.1.2 Grafische Darstellung bei diskreten Merkmalen.... . . . 95
4.1.3 Maßzahlen zur Beschreibung der Verteilung bei steti- gen und gemischt stetig-diskreten Merkmalen . . . 97
4.1.4 Grafische Darstellung der Verteilung stetiger bzw. ge- mischt stetig-diskreter Merkmale . . . 99
4.2 Maßzahlen für den Zusammenhangzweier nominaler Merkmale101 4.2.1 Pearsons
x
2-Statistik ... 1034.2.2 Phi-Koeffizient ... 106
4.2.3 Kontingenzmaß von Crßmer ... 108
4.2.4 Kontingenzkoeffizient C ... 109
4.2.5 Lambda-Maße ... 110
4.2.6 Der Yule-Koeffizient ... 112
4.2.7 Der Odds-Ratio ... 114
4.3 Maßzahlen für den Zusammenhang ordinaler Merkmale ... 116
4.3.1 Gamma ... 117
4.3.2 Kendalls tau-b und Stuarts tau-e ... 119
4.3.3 Rangkorrelationskoeffizient von Spearman ... 120
4.4 Zusammenhang zwischen zwei stetigen Merkmalen ... 124
4.5 Aufgaben und Kontrollfragen ... 130
5. Zweidimensionale quantitative Merkmale: Lineare Regres- sion ... 135
5.1 Einleitung ... 135
5.2 Plots und Hypothesen ... 137
5.3 Prinzip der kleinsten Quadrate ... 139
5.3.1 Bestimmung der Schätzungen ... 141
5.3.2 Herleitung der Kleinste-Quadrate-Schätzungen ... 141
5.3.3 Eigenschaften der Regressionsgeraden ... 143
5.4 Güte der Anpassung ... 147
5.4.1 Varianzanalyse ... 147
5.4.2 Korrelation ... 150
5.5 Residualanalyse ... 155
5.6 Lineare Transformation der Originaldaten ... 155
5. 7 Multiple lineare Regression und nichtlineare Regression ... 157
Inhaltsverzeichnis IX
5.8 Polynomiale Regression ... 159
5.9 Lineare Regression mit kategorialen Regressaren ... 161
5.10 Spezielle nichtlineare Modelle- Wachstumskurven ... 165
5.11 Aufgaben und Kontrollfragen ... 165
6. Zeitreihen . . . 171
6.1 Kurvendiagramme ... 171
6.2 Zerlegung von Zeitreihen . . . 172
6.3 Fehlende Werte, äquidistante Zeitpunkte . . . 173
6.4 Gleitende Durchschnitte ... 173
6.5 Saisonale Komponente, konstante Saisonfigur . . . 175
6.6 Modell für den linearen Trend ... 179
6.7 Aufgaben und Kontrollfragen ... 181
7. Verhältniszahlen und Indizes ... 183
7.1 Einleitung ... 183
7.2 Einfache Indexzahlen ... 185
7.2.1 Veränderung des Basisjahres ... 186
7.3 Preisindizes ... 188
7.3.1 Preisindex nach Laspeyres ... 189
7.3.2 Preisindex nach Paasche ... 190
7.3.3 Alternative Preisindizes ... 191
7.4 Mengenindizes ... 191
7.4.1 Laspeyres-Mengenindex ... 192
7.4.2 Paasche-Mengenindex ... 192
7.5 Umsatzindizes (Wertindizes) ... 192
7.6 Verknüpfung von Indizes ... 193
7.7 Spezielle Probleme der Indexrechnung ... 195
7.7.1 Erweiterung des Warenkorbs ... 195
7.7.2 Substitution einer Ware ... 196
7.7.3 Subindizes ... 197
7.8 Standardisierung von Raten und Quoten ... 199
7.8.1 Datengestaltung für die Standardisierung von Raten .. 202
7.8.2 Indirekte Methode der Standardisierung ... 203
7.8.3 Direkte Standardisierung ... 206
7. 9 Ereignisanalyse. . . 209
7.9.1 Problemstellung ... 209
7.9.2 Grundbegriffe der Lebensdaueranalyse ... 212
7.9.3 Empirische Hazardrate und Überlebensrate ... 214
7.10 Aufgaben und Kontrollfragen ... 217
Lösungen zu den Übungsaufgaben ... 223
Sachverzeichnis . . . 283