• Keine Ergebnisse gefunden

Datengrundlage

Im Dokument Sabine Hübgen (Seite 122-125)

6 Analysestrategie, Daten, Messung und Samples

6.2 Datengrundlage

In diesem Unterkapitel werden die Datensätze vorgestellt, die im Rahmen der vorliegenden Arbeit Verwendung finden.

6.2.1 Das Sozio-oekonomische Panel

Die Analysen zu Deutschland basieren auf den Daten des Sozio-oekonomi-schen Panels (SOEP), einer jährlich wiederholten multidisziplinären Haus-halts- und Kohortenstudie (Wagner et al. 2007). Das SOEP ist 1984 mit einer repräsentativen Haushaltsstichprobe von ca. 4.500 Haushalten in Westdeutsch-land sowie weiteren 1.400 Haushalten mit nicht-deutschem Haushaltsvorstand gestartet. Im Zuge der Wiedervereinigung 1990 wurde das SOEP um ein Sample von ca. 1.400 Haushalten im Gebiet der ehemaligen DDR erweitert.

Neben weiteren inhaltlich motivierten Zusatzstichproben (Zuwanderungs-Sample (1994/ 1995), Hocheinkommensprivathaushalte (2002), Familien in Deutschland (2010), Migrations-Samples (2013-2015)) wird mit Hilfe von sukzessiven Auffrischungsstichproben die Repräsentativität der befragten

42 Eine Übersicht des Entropy-Balancing und der verwendeten Merkmale kann in den Ta-bellen A9.1-6 im Anhang von Kapitel 9 (Unterkapitel 9.5) eingesehen werden.

Haushalte über die Zeit aufrechterhalten. Im Jahr 2016 umfasste das SOEP rund 30.000 Personen in etwa 15.000 Haushalten.

Befragt werden alle ständigen Haushaltsmitglieder, die 17 Jahre und älter sind. Inhaltlich deckt das SOEP ein breites Spektrum von zeitkonstanten und sich über die Zeit verändernden individuellen und Haushaltsmerkmalen ab.

Zusätzlich werden retrospektiv biografische Daten der Befragten zu Erwerbs-tätigkeit, Partnerschaften und Geburten erhoben, um idealerweise den bisheri-gen Lebensverlauf der Befragten in zentralen Dimensionen abbilden zu kön-nen. Die biografischen Informationen sind für die vorliegende Arbeit von be-sonderer Bedeutung, da sie eine recht präzise zeitliche Feststellung des Über-gangs ins Alleinerziehen ermöglichen.

Weiterhin stellt das SOEP eine Vielzahl von Gewichtsvariablen zur Ver-fügung, die aufgrund der Komplexität der Studie von hoher Relevanz sind: In den Querschnittsgewichten wird für die Art des Erhebungsdesigns sowie für die Vielfalt der unterschiedlichen Stichproben korrigiert, sodass die Repräsen-tativität gewährleistet ist und Hochrechnungen auf Bevölkerungsebene mög-lich sind. Zudem wird mit den Längsschnittgewichten dafür korrigiert, dass es im Rahmen von Panelstudien zu ‚Attrition‘, also selektiven (temporären oder Komplett-)Ausfällen, kommt. Diese Längsschnittgewichte umfassen die in-verse Bleibewahrscheinlichkeit einer Person oder eines Haushaltes (Kroh 2010). Anhand dieser Variablen ergibt das Produkt aus dem Querschnittsge-wicht eines Jahres mit dem LängsschnittgeQuerschnittsge-wicht des Folgejahres das Quer-schnittsgewicht im Folgejahr.

Das SOEP ist für die empirische Untersuchung der zentralen Fragestellung aus folgenden Gründen in besonderem Maße geeignet: Erstens ist ein Panel-design mit mehreren Beobachtungszeitpunkten pro Befragten eine essentielle Voraussetzung, um Selektionsprozesse ins Alleinerziehen einerseits und intra-individuelle Armutsverläufe andererseits abzubilden. Zweitens muss ein mög-lichst langer historischer Beobachtungszeitraum gegeben sein, um auch zeitli-che Entwicklungen im Armutsrisiko alleinerziehender Mütter sowie den Ein-fluss des sich wandelnden institutionellen Kontexts auf das Armutsrisiko dar-stellen zu können. Drittens muss eine sehr große Stichprobe bzw. ein bewuss-tes Oversampling von Alleinerziehenden gegeben sein, damit überhaupt eini-germaßen belastbare Aussagen getroffen werden können.

Daher scheidet beispielsweise der Mikrozensus trotz deutlich höherer Fall-zahlen und einem längeren Beobachtungszeitraum als Datenbasis aus, da die-ser keine Panelstruktur aufweist und damit der intraindividuelle Verlauf unbe-rücksichtigt bleibt. Ebenso scheidet Pairfam43 als mögliche Datenbasis aus.

Zwar sind in diesem Beziehungs- und Familienpanel die Panelstruktur und eine sehr gute inhaltliche Passung gegeben. So erhebt Pairfam seit 2008/2009 (Welle1) jährliche Daten von ca. 12.000 Ankerpersonen in drei

Geburts-43 Pairfam: “Panel Analysis of Intimate Relationships and Family Dynamics” (Huinink et

kohorten (1971-73, 1981-83, 1991-93) sowie deren Partnern, Eltern und Kin-dern. Damit können zwar ähnlich wie im SOEP aufgrund der retrospektiv er-fassten Partnerschafts- sowie Fertilitätsverläufe Übergänge ins Alleinerziehen in ausreichender Anzahl identifiziert werden. Allerdings liegen die Einkom-mensdaten nur für die Erhebungsjahre vor. Somit können anhand von Pairfam weder Alleinerziehende in geeigneter Zahl44 für statistische Verfahren identi-fiziert noch der Wandel in sozialer Komposition und institutionellem Kontext abgebildet werden.

Da es in jedem empirischen Kapitel zusätzlich ein vergleichendes Unter-kapitel mit dem Vereinigten Königreich gibt, ist es darüber hinaus von Vorteil, wenn auf harmonisierte Daten für eine verbesserte Vergleichbarkeit zurückge-griffen werden kann. Auch dies ist beim SOEP der Fall, da es Teil des ‚Cross-National Equivalent File‘ (CNEF) ist (Wagner et al. 2007). Dies kommt in der vorliegenden Arbeit insbesondere bei der Definition der Altersgrenze von ‚ab-hängigen‘ Kindern sowie von Einkommen zum Tragen.

6.2.2 Die British Household Panel Study

und die UK Household Longitudinal Study

Die empirischen Analysen für das Vereinigten Königreichs stützen sich auf zwei verschiedene, eng verbundene Datensätze, die auch im CNEF vertreten sind: die British Household Panel Study (BHPS) und die UK Household Lon-gitudinal Study (UKHLS). Die beiden Datensätze sind wie das SOEP als zent-rale Haushaltspanelstudien anzusehen, in denen jährlich eine Vielzahl an so-zio-demografischen und biografischen Informationen abgefragt wird. Dabei folgen das BHPS und das UKHLS zeitlich aufeinander: Das BHPS wurde zwi-schen 1991 und 2008 erhoben (18 Wellen), während das UKHLS seit 2009 Daten erhebt. Damit umfassen die Informationen für das Vereinigte König-reich den Zeitraum von 1991 bis 2014.

Das BHPS wurde als jährlich wiederholte Haushaltsbefragung konzipiert, in der alle erwachsenen Personen (16+) eines Haushalts interviewt werden. Die Erstbefragung startete mit rund 5.000 repräsentativen Haushalten und annä-hernd 10.000 Befragten (Taylor et al. 2010) . Im Jahr 1999 wurden die regio-nalen Subsamples von Wales und Schottland um jeweils 1.500 Haushalte er-weitert und 2001 wurden erstmalig 2.000 Haushalte aus Nordirland hinzuge-fügt, um auch Analysen auf regionaler Ebene im gesamten Vereinigten König-reich zu ermöglichen. Das UKHLS befragt seit 2009 40.000 repräsentativ ge-zogene Haushalte aus dem gesamten Vereinigten Königreich. Diese stammen aus vier verschiedenen Ursprungssamples: dem General Population Sample,

44 Die Analysen von Dechant et al. (2015) zu Trennung von Ehe und NEL basieren auf 169 Müttern in Pairfam, von denen es nur für 80 Angaben zur Veränderung im Ein-kommen nach der Trennung gibt.

dem Ethnic Minority Boost Sample, dem alten BHPS45 Sample sowie dem Im-migrant and Ethnic Minority Boost Sample. Viele der Variablen sind im UKHLS entweder identisch oder ähnlich definiert, sodass grundsätzlich eine sehr gute Vergleichbarkeit gewährleistet ist. Abweichende Definitionen von UKHLS und BHPS werden im nachfolgenden Abschnitt zur Messung der the-oretischen Konstrukte dargestellt.

Die Datensatzstruktur der beiden Panelstudien ähnelt der des SOEP: Jede Welle umfasst mehrere Datensätze auf der Individual- und Haushaltsebene mit zeitveränderlichen Informationen (Einkommen, Partnerschaftsstatus, Lebens-zufriedenheit, etc.), einem Grunddatensatz mit zeitkonstanten Informationen (Geburtsjahr, Migrationshintergrund, etc.) sowie verschiedene retrospektiv ab-gefragte Biografiedatensätze (Partnerschaften, Fertilität und Erwerbstätigkeit).

In beiden Datensätzen werden auch Querschnitts- und Längsschnittgewichte bereitgestellt, die in den folgenden Analysen verwendet werden.

Allerdings wurden leider die CNEF-Variablen in den beiden britischen Datensätzen nicht so konsequent erhoben wie im SOEP. Dies schlägt sich zum einen darin nieder, dass es viel mehr Missings gibt. Im BHPS wurden für die Jahre 2007 und 2008 beispielsweise gar keine CNEF-Variablen bereitgestellt.

Zum anderen fehlen im UKHLS zentrale Variablen, um verschiedene Einkom-mensquellen des Haushaltseinkommens zu identifizieren. Aus diesem Grund kann in Kapitel 8 lediglich der Ländervergleich der wohlfahrtsstaatlichen Ar-mutsreduktion untersucht werden, während für Deutschland zusätzlich die ge-nauere Einkommenszusammensetzung betrachtet werden kann.

Im Dokument Sabine Hübgen (Seite 122-125)