Besondere Aspekte bei Lohnschätzungen mit Panel-

3.1 Vorüberlegungen zu den Schätzungen

3.1.1 Aspekte der Modellspezifikation

3.1.1.2 Besondere Aspekte bei Lohnschätzungen mit Panel-

Für die angestrebten Panelschätzungen lässt sich die weiter oben genannte Nota-tion (11) des ökonometrischen Modells konkreter als ein lineares multiples Re-gressionsmodell folgender Form fassen:¹⁶¹

(12) (für i=1, 2,…, N; t=1, 2,…, T)

159 Vgl. von Auer (2007), S. 482.

160 Vgl. von Auer (2007), S. 482.

161 Die folgende Notation ist angelehnt an die Darstellung in Licht/Steiner (1991b), S. 4.

mit

= realer Bruttostundenlohn der Person i zum Zeitpunkt t,

= Konstante (,Grand Mean‘, Niveauparameter),

= unbeobachtete individuelle Effekte,

=inverseMill’s Ratio

= Set von m Schul- und Berufsausbildungsvariablen,

= Set von n Erwerbserfahrungsvariablen, = Set von k Kontrollvariablen,

εit = Störterm,

, = zu schätzende Steigungsparameter.

Der reale Bruttostundenlohn des Individuums i zum Zeitpunkt t, wit, ist eine Funktion seiner (zeitinvarianten) Schulbildung, seiner Erwerbserfahrung zum Zeitpunkt t sowie der Ausprägungen verschiedener Kontrollvariablen. stellen unbeobachtbare, aber lohnrelevante und mit den erklärenden Variablen mögli-cherweise korrelierte Eigenschaften der Personen im Datensatz (beispielsweise Arbeitsmarktnähe oder nicht messbare Fähigkeiten) dar. Mit wird die Inverse der Mill’s Ratio, die aus einer Probit-Schätzung der Beschäftigungsgleichung ge-wonnen wird, bezeichnet. Die Problematik der Selbstselektionsverzerrung ist zwar kein panelspezifisches Problem (weiter unten werden auch Kleinst-Quadrate-Schätzungen mit Selektionskorrektur durchgeführt); dennoch wird der Selekti-onskorrektur-Term bereits an dieser Stelle in die Schätzgleichung des Panelmo-dells aufgenommen, um zur adäquaten MoPanelmo-dellspezifikation für die weiter unten – ausschließlich mit Selektionskorrektur durchgeführten – Panelschätzungen zu gelangen. Für die Simulation von Lohnprofilen in Abhängigkeit idealtypischer Ausprägungen der Regressoren kommt es auf eine konsistente und effiziente Schätzung der Steigungsparameter an.

Unbeobachtete Populationsheterogenität

Während reine Querschnittsdaten nur interpersonell variieren, kommt bei Panel-daten die intrapersonelle Variation hinzu: Innerhalb ein- und derselben Person können beobachtete Löhne, Erwerbsstatus, Berufserfahrung, Kinderzahl etc. von Jahr zu Jahr variieren. Angesichts der Beobachtungszahl von 6.276 Beobachtun-gen, die sich über einen vergleichsweise kurzen Zeitraum von fünf Jahren (2001-2005) erstrecken, ergibt sich zusätzlich eine hohe interpersonelle Variation in den Daten. Die interessierenden Lohnunterschiede sind daher auf Unterschiede in beobachtbaren Merkmalen wie Schulbildung, aber auch auf Unterschiede in unbe-obachteten Merkmalen wie Intelligenz, Präferenz für Erwerbsarbeit etc. (Indivi-dualeffekte ) zurückzuführen. Entscheidend ist, ob diese unbeobachtbaren Einflussfaktoren als über die Zeit konstant oder als über die Zeit variierend

ange-sehen werden. Im Fall von als konstant angenommenen αi ergibt sich ein Dummy-variablen (Fixed-Effects-), im anderen Fall ein Fehlerkomponenten-Modell. Auf beide Modelltypen soll im Folgenden etwas näher eingegangen werden.

Eine einfache, gepoolte Kleinst-Quadrate-Schätzung (im Folgenden als OLS-Schätzung¹⁶² bezeichnet) ignoriert den Panelcharakter der Daten und behandelt diese als Querschnittsdaten, indem die gesamte Variation in den Daten als inter-personelle Variation eingestuft wird. Panelmodelle unterscheiden dagegen zwischen intra- und interpersoneller Variation. Um die (Lohneinflüsse der) Populations-heterogenität zu kontrollieren, kann für jede Person im Datensatz ein eigener Dummy in die Kleinst-Quadrate-Schätzung aufgenommen werden (Fixed-Effects-Modell). Die ökonometrische Umsetzbarkeit eines solchen Modells stößt bei großen Datensätzen wie dem vorliegenden jedoch an Grenzen, nämlich den Verlust an Freiheitsgraden und potenzielle Multikollinearität. Bekanntermaßen lassen sich die festen Effekte zur Schätzung von aus der Schätzgleichung entfernen, indem pro Person und Variable die individuellen Mittelwerte über die Zeit von den aktuel-len Ausprägungen subtrahiert werden.¹⁶³ Eine solche Schätzung wird als „Within-Transformation“ bezeichnet. Sie bündelt alle zeitinvarianten interpersonellen Un-terschiede, in die auch die unbeobachtbaren Merkmale einfließen, in der Feste Ef-fekte-Variable und schätzt auf dieser Basis den Einfluss zeitvarianter Faktoren auf die (zeitvariante) endogene Lohn-Variable.¹⁶⁴ Fixed-Effects-Modelle haben den Vorteil, dass die Koeffizienten dieser zeitvarianten Regressoren (Within-Schätzer) nicht auf Grund fehlender Berücksichtigung verdeckter, zeitinvarianter Einfluss-faktoren verzerrt sein können. Andererseits werden durch die Within-Trans-formation alle zeitinvarianten Regressoren eliminiert, auch die für das humankapi-taltheoretische Modell zentralen Schul- und Berufsausbildungsvariablen. Daher ist das Fixed-Effects-Modell für den vorliegenden Untersuchungszusammenhang nur bedingt geeignet.

Hilfsweise bietet sich ein Verfahren zur nachträglichen Schätzung der festen Effekte an, um die Informationen zum Lohneinfluss der zeitinvarianten Variab-len auszuschöpfen: Die festen Effekte können geschätzt werden als

i = ^. ∑ ̂it.

Allerdings ist dieser Schätzer nur für einen hinreichend großen Zeitraum T – nicht für einen Fünf-Jahres-Zeitraum – konsistent. In einem zweiten Schritt können die Parameter der zeitinvarianten Ausbildungsvariablen durch Regression der i

162 (OLS = Ordinary Least Squares)

163 Siehe beispielsweise Hsiao (1986), hier zitiert nach Licht/Steiner (1991b), S. 6.

164 Die Stata 7.0-Syntax zum Fixed-Effects-Modell ist „xtreg depvar varlist, fe“.

(Endogene)auf eben diese Variablen geschätzt werden. Diese Hilfsregression ist zwar im Hinblick auf die fehlende Konsistenz des Schätzers für die Endogene als problematisch einzustufen; gleichwohl wurde sie durchgeführt, da das Random Effects-Modell, wie weiter unten noch dargestellt wird, seine eigene Problematik hat.

Die unbeobachteten Einflussfaktoren, die mit anderen exogenen Variablen des Modells korreliert sind, können die erklärenden Variablen im Modell entweder in immer gleicher oder in über die Zeit unterschiedlicher Weise beeinflussen.

Das heißt, die Residuen der Lohnschätzungen für Person i sind in jedem Fall miteinander korreliert: Eine Person, die bei ihrer ersten Beobachtung ein hohes positives Residuum besitzt, besitzt dieses wahrscheinlich auch bei ihrer zweiten, dritten Beobachtung etc. Bei Paneldaten kann man in der Regel von korrelierten Fehlern ausgehen. Für Fixed-Effects-Modelle ist die Spezifikation der Fehler-struktur nicht notwendig, aber für Fehlerkomponenten-Modelle ist sie zwingend.

Fehlerkomponenten-Modelle machen die unbeobachtbaren zwischenmenschli-chen Unterschiede im Modell selbst sichtbar, indem spezielle Annahmen über die Korrelation der Residuen (mittels Spezifizierung der Fehlerkorrelationsmat-rix) getroffen werden.¹⁶⁵ So kann mittels eines Random-Effects-Modells schlicht angenommen werden, dass die Beobachtungen ein und derselben Person über die Zeit einander stärker ähneln als es die Beobachtungen unterschiedlicher Perso-nen tun (etwa, weil sich die Intelligenz einer Person im Zeitablauf kaum verän-dert), ohne genaue Annahmen über die intertemporale Struktur der Residuen zu treffen.¹⁶⁶ Will man dagegen Letzteres tun, kann man die Fehlerkorrelation ex-plizit spezifizieren, beispielsweise durch die Annahme, dass sich die Residuen von Beobachtungen, die in engem zeitlichen Abstand zueinander erfolgen, einan-der stärker ähneln als Residuen von Beobachtungen mit hohem zeitlichen Abstand zueinander (Random-Effects-Modell mit Autokorrelation, z. B. der Form AR(1)).¹⁶⁷ Der Vorteil der Fehlerkomponenten-Modelle liegt darin, dass die Koeffizienten der Regressoren auf Basis der intra- sowie interpersonellen Unterschiede in den Daten berechnet werden, mithin also auch der Lohneinfluss zeitinvarianter erklä-render Variablen wie Schul- oder Berufsausbildung geschätzt werden kann. Bei richtiger Spezifikation der Fehlerkorrelation resultieren präzisere Parameter-schätzungen als im Fixed-Effects-Modell. Bei falscher Spezifikation hingegen –

165 Die Stata 7.0-Syntax für VCM-Modelle ist „xtgee depvar varlist, corr ( )“.

166 Die Stata 7.0-Syntax zum Random Effects-Modell lautet „xtreg depvar varlist, re oder oder

„xtgee, corr(exchangeable)“.

167 Hierbei hängt die Störgröße in Periode t von ihrem Wert in der Vorperiode t-1 ab; vgl. hierzu die Ausführungen zur Annahme B3 weiter oben. Die Stata-Syntax zur Spezifizierung einer One-Period-Lagged Correlation ist „xtgee depvar varlist, corr (ar1)“. Die Korrelationsmatrix kann nach Eingabe des Regressionsbefehls über „xtcorr“ angezeigt werden.

wenn also die unbeobachteten Individualeffekte mit den erklärenden Variablen des Modells korrelieren – sind die Parameterschätzer jedoch inkonsistent.¹⁶⁸ Potentielle Endogenität

Ein anders gelagertes Problem entsteht, wenn die Richtung der Kausalbeziehung zwischen Lohn und Erwerbserfahrungsvariablen theoretisch unklar ist. Beein-flusst nicht nur die Erwerbsbiografie den erzielbaren Lohnsatz, sondern ist erstere umgekehrt seitens des (antizipierten) Lohnsatzes prädeterminiert, korrelieren die als exogen angesehenen Variablen der Lohngleichung mit der Störgröße, d. h.

Annahme C1 ist verletzt.

Im Hinblick auf die bereits diskutierten Schwächen von Instrumentvariablen-Modellen wird auf die Schätzung solcher Modelle in dieser Untersuchung verzichtet.

Für die Erwerbserfahrungsvariablen des vorliegenden Datensatzes geeignete, außer-halb der bereits konstruierten Variablen liegende Instrumentvariablen zu finden, erscheint ohnehin angesichts der Gliederungstiefe dieser Variablen nicht möglich.

Im Dokument Peter Lang (Seite 97-101)