Fixed Effects Modell - Analyse von Längsschnittdaten mit fehlenden Werten: Grundlagen, Verfahre

3.2.1 Modellspezifikation und Least-Squares-Sch¨atzer Liegen pro Einheit mehrere Messungen vor, dann ist im Allgemeinen davon auszugehen, dass die Responsevariablen ¨uber die t= 1, . . . , T Messungen, gegeben die linearen Pr¨adiktoren, nicht unabh¨angig voneinander sind. Ei-ne M¨oglichkeit solche Abh¨angigkeiten zu modellieren besteht darin, von individuellen, zeitlich stabilen aber unbeobachtbaren Effekten auszugehen.

Bei Personen k¨onnen diese f¨ur bestimmte Neigungen oder Dispositionen, bei Firmen f¨ur eine bestimmte Firmenpolitik oder einen firmeneigenen Stil stehen.

Die Annahme der unbeobachtbaren individuellen Effekte als feste Gr¨oßen (”fixed effects“) f¨uhrt zu einem Fixed Effects Modell (z.B. Baltagi, 2001;

Hsiao, 2003; Judge, Griffiths, Hill, L¨utkepohl und Lee, 1985; Verbeek, 2000;

Wooldridge, 2002). Dazu wird das Modell in der Fehlervariablen ǫ_nt = πn +νnt formuliert, mit πn dem unbeobachtbaren festen Effekt, nun als unbekannter Parameter betrachtet, und ν_nt einer zuf¨alligen Fehlerkompo-nente mit ν_nt∼N(0, σ_ν²) unabh¨angig ¨uber allenundt. In Verbindung mit dem Modell

y_nt =x^′_ntβ+ǫ_nt, n= 1, . . . , N, t= 1, . . . , T, erh¨alt man

y_n=X_nβ+1_Tπ_n+ν_n, n= 1, . . . , N, mitν_n∼N(0, σ_ν²I_T).

Allerdings sind nicht alle Parameter α, β₁, . . . , β_P und π₁, . . . , π_N iden-tifizierbar. Dies ist leicht zu sehen, wenn man das Modell f¨ur alleN T Beob-achtungen anschreibt. MitD=I_N⊗1_T,π= (π₁, . . . , π_N)^′, der um den Ein-servektor verkleinerten DatenmatrixX^∗ = (x^∗₁₁, . . . ,x^∗_1T, . . . ,x^∗_N₁, . . . ,x^∗_{N T})^′

undβ^∗= (β1, . . . , βP)^′ erh¨alt man

y=1_{N T}α+Dπ+X^∗β^∗+ν, ν ∼N(0, σ²_νI_{N T}).

Aus dieser Darstellung wird deutlich, dass das Modell in dieser Form nicht identifiziert ist, denn1_{N T} l¨asst sich als lineare Funktion, n¨amlich der Sum-me der Spalten vonDdarstellen. Dies ¨andert sich, wenn man die Parameter α und π einer geeigneten Restriktion unterwirft. M¨ogliche Restriktionen sind die symmetrische Restriktion mit PN

n=1π_n = 0 oder die asymme-trische Restriktion mit πn = 0 f¨ur beliebiges n. Eine andere Restriktion setztα= 0. Im Folgenden bezeichneD^∗ eine (N T ×N) Matrix bestehend aus Dummy-Variablen, die die jeweils gew¨ahlte Restriktion realisieren und π^∗ den entsprechenden N dimensionalen (restringierten) Parametervektor mit, je nach Restriktion, den Elementenα^∗, π^∗₁, . . . , π^∗_N−1 beziehungsweise π^∗₁, . . . , π_N^∗. Welche dieser Restriktionen auch immer gew¨ahlt wird, sie be-einflusst nicht die Sch¨atzung des Parameters β^∗ (siehe Anhang B.1). Mit den Komponenten D^∗ und π^∗ l¨asst sich das Fixed Effects Modell nun an-schreiben als

y=D^∗π^∗+X^∗β^∗+ν, ν ∼N(0, σ_ν²I_{N T}). (3.7) Trotz geeigneter Restriktion bez¨uglich der Parameter α und π ergibt sich dasselbe Problem der linearen Abh¨angigkeit wenn zus¨atzlich zeitin-variante Einflussgr¨oßen, wie etwa das Merkmal Geschlecht, in das Modell aufgenommen werden. Auch in diesem Fall lassen sich diese Einflussgr¨oßen als Linearkombination der Spalten der MatrixD^∗darstellen, weshalb zeitin-variante Einflussgr¨oßen nicht in Modell (3.7) ber¨ucksichtigt werden k¨onnen.

Als M¨oglichkeit zur Sch¨atzung des Modells (3.7) liegt wegen der Un-abh¨angigkeit der Fehlervariablenν_ntdieOrdinary-Least Squares-oder OLS-Methode (gew¨ohnliche Kleinst-Quadrate-Methode) nahe, wobei neben β^∗ auch die Parameter π^∗ als Regressionsparameter aufgefasst werden. Der LS-Sch¨atzer ist jener Wert f¨urθ, der die Funktion

q(θ) = (y−Zθ)^′(y−Zθ),

mit Z = (D^∗ X^∗) und θ = (π^∗′,β^∗′)^′, minimiert. Ableiten nach θ und Nullsetzen der ersten Ableitung f¨uhrt zu dem OLS-Sch¨atzer

θˆ= (Z^′Z)⁻¹Z^′y. (3.8) Als Sch¨atzer f¨urσ_ν² verwendet man mit ˆy=Zθˆ

σ_ν² = (N T −N −P)⁻¹(y−y)ˆ ^′(y−y)ˆ

= (N T −N −P)⁻¹Q_e. (3.9)

3.2.2 Eigenschaften des OLS-Sch¨atzers

Unter den Annahmen E(ν) = 0 und Cov(ν) = σ²_νI_{N T} ist der auch als ”Least-Squares-Dummy-Variable“-Sch¨atzer (LSDV-Sch¨atzer) bezeich-nete Sch¨atzer ˆθ erwartungstreu, das heißt E(ˆθ) = θ₀, mit einer Kovari-anzmatrix, die mitCov(ˆd β) = ˆσ²_ν(Z^′Z)⁻¹ gesch¨atzt werden kann. Weiterhin ist er bester linearer unverzerrter Sch¨atzer (BLUE), das heißt, unter allen erwartungstreuen linearen Sch¨atzern der Form ˜θ=Aybesitztc^′θˆf¨ur jeden reellen Vektor c die kleinste Varianz. Auch der Sch¨atzer ˆσ²_ν ist unverzerrt (E(ˆσ_ν²) =σ²_ν,0).

Wegen der zus¨atzlichen Annahme, dassν normalverteilt ist, erh¨alt man, bei Geltung der Annahmen, eine Reihe weiterer Aussagen, die f¨ur die Kon-struktion von Tests und Konfidenzintervallen wichtig sind (z.B. Fahrmeir, Kaufmann und Kredler, 1996). Einerseits ist in diesem Fall der OLS-Sch¨atzer mit dem ML-Sch¨atzer des Modells (3.7) identisch. Andererseits gilt ˆθ ∼ N(θ₀, σ²_ν,0(Z^′Z)⁻¹) und ˆθ ist unabh¨angig von ˆσ_ν². Dar¨uber hinaus ist der Sch¨atzer ˆθbester unverzerrter Sch¨atzer, das heißt besser als alle anderen li-nearen und nichtlili-nearen unverzerrten Sch¨atzer. F¨ur weitere Eigenschaften siehe etwa (Fahrmeir, Kaufmann und Kredler, 1996, S. 99 ff.).

Der ˆβ^∗-Teil des LSDV-Sch¨atzers ˆθ ist nicht nur erwartungstreu son-dern, f¨ur T → ∞ oder N → ∞ auch (zumindest schwach) konsistent⁶ (siehe Anhang A.5). Der π^∗-Teil ist lediglich f¨ur T → ∞ konsistent, eine

6Im Allgemeinen reicht f¨ur praktische Anwendungen die schwache Konsistenz aus.

Daher soll durchweg mit Konsistenz die schwache Konsistenz gemeint sein.

in L¨angsschnittuntersuchungen eher seltene Situation (z.B. Baltagi, 2001;

Hsiao, 2003; Verbeek, 2000; Wooldridge, 2002).

3.2.3 Alternative Darstellung des OLS-Sch¨atzers

Zur Bestimmung des OLS-Sch¨atzers (3.8) ist allerdings mit Z= (D^∗ X^∗) eine (N+P)×(N+P) Matrix zu invertieren, was insbesondere f¨ur großes N technische Probleme bereitet. Betrachtet man aber (3.8) genauer, zeigt sich (siehe Anhang B.1), dass ˆβ^∗ unabh¨angig von ˆπ^∗ einfacher berechnet werden kann und zwar mit

βˆ^∗ = XN n=1

XT t=1

(x^∗_nt−x¯^∗_n)(x^∗_nt−x¯^∗_n)^′

!−1XN

n=1

XT t=1

(x^∗_nt−x¯^∗_n)(y_nt−y¯_n)^′. (3.10) Diesen Sch¨atzer erh¨alt man direkt, wenn man das transformierte Modell,

y_nt−y¯_n= (x^∗_nt−x¯^∗_n)^′β^∗+ (ν_nt−ν¯_n), (3.11) mit ¯yn = T⁻¹PT

t=1ynt, ¯xn = T⁻¹PT

t=1xnt und ¯νn = T⁻¹PT

t=1νnt, aus dem die Komponentenπ_ndurch die Bildung der Differenzen vom jeweiligen individuellen Mittel ¨uber die Zeit herausfallen, betrachtet. Zur Berechnung von ˆβ^∗ nach (3.10) ist dann nur noch eine (P×P) Matrix zu invertieren.

Auch der Sch¨atzer ˆπ^∗ l¨asst sich alternativ, je nach gew¨ahlter Restrikti-on, aber als Funktion von ˆβ^∗ darstellen (siehe Anhang B.1). Zum Beispiel erh¨alt man unter der RestriktionπN = 0

ˆ π^∗ =







¯ y_N

¯ y1−y¯N

...

yN−1−y¯N





−







¯ x^∗′_N x¯^∗′₁ −x¯^∗′_N

...

¯x^∗′_N₋₁−x¯^∗′_N





βˆ^∗.

Mit ¯x^∗ = (N T)⁻¹PN n=1

t=1x^∗_nt und ¯y = (N T)⁻¹PN n=1

t=1y_nt ergibt

sich unter der RestriktionPN

n=1πn= 0

ˆ π^∗ =





 ˆ α^∗ ˆ π^∗₁

... ˆ π_N^∗₋₁





=







¯ y

¯ y₁−y¯

...

y_N₋₁−y¯













¯ x^∗′

x^∗′₁ −x¯^∗′

...

x^∗′_N₋₁−x¯^∗′





βˆ^∗.

Als Sch¨atzer f¨ur die Residualvarianz erh¨alt man mit ˆy=D^∗πˆ^∗+X^∗βˆ^∗ auch in diesem Fall (3.9). Dies ist insbesondere dann zu beachten, wenn ausgehend vom transformierten Modell (3.11), ˆβ^∗ nach (3.10) mit Hilfe ei-nes Programms zur Berechnung des OLS-Sch¨atzers bestimmt wird. In die-sem Fall wird im Allgemeinen bei der Sch¨atzung von σ²_ν von (N T −P) Freiheitsgraden ausgegangen. Der entsprechende Sch¨atzer ist daher mit (N T −P)/(N T −N −P) zu multiplizieren. Als Sch¨atzer f¨ur die Kova-rianzmatrix von ˆβ^∗ l¨asst sich

Cov(ˆd β^∗) = ˆσ_ν² XN n=1

XT t=1

(x^∗_nt−¯x^∗_n)(x^∗_nt−¯x^∗_n)^′

!−1

(3.12) verwenden, eine mit der entsprechenden Teilmatrix der gesch¨atzten Kova-rianzmatrix von ˆθ^∗ identischen Matrix.

3.2.4 Tests

Neben Tests auf einzelne Parameterwerte oder anderer linearer Hypothesen ist h¨aufig ein simultaner Test, dass alle Parameter π^∗₁, . . . , π_N^∗ gleich Null sind von Interesse. Diese, sowie eine ganze Reihe weiterer linearer Hypo-thesen bez¨uglich der Parameter, lassen sich als Spezialfall der allgemeinen linearen Hypothese

H₀ :Cθ=ξ, H₁ :Cθ 6=ξ,

mit C einer (S×(N +P)) dimensionalen Matrix mit vollem Zeilenrang, auffassen (z.B. Fahrmeir, Kaufmann und Kredler, 1996, S. 110 ff.). Die

entsprechende, unter H0 F-verteilte Pr¨uf- oder Testgr¨oße ist

F = Q/S

Q_e/(N T −N −P) ∼F(S, N T −N −P), mit Q = (Cθˆ−ξ)^′(C(Z^′Z)⁻¹C^′)⁻¹(Cθˆ−ξ).

Soll ¨ubepr¨uft werden, ob die individuellen Effekte einen statistisch re-levanten Erkl¨arungswert besitzen, dann f¨uhrt dies f¨ur die Restriktionen PN

n=1π_n = 0 und π_N = 0 nach Umsortieren des Vektors π^∗ zu ˜π^∗ = (π₁^∗, . . . , π^∗_N−1, α^∗)^′ mit C = (IN−1 0_(N_−1)×(P₊₁₎) zu folgendem Testpro-blem

H₀:C π˜^∗

β^∗

=0, H₀:C π˜^∗

β^∗

=0 und unter H₀ zur F-verteilten Pr¨ufgr¨oße

F = Q/(N−1)

Q_e/(N T −N −P) ∼F(N−1, N T −N −P)

mit Q = Q₀ −Q_e, Q₀ = (y−y)ˇ ^′(y−y) und ˇˇ y = 1αˆ^∗ +X^∗βˆ^∗. Unter der Restriktion α = 0 ist die Matrix Cso zu bilden, dass alle N −1 Dif-ferenzen der N Effekte auf Null getestet werden. Einen solchen Test auf die statistische Bedeutsamkeit der festen, unbeobachtbaren Effekte sollte durchgef¨uhrt werden, bevor man sich entscheidet individuelle feste Effek-te nicht in die Modellgleichung aufzunehmen, denn das Ignorieren stati-stisch relevanter individueller fester Effekte f¨uhrt zu verzerrten und inkon-sistenten Sch¨atzern f¨ur die Regressionsparameter β^∗. F¨ur weitere Tests, die Konstruktion von Konfidenzintervallen, Punkt- und Bereichsprognosen oder M¨oglichkeiten zur Modell¨uberpr¨ufung siehe etwa Fahrmeir, Kaufmann und Kredler (1996, S. 108 ff.).

3.2.5 Erg¨anzungen

Im Allgemeinen stehtβ^∗ im Mittelpunkt des Interesses. Daher sollen einige Anmerkungen zu ˆβ^∗ folgen. Eine M¨oglichkeit der Fehlspezifikation besteht in der Annahme der linearen Unabh¨angigkeit der Fehlervariablenν_nt, wenn

nicht auszuschließen ist, dass diese ¨uber die Messpunkte korreliert sind. Ist die Annahme unkorrelierter Fehler falsch, dann ist, unter relativ schwachen Bedingungen, der Sch¨atzer ˆβ^∗zwar immer noch erwartungstreu, konsistent und asymptotisch normalverteilt, aber mit einer anderen asymptotischen Kovarianzmatrix (z.B. White, 1982). Diese kann, ausgehend vom transfor-mierten Modell (3.11), gesch¨atzt werden mit

Cov(ˆd β^∗) = XN n=1

Xe^′_nXe_n

!−1 XN

n=1

Xe^′_nue_nue^′_nXe_n

! _N X

n=1

Xe^′_nXe_n

!−1

wobeiXen= (x^∗_n1−x¯^∗_n, . . . ,x^∗_nT−x¯^∗_n)^′ undeun= (yn1−y¯n, . . . , ynT −y¯n)^′− Xe_nβˆ^∗. Ein ¨ahnliches Ergebnis erh¨alt man, wenn die Annahme gleicher Va-rianzen der Fehlervariable (Homoskedastizit¨at) falsch ist, also Heteroske-dastizit¨at nicht auszuschließen ist (White, 1980). Sind die Fehlervariablen unabh¨angig und identisch aber nicht normalverteilt, dann ist ˆβ^∗ unter recht schwachen Bedingungen immer noch konsistent und asymptotisch normal-verteilt⁷ (z.B. Fahrmeir, Kaufmann und Kredler, 1996, S. 101). Die Kova-rianzmatrix kann auch in diesem Fall mit (3.12) gesch¨atzt werden.

Bei der Einf¨uhrung und Diskussion des Fixed Effects Modells wurden die individuellen, nicht beobachtbaren Effekte als feste Parameter aufge-fasst. Dies ist nicht zwingend notwendig. Insbesondere die Ergebnisse in Abschnitt 3.2.3 machen deutlich, dass unter Geltung der Annahmen eine Inferenz bez¨uglich β^∗ nicht davon abh¨angt ob es sich beiπn um feste oder zuf¨allige Gr¨oßen handelt, denn alle zeitinvarianten Merkmale werden durch die Transformation eliminiert.

Das in diesem Abschnitt behandelte Fixed Effects Modell kann um einen zus¨atzlichen festen Effekt erweitert werden, der invariant ¨uber die Einheiten n = 1, . . . , N aber variabel ¨uber die Messpunkte t = 1, . . . , T ist. Dieser Effekt modelliert etwa Zeiteffekte, die an jedem Zeitpunkt unterschiedlich aber f¨ur alle Einheiten identisch wirken (z.B. Baltagi, 2001; Hsiao, 2003).

Vorgehen und Ergebnisse im Modell mit zwei festen Effekten sind ¨ahnlich wie im einfachen Fixed Effects Modell.

7Wenn nicht anders angegeben, dann wird im Folgenden von festem T undN → ∞ ausgegangen.

Im Dokument Analyse von Längsschnittdaten mit fehlenden Werten: Grundlagen, Verfahren und Anwendungen. (Seite 88-95)