3.2.1 Modellspezifikation und Least-Squares-Sch¨atzer Liegen pro Einheit mehrere Messungen vor, dann ist im Allgemeinen davon auszugehen, dass die Responsevariablen ¨uber die t= 1, . . . , T Messungen, gegeben die linearen Pr¨adiktoren, nicht unabh¨angig voneinander sind. Ei-ne M¨oglichkeit solche Abh¨angigkeiten zu modellieren besteht darin, von individuellen, zeitlich stabilen aber unbeobachtbaren Effekten auszugehen.
Bei Personen k¨onnen diese f¨ur bestimmte Neigungen oder Dispositionen, bei Firmen f¨ur eine bestimmte Firmenpolitik oder einen firmeneigenen Stil stehen.
Die Annahme der unbeobachtbaren individuellen Effekte als feste Gr¨oßen (”fixed effects“) f¨uhrt zu einem Fixed Effects Modell (z.B. Baltagi, 2001;
Hsiao, 2003; Judge, Griffiths, Hill, L¨utkepohl und Lee, 1985; Verbeek, 2000;
Wooldridge, 2002). Dazu wird das Modell in der Fehlervariablen ǫnt = πn +νnt formuliert, mit πn dem unbeobachtbaren festen Effekt, nun als unbekannter Parameter betrachtet, und νnt einer zuf¨alligen Fehlerkompo-nente mit νnt∼N(0, σν2) unabh¨angig ¨uber allenundt. In Verbindung mit dem Modell
ynt =x′ntβ+ǫnt, n= 1, . . . , N, t= 1, . . . , T, erh¨alt man
yn=Xnβ+1Tπn+νn, n= 1, . . . , N, mitνn∼N(0, σν2IT).
Allerdings sind nicht alle Parameter α, β1, . . . , βP und π1, . . . , πN iden-tifizierbar. Dies ist leicht zu sehen, wenn man das Modell f¨ur alleN T Beob-achtungen anschreibt. MitD=IN⊗1T,π= (π1, . . . , πN)′, der um den Ein-servektor verkleinerten DatenmatrixX∗ = (x∗11, . . . ,x∗1T, . . . ,x∗N1, . . . ,x∗N T)′
undβ∗= (β1, . . . , βP)′ erh¨alt man
y=1N Tα+Dπ+X∗β∗+ν, ν ∼N(0, σ2νIN T).
Aus dieser Darstellung wird deutlich, dass das Modell in dieser Form nicht identifiziert ist, denn1N T l¨asst sich als lineare Funktion, n¨amlich der Sum-me der Spalten vonDdarstellen. Dies ¨andert sich, wenn man die Parameter α und π einer geeigneten Restriktion unterwirft. M¨ogliche Restriktionen sind die symmetrische Restriktion mit PN
n=1πn = 0 oder die asymme-trische Restriktion mit πn = 0 f¨ur beliebiges n. Eine andere Restriktion setztα= 0. Im Folgenden bezeichneD∗ eine (N T ×N) Matrix bestehend aus Dummy-Variablen, die die jeweils gew¨ahlte Restriktion realisieren und π∗ den entsprechenden N dimensionalen (restringierten) Parametervektor mit, je nach Restriktion, den Elementenα∗, π∗1, . . . , π∗N−1 beziehungsweise π∗1, . . . , πN∗. Welche dieser Restriktionen auch immer gew¨ahlt wird, sie be-einflusst nicht die Sch¨atzung des Parameters β∗ (siehe Anhang B.1). Mit den Komponenten D∗ und π∗ l¨asst sich das Fixed Effects Modell nun an-schreiben als
y=D∗π∗+X∗β∗+ν, ν ∼N(0, σν2IN T). (3.7) Trotz geeigneter Restriktion bez¨uglich der Parameter α und π ergibt sich dasselbe Problem der linearen Abh¨angigkeit wenn zus¨atzlich zeitin-variante Einflussgr¨oßen, wie etwa das Merkmal Geschlecht, in das Modell aufgenommen werden. Auch in diesem Fall lassen sich diese Einflussgr¨oßen als Linearkombination der Spalten der MatrixD∗darstellen, weshalb zeitin-variante Einflussgr¨oßen nicht in Modell (3.7) ber¨ucksichtigt werden k¨onnen.
Als M¨oglichkeit zur Sch¨atzung des Modells (3.7) liegt wegen der Un-abh¨angigkeit der FehlervariablenνntdieOrdinary-Least Squares-oder OLS-Methode (gew¨ohnliche Kleinst-Quadrate-Methode) nahe, wobei neben β∗ auch die Parameter π∗ als Regressionsparameter aufgefasst werden. Der LS-Sch¨atzer ist jener Wert f¨urθ, der die Funktion
q(θ) = (y−Zθ)′(y−Zθ),
mit Z = (D∗ X∗) und θ = (π∗′,β∗′)′, minimiert. Ableiten nach θ und Nullsetzen der ersten Ableitung f¨uhrt zu dem OLS-Sch¨atzer
θˆ= (Z′Z)−1Z′y. (3.8) Als Sch¨atzer f¨urσν2 verwendet man mit ˆy=Zθˆ
ˆ
σν2 = (N T −N −P)−1(y−y)ˆ ′(y−y)ˆ
= (N T −N −P)−1Qe. (3.9)
3.2.2 Eigenschaften des OLS-Sch¨atzers
Unter den Annahmen E(ν) = 0 und Cov(ν) = σ2νIN T ist der auch als ”Least-Squares-Dummy-Variable“-Sch¨atzer (LSDV-Sch¨atzer) bezeich-nete Sch¨atzer ˆθ erwartungstreu, das heißt E(ˆθ) = θ0, mit einer Kovari-anzmatrix, die mitCov(ˆd β) = ˆσ2ν(Z′Z)−1 gesch¨atzt werden kann. Weiterhin ist er bester linearer unverzerrter Sch¨atzer (BLUE), das heißt, unter allen erwartungstreuen linearen Sch¨atzern der Form ˜θ=Aybesitztc′θˆf¨ur jeden reellen Vektor c die kleinste Varianz. Auch der Sch¨atzer ˆσ2ν ist unverzerrt (E(ˆσν2) =σ2ν,0).
Wegen der zus¨atzlichen Annahme, dassν normalverteilt ist, erh¨alt man, bei Geltung der Annahmen, eine Reihe weiterer Aussagen, die f¨ur die Kon-struktion von Tests und Konfidenzintervallen wichtig sind (z.B. Fahrmeir, Kaufmann und Kredler, 1996). Einerseits ist in diesem Fall der OLS-Sch¨atzer mit dem ML-Sch¨atzer des Modells (3.7) identisch. Andererseits gilt ˆθ ∼ N(θ0, σ2ν,0(Z′Z)−1) und ˆθ ist unabh¨angig von ˆσν2. Dar¨uber hinaus ist der Sch¨atzer ˆθbester unverzerrter Sch¨atzer, das heißt besser als alle anderen li-nearen und nichtlili-nearen unverzerrten Sch¨atzer. F¨ur weitere Eigenschaften siehe etwa (Fahrmeir, Kaufmann und Kredler, 1996, S. 99 ff.).
Der ˆβ∗-Teil des LSDV-Sch¨atzers ˆθ ist nicht nur erwartungstreu son-dern, f¨ur T → ∞ oder N → ∞ auch (zumindest schwach) konsistent6 (siehe Anhang A.5). Der π∗-Teil ist lediglich f¨ur T → ∞ konsistent, eine
6Im Allgemeinen reicht f¨ur praktische Anwendungen die schwache Konsistenz aus.
Daher soll durchweg mit Konsistenz die schwache Konsistenz gemeint sein.
in L¨angsschnittuntersuchungen eher seltene Situation (z.B. Baltagi, 2001;
Hsiao, 2003; Verbeek, 2000; Wooldridge, 2002).
3.2.3 Alternative Darstellung des OLS-Sch¨atzers
Zur Bestimmung des OLS-Sch¨atzers (3.8) ist allerdings mit Z= (D∗ X∗) eine (N+P)×(N+P) Matrix zu invertieren, was insbesondere f¨ur großes N technische Probleme bereitet. Betrachtet man aber (3.8) genauer, zeigt sich (siehe Anhang B.1), dass ˆβ∗ unabh¨angig von ˆπ∗ einfacher berechnet werden kann und zwar mit
βˆ∗ = XN n=1
XT t=1
(x∗nt−x¯∗n)(x∗nt−x¯∗n)′
!−1XN
n=1
XT t=1
(x∗nt−x¯∗n)(ynt−y¯n)′. (3.10) Diesen Sch¨atzer erh¨alt man direkt, wenn man das transformierte Modell,
ynt−y¯n= (x∗nt−x¯∗n)′β∗+ (νnt−ν¯n), (3.11) mit ¯yn = T−1PT
t=1ynt, ¯xn = T−1PT
t=1xnt und ¯νn = T−1PT
t=1νnt, aus dem die Komponentenπndurch die Bildung der Differenzen vom jeweiligen individuellen Mittel ¨uber die Zeit herausfallen, betrachtet. Zur Berechnung von ˆβ∗ nach (3.10) ist dann nur noch eine (P×P) Matrix zu invertieren.
Auch der Sch¨atzer ˆπ∗ l¨asst sich alternativ, je nach gew¨ahlter Restrikti-on, aber als Funktion von ˆβ∗ darstellen (siehe Anhang B.1). Zum Beispiel erh¨alt man unter der RestriktionπN = 0
ˆ π∗ =
¯ yN
¯ y1−y¯N
...
¯
yN−1−y¯N
−
¯ x∗′N x¯∗′1 −x¯∗′N
...
¯x∗′N−1−x¯∗′N
βˆ∗.
Mit ¯x∗ = (N T)−1PN n=1
PT
t=1x∗nt und ¯y = (N T)−1PN n=1
PT
t=1ynt ergibt
sich unter der RestriktionPN
n=1πn= 0
ˆ π∗ =
ˆ α∗ ˆ π∗1
... ˆ πN∗−1
=
¯ y
¯ y1−y¯
...
¯
yN−1−y¯
¯ x∗′
¯
x∗′1 −x¯∗′
...
¯
x∗′N−1−x¯∗′
βˆ∗.
Als Sch¨atzer f¨ur die Residualvarianz erh¨alt man mit ˆy=D∗πˆ∗+X∗βˆ∗ auch in diesem Fall (3.9). Dies ist insbesondere dann zu beachten, wenn ausgehend vom transformierten Modell (3.11), ˆβ∗ nach (3.10) mit Hilfe ei-nes Programms zur Berechnung des OLS-Sch¨atzers bestimmt wird. In die-sem Fall wird im Allgemeinen bei der Sch¨atzung von σ2ν von (N T −P) Freiheitsgraden ausgegangen. Der entsprechende Sch¨atzer ist daher mit (N T −P)/(N T −N −P) zu multiplizieren. Als Sch¨atzer f¨ur die Kova-rianzmatrix von ˆβ∗ l¨asst sich
Cov(ˆd β∗) = ˆσν2 XN n=1
XT t=1
(x∗nt−¯x∗n)(x∗nt−¯x∗n)′
!−1
(3.12) verwenden, eine mit der entsprechenden Teilmatrix der gesch¨atzten Kova-rianzmatrix von ˆθ∗ identischen Matrix.
3.2.4 Tests
Neben Tests auf einzelne Parameterwerte oder anderer linearer Hypothesen ist h¨aufig ein simultaner Test, dass alle Parameter π∗1, . . . , πN∗ gleich Null sind von Interesse. Diese, sowie eine ganze Reihe weiterer linearer Hypo-thesen bez¨uglich der Parameter, lassen sich als Spezialfall der allgemeinen linearen Hypothese
H0 :Cθ=ξ, H1 :Cθ 6=ξ,
mit C einer (S×(N +P)) dimensionalen Matrix mit vollem Zeilenrang, auffassen (z.B. Fahrmeir, Kaufmann und Kredler, 1996, S. 110 ff.). Die
entsprechende, unter H0 F-verteilte Pr¨uf- oder Testgr¨oße ist
F = Q/S
Qe/(N T −N −P) ∼F(S, N T −N −P), mit Q = (Cθˆ−ξ)′(C(Z′Z)−1C′)−1(Cθˆ−ξ).
Soll ¨ubepr¨uft werden, ob die individuellen Effekte einen statistisch re-levanten Erkl¨arungswert besitzen, dann f¨uhrt dies f¨ur die Restriktionen PN
n=1πn = 0 und πN = 0 nach Umsortieren des Vektors π∗ zu ˜π∗ = (π1∗, . . . , π∗N−1, α∗)′ mit C = (IN−1 0(N−1)×(P+1)) zu folgendem Testpro-blem
H0:C π˜∗
β∗
=0, H0:C π˜∗
β∗
6
=0 und unter H0 zur F-verteilten Pr¨ufgr¨oße
F = Q/(N−1)
Qe/(N T −N −P) ∼F(N−1, N T −N −P)
mit Q = Q0 −Qe, Q0 = (y−y)ˇ ′(y−y) und ˇˇ y = 1αˆ∗ +X∗βˆ∗. Unter der Restriktion α = 0 ist die Matrix Cso zu bilden, dass alle N −1 Dif-ferenzen der N Effekte auf Null getestet werden. Einen solchen Test auf die statistische Bedeutsamkeit der festen, unbeobachtbaren Effekte sollte durchgef¨uhrt werden, bevor man sich entscheidet individuelle feste Effek-te nicht in die Modellgleichung aufzunehmen, denn das Ignorieren stati-stisch relevanter individueller fester Effekte f¨uhrt zu verzerrten und inkon-sistenten Sch¨atzern f¨ur die Regressionsparameter β∗. F¨ur weitere Tests, die Konstruktion von Konfidenzintervallen, Punkt- und Bereichsprognosen oder M¨oglichkeiten zur Modell¨uberpr¨ufung siehe etwa Fahrmeir, Kaufmann und Kredler (1996, S. 108 ff.).
3.2.5 Erg¨anzungen
Im Allgemeinen stehtβ∗ im Mittelpunkt des Interesses. Daher sollen einige Anmerkungen zu ˆβ∗ folgen. Eine M¨oglichkeit der Fehlspezifikation besteht in der Annahme der linearen Unabh¨angigkeit der Fehlervariablenνnt, wenn
nicht auszuschließen ist, dass diese ¨uber die Messpunkte korreliert sind. Ist die Annahme unkorrelierter Fehler falsch, dann ist, unter relativ schwachen Bedingungen, der Sch¨atzer ˆβ∗zwar immer noch erwartungstreu, konsistent und asymptotisch normalverteilt, aber mit einer anderen asymptotischen Kovarianzmatrix (z.B. White, 1982). Diese kann, ausgehend vom transfor-mierten Modell (3.11), gesch¨atzt werden mit
Cov(ˆd β∗) = XN n=1
Xe′nXen
!−1 XN
n=1
Xe′nuenue′nXen
! N X
n=1
Xe′nXen
!−1
wobeiXen= (x∗n1−x¯∗n, . . . ,x∗nT−x¯∗n)′ undeun= (yn1−y¯n, . . . , ynT −y¯n)′− Xenβˆ∗. Ein ¨ahnliches Ergebnis erh¨alt man, wenn die Annahme gleicher Va-rianzen der Fehlervariable (Homoskedastizit¨at) falsch ist, also Heteroske-dastizit¨at nicht auszuschließen ist (White, 1980). Sind die Fehlervariablen unabh¨angig und identisch aber nicht normalverteilt, dann ist ˆβ∗ unter recht schwachen Bedingungen immer noch konsistent und asymptotisch normal-verteilt7 (z.B. Fahrmeir, Kaufmann und Kredler, 1996, S. 101). Die Kova-rianzmatrix kann auch in diesem Fall mit (3.12) gesch¨atzt werden.
Bei der Einf¨uhrung und Diskussion des Fixed Effects Modells wurden die individuellen, nicht beobachtbaren Effekte als feste Parameter aufge-fasst. Dies ist nicht zwingend notwendig. Insbesondere die Ergebnisse in Abschnitt 3.2.3 machen deutlich, dass unter Geltung der Annahmen eine Inferenz bez¨uglich β∗ nicht davon abh¨angt ob es sich beiπn um feste oder zuf¨allige Gr¨oßen handelt, denn alle zeitinvarianten Merkmale werden durch die Transformation eliminiert.
Das in diesem Abschnitt behandelte Fixed Effects Modell kann um einen zus¨atzlichen festen Effekt erweitert werden, der invariant ¨uber die Einheiten n = 1, . . . , N aber variabel ¨uber die Messpunkte t = 1, . . . , T ist. Dieser Effekt modelliert etwa Zeiteffekte, die an jedem Zeitpunkt unterschiedlich aber f¨ur alle Einheiten identisch wirken (z.B. Baltagi, 2001; Hsiao, 2003).
Vorgehen und Ergebnisse im Modell mit zwei festen Effekten sind ¨ahnlich wie im einfachen Fixed Effects Modell.
7Wenn nicht anders angegeben, dann wird im Folgenden von festem T undN → ∞ ausgegangen.