• Keine Ergebnisse gefunden

3.2.1 Modellspezifikation und Least-Squares-Sch¨atzer Liegen pro Einheit mehrere Messungen vor, dann ist im Allgemeinen davon auszugehen, dass die Responsevariablen ¨uber die t= 1, . . . , T Messungen, gegeben die linearen Pr¨adiktoren, nicht unabh¨angig voneinander sind. Ei-ne M¨oglichkeit solche Abh¨angigkeiten zu modellieren besteht darin, von individuellen, zeitlich stabilen aber unbeobachtbaren Effekten auszugehen.

Bei Personen k¨onnen diese f¨ur bestimmte Neigungen oder Dispositionen, bei Firmen f¨ur eine bestimmte Firmenpolitik oder einen firmeneigenen Stil stehen.

Die Annahme der unbeobachtbaren individuellen Effekte als feste Gr¨oßen (”fixed effects“) f¨uhrt zu einem Fixed Effects Modell (z.B. Baltagi, 2001;

Hsiao, 2003; Judge, Griffiths, Hill, L¨utkepohl und Lee, 1985; Verbeek, 2000;

Wooldridge, 2002). Dazu wird das Modell in der Fehlervariablen ǫnt = πnnt formuliert, mit πn dem unbeobachtbaren festen Effekt, nun als unbekannter Parameter betrachtet, und νnt einer zuf¨alligen Fehlerkompo-nente mit νnt∼N(0, σν2) unabh¨angig ¨uber allenundt. In Verbindung mit dem Modell

ynt =xntβ+ǫnt, n= 1, . . . , N, t= 1, . . . , T, erh¨alt man

yn=Xnβ+1Tπnn, n= 1, . . . , N, mitνn∼N(0, σν2IT).

Allerdings sind nicht alle Parameter α, β1, . . . , βP und π1, . . . , πN iden-tifizierbar. Dies ist leicht zu sehen, wenn man das Modell f¨ur alleN T Beob-achtungen anschreibt. MitD=IN⊗1T,π= (π1, . . . , πN), der um den Ein-servektor verkleinerten DatenmatrixX = (x11, . . . ,x1T, . . . ,xN1, . . . ,xN T)

undβ= (β1, . . . , βP) erh¨alt man

y=1N Tα+Dπ+Xβ+ν, ν ∼N(0, σ2νIN T).

Aus dieser Darstellung wird deutlich, dass das Modell in dieser Form nicht identifiziert ist, denn1N T l¨asst sich als lineare Funktion, n¨amlich der Sum-me der Spalten vonDdarstellen. Dies ¨andert sich, wenn man die Parameter α und π einer geeigneten Restriktion unterwirft. M¨ogliche Restriktionen sind die symmetrische Restriktion mit PN

n=1πn = 0 oder die asymme-trische Restriktion mit πn = 0 f¨ur beliebiges n. Eine andere Restriktion setztα= 0. Im Folgenden bezeichneD eine (N T ×N) Matrix bestehend aus Dummy-Variablen, die die jeweils gew¨ahlte Restriktion realisieren und π den entsprechenden N dimensionalen (restringierten) Parametervektor mit, je nach Restriktion, den Elementenα, π1, . . . , πN−1 beziehungsweise π1, . . . , πN. Welche dieser Restriktionen auch immer gew¨ahlt wird, sie be-einflusst nicht die Sch¨atzung des Parameters β (siehe Anhang B.1). Mit den Komponenten D und π l¨asst sich das Fixed Effects Modell nun an-schreiben als

y=Dπ+Xβ+ν, ν ∼N(0, σν2IN T). (3.7) Trotz geeigneter Restriktion bez¨uglich der Parameter α und π ergibt sich dasselbe Problem der linearen Abh¨angigkeit wenn zus¨atzlich zeitin-variante Einflussgr¨oßen, wie etwa das Merkmal Geschlecht, in das Modell aufgenommen werden. Auch in diesem Fall lassen sich diese Einflussgr¨oßen als Linearkombination der Spalten der MatrixDdarstellen, weshalb zeitin-variante Einflussgr¨oßen nicht in Modell (3.7) ber¨ucksichtigt werden k¨onnen.

Als M¨oglichkeit zur Sch¨atzung des Modells (3.7) liegt wegen der Un-abh¨angigkeit der FehlervariablenνntdieOrdinary-Least Squares-oder OLS-Methode (gew¨ohnliche Kleinst-Quadrate-Methode) nahe, wobei neben β auch die Parameter π als Regressionsparameter aufgefasst werden. Der LS-Sch¨atzer ist jener Wert f¨urθ, der die Funktion

q(θ) = (y−Zθ)(y−Zθ),

mit Z = (D X) und θ = (π∗′∗′), minimiert. Ableiten nach θ und Nullsetzen der ersten Ableitung f¨uhrt zu dem OLS-Sch¨atzer

θˆ= (ZZ)−1Zy. (3.8) Als Sch¨atzer f¨urσν2 verwendet man mit ˆy=Zθˆ

ˆ

σν2 = (N T −N −P)−1(y−y)ˆ (y−y)ˆ

= (N T −N −P)−1Qe. (3.9)

3.2.2 Eigenschaften des OLS-Sch¨atzers

Unter den Annahmen E(ν) = 0 und Cov(ν) = σ2νIN T ist der auch als ”Least-Squares-Dummy-Variable“-Sch¨atzer (LSDV-Sch¨atzer) bezeich-nete Sch¨atzer ˆθ erwartungstreu, das heißt E(ˆθ) = θ0, mit einer Kovari-anzmatrix, die mitCov(ˆd β) = ˆσ2ν(ZZ)−1 gesch¨atzt werden kann. Weiterhin ist er bester linearer unverzerrter Sch¨atzer (BLUE), das heißt, unter allen erwartungstreuen linearen Sch¨atzern der Form ˜θ=Aybesitztcθˆf¨ur jeden reellen Vektor c die kleinste Varianz. Auch der Sch¨atzer ˆσ2ν ist unverzerrt (E(ˆσν2) =σ2ν,0).

Wegen der zus¨atzlichen Annahme, dassν normalverteilt ist, erh¨alt man, bei Geltung der Annahmen, eine Reihe weiterer Aussagen, die f¨ur die Kon-struktion von Tests und Konfidenzintervallen wichtig sind (z.B. Fahrmeir, Kaufmann und Kredler, 1996). Einerseits ist in diesem Fall der OLS-Sch¨atzer mit dem ML-Sch¨atzer des Modells (3.7) identisch. Andererseits gilt ˆθ ∼ N(θ0, σ2ν,0(ZZ)−1) und ˆθ ist unabh¨angig von ˆσν2. Dar¨uber hinaus ist der Sch¨atzer ˆθbester unverzerrter Sch¨atzer, das heißt besser als alle anderen li-nearen und nichtlili-nearen unverzerrten Sch¨atzer. F¨ur weitere Eigenschaften siehe etwa (Fahrmeir, Kaufmann und Kredler, 1996, S. 99 ff.).

Der ˆβ-Teil des LSDV-Sch¨atzers ˆθ ist nicht nur erwartungstreu son-dern, f¨ur T → ∞ oder N → ∞ auch (zumindest schwach) konsistent6 (siehe Anhang A.5). Der π-Teil ist lediglich f¨ur T → ∞ konsistent, eine

6Im Allgemeinen reicht f¨ur praktische Anwendungen die schwache Konsistenz aus.

Daher soll durchweg mit Konsistenz die schwache Konsistenz gemeint sein.

in L¨angsschnittuntersuchungen eher seltene Situation (z.B. Baltagi, 2001;

Hsiao, 2003; Verbeek, 2000; Wooldridge, 2002).

3.2.3 Alternative Darstellung des OLS-Sch¨atzers

Zur Bestimmung des OLS-Sch¨atzers (3.8) ist allerdings mit Z= (D X) eine (N+P)×(N+P) Matrix zu invertieren, was insbesondere f¨ur großes N technische Probleme bereitet. Betrachtet man aber (3.8) genauer, zeigt sich (siehe Anhang B.1), dass ˆβ unabh¨angig von ˆπ einfacher berechnet werden kann und zwar mit

βˆ = XN n=1

XT t=1

(xnt−x¯n)(xnt−x¯n)

!−1XN

n=1

XT t=1

(xnt−x¯n)(ynt−y¯n). (3.10) Diesen Sch¨atzer erh¨alt man direkt, wenn man das transformierte Modell,

ynt−y¯n= (xnt−x¯n)β+ (νnt−ν¯n), (3.11) mit ¯yn = T−1PT

t=1ynt, ¯xn = T−1PT

t=1xnt und ¯νn = T−1PT

t=1νnt, aus dem die Komponentenπndurch die Bildung der Differenzen vom jeweiligen individuellen Mittel ¨uber die Zeit herausfallen, betrachtet. Zur Berechnung von ˆβ nach (3.10) ist dann nur noch eine (P×P) Matrix zu invertieren.

Auch der Sch¨atzer ˆπ l¨asst sich alternativ, je nach gew¨ahlter Restrikti-on, aber als Funktion von ˆβ darstellen (siehe Anhang B.1). Zum Beispiel erh¨alt man unter der RestriktionπN = 0

ˆ π =





¯ yN

¯ y1−y¯N

...

¯

yN−1−y¯N



−





¯ x∗′N∗′1 −x¯∗′N

...

¯x∗′N−1−x¯∗′N



βˆ.

Mit ¯x = (N T)−1PN n=1

PT

t=1xnt und ¯y = (N T)−1PN n=1

PT

t=1ynt ergibt

sich unter der RestriktionPN

n=1πn= 0

ˆ π =



 ˆ α ˆ π1

... ˆ πN−1



=





¯ y

¯ y1−y¯

...

¯

yN−1−y¯









¯ x∗′

¯

x∗′1 −x¯∗′

...

¯

x∗′N−1−x¯∗′



βˆ.

Als Sch¨atzer f¨ur die Residualvarianz erh¨alt man mit ˆy=Dπˆ+Xβˆ auch in diesem Fall (3.9). Dies ist insbesondere dann zu beachten, wenn ausgehend vom transformierten Modell (3.11), ˆβ nach (3.10) mit Hilfe ei-nes Programms zur Berechnung des OLS-Sch¨atzers bestimmt wird. In die-sem Fall wird im Allgemeinen bei der Sch¨atzung von σ2ν von (N T −P) Freiheitsgraden ausgegangen. Der entsprechende Sch¨atzer ist daher mit (N T −P)/(N T −N −P) zu multiplizieren. Als Sch¨atzer f¨ur die Kova-rianzmatrix von ˆβ l¨asst sich

Cov(ˆd β) = ˆσν2 XN n=1

XT t=1

(xnt−¯xn)(xnt−¯xn)

!−1

(3.12) verwenden, eine mit der entsprechenden Teilmatrix der gesch¨atzten Kova-rianzmatrix von ˆθ identischen Matrix.

3.2.4 Tests

Neben Tests auf einzelne Parameterwerte oder anderer linearer Hypothesen ist h¨aufig ein simultaner Test, dass alle Parameter π1, . . . , πN gleich Null sind von Interesse. Diese, sowie eine ganze Reihe weiterer linearer Hypo-thesen bez¨uglich der Parameter, lassen sich als Spezialfall der allgemeinen linearen Hypothese

H0 :Cθ=ξ, H1 :Cθ 6=ξ,

mit C einer (S×(N +P)) dimensionalen Matrix mit vollem Zeilenrang, auffassen (z.B. Fahrmeir, Kaufmann und Kredler, 1996, S. 110 ff.). Die

entsprechende, unter H0 F-verteilte Pr¨uf- oder Testgr¨oße ist

F = Q/S

Qe/(N T −N −P) ∼F(S, N T −N −P), mit Q = (Cθˆ−ξ)(C(ZZ)−1C)−1(Cθˆ−ξ).

Soll ¨ubepr¨uft werden, ob die individuellen Effekte einen statistisch re-levanten Erkl¨arungswert besitzen, dann f¨uhrt dies f¨ur die Restriktionen PN

n=1πn = 0 und πN = 0 nach Umsortieren des Vektors π zu ˜π = (π1, . . . , πN−1, α) mit C = (IN−1 0(N−1)×(P+1)) zu folgendem Testpro-blem

H0:C π˜

β

=0, H0:C π˜

β

6

=0 und unter H0 zur F-verteilten Pr¨ufgr¨oße

F = Q/(N−1)

Qe/(N T −N −P) ∼F(N−1, N T −N −P)

mit Q = Q0 −Qe, Q0 = (y−y)ˇ (y−y) und ˇˇ y = 1αˆ +Xβˆ. Unter der Restriktion α = 0 ist die Matrix Cso zu bilden, dass alle N −1 Dif-ferenzen der N Effekte auf Null getestet werden. Einen solchen Test auf die statistische Bedeutsamkeit der festen, unbeobachtbaren Effekte sollte durchgef¨uhrt werden, bevor man sich entscheidet individuelle feste Effek-te nicht in die Modellgleichung aufzunehmen, denn das Ignorieren stati-stisch relevanter individueller fester Effekte f¨uhrt zu verzerrten und inkon-sistenten Sch¨atzern f¨ur die Regressionsparameter β. F¨ur weitere Tests, die Konstruktion von Konfidenzintervallen, Punkt- und Bereichsprognosen oder M¨oglichkeiten zur Modell¨uberpr¨ufung siehe etwa Fahrmeir, Kaufmann und Kredler (1996, S. 108 ff.).

3.2.5 Erg¨anzungen

Im Allgemeinen stehtβ im Mittelpunkt des Interesses. Daher sollen einige Anmerkungen zu ˆβ folgen. Eine M¨oglichkeit der Fehlspezifikation besteht in der Annahme der linearen Unabh¨angigkeit der Fehlervariablenνnt, wenn

nicht auszuschließen ist, dass diese ¨uber die Messpunkte korreliert sind. Ist die Annahme unkorrelierter Fehler falsch, dann ist, unter relativ schwachen Bedingungen, der Sch¨atzer ˆβzwar immer noch erwartungstreu, konsistent und asymptotisch normalverteilt, aber mit einer anderen asymptotischen Kovarianzmatrix (z.B. White, 1982). Diese kann, ausgehend vom transfor-mierten Modell (3.11), gesch¨atzt werden mit

Cov(ˆd β) = XN n=1

XenXen

!−1 XN

n=1

XenuenuenXen

! N X

n=1

XenXen

!−1

wobeiXen= (xn1−x¯n, . . . ,xnT−x¯n) undeun= (yn1−y¯n, . . . , ynT −y¯n)− Xenβˆ. Ein ¨ahnliches Ergebnis erh¨alt man, wenn die Annahme gleicher Va-rianzen der Fehlervariable (Homoskedastizit¨at) falsch ist, also Heteroske-dastizit¨at nicht auszuschließen ist (White, 1980). Sind die Fehlervariablen unabh¨angig und identisch aber nicht normalverteilt, dann ist ˆβ unter recht schwachen Bedingungen immer noch konsistent und asymptotisch normal-verteilt7 (z.B. Fahrmeir, Kaufmann und Kredler, 1996, S. 101). Die Kova-rianzmatrix kann auch in diesem Fall mit (3.12) gesch¨atzt werden.

Bei der Einf¨uhrung und Diskussion des Fixed Effects Modells wurden die individuellen, nicht beobachtbaren Effekte als feste Parameter aufge-fasst. Dies ist nicht zwingend notwendig. Insbesondere die Ergebnisse in Abschnitt 3.2.3 machen deutlich, dass unter Geltung der Annahmen eine Inferenz bez¨uglich β nicht davon abh¨angt ob es sich beiπn um feste oder zuf¨allige Gr¨oßen handelt, denn alle zeitinvarianten Merkmale werden durch die Transformation eliminiert.

Das in diesem Abschnitt behandelte Fixed Effects Modell kann um einen zus¨atzlichen festen Effekt erweitert werden, der invariant ¨uber die Einheiten n = 1, . . . , N aber variabel ¨uber die Messpunkte t = 1, . . . , T ist. Dieser Effekt modelliert etwa Zeiteffekte, die an jedem Zeitpunkt unterschiedlich aber f¨ur alle Einheiten identisch wirken (z.B. Baltagi, 2001; Hsiao, 2003).

Vorgehen und Ergebnisse im Modell mit zwei festen Effekten sind ¨ahnlich wie im einfachen Fixed Effects Modell.

7Wenn nicht anders angegeben, dann wird im Folgenden von festem T undN → ∞ ausgegangen.