• Keine Ergebnisse gefunden

Die MatrixM2ist hier dieselbe wie f¨ur die AR(1)-Struktur. Zur Parameter-sch¨atzung kann wieder das Newton-Raphson Verfahren in Verbindung mit der bereits beschriebenen Line-Search Methode verwendet werden.

In allen drei Schritten ist wie f¨ur die Sch¨atzung der Parameter des Ran-dom Effects Probitmodells bei der iterativen Sch¨atzung die Festlegung von Abbruchkriterien notwendig. Die f¨ur die Sch¨atzung der in diesem Abschnitt behandelten Modellspezifikationen notwendigen Ableitungen findet man in Spieß (1995).

Die Sch¨atzer dieses dreistufigen Verfahrens sind, unter den ¨ublichen Regularit¨atsbedingungen, konsistent und asymptotisch normalverteilt mit einer Kovarianzmatrix, die mit

Cov(θ) =d N−1(GcbW−1G)b −1

undGb = (∂g(θ)/∂θ)θ=ˆθ, konsistent gesch¨atzt werden kann (K¨usters, 1987;

Shapiro, 1986).

Die praktische Berechnung der Sch¨atzer ist allerdings problematischer als im Falle des Random Effects Probit Modells. So finden Spieß und Ha-merle (2000) vor allem in kleineren Stichproben und bei h¨oheren Korre-lationen Konvergenzprobleme. Im Allgemeinen treten diese Probleme im zweiten Schritt, bei der Sch¨atzung der T(T −1)/2 Korrelationen auf. Das ist nicht ¨uberraschend, denn bereits bei T = 5 Zeitpunkten sind 10 Kor-relationen zu sch¨atzen. Sind die wahren KorKor-relationen hoch, dann steigt die Wahrscheinlichkeit mit kleiner werdenden Datens¨atzen daf¨ur, dass f¨ur wenigstens eine Korrelation die Folge der Sch¨atzwerte nicht konvergiert.

Ge-gen¨uber einer ML-Sch¨atzung, f¨ur die eine vollst¨andige Spezifikation der entsprechenden Verteilung erforderlich ist, basiert die GEE-Sch¨atzung —

¨ahnlich wie das im letzten Abschnitt beschriebene dreistufige Verfahren — lediglich auf einer teilweisen Spezifikation des beteiligten Zufallsmechanis-mus. Eine Einbettung der Methode der verallgemeinerten Sch¨atzgleichun-gen in den

”Quasi-Likelihood“-Ansatz sowie die Darstellung der Beziehun-gen zu alternativen Methoden findet man in (Liang und Zeger, 1995).

F¨ur das hier betrachtete Modell sind — im Rahmen der GEE-Methode

— die identifizierbaren Parameter des systematischen Teils die inhaltlich interessierenden Parameter und die Korrelationsstrukturparameter die un-interessanten Parameter. Letztere werden auch als

”nuisance“ oder

” inci-dental“ Parameter bezeichnet. Sei E(yn|Xn) = µn = (µn1, . . . , µnT) der Erwartungswert der beobachtbaren bin¨aren Responsevariablen bei festen Einflussgr¨oßen Xn = (xn1, . . . ,xnT), der als korrekt spezifiziert vorausge-setzt wird. F¨ur das bin¨are Probitmodell ist µnt = Φ(xntβ). Dann ist der GEE-Sch¨atzer f¨ur den systematischen Teil des Regressionsmodells jenes ˆβ, das die Sch¨atzgleichungen

XN n=1

∂µn

∂β−1n (yn−µn) =0 (4.3) l¨ost. F¨ur die Ableitung ∂µn/∂β erh¨alt man ausgehend von der Probits-pezifikation∂µn/∂β=XnDn, mitDn= Diag(ϕ(xn1β), . . . , ϕ(xnTβ)).

Die Matrix Ωn ist die Kovarianzmatrix der Responsevariablen yn. Liang und Zeger (1986) schlagen eine Kovarianzmatrix der Form

n=V1/2n R(γ)V1/2n mit Vn= Diag(µn1(1−µn1), . . . , µnT(1−µnT)) vor. Dabei istR(γ) die unbekannte Korrelationsmatrix der beobachtbaren Responsevariablen, die f¨ur alle Einheiten als identisch angenommen wird und γ ein Vektor, der die nicht interessierenden Strukturparameter der Korrelationsmatrix enth¨alt. Sowohl die Struktur als auch der Parameter γ sind im Allgemeinen nicht bekannt. Nach Festlegung einer Struktur f¨ur R(γ) ist daherγ gegebenenfalls zu sch¨atzen.

Abweichend von Liang und Zeger (1986) oder Sharples und Breslow (1992) wird im Folgenden zur Sch¨atzung von γ zun¨achst die ¨ubliche Pearson-Korrelationsmatrix der Residuen4 (yn−µn) berechnet, die un-ter den ¨ublichen Bedingungen positiv definit ist. Das weitere Vorgehen h¨angt davon ab, welche Annahme bez¨uglich der Korrelationsstruktur ge-troffen wird. Wird eine Equi-Korrelationsstruktur angenommen, dann ist γ ein Skalar und ˆγ das zur¨ucktransformierte arithmetische Mittel ¨uber die Z-transformierten T(T −1)/2 Elemente der unteren Dreiecksmatrix der gesch¨atzten Korrelationsmatrix. Bei Annahme einer unrestringierten Kor-relationsmatrix geht die aus den Residuen gesch¨atzte KorKor-relationsmatrix in die Sch¨atzgleichungen ein. Wird eine oder eine gemischte AR(1)-und Equi-Korrelationsstruktur — hier immer in den beobachtbaren Resi-duen — angenommen, dann wird die Funktion

q(γ) = (ˆz−M2h(γ))(ˆz−M2h(γ))

nach γ minimiert. Dabei ist ˆz = (ˆz21,zˆ31,zˆ32, . . .) der (T(T −1) × 1)-Vektor, der die Z-transformierten Elemente der unteren Dreiecksmatrix der gesch¨atzten Korrelationsmatrix enth¨alt. Die ZuordnungsmatrixM2 ist identisch mit der entsprechenden Matrix in Abschnitt 4.3. Auch die Funkti-on h(γ) entspricht jeweils der in Abschnitt 4.3 gegebenen Funktion. Unter Annahme einer AR(1)-Struktur wird γ zu einem Skalar und als Korrelati-on erh¨alt man corr((ynt−µnt)(ynt −µnt)) =γ|t−t|. Bei einer gemischten AR(1)- und Equi-Korrelationsstruktur ist γ ein zweidimensionaler Vektor und

corr((ynt−µnt)(ynt−µnt)) =γ1+ (1−γ12|t−t|.

In beiden F¨allen kann die Sch¨atzung von γuber das Newton-Raphson Ver-¨ fahren erfolgen.

Die Sch¨atzung der Parameter β und γ erfolgt iterativ, wobei in je-dem Iterationsschritt (l= 1,2, . . .) zun¨achst, ausgehend von einem Sch¨atz-wert ˆβl−1, ein Sch¨atzwert f¨ur γ berechnet wird, um anschließend ¨uber

4Anstatt der Residuen k¨onnten auch standardisierte Residuen verwendet werden. In Simulationen traten allerdings keine Unterschiede in den resultierenden GEE-Sch¨atzern auf (Spieß und Hamerle, 2000).

eine modifizierte Fisher-Scoring Methode einen neuen Sch¨atzwert f¨ur β zu berechnen. Sei D = Bdiag(D1, . . . ,DN), Ω = Bdiag(Ω1, . . . ,ΩN) und µ = (µ1, . . . ,µN), dann erh¨alt man den in jedem Schritt aktualisierten Sch¨atzwert f¨urβ uber die Beziehung¨

βˆl = ˆβl−1

−(XDΩ−1DX)−1XDΩ−1(y−µ) βˆ

l−1.

Dabei ist−XDΩ−1DX eine Approximation an die Ableitung der verall-gemeinerten Sch¨atzgleichungen nachβ,

( ∂

∂βXDΩ−1(y−µ)) =−XDΩ−1DX+ ( ∂

∂βDΩ−1)(X⊗(y−µ)).

Als Abbruchkriterien k¨onnen dieselben Kriterien wie f¨ur die Sch¨atzung der Parameter im Random Effects Probitmodell gew¨ahlt werden.

4.4.1 Eigenschaften der GEE-Sch¨atzer

Mit einem konsistenten Sch¨atzer f¨ur γ und unter recht schwachen Regu-larit¨atsbedingungen ist der Sch¨atzer ˆβ, der die verallgemeinerten Sch¨atz-gleichungen 4.3 l¨ost, konsistent und asymptotisch normalverteilt mit einer Kovarianzmatrix, die mitCov(ˆd β) =Gb−1WcGb−1, wobei

Gb =−(XDΩ−1DX)βˆγ und

Wc = (XDΩ−1Cov(y)Ωd −1DX)βˆγ mit

Cov(y) = Bdiag((yd 1−µ1)(y1−µ1), . . . ,(yN −µN)(yN −µN)), konsistent gesch¨atzt werden kann (Liang und Zeger, 1986). Zentral f¨ur dieses Ergebnis ist die korrekte Spezifikation des Erwartungswertes E(yn|Xn) =µnbei festen Einflussgr¨oßen. Weder muss die Korrelationsma-trixR(γ) korrekt spezifiziert sein, noch ist f¨urγein bestimmter Sch¨atzer zu

verwenden. Letzterer muss lediglich, ausgehend von der gew¨ahlten Korrela-tionsstruktur, konsistent sein. Die Begr¨undung f¨ur diese Ergebnisse liegt in den Sch¨atzgleichungen selbst, denn diese setzen sich aus dem Produkt zwei-er Tzwei-erme zusammen, wovon dzwei-er zwei-erste eine Funktion von γ aber nicht von yn und der zweite nicht abh¨angig von γ, und dessen Erwartungswert null ist (Liang und Zeger, 1986, 1995). Obwohl der Sch¨atzer ˆβ auch bei einer Fehlspezifikation der Korrelationsmatrix konsistent ist, muss in diesem Fall mit einer, relativ zu einer korrekten Spezifikation der Korrelationsmatrix, geringeren (asymptotischen) Effizienz gerechnet werden.

F¨ur spezielle Situationen k¨onnen weitergehende Ergebnisse gezeigt wer-den (z.B. Fitzmaurice, Laird und Rotnitzky, 1993; Mancl und Leroux, 1996;

McDonald, 1993; Spieß und Hamerle, 1996). Liegt etwa f¨ur jede Einheit die-selbe regul¨are und damit invertierbare Matrix Xn vor, dann ist der GEE-Sch¨atzer ˆβ selbst und dessen asymptotische und gesch¨atzte Kovarianzma-trix unabh¨angig von der angenommenen KorrelationsmaKovarianzma-trix (siehe Anhang C.1). Weiterhin ist die asymptotische Varianz des GEE-Sch¨atzers gleich der asymptotischen Varianz eines

”Quasi-Likelihood“-Sch¨atzers, der innerhalb der Klasse der in den Responsevariablen linearen Sch¨atzer die kleinste Vari-anz aufweist (McCullagh, 1983). Entsprechende Datenmatrizen liegen etwa bei einem L¨angsschnittmodell vor, bei dem neben der Konstanten ledig-lich Dummy-Variablen, die Zeiteffekte kodieren ber¨ucksichtigt werden oder bei einem saturierten varianzanlytischen Modell mit Messwiederholungen auf allen Faktoren. Ein ¨ahnliches, wenn auch schw¨acheres Ergebnis erh¨alt man, wenn nicht ¨uber die Einheiten, sondern ¨uber die T Messwiederho-lungen invariante Einflussgr¨oßen betrachtet werden. In diesem Fall ist der Sch¨atzer sowie dessen asymptotische und gesch¨atzte Kovarianzmatrix le-diglich Funktion der Summe ¨uber die Zeilen beziehungsweise ¨uber Zeilen und Spalten der angenommenen Korrelatiosstruktur, das heißt die ange-nommene Korrelationsstruktur spielt nur eine unwesentliche Rolle (siehe Anhang C.2). Allerdings ist in diesem Fall die asymptotische Varianz der GEE-Sch¨atzer nicht identisch mit der asymptotischen Varianz der” Quasi-Likelihood“-Sch¨atzer. Weiterhin l¨asst sich zeigen, dass in diesem Fall die Annahme einer Equi-Korrelationsstruktur zu identischen Resultaten f¨uhrt

wie die Annahme der Unabh¨angigkeit (siehe Anhang C.2).

Die Eigenschaften von GEE-Sch¨atzern wurden, meist im Kontext von Logitmodellen, in einigen Arbeiten mit Hilfe von Simulationen oder, f¨ur sehr einfache Modelle, analytisch untersucht (z.B. Emrich und Piedmon-te, 1992; Lee, Scott und Soo, 1993; Liang und Zeger, 1986; Sharples und Breslow, 1992). Generelles Ergebnis dieser Untersuchungen ist, dass die GEE-Sch¨atzer relativ zu dem jeweils entsprechenden ML-Sch¨atzer auch in endlichen Stichproben recht brauchbar und der Effizienzverlust zwar bei einer f¨alschlicherweise gemachten Unabh¨angigkeitsannahme gr¨oßer als bei der korrekten Spezifikation der Korrelationsmatrix, im Allgemeinen aber nicht sehr groß ist.

Prentice (1988) weist darauf hin, dass die Korrelation bin¨arer Respon-sevariablen durch die jeweiligen marginalen Wahrscheinlichkeiten restrin-giert ist. Sharples und Breslow (1992) berichten von Konvergenzproblemen f¨ur ein Logitmodell mit zwei bin¨aren Einflussgr¨oßen, wenn diese Restrik-tionen verletzt werden. Dabei traten entweder mehrere L¨osungen f¨ur die Sch¨atzgleichungen oder negative Varianzsch¨atzungen auf. In Modellen mit

¨uber alle Beobachtungspunkte variierenden Einflussgr¨oßen, die mehr als zwei verschiedene Werte annehmen k¨onnen ist allerdings zu erwarten, dass diese Restriktion zumindest in einigen F¨allen verletzt ist. In diesem Zusam-menhang ist nicht gekl¨art, ab welchem Anteil an Restriktionsverletzungen Konvergenzprobleme auftreten k¨onnen.

Die in diesem Abschnitt beschriebenen GEE-Sch¨atzer k¨onnen auch als GMM-Sch¨atzer (

”generalized methods of moments“-Sch¨atzer; z.B Avery, Hansen und Hotz, 1983; Hansen, 1982) aufgefasst werden. W¨ahrend die GEE-Sch¨atzer auf einem biometrischen Hintergrund vorgeschlagen wurden, wurden GMM-Sch¨atzer im ¨okonometrischen Kontext entwickelt. F¨ur eine Einf¨uhrung in die Theorie der GMM-Sch¨atzer siehe etwa Davidson und MacKinnon (1993).