Die MatrixM2ist hier dieselbe wie f¨ur die AR(1)-Struktur. Zur Parameter-sch¨atzung kann wieder das Newton-Raphson Verfahren in Verbindung mit der bereits beschriebenen Line-Search Methode verwendet werden.
In allen drei Schritten ist wie f¨ur die Sch¨atzung der Parameter des Ran-dom Effects Probitmodells bei der iterativen Sch¨atzung die Festlegung von Abbruchkriterien notwendig. Die f¨ur die Sch¨atzung der in diesem Abschnitt behandelten Modellspezifikationen notwendigen Ableitungen findet man in Spieß (1995).
Die Sch¨atzer dieses dreistufigen Verfahrens sind, unter den ¨ublichen Regularit¨atsbedingungen, konsistent und asymptotisch normalverteilt mit einer Kovarianzmatrix, die mit
Cov(θ) =d N−1(GcbW−1G)b −1
undGb = (∂g(θ)/∂θ)θ=ˆθ, konsistent gesch¨atzt werden kann (K¨usters, 1987;
Shapiro, 1986).
Die praktische Berechnung der Sch¨atzer ist allerdings problematischer als im Falle des Random Effects Probit Modells. So finden Spieß und Ha-merle (2000) vor allem in kleineren Stichproben und bei h¨oheren Korre-lationen Konvergenzprobleme. Im Allgemeinen treten diese Probleme im zweiten Schritt, bei der Sch¨atzung der T(T −1)/2 Korrelationen auf. Das ist nicht ¨uberraschend, denn bereits bei T = 5 Zeitpunkten sind 10 Kor-relationen zu sch¨atzen. Sind die wahren KorKor-relationen hoch, dann steigt die Wahrscheinlichkeit mit kleiner werdenden Datens¨atzen daf¨ur, dass f¨ur wenigstens eine Korrelation die Folge der Sch¨atzwerte nicht konvergiert.
Ge-gen¨uber einer ML-Sch¨atzung, f¨ur die eine vollst¨andige Spezifikation der entsprechenden Verteilung erforderlich ist, basiert die GEE-Sch¨atzung —
¨ahnlich wie das im letzten Abschnitt beschriebene dreistufige Verfahren — lediglich auf einer teilweisen Spezifikation des beteiligten Zufallsmechanis-mus. Eine Einbettung der Methode der verallgemeinerten Sch¨atzgleichun-gen in den
”Quasi-Likelihood“-Ansatz sowie die Darstellung der Beziehun-gen zu alternativen Methoden findet man in (Liang und Zeger, 1995).
F¨ur das hier betrachtete Modell sind — im Rahmen der GEE-Methode
— die identifizierbaren Parameter des systematischen Teils die inhaltlich interessierenden Parameter und die Korrelationsstrukturparameter die un-interessanten Parameter. Letztere werden auch als
”nuisance“ oder
” inci-dental“ Parameter bezeichnet. Sei E(yn|Xn) = µn = (µn1, . . . , µnT)′ der Erwartungswert der beobachtbaren bin¨aren Responsevariablen bei festen Einflussgr¨oßen Xn = (xn1, . . . ,xnT)′, der als korrekt spezifiziert vorausge-setzt wird. F¨ur das bin¨are Probitmodell ist µnt = Φ(x′ntβ∗). Dann ist der GEE-Sch¨atzer f¨ur den systematischen Teil des Regressionsmodells jenes ˆβ∗, das die Sch¨atzgleichungen
XN n=1
∂µn
∂β∗ Ω−1n (yn−µn) =0 (4.3) l¨ost. F¨ur die Ableitung ∂µn/∂β∗ erh¨alt man ausgehend von der Probits-pezifikation∂µn/∂β∗=X′nDn, mitDn= Diag(ϕ(x′n1β∗), . . . , ϕ(x′nTβ∗)).
Die Matrix Ωn ist die Kovarianzmatrix der Responsevariablen yn. Liang und Zeger (1986) schlagen eine Kovarianzmatrix der Form
Ωn=V1/2n R(γ)V1/2n mit Vn= Diag(µn1(1−µn1), . . . , µnT(1−µnT)) vor. Dabei istR(γ) die unbekannte Korrelationsmatrix der beobachtbaren Responsevariablen, die f¨ur alle Einheiten als identisch angenommen wird und γ ein Vektor, der die nicht interessierenden Strukturparameter der Korrelationsmatrix enth¨alt. Sowohl die Struktur als auch der Parameter γ sind im Allgemeinen nicht bekannt. Nach Festlegung einer Struktur f¨ur R(γ) ist daherγ gegebenenfalls zu sch¨atzen.
Abweichend von Liang und Zeger (1986) oder Sharples und Breslow (1992) wird im Folgenden zur Sch¨atzung von γ zun¨achst die ¨ubliche Pearson-Korrelationsmatrix der Residuen4 (yn−µn) berechnet, die un-ter den ¨ublichen Bedingungen positiv definit ist. Das weitere Vorgehen h¨angt davon ab, welche Annahme bez¨uglich der Korrelationsstruktur ge-troffen wird. Wird eine Equi-Korrelationsstruktur angenommen, dann ist γ ein Skalar und ˆγ das zur¨ucktransformierte arithmetische Mittel ¨uber die Z-transformierten T(T −1)/2 Elemente der unteren Dreiecksmatrix der gesch¨atzten Korrelationsmatrix. Bei Annahme einer unrestringierten Kor-relationsmatrix geht die aus den Residuen gesch¨atzte KorKor-relationsmatrix in die Sch¨atzgleichungen ein. Wird eine oder eine gemischte AR(1)-und Equi-Korrelationsstruktur — hier immer in den beobachtbaren Resi-duen — angenommen, dann wird die Funktion
q(γ) = (ˆz−M2h(γ))′(ˆz−M2h(γ))
nach γ minimiert. Dabei ist ˆz = (ˆz21,zˆ31,zˆ32, . . .)′ der (T(T −1) × 1)-Vektor, der die Z-transformierten Elemente der unteren Dreiecksmatrix der gesch¨atzten Korrelationsmatrix enth¨alt. Die ZuordnungsmatrixM2 ist identisch mit der entsprechenden Matrix in Abschnitt 4.3. Auch die Funkti-on h(γ) entspricht jeweils der in Abschnitt 4.3 gegebenen Funktion. Unter Annahme einer AR(1)-Struktur wird γ zu einem Skalar und als Korrelati-on erh¨alt man corr((ynt−µnt)(ynt′ −µnt′)) =γ|t−t′|. Bei einer gemischten AR(1)- und Equi-Korrelationsstruktur ist γ ein zweidimensionaler Vektor und
corr((ynt−µnt)(ynt′−µnt′)) =γ1+ (1−γ1)γ2|t−t′|.
In beiden F¨allen kann die Sch¨atzung von γuber das Newton-Raphson Ver-¨ fahren erfolgen.
Die Sch¨atzung der Parameter β∗ und γ erfolgt iterativ, wobei in je-dem Iterationsschritt (l= 1,2, . . .) zun¨achst, ausgehend von einem Sch¨atz-wert ˆβ∗l−1, ein Sch¨atzwert f¨ur γ berechnet wird, um anschließend ¨uber
4Anstatt der Residuen k¨onnten auch standardisierte Residuen verwendet werden. In Simulationen traten allerdings keine Unterschiede in den resultierenden GEE-Sch¨atzern auf (Spieß und Hamerle, 2000).
eine modifizierte Fisher-Scoring Methode einen neuen Sch¨atzwert f¨ur β∗ zu berechnen. Sei D = Bdiag(D1, . . . ,DN), Ω = Bdiag(Ω1, . . . ,ΩN) und µ = (µ′1, . . . ,µ′N)′, dann erh¨alt man den in jedem Schritt aktualisierten Sch¨atzwert f¨urβ∗ uber die Beziehung¨
βˆ∗l = ˆβ∗l−1−
−(X′DΩ−1DX)−1X′DΩ−1(y−µ) βˆ∗
l−1.
Dabei ist−X′DΩ−1DX eine Approximation an die Ableitung der verall-gemeinerten Sch¨atzgleichungen nachβ∗,
( ∂
∂β∗X′DΩ−1(y−µ)) =−X′DΩ−1DX+ ( ∂
∂β∗DΩ−1)(X⊗(y−µ)).
Als Abbruchkriterien k¨onnen dieselben Kriterien wie f¨ur die Sch¨atzung der Parameter im Random Effects Probitmodell gew¨ahlt werden.
4.4.1 Eigenschaften der GEE-Sch¨atzer
Mit einem konsistenten Sch¨atzer f¨ur γ und unter recht schwachen Regu-larit¨atsbedingungen ist der Sch¨atzer ˆβ∗, der die verallgemeinerten Sch¨atz-gleichungen 4.3 l¨ost, konsistent und asymptotisch normalverteilt mit einer Kovarianzmatrix, die mitCov(ˆd β∗) =Gb−1WcGb−1, wobei
Gb =−(X′DΩ−1DX)βˆ∗,ˆγ und
Wc = (X′DΩ−1Cov(y)Ωd −1DX)βˆ∗,ˆγ mit
Cov(y) = Bdiag((yd 1−µ1)(y1−µ1)′, . . . ,(yN −µN)(yN −µN)′), konsistent gesch¨atzt werden kann (Liang und Zeger, 1986). Zentral f¨ur dieses Ergebnis ist die korrekte Spezifikation des Erwartungswertes E(yn|Xn) =µnbei festen Einflussgr¨oßen. Weder muss die Korrelationsma-trixR(γ) korrekt spezifiziert sein, noch ist f¨urγein bestimmter Sch¨atzer zu
verwenden. Letzterer muss lediglich, ausgehend von der gew¨ahlten Korrela-tionsstruktur, konsistent sein. Die Begr¨undung f¨ur diese Ergebnisse liegt in den Sch¨atzgleichungen selbst, denn diese setzen sich aus dem Produkt zwei-er Tzwei-erme zusammen, wovon dzwei-er zwei-erste eine Funktion von γ aber nicht von yn und der zweite nicht abh¨angig von γ, und dessen Erwartungswert null ist (Liang und Zeger, 1986, 1995). Obwohl der Sch¨atzer ˆβ∗ auch bei einer Fehlspezifikation der Korrelationsmatrix konsistent ist, muss in diesem Fall mit einer, relativ zu einer korrekten Spezifikation der Korrelationsmatrix, geringeren (asymptotischen) Effizienz gerechnet werden.
F¨ur spezielle Situationen k¨onnen weitergehende Ergebnisse gezeigt wer-den (z.B. Fitzmaurice, Laird und Rotnitzky, 1993; Mancl und Leroux, 1996;
McDonald, 1993; Spieß und Hamerle, 1996). Liegt etwa f¨ur jede Einheit die-selbe regul¨are und damit invertierbare Matrix Xn vor, dann ist der GEE-Sch¨atzer ˆβ∗ selbst und dessen asymptotische und gesch¨atzte Kovarianzma-trix unabh¨angig von der angenommenen KorrelationsmaKovarianzma-trix (siehe Anhang C.1). Weiterhin ist die asymptotische Varianz des GEE-Sch¨atzers gleich der asymptotischen Varianz eines
”Quasi-Likelihood“-Sch¨atzers, der innerhalb der Klasse der in den Responsevariablen linearen Sch¨atzer die kleinste Vari-anz aufweist (McCullagh, 1983). Entsprechende Datenmatrizen liegen etwa bei einem L¨angsschnittmodell vor, bei dem neben der Konstanten ledig-lich Dummy-Variablen, die Zeiteffekte kodieren ber¨ucksichtigt werden oder bei einem saturierten varianzanlytischen Modell mit Messwiederholungen auf allen Faktoren. Ein ¨ahnliches, wenn auch schw¨acheres Ergebnis erh¨alt man, wenn nicht ¨uber die Einheiten, sondern ¨uber die T Messwiederho-lungen invariante Einflussgr¨oßen betrachtet werden. In diesem Fall ist der Sch¨atzer sowie dessen asymptotische und gesch¨atzte Kovarianzmatrix le-diglich Funktion der Summe ¨uber die Zeilen beziehungsweise ¨uber Zeilen und Spalten der angenommenen Korrelatiosstruktur, das heißt die ange-nommene Korrelationsstruktur spielt nur eine unwesentliche Rolle (siehe Anhang C.2). Allerdings ist in diesem Fall die asymptotische Varianz der GEE-Sch¨atzer nicht identisch mit der asymptotischen Varianz der” Quasi-Likelihood“-Sch¨atzer. Weiterhin l¨asst sich zeigen, dass in diesem Fall die Annahme einer Equi-Korrelationsstruktur zu identischen Resultaten f¨uhrt
wie die Annahme der Unabh¨angigkeit (siehe Anhang C.2).
Die Eigenschaften von GEE-Sch¨atzern wurden, meist im Kontext von Logitmodellen, in einigen Arbeiten mit Hilfe von Simulationen oder, f¨ur sehr einfache Modelle, analytisch untersucht (z.B. Emrich und Piedmon-te, 1992; Lee, Scott und Soo, 1993; Liang und Zeger, 1986; Sharples und Breslow, 1992). Generelles Ergebnis dieser Untersuchungen ist, dass die GEE-Sch¨atzer relativ zu dem jeweils entsprechenden ML-Sch¨atzer auch in endlichen Stichproben recht brauchbar und der Effizienzverlust zwar bei einer f¨alschlicherweise gemachten Unabh¨angigkeitsannahme gr¨oßer als bei der korrekten Spezifikation der Korrelationsmatrix, im Allgemeinen aber nicht sehr groß ist.
Prentice (1988) weist darauf hin, dass die Korrelation bin¨arer Respon-sevariablen durch die jeweiligen marginalen Wahrscheinlichkeiten restrin-giert ist. Sharples und Breslow (1992) berichten von Konvergenzproblemen f¨ur ein Logitmodell mit zwei bin¨aren Einflussgr¨oßen, wenn diese Restrik-tionen verletzt werden. Dabei traten entweder mehrere L¨osungen f¨ur die Sch¨atzgleichungen oder negative Varianzsch¨atzungen auf. In Modellen mit
¨uber alle Beobachtungspunkte variierenden Einflussgr¨oßen, die mehr als zwei verschiedene Werte annehmen k¨onnen ist allerdings zu erwarten, dass diese Restriktion zumindest in einigen F¨allen verletzt ist. In diesem Zusam-menhang ist nicht gekl¨art, ab welchem Anteil an Restriktionsverletzungen Konvergenzprobleme auftreten k¨onnen.
Die in diesem Abschnitt beschriebenen GEE-Sch¨atzer k¨onnen auch als GMM-Sch¨atzer (
”generalized methods of moments“-Sch¨atzer; z.B Avery, Hansen und Hotz, 1983; Hansen, 1982) aufgefasst werden. W¨ahrend die GEE-Sch¨atzer auf einem biometrischen Hintergrund vorgeschlagen wurden, wurden GMM-Sch¨atzer im ¨okonometrischen Kontext entwickelt. F¨ur eine Einf¨uhrung in die Theorie der GMM-Sch¨atzer siehe etwa Davidson und MacKinnon (1993).