GEE-Sch¨ atzung des allgemeinen Modells - Analyse von Längsschnittdaten mit fehlenden Werten: G

Die MatrixM2ist hier dieselbe wie f¨ur die AR(1)-Struktur. Zur Parameter-sch¨atzung kann wieder das Newton-Raphson Verfahren in Verbindung mit der bereits beschriebenen Line-Search Methode verwendet werden.

In allen drei Schritten ist wie f¨ur die Sch¨atzung der Parameter des Ran-dom Effects Probitmodells bei der iterativen Sch¨atzung die Festlegung von Abbruchkriterien notwendig. Die f¨ur die Sch¨atzung der in diesem Abschnitt behandelten Modellspezifikationen notwendigen Ableitungen findet man in Spieß (1995).

Die Sch¨atzer dieses dreistufigen Verfahrens sind, unter den ¨ublichen Regularit¨atsbedingungen, konsistent und asymptotisch normalverteilt mit einer Kovarianzmatrix, die mit

Cov(θ) =d N⁻¹(GcbW⁻¹G)b ⁻¹

undGb = (∂g(θ)/∂θ)_θ=ˆ_θ, konsistent gesch¨atzt werden kann (K¨usters, 1987;

Shapiro, 1986).

Die praktische Berechnung der Sch¨atzer ist allerdings problematischer als im Falle des Random Effects Probit Modells. So finden Spieß und Ha-merle (2000) vor allem in kleineren Stichproben und bei h¨oheren Korre-lationen Konvergenzprobleme. Im Allgemeinen treten diese Probleme im zweiten Schritt, bei der Sch¨atzung der T(T −1)/2 Korrelationen auf. Das ist nicht ¨uberraschend, denn bereits bei T = 5 Zeitpunkten sind 10 Kor-relationen zu sch¨atzen. Sind die wahren KorKor-relationen hoch, dann steigt die Wahrscheinlichkeit mit kleiner werdenden Datens¨atzen daf¨ur, dass f¨ur wenigstens eine Korrelation die Folge der Sch¨atzwerte nicht konvergiert.

Ge-gen¨uber einer ML-Sch¨atzung, f¨ur die eine vollst¨andige Spezifikation der entsprechenden Verteilung erforderlich ist, basiert die GEE-Sch¨atzung —

¨ahnlich wie das im letzten Abschnitt beschriebene dreistufige Verfahren — lediglich auf einer teilweisen Spezifikation des beteiligten Zufallsmechanis-mus. Eine Einbettung der Methode der verallgemeinerten Sch¨atzgleichun-gen in den

”Quasi-Likelihood“-Ansatz sowie die Darstellung der Beziehun-gen zu alternativen Methoden findet man in (Liang und Zeger, 1995).

F¨ur das hier betrachtete Modell sind — im Rahmen der GEE-Methode

— die identifizierbaren Parameter des systematischen Teils die inhaltlich interessierenden Parameter und die Korrelationsstrukturparameter die un-interessanten Parameter. Letztere werden auch als

”nuisance“ oder

” inci-dental“ Parameter bezeichnet. Sei E(y_n|Xn) = µ_n = (µn1, . . . , µnT)^′ der Erwartungswert der beobachtbaren bin¨aren Responsevariablen bei festen Einflussgr¨oßen X_n = (x_n1, . . . ,x_nT)^′, der als korrekt spezifiziert vorausge-setzt wird. F¨ur das bin¨are Probitmodell ist µnt = Φ(x^′_ntβ^∗). Dann ist der GEE-Sch¨atzer f¨ur den systematischen Teil des Regressionsmodells jenes ˆβ^∗, das die Sch¨atzgleichungen

XN n=1

∂µ_n

∂β^∗ Ω⁻¹_n (y_n−µ_n) =0 (4.3) l¨ost. F¨ur die Ableitung ∂µ_n/∂β^∗ erh¨alt man ausgehend von der Probits-pezifikation∂µ_n/∂β^∗=X^′_nD_n, mitD_n= Diag(ϕ(x^′_n1β^∗), . . . , ϕ(x^′_nTβ^∗)).

Die Matrix Ω_n ist die Kovarianzmatrix der Responsevariablen y_n. Liang und Zeger (1986) schlagen eine Kovarianzmatrix der Form

Ω_n=V^1/2_n R(γ)V^1/2_n mit V_n= Diag(µ_n1(1−µ_n1), . . . , µ_nT(1−µ_nT)) vor. Dabei istR(γ) die unbekannte Korrelationsmatrix der beobachtbaren Responsevariablen, die f¨ur alle Einheiten als identisch angenommen wird und γ ein Vektor, der die nicht interessierenden Strukturparameter der Korrelationsmatrix enth¨alt. Sowohl die Struktur als auch der Parameter γ sind im Allgemeinen nicht bekannt. Nach Festlegung einer Struktur f¨ur R(γ) ist daherγ gegebenenfalls zu sch¨atzen.

Abweichend von Liang und Zeger (1986) oder Sharples und Breslow (1992) wird im Folgenden zur Sch¨atzung von γ zun¨achst die ¨ubliche Pearson-Korrelationsmatrix der Residuen⁴ (y_n−µ_n) berechnet, die un-ter den ¨ublichen Bedingungen positiv definit ist. Das weitere Vorgehen h¨angt davon ab, welche Annahme bez¨uglich der Korrelationsstruktur ge-troffen wird. Wird eine Equi-Korrelationsstruktur angenommen, dann ist γ ein Skalar und ˆγ das zur¨ucktransformierte arithmetische Mittel ¨uber die Z-transformierten T(T −1)/2 Elemente der unteren Dreiecksmatrix der gesch¨atzten Korrelationsmatrix. Bei Annahme einer unrestringierten Kor-relationsmatrix geht die aus den Residuen gesch¨atzte KorKor-relationsmatrix in die Sch¨atzgleichungen ein. Wird eine oder eine gemischte AR(1)-und Equi-Korrelationsstruktur — hier immer in den beobachtbaren Resi-duen — angenommen, dann wird die Funktion

q(γ) = (ˆz−M₂h(γ))^′(ˆz−M₂h(γ))

nach γ minimiert. Dabei ist ˆz = (ˆz₂₁,zˆ₃₁,zˆ₃₂, . . .)^′ der (T(T −1) × 1)-Vektor, der die Z-transformierten Elemente der unteren Dreiecksmatrix der gesch¨atzten Korrelationsmatrix enth¨alt. Die ZuordnungsmatrixM2 ist identisch mit der entsprechenden Matrix in Abschnitt 4.3. Auch die Funkti-on h(γ) entspricht jeweils der in Abschnitt 4.3 gegebenen Funktion. Unter Annahme einer AR(1)-Struktur wird γ zu einem Skalar und als Korrelati-on erh¨alt man corr((ynt−µ_nt)(y_nt^′ −µ_nt^′)) =γ^|t−t^′^|. Bei einer gemischten AR(1)- und Equi-Korrelationsstruktur ist γ ein zweidimensionaler Vektor und

corr((y_nt−µ_nt)(y_nt^′−µ_nt^′)) =γ₁+ (1−γ₁)γ₂^|t−t^′^|.

In beiden F¨allen kann die Sch¨atzung von γuber das Newton-Raphson Ver-¨ fahren erfolgen.

Die Sch¨atzung der Parameter β^∗ und γ erfolgt iterativ, wobei in je-dem Iterationsschritt (l= 1,2, . . .) zun¨achst, ausgehend von einem Sch¨atz-wert ˆβ^∗_l−1, ein Sch¨atzwert f¨ur γ berechnet wird, um anschließend ¨uber

4Anstatt der Residuen k¨onnten auch standardisierte Residuen verwendet werden. In Simulationen traten allerdings keine Unterschiede in den resultierenden GEE-Sch¨atzern auf (Spieß und Hamerle, 2000).

eine modifizierte Fisher-Scoring Methode einen neuen Sch¨atzwert f¨ur β^∗ zu berechnen. Sei D = Bdiag(D₁, . . . ,D_N), Ω = Bdiag(Ω₁, . . . ,Ω_N) und µ = (µ^′₁, . . . ,µ^′_N)^′, dann erh¨alt man den in jedem Schritt aktualisierten Sch¨atzwert f¨urβ^∗ uber die Beziehung¨

βˆ^∗_l = ˆβ^∗_l−1−

−(X^′DΩ⁻¹DX)⁻¹X^′DΩ⁻¹(y−µ) _β_ˆ^∗

l−1.

Dabei ist−X^′DΩ⁻¹DX eine Approximation an die Ableitung der verall-gemeinerten Sch¨atzgleichungen nachβ^∗,

( ∂

∂β^∗X^′DΩ⁻¹(y−µ)) =−X^′DΩ⁻¹DX+ ( ∂

∂β^∗DΩ⁻¹)(X⊗(y−µ)).

Als Abbruchkriterien k¨onnen dieselben Kriterien wie f¨ur die Sch¨atzung der Parameter im Random Effects Probitmodell gew¨ahlt werden.

4.4.1 Eigenschaften der GEE-Sch¨atzer

Mit einem konsistenten Sch¨atzer f¨ur γ und unter recht schwachen Regu-larit¨atsbedingungen ist der Sch¨atzer ˆβ^∗, der die verallgemeinerten Sch¨atz-gleichungen 4.3 l¨ost, konsistent und asymptotisch normalverteilt mit einer Kovarianzmatrix, die mitCov(ˆd β^∗) =Gb⁻¹WcGb⁻¹, wobei

Gb =−(X^′DΩ⁻¹DX)_β_ˆ^∗_,ˆ_γ und

Wc = (X^′DΩ⁻¹Cov(y)Ωd ⁻¹DX)_β_ˆ^∗_,ˆ_γ mit

Cov(y) = Bdiag((yd ₁−µ₁)(y₁−µ₁)^′, . . . ,(y_N −µ_N)(y_N −µ_N)^′), konsistent gesch¨atzt werden kann (Liang und Zeger, 1986). Zentral f¨ur dieses Ergebnis ist die korrekte Spezifikation des Erwartungswertes E(y_n|X_n) =µ_nbei festen Einflussgr¨oßen. Weder muss die Korrelationsma-trixR(γ) korrekt spezifiziert sein, noch ist f¨urγein bestimmter Sch¨atzer zu

verwenden. Letzterer muss lediglich, ausgehend von der gew¨ahlten Korrela-tionsstruktur, konsistent sein. Die Begr¨undung f¨ur diese Ergebnisse liegt in den Sch¨atzgleichungen selbst, denn diese setzen sich aus dem Produkt zwei-er Tzwei-erme zusammen, wovon dzwei-er zwei-erste eine Funktion von γ aber nicht von y_n und der zweite nicht abh¨angig von γ, und dessen Erwartungswert null ist (Liang und Zeger, 1986, 1995). Obwohl der Sch¨atzer ˆβ^∗ auch bei einer Fehlspezifikation der Korrelationsmatrix konsistent ist, muss in diesem Fall mit einer, relativ zu einer korrekten Spezifikation der Korrelationsmatrix, geringeren (asymptotischen) Effizienz gerechnet werden.

F¨ur spezielle Situationen k¨onnen weitergehende Ergebnisse gezeigt wer-den (z.B. Fitzmaurice, Laird und Rotnitzky, 1993; Mancl und Leroux, 1996;

McDonald, 1993; Spieß und Hamerle, 1996). Liegt etwa f¨ur jede Einheit die-selbe regul¨are und damit invertierbare Matrix X_n vor, dann ist der GEE-Sch¨atzer ˆβ^∗ selbst und dessen asymptotische und gesch¨atzte Kovarianzma-trix unabh¨angig von der angenommenen KorrelationsmaKovarianzma-trix (siehe Anhang C.1). Weiterhin ist die asymptotische Varianz des GEE-Sch¨atzers gleich der asymptotischen Varianz eines

”Quasi-Likelihood“-Sch¨atzers, der innerhalb der Klasse der in den Responsevariablen linearen Sch¨atzer die kleinste Vari-anz aufweist (McCullagh, 1983). Entsprechende Datenmatrizen liegen etwa bei einem L¨angsschnittmodell vor, bei dem neben der Konstanten ledig-lich Dummy-Variablen, die Zeiteffekte kodieren ber¨ucksichtigt werden oder bei einem saturierten varianzanlytischen Modell mit Messwiederholungen auf allen Faktoren. Ein ¨ahnliches, wenn auch schw¨acheres Ergebnis erh¨alt man, wenn nicht ¨uber die Einheiten, sondern ¨uber die T Messwiederho-lungen invariante Einflussgr¨oßen betrachtet werden. In diesem Fall ist der Sch¨atzer sowie dessen asymptotische und gesch¨atzte Kovarianzmatrix le-diglich Funktion der Summe ¨uber die Zeilen beziehungsweise ¨uber Zeilen und Spalten der angenommenen Korrelatiosstruktur, das heißt die ange-nommene Korrelationsstruktur spielt nur eine unwesentliche Rolle (siehe Anhang C.2). Allerdings ist in diesem Fall die asymptotische Varianz der GEE-Sch¨atzer nicht identisch mit der asymptotischen Varianz der” Quasi-Likelihood“-Sch¨atzer. Weiterhin l¨asst sich zeigen, dass in diesem Fall die Annahme einer Equi-Korrelationsstruktur zu identischen Resultaten f¨uhrt

wie die Annahme der Unabh¨angigkeit (siehe Anhang C.2).

Die Eigenschaften von GEE-Sch¨atzern wurden, meist im Kontext von Logitmodellen, in einigen Arbeiten mit Hilfe von Simulationen oder, f¨ur sehr einfache Modelle, analytisch untersucht (z.B. Emrich und Piedmon-te, 1992; Lee, Scott und Soo, 1993; Liang und Zeger, 1986; Sharples und Breslow, 1992). Generelles Ergebnis dieser Untersuchungen ist, dass die GEE-Sch¨atzer relativ zu dem jeweils entsprechenden ML-Sch¨atzer auch in endlichen Stichproben recht brauchbar und der Effizienzverlust zwar bei einer f¨alschlicherweise gemachten Unabh¨angigkeitsannahme gr¨oßer als bei der korrekten Spezifikation der Korrelationsmatrix, im Allgemeinen aber nicht sehr groß ist.

Prentice (1988) weist darauf hin, dass die Korrelation bin¨arer Respon-sevariablen durch die jeweiligen marginalen Wahrscheinlichkeiten restrin-giert ist. Sharples und Breslow (1992) berichten von Konvergenzproblemen f¨ur ein Logitmodell mit zwei bin¨aren Einflussgr¨oßen, wenn diese Restrik-tionen verletzt werden. Dabei traten entweder mehrere L¨osungen f¨ur die Sch¨atzgleichungen oder negative Varianzsch¨atzungen auf. In Modellen mit

¨uber alle Beobachtungspunkte variierenden Einflussgr¨oßen, die mehr als zwei verschiedene Werte annehmen k¨onnen ist allerdings zu erwarten, dass diese Restriktion zumindest in einigen F¨allen verletzt ist. In diesem Zusam-menhang ist nicht gekl¨art, ab welchem Anteil an Restriktionsverletzungen Konvergenzprobleme auftreten k¨onnen.

Die in diesem Abschnitt beschriebenen GEE-Sch¨atzer k¨onnen auch als GMM-Sch¨atzer (

”generalized methods of moments“-Sch¨atzer; z.B Avery, Hansen und Hotz, 1983; Hansen, 1982) aufgefasst werden. W¨ahrend die GEE-Sch¨atzer auf einem biometrischen Hintergrund vorgeschlagen wurden, wurden GMM-Sch¨atzer im ¨okonometrischen Kontext entwickelt. F¨ur eine Einf¨uhrung in die Theorie der GMM-Sch¨atzer siehe etwa Davidson und MacKinnon (1993).

Im Dokument Analyse von Längsschnittdaten mit fehlenden Werten: Grundlagen, Verfahren und Anwendungen. (Seite 122-128)