• Keine Ergebnisse gefunden

Fazit: Hinweise zur Auswahl statistischer Modelle und Prozeduren bei l¨angsschnittlichen Datenanalysenund Prozeduren bei l¨angsschnittlichen Datenanalysen

Modelle und Prozeduren

3. Die Vorgehensweise bei der SEM-Parametersch¨atzung besteht dann darin, daß wie auch im ” konventionellen“ Fall ohne fehlende Werte Σ und µ als Funktionen eines Vektors der

2.4 Fazit: Hinweise zur Auswahl statistischer Modelle und Prozeduren bei l¨angsschnittlichen Datenanalysenund Prozeduren bei l¨angsschnittlichen Datenanalysen

Nachdem in den vorangegangen Unterkapiteln der Darstellung und Diskussion verschie-dener statistischer Analysemodelle sehr viel Raum gegeben wurde, erscheint es an dieser Stelle angebracht, aus alledem ein Resultat in Form einer Art praktischer Handreichung

ab-22Bei unvollst¨andiger Datenmatrix produziert das saturierte Modell nicht zwangsl¨aufig eine perfekte An-passung.

zuleiten, welche nicht nur f¨ur die im folgenden dargestellten eigenen empirischen Analysen dienlich war, sondern auch einem Leser dieser Abhandlung f¨ur zuk¨unftige l¨angsschnittliche Analysen hilfreich sein k¨onnte.

Im Grunde jedoch sind solche praktischen Empfehlungen in den vorherigen Darlegun-gen bereits enthalten, so daß hier nur noch die zusammenfassende Auflistung der darin m.E.

wesentlichsten Punkte bleibt:

I Zur Analyse von Kohorteneffekten bzw. zur Trennung von Alters- und Kohorten-effekten in l¨angsschnittlichen Daten eignet sich ein Multilevel-Regressionsmodell, wie es in Kapitel 2.1 dargestellt wurde. Der Nachteil dieser Modellierung liegt in den dar-in implizierten Ldar-inearit¨atsannahmen – welche allerddar-ings durch die Edar-inf¨uhrung expo-nentieller Pr¨adiktorterme f¨ur Alter und Kohorte modifiziert werden k¨onnten –, sowie in der M¨oglichkeit eines durch dieses Modell unentdeckten Periodeneffekts, der hier zum gesch¨atzten Alters- und Kohorteneffekt beitragen kann. Demgegen¨uber besitzt diese Mo-dellierung viele Vorteile, die f¨ur die hier relevante Fragestellung gar nicht alle genutzt werden m¨ussen: Es wird durch die Random-Komponente des Alters interindividuelle Va-riabilit¨at der Wirksamkeit des Alterseffekts erfaßt (entsprechend der Slope-Varianz in den bekannteren Growth-Models), dazu besteht die prinzipielle M¨oglichkeit, weitere Pr¨adik-toren auf dem

”Personenlevel“ einzuf¨ugen und damit die Abh¨angigkeit alterskorrelier-ter Ver¨anderungen von diesen Pr¨adiktoren zu unalterskorrelier-tersuchen, außerdem wird bei der ¨ubli-chen Maximum-Likelihood-Parametersch¨atzung dieses Modells eine Modellanpassung f¨ur alle vorhandenen Meßwerte durchgef¨uhrt, so daß Merkmalstr¨ager mit fehlenden Wer-ten nicht ausgeschlossen und auch fehlende Werte nicht ersetzt werden m¨ussen – das Verfahren erf¨ullt das im Kapitel 2.3.1 erl¨auterte Kriterium der

”ignorability“ von MAR-Datenausf¨allen.

I Zur Analyse von Stabilit¨at und Ver¨anderung eines Merkmals ist aufgrund der Vermi-schung von Reliabilit¨at und tats¨achlicher Stabilit¨at in Meßwertkovarianzen bzw. -korre-lationen eine meßfehlerbereinigte Sch¨atzung von Stabilit¨atsparametern w¨unschenswert, wie sie durch l¨angsschnittliche Strukturgleichungsmodelle mit latenten True-Score-Kom-ponenten erm¨oglicht wird. Das f¨ur die nachfolgenden Analysen ausgew¨ahlte QMSM ist dann zu empfehlen, wenn Merkmalsstabilit¨at

”unvoreingenommen“ durch bestimmte theoretisch vorab spezifizierte Verlaufsmodelle der Ver¨anderung untersucht werden soll.

LDCM und LDSM stellen im Grunde modifizierte Modellvarianten des QMSM dar, de-ren Besonderheit in der expliziten Modellierung von Ver¨anderungswerten liegt, welche im ersteren Falle als modellexogene, im letzteren als jeweils vom vorherigen True-Score abh¨angige absolute Ver¨anderungsbetr¨age modelliert sind. Solche Modellvarianten k¨onnen v.a. dann n¨utzlich sein, wenn weitere exogene Einflußgr¨oßen auf die Ver¨anderung einbe-zogen werden sollen, welche dann als Pr¨adiktoren der Ver¨anderungsbetr¨age modellierbar w¨aren. Das weithin bekannte LGCM ist durch eine im Vergleich zu den vorgenannten Mo-dellen erheblich restriktivere Modellierung der stattfindenden Ver¨anderung gekennzeich-net: Wie gezeigt handelt es sich um ein Verlaufsmodell, durch welches gewissermaßen

die Form der zeitlichen Ver¨anderung interindividuell invariant festgesetzt (z.B. im ein-fachsten Falle als lineare Ver¨anderung) und Variation zwischen den Merkmalstr¨agern nur in den Parametern, die diese Verlaufsform beschreiben (z.B. die Steigung des linearen Verlaufs) zugelassen ist. Das LGCM w¨are somit dann nicht geeignet, wenn solche Re-striktivit¨at der Fragestellung nicht angemessen scheint (wie im vorliegenden Fall), gibt es dagegen gute (theoretische) Gr¨unde f¨ur die Annahme, daß die zu untersuchende Ver¨ande-rung durch ein interindividuell invariantes Verlaufsmodell hinreichend abgebildet werden kann, so besitzt das LGCM den Vorteil der gr¨oßeren Sparsamkeit und ist den vorgenann-ten Modellen vorzuziehen.

I Ein in l¨angsschnittlichen Untersuchungen nahezu zwangsl¨aufig sich ergebendes Pro-blem sind große Anzahlen fehlender Werte infolge des Dropouts im Panelverlauf. Im Kapitel 2.3.1.3 wurden Methoden des Umgangs mit fehlenden Werten aufgef¨uhrt, die gegen¨uber weitverbreiteten Vorgehensweisen wie dem fallweisen Ausschluß erhebliche Vorteile aufweisen – insbesondere den, daß die Unverzerrtheit der daraus resultieren-den Sch¨atzungen nicht an die sehr restriktive Annahme der vollst¨andigen Zuf¨alligkeit der Datenausf¨alle (MCAR) gekn¨upft ist, sondern an die weniger restriktive Bedingung von MAR-Datenausf¨allen. Letztere ist leicht dadurch herzustellen, daß Pr¨adiktoren des Da-tenausfalls ins statistische Modell einbezogen werden. Es ist also zu empfehlen, bei der Berechnung l¨angsschnittlicher Strukturgleichungsmodelle mit gr¨oßeren Dropoutraten ei-ne der an die MAR-Bedingung gekn¨upften Methoden anzuwenden – besonders einfach ist hier die Anwendung der FIML-Sch¨atzung. Von diesen Empfehlungen abgesehen be-steht sozusagen die praktische Handreichung bez¨uglich des Problems fehlender Werte im Grunde in der Verfassung des Kapitels 2.3.1 selbst, denn vorhandene Texte zu diesem Thema erscheinen oft sehr wenig verst¨andlich, weil sie entweder formal hochkomplex, oder aber im Gegenteil zu oberfl¨achlich gehalten sind. Im obigen Kapitel wurde versucht, in dieser Hinsicht einen Mittelweg zu gehen – wof¨ur dann auch eine etwas umf¨angliche L¨ange dieser Ausf¨uhrungen in Kauf genommen wurde: Es schien hier durchaus lohnend, einmal den

”Stand der Dinge“ einigermaßen ausf¨uhrlich zu dokumentieren.

I Bei der Anwendung von Strukturgleichungsmodellen ist der Vergleich von

”nested models“ eine h¨aufig gew¨ahlte Vorgehensweise: Ihre Attraktivit¨at besteht in der M¨oglich-keit, theoretische Annahmen in verschiedene Modellrestriktionen eines Modells zu ¨uber-setzen und durch diesen Vergleich zu testen. Dabei aber kann oft ein praktisches Problem in der zu großen Testst¨arke des ∆χ2-Test bei hinreichend großen Untersuchungsstich-proben bestehen, wodurch dann auch geringf¨ugige Unterschiede in der Modellanpassung statistisch signifikant werden. Die in Unterkapitel 2.3.2 aufgestellten Entscheidungsre-geln f¨ur den Modellvergleich k¨onnen hier als Beispiel dienen, wie man stattdessen vor-gehen k¨onnte. Sie sind aber, darauf sei nochmals hingewiesen, praktische Festlegungen f¨ur die nachfolgenden Analysen, welche nicht entsprechenden Ver¨offentlichungen in der SEM-Literatur entnommen wurden.

Outline

ÄHNLICHE DOKUMENTE