4 Prä-Post-Vergleiche zur Schätzung kausaler Effekte
4.1 Einfaches Prä-Post-Design
Wir beginnen zunächst bei einem einfachen Prä-Post-Design, in dem zunächst ein Vortest Y0 erhoben wird, man dann eine experimentelle Behandlung (eine Interven-tion, eine Exposition) vornimmt und schließlich den Nachtest (die Outcomevariable) Y1 beobachtet.
Den Vortest können wir immer in die Summe seiner True-score-Variablen η0≡ E(Y0 |U) und seines Residuums ε0 zerlegen (s. STEYER/EID, 2001). Demnach können wir auch schreiben:
Y0 = η0 + ε0. (V.15)
Die Outcomevariable Y1, die nach der experimentellen Behandlung erhoben wird, lässt sich ebenfalls additiv in die Summe ihrer True-score-Variablen η1 ≡ E(Y1|U) und ihres Residuum ε1 zerlegen. Es gilt also:
Y1 = η1 + ε1 = η0 + (η1−η0) + ε1 = η0 + η1−0 + ε1, (V.16) wobei η1−0 ≡ η1−η0 die latente Veränderungsvariable bezeichnet. In Abbildung V.1 ist dieses noch nicht identifizierte Modell als Pfaddiagramm dargestellt. Dieses Modell ist selbst dann nicht identifiziert, wenn wir die Annahme unkorrelierter Mess-fehler,
Cov(ε0, ε1) = 0 (V.17)
hinzufügen, d. h. die Varianzen Var(η0), Var(η1−0), Var(ε0) und Var(ε1) sowie die Kovarianz Cov(η0, η1−0) - das sind die 5 theoretischen Parameter - lassen sich nicht aus den vom Modell implizierten 3 Gleichungen für die Varianzen Var(Y0), Var(Y1) und der Kovarianz Cov(Y0, Y1) der beobachtbaren Variablen bestimmen.
Diese missliche Lage kann man jedoch dadurch beheben, dass wir statt eines einzi-gen Vortests zwei und anstatt eines einzieinzi-gen Nachtests zwei erheben und dazu die folgenden Annahmen einführen:
Yi0 = η0 + εi0 , i = 1, 2, (V.18)
Yi1 = η1 + ε i1 (V.19)
= η0 + (η1−η0) + ε i1 = η0 + η1−0 + ε i1, i = 1, 2
Cov(ε10, ε20) = Cov(ε11, ε21) = Cov(εi0, εj1) = 0, i, j = 1, 2, (V.20) (s. Abb. V.2). Bei (V.18) handelt es sich um die Annahme der Äquivalenz (Gleichheit) der True-score-Variablen der beiden Vortests und bei (V.19) um die Annahme der Äquivalenz der True-score-Variablen der beiden Nachtests. (Die zweite Zeile dieser Gleichung ist nur eine allgemeingültige Umformung, in der die latente Veränderungs-variable η1−0≡η1−η0 eingeführt wird.) Darüber hinaus folgen bereits aus der Defini-tion der True-score-Variablen und der Residuen:
Cov(εit, η0) = Cov(εit, η1−0) = 0, i = 1, 2, t = 0, 1. (V.21)
Diese Gleichungen definieren bereits ein überidentifiziertes Modell, d. h. ein Modell, das durch den Vergleich der von diesem Modell implizierten Kovarianzmatrix mit der empirischen Kovarianzmatrix der beobachtbaren Variablen Yi0 und Yj1 empirisch prüfbar ist.
Darüber hinaus müssen wir die Annahmen machen, dass es sich bei den in den obi-gen Gleichunobi-gen vorkommenden latenten Variablen η0 und η1 tatsächlich um die in Abschnitt 2 definierten True-outcome-Variablen τ0 in der experimentellen Bedingung 0 (= Nichtbehandlung) bzw. τ1 in der Bedingung 1 (= Behandlung) handelt, dass also gilt:
η0≡ E(Yi0 |U) = τ0, i = 1, 2, (V.22) η1≡ E(Yi1 |U) = τ1, i = 1, 2. (V.23) Erst diese Annahmen ermöglichen die Interpretation der Werte der latenten Diffe-renzvariablen η1−0 als individuelle kausale Effekte. Stimmen die letzten beiden Annahmen, dann sind die Werte von η1−0 die individuellen kausalen Effekte der zwi-schen Vor- und Nachtests durchgeführten experimentellen Behandlung, der Erwar-tungswert E(η1−0) ist der durchschnittliche kausale Effekt des Treatments, die Vari-anz von η1−0 gibt an, wie stark die individuellen kausalen Effekte von ihrem Erwar-tungswert abweichen und die Kovarianz Cov(η0, η1−0) beschreibt, wie stark die indi-viduellen kausalen Effekte des Treatments vom fehlerbereinigten Vortest η0 abhän-gen. Darüber hinaus kann man weitere Variablen in das Modell einführen, die neben η0 möglicherweise ebenfalls vorhersagen können, wie groß ein individueller kausaler Effekt sein wird.
Wir zeigen nun zunächst, wie wir die Gültigkeit der Annahmen (V.18) bis (V. 20) prüfen können. Danach wenden wir uns der Überprüfung der Annahmen (V.22) und (V.23) zu.
Y10
ε10
Y20
ε20
Y11
ε11
Y21
ε21
η0
η1−0
Abb. V.2 Pfaddiagramm eines überidentifizierten Modells mit latenter Verände-rungsvariable η1−0≡η1−η0
Die vom Modell implizierte Kovarianzstruktur. Die vom Modell, genauer, die von den Gleichungen (V.18) bis (V.21) implizierte Kovarianzstruktur, lässt sich wie folgt beschreiben:
Var(Yi0) = Var(η0) + Var(εi0), i = 1, 2, (V.24) Var(Yi1) = Var(η0) + Var(η1−0) + 2 Cov(η0, η1−0) + Var(εi1), (V.25)
i = 1, 2,
Cov(Y10, Y20) = Var(η0), (V.26)
Cov(Y10, Y20) = Var(η0) + Var(η1−0) + 2 Cov(η0, η1−0), (V.27) Cov(Yi0, Yj1) = Var(η0) + Cov(η0, η1−0), i, j = 1, 2. (V.28) Demnach lassen sich die 10 (empirisch schätzbaren) Varianzen und Kovarianzen der beobachtbaren Variablen (s. jeweils die rechte Seite dieser Gleichungen) durch 7 theoretische Parameter (s. jeweils die linke Seite) beschreiben, wenn wir vorausset-zen, dass das Modell gilt. Die Zahl der Freiheitsgrade hinsichtlich der Kovari-anzstruktur beträgt demzufolge 10 − 7 = 3.
Eine Betrachtung dieser Gleichungen zeigt darüber hinaus, dass alle theoretischen Parameter identifiziert sind, d. h. sie lassen sich aus den Varianzen und Kovarianzen der beobachtbaren Variablen berechnen:
Var(η0) = Cov(Y10, Y20) (V.29)
[s. Gl. (V.26)],
Cov(η0, η1−0) = Cov(Yi0, Yj1) − Cov(Y10, Y20), i, j = 1, 2, (V.30) [s. Gln. (V.28), (V.26)],
Var(η1−0) = Cov(Y11, Y21) − 2Cov(Yi0, Yj1) − Cov(Y10, Y20), (V.31) [s. Gln. (V.27), (V.28), (V.26)], i, j = 1, 2,
Var(εi0) = Var(Yi0) − Cov(Y10, Y20), i = 1, 2, (V.32) [s. Gln. (V.24), (V.26)],
Var(εi1) = Var(Yi1) − Cov(Y11, Y21), i = 1, 2, (V.33) [s. Gln. (V.25), (V.27)].
Demnach können wir sowohl die Varianzen der latenten Variablen η0 und η1−0 als auch deren Kovarianz identifizieren. Sind auch unsere Annahmen (V.22) und (V.23) gültig, dann handelt es sich bei Var(η1−0) um die Varianz der individuellen kausalen Effekte.
Die vom Modell implizierte Mittelwertstruktur. Auch die vom Modell implizierte Mittelwertstruktur ist durchaus von Interesse und kann sowohl für die empirische Prüfung des Modells, als auch für die Identifizierung weiterer theoretischer Parame-ter genutzt werden. Die vom Modell implizierte Mittelwertstruktur ist:
E(Yi0) = E(η0), i = 1, 2, (V.34)
E(Yi1) = E(η0) + E(η1−0), i = 1, 2. (V.35)
Die 4 Erwartungswerte der beobachtbaren Variablen Yi0 und Yi1 lassen sich also aus den 2 Erwartungswerten der latenten Variablen η0 und η1−0 berechnen. Demnach beträgt die Zahl der Freiheitsgrade hinsichtlich der Mittelwertsstruktur 4 − 2 = 2, und die Gesamtzahl der Freiheitsgrade ist daher 3 + 2 = 5.
Auch die Implikationen des Modells hinsichtlich der Mittelwertsstruktur lassen sich natürlich empirisch überprüfen. In Strukturgleichungsmodellen kann dies sogar, zusammen mit der Überprüfung der implizierten Kovarianzstruktur, mit einem einzi-gen Signifikanztest geschehen.
Aus den Gleichungen (V.34) und (V.35) folgen trivialerweise
E(η0) = E(Yi0), i = 1, 2, (V.36)
aber auch:
E(η1−0) = E(Yj1) − E(Yi0), i, j = 1, 2. (V.37) Demnach können wir in diesem Modell auch die Erwartungswerte der Variablen η0 und η1−0 identifizieren. Sind auch unsere Annahmen (V.22) und (V.23) gültig, dann handelt es sich bei E(η1−0) um den durchschnittlichen kausalen Effekt der experi-mentellen Behandlung, die zwischen Vor- und Nachtests durchgeführt wird.
Y10
Abb. V.3 Pfaddiagramm eines überidentifizierten Modells mit latenter Verände-rungsvariable η1−0≡η1− η0 in der Experimentalgruppe (rechts) und ohne eine solche Veränderungsvariable in der Kontrollgruppe (links)
Wie lassen sich nun die Annahmen (V.22) und (V.23) überprüfen, auf denen die Interpretation der Werte der latenten Variablen η1−0 als individuelle kausale Effekte der experimentellen Behandlung beruht, die zwischen Vor- und Nachtests gegeben wurde? Ist tatsächlich η0 die True-outcome-Variable unter Nichtbehandlung und η1
die True-outcome-Variable unter der Behandlung? Oder gibt es in der betreffenden Anwendung vielleicht doch Test-Retest-Effekte, spontan auftretende Veränderungen (Spontanremission), entwicklungsbedingte Veränderungen oder Effekte von kriti-schen Lebensereignissen? Die bisher betrachteten Implikationen der Annahmen (V.18) bis (V.20) überprüfen nicht die Gültigkeit der kausalen Interpretation der Werte von η1−0. Die gerade aufgeführten alternativen Erklärungen (vgl. hierzu z. B.
CAMPBELL/STANLEY, 1963) machen deutlich, dass wahre (d. h.
messfehlerberei-nigte) Veränderungen auch aus anderen Gründen als der zwischenzeitlich durchge-führten experimentellen Behandlung auftreten können. Wie können wir also solche Alternativerklärungen ausschließen?