• Keine Ergebnisse gefunden

3.2 V ERWENDETE STATISTISCHE V ERFAHREN

3.2.2 Die Methode der statistischen Mehrebenenanalyse

3.2.2.1 Problemstellung und alternative Analysemodelle

Die dieser Analyse zugrunde liegenden Daten haben eine hierarchische, zweistufi-ge161 Struktur. Auf der ersten Ebene liegen Daten zu den einzelnen N=n1 Patienten vor, auf der zweiten Ebene Daten zu den N=n2 Einrichtungen, in denen die Patien-ten behandelt wurden.162 Da sich jeder Patient genau einem Krankenhaus zuordnen lässt, handelt es sich um eine hierarchische Datenstruktur.163 Ziel der Datenanalyse ist es dabei, den Einfluss unabhängiger Variablen auf der Patienten- und Einrich-tungsebene auf eine164 abhängige Variable auf der Patientenebene zu modellieren.

Da gewöhnlich n2<n1 ist, gibt es verschiedene Wege, durch die Analyse hierarchi-scher Daten solche Einflüsse zu analysieren.165

Die erste Möglichkeit besteht darin, getrennte Analysen für jede Einrichtung und ihre Patienten durchzuführen. Dazu werden die Einrichtungsdaten auf die erste Ebene

(1999: 208). Vgl. dazu auch Bortz (1999: 201) und Schroeder (1986: 33). Kritisch zum Determinations-koeffizienten als Indikator für Modellgüte äußert sich Fichman (1999).

156 Vgl. Tabachnik & Fidell (1996: 575ff.).

157 Vgl. Bortz (1999: 547ff.). Zu den Vorteilen der Ward-Aggregationsmethode vgl. Backhaus et al.

(2000: 365f.).

158 SPSS (1999).

159 Vgl. Rice & Leyland (1996: 155).

160 Vgl. Duncan et al. (1998: 97), Diez-Roux (2000). Für eine neuere Mehrebenenstudie vgl. Merlo et al. (2001).

161 Theoretisch können mit dem hier vorgestellten statistischen Verfahren beliebig viele Ebenen model-liert werden.

162 Man kann sich auch andere Untersuchungseinheiten vorstellen, z.B. Wähler in Wahlkreisen, Schü-ler in Schulklassen in Schulen oder Zähne in Unterkiefern. Um die folgende Darstellung etwas an-schaulicher zu gestalten, wird hier von Patienten und Einrichtungen gesprochen.

163 Ist dies nicht der Fall, müssen nicht-hierarchische Mehrebenenmodelle verwendet werden; vgl.

Rashbash & Browne (2001).

164 Wenn es mehrere unabhängige Variablen sind, handelt es sich um ein multivariates Modell.

165 Vgl. Rice & Leyland (1996), Duncan et al. (1998) und Snijders & Bosker (1999).

disaggregiert, und man führt n2 verschiedene Analysen mit einer Fallzahl von n1j

durch, wobei j für die jeweilige Einrichtung steht.

In einem zweiten, in der Praxis recht häufig gewählten Ansatz werden alle Daten in

einem gemeinsamen Regressionsmodell mit

=

Man kann diese Daten auch nach einem dritten Verfahren analysieren, indem man alle Daten wie beim zweiten Ansatz in einem Modell zusammenführt, aber zur Mo-dellierung von Einrichtungsspezifika für jede Einrichtung und jede Variable einen Dummy-Koeffizienten in das Modell einfügt.

Eine vierte Möglichkeit besteht darin, die Patientenvariablen auf die Einrichtungse-bene zu aggregieren und so die Einrichtungsvariablen etwa mit den jeweiligen Ein-richtungsmittelwerten der Patientenvariablen zu verknüpfen, wobei die der Analyse zugrunde liegende Fallzahl dann n2 beträgt. In Studien dieser Art wird etwa der durchschnittliche case-mix einer Einrichtung zu der durchschnittlichen Verweildauer der Patienten in dieser Einrichtung in Beziehung gesetzt.

Mit diesen Ansätzen sind allerdings eine Reihe von Problemen verbunden.

So ist die Verfolgung des ersten Ansatzes insbesondere dann schwierig, wenn n2 ein überschaubares Maß überschreitet. Denn mit zunehmendem n2 steigt nicht nur der Analyseaufwand. Es wird auch immer schwieriger, sich ein zusammenfassen-des Bild der interessierenden Zusammenhänge über alle untersuchten Einrichtun-gen hinweg zu machen. Es ist zudem nicht möglich, statistisch abgesicherte Aussa-gen zu machen, die über die untersuchten EinrichtunAussa-gen hinaus auch für andere Einrichtungen gelten können.

Diese generalisierenden Aussagen lassen sich mit Hilfe des zweiten Modells treffen.

Hier gibt es nur einen Koeffizienten pro Variable. Entsprechend fallen diesem An-satz aber auch sämtliche Einrichtungsunterschiede zum Opfer. Außerdem kommt es hier zu einem Effekt, den Snijders & Bosker (1999: 15) als ‚wundersame Fallzahl-vermehrung‘ beschreibt. Aus 10 Einrichtungen mit je 100 Patienten erhält man so ein n1 von 1000 Patienten. Dabei wird jedoch häufig übersehen, dass damit gegen eine grundlegende Prämisse statistischer Testverfahren verstoßen wird, derzufolge alle Fälle voneinander unabhängig sind. Tatsächlich sind in diesem Beispiel aber nur die 10 Einrichtungen unabhängig voneinander erhoben worden, während die Patienten insofern nicht unabhängig voneinander sind, als jeweils 100 aus dersel-ben Einrichtung stammen. Je ähnlicher166 nun die Patienten innerhalb einer

166 Als Maß für diese Ähnlichkeit gilt der unten noch näher erläuterte ‘Intra-class Correlation Coeffi-cient‘.

richtung sind, desto geringer ist die tatsächliche Anzahl an unabhängigen Informa-tionen über die Patienten. Dies wiederum führt zu einer Unterschätzung der Stan-dardfehler167 in statistischen Tests und damit ggf. zur Annahme von Hypothesen, die bei korrekter Berechnung des Standardfehlers eigentlich abgelehnt werden müss-ten.168

Das dritte Modell mit den Dummy-Variablen für jede Einrichtung und für jeden Koeffizienten kombiniert die Probleme seiner Vorgänger; zum einen folgen aus der Überschätzung der effektiven Fallzahl zu kleine Standardfehler, zum anderen ist die statistisch abgesicherte Generalisierung von ggf. entdeckten Einrichtungseffekten auf Patientenvariablen über die untersuchten Einrichtungen hinaus nicht möglich.

Durch die hohe Anzahl der zu schätzenden statistischen Parameter und die damit verbundene Reduktion der statistischen Freiheitsgrade ist es zudem ineffizient.

Das Problem bei der Anwendung des vierten Ansatzes liegt vor allem in dem damit verbundenen Informationsverlust und in der Interpretation der Ergebnisse. Hier kann es zu falschen Schlussfolgerungen kommen, wenn aus aggregierten Daten Aussa-gen über Zusammenhänge in einzelnen Fällen getroffen werden sollen.169

In Abb. 3-1 werden die verschiedenen Ansätze anhand eines konstruierten Bei-spieldatensatzes idealtypisch dargestellt.170

167 Dies deswegen, weil die Fallzahl unmittelbar in die Berechnung des Standardfehlers eingeht nach

der Formel: n

Abweichung Fehler Std

Std .

. =

168 Vgl. dazu insgesamt Snijders & Bosker (1999: 16ff.).

169 Vgl. zu derartigen Fehlschlüssen etwa Alker (1969), Blakely & Woodward (2000: 369f.).

170 Beispiel in Anlehnung an Snijders & Bosker (1999: 14).

Abb. 3-1: Zusammenhang zwischen zwei Variablen in Abhängigkeit von gewählter Analysemethode (Beispiel mit fiktiven Daten)

In diesem Beispiel werden in vier verschiedenen Forschungseinrichtungen neuge-borene Tiere jeden Tag gewogen und ihr Gewicht in Gramm gemessen. Die vier Linien, die jeweils durch die 7 gleichförmigen Punkte verlaufen, stellen als Regres-sionsgraden den gruppenindividuellen Zusammenhang zwischen dem Alter eines Versuchstieres in Tagen und seinem Gewicht in Gramm gemäß dem ersten und dritten Ansatz dar. Die leicht ansteigende, mit (1) bezeichnete Punkt-Strich-Regressionsgerade stellt das Ergebnis einer Analyse dar, in der dem zweiten An-satz folgend Einrichtungsunterschiede nicht beachtet wurden. Die fallende, ge-punktete Regressionsgerade (2) repräsentiert den Zusammenhang, der Ansatz 4 folgend auf Basis der aggregierten Gruppenmittelwerte geschätzt wurde. Die paral-lel zu den Linien der vier subgruppenspezifischen Regressionsgraden verlaufende Linie (3) schließlich stellt die Regressionsgrade einer Mehrebenenanalyse dar.