• Keine Ergebnisse gefunden

4.6 Statistische Verfahren

4.6.3. Regressionsanalyse

Bei der Untersuchung der 3. Hypothese nach dem Einfluss der Technologie auf die Versorgungskosten wurde eine Regressionsanalyse für den Initialindex sowie für den Follow-up-Index durchgeführt. Die multiple Regressionsanalyse bot hier die Möglichkeit, neben der Technologie weitere Faktoren zugleich einzubeziehen, die auch einen Einfluss auf die Kosten haben können. Dafür wurde eine Regressionsfunktion mit den in Betracht kommenden Einflussfaktoren als erklärende Variable für die Kosten definiert, wobei ein stochastischer Ansatz gewählt wurde. Dieser Ansatz trägt der Tatsache Rechnung, dass u. a. nicht alle mögliche Einflussfaktoren abschließend berücksichtigt werden können und Messfehler sowie Beobachtungsfehler in der Empirie auftreten.

Die Erklärungskraft der spezifizierten Regressionsfunktion, welche die Abhängigkeit zwischen Kosten als abhängiger Variable und Einflussfaktoren als unabhängigen Variablen abbildet, lässt sich anhand des Bestimmtheitsmaßes R² feststellen. Die Werte von R² liegen zwischen 0 für die niedrigste Erklärung und 1 für die höchste Erklärung (Schnell et al. 1999). Bezogen auf dem vorliegenden Fall wird R² den Erklärungsbeitrag der in die Regressionsfunktion aufgenommenen Einflussfaktoren auf die Kostenvarianz liefern. Bei signifikantem Erklärungsbeitrag (mit F-Test) werden die Regressionskoeffizienten der relevanten Einflussfaktoren im Einzelnen geschätzt, um die Einflusshöhe und -richtung zu bestimmen. Da die unabhängigen Variablen unterschiedliche Messeinheiten haben, werden in der Darstellung die standardisierten Regressionskoeffizienten (β) verwendet, um die Stärke der Effekte deutlicher zum Ausdruck zu bringen. Anhand der statistischen t-Werte (bei einem gegebenen Signifikanzniveau) lässt sich bestimmen, ob der geschätzte β einen zufälligen oder statistisch signifikanten Einfluss auf die Kosten aufweist. Das Signifikanzniveau wurde ebenfalls hier bei 0,05 festgelegt.

Im Folgenden wird (1) die angewandte multiple Regressionsfunktion dargestellt und (2) eine Überprüfung bestimmter modelltheoretischer Voraussetzungen für die Anwendung des gewählten Modells sowie für die Aussagefähigkeit der Regressionskoeffizienten vorgenommen.

(1) Modellspezifikation

Ein linear stochastisches Regressionsmodell wurde zugrunde gelegt in der Form:

Yp=ßo+ßiXi+Uk;

wobei die Kosten Yp die abhängige Variable darstellen mit p = Patient 1…n, ßo eine Konstante ist, der Einflussfaktor Xi eine erklärende Variable darstellt mit i=1…m, ßi der Regressionskoeffizient ist und die Störvariable Uk die Residuen darstellt mit k=1…l.

Aufgenommen in die Regressionsfunktion als erklärende Variablen für den Initialindex waren (1) bei soziodemografischen Patientencharakteristika: Alter, Geschlecht, Berufstätigkeit, Familienstand, (2) bei medizinischen Patientencharakteristika:

kardiologisches Risikoprofil, Komorbidität, Komplikationsgrad, Art der EKG-Infarktdiagnose, (3) bei Prozessfaktoren: Therapieverfahren für Technologie, Verweildauer und (4) bei Krankenhaustyp: die Behandlung im Untersuchungskrankenhaus (ZKA). Dabei stellen die Variablen: „Risikoprofil“ die Anzahl der medizinisch betrachteten Risiken für Herzinfarkt maximal 3 je Patient, „Komorbidität“ die Anzahl der zusätzlichen ICD-Diagnosen zu der AMI-Hauptdiagnose (maximal 2 je Patient) sowie „Komplikationsgrad“

die Anzahl der angegebenen Komplikationen (maximal 7 je Patient). Für die kategorialen Variablen wie „Berufstätigkeit“, „Krankenhaustyp“ und „Therapieverfahren“ u. a. wurden Dummy-Variablen mit Referenzgruppen verwendet. Die Variablen wurden bei einem hierarchischen Vorgehen sukzessiv in die Regression nach dem Einschlussverfahren aufgenommen, um jeweils die spezifischen Effekte der Einflussfaktoren auf die Kosten zu erfassen.

Es wurde in diesem Modell angenommen, dass: (1) die Pflegeintensität bei allen Patienten gleich ist, (2) das Therapieverfahren weder von der Soziodemografie noch von medizinischen Patientencharakteristika abhängig ist, also eine Zufallsvariable ist, (3) die Verweildauer vielmehr von Zufallsfaktoren, wie Patientenwohlbefinden, Anschlagen der Behandlungsstrategie, Bettenauslastungsgrad, Risikofreudigkeit des entscheidenden Arztes, bestimmt wird und daher eine Zufallsvariable ist.

Ausgeschlossen in diesem Modell waren die exogenen Faktoren wie Vergütungs-system, Preise und technischer Fortschritt, die in einer solchen Querschnittuntersuchung als gegeben und konstant betrachtet werden.

Im Follow-up-Index wurden in die Regressionsfunktion als erklärende Variablen aufgenommen: (1) für soziodemografische Patientencharakteristika: Alter, Geschlecht, Berufstätigkeit, Familienstand, Haushaltsgröße, Krankenversicherungsträger; (2) für medizinische Patientencharakteristika: kardiologisches Risikoprofil, Komorbidität; (3) für Gesundheitstechnologie: Initialtherapieverfahren; (4) für Lebensqualität: QALY (vgl.

Abschnitt 2.1.5.3). Dabei stellt die Haushaltsgröße die Anzahl der in einem Haushalt lebenden Personen dar. Der Krankenversicherungsträger umfasst drei Typen (siehe Tabelle 6). Zum kardiologischen Risikoprofil wurde zusätzlich der Body Mass Index8 aufgenommen. Für die kategorialen Variablen wie Krankenversicherungsträger und Therapieverfahren u. a. wurden Dummy-Variablen mit Referenzgruppen verwendet. Zwei hierarchische Regressionen wurden – wie im Initialindex – durchgeführt. Im ersten Fall wurden als abhängige Variable nur die direkten medizinischen Kosten für die gesamte Studienpopulation herangezogen, da für die Probandengruppe ab 65 Jahre aufgrund der regulären Verrentung gar keine Produktivitätsausfallkosten anfallen. Im zweiten Fall wurden die gesamten Folgekosten als abhängige Variable die Gruppe der Erwerbstätigen (Berufstätigen und Arbeitslosen) genommen, da hier Arbeitsunfähigkeit und Frühverrentung indirekte Kosten verursachen. Die Tabelle 6 zeigt eine Übersicht der verwendeten Variablen in der Regressionsanalyse.

8 Body Mass Index – BMI = Körpergewicht in kg/Körpergröße² in m, nach Gewichtsklassifikation der WHO gilt: (BMI < 18,5), Normalgewicht(18,5 – 24,9), Übergewicht (25,0 – 29,9), Adipositas (30,0 – 39,9) und schwere Adipositas (> 40), siehe WHO.: http://www.euro.who.int/nutrition/20030507_1,

Tabelle 6: Regressionsvariablen für die Kostenfunktion

Initialindex Follow-up-Index abhängige Variablen

Gesamtkosten in der Akutversorgung

gesamte Folgekosten

direkte medizinische Folgekosten

unabhängige Variablen

ZKA als Krankenaus der maximalen Versorgungsstufe umliegende Krankenhäuser

Variablen

PCI=Perkutane Koronare Intervention, ACVB=Aorto Koronarer Venen-Bypass, BMI=Body Mass Index, ZKA=Zentralklinikum Augsburg

(2) Modellvoraussetzungen

Dem linearen Regressionsmodell liegen mehrere theoretische Annahmen zugrunde (Cohen et al. 2003, Berry 1993).Seine Anwendung setzt voraus, dass

- eine lineare Beziehung zwischen der abhängigen und unabhängigen Variablen besteht;

- der Erwartungswert der Residuen null ist E(u) = 0, d. h. die Summe der Abweichungen der geschätzten Werte und der beobachteten sich gegenseitig aufheben;

- keine Autokorrelation der Residuen vorliegt, d. h. die Störvariablen Uk, Uk+1 nicht miteinander korreliert sind;

- keine Heteroskedastizität vorliegt, d. h. erklärende Variablen Xi mit den Störvariablen Uk nicht korreliert sind;

- keine Multikollinearität 1. Ordnung vorliegt, d. h. zwischen den erklärenden Variablen Xi keine exakten, lineare Abhängigkeiten bestehen.

Darüber hinaus wird eine Normalverteilung der Regressionsresiduen vorausgesetzt, um aussagefähige Signifikanztests zu erhalten. Bei der Normalverteilung wird von der Zentrierung der meisten Werte um den Mittelwert und von der gleichmäßig abfallenden Verteilung auf beiden Seiten um diesen Mittelwert ausgegangen.

Tests, die zur Überprüfung der o. g. Modellvoraussetzungen durchgeführt wurden, schließen die Anwendung der linearen Regression im vorliegenden Fall nicht aus. Die Durbin-Watson-Statistik von 2,058 zeigte, dass keine Autokorrelation der Residuen vorlag.

Ebenso konnte anhand der Variance Inflation-Factor (VIF)-Koeffizienten, als Indikator des Grades an Multikollinearität (VIF = 1 bedeutet gänzlich fehlende lineare Abhängigkeit), bei errechneten Werten zwischen 1,029 und 1,206 davon ausgegangen werden, dass keine Multikollinearität 1. Ordnung vorlag. Der Levene-Test auf Varianzhomogenität (p>0,05) deutete nicht auf eine Heteroskedastizität hin. Anhand des Kolmogorov-Smnirnov-Tests mit Signifikanzkorrektur nach Lilliefors (P<0,001) konnte eine hinreichende Normal-verteilung der Residuen angenommen werden, so dass die Anwendung von parame-trischen Tests, wie t-Test und F-Test, auch möglich war.