• Keine Ergebnisse gefunden

Eine systematische Review der empirischen Studien

4. Berücksichtigung von zufallsbedingter, methodischer und klinischer Heterogenität in Meta-Analyse: Meta-Analyse zu Statinen als Fallstudie

4.4. Methodik

Um die unter Abschnitt 4.3 aufgeführten Vergleiche durchzuführen, wurde die

Gesamtmortalität als Zielgröße gewählt. Dies hängt damit zusammen, dass Daten zur

Gesamtmortalität in allen Primärstudien verfügbar sind und dass es sich um einen objektiven

„harten“ Endpunkt handelt. Eine wesentliche Einschränkung von MA-APD ist die fehlende oder nicht standardisierte Berichterstattung über wichtige Endpunkte und potenzielle Modifikatoren des Behandlungseffekts in der Publikation von Primärstudien, was die Untersuchung von Heterogenitätsquellen mittels MA-APD sehr erschwert.

Zwei statistische Ansätze zur Untersuchung von Heterogenitätsquellen in der MA-APD wurden verwendet, nämlich: Subgruppen-Analyse und Meta-Regression. Aufgrund der niedrigen Power der Subgruppen-Analyse und der Meta-Regression bei MA-APD mit kleiner Anzahl von Primärstudien wurde zur Testung der Subgruppenunterschiede und der

geschätzten Regressions-Koeffizienten ein Signifikanzniveau von 10% gewählt. Alle

Auswertungen wurden anhand des freien Software-Pakets „R“ (Version 2.2.0) durchgeführt.

Die zu untersuchenden Ursachen möglicher Heterogenität wurden a priori definiert und ihre Auswahl wurde begründet.

4.4.1. Berücksichtigung zufallsbedingter Heterogenität

Die Überprüfung der Zufallsrolle bei der Heterogenität in MA erfolgt durch den Cochran-Test (Q-Test). Zur Quantifzierung der Heterogenität wurde das Heterogenitäts-Maß I2 verwendet [Higgins, 2002a]. Da die Haupteinschränkung des Heterogenitäts-Tests seine geringe statistische Power ist, d.h. Heterogenität kann noch bestehen, auch wenn der statistische Test nicht signifikant ist, wurde zunächst die von Fleiss und Bailey empfohlene Anhebung des Signifikanzniveaus dieses Tests von 0,05 auf 0,10 übernommen [Fleiss, 1986; Bailey, 1987]. Damit soll das Risiko von falsch negativen Ergebnissen verringert werden. Zur Schätzung der Inter-Studien-Varianz für das REM wurde das am meisten verwendete Verfahren nach DerSimonian und Laird benutzt [DerSimonian, 1996; Sutton, 2008]. Zur Berücksichtigung der zufallsbedingten Heterogenität wurde das REM als Synthese-Modell verwendet. Zwecks der Sensitivitäts-Analyse erfolgte die Synthese auch im FEM nach der Mantel-Haenszel-Methode (s. Abschnitt 1.2.4.2).

4.4.2. Berücksichtigung methodischer Heterogenität

Anhand des Jadad-Scores (0-5 Punkte) wurden die berichtete Randomisierung, Verblindung und Studienaustritte für jede Primärstudie zusammen erfasst (s. Tab. 35). Der nach Jadad genannte Score gilt als einer der am meisten verwendeten Qualitätsbewertungsinstrumente von RCTs und es wurde seine Validität und Reliabilität untersucht [Jadad, 1996b; Moja, 2005]. Eine SR der SRs, die in der Cochrane Library oder in „peer-reviewed“ medizinischen Zeitschriften veröffentlicht wurden, ergab, dass der Jadad-Score bei 11,7% der zwischen 1995 und 2005 veröffentlichten SRs (n = 965) als Instrument der Bewertung methodischer Qualität fungiert [Moja, 2005].

Bewertet wurden weiterhin die Qualitäts-Komponenten: Allocation Concealment

(=Verblindung der Randomisierung) und Intention-To-Treat-Analyse (ITT-Analyse), da diese nicht im Jadad-Score enthalten sind. Die empirische Arbeit von Egger und Kollegen fand heraus, dass RCTs mit unangemessenem Allocation Concealment eine durchschnittliche

Kollegen zeigten sogar eine Überschätzung von 41% [Schulz, 1995]. Die empirischen Studien von Hollis und Campbell sowie von Ruiz-Canela und Kollegen fanden heraus, dass weniger als die Hälfte der untersuchten RCTs nicht über eine ITT-Analyse berichteten [Hollis, 1999; Ruiz-Canela, 2000]. Weiterhin detektierten Kruse und Kollegen, dass bei 100 RCTs mit berichteter ITT-Analyse weniger als die Hälfte tatsächlich dementsprechend auswerteten [Kruse, 2002].

Da die methodische Qualität von einer Person bewertet wurde, wurde sie zweimal in einem zeitlichen Abstand von drei Monaten durchgeführt (Oktober 2005 und Januar 2006).

Tab. 35 Berechnung des Jadad-Scores [Quelle: http://www.naturalstandards.com; nach:

Jadad, 1996b]

Item Score

Was the study described as randomized (this includes words such as randomly,

random, and randomization)? 0/1

Was the method used to generate the sequence of randomization described and

appropriate (table of random numbers, computer-generated, etc)? 0/1

Was the study described as double blind? 0/1

Was the method of double blinding described and appropriate (identical placebo, active placebo, dummy, etc)?

0/1 Was there a description of withdrawals and dropouts (number and reasons)? 0/1 Deduct one point if the method used to generate the sequence of randomization was

described and it was inappropriate (patients were allocated alternately, or according to date of birth, hospital number, etc).

0/-1

Deduct one point if the study was described as double blind but the method of blinding

was inappropriate (e.g., comparison of tablet vs. injection with no double dummy). 0/-1

4.4.3. Untersuchung klinischer Heterogenität

Ein positiver Zusammenhang zwischen den Serum-Werten von Low-Density-Lipoprotein (LDL) und dem Risiko für Koronare Herzkrankheit (KHK) wurde in mehreren beobachteten Studien gefunden [MRFIT, 1982; Anderson, 1987; Assmann, 1987]. Mehrere RCTs haben gezeigt, dass HMG-CoA-Reduktase-Hemmer (Statine) die Wiederholung eines

kardiovaskulären Ereignisses bei Patienten mit manifesten KHK und den erstmaligen Auftritt eines solchen Ereignisses bei Probanden mit erhöhtem Risiko für KHK verringern [LaRosa, 1999; Pignone, 2000]. Statine wirken hauptsächlich durch die Senkung der LDL [Law, 2003].

Daher ist zu erwarten, dass Patienten mit hoher Basis-LDL-K mehr als die mit niedriger Basis-LDL-K von der Statintherapie profitieren. Bei einer RCT wurden die Teilnehmer vor der Randomisierung bezüglich der Basis-LDL-K stratifiziert, aber in der Publikation erschienen lediglich die Ergebnisse für das Stratum niedriger Basis-LDL-K (> 4 mmol/L) [Pitt, 1995].

Während eine nach der Randomisierung erfolgten Stratifizierung der Teilnehmer bezüglich der Basis-LDL-K in der CARDS-Studie keine differentielle Wirksamkeit heraus fand

[Colhoun, 2004], zeigte eine ähnliche Auswertung der WOSCOPS-Studie einen nicht signifikanten höheren Nutzen für Probanden mit niedriger Basis-LDL-K (< 4,9 mmol/L) [Shepherd, 1995]. Ob die Wirksamkeit von Statinen bei unterschiedlicher Basis-LDL-K sich unterscheidet, wird im Rahmen der vorliegenden MA-APD untersucht.

Im Allgemeinen sind Frauen unterrepräsentiert in RCTs zu Statinen. Eine SR der RCTs zu Statinen, die zwischen 1990 und 2002 veröffentlicht wurden, fand heraus, dass 8 von den 50 identifizierten Studien Frauen ausschlossen. Der Median des Frauenanteils in diesen

Studien betrug lediglich 19% (Interquartil-Bereich 12-30%) [Bartlett, 2005]. Zwei SRs zu Cholesterin senkenden Interventionen fanden keine signifikante Reduzierung der

Gesamtmortalität bei Frauen [Grady, 2003; Walsh, 2004]. Anhand der vorliegenden MA-APD wird der Einfluss des Frauenanteils in den Primärstudien auf die Gesamtmortalität

untersucht.

4.4.4. Extraktion der Daten

Aus den Publikationen der Primärstudien und aus ihren Studienplänen, falls letztere vorhanden sind, wurden Angaben zu folgenden Variablen aus jeder Studie extrahiert:

- Publikationsjahr

- Anzahl der Studienteilnehmer - Dauer des Follow-Ups

- Probandenkollektive in Bezug auf KHK-Vorgeschichte - Typ der Kontrollgruppe

- Statintyp

- Gesamtmortalität in der Statin- und in der Kontrollgruppe - Frauenanteil (in Prozent)

- Basis-LDL-K (in mmol/L)

- Angaben zu Randomisierung, Allocation Concealment, Verblindung, Studienaustritten, Intention-To-Treat-Analyse (ITT-Analyse).

4.4.5. Subgruppen-Analysen

Zur Untersuchung des Einflusses methodischer Qualität auf die zusammengefasste Effektgröße wurden die Primärstudien nach dem Median ihres erzielten Jadad-Scores (4 Punkte), nach der Angemessenheit ihres Allocation Concealment und nach der Befolgung des ITT-Prinzips jeweils in zwei Gruppen geteilt. Demnach wurden folgenden Subgruppen definiert:

RCTs mit hoher Qualität (Jadad-Score ≥ 4) RCTs mit niedriger Qualität (Jadad-Score < 4)

RCTs mit hoher Qualität (angemessens Allocation Concealment) RCTs mit niedriger Qualität (unangemessenes Allocation Concealment)

RCTs mit hoher Qualität (ITT-Analyse)

RCTs mit niedriger Qualität (Per-Protokoll-Analyse)

Für die RCTs mit hoher Qualität (RCTs-HQ ) und die RCTs mit niedriger Qualität (RCTs-NQ) wurde jeweils eine MA-APD durchgeführt. Der Interaktions-Test wurde verwendet, um die Unterschiede zwischen der MA-APD für RCTs-HQ und der MA-APD für RCTs-NQ bezüglich der zusammengefassten Gesamtmortalität zu testen [Altman, 2003].

Zwecks der Ermittlung des Einflusses von Patientencharakteristika auf die

zusammengefasste Effektgröße wurden die Primärstudien nach dem Median ihrer Basis-LDL-K (3.8 mmol/L) und ihres Frauenanteils (18,61%) jeweils zwei Gruppen zugewiesen.

Demnach wurden folgende Subgruppen bestimmt:

RCTs mit hohem Frauenanteil (RCTs-HF; Frauenanteil ≥ 18,61%) RCTs mit niedrigem Frauenanteil (RCTs-NF; Frauenanteil < 18,61%)

RCTs mit hoher Basis-LDL-K (RCTs-HL; Basis-LDL-K ≥ 3,8 mmol/L) RCTs mit niedriger Basis-LDL-K (RCTs-NL; Basis-LDL-K < 3,8 mmol/L)

Eine MA-APD wurde für jede Subgruppe durchgeführt und die Variation der

zusammengefassten Effektgröße zwischen RCTs-HF und RCTs-NF bzw. RCTs-HL und RCTs-NL mit dem Interaktions-Test geprüft.

4.4.6. Meta-Regressionen

Zwecks der gleichzeitigen Berücksichtigung methodischer und klinischer

Heterogenitätsquellen wurde der potenzielle Einfluss von Studienqualität, Frauenanteil und Basis-LDL-K auf die Gesamtmortalität in den Primärstudien anhand von drei

Meta-Regressions-Modellen untersucht:

Modell 1: Log (RRi) = β0 + β1* Jadad + β2* Frauenanteili + β3* Basis-LDL-Ki

Modell 2: Log (RRi) = β0 + β1* Allocation Concealment + β2* Frauenanteili + β3* Basis-LDL-Ki

Modell 3: Log (RRi) = β0 + β1* ITT-Analyse + β2* Frauenanteili + β3* Basis-LDL-Ki

Wobei RRi das Relative Risiko zur Gesamtmortalität in Studie i (i = 1, 2, ..., k; k = 14), β1 den Regressionskoeffizienten zur Studienqualität, β2 den Regressionskoeffizienten zum

Frauenanteil (von 0,00 bis 1,00) und β3 den Regressionskoeffizienten zur Basis-LDL-K darstellen. Das verwendete generalisierte lineare Modell weist eine Normalverteilung mit einer „Log-Link-Funktion“ auf. Die Schätzung der Regressionskoeffizienten erfolgt durch die Methode der gewichteten kleinsten Quadrate. Zur Berücksichtigung der zufallsbedingter Heterogenität wurden alle Regressionen nach dem REM gewichtet. Zwecks der Sensitivitäts-Analyse erfolgte die Gewichtung auch nach dem FEM.