• Keine Ergebnisse gefunden

1.3. Kritische Bewertung von randomisierten kontrollierten Studien

1.3.1. Komponenten der Fragestellung

1.3.1.2. Interventionsgruppen

1.3.1.2.1. Standardisierung nicht-pharmakologischer Intervention

Als schwierig gelten im Rahmen von kontrollierten klinischen Studien die Standardisierung nicht-pharmakologischer Interventionen, z.B. Chirurgie, Psychotherapie, Chirotherapie, und komplexer Interventionen, z.B. Prävention und Gesundheitsförderung in sozialen Settings, Organisationsprogramme. Das UK „Medical Research Council“ entwickelte ein „Framework for the Development and Evaluation of Randomised Controlled Trials for Complex

Schwierigkeiten bei der Bestimmung, Isolierung, Optimierung und Normierung, also der Standardisierung der „aktiven“ Komponenten [Campbell, 2000; Hawe, 2004; Murchie, 2007;

Peters-Klimm, 2007].

Die in klinischen Studien ermittelten Effekte von durch soziale Interaktionen (Inter-individuen oder Inter-Gruppen) oder professionelle Interaktionen (z.B. multidisziplinäre Prüfärzte) modifizierbaren Interventionen können zur Kontamination zwischen den

Interventionseffekten führen. Diese Kontamination resultiert oft in der Unterschätzung des Nutzens und der Überschätzung des Risikos der experimentellen Intervention und ist generell mit zusätzlichen Unsicherheiten bei der Interpretation der Ergebnisse verbunden [Murphy, 2006; Torgerson, 2001]. Bei erwarteter hoher Rate von inter-individueller

Kontamination können Cluster-RCTs verwendet werden, wobei die Randomisierungs- und Auswertungseinheit das Setting oder die jeweilige Teilnehmergruppe ist [Hahn, 2005;

Eldridge, 2004; Donner, 2001]. Allerdings weisen Cluster-RCTs im Vergleich zu Individuum-basierten RCTs in der Regel höhere Fallzahl, höhere Rekrutierungshürden und höhere Studienaustrittsraten auf. Zumal eine Cluster-RCT durch unvollständiges Allocation Concealment und mangelnde Rekrutierbarkeit aller Mitglieder eines Clusters vor der Randomisierung für Selection-Bias empfänglich ist. Pseudo-Cluster-RCTs sind Studien bei denen lediglich ein großer Anteil der Mitglieder des Clusters, die der experimentellen Intervention zufällig zugewiesen sind, diese Intervention erhalten und wenige Mitglieder die Kontrollintervention bekommen. Dies findet vice versa in den Kontroll-Clustern statt.

Pseudo-Cluster-RCTs wurden zur Reduzierung der Fallzahl (Erhöhung der Trial-Effizienz), Verbesserung der Rekrutierung und des Allocation Concealment vorgeschlagen [Teerenstra, 2006; Borm, 2005].

Expertise-basierte RCTs wurden für verbesserte Standardisierung der durch Erfahrungen von Prüfärzten beeinflussbaren Interventionen, z.B. Chirurgie, vorgeschlagen [Devereaux, 2005], wenngleich die darin geforderte große Expertise zu begrenzter externer Validität führen kann. Statistisches Monitoring und Rückmeldung für Prüfärzte bezüglich nicht

standardisierter Intervention (z.B. Psychotherapie) wurde als eine kostengünstige Alternative zu Schulungen und Manualen vorgeschlagen [Iberg, 1991].

Nicht-pharmakologische Interventionen, die in Clusters durchgeführt werden, z.B.

Programme zur Gesundheitsförderung in Schulen, oder die durch die Expertise der Prüfärzte variieren (z.B. Psychotherapie), sollen durch Schulungen, Audits und externe Gutachter standardisiert und evaluiert werden.

1.3.1.2.2. Selektion der Kontroll-Gruppe

Der Biometriker Francis Galton schlug bereits 1872 vor, eine Kontrollgruppe einzusetzen, um die Wirksamkeit von Gebeten zu ermitteln [Dehue, 2000]. Ein gelegentlicher Einsatz von Kontrollgruppen kann bis ins 6. Jh. v. Chr. (im Buch Daniel) zurückverfolgt werden. Die systematische Verwendung einer Kontrollgruppe als methodische Anforderung an Experimente wurde erst seit Anfang des 20. Jahrhunderts beobachtet [Dehue, 2000].

Die Selektion einer „angemessenen“ Kontrollintervention ist die unabdingbare

Voraussetzung für die Validität jedes kontrollierten Experiments. Die Validität einer klinischen Studie mit einer ineffektiven Kontrollintervention kann weder mittels weiterer

höchstqualitativer Dimensionen des Studiendesigns noch anhand aufwändiger,

methodischer und biometrischer Analyse-Verfahren restauriert werden. Die „International Conference on Harmonisation“ entwickelte einen ausführlichen und differenzierten Leitfaden zur Selektion von Kontrollgruppen in klinischen Studien [ICH, 2000].

Seit langem werden überwiegend ethische und regulatorische Debatten geführt werden über den Einsatz von keiner Intervention, Placebo/ Schein-Intervention oder aktiver Intervention in der Kontrollgruppe [Albin, 2005; Moerman, 2002; Miller, 2002; Temple, 2000; Ellenberg, 2000]. Ausführliche Diskussionen wurden geführt, wenn die Evidenzlage bezüglich der Nutzen-Risiko-Bilanz einer als Standard zu bezeichnenden aktiven Kontrollintervention schlecht ist oder bislang keine aktive Intervention existiert. Die Selektion der Kontroll-Gruppe wird engagiert debattiert in der Chirurgie wegen der zu bedenkenden Risiko-Nutzen-Bilanz von Schein-Prozeduren, wie im Falle der Parkinson-Krankheit [Frank, 2005; Albin, 2005;

Angelos, 2007]. Einen ebenso ausführlichen Diskurs gibt es über die

Zweitlinienkrebstherapie, weil für das Zulassungsverfahren in Europa „keine Intervention“ als Kontrollintervention akzeptiert ist, diese Regelung in den USA dagegen abgelehnt wird [Ellenberg, 2000]. Allerdings führt diese Debatte unmittelbar zur relativen Vernachlässigung eines für die methodische Validität der Studien unabdingbaren konzeptuellen und Empirie-gestützten Diskurses über die „Angemessenheit“ einer Kontrollintervention.

1.3.1.2.2.1. Assay-Sensitivity

Das Potenzial einer Studie, eine effektive Intervention von weniger effektiver oder nicht effektiver Intervention zu unterscheiden, wird als „Assay-Sensitivity“ bezeichnet. Dies hängt von der Validität des Studiendesigns, einschließlich einer konkurrenten angemessenen Kontrollgruppe, und der statistischen Power der klinischen Studien ab. Falls eine aktive Kontrollintervention verfügbar ist, sichert ein paralleles dreiarmiges Studiendesign

(Placebokontroll-, Aktivkontroll-, und Experiment-Gruppe) sowohl in Überlegenheits-, Nicht-Überlegenheits- und Äquivalenz-RCTs die Assay-Sensitivity am besten [ICH, 2000; Kieser, 2007]. Dreiarmige klinische Studien sind allerdings weiterhin eine Seltenheit, wobei die meisten wurden für die Evaluation onkologischer Therapeutika durchgeführt [Bidoli, 2007;

Baum, 2002; Le Chevalier, 1994].

Die Verwendung von nicht in der klinischen Studie (externe Kontrollen) oder von im Zeitraum vor der Studie (historische Kontrollen) eingeschlossenen Patienten als Kontrollgruppe

schwächt die Validität des Vergleichs ab und ist nur in begrenzten und im Vorfeld zu begründenden Situationen zulässig [ICH, 2000].

1.3.1.2.2.2. Inaktive Kontrollintervention

Obwohl „The Powerful Placebo“ schon 1955 im Rahmen der ersten bekannten und mit Recht kritisierten MA zu therapeutischen Interventionen thematisiert wurde [Beecher, 1955; nach:

Egger, 2005; Boussageon, 2006], besteht bedauernswerterweise bislang keine eindeutige Definition, weder von Placebo, noch vom Placebo-Effekt [Meissner, 2007; Hrobjartsson, 2004; Macedo, 2003; Gotzsche, 1994], noch vom Nocebo-Effekt [Olshansky, 2007; Barsky, 2002; London, 2002]. Placebo-kontrollierte klinische Studien ohne effektive und erhaltende Verblindung laufen Gefahr, dass die Effektgröße in der Placebogruppe durch den

Placebosuspekt unterschätzt und dass anderweitige Nutzen oder Risiken in der

Placebogruppe zu vermehrtem Placebosuspekt führen. Herstellung, Aufrechterhaltung und Überprüfung der Verblindung von Patienten, Prüfärzten und weiteren an der

Patientenversorgung beteiligten Studienpersonals ist für die Minimierung eines möglichen Placebo-Effekts entscheidend. Daher soll ein Placebo der experimentellen Intervention in Bezug auf die äußere Erscheinung (Größe, Form, Farbe, Gewicht, Konsistenz, Geschmack, Geruch) und das Administrationsregime (Dosis, Frequenz, Weg) möglichst ähneln, sich jedoch hinsichtlich der effektiven Komponente und des Wirkungsmechanismusses weitgehend unterscheiden. Diese Unterscheidung setzt das Vorhandensein von Evidenz

oder einer Hypothese über die effektive Komponente und den Wirkungsmechanismus der experimentellen Intervention voraus [Brinkhaus, 2008].

Die Verblindung inerter Kontrollintervention erwies sich oft als nicht trivial bei Interventionen, die nicht-pharmakologisch sind, z.B. Chirurgie [Boutron, 2007], bei Interventionen mit

unsicherem Wirkungsmechanismus, z.B. Akupunktur, Wirbelsäulen-Manipulation [Dincer, 2003; Ernst, 2001], mit suboptimaler Standardisierung, z.B. Bewegung, oder mit komplexen Multi-Interventionen, z.B. Heimpflege. Weiterhin zeigte eine RCT, die Schein-Akupunktur mit Placebo-Pillen bei Patienten mit Armschmerzen verglich, eine signifikante, wenn auch kleine und auf patientenberichteten Endpunkte eingeschränkte, Überlegenheit der

Schein-Akupunktur [Kaptchuk, 2006]. Die „Placebo Quality Checklist“, begleitet von einem Fragenraster zum Monitoring der Verblindung, wurde vor kurzem publiziert [Brinkhaus, 2008].

Obwohl der Verfasser den Einsatz einer Nicht-Intervention oder eines Placebos als

Kontrollintervention [Leber, 2000], insbesondere in dem dafür auszuwählenden dreiarmigen Trial-Design, in den meisten Evaluationen neuer Interventionen sowohl methodisch als auch ethisch für vertretbar hält, kann ein zu häufiger Einsatz von inaktiven Kontrollinterventionen beobachtet werden. Eine SR, die 136 klinische Studien zu neuen Therapeutika gegen multiple Myeloma berücksichtigte, fand heraus, dass inaktive Interventionen bei 60% der industriefinanzierten, klinischen Studien und bei 21% der nicht-industriefinanzierten klinischen Studien als Komparatoren fungierten [Djulbegovic, 2000]. Aus

Vermarktungsmotiven wurden im renommierten „New England Journal of Medicine“ in drei klinischen Studien für Patienten mit diabetischer Nephropathie ACE-Hemmer, statt mit verfügbaren aktiven Kontrollinterventionen, mit Placebos verglichen [Hostetter, 2001;

Parving, 2001; Brenner, 2001; Lewis, 2001].

1.3.1.2.2.3. Aktive Kontrollintervention

Interessenbelastet und als wissenschaftliche Verfehlung zu bewerten ist die Verwendung einer pharmakodynamisch impotenten oder mit erhöhten Risiken verbundenen aktiven Kontrollintervention. Fokussiertes Augenmerk soll gelegt werden auf aktive

Kontroll-interventionen mit suboptimaler Dosierung [Woods, 2005; Safer, 2002; Geddes, 2000], mit ineffektiven [Schroeder, 2004; Johansen, 1999], oder riskanten Ingredienzen [Ahmad, 1992], mit ungeeignetem Administrationsweg [Johansen, 1999] oder Darreichungszeitpunkt [Safer,

von der pharmazeutischen Industrie finanzierte klinische Studien und MAs vierfach häufiger Ergebnisse zugunsten der Sponsorintervention zeigten als von anderen finanzierte klinische Studien und MAs. Unangemessene Kontrollintervention und Publication-Bias wurden als mögliche Gründe für diese Verzerrung beobachtet [Lexchin, 2003].

Die Äquivalenz oder Nicht-Unterlegenheit einer experimentellen Intervention gegenüber einer aktiven Kontrollintervention kann erst geprüft werden, wenn eine „Kopf-an-Kopf- Überlegenheit“ der aktiven Kontrollintervention gegenüber Placebo oder gegenüber keiner Intervention in mindestens einer vorher durchgeführten zweiarmigen RCT nachgewiesen wurde [Gelfand, 2006; Temple, 2000a]. Die Überlegenheitsannahme neuer Interventionen über Placebo beim Vorhandensein einer Äquivalenz zwischen neuen und alten aktiven Interventionen erwies sich oft als unhaltbar und die Verwendung von indirekten nicht-randomisierten Vergleichen oder historischen Placebo-kontrollierten Studien stellten sich nicht selten als nicht valide heraus [Wang, 2002; Otto, 2002; Leber, 1989].