• Keine Ergebnisse gefunden

2. Methoden

2.2. Quantitative Teilstudie – Prospektive, kontrollierte Interventionsstudie

2.2.3. Statistische Methoden

Die Datenerfassung erfolgte mit dem Statistikprogramm IBM SPSS 24. Für die Auswertung wurden die Statistikprogramme IBM SPSS 24 und SAS 9.4 verwendet.

2.2.3.1. Maßnahmen zur Bias-Kontrolle

Um einen aufgrund der fehlenden Randomisierung der Studienteilnehmer möglicherweise auftretenden Selektionsbias zu kontrollieren, wurden die Ergebnisse mittels Propen-sity Score-Methode adjustiert. Der PropenPropen-sity Score (PS) beschreibt die bedingte Wahr-scheinlichkeit, mit der der Studienteilnehmer die zu prüfende Intervention unter Berück-sichtigung ausgewählter Variablen erhält [111], also im Falle dieser Studie an der HELPS-In-tervention teilnimmt. Die PS-Methode unterscheidet sich von herkömmlichen Regressions-modellen durch ihr zweistufiges Vorgehen. Dabei wird zunächst für jeden Patienten ein Propensity Score berechnet, um dann im nächsten Schritt die eigentlich interessierenden Interventionseffekte zu bestimmen [69].

Schätzung des Propensity Scores

Die Propensity Scores werden auf Grundlage einer logistischen Regression, in die die Inter-vention als abhängige Variable und bei InterInter-ventionsbeginn bestehende Teilnehmermerk-male als unabhängige Variablen eingehen, geschätzt [69]. Diese dem PS zugrunde liegen-den unabhängigen Variablen müssen zunächst ausgewählt werliegen-den. In der Literatur besteht jedoch keine einheitliche Meinung darüber, welche Variablen in das Modell aufgenommen werden sollten [5, 15]. Für die vorliegende Arbeit wurde der Ansatz gewählt, diejenigen Variablen einzubeziehen, welche mit dem Interventionserfolg oder mit der Gruppenzutei-lung in Verbindung stehen. Wichtig ist, lediglich zu Baseline erhobene Daten zu berücksich-tigen, die durch die Intervention noch nicht beeinflusst sind [5].

Aus 50 vorausgewählten Variablen wurden in einem primären Selektionsschritt 36 Variab-len bestimmt, welche mit dem primären Outcome-Kriterium FEW-16 (p<0,10) oder der

29 Gruppenzugehörigkeit (absolute standardisierte Differenz d>0,10) assoziiert waren. In einem zweiten Selektionsschritt wurde die Variablenauswahl auf 20 letztendlich in die PS-Schätzung einbezogene Variablen reduziert (siehe Abschnitt 3.1.4.). Neben der Kran-kengeschichte und dem klinischen Status der Patienten waren darin auch soziodemogra-phische Merkmale und Merkmale der aktuellen Lebenssituation enthalten.

Um für jeden Patienten einen PS berechnen zu können, wurden fehlende Daten in den aus-gewählten Kovariablen mittels Regressionsmethoden einfach imputiert [89].

Voraussetzung für eine sinnvolle Anwendung der PS ist eine ausreichend große „Common Support Region“. Dieser Bereich beschreibt eine Überschneidung der Verteilungen der PS der Interventions- und Kontrollgruppe und sollte möglichst groß sein. Die „Common Sup-port Region“ kann graphisch oder mit der Minima-Maxima-Regel bestimmt werden. Nach dieser Regel liegt der gesuchte Bereich zwischen dem größeren der beiden minimalen PS-Werte und dem kleineren der beiden maximalen PS-PS-Werte der zwei Gruppen. Das bedeutet also, dass die „Common Support Region“ eine Schnittmenge der PS-Intervalle beider Grup-pen darstellt [70, 169].

Berechnung der Interventionseffekte

Im nächsten Schritt wird auf Basis dieser Propensity Scores der Effekt der Intervention ge-schätzt [69]. Dazu stehen die vier verschiedenen Methoden Matching, „inverse probability of treatment weighting“ (IPTW), Stratifizierung und Adjustierung zur Verfügung [6].

PS-Matching wird häufig als das zu bevorzugende Verfahren genannt [6]. Anhand einer Da-tensimulation konnte jedoch gezeigt werden, dass im Gegensatz zu Sekundärdatenanaly-sen in quasi-experimentellen Untersuchungen mit kleineren Fallzahlen die PS-Adjustierung dem PS-Matching überlegen und daher zu empfehlen ist [70]. Zur Effektschätzung wurde aus diesem Grund in vorliegender Studie die Methode der PS-Adjustierung angewandt.

Dazu wurde ein herkömmliches Regressionsmodell verwendet, in welches die Zielgrößen als abhängige Variablen und der Interventionseffekt sowie der PS als unabhängige Variab-len eingingen. Somit wurde der Interventionseinfluss auf die Zielgrößen durch Verwendung nur einer Kovariablen für alle in den PS eingeschlossenen Patientenmerkmale adjustiert [69, 70].

Zur Überprüfung einer erfolgreichen Bias-Kontrolle wurden Balance-Tests angewandt. Da-bei sollte festgestellt werden, inwieweit die Verteilung der Kovariablen nach der

30 Adjustierung zwischen Interventions- und Kontrollgruppe übereinstimmen. Dazu wird die standardisierte Differenz, welche unabhängig von der Stichprobengröße ist und zum Ver-gleich von Variablen verschiedener Skalenniveaus genutzt werden kann, verwendet [5].

Von einem Gleichgewicht zwischen beiden Gruppen kann bei einer absoluten standardi-sierten Differenz von <0,1 gesprochen werden, wobei diesbezüglich kein einheitlich festge-legter Wert besteht [5, 98].

2.2.3.2. Umgang mit fehlenden Werten

Aufgrund einer geringen Anzahl fehlender Werte und einer Berücksichtigung dieser in den verwendeten gemischten linearen Modellen durch die Gewichtung der Parameterschät-zung wurde auf eine Imputation der fehlenden Daten für die EffektschätParameterschät-zung verzichtet.

Lediglich die zur Berechnung der Propensity Scores benötigten Daten wurden wie oben beschrieben durch einfache Imputation vervollständigt.

2.2.3.3. Deskription

Mittels deskriptiver Methoden wurden ohne Adjustierung für Baseline-Unterschiede der Versorgungsgruppen die Teilnehmerrekrutierung, der Studienverlauf und das Studienkol-lektiv zu Baseline sowie die Entwicklung der Zielgrößen im Studienverlauf beschrieben.

Die Beschreibung der Teilnehmerrekrutierung und des Studienverlaufs erfolgte unter An-gabe der absoluten und relativen Häufigkeiten.

Die Baseline-Werte des Studienkollektivs wurden getrennt für beide Versorgungsgruppen und in Abhängigkeit vom jeweiligen Skalenniveau mit dem arithmetischen Mittel, der Stan-dardabweichung sowie den absoluten und relativen Häufigkeiten beschrieben. Zum Ver-gleich kategorialer Baseline-Variablen der beiden Versorgungsgruppen wurden Chi2-Tests nach Pearson angewandt. Für kontinuierliche Variablen wurden mit dem t-Test für unver-bundene Stichproben die Mittelwerte beider Gruppen verglichen.

Zur Darstellung der Entwicklung der Zielgrößen im Studienverlauf wurden die unadjustier-ten Mittelwerte und Standardabweichungen beziehungsweise absoluunadjustier-ten und relativen Häufigkeiten zu allen vier Messzeitpunkten dargestellt.

Bei Protokollverletzungen wurde nach dem Intention to Treat (ITT)-Prinzip gehandelt [158].

Dies bedeutet, dass auch bei einem Versorgungsgruppenwechsel die ursprüngliche

31 Gruppenzuordnung zu Visite 1 erhalten blieb und Studienabbrecher aus den Darstellungen nicht ausgeschlossen wurden.

2.2.3.4. Gemischte Regressionsanalyse

Die Analyse der Zielkriterien erfolgte über mixed-effects Regressionsmodelle mit einem va-riablen Zeiteffekt, einem fixen Gruppeneffekt und einem fixen Interaktionseffekt zwischen der Zeit und der Untersuchungsgruppe bei Kontrolle der Propensity Scores [62, 71]. Wie auch bei der Darstellung der deskriptiven Daten, erfolgten alle Analysen nach dem ITT-Prin-zip. Fehlende Werte wurden dabei wie oben beschrieben nicht imputiert.

2.2.3.5. Zusatzauswertungen

Um die Robustheit der Ergebnisse zu überprüfen, wurden nach vollständiger quantitativer Auswertung Sensitivitätsanalysen für den FEW-16-Gesamtwert durchgeführt. Diese Zusatz-analysen beruhten auf alternativen Methoden zur Kontrolle des Selektionsbias.

Folgende Strategien wurden hierfür angewandt:

1. gemischtes Regressionsmodell ohne PS-Adjustierung 2. Variation der Variablenauswahl für die PS-Schätzung

In die neue Variablenauswahl für die PS-Schätzung wurden lediglich Variablen ein-bezogen, die einen signifikanten Zusammenhang zur Gruppenzugehörigkeit aufwie-sen. Auf dieser Grundlage wurden fünf Variablensets in Abhängigkeit des d-Wertes (absolute standardisierte Differenz) erstellt:

• Set 1: d > 0,25

• Set 2: d > 0,3

• Set 3: d > 0,35

• Set 4: d > 0,4

• Set 5: d > 0,5

Unter diesen Bedingungen wurde die WHR nie und Adipositas lediglich in Set 1 ein-bezogen. Aus diesem Grund wurden die in der Variablenselektion zur Hauptauswer-tung ausgeschlossenen Variablen Taillenumfang und BMI wieder mitaufgenommen, sofern sie den angegebenen d-Wert aufwiesen. Binäre Variablen, für welche die

32 Zellbesetzung in der Kreuztabelle mit der Gruppenzugehörigkeit kleiner gleich 5 war, wurden ausgeschlossen.

Tabelle 15 in Abschnitt 3.2.3. fasst diese Variablenauswahl zusammen.

3. Aufnahme der wichtigsten Confounder im Modell ohne PS-Adjustierung

Die als wichtigste Confounder identifizierten Variablen aus Set 4 und Set 5 wurden außerdem ohne PS-Adjustierung einzeln im Modell aufgenommen.