• Keine Ergebnisse gefunden

4. Diskussion

4.6 Limitationen

Nachdem die Ergebnisse nun interpretiert und mit der vorhandenen Literatur verglichen wurden, soll nun auf die Limitationen dieser Studie und auf sich daraus ergebende Einschränkung in der Aussagekraft der diskutierten Ergebnisse eingegangen werden.

4.6.1 Methodische Limitationen 4.6.1.1 Studiendesign

Um den großen Vorteil einer naturalistisch behandelten Studienpopulation zur Übertragbarkeit der Ergebnisse auf den klinischen Alltag erzielen zu können, mussten einige Limitationen in Kauf genommen werden. So wurde die Studie nicht unter kontrollierten Bedingungen durchgeführt und es gab keine Vergleichsgruppe.

Im Vergleich zu anderen Studien mit naturalistischem Design, wurden die Ausschlusskriterien minimal gehalten, um eine möglichst unverfälschte Studienpopulation zu erhalten. So wurden anders als bei Riedel et al. auch Patienten über 65 Jahre einbezogen (Riedel et al. 2011). Die Ergebnisse von Ciudad et al. zum Einfluss von Early Improvement konnten auch unter Einschluss von Patienten mit psychiatrischen Komorbiditäten bestätigt werden (Ciudad et al. 2011). Dies ist damit derzeit die einzige Studie mit naturalistischem Design, welche unter Einschluss aller psychiatrischen Komorbiditäten (inklusive Persönlichkeitsstörungen, bipolarer Störung, wahnhafter Depression und Abhängigkeitserkrankungen) durchgeführt wurde. Die Ergebnisse sind zwar unter Umständen weniger spezifisch für die Therapie der reinen Depression und mehr für stationäre psychiatrische Versorgung depressiver Patienten mit häufigen Komorbiditäten, gleichzeitig leiden laut US National Comorbidity Survey 45% aller psychiatrisch erkrankten Patienten an mindestens einer weiteren psychiatrischen Erkrankung (Kessler et al. 2005), weshalb es für die klinische Versorgung sinnvoll sein kann, auch Patienten mit Komorbiditäten und bereits vorhandener psychiatrischer Medikation zu betrachten (Maj, 2005). Um der aufgrund des naturalistischen Designs entstandenen Heterogenität der Patientengruppe gerecht zu werden, wurden jedoch mehrere Subgruppenanalysen durchgeführt, welche die Hauptergebnisse bestätigen konnten.

4.6.1.2 Retrospektive Datenerhebung

Ein weiteres Problem bestand darin, dass die Daten retrospektiv, also bis zu drei Jahre nach Entlassung der Patienten, erhoben wurden. Es war also einerseits nicht sicher abzuschätzen, welche Variablen möglichst vollständig vorhanden sein würden und andererseits konnten fehlende Daten nicht mehr akquiriert werden. Auch basierten einige Daten auf den Angaben der Patienten im Anamnesegespräch, wodurch sicherlich ein sogenannter recall bias in die Daten eingegangen ist. Dies bedeutet, dass sich die Patienten an bestimmte Angaben nicht

mehr genau erinnert konnten und möglicherweise unbeabsichtigt falsche Angaben gemacht haben. So war beispielsweise dokumentiert, dass sich Patienten nicht an früher eingenommene Präparatenamen erinnerten oder nicht genau abschätzen konnten wie oft sie bereits stationär behandelt worden waren.

An dieser Stelle sei noch darauf hingewiesen, dass die Daten nicht direkt elektronisch erfasst wurden und zur Auswertung zum Teil von Hand in digitale Form übertragen werden mussten.

Es ist also nicht auszuschließen, dass Fehler bei der Übertragung entstanden sind, obwohl der Datensatz auf Ausreißer und Tippfehler überprüft und zusätzlich eine Residualanalyse durchgeführt wurde. Da aber davon auszugehen ist, dass etwaige fehlerhafte Eingaben ohnehin zufällig verteilt waren, sollte der Einfluss auf das Gesamtergebnis aufgrund der Normalverteilung vernachlässigbar sein.

4.6.1.3 ROC und Early Improvement

Im Rahmen der Erstellung und des Vergleichs der ROC-Kurven mit und ohne Early Improvement konnte im Einvernehmen mit der Studie von Riedel et al. gezeigt werden, dass Early Improvement einen entscheidenden Faktor für das Therapieansprechen der Patienten darstellt (Riedel et al. 2011). Dies konnte in der vorliegenden Arbeit sowohl für Response als auch für Remission bestätigt werden. Allerdings muss diese Aussage etwas eingeschränkt werden, wenn man den Verlauf der übereinander projizierten Kurven betrachtet. So schneidet die ROC-Kurve mit Early Improvement die ROC-Kurve ohne Early Improvement an mehreren Stellen, sodass Bereiche entstehen, in denen das Modell mit Early Improvement nicht mehr überlegen ist. Dies zeigt sich besonders im mittleren Bereich, also bei moderaten Cut-Off Entscheidungswerten (Vgl. Abbildung 13 auf S. 55). Im Bereich von hohen Cut-Off Werten ist das Modell mit Early Improvement deutlich überlegen. Im Bereich von niedrigen Cut-Off Werten scheinen die Modelle ungefähr gleich gute Voraussagen zu treffen. Dies würde bedeuten, dass Early Improvement eher als zusätzlicher Prädiktor angewandt werden sollte, wenn die Wahrscheinlichkeit auf ein Therapieansprechen aufgrund anderer Prädiktoren bereits als besonders hoch bzw. besonders niedrig eingeschätzt werden kann. Hierfür spricht auch, dass der AUC-Wert von 0,66 für Response bzw. 0,7 für Remission nicht besonders hoch liegt. Der Wert entspricht in etwa den Ergebnissen von Riedel et al., welche bei 0,68 und 0,63 lagen und von den Autoren ebenfalls als mittelmäßig interpretiert wurden (Riedel et al.

2011). Auch dies zeigt, dass Early Improvement nur zurückhaltend als Prädiktor genutzt

Da Early Improvement ebenfalls über den MADRS gemessen wird, ist es möglicherweise auch dem bereits oben thematisierten Problem der Regression zur Mitte unterworfen und muss somit mit derselben mathematischen Einschränkung interpretiert werden wie der Prädiktor MADRS bei Aufnahme.

4.6.1.4 Messinstrumente

Wie einleitend beschrieben gibt es mit dem MADRS und dem HAMD zwei nebeneinanderstehende Skalen zur Verlaufsbeurteilung einer Depression. Neuere Studien zeigen jedoch, dass der MADRS eine höhere Sensitivität und bessere interne Validität aufweist als der HAMD und kommen sogar zu dem Schluss, dass der MADRS zu bevorzugen sei (Iannuzzo et al. 2006, Bagby et al. 2004).

Auch wenn die in dieser Arbeit verwendete Definition von Response und Remission für den MADRS anerkannt ist und am häufigsten verwendet wird, hinterfragen manche Autoren die Cut-Off Werte (Keller et al. 2003, Riedel et al. 2010). Sie geben vor allem zu bedenken, dass die Skala nicht zur Diagnosestellung, sondern zur Verlaufsbeurteilung entwickelt wurde und somit derselbe Wert bei zwei Patienten nicht unbedingt dieselbe Erkrankungsschwere angibt.

Aufgrund mangelnder Alternativen und besserer Vergleichbarkeit mit anderen Studien wurden in der vorliegenden Arbeit die von Hawley et al. vorgeschlagenen Cut-Off-Werte trotzdem übernommen. Auch andere Autoren haben den MADRS als Instrument für die Evaluation von Prädiktoren für das Therapieansprechen bereits erfolgreich verwendet (Balestri et al. 2015, Joel et al. 2014).

In Anbetracht dieser Überlegungen wäre es möglicherweise sinnvoll, die Quantifizierung des Therapieansprechens mittels mehrerer Messinstrumente durchzuführen und sich nicht auf den MADRS zu beschränken. So existiert in der Psychiatrie das gut etablierte Becks Depression Inventory (BDI) als Instrument zur Selbstauskunft. Beispielsweise könnte es sinnvoll sein den SCL-90 (Symptom Checklist 90) zusätzlich einzusetzen, um subjektiven und objektiven Therapieerfolg differenzieren zu können (Hennings et al. 2009). Als weitere alternative Messinstrumente wären hier der DASS (Depression, Anxiety and Stress Scales) oder der QIDS (Quick Inventory of Depressive Symptomatology) zu nennen (Saveanu et al. 2015;

Jakubovski et al. 2014). Beide stellen ebenfalls Instrumente zur Selbstauskunft dar.

Allerdings haben entsprechende Selbstauskünfte natürlich wiederum eigene Limitationen, auf die hier nicht weiter eingegangen werden soll.

4.6.2 Inhaltliche Limitationen 4.6.2.1 Studienpopulation

Die Studienpopulation war aufgrund der Spezialisierung der Station häufiger von chronischer Depression betroffen und therapieerfahrener, als dies in Vergleichsstudien der Fall ist. Die Generalisierbarkeit der Ergebnisse wird dadurch eingeschränkt. Zusätzlich gelten die Ergebnisse nur für stationär therapierte Patienten und sind nicht automatisch auf den ambulanten Bereich übertragbar (Riedel et al. 2011; Hennings et al. 2009). Dabei leiden Patienten im ambulanten Bereich eher an leichter und mittelschwerer Depression und haben im Durchschnitt weniger Therapieerfahrung als stationär behandelte Patienten. Allerdings sind die in dieser Studie präsentierten Ergebnisse entsprechend spezifischer und somit relevanter für Patientenpopulationen mit schwer behandelbarer Depression. Diese Patienten leiden besonders unter einer dauerhaften Einschränkung ihrer Lebensqualität und sind von einer verringerten Lebenserwartung bedroht (Chesney et al. 2014, Üstün et al. 2000), weshalb sie besonders dringend neue Therapiestrategien benötigen.

4.6.2.2 Bipolare Störung

Die Inklusion der Patienten mit bipolarer Störung könnte sich in der vorliegenden Studie auf die Variablen Alter bei Erstmanifestation und Anzahl depressiver Episoden ausgewirkt haben, da wie eingangs erwähnt diese Patienten durchschnittlich in jüngerem Alter erkranken und häufiger Episoden durchlaufen als Patienten mit unipolarer Depression. Es lässt sich nicht ausschließen, dass das Gesamtergebnis nicht durch den Einschluss bipolarer Patienten verzerrt wurde, auch wenn die Subgruppenanalyse mit unipolarer nicht-chronischer Depression dieselben Prädiktoren für Response und Remission identifizieren konnte wie die Gesamtanalyse.