• Keine Ergebnisse gefunden

5.2 Diskussion der Ergebnisse

5.2.7 Selektionseffekte

3.3.4 Sensivitätsanalyse zur Randomisierung

Neben Selektionseffekt und Verwässerungseffekt ergab sich aus dem Abbruch der Randomisierung eine weitere mögliche Fehlerquelle. Eine Sensivitätsanalyse soll die Abhängigkeit der Ergebnisse bezüglich der abgebrochenen Randomisierung überprüfen (siehe Diskussion „5.2.1 Ausschlusskriterien, Randomisierung, Vergleichbarkeit“). Da ab dem Stichtag am 28.06.2004 alle eingeschlossenen Patienten unabhängig vom Geburtsdatum angeschrieben wurden, wäre prinzipiell ein systematischer Fehler möglich, z.B. wenn durch saisonale Faktoren im Winter besonders kranke Patienten entlassen worden wären. Deshalb werden in dieser Sensivitätsanalyse alle Personen aus der Gruppe der Angeschriebenen ausgeschlossen, die nach dem Stichtag hinzugekommen waren. Die so gebildete deutlich kleinere Gruppe der sogenannten

„bereinigten Angeschriebenen“ wird mit der Kontrollgruppe verglichen. In Tabelle 4 sind die verschiedenen Analysen mit den entsprechenden Vergleichsgruppen und der jeweiligen Problematik zur Übersicht aufgeführt.

Untersuchungen Vergleichsgruppen Problematik

Standard Interventionsgruppe vs Kontrollgruppe positiver / negativer Selektionseffekt Intention-to-treat Angeschriebene vs Kontrollgruppe Verwässerung des Programmeffekts Sensivitätsanalyse bereinigte Angeschriebene vs Kontrolle Verwässerung des Programmeffekts Selektionseffekt Ablehner vs Intervention / Kontrolle

Spezielles Modell potentielle Intervention vs Intervention Keine Standardmethodologie Tabelle 4 – Durchgeführte Untersuchungen

Die Zusatzuntersuchungen werden in der Betrachtung von Krankenhausaufenthalten und Leistungsausgaben in separaten Gliederungspunkten besprochen. In der Analyse der Mortalität werden die Zusatzuntersuchungen innerhalb der verschiedenen Mortalitätsanalysen behandelt.

3.4 Zielparameter Mortalität

Der Zielparameter Mortalität wird anhand von Überlebenswahrscheinlichkeitskurven untersucht, welche über die Kaplan-Meier-Methode bestimmt wurden. Ferner werden aus den resultierenden Kaplan-Meier-Kurven Quantile der Überlebenszeitverteilung bestimmt (u.a. 25./75. Perzentil, Median).

Für die Überlebenszeitanalyse nach der Kaplan-Meier-Methode müssen keine zusätzlichen Annahmen bezüglich Prävalenz der Risikofaktoren, Charakteristika der Population oder Prognose getroffen werden, da sich die Beobachtungsdauer und Zensierungsmuster für die untersuchten Gruppen gleichen.

Der Unterschied im Überleben wird durch einen Vergleich der Quantile quantifiziert. In der Regel wird das 50 Quantil (medianes Überleben) angegeben. Falls das 50 %-Quantil nicht erreicht wurde, weil weniger als die Hälfte der Patienten verstorben waren, werden andere Überlebensquantile angegeben. So wird zum Beispiel auch das 75 %- und 80 %-Überlebenszeitquantil herangezogen.

Die Betrachtung des mittleren Überlebens erweist sich generell als problematisch, da die in der Regel schiefe Überlebenszeitverteilung zu einer Verzerrung der Mittelwertschätzung führt. Das mittlere Überleben wird trotzdem angegeben, da aus mittlerem Überleben und Kosten pro Tag die Kosten des Kostenträgers für die jeweilige Subgruppe berechnet werden können.

3.5 Zielparameter Krankenhausaufenthalte und Leistungsausgaben 3.5.1 Perspektiven

Um eine präzise Evaluation des Gesundheitsprogramms „Herzensgut“

durchzuführen, müssen zunächst die Perspektive der Untersuchung genau spezifiziert werden. Dabei stellt sich die grundsätzliche Frage, um wessen Kosten und Nutzen es sich in der Evaluation handelt. Prinzipiell mögliche Betrachtungsweisen differenzieren zwischen Nachfragern (z.B. Patient), Leistungserbringern (z.B. Arzt), Kostenträgern (z.B. Krankenkassen) und der Gesellschaft. Die Wahl der geeigneten eindeutigen Perspektive hängt von der Fragestellung der gesundheitsökonomischen Evaluation ab. Gegebenenfalls können auch verschiedene Perspektiven im Vergleich berücksichtigt werden.

Die Krankenkassen sind die wesentlichen Kostenträger bei Herzinsuffizienz und neben den Leistungserbringern die zentralen Entscheidungsträger im deutschen Gesundheitssystem. Die Ergebnisse des Zielparameters „Kosten“ werden daher aus der Perspektive des Kostenträgers betrachtet. Dabei wird zwischen einer absoluten Perspektive und einer relativen Perspektive unterschieden:

In der absoluten Perspektive werden die Zielparameter Leistungsausgaben, bzw.

Krankenhausaufenthalte und Krankenhaustage separat betrachtet ohne Berücksichtigung der Mortalität.

In der relativen Perspektive wird der Effekt der Mortalität auf die Kosten berücksichtigt.

Die Kosten werden pro gelebten Programmtag berechnet, d.h. die Summe der Kosten für Medikamente oder Krankenhausaufenthalte wird durch die Anzahl an gelebten Programmtagen geteilt. Diese Berechnungsmethode wird analog auch für Krankenhausaufenthalte und Krankenhaustage angewendet. Um diese Ergebnisse in fassbaren Zahlen zu verdeutlichen, werden die Parameter „Aufenthalte pro Lebendtag“

und „Krankenhaustage pro Lebendtag“ auf 730 Tage, also die Länge des Evaluationszeitraums, hochgerechnet (siehe Ergebnisse „4.4 Kosten im Evaluationszeitraum – Relative Perspektive“).

Das Prinzip der relativen Perspektive ist in Abbildung 5 beispielhaft für zwei Teilnehmer veranschaulicht. Während die absoluten Kosten für beide Personen gleich hoch waren, ergeben sich bei Teilnehmer 2 aufgrund der längeren Lebenszeit niedrigere Kosten pro Lebendtag.

Abbildung 5 – Kosten pro Lebendtag

Die relative Perspektive bezieht ihre Berechtigung zum einen aus der besseren Vergleichsmöglichkeit mit der Voruntersuchung des Gesundheitsprogramms

„Herzensgut“ durch Kielblock et. al.. Zum anderen kann so der Programmeffekt in einem einzigen Parameter zusammengefasst und angegeben werden. Die Ergebnisse der relativen Perspektive werden in Euro/Lebendtag gemessen. Sofern nicht anders angegeben, werden in den Abschnitten zur relativen Perspektive alle Parameter in dieser Einheit angegeben.

3.5.2 Kostenarten

Der Zielparameter „Kosten“ betrachtet nur direkte Kosten. Sie entstehen unmittelbar bei der Herstellung oder dem Einsatz der Gesundheitstechnologie und können in direkte medizinische und direkte nicht-medizinische Kosten unterteilt werden. Direkte medizinische Kosten fallen unmittelbar bei der Patientenversorgung an wie zum Beispiel ärztliches Personal, Arzneimittel, medizinische Geräte und Verwaltungskosten des Leistungserbringers. Nicht-medizinische direkte Kosten resultieren aus Leistungen, die die gesundheitliche Versorgung unterstützen. Dazu zählen unter anderem Zeit- und Transportkosten der Patienten sowie die Unterstützung durch ihre Angehörigen [2].

In der Analyse des Programms „Herzensgut“ wird nur ein Teil der gesamten direkten medizinischen Gesamtkosten berücksichtigt. Die untersuchten Kosten beinhalteten Leistungsausgaben der Versicherung für stationäre Krankenhausaufenthalte und Kosten für Medikamente. Der Begriff „Gesamtkosten“ wird im Sinn der gesamten Leistungsausgaben der Krankenkasse verwendet. Zudem kann der interne Verwaltungsaufwand der Krankenkasse geschätzt werden. Andere direkte medizinische Kosten, insbesondere die Kosten der ambulanten hausärztlichen Betreuung, werden nicht berücksichtigt. Die Unterschiede in diesen Kosten sind allerdings aufgrund der speziellen Vergütungsregeln für Hausärzte vermutlich vergleichsweise gering.

Zusätzliche, nicht berücksichtigte Kosten entstanden auch durch die Aufwendungen für Krankentagegeld. Arbeitsunfähigkeitskosten wurden aufgrund des generell hohen Durchschnittsalters der Studienteilnehmer und des dadurch geringen Volumens vernachlässigt.

3.5.3 Ökonomische Evaluation

Die Effekte einer Gesundheitstechnologie können auf unterschiedliche Art und Weise ökonomisch gemessen werden. In Abbildung 6 sind drei ökonomische Evaluationsverfahren mit ihren jeweiligen Zielparametern dargestellt:

Kosten-Effektivitäts-Analyse, Kosten-Nutzwert-Analyse und Kosten-Nutzen-Analyse. In vorliegender Arbeit werden die Kosten-Nutzen-Analyse und die Kosten-Effektivitäts-Analyse verwendet.

Die Kosten-Nutzen-Analyse gibt den Programmnutzen in monetären Einheiten an.

Die in dieser Analyse berücksichtigten Kosten sind zum einen die Kosten für das Gesundheitsprogramm „Herzensgut“, zum anderen die indirekten Kosten durch Verwaltungs- und Administrationsaufwand der Versicherung. Der Nutzen ergibt sich aus der Einsparung der Leistungsausgaben.

Abbildung 6 – Ökonomische Evaluationsverfahren

Nach Amelung [2]

Die Kosten-Effektivitäts-Analyse bietet die Möglichkeit, die Nutzenparameter zu berücksichtigen, ohne dass der Nutzen in monetären Einheiten erfasst werden muss.

Der Nutzen wird in „natürlichen“ medizinischen oder epidemiologischen Ergebnis-Parametern gemessen. Als Parameter werden in der Analyse von „Herzensgut“

Mortalität, Krankenhausaufenthalte und Krankenhaustage verwendet.

Abbildung 7 zeigt die möglichen Ergebniskombinationen. Der Nullpunkt stellt den Zustand ohne Einsatz des Gesundheitsprogramms dar. Im Quadranten I ist das Gesundheitsprogramm medizinisch dem der Behandlung der Kontrollgruppe überlegen, die Kosten liegen hier allerdings über denen der Kontrollgruppe. Die

Entscheidung für oder wider das Gesundheitsprogramm hängt dann davon ab, welches Kosten-Wirksamkeits-Verhältnis akzeptiert wird.

In den Quadranten II und IV ist die Entscheidung eindeutig. In Quadrant II ist das Gesundheitsprogramm medizinisch schlechter und teurer. Es muss abgelehnt werden. In Quadrant IV ist das Programm sowohl günstiger als auch medizinisch überlegen und sollte deshalb angenommen werden.

Im Quadranten III ist das Programm medizinisch unterlegen, aber dafür günstiger. Die Entscheidung muss durch einen Vergleich der Kosten-Effektivitäts-Verhältnisse anderer Gesundheitstechnologien erfolgen. Möglicherweise könnten die durch den Einsatz eingesparten Mittel in einem anderen Bereich des Gesundheitswesens besser eingesetzt werden.

Abbildung 7 – Nutzen-Wirtschaftlichkeits-Matrix einer Innovation

3.5.4 Kostenzurechnung

Durch die individuell unterschiedlichen Programmstarts ergibt sich die Notwendigkeit, die Auswertungszeiträume für jeden Patienten einzeln zu berechnen. Dies war besonders für die Krankenhausaufenthalte wichtig, um eine Doppelberechnung oder eine Nichtberücksichtigung der überlappenden Krankenhausaufenthalte zu vermeiden.

Zur Veranschaulichung sind in Abbildung 8 sechs mögliche Krankenhausaufenthalte eines Patienten in den zwei abgegrenzten Zeiträumen Basiszeitraum und Evaluationszeitraum aufgeführt. Für den Evaluationszeitraum sind in diesem Beispiel Aufenthalt 3, Aufenthalt 4 und Aufenthalt 5 relevant, für den Basiszeitraum sind Aufenthalt 1, Aufenthalt 2 und Aufenthalt 3 relevant usw. . Nur Aufenthalte 2 und 4 liegen ohne Überlappung in einem einzigen Berechnungszeitraum. Alle anderen überlappen in den Zeiträumen. Aufenthalt 3 ist für beide Zeiträume relevant. Um eine genaue Berechnung der Kosten zu ermöglichen, werden die Krankenhauskosten unter der Annahme einer gleichmäßigen Kostenverteilung tagesgenau berechnet. Die Kosten werden also je nach Anteil der Krankenhaustage dem jeweiligen Zeitraum im Verhältnis der Krankenhaustage zugeordnet.

Abbildung 8 – Krankenhausaufenthalte eines Patienten

Hatte ein Patient beispielsweise drei Krankenhausaufenthalte im Evaluationszeitraum, die wie in Abbildung 9 gezeigt mit den Periodengrenzen überlappen, so werden die Kosten der überlappenden Krankenhausaufenthalte tagesgenau der relevanten Periode zugerechnet. Von dem zehntägigen Krankenhausaufenthalt, dessen Anfang vor Programmstart lag, werden nur die anteiligen Kosten, die in den Evaluationszeitraum fielen, berechnet. Es werden also anteilig 1.000 € / 10 Tage * 5 Tage = 500 € als Kosten berücksichtigt.

Abbildung 9 – Tagesgenaue Berechnung der Krankenhauskosten

Für die Kostenerhebung der Medikamente wird diese aufwendige Methode nicht angewendet. Eine tagesgenaue Berechnung ist zum einen nicht möglich, da die Daten für Medikamente nicht tagesgenau, sondern monatsgenau vorliegen. Zum anderen fallen hier im Wesentlichen kleine Beträge an und die monatsweise Zuordnung ist demnach ausreichend.

3.5.5 Verwaltungs-, Personal- und Programmkosten

Die Kosten für eine Teilnahme am Programm errechnen sich aus den zusätzlichen Personalkosten und Verwaltungskosten sowie der Programmvergütung. Personalkosten und Verwaltungskosten werden gemäß dem ermittelten Arbeitsaufwand geschätzt. Die Personalkosten der Versicherung ergaben sich dabei aus der Selektion der Patienten.

Diese lagen bei 20 € pro Teilnehmer. Zusätzliche Verwaltungskosten beliefen sich auf 12 € pro Teilnehmer [97]. Die Vergütung für das Gesundheitsprogramm betrug 765 € pro Jahr und Teilnehmer, also 1.530 € für den Evaluationszeitraum. Diese Kosten der Programmteilnahme werden in der Analyse zunächst nicht berücksichtigt. Sie werden in der Diskussion zur Ermittlung des Netto-Programmerfolges herangezogen (siehe

„Quantifizierung des Programmerfolgs“).

3.6 Sonstige Vergleichsparameter

3.6.1 Herzinsuffizienzstadien

Um die randomisierten Gruppen auf Vergleichbarkeit zu prüfen, werden die Herzinsuffizienzstadien der New York Heart Association (NYHA) herangezogen. Die NYHA-Klassifikation ist ein Schema zur Einteilung der Herzinsuffizienz in eindeutige Stadien nach definierten Kriterien. Die NYHA-Stadien werden nach einer einheitlichen Methode für alle Gruppen anhand der Entlassungsdiagnosen ermittelt. Für die vier NYHA-Schweregrade gibt es dabei jeweils eine eindeutige ICD-Diagnose. Im Gegensatz dazu spezifizieren die ICD-Diagnosen I50.1, I50.9 und I50.19 kein NYHA Stadium. Für diese Diagnosen wird der Schweregrad als „nicht näher bezeichnet“ eingeordnet. Ist weder eine NYHA Zuordnung noch ein unspezifisches Stadium zuzuordnen, so wird das Stadium als „unbekannt“ klassifiziert.

3.6.2 Einkommen

Es gibt einen negativen Zusammenhang zwischen den Einkommensverhältnissen und der Anzahl der Krankenhausaufenthalte bei Herzinsuffizienz [98]. Die Einkommensgruppe bietet somit einen relevanten Parameter, der zur Analyse der Vergleichbarkeit der Ausgangsgruppen im Basiszeitraum herangezogen wird.

3.7 Datenquellen

Bei der Durchführung von gesundheitsökonomischen Evaluationen stellt die zum Teil unzureichende statistische Datenlage ein Problem dar. Bei der KKH findet sich durch das seit 1990 produktiv eingesetzte Datenverarbeitungssystem, BVS (Bildschirm-unterstützter Versichertenservice), eine vergleichsweise gute Datenlage. Zum einen handelt es sich bei den untersuchten Daten um sozio-demographische Stammdaten wie Alter, Geschlecht, Gruppenzugehörigkeit etc., zum anderen um Abrechnungsdaten wie Krankenhaus- und Medikamentenkosten. Die Daten wurden anonymisiert und mittels Excel-Tabellen aus dem KKH-Datenbanksystem exportiert.

In Bezug auf den Aggregationsgrad der genutzten Daten wird für die Auswertung der Informationen ein „bottom-up“-Ansatz gewählt. Es werden niedrig aggregierte Daten auf die gewünschte Aussagenebene hochgerechnet.

Weitere Informations- und Plausibilitätsprüfungen konnten durch persönliche Befragung von Experten der jeweils relevanten Institutionen durchgeführt werden. So wurden Interviews mit dem Teamleiter des Call-Centers bei ArztPartner almeda AG, der zuständigen Projektleiterin der Krankenkasse KKH und einem IT-Experten der KKH geführt.

Die wesentlichen Merkmale der Daten:

1. Stammdaten: Identifikationsnummer, Geschlecht, Geburtsdatum, Sterbedatum, Gruppe, Startdatum, Sterbedatum

2. Krankenhausaufenthalte: Identifikationsnummer, Krankenkassenaufwand brutto, ICD, Einweisungsdatum, Entlassungsdatum, 7.11.2000 -20.3.2007

3. Arzneimittel: Identifikationsnummer, Verordnungsdatum, Hilfmittelklassifikation, Krankenkassenaufwand brutto, 15.7.2002 – 15.3.2007

4. Einkommen: Identifikationsnummer, Einkommensgruppe

5. Experteninterview Datenexperte und Betreuungsteamleiter von der ArztPartner almeda AG, IT-Fachmann KKH

3.8 Statistische Methoden

In der Darstellung der Ergebnisse werden als statistischen Maßzahlen zur Beschreibung der zentralen Tendenz Mittelwert und Median aufgeführt. Der Median hat bei den meisten Ergebnisdarstellungen die wichtigste Bedeutung als Schätzer für die Lage der Daten, da für fast alle Zielvariablen eine starke Rechtsschiefe der Verteilungen vorlag.

Somit unterscheidet sich der Median in vielen Fällen auch zum Teil erheblich von den Mittelwerten. In fast allen Fällen liegt der Mittelwert rechts vom Median, worin sich die bekannte Empfindlichkeit des Mittelwertes für Ausreißer oder schiefe Verteilungen widerspiegelt.

Bei vielen Variablen kann nicht von einer Normalverteilung ausgegangen werden, so dass der gängige t-Test für den Mittelwertvergleich zweier unabhängiger Stichproben nicht anwendbar ist. Bei deutlicher Verletzung der Annahmen von Normalverteilung und Homoskedastizität (Varianz-Gleichheit) wird der verteilungsfreie, nichtparametrische Mann-Whitney-U-Test verwendet. Der Log-Rang Test wird verwendet, um Überlebenskurven von unabhängigen Subgruppen zu vergleichen. Ferner werden 95%-Konfidenzintervalle für relevante Schätzgrößen angegeben. Der Begriff „signifikant“

bedeutet im Folgenden soweit nicht anders spezifiziert: statistisch signifikant auf dem zweiseitigen 5 %-Signifikanz-Niveau.

Aufgrund der Vielzahl der Fragestellungen, welche im Rahmen der vorliegenden Arbeit untersucht werden sollen, kann der Problematik des „multiplen Testens“ (siehe Anhang:

Multiple Testproblematik) nicht ausreichend Rechnung getragen werden. Eine Korrektur des Signifikanzniveaus für alle vorgenommenen Tests würde zu stark konservativen Ergebnissen führen. Saville schlägt vor keine Korrekturen für multiples Testen vorzunehmen, sondern vielmehr alle Ergebnisse und vorgenommenen Tests vollständig zu berichten und dabei auf die multiple Testproblematik hinzuweisen [99]. Dem Leser wird somit die Möglichkeit gegeben, im Zuge der Interpretation der Resultate, selbst eine informelle Adjustierung des Signifikanzniveaus vorzunehmen.

Neben der statistischen Signifikanz wurde die klinische oder ökonomische Relevanz der Differenz eines Zielparameters zwischen den Vergleichsgruppen zur Beurteilung des Programmeffekts herangezogen. Die Entscheidung ab wann eine Differenz relevant war, hing von einer umfassenden Einwertung des Ergebnisses ab. In der Regel wurden Abweichungen von mehr als 10 % als relevant eingestuft.

Sofern nicht anderweitig ausgewiesen, beziehen sich die angegebenen Parameter auf den gesamten zweijährigen Evaluationszeitraum. Die Aufbereitung der Daten erfolgte in Access 2003 und Excel 2003. Die statistischen Berechnungen wurden in SPSS 11.5 durchgeführt. Für die graphischen Darstellungen wurde PowerPoint 2003, Excel 2003 und SPSS 11.5 eingesetzt.

4 ERGEBNISSE

4.1 Vergleichbarkeit der Ausgangsgruppen 4.1.1 Teilnehmer, Ablehner und Ausscheider

Die Teilnahme am Programm „Herzensgut“ war freiwillig. Es ergaben sich geschlechts- und altersabhängige Unterschiede in der Teilnahmebereitschaft. Die Teilnahmequote der Männer lag deutlich höher als die der Frauen: 38,6 % der angesprochenen männlichen Kandidaten zeigten sich zur Teilnahme bereit, gegenüber 28,7 % der Frauen. Bei jüngeren Patienten war die Teilnahmebereitschaft größer.

Im Prozess der Einschreibung in das Gesundheitsprogramm wurden die potentiellen Teilnehmer nicht nur von der KKH angeschrieben, sondern auch von ArztPartner-Mitarbeitern angerufen, bzw angeschriebene Patienten setzten sich mit ArztPartner telefonisch in Verbindung (eingehende Anrufe). Dadurch liegen Informationen für 381 Ablehner vor. Es konnten folgende Gründe für das Ablehnen der Teilnahme festgestellt werden: Die häufigsten drei Gründe waren „dauerhaft kein Interesse“, „zurzeit kein Interesse“ und „dauerhaft medizinisch nicht geeignet“. Die Tabelle 5 zeigt weitere Gründe. Insgesamt 52 Personen gaben an, nicht an Herzinsuffizienz erkrankt zu sein, obwohl dies das Einschlußkriterium war (siehe Abschnitt 3.3.1)

Ausgehende Zurzeit nicht medizinisch geeignet 25 1 26

5x nicht erreicht 9 0 10

Verstorben 6 6

Gesamt 381

Tabelle 5 – Gründe für das Ablehnen der Teilnahme

Insgesamt schieden 90 Teilnehmer vorzeitig aus dem Gesundheitsprogramm Herzensgut aus. 52 Personen starben, 38 Programmteilnehmer schieden aufgrund anderer, nicht näher bekannter Gründe vorzeitig aus. Im Mittel verbrachten die durch Tod ausgeschiedenen Teilnehmer 263 Tage im Gesundheitsprogramm, im Median waren es 250 Tage. Die Ausscheider aus anderen Gründen verbrachten im Mittel 468 Tage im Gesundheitsprogramm, der Median lag bei 426 Tagen. Aufgrund der relativ langen Verweildauer wurden Ausscheider generell nicht aus der analysierten Interventionsgruppe herausgerechnet.

4.1.2 Beobachtungsdauer und Evaluationszeitraum

Da der Start des Gesundheitsprogramms für jeden Teilnehmer zeitlich individuell erfolgte, ergaben sich unterschiedlich lange Beobachtungszeiträume. Die unterschiedliche Länge der Beobachtungsdauer ist in Tabelle 6 aufgeführt. Obwohl die maximale Beobachtungsdauer bei 36 Monaten lag, wurde für eine Gleichgewichtung aller Teilnehmer ein einheitlich langer Evaluationszeitraum für alle Teilnehmer gewählt.

Dazu wurde die minimale Beobachtungszeit von 24 Monaten herangezogen. Der Evaluationszeitraum wurde folglich auf 24 Monate begrenzt wie in Abbildung 10 dargestellt. Der Zeitraum von 12 Monaten vor dem Evalutionszeitraum wird mit Basiszeitraum bezeichnet und diente zur Analyse der Vergleichbarkeit der Ausgangsgruppen.

Abbildung 10 – Basis- und Evaluationszeitraum

4.1.3 Basisdaten

Die Studienteilnehmer verteilten sich wie folgt auf die einzelnen Gruppen: 747 Patienten waren Angeschriebene, die sich in 251 Interventionsgruppenteilnehmer und 496 Ablehner aufteilten. 252 Personen befanden sich in der Kontrollgruppe. Diese Ausgangsgruppen wurden zunächst bezüglich Alter, Geschlechterverteilung, Herzinsuffizienzstadien und Einkommen verglichen.

Im Vergleich zur Kontrollgruppe mit 77,5 Jahren war die Interventionsgruppe mit 72,7 Jahren im Mittel um 4,8 Jahre jünger (p-Wert < 0,001; t-Test). Der Altersunterschied war damit größer als derjenige zwischen Kontrollgruppe und Angeschriebenen (Tabelle 6).

Der Altersunterschied war zwischen den Angeschriebenen und der Kontrollgruppe nur noch gering ausgeprägt. Im mittleren Durchschnitt waren die Teilnehmer der Kontrollgruppe mit 77,5 Jahren 2,2 Jahre älter als die Teilnehmer der angeschriebenen Gruppe mit 75,3 Jahren. Dieser Unterschied war gering, aber dennoch signifikant (t-Test: p < 0,05). Im Median ergab sich ein Unterschied von 2 Jahren zwischen Kontrollgruppe und Angeschriebenen. Bei großen Stichproben ist es durchaus möglich, dass sich trotz einer ordnungsgemäßen Randomisierung kleine, aber signifikante Unterschiede zeigen, welche jedoch klinisch gesehen irrelevant sein können. In der folgenden Analyse wurde der Altersunterschied zwischen Angeschriebenen und Kontrollgruppe als vernachlässigbar eingestuft (siehe „5.2.1 Ausschlusskriterien, Randomisierung, Vergleichbarkeit“).

Auch die Geschlechterverteilung unterschied sich zwischen Interventions- und Kontrollgruppe: Der Frauenanteil lag bei der Kontrollgruppe bei 54,4 %, bei der Interventionsgruppe nur bei 42,6 %. Der Unterschied war signifikant (p-Wert = 0,01;

Chi2-Test) und größer als derjenige zwischen Kontrollgruppe und Angeschriebenen. Bei den Angeschriebenen lag der Frauenanteil bei knapp 50 %, die Geschlechterverteilung unterschied sich nicht signifikant zwischen Angeschriebenen und Kontrollgruppe (p-Wert

= 0,24; Chi2-Test).

Angeschriebene

* t-Test gegen Kontrollgruppe, † Chi-Quadrat Test (2-seitig) gegen Kontrollgruppe

Tabelle 6 – Basisdaten

Der signifikante und relevante Alters- und Geschlechterunterschied zwischen Interventionsgruppe und Kontrollgruppe könnte auf Zufall oder Selektionseffekten beruhen. Deshalb wurde in der Folge die Intention-to-treat-Analyse zwischen allen Angeschriebenen und der Kontrollgruppe besondere Beachtung geschenkt.

In der Intention-to-treat-Analyse zwischen Angeschriebenen und Kontrollgruppe zeigte sich der Altersunterschied nicht nur schwächer, sondern er war bei den Männern mit im Mittel 1,5 Jahren auch nicht mehr signifikant (p-Wert = 0,216; t-Test). Bei den Frauen allerdings war der Unterschied mit im Mittel 2,6 Jahren noch signifikant (p-Wert =0,015;

t-Test). Die Daten sind in Tabellen C und D im Anhang aufgeführt.

Neben Alter und Geschlecht war das Stadium der Herzinsuffizienz der wichtigste vorliegende Parameter für die klinische Vergleichbarkeit der untersuchten Gruppen.

Dazu wurden die Stadien gemäß der Einteilung der New York Heart Association (NYHA) herangezogen (siehe Tabelle 7) und die Patienten weiter in drei Gruppen unterteilt:

Gruppe A bedeutete die zwei leichten NYHA Stadien (I und II), Gruppe B die beiden hohen (III und IV). In Gruppe C waren die NYHA Stadien nicht näher bezeichnet (d.h.

ICD-Codes I50.1, I50.9, I50.19). Aus Tabelle 7 ist ersichtlich, dass sich der Großteil der

Interventionsgruppe (52,6 %) in einem schweren NYHA-Stadium befand. Bei der Kontrollgruppe waren es nur 46,4 %. Die Verteilung der Interventionsgruppe entsprach auch in den Kategorien „leicht“ und „unbekannt“ in etwa der Verteilung aller Angeschriebenen.

NYHA-Stadium Angeschriebene (%) Kontrolle (%) Gesamt (%) Leicht (I und II) Gesamt 6,2 5,2 5,9

Unbekannt Gesamt 41,1 48,4 42,9

Intervention 41,0

Ablehner 41,1

Total 100 100 100

Tabelle 7 – Herzinsuffizienz nach Stadien der New York Heart Association

Neben den medizinischen Parametern wurde ein sozio-ökonomischer Vergleich durchgeführt. Dazu wurden die Patienten entsprechend ihres Einkommens in 12 Gruppen eingeteilt (siehe Tabelle G im Anhang). Die meisten Studienteilnehmer befanden sich in Einkommensgruppe 1. 33,4 % der Studienteilnehmer verdienten

Neben den medizinischen Parametern wurde ein sozio-ökonomischer Vergleich durchgeführt. Dazu wurden die Patienten entsprechend ihres Einkommens in 12 Gruppen eingeteilt (siehe Tabelle G im Anhang). Die meisten Studienteilnehmer befanden sich in Einkommensgruppe 1. 33,4 % der Studienteilnehmer verdienten