• Keine Ergebnisse gefunden

1 Einleitung

1.4 Outcome von Patient/innen nach Herzkreislaufstillstand

1.4.2 Messgrößen zur Outcomemessung

1.4.2.4 Das Sickness Impact Profile (SIP)

1.4.2.4.2 Entwicklung des Sickness Impact Profile

Marilyn Bergner erkannte die Notwendigkeit, ein neues Messinstrument zu entwickeln, das unabhängig von verschiedenen Krankheitszuständen den Gesundheitszustand zuverlässig misst und zudem auch sensitiv genug ist, um bereits kleine gesundheitliche Veränderungen festzustellen. Zusammen mit Betty Gilson, Ruth Bobbit, und Kollegen der Universität Washington begann sie im Jahr 1972 mit der Entwicklung des SIP [56]. Die Entwicklung des SIP dauerte ganze 5 Jahre. Folgende Entwicklungsschritte wurden durchlaufen [61][62][64][48][63]:

1. Schritt: Erarbeiten eines konzeptionellen Rahmens.

2. Schritt: Festlegen des Inhalts des Messinstruments.

3. Schritt: Durchführen von 3 Feldstudien, Untersuchen der Anwendbar- keit, Reliabilität, Validität und Punkteverteilung.

1. Schritt: Erarbeiten eines konzeptionellen Rahmens.

Aus folgenden Gründen wurde sich dafür entschieden, sich bei der Lebensqualitäts-messung auf das krankheitsbezogene Verhalten im Alltag zu konzentrieren und Gefühls-zustände und klinische Messwerte auszuklammern [61]:

Das Verhalten kann direkt von dem Patienten bzw. der Patientin berichtet werden oder das Verhalten von einem Angehörigen beobachtet und anschließend berichtet werden.

Die medizinische Behandlung kann unabhängig von ihrem Effekt einen Einfluss auf die Erkrankung selbst zeigen.

Das Verhalten kann unabhängig davon gemessen werden, ob sich die Person momentan in medizinischer Behandlung befindet oder nicht.

Sowohl der Erkrankte als auch die Pflegeperson kann den Zusammenhang zwischen dem Schweregrad der vorherrschenden Erkrankung und den sich daraus ergebenden Veränderungen im Verhalten nachvollziehen.

Eine Konzeptionalisierung der Lebensqualität mit der Aufteilung in Domänen und Kom-ponenten ist eine Grundvoraussetzung zur strukturierten Erfassung. Da viele KomKom-ponenten der Lebensqualität nicht direkt erfasst werden können, erfolgt eine indirekte Messung, indem mehrere Fragen / Items den Antworten entsprechend in einen Punktwert umgesetzt werden. Die Summe dieser Punktwerte ergibt dann den Wert der jeweiligen Komponente, aus welchen wiederum der Wert der einzelnen Domänen berechnet werden kann [47].

Die enge Beziehung zwischen Verhalten im Alltag sowie Art und Stärke der Erkrankung bildet das Fundament des konzeptionellen Rahmens und ist in einem Kontinuum definiert [61]. Auf der einen Seite des Kontinuums steht der gesunde Mensch ohne Einschränkun-gen im Alltag, auf der anderen Seite der kranke Mensch mit EinschränkunEinschränkun-gen und even-tuellen Dysfunktionen.

Die Fragen des SIP sollten anhand verschieden hoher Punktwerte unterschiedlich gewich-tet werden, wobei man sich dabei an Stellungnahmen von Expert/innen im Bereich des Gesundheitswesens, Patient/innen, Angehörigen, Pflegepersonen, offensichtlich Gesunden und an Ergebnissen von den ersten Feldversuchen orientierte (siehe dazu Schritt 3) [48][53].

Schritt 2: Festlegen des Inhalts des Messinstruments.

Experten im Bereich des Gesundheitswesens, Patient/innen, Angehörige, Pflegepersonen und Gesunde schätzten das Verhalten bei minimaler bis hin zu maximaler Dysfunktion ab.

Mehr als 1100 Personen beteiligten sich an der Umfrage. Zusätzlich stützt man sich auf bestehende Kataloge, die krankheitsbezogene Verhaltensweisen bei Dysfunktionen beschreiben. Eine bestimmte Art und Schwere einer Dysfunktion durfte nur mit einer Frage abgehandelt werden, um überflüssige Fragen weitestgehend zu vermeiden. Durch Sammeln, Sortieren und Gruppieren dieser Informationen entstand der anfängliche SIP, der 312 Fragen und 14 Kategorien besitzt [61].

Schritt 3: Die 3 Feldstudien.

Die erste Feldstudie wurde im Jahr 1973 begonnen und verfolgte die unten angegebenen Ziele [61]:

eine Gewichtung der einzelnen Fragen anhand unterschiedlicher Punkteverteilung für die Entwicklung eines Auswertungsschlüssels,

eine Prüfung der Durchführbarkeit des SIP,

eine Messung der Validität und der Reliabilität und

nochmalige Überprüfung des Inhalts und Überarbeitung bei Bedarf.

Ein Gremium, bestehend aus 25 Personen, darunter Expert/innen aus dem Bereich des Gesundheitswesens und Student/innen, bewertete die einzelnen Fragen des SIP nach dem jeweiligen Ausmaß der Gesundheitsbeeinträchtigung in einem zweiteiligen Skalierungs-verfahren [61][63]. Dieses Gremium legte den Grad der Dysfunktion fest, der vorliegt, wenn ein Teilnehmer bzw. eine Teilnehmerin die Frage aufgrund seiner gesundheitlichen Beeinträchtigung mit Ja beantwortet. Im ersten Schritt wurde jede der Fragen innerhalb einer Kategorie an einem 11-Punkte-Intervall bewertetet. So wurden die beiden Fragen pro Kategorie gefunden, die jeweils die geringste bzw. die stärkste Beeinträchtigung des Gesundheitszustandes aufzeigen. Im zweiten Schritt wurden diese beiden ermittelten Fragen pro Kategorie auf einer 15-Punkte-Skala bewertet. Durch diesen Schritt konnten die Fragen kategorieübergreifend auf einer einzigen Skala abgebildet werden und anhand dieser ermittelten Skalierungswerte die Punktwerte (Scores) des SIP festgelegt werden.

In dem ersten Feldversuch wurde das Sickness Impact Profile bei insgesamt 246 Personen geprobt. Darunter befanden sich neben ambulanten Patient/innen auch stationäre

Patient/-innen, Patient/innen mit häuslicher Betreuung und so genannte „non-patients“, die am ehesten mit einem Normalkollektiv gleichzusetzen sind [61].

Die Ergebnisse der ersten Feldstudie dienten letztendlich für eine vorläufige erste Validie-rung der SkalieValidie-rungswerte des Gremiums [61]. Eine unabhängige Gutachtergruppe bewer-tete die Profiles von den 246 Personen der ersten Feldstudie, die nicht mit Scores belegt waren. Die anhand des vom Gremium erarbeiteten Punkteschlüssels gewonnenen Bewertungen stimmten mit den Einschätzungen der Gruppe stark überein (r ≥ 0,85). Die Validität des Gesamtkonstrukts bezüglich der Einschätzung einer Dysfunktion sowie die Validität für die anfängliche Zuteilung der Skalierungswerte zu den einzelnen Fragen waren somit bewiesen.

In der zweiten Feldstudie im Jahre 1974 wurde die Test-Retest Reliabilität gemessen, die ziemlich hoch ausfiel und sich nicht signifikant bei verschiedenen Interviewern (r = 0,73 bis 0,96), bei den verschiedenen Arten der Anwendung (r = 0,85 bis 0,95) und bei unterschiedlichen Graden und Arten der Funktionseinschränkung änderte (r = 0,64 bis 0,92) [64][62].

Die konzeptionelle Validität und diskriminative Kapazität des SIP konnte dadurch bewie-sen werden, dass Untergruppen innerhalb der jeweiligen Patientengruppen mittels SIP identifiziert werden konnten [62]. Die in diesem Feldversuch gewonnenen Informationen initiierten eine nochmalige Überarbeitung des SIP [65][48]. Es wurde der Zusammenhang zwischen den Fragen, die Beziehung der Fragen zu der jeweils zugehörigen Kategorie und zum Overall Score erneut geprüft, Fragen verbessert und auch gestrichen. Es entstand dabei eine verkürzte überarbeitete Version, die in einem erneuten Feldversuch getestet werden musste.

In der dritten Feldstudie im Jahre 1976 wurde mittels des neu überarbeiteten SIP bei 696

„members of a prepaid group practice“ und 199 kranke Personen einer „family medicine clinic“ die Lebensqualität erhoben [48].

Zur Test-Retest-Überprüfung wurde eine kleinere Untergruppe von 53 Personen zu einem zweiten Zeitpunkt befragt.

Zusätzlich wurden drei verschiedene Arten der Anwendung evaluiert:

Interviewer-kontrolliert (1): Fragen werden durch den Interviewer gestellt und die Antworten des Befragten vom Interviewer eingeschätzt.

Interviewer-assistiert (2): Fragen werden durch den Interviewer gestellt und durch den Befragten selbst beantwortet.

Interviewer-unabhängig (3): Fragen werden per Post zugesandt und vom Befragten selbst gelesen und beantwortet.

Die Test-Retest Reliabilität war sowohl für die Gruppe 1 (r = 0,97) als auch für die Gruppe 2 (r = 0,87) hoch, für die Gruppe 3 wurde kein Wert berechnet. Die Reliabilität der inter-nen Konsistenz war bei allen drei Gruppen hoch. Jedoch hatte die Gruppe 3 (alpha = 0,81) einen geringeren Wert als Gruppe 1 und Gruppe 2 (alpha = 0,94). Die Korrelationen zwischen den Kriterienvariablen und den SIP Scores der Gruppe 3 (r= 0,05 bis 0,48) waren wesentlich geringer als die der Gruppe 1 (r = 0,55 bis 0,64) und Gruppe 2 (r = 0,60 bis 0,74). Die SIP Scores bei einem Interviewer-unabhängigen Ausfüllen ohne Möglichkeit zur Nachfrage könnten folglich nicht so zuverlässig sein wie bei einer Interviewer-kontrollierten bzw. Interviewer-assistierten Erhebung [48].

Das SIP war höher korreliert mit denjenigen Kriterienmaßstäben, von denen von vornherein vorausgesetzt wurde, dass diese die durch den SIP erhobene gesundheitsbezogene Lebensqualität reflektieren.

Die SIP Scores korrelierten stark mit den Kriterienmaßstäben. Die hohe Übereinstimmung mit den Kriterienmaßstäben bekräftigt das Grundgerüst des SIP, den Gesundheitszustandes einer Person über deren Dysfunktion zur erheben.

In Tabelle 2 werden diese Korrelationen zwischen dem Overall Score und anderen

National Health Interview Survey Index 0,55

klinische Beurteilung der Dysfunktion 0,50

klinische Beurteilung der Erkrankung 0,40

Tabelle 2 Korrelationen zwischen dem Overall Score und anderen Unter-suchungsmethoden, Feldversuch des Jahres 1976.

Für die Validierung des SIP wurden zuverlässige klinische Messdaten von folgenden Patient/innen mit den Ergebnissen des SIP verglichen:

Patient/innen mit kompletten künstlichen Hüftgelenk, Patient/innen mit Hyperthyreose,

Patient/innen mit Gelenkrheumatismus.

Die Korrelationen zwischen den SIP Scores und den klinischen Messgrößen waren moderat bis hoch (r = 0,41 bis 0,91) [48], das die Tatsache bestärkt, dass die gefühlte Beeinträchtigung nicht unbedingt stark mit den klinischen Messwerten korrelieren muss.

Die gesammelten Ergebnisse aller drei Feldstudien wurden dazu verwendet, die endgültige Version des SIP zu entwickeln [48]. Aufgrund von enger Beziehung wurden die Kategorie

„Körperbewegung“ und die Kategorie „Personal Hygiene“ zur Kategorie „Körperpflege und Bewegung“ zusammengeschlossen, ebenso die Kategorie „Familiärer Kontakt“ und die Kategorie „Sozialkontakt“ zur Kategorie „Sozialkontakt“. Nach weiteren Veränderun-gen der FraVeränderun-gen entstand schließlich das heute gängige SIP mit 136 FraVeränderun-gen und 12 Kategorien.

Die Skalierungswerte, die Punkteverteilung auf die einzelnen Fragen und die Größe der Gesamtpunktezahl wurden evaluiert und fertig ausgearbeitet [63][65].

Die Skalenmetrik, die von dem bereits erwähnten Gremium im ersten Feldversuch erstellt worden war, wurde in einer erneuten Stichprobe als Intervall gleich verifiziert (Skala mit identischer Intervallbreite) [63]. Regressionsanalysen, Korrelationsmessungen zwischen einem vorausgesetzten physischen und psychosozialen Dimensionsscore, Korrelations-messungen zwischen einem von diesen beiden Dimensionsscores und dem Overall Score und Clusteranalysen bestätigten den Zusammenschluss zu den folgenden Scores [65]:

der Overall Score,

der physische Dimensionsscore, psychosoziale Dimensionsscore, die 12 Kategoriescores.