• Keine Ergebnisse gefunden

7.2 D ATENMATERIAL , D ATENAUFBEREITUNG UND VARIABLENTRANSFORMATION

7.2.1 Beschreibung der Rohdaten und ihre Aufbereitung

Die Daten wurden in zwei Excel-Dateien geliefert, von denen die eine 10 Arbeitsblätter enthielt (siehe Tabelle 6). Die andere Excel-Tabelle beinhaltete die Fachkraftquote pro Einrichtung zu sechs unterschiedlichen Stichtagen.

Tabelle 6: Übersicht über die gelieferten Rohdaten

Arbeitsblatt Anzahl Fälle Anzahl Variablen davon relevant

Personendaten 3738 13 13

Nortonskala 12625 38 10

Unterbringung 5229 5 5

Pflegestufe 3498 4 4

Arbeitsblatt Anzahl Fälle Anzahl Variablen davon relevant

Abwesenheiten 2243 4 4

Verwaltungseckdaten 2764 20 9

Mitarbeiter 16709 6 6

Med. Diagnosen 20158 4 4

Einrichtung Allg. II 94 4 4

Die gelieferten Daten mussten vor der Analyse zu einem Datensatz zusammengeführt werden.

Als problematisch erwies sich dabei, dass die für die einzelnen Bewohner zu unterschiedlichen Zeitpunkten vorgenommenen Datenerfassungen routinemäßig in jeweils derselben Datenmaske erfolgte. Somit unterschieden sich die Variablennamen nicht nach erhobenen Zeitpunkten, und dieselbe Variable lag mehrmals für eine Person vor. Teilweise waren wichtige Bezugsvariablen wie das Aufnahmedatum nur in einer Tabelle vorhanden. Für die Bildung neuer zeitpunktbezogener Variablen musste auf die Zeitangaben in anderen Tabellen zurückgegriffen werden. Diese anspruchsvolle Umstrukturierung des Datenmaterials in einen einheitlichen und für Längsschnittbetrachtungen geeigneten Datensatz wurde per Auftrag vergeben21.

Die aufbereiteten Daten enthielten nun teilweise zeitpunktbezogene Variablen. Im Vorfeld wurden vier Zeitpunkte definiert:

t0 = (Aufnahmezeitpunkt) wurde aus der ersten Eintragung nach der Aufnahme gebildet, die vor dem Zeitpunkt „ein Monat nach der Aufnahme“ lag.

t1 = (zwei Monate nach Aufnahme) wurde aus der Eintragung gebildet, die am dichtesten vor dem Zeitpunkt „zwei Monate nach der Aufnahme“ lag (alle anderen Eintragungen waren zu ignorieren).

t2 = (vier Monate nach Aufnahme) wurde aus der Eintragung gebildet, die am dichtesten vor dem Zeitpunkt „vier Monate nach der Aufnahme“ lag (alle anderen Eintragungen waren zu ignorieren).

t3 = (sechs Monate nach Aufnahme) wurde aus der Eintragung gebildet, die am dichtesten vor dem Zeitpunkt „sechs Monate“ nach der Aufnahme lag (alle anderen Eintragungen waren zu ignorieren).

Für den Fall, dass zwischen den einzelnen Erhebungszeitpunkten keine Eintragungen vorlagen, war der Zeitpunkt als Missing zu kennzeichnen.

Durch diese Datenaufbereitung wurde deutlich, dass nicht für jeden Bewohner ein vollständiger Datensatz zur Verfügung stand. Für 1002 Bewohner (28,9%) lagen gar keine Einträge in der Nortonskala vor, Da das Item der Nortonskala „Inkontinenz“ für diese Untersuchung die

21 Durchgeführt im Institut für medizinische Informatik, Biometrie und Epidemiologie der

Charité-Universitätsmedizin Berlin

Methodik 64

abhängige Variable bilden soll, mussten folglich alle Bewohner aus der Studie ausgeschlossen werden, für die keine Eintragung im Assessmentinstrument Nortonskala vorlag. Ob durch dieses Vorgehen ein Selections-Bias entstand, wird in Kapitel 7.5 beschrieben.

Zur Bestimmung der Aufnahme- und Gesamtprävalenz wurden nur Bewohner untersucht, deren Ausscheidungssituation mindestens zu zwei Zeitpunkten oder zum Zeitpunkt t0 in der Nortonskala beschrieben vorlag. Der Datenpool betrug nach dieser Datenaufbereitung 2466 Bewohner.

Um die weitern Zielstellungen der Arbeit („Bestimmung von Neuerkrankungen und Heilungen“,

„Zusammenhangsanalysen zwischen Neuerkrankungen und ausgewählten Faktoren“ und

„Zusammenhangsanalysen zwischen der wiederhergestellten Kontinenzfähigkeit und ausgewählten Faktoren“) zu erreichen, konnten nur die Fälle in die Analyse aufgenommen werden, für die zu mindestens zwei Zeitpunkten eine Einschätzung ihrer Kontinenzsituation vorlag. Dies traf für 2000 Fälle zu.

Wie häufig die Nortonskala angewendet wurde, zeigt Abbildung 4: Zum Zeitpunkt t0, also bis zu vier Wochen nach der Aufnahme, erhielten von den 2466 Bewohnern 85,9 % (2118 Bewohner) eine Einschätzung und für 14,1 % (348 Bewohner) lag keine Einschätzung vor. Zum Zeitpunkt t1 wurden nur etwa die Hälfte aller hier untersuchten Bewohner eingeschätzt (1292 Bewohner).

Für t2 und t3 existierten jeweils lediglich für ca. zwei Drittel der Bewohner Angaben der Nortonskala und für ein Drittel nicht.

14,1

47,6

33,8 39,0

85,9

52,4

66,2 61,0

0%

20%

40%

60%

80%

100%

t0 (n = 2118) t1 (n = 1292) t2 (n = 1633) t3 (n = 1505)

Prozent

keine Einschätzung Einschätzung

Abbildung 4: Anwendung der Nortonskala zu allen Zeitpunkten, Querschnitte

Eintragungen zu den Items der Nortonskala über alle vier Zeitpunkte lagen lediglich für 723 Bewohner vor, zu nur drei Zeitpunkten waren Eintragungen von 636 Bewohnern im Datensatz vorhanden, 641 Bewohner wurden nur zweimal in der Nortonskala eingeschätzt und für 466 Bewohner lag nur eine Einschätzung zum Zeitpunkt t0 vor.

Für eine längsschnittliche Verlaufsbeschreibung waren dieser unvollständige Datensatz und die daraus resultierenden variierenden Teildatensätze22 ungeeignet. Eine Transformation der Variablen in Gruppenvariablen, anhand derer die verschiedenen Verläufe dargestellt wurden, war unumgänglich Wie die Transformation der Verlaufs-Variablen vorgenommen wurde, ist in Abschnitt 7.2.2 dargestellt.

Neben dieser zeitpunktbezogenen Umstrukturierung waren weitere Variablen zu transformieren, wie medizinische Diagnosen und alle Variablen, die Aussagen über die einzelnen Einrichtungen machten (z. B. Fachkraftquote, Mitarbeiter, Größe und Lokalisation des Heims).

Die Herkunft der dokumentierten medizinischen Diagnosen war nicht nachvollziehbar. Es war nicht erkennbar, ob es sich bei den dokumentierten Diagnosen um Selbstauskünfte des Bewohners, um Auskünfte der Angehörigen oder um Angaben des behandelnden Arztes handelte. Teilweise fehlte die Angabe, wann die Erkrankung diagnostiziert worden war. Die Diagnosen waren keiner einheitlichen Dokumentationslogik unterworfen. So fanden sich in den Daten

• ICD 10 Nummern (z.B. ICD - 10F20.01)

• Verdachtsdiagnosen (z.B. Verdacht auf Bradycardie)

• akute Erkrankungen(Gürtelrose)

• chronische Erkrankungen (chronische Niereninsuffizienz)

• Fachtermini (Chronisch cerebrale Ischämie)

• umgangssprachliche Bezeichnungen einer Krankheit (Schlaganfall)

• nicht nachvollziehbare Abkürzungen (z. B. CVI)

• Hilfsmittel (DK PEG)

Um den Einfluss einer Erkrankung auf die Entstehung der Harninkontinenz zu untersuchen, hätten die Erkrankungen in eine einheitliche Systematik überführt werden müssen; dieser Schritt setzt ein umfangreiches medizinisches Fachwissen voraus und erfordert eine entsprechende Bearbeitung des Datenmaterials durch eine ausgewiesene Fachperson.

Aufgrund mangelnder zeitlicher und personeller Ressourcen wurde von dieser Überarbeitung abgesehen. Unter pragmatischen Gesichtspunkten erfolgte eine Reduktion des Datenmaterials

22 Im Grunde wurde eine Vollerhebung aller Bewohner vorgenommen, die den Einschlusskriterien

entsprachen. Da man diese Erhebung aber auch als Stichprobe der Grundgesamtheit der BRD auffassen kann, wird im Folgenden der begriff Teilstichprobe bzw. Stichprobe verwandt.

Methodik 66 auf die Erkrankungen, deren Einfluss auf die Inkontinenzentwicklung bereits in vorherigen Studien nachgewiesen wurde. In einem ersten Schritt fand eine Bereinigung aller Doppel- und Mehrfachnennungen statt. Die so reduzierte Anzahl an Diagnosen konnte „per Hand“ den in- frage kommenden Diagnosen zugewiesen werden. Die so zugewiesenen Diagnosen wurden danach von zwei weiteren, medizinisch ausgebildeten Personen validiert.

Die Mitarbeiterdatei erwies sich ebenfalls als unsystematisch strukturiert. Es war nicht nachvollziehbar, für welche Tätigkeiten (Administration, Hauswirtschaft oder Pflege) die einzelnen Mitarbeiter zuständig waren. Teilweise fehlten eindeutige Berufsangaben oder die Angaben zur Fachkraft bzw. Hilfskraft. Die Aufbereitung dieser Datei erfolgte nach einem ähnlichen Vorgehen, wie es bei den medizinischen Diagnosen angewendet wurde. Zunächst fand eine Reduktion um alle Doppel- und Mehrfachnennungen statt. Danach wurden Berufskategorien gebildet und die einzelnen Berufsangaben der Datei diesen Kategorien zugeordnet.