• Keine Ergebnisse gefunden

In diesem Kapitel werden statistische Analysemethoden vorgestellt, die im Rahmen dieser Arbeit diskutiert werden. Hierbei wird kein Anspruch auf Vollst¨andigkeit aller verf¨ugbaren Methoden erhoben. Dieses Kapitel soll vielmehr als Einf¨uhrung in die Methoden verstanden werden, die bei der Zielstellung dieser Arbeit von Bedeutung sind.

Bei Vergleichen von medizinischen Einrichtungen bzw. Kliniken auf Basis von Registerdaten – die im Folgenden als

”Einrichtungsvergleiche“ bezeichnet werden – sind zur Planung der Analyse zun¨achst verschiedene Fragen zu beantworten:

Anzahl der Zielgr¨oßen:

Zum einen gibt es Situationen, in denen die Behandlungsqualit¨at (also der Behandlungserfolg) anhand eines Indikators gemessen werden soll. In diesem Fall spricht man von einem Ranking. Werden aber mehrere Zielgr¨oßen be-trachtet, die innerhalb eines Versuchs / einer Auswertung dargestellt werden sollen, spricht man von einemProfiling. Beim Profiling werden also mehrere Rankings gleichzeitig durchgef¨uhrt, bei denen die Zentren im allgemeinen ver-schiedene Rangpl¨atze einnehmen. So kann untersucht werden, ob sich in den R¨angen bestimmte Strukturen zeigen, welches die St¨arken und Schw¨achen der Einrichtungen sind oder zu welchem

”Preis“ ein gutes Abschneiden in einem Parameter erzielt wird.

Im Rahmen dieser Arbeit wird haupts¨achlich auf die methodischen Aspek-te der Rankings eingegangen; das Profiling von Krankenh¨ausern ist f¨ur die Methodendiskussion weniger relevant, da es sich hierbei im Wesentlichen um mehrfaches Ranking handelt, und daher nur am Rande diskutiert wird.

Skalenniveau der Zielgr¨oße(n):

In den meisten Untersuchungen an Registerdaten liegen die Zielgr¨oßen als stetige und als normalverteilt angenommene Variablen oder in bin¨arer Form vor. Es sind aber Situationen vorstellbar, bei denen die Auspr¨agungen in ge-ordneten Stufen (Ordinalskala) oder als Zeit bis zu einem Ereignis (

” time-to-event“) gemessen werden. In seltenen F¨allen kann eine nominal skalierte Zielgr¨oße vorliegen, bei der also keine Rangfolge zwischen den Auspr¨agungen existiert. Zus¨atzlich zu den klassischen Skalenniveaus k¨onnte eine Erhebung im Gesundheitswesen auch Daten, die einen (stochastischen) Prozess beschrei-ben, betrachten.

F¨ur diese Arbeit werden aufgrund der Relevanz im Wesentlichen die beiden zu-erst genannten Skalenniveaus diskutiert. F¨ur die anderen Situationen werden an geeigneter Stelle Ausblicke gegeben.

Einflussgr¨oßen und Adjustierung:

Wie bereits im ersten Kapitel diskutiert wurde, ist es bei Einrichtungsverglei-chen zwingend erforderlich, die Ergebnisse hinsichtlich der Risikofaktoren, die f¨ur den Behandlungs(miss)erfolg bedeutsam sind und die sich zumeist zwi-schen den Kliniken unterscheiden, zu adjustieren. Diese Faktoren m¨ussen – zus¨atzlich zur Einflussgr¨oße Klinik – in das finale Modell einbezogen werden.

Zur Identifikation der relevanten Faktoren sollten Substanzwissenschaftler (z.B.

Fachexperten) hinzugezogen werden. Ist dies nicht m¨oglich, muss auf Basis von signifikanten Faktoren bzw. Faktoren mit starkem Einflussgrad (Steigungspa-ramter/slopes oder Odds Ratios) gearbeitet werden. Die Auswahl der Fakto-ren ist in der Regel nicht eindeutig zu kl¨aFakto-ren; man sollte aber bei hinreichend großer Fallzahl (und damit hoher Zahl von Freiheitsgraden) nicht zu

” spar-sam“ mit den Adjustierungsfaktoren umgehen. Eine Modell¨uberspezifierung h¨atte einen geringeren Einfluss auf das Ergebnis als eine Unterspezifikation.

Hierarchie der Datenlage (Cluster-Struktur):

Wie ebenfalls im ersten Kapitel erw¨ahnt wurde, sollte bei Einrichtungsverglei-chen die Korrelation der Beobachtungen innerhalb der Einrichtungen Ber¨uck-sichtung finden. Registerdaten sind in der Terminologie der Stichprobenverfah-ren also als Klumpenstichproben zu begreifen, da Patienten praktisch immer innerhalb genau eines Zentrums erfasst werden. Datenlagen dieser Form nennt man ”hierarchische Daten“ oder auch”multilevel data“ oder ”clustered data“.

Die beobachteten Daten von Patienten k¨onnen somit als Messwiedholungen desselben Zentrums aufgefasst werden; in diesem Fall spricht man bei den Patienten von

”level-1“ und bei den Kliniken von

”level-2“-Daten. Die hierar-chische Situation kann auf mehr als zwei Ebenen erweitert werden, etwa wenn bei den Patienten mehrere Messungen durchgef¨uhrt werden. Dann sind die Messungen innerhalb des Patienten wiederum untereinander korreliert. Die-se – f¨ur die AnalyDie-se wegen der zu modellierenden (und h¨aufig unbekannten) Kovarianz-Struktur wesentlich komplexere und schwieriger zu modellierende – Situation ist bei Einrichtungsvergleichen jedoch seltener, da wiederholte Mes-sungen h¨aufig in wiederholten Rankings auftreten.

Modellwahl:

Schließlich muss entschieden werden, mittels welcher statistischen Modellklas-se die Auswertung geschehen soll. Es bieten sich – je nach dem Skalenniveau der Zielgr¨oße – neben den klassischen linearen Modellen (Varianzanalyse, Re-gression, Kovarianzanalyse) einige alternative Verfahren an, die im Folgenden diskutiert werden. Bei der Wahl des Modells ist durch die hierarchische Da-tenlage allerdings ein limitierender Faktor gegeben, da diese von vielen Analy-semethoden nicht ber¨ucksichtigt werden kann. Lineare Modelle k¨onnen jedoch sowohl f¨ur hierarchische Daten als auch f¨ur gemischte (feste und zuf¨allige) Ef-fekte angewendet werden. Eine Auswahl der zur Verf¨ugung stehenden Modelle wird in diesem Kapitel vorgestellt und diskutiert.

Statistische Aufgabenstellung

Ziel dieser Arbeit ist es, Eigenschaften von statistischen Methoden allgemein und f¨ur das Anwendungsbeispiel speziell aufzubereiten und im Sinne eines Analysekonzeptes zu bewerten.

F¨ur das Analyseergebnis dieser Arbeit sind zwei Zielstellungen zu betrachten:

Methodenteil:Identifizierung geeigneter statistischer Methoden f¨ur die Ana-lyse von Daten aus der Versorgungsforschung (Registerdaten);

Analyseteil:Ermittlung optimaler Behandlungsstandards f¨ur Patienten (oder Patientengruppen).

In diesem Kapitel (Methodenteil) wird auf der Basis der vorhandenen Modellie-rungsans¨atze ein Analysekonzept mit dem Ziel der Benchmarkbildung in der Ver-sorgungsforschung erarbeitet.

Hierzu ist zun¨achst die Einf¨uhrung des klassischen linearen Modells hilfreich.

Definition – Das lineare Modell:

Seien

y, e zuf¨allige Vektoren mit je N Komponenten;

β fester Vektor mit k Komponenten;

X Matrix der Dimension Nk.

EinLineares Modell ist eine Darstellung der Form y=+e, wobei

y= (y1, . . . , yN)0 Realisationen der abh¨angigen Variablen Y;

X Designmatrix;

β = (β1, ..., βk) Parametervektor;

e= (e1, . . . , eN)0 Zufallsfehler mit unabh¨angig identisch verteilten Komponenten

E(e) = 0; Σe =σe2V und σe2 >0

Der Wert N entspricht der Gesamtzahl der als untereinander unabh¨angig ange-nommenen Beobachtungen.

Eine L¨osung ˆβ Rk des Normalengleichungssystems X0ˆ = X0y bezeichnet man auch als Kleinste-Quadrate-Sch¨atzung f¨ur β. Ist β linear und erwartungs-treu sch¨atzbar, so gilt nach dem Gauß-Markov-Theorem die Existenz und die Ein-deutigkeit dieser L¨osung ˆβ (

”Gauß-Markov-Sch¨atzer“).

Auf weitere theoretische Grundlagen der Linearen Modelle wird im Rahmen dieser Arbeit nicht weiter eingegangen. Hierzu sei auf die einschl¨agigen Lehrb¨ucher (z.B.

von Scheff´e [49] oder Hartung [22]) verwiesen.

Im Folgenden werden die g¨angigsten Typen von linearen Modellen eingef¨uhrt, die f¨ur die Analyse von Daten in der Versorgungsforschung von m¨oglicher Relevanz sind, d.h. in welcher Weise die eingangs benannten Fragestellungen und hinsichtlich der Situation bei Einrichtungsvergleichen modelliert werden k¨onnen. Die Einf¨uhrung der Methode und Notation erfolgt schrittweise, jedoch ohne auf maß- und wahrschein-lichkeitstheoretische Grundlagen zur¨uckzugreifen.