• Keine Ergebnisse gefunden

Da die Anpassung eines gemischten Modells ohne Hinzunahme von Kovariaten einen fairen Vergleich zwischen den Einrichtungen nicht erm¨oglicht, m¨ussen in den Teil der festen Effekte neben einem Gesamtmittel µ bzw. β0 diejenigen Kovariaten und m¨ogliche Wechselwirkungen einbezogen werden, von denen ein relevanter Einfluss auf die Zielgr¨oße bekannt ist oder zumindest vermutet wird.

Eine Ungleichheit in der Verteilung der relevanten Faktoren zwischen den Kliniken ist bei Registerdaten in nahezu allen F¨allen gegeben. Die Modellanpassung bewirkt dann, dass die Einfl¨usse, die durch die risiko-relevanten Kovariaten erkl¨art werden, nicht mehr f¨alschlicherweise dem Zentrum zugerechnet werden.

F¨ur die Auswahl der Kovariaten stehen im Wesentlichen die in den folgenden Abschnitten beschriebenen Konzepte zur Auswahl.

3.2.1 Auswahl ¨ uber Datenexploration, robuste Verfahren

Wie in Kapitel 2.6.3.2 erl¨autert wurde, kann der CART-Algorithmus zwar kaum zur prim¨aren Analyse benutzt werden, da zuf¨allige Effekte und hierarchische Struktu-ren schwer abzubilden sind. Wenn aber wenig Vorinformation ¨uber m¨ogliche Ein-flussfaktoren verf¨ugbar sind, kann dieses Instrument zur Datenexploration und zur Aufdeckung etwaiger Wechselwirkungen oder anderer komplexer Strukturen zwi-schen den (mit festen Effekten) modellierten Kovariaten jedoch hilfreich sein.

Alle Variablen und Kombinationen, die nach geeigneter Stutzung des Regressions-oder Klassifikationsbaums im Modell verbleiben, k¨onnen somit zur Analyse ins finale gemischte lineare Modell ¨ubernommen werden.

3.2.2 Auswahl nach Signifikanz, Selektionsverfahren

F¨ur alle bisher beschriebenen Modellans¨atze lassen sich die Modelle ¨uber verschiede-ne Verfahren so anpassen, dass nur noch diejenigen Parameter im Modell verbleiben, die einen relevanten Beitrag zur Erkl¨arung der Streuung des Zielparameters Y lei-sten. Parameter, die keinen im Sinne der statistischen Signifikanz nennenswerten Beitrag leisten, werden eliminiert bzw. nicht eingeschlossen.

Dar¨uber hinaus muss die Modellwahl Wechselwirkungen zwischen diesen Para-metern ber¨ucksichtigen. Hinweise auf diese k¨onnen beispielsweise aus bivariaten Be-trachtungen oder auch aus den Ergebnissen robuster Verfahren (hier CART-Analyse) abgeleitet werden.

Folgende Methoden stehen hierbei zur Verf¨ugung:

Volles Modell: Diese Methode ist die Standardmethode (”Full Model Fit“; keine Selektion), bei der alle in der Modellgleichung aufgef¨uhrten Parameter bzw.

Wechselwirkungsterme einbezogen werden. H¨aufig ist dies die einzige Methode, die zur Betrachtung der Signifikanz n¨otig ist, beispielsweise wenn nur wenige Parameter ohne gr¨oßere Interdependenzen betrachtet werden.

Vorw¨arts-Selektion: Bei der Vorw¨arts-Selektion (”Forward Selection“) wird zu Be-ginn der Prozedur ein Modell ohne unabh¨angige Variable spezifiziert.

F¨ur jede Einflussgr¨oße errechnet die Vorw¨artsmethode nun F-Statistiken, die den Beitrag der Variablen zum Modell angeben, wenn sie enthalten ist. Die p-Werte f¨ur diese F-Statistiken werden mit einem Eingangswert fα vergli-chen, der in der Modellanweisung spezifiziert wird (z.B. fα = 0,05). Wenn der p-Wert von keiner F-Statistik die vorgegebene Signifikanzschwelle fα un-terschreitet, stoppt die Selektion. Andernfalls f¨ugt die Methode die Variable dem Modell hinzu, die die F-Statistik mit dem gr¨oßten Wert besitzt.

Die Methode errechnet dann wieder F-Statistiken f¨ur die Variablen, die nicht einbezogen wurden, und der Auswahlprozess wird wiederholt. So werden die Variablen nacheinander dem Modell hinzugef¨ugt, bis keine außerhalb des Mo-dells verbliebene Variable eine F-Statistik besitzt, deren p-Wert unterhalb des vorgegebenen fα liegt.

Ist eine Variable einmal ins Modell einbezogen, bleibt sie enthalten.

R¨uckw¨arts-Selektion: Die R¨uckw¨arts-Selektion (”Backward Elimination“) startet mit der Berechnung der F-Statistiken f¨ur ein Modell, welches zun¨achst alle unabh¨angigen Variablen einschließt.

Dann werden Variablen nacheinander aus dem Modell gel¨oscht, bis alle im Modell verbliebenen Parameter F-Statistiken zeigen, deren p-Werte unterhalb einer festgelegten Schwelle bα (z.B. bα = 0,1) liegen. An jedem Schritt wird die Variable, die den kleinsten Beitrag zum Modell liefert, gel¨oscht.

Schrittweise Selektion: Die Schrittweise Selektion (

”Stepwise Selection“) stellt ei-ne Modifikation der Vorw¨arts-Selektions-Technik dar und unterscheidet sich dadurch, dass Variablen, die ins Modell eingeschlossen wurden, nicht notwen-digerweise dort verbleiben.

Wie in der Vorw¨arts-Selektion werden Variablen nacheinander dem Modell hinzugef¨ugt, deren F-Statistik einen p-Wert p < fα zeigen. Nachdem jedoch eine Variable hinzugef¨ugt wurde, betrachtet die schrittweise Methode alle Va-riablen, die bereits im Modell eingeschlossen wurden, und l¨oscht jede Variable, deren F-Statistik einen p-Wert oberhalb einer Schwelle bα zeigt. Erst nach die-ser ¨Uberpr¨ufung und dem n¨otigen Entfernen von Variablen kann die n¨achste Variable dem Modell hinzugef¨ugt werden.

Die schrittweise Prozedur endet,

wenn keine der Variablen außerhalb des Modells eine F-Statistik zeigt, die verglichen mit fα signifikant ist UND jede Variable im Modell verglichen mit bα Signifikanz zeigt, ODER,

wenn die Variable, die dem Modell hinzugef¨ugt werden soll, erst im vor-angegangenen Schritt gel¨oscht wurde.

Dar¨uber hinaus stehen weitere Verfahren, wie”MaximumR2-Verbesserung“,

” Mi-nimum R2-Verbesserung“,

R2-Selektion“,

”adjustierte R2-Selektion“ oder

” Mal-lows’Cp-Selection“ zur Auswahl. ¨Ubersichtsarbeiten zur Modellselektion finden sich bei Hocking [26] sowie Judge [29].

Die dargestellten Methoden weisen hinsichtlich des Resultats Unterschiede auf. So tendiert die Vorw¨arts-Methode eher zur ¨Uberspezifizierung, w¨ahrend die R¨uckw¨arts-methode eher unterspezifiziert.

Ein Hauptkritikpunkt an der Auswahl nach Signifikanz ist die Fallzahlabh¨angig-keit. In der Praxis sind bei hohen Fallzahlen in der Regel viele der betrachteten

Kovariaten im Modell hinsichtlich einesα-Niveaus (h¨aufigα= 0,05) signifikant, ob-wohl ihr Einfluss kaum ausgepr¨agt ist. Andererseits k¨onnen, bedingt durch zu kleine Datenumf¨ange oder hohe Streuungen, wichtige Effekte unentdeckt bleiben.

3.2.3 Auswahl nach Einflussgrad

Um die Fallzahlabh¨angigkeit bei der Auswahl zu umgehen, kann alternativ zur Si-gnifikanz als Kriterium der gesch¨atzte Koeffizient (Steigungsparameter bzw. Odds Ratio) des Einflussfaktors benutzt werden. Hierzu sollten m¨oglichst a-priori Krite-rien aufgestellt werden, die zum Einschluss in die Hauptanalyse berechtigen.

Gerade Letzteres wird in der Praxis h¨aufig schwer realisierbar sein, da der Umgang mit und die Interpretation von Koeffizienten-Sch¨atzern ein gewisses Maß an stati-stischer Vorstellungskraft einerseits und medizinisch-fachliches Wissen andererseits erfordern.

3.2.4 Auswahl nach medizinisch-fachlichen Gesichtspunkten, externe Informationsquellen

Die bisher in diesem Abschnitt vorgestellten Optionen zur Parameterauswahl ber¨uck-sichtigen ausschließlich statistische Kriterien und sind im Rahmen einer Analyse im klinischen Bereich f¨ur sich alleine genommen nicht hinreichend. Die zu bevorzugende Methode zur Auswahl der Adjustierungsparameter stellt vielmehr die Selektion nach fachlichen Gesichtspunkten, d.h. nach bekannten medizinischen und epidemiologi-schen Erkenntnissen, dar. Ohne interdisziplinre Zusammenarbeit besteht die Gefahr, dass in der Analyse wichtige substanzwissenschaftliche Aspekte unber¨ucksichtigt bleiben.

Da bei den meisten Indikationen in Registerdaten relevante Kovariate bei den medizinischen Experten bereits bekannt sind, kann zur Variablenauswahl Beratung durch diese Personengruppe – beispielsweise durch Vertreter der teilnehmenden Ein-richtungen oder auch durch von der Untersuchung unabh¨angige Experten – in An-spruch genommen werden. Ist es nicht m¨oglich, eine solche Informationsquelle zu

erschließen, k¨onnen die gew¨unschten Informationen alternativ auch ¨uber Litera-turrecherchen erfolgen, falls zu der im Register betrachteten Indikation gen¨ugend Literatur vorliegt.

Ein weiterer Vorteil der Informationsgewinnung durch externe Quellen liegt darin, dass so die Vorauswahl und die Analyse voneinander getrennt werden k¨onnen und nicht zuf¨allige oder singul¨are Zusammenh¨ange eine zu hohe Bedeutung erhalten.