• Keine Ergebnisse gefunden

2.1 Datenquelle: Die LUCY-Studie

2.1.3 Klassifizierung der Probanden in der vorliegenden Arbeit

Für den deskriptiven Teil der vorliegenden Arbeit, die Validierung des LLP-Scores und zur Erstellung des FLK50-Modells wurden die Daten der von 2000 bis Juni 2006 rekrutierten 657 IP und 3884 Angehörigen herangezogen (vgl. Kap. 1.3, S. 21). Die anschließende unabhängige Evaluierung der Scores erfolgte mit den Daten der 168 IP sowie ihrer 463 Halb-, Geschwister und Partner, die seitdem bis 2009 in die LUCY-Studie aufgenommen wurden. Diese zweite Stichprobe wird im Folgenden Validierungsstichprobe (ValS) genannt, um sie deutlich von der ersten, der Modellierungsstichprobe (ModS), zu unterscheiden.

Vorher wurden aus der ModS drei doppelt vorhandene Personen, ein Partner ohne IP, 30 Nichtkaukasier und 450 Minderjährige (≤ 17 Jahre alt) entfernt. Aus der ValS wurden 9 Nichtkaukasier und 12 minderjährige Halb-/Geschwister ausgeschlossen. So, wie ehemalige Arbeiter im Uranbergbau per se nicht in die Studie aufgenommen wurden, mussten aus beiden Datensätzen auch ein an Silikose und drei an Asbestose erkrankte IP (inkl. ihrer Verwandten) entfernt werden, da bei ihnen allein die starke Exposition mit dem Kanzerogen das Bronchialkarzinom hätte bedingen können (vgl.

Kap. 1.1.1.2, S. 5-6). Noch fehlende ICD-10-Codierungen der Malignome aller betroffenen Teilnehmer wurden den offenen Beschreibungen entsprechend aufgefüllt.

Die anschließenden Analysen wurden mit Hilfe des Programms SAS 9.1 durchgeführt.

Die (im Folgenden näher beschriebene) Berechnung der AUC der ROC-Kurven geschah mittels SPSS 17.0. Die Abbildungen wurden mit MS Excel 2003 erstellt.

Zunächst wurde nur mit der Modellierungsstichprobe gearbeitet. Für den deskriptiven Teil der Arbeit wurden die Teilnehmer in ihren Verwandtschaftsverhältnissen entsprechende Subgruppen eingeteilt: IP, Geschwister (G), Halbgeschwister (HG),

Partner (Pa), Eltern und Kinder. Die gebildeten Altersgruppen umfassten je nach Analyse 5 oder 10 Jahre (18-20, 21-25, ..., 96-100 J.). Die Kategorisierung der Geburtsländer bzw. Geburtsregionen der Teilnehmer ist in Tabelle 2 aufgelistet.

Tabelle 2: Kategorien der Geburtsländer der Indexprobanden und Eltern der Modellierungsstichprobe Deutschland (inklusive der ehemaligen Ostgebiete) USA

West- europa Belgien

Mittel- europa ehemalige ČSSR

Osteuropa (inkl.ehema- ligeUdSSR) Kasachstan

Der erste untersuchte Risikofaktor war der Tabakkonsum. Dazu wurden die Teilnehmer in Nie- (≤ 6 Monate geraucht, dabei ≤ 400 Zigaretten konsumiert) und (Jemals-) Raucher geteilt. Diese wurden untergliedert in Wenigraucher (≤ 20 Pys) und Vielraucher (> 20 Pys) sowie Aktiv- und Exraucher. Als Exraucher wurden Probanden klassifiziert, die den Abusus mindestens zwei Jahre vor Studienteilnahme eingestellt hatten. Sie wurden nach der Dauer ihrer Abstinenz unterteilt (2-10, 11-20, ≥ 21 J.). Bei den Jemalsrauchern wurden die gesamte Dauer des Abusus (≤ 20, 21-40, ≥ 41 J.) und ihre durchschnittlich konsumierten Zigaretten pro Tag kategorisiert (1-10, 11-20, 21-40,

≥ 41 Zig/d). Um die Einflussfaktoren Schulbildung, Berufsausbildung und Familienleben zu untersuchen, wurden die Teilnehmer auch danach klassifiziert.

Teilnehmer ohne, mit Sonder- oder Haupt-/Volksschulabschluss wurden als Gruppe zusammengefasst, erfolgreiche Mittel-/Realschüler bildeten eine zweite und Fach-/

Abiturienten eine dritte Kategorie. Entsprechend ihrer höchsten beruflichen Qualifikation wurden die Teilnehmer in solche ohne, mit abgeschlossener Lehre, Fach-bzw. Verwaltungsschulabsolventen sowie Akademiker eingeteilt. Die Familienstand-Kategorie „Alleinlebende“ umfasste Ledige, Witwen/r, Geschiedene sowie getrennt Lebende und wurde den mit ihren Partnern zusammenlebenden Probanden gegenübergestellt.

Im Rahmen einer eingebetteten Fall-Kontroll-Studie bildeten die IP die Fälle und ihre nicht an Lungenkrebs erkrankten Halb-, Geschwister und Partner die Kontrollen (K). Da sie derselben Generation angehören und miteinander verwandt sind, wurde angenommen, dass sie unter vergleichbaren sozialen, kulturellen und finanziellen

Bedingungen lebten. Dabei ist anzumerken, dass zwar die IP, nicht jedoch die Kontrollen mit dem Alterslimit ≤ 50 Jahre rekrutiert wurden. Eine durch die Verwandtschaft der IP und Kontrollen bedingte Korrelation wurde untersucht, indem alle Risikomodulationen zusätzlich auch mittels konditionierter logistischer Regression ermittelt wurden. Dabei wurden den IP zum einen die gesamte Kontrollgruppe, zum anderen allein ihre genetisch vergleichbar ausgestatteten Geschwister als Kontrollen gegenübergestellt. Bei der Stratifizierung nach Familien blieben allerdings die Familien, in denen keine (jeweils antwortenden) Kontrollpersonen vorkamen, als fehlende Werte unberücksichtigt. Dadurch wurden die Stichproben meist so verkleinert, dass sehr breite Konfidenzintervalle berechnet wurden, wodurch auch die Aussagekraft der zugehörigen Odds Ratios (ORs) eingeschränkt war. Für einige Expositionen konnte gar kein ORkond

ermittelt werden. In den wenigen Fällen, in denen sich die in der konditionierten logistischen Regression berechneten Risikomodulationen deutlich von denen der nicht konditionierten unterschieden, wurde darauf – ebenso wie auf weitere mögliche Verzerrungen – im Text hingewiesen. Einen Sonderfall der Einteilung in Fälle und Kontrollen stellte die Analyse der histologischen Typen der Bronchialkarzinome der IP dar: Hier interessierte zusätzlich, ob pneumonologische Vorerkrankungen zur Ausprägung von Adenokarzinomen prädisponieren. Darum waren hierfür die Indexprobanden mit Adenokarzinomen die Fälle und die Kontrollgruppe wurde aus den IP mit anderen histologischen Typen gebildet.

Der zweite untersuchte Risikofaktor waren die Vorerkrankungen. Den früheren Tumorerkrankungen wurde ein eigenes Kapitel gewidmet. Zunächst wurden die Kategorien benigne/semimaligne Tumore und Krebserkrankungen gebildet. Letztere wurden nach Mehrfachmalignomen, tabakassoziierten Tumoren, Brustkrebs und (nichtmelanozytärem) Hautkrebs getrennt analysiert. Es wurde auch nach Hinweisen für eine familiäre Prädisposition gesucht. Dazu wurden den Probanden ohne lungenkrebskranke Verwandte ersten Grades die Teilnehmer mit positiver Familienanamnese gegenübergestellt. Dabei wurde unterschieden, ob die Angehörigen zum Zeitpunkt der Diagnose unter oder ab 60 Jahre alt waren. Anschließend wurden die anderen, nichtneoplastischen Vorerkrankungen untersucht. Zusätzlich zu den elf geschlossen abgefragten konnten bis zu drei weitere Krankheiten offen angegeben werden, deren Kategorisierung Tabelle 3 entnehmbar ist. Aus vier pneumonologischen Krankheiten wurden zusätzlich Kombinationsgruppen gebildet (Tabelle 4). Unter den Studienteilnehmern fanden sich insgesamt fünf Fälle mit Erbkrankheiten, doch wurden

für keine von diesen Assoziationen mit Lungenkrebs beschrieben. Vom medizinischen Standpunkt aus gesehen, waren diese Erkrankungen zu heterogen, um als Gruppe untersucht zu werden, sie einzeln zu analysieren war wiederum mathematisch nicht sinnvoll.

Tabelle 3: Kategorisierung der nichtneoplastischen Vorerkrankungen

Sammelkategorie geschlossen abgefragte

rheumatoide Arthritis, Fehlsteuerungen des Immunsystems, Infektionskrankheiten

Multiple Sklerose, weitere nervenheilkundliche Krankheiten, Erkrankungen der Sinnesorgane

Erkrankungen der Fortpflanzungsorgane degenerativ-traumatische Erkrankungen

Tabelle 4: Kombinationsgruppen aus geschlossen abgefragten Vorerkrankungen

Vorerkrankung(en) Kombinationsgruppe

chronische Bronchitis und/oder Lungenemphysem BE

BE und/oder Asthma bronchiale BEA

BE und/oder Pneumonie BEP

BEA und/oder Pneumonie BEAP

BEAP ohne Lungenemphysem BAP

Einbezogen wurden jeweils Probanden, die auf geschlossene Fragen mit „ja“ oder

„nein“ antworteten, die anderen zählten als „fehlende Werte“. Bei offenen Fragen konnten nur Teilnehmer, die mindestens eine Krankheit offen angaben, berücksichtigt werden. Entsprechend wurden in die Analyse der in Tabelle 3 gelisteten Sammelkategorien Probanden eingeschlossen, die mindestens eine geschlossen abgefragte Krankheit mit „ja“ oder „nein“ beantworteten und/oder mindestens eine Krankheit offen angaben. Handelte es sich um Erkrankungen, die mehrere Organsysteme beeinträchtigten, wurden sie in all diesen Kategorien berücksichtigt.

Mehrfachfälle derselben Kategorie eines Probanden wurden nur einfach gezählt, ergänzend wurden in den jeweiligen Kapiteln Anzahl der Betroffenen und der

Krankheitsfälle getrennt ausgewiesen. Es interessierte der Stand der Dinge bis zwei Jahre vor Studienteilnahme. Auch die Probanden der Validierungsstichprobe wurden hinsichtlich der in die weiterentwickelten Scores eingegangenen Risikofaktoren kategorisiert und analog denen der Modellierungsstichprobe in Fälle und Kontrollen unterteilt.