• Keine Ergebnisse gefunden

Im ersten Schritt der RRR werden basierend auf der Kovarianzmatrix der Responses soge-nannte Responsescores extrahiert, die die Variationsaufklärung im Set der Responses ma-ximieren. Die Anzahl der extrahierten Responsescores entspricht dabei der Anzahl der in-tegrierten Responsevariablen, sofern diese kleiner als die Anzahl der Prädiktoren ist. Um eine gleichwertige Bedeutung der Responses für die Herleitung der Responsescores zu er-reichen, wurden die Responses während der RRR standardisiert (d.h. arithmetischer Mittel-wert = 0, Standardabweichung = 1). Jeder Responsescore kann als Linearkombination der standardisierten Responses beschrieben werden, wobei der Eigenvektor der Kovarianz-matrix den Koeffizientenvektor der Responses widerspiegelt. Der zum Eigenvektor zugehö-rige Eigenwert quantifiziert die durch den jeweiligen Responsescore erklärte Variation im Set der Responses.

In der vorliegenden Arbeit wurden die vier Biomarker HbA1c, HDL-Cholesterol, CRP und Adi-ponektin als Responses ausgewählt. Diese wurden logarithmisch transformiert in die RRR einbezogen. Um ein Confounding durch die Einnahme von Medikamenten zu verringern, wurde die Konzentration von HDL-Cholesterol zudem für die Einnahme von Lipidsenkern und die Konzentrationen von CRP und Adiponektin für die Einnahme antiinflammatorischer Medikamente adjustiert. Insgesamt wurden vier Responsescores generiert, von denen jeder durch die folgende lineare Gleichung beschrieben werden kann:

Responsescore =

α

1Y1 +

α

2Y2 +

α

3Y3 +

α

4Y4 (Gleichung 1)

(

i=1,...,4

)

=

α

i scorespezifisches Gewicht des Biomarkers, das der i-ten Komponente des Koeffizientenvektors entspricht

(

i=1,...,4

)

=

Yi probandenspezifische, standardisierte Konzentration des Biomarkers Im zweiten Schritt der RRR werden die Responsescores auf die Ebene der Prädiktoren „pro-jiziert“, was einer linearen Regression unter Verwendung des jeweiligen Responsescores als abhängige Variable und den Prädiktoren als unabhängige Variablen entspricht. Resultierend daraus werden sogenannte Faktorscores hergeleitet, die Linearkombinationen der standar-disierten Prädiktoren darstellen und die Variationsaufklärung der Responses maximieren.

In dieser Arbeit wurden insgesamt 48 Lebensmittelgruppen als Prädiktoren herangezogen.

Die darauf basierend hergeleiteten vier Faktorscores werden in dieser Arbeit als Ernäh-rungsmusterscores bezeichnet und können durch die folgende lineare Funktion charakteri-siert werden:

Ernährungsmusterscore =

β

1X1 +

β

2X2 +...+

β

48X48 (Gleichung 2)

(

i=1,...,48

)

=

β

i scorespezifisches Gewicht der Lebensmittelgruppe, das dem Regressi- onskoeffizienten der standardisierten Lebensmittelgruppe entspricht

(

i=1,...,48

)

=

Xi probandenspezifische, standardisierte Aufnahme der Lebensmittelgruppe

Die mittels RRR extrahierten vier Responsescores und vier Ernährungsmusterscores stellen vier Scorepaare dar, wobei jedes Paar dieselbe latente Variable in verschiedenen Sets von Ausgangsvariablen (Biomarker bzw. Lebensmittelgruppen) reflektiert.

Simplifizierung des Ernährungsmusters

Im Verlauf dieser Arbeit wurde der erste der vier hergeleiteten Ernährungsmusterscores intensiver untersucht. Wie die Gleichung 2 verdeutlicht, stellt dieser Ernährungsmusterscore eine durch 48 Lebensmittelgruppen und deren Gewichte definierte Variable dar, die folglich sehr komplex und nur schwer interpretierbar ist. Deshalb war ein Ziel dieser Arbeit, einen vereinfachten Ernährungsmusterscore herzuleiten.

Zuerst wurde dazu die Anzahl der im Ernährungsmusterscore berücksichtigten Lebensmit-telgruppen reduziert. Ähnlich zum beschriebenen zweiten Schritt in der RRR-Analyse wurde ein lineares Regressionsmodell mit dem ersten Responsescore als abhängige Variable und den 48 Lebensmittelgruppen als unabhängige Variablen aufgestellt. Durch die Wahl einer schrittweisen Prozedur der Variablenauswahl wurde jedoch erreicht, dass lediglich die mit einem Signifikanzniveau von < 5% zur Variationsaufklärung des Responsescores beitragen-den Lebensmittelgruppen in das Modell integriert wurbeitragen-den. Insgesamt konnten anhand die-ser objektiven Herangehensweise die acht bedeutendsten der 48 Lebensmittelgruppen se-lektiert werden.

Lediglich die ausgewählten, standardisierten Lebensmittelgruppen wurden anschließend zur Bildung eines simplifizierten Ernährungsmusterscore herangezogen. Zur weiteren Vereinfa-chung wurden dabei nur die Vorzeichen, jedoch nicht die als Gewichte fungierenden Re-gressionskoeffizienten der Lebensmittelgruppen berücksichtigt. Die Gleichung 3 veranschau-licht, dass der so gebildete simplifizierte Ernährungsmusterscore eine Linearkombination von nur acht ungewichteten standardisierten Lebensmittelgruppen darstellt:

Simplifizierter Ernährungsmusterscore = X1 +X2 +...+ X8 (Gleichung 3)

(

i=1,...,8

)

=

Xi probandenspezifische, standardisierte Aufnahme der Lebensmittelgruppe Um zu überprüfen, inwieweit der vereinfachte Ernährungsmusterscore bezüglich seines In-formationsgehaltes dem originalen Ernährungsmusterscore entspricht, wurde der Pearson-sche Korrelationskoeffizient berechnet (s. Kapitel 3.2.5).

Berechnung von Odds Ratios und Hazardraten-Verhältnissen

Um den Einfluss der hergeleiteten und des simplifizierten Musterscores auf das Auftreten eines inzidenten Typ-2-Diabetes in der Fall-Kontroll-Studienpopulation zu untersuchen, wurden entsprechend dem gematchten Design mittels bedingter logistischer Regressions-analyse Odds Ratios und die dazugehörigen 95% Konfidenzintervalle berechnet. Die Odds Ratios und 95% Konfidenzintervalle wurden einerseits pro Einheit des standardisierten ste-tigen Scores und andererseits für die einzelnen Quintile des standardisierten Scores unter

Verwendung des ersten Quintils als Referenzkategorie ermittelt. Insgesamt wurden drei verschiedene Modelle, die jeweils den Status des Typ-2-Diabetes als abhängige Variable enthielten, aufgestellt. Im initialen, alters- und geschlechtsgematchten Modell war lediglich der stetige standardisierte Score bzw. der in Quintile kategorisierte standardisierte Score als unabhängige Variable integriert. Das zweite Modell enthielt zusätzlich die anthropometri-schen Kovariablen Taillenumfang (stetig) und BMI (kg/m2). Im dritten Modell wurde zusätz-lich zum zweiten Modell für die weiteren Kovariablen Bildung (kein Abschluss/Teilfacharbei-ter, FacharbeiAbschluss/Teilfacharbei-ter, Fachschulabschluss, (Fach-) Hochschulabschluss), regelmäßige sportliche Aktivität (ja, nein), körperliche Berufsbelastung (leicht, mittel, (sehr) schwer), Rauchstatus (Nieraucher, Exraucher, Raucher < 20 Einheiten pro Tag, Raucher ≥ 20 Einheiten pro Tag) und Energieaufnahme (Megajoule pro Tag) adjustiert. Zudem wurde durch Modellierung der Mittelwerte der Scorequintile als unabhängige Variable in den drei Regressionsmodellen anhand des Likelihood Ratio-Tests der Trend der Odds Ratios über die Scorequintile unter-sucht.

In der Kohorten-Studienpopulation wurde der Einfluss des simplifizierten Ernährungsmus-terscores auf das Auftreten eines inzidenten Typ-2-Diabetes durch Hazardraten-Verhältnisse und den dazugehörigen 95% Konfidenzintervallen, die mittels geschlechtsstratifizierter Cox-scher Regressionsanalyse berechnet wurden, charakterisiert. Dazu wurden die Hazardraten-Verhältnisse analog zu den Odds Ratios der Fall-Kontroll-Studienpopulation sowohl pro Ein-heit des standardisierten stetigen Scores als auch pro Quintil des standardisierten Scores berechnet. Insgesamt wurden wiederum drei Modelle betrachtet. Diese enthielten jeweils den Typ-2-Diabetesstatus als Zensierungsvariable und das Lebensalter der Probanden wäh-rend der Nachbeobachtungszeit als abhängige Zeitvariable („Counting Process Style of In-put“ [311]). Die Nachbeobachtungszeit umfasste den Zeitraum von der Basisuntersuchung bis zum Diagnosedatum eines inzidenten Typ-2-Diabetes oder einer anderen inzidenten Di-abeteserkrankung (Typ-1-Diabetes, sekundärer Diabetes oder Diabetes ohne nähere Anga-be), bis zum Datum des Versterbens oder Ausscheidens aus der Studie bzw. bei keinem der vorhergehenden Kriterien bis zum Versanddatum des letzten Nachbeobachtungsfragebo-gens. Zudem wurde das Alter der Probanden zur Basisuntersuchung (in Jahren) als „strata“-Variable im Coxschen Regressionsmodell verwandt. Die weitere Modellbildung entsprach der in der Fall-Kontroll-Studienpopulation. So enthielt das initiale, geschlechtsstratifizierte Mo-dell mit dem Lebensalter der Probanden während der Studie als abhängige Zeitvariable le-diglich den stetigen bzw. kategorisierten Score als unabhängige Variable, wogegen in Mo-dell 2 und 3 zusätzlich die oben genannten anthropometrischen Parameter und Lebensstil-eigenschaften einbezogen wurden. In weiteren Modellen wurden zusätzlich zu den Kovari-ablen des Modells 3 ausgewählte nutritive Faktoren berücksichtigt. Mittels einer zur Duplika-tionsmethode von Lunn und McNeil ähnlichen Technik [312] wurde auf die Gleichheit der erhaltenen stetigen Hazardraten-Verhältnisse zu denen des Modells 3 getestet. Der Test für

den Trend der Hazardraten-Verhältnisse über die Scorequintile erfolgte wiederum mittels Likelihood Ratio-Test unter Verwendung der Mittelwerte der Scorequintile als unabhängige Variable in den Coxschen Regressionsanalysen.

Weiterhin wurden in der Kohorten-Studienpopulation die mit den scorebildenden Lebensmit-telgruppen, ausgewählten Nährstoffen und nicht-nutritiven Risikofaktoren verbundenen Ha-zardraten-Verhältnisse und 95% Konfidenzintervalle für Typ-2-Diabetes ermittelt. Die Mo-dellbildung erfolgte weitestgehend analog zu der für den Ernährungsmusterscore. Lediglich die Einbeziehung der Kovariablen variierte entsprechend der Zielstellung.

Berechnung von populationsattributablen Risiken

Zur Bestimmung der prozentualen Anteile inzidenter Typ-2-Diabetesfälle, die in der Kohor-ten-Studienpopulation auf einen niedrigen Ernährungsmusterscore sowie weitere dichotomi-sierte Risikofaktoren zurückzuführen sind, wurden PARs berechnet. Dazu wurde die folgen-de von Miettinen eingeführte Formel [313], welche die Einbeziehung von adjustierten relati-ven Risiken (in der vorliegenden Arbeit durch Hazardraten-Verhältnisse repräsentiert) er-laubt, herangezogen:

⎟⎠

⎜ ⎞

⎛ −

= RR

pd RR

PAR 1

(Gleichung 4)

=

pd Proportion der gegenüber dem Risikofaktor Exponierten unter den Fällen

=

RR adjustiertes relatives Risiko des Risikofaktors

Die Berechnung der entsprechenden 95% Konfidenzintervalle erfolgte anhand einer von Whittemore postulierten Varianzgleichung, die sowohl die Unsicherheit beim Schätzen der relativen Risiken als auch beim Schätzen der Proportionen Exponierter berücksichtigt [314].

Um zusätzlich PARs zu berechnen, die auf den Kombinationen des niedrigen Ernährungs-musterscores mit einem oder mehreren weiteren Risikofaktoren beruhen, wurde eine Ver-allgemeinerung der Formel von Miettinen angewandt:

⎟⎟⎠

⎜⎜ ⎞

⎛ −

=

= i

i k

i

i RR

pd RR

PAR 1

1

(Gleichung 5)

i =

pd Proportion der Exponierten unter den Fällen im i-ten Stratum

i =

RR adjustiertes relatives Risiko im i-ten Stratum

Dabei ist ein Stratum durch eine bestimmte Kombination von Risikofaktoren definiert und k die Anzahl aller Strata, die im Fall von m dichotomen Risikofaktoren gleich 2m ist. Diese auf Bruzzi et al. [315] zurückgehende Formel ermöglicht die gleichzeitige Einbeziehung ver-schiedener dichotomer Risikofaktoren unter Berücksichtigung ihrer Interaktion.

3 Ergebnisse