• Keine Ergebnisse gefunden

3 METHODEN

3.12 Statistische Auswertung

Zur statistischen Analyse der erhobenen Daten (Genotypen, funktionelle und klinische Phänotypen) wurde die Software SPSS (Version 12.0) verwendet. Für die graphische Darstellung der Ergebnisse wurden die Programme SPSS, Excel, Sigma Plot (Version 9.0) und Corel Draw (Version 13.0) verwendet.

3.12.1 Deskriptive Statistik

Die deskriptive Statistik dient zur Beschreibung der Verteilung und Variabilität einer Messgröße. Typische Kenngrößen der deskriptiven Statistik sind Mittelwert, Median, Varianz, Standardabweichung und Standardfehler.

Kann eine Verteilung durch einen mathematischen Parameter (z. B. bei Vorliegen einer Normalverteilung) beschrieben werden, handelt es sich um eine parametrische Verteilung.

Ist diese Voraussetzung nicht gegeben, ist die Verteilung nicht-parametrisch. Die Prüfung der Normalverteilung erfolgte unter Verwendung des Shapiro-Wilk-Tests. Eine Normal-verteilung wurde angenommen, wenn dieser Test ein Signifikanzniveau von P > 0,05 zeigte.

Mit einer Normalverteilung vereinbare Daten wurden in Form von Säulendiagrammen dargestellt. Die entsprechende Illustration nicht-parametrischer Größen erfolgte mittels Boxplots.

3.12.2 Analytische Statistik

Die analytische Statistik prüft, ob Zusammenhänge zwischen Messparametern und Einflussfaktoren statistisch signifikant sind. Der p-Wert, auch als Irrtumswahr-scheinlichkeit bezeichnet, gibt dabei an, mit welcher WahrIrrtumswahr-scheinlichkeit ein beobachteter Unterschied zwischen zwei oder mehreren Gruppen zufällig ist. Oder anders ausgedrückt:

Mit welcher Wahrscheinlichkeit kann die Nullhypothese, dass kein relevanter Unterschied besteht, verworfen werden? In analoger Weise kann auch für die Korrelation von stetigen Messgrößen ein Signifikanzniveau bestimmt werden. Nachfolgend sind die eingesetzten Testverfahren beschrieben.

Unabhängige diskrete Einflussfaktoren und abhängige stetige Messgröße bei unabhängiger Stichprobe

Stetige Messgrößen waren z. B. die Aktivität der NAD(P)H-Oxidase oder Genexpressions-messungen. Faktoren, deren Einfluss darauf geprüft wurde, waren die analysierten SNPs mit ihren jeweiligen Genotypausprägungen.

Nicht-parametrische Testverfahren setzen nur ordinal skalierte Messdaten voraus, eine parametrische Verteilung wie die Normalverteilung ist dafür nicht erforderlich. Beim Vergleich von Genotypgruppen wurde der Mann-Whitney-U-Test angewandt, bei mehre-ren Gruppen der Jonkheere-Terpstra-Tmehre-rendtest, welcher einen Tmehre-rend zwischen Gruppen berücksichtigt (der Effekt eines heterozygoten Trägerstatus sollte zwischen den beiden homozygoten liegen). Diese Art von Tests war hier grundsätzlich anwendbar, die statistische Power ist jedoch geringer als bei parametrischen Tests.

Entsprach die Verteilung aller zu vergleichenden Gruppen einer Normalverteilung (gemäß Shapiro-Wilk-Test, Q-Q-Plots und Häufigkeitsdiagrammen), konnten parametrische Verfahren eingesetzt werden. Zur Anwendung kamen die lineare Regressionsanalyse und die einfaktorielle ANOVA mit einer Zielvariablen und einer unabhängigen Variablen. Es wurde getestet, ob die Varianz zwischen den Gruppen größer ist als innerhalb einer Gruppe. Ergab die ANOVA ein statistisch signifikantes Ergebnis, wurde mittels des

post-hoc-Tests nach Bonferroni untersucht, welche Ausprägungen der unabhängigen Variablen sich signifikant unterschieden.

Stetige Messgrößen bei abhängigen Stichproben

Diese Art der statistischen Testung wurde z. B. bei unterschiedlichen Behandlungen der Zellen eines Probanden oder bei der Analyse der Transkriptstabilität im Zeitverlauf vorgenommen. Bei nicht-parametrischer Verteilung wurde dazu der Wilcoxon-Test für verbundene Stichproben benutzt, bei parametrischer der Student-t-Test.

Korrelationsanalyse

Eine mögliche Korrelation von zwei Funktionsparametern wurde bei Normalverteilungen mit dem Pearson-Korrelationskoeffizienten r untersucht. Lag keine Normalverteilung vor, wurde der Zusammenhang über den Spearman-Rank-Korrelations-koeffizienten ρ ausgedrückt.

Verteilung diskreter Parameter

Das Hardy-Weinberg-Equilibrium (HWE) ist ein Kriterium für die Richtigkeit einer Genotypisierung. Die beobachteten Genotypverteilungen wurden mit den aus den Allelfrequenzen zu erwartenden verglichen. Die Überprüfung des HWE erfolgte mittels χ²-Tests (in EXCEL).

Odds Ratios (OR) werden typischerweise bei Fall-Kontroll- und Kohorten-Studien bestimmt. In einer Vierfeldertafel wird der Zusammenhang zwischen zwei dichotomen Variablen dargestellt, z. B. krank/gesund in Abhängigkeit einer genetischen Konstellation.

Dabei drücken Odds für einen bestimmten Genotyp das Verhältnis zwischen krank und gesund aus. Mit dem OR wird das Verhältnis zweier Odds (hier für die beiden Ausprägungen des dichotomen Genotyps) zueinander beschrieben. Ein Wert grösser als 1 beschreibt ein Risiko für ein Ereignis, ein Wert kleiner als 1 beschreibt einen Schutz vor einem Ereignis. Im Allgemeinen wird eine statistische Signifikanz nur dann angenommen, wenn der 95 %-Vertrauensbereich die 1 nicht einschließt.

Verwandt mit dem Odds Ratio ist das relative Risiko (RR), das ebenfalls auf dem Vergleich von zwei dichotomen Variablen beruht. Zunächst wird für eine Genotyp-ausprägung die Wahrscheinlichkeit für ein Ereignis (z. B. für eine Nebenwirkung)

dargestellt und dann für den anderen Genotyp. Das RR errechnet sich als Quotient dieser beiden Wahrscheinlichkeiten. Bei seltenen Ereignissen ist das RR dem OR vorzuziehen.

Überlebenszeitanalysen

Zur statistischen Analyse der Überlebenszeitkurven in Abhängigkeit einer diskreten Variablen (hier Genotypen) wurde der log-rank-Test angewendet. Dieser Test berücksichtigt eine ordinale Anordnung der unabhängigen Variablen, d. h. bei der Analyse von Genotypen wird der Effekt des heterozygoten Status als zwischen den beiden homozygoten liegend angenommen.

Problem des Multiplen Testens

Bei der üblicherweise verwendeten formalen Irrtumswahrscheinlichkeit von p < 0,05 steigt mit der Zahl der Tests die Wahrscheinlichkeit für falsch positive Befunde an. Die strengste Korrektur ist die nach Bonferroni, bei welcher der zu unterschreitende p-Wert durch die Zahl der Tests dividiert wird. Da die Effektstärke eines funktionalen SNPs in der Regel sehr moderat ist, wäre bei einer die gesamte genetische Variabilität der NAD(P)H-Oxidase chrakterisierenden Genotypisierung von ca. 50 SNPs eine sehr große Fallzahl zum Erreichen dieses Signifikanzniveaus nötig. Diese strenge Betrachtung ist insbesondere bei explorativem Vorgehen angebracht. Eine in dieser Arbeit gewählte Alternative bestand in der Durchführung einer Validierungsstudie. Eine auf diese Weise generierte Hypothese für eine mögliche Funktionalität eines SNPs sollte in weiteren Untersuchungen überprüft werden, für welche dann wieder das Standard-Signifikanzniveau von p < 0,05 angenommen werden durfte.