• Keine Ergebnisse gefunden

! liegenden Marker ihrerseits müssen nicht notwendigerweise in starkem

liegenden Marker ihrerseits müssen nicht notwendigerweise in starkem Kopplungsungleichgewicht untereinander stehen.

Nach der „Four Gamete Rule“ werden in Anlehnung an die Beschreibungen von Wang (2002) alle Marker als Block zusammengefasst, bei denen von den vier möglichen Haplotypen in den zu Grunde liegenden Gameten von jeweils zwei Markern nur drei beobachtet werden. Werden im Gegensatz dazu vier mit einer Frequenz von mehr als 0,01 beobachtet, unterstellt man Rekombination in dem Bereich und fasst diese Marker nicht in einem Block zusammen.

Die folgende Abb. 4.27 stellt die Ergebnisse der Haplotypen nach den beiden verschiedenen Methoden gegenüber.

&Rekonstruierte Haplotypen von für das gesamte Patientinnenkollektiv. Links: nach

„Four Gamete Rule“. Rechts: nach „Solid spine of LD“. Dicke Linie: mehr als 40 % Zuordnung.

Dünne Linie: mehr als 3,5 % Zuordnung. Die kleinen Dreiecke weisen mit der Spitze auf die tagSNPs (vgl. Kap. 3.11.7).

Ein Vergleich der beiden Abbildungen ergab jeweils übereinstimmende Haplotypen. Nach der

„Solid Spine of LD Methode“ sind es durch die zusätzliche Berücksichtigung der Variante p.P435L (05) zwei Haplotypen mehr, die bei der „Four Gamete Rule Methode“ jeweils in einem anderen Haplotypen aufgegangen sind. Das kommt dadurch zustande, dass es nach der

„Four Gamete Rule Methode“ zwei Haplotypblöcke gibt. Einen vor und einen nach Exon 8.

Somit scheidet dann die Variante p.P435L als SNP aus der Haplotypbetrachtung aus.

Für die Generierung der Abbildungen wurden nur die Haplotypen eingeschlossen, die mehr als einmal vorkamen. Insgesamt sind somit in der linken Abbildung ca. 98 % und in der rechten Abbildung ca. 95 % der Haplotypen berücksichtigt worden. Die Frequenzen der vergleichbaren Haplotypen (ohne Berücksichtigung von p.P435L) stimmen bei beiden Methoden statistisch überein. Die höchste Frequenz stellt der Haplotyp mit der Dreierkombination von SNPs in Exon 3, Exon 9 und Intron 12 (02, 06, 12) vor dem fast gleich häufigen Wildtyp. Beide zusammen ergeben ca. 90 % aller Haplotypen. Der Haplotyp

!&Exon 2 p.R34C

! mit der nächst höheren Frequenz von ca. 5 % ist derjenige, in dem zwei Dreierkombinationen von SNPs vorkommen. Neben der schon beschriebenen (02, 06, 12) finden sich die SNPs in Intron 5, Intron 9 und Exon 10 (04, 07, 08). Mit ca. 4 % ist die letzte Haplotypvariante vertreten. Hier findet sich neben der Dreierkombination von SNPs in Exon 3, Exon 9 und Intron 12 (02, 06, 12) die Variante in Intron 11 (10).

Zusammenfassend bestätigen die berechneten Haplotypen die Vermutungen aufgrund der Allelfrequenzen und der Genotypen. Die Frage nach Rekombination in dem untersuchten Gen kann nicht abschließend beantwortet werden. Das multiallelische D` von 0,99 zwischen den Blöcken lässt eher Neumutation als Rekombination (vgl. Kap. 4.7.3) vermuten. Fasst man die Variante in Exon 8 jedoch ebenfalls als Block auf, errechnet sich ein D`von 0,74 zwischen Exon 8 und Block 2. Die Rekombinationsraten, die von HapMap für den Chromosomabschnitt von zur Verfügung gestellt werden (HapMap Data Rel27 Phase II+III, Feb09, on NCBI B36 assembly, dbSNP b126), sind klein. Die höchste ist ca. 4 cM/Mb.

Die Rekombinationsrate zwischen Exon 8 und Exon 9 ist kleiner als 0,2 cM/Mb, so dass im vorliegenden Fall bei einer Entfernung der beiden Varianten von ca. 4400 Basen mit einer 0,9% igen Wahrscheinlichkeit Rekombination stattgefunden haben könnte.

Zusätzlich wurde eine Kopplungsanalyse wie in Kap. 3.11.6 beschrieben, durchgeführt. Es wurde eine Darstellung (vgl. Abb. 4.28) gewählt, die durch weißen Hintergrund D` < 1 und LOD < 2 anzeigt. Ist D` = 1 und LOD ≥ 2, wird dies durch einen roten Hintergrund angegeben. Ist D` = 1 und LOD < 2, ist der Hintergrund blau. Der LOD Score (LOD =

„logarithmic odds ratio“) ist definiert als der Logarithmus zur Basis 10 des Verhältnisses von L(θ) zu L(0,5). L(θ) ist die Likelihoodfunktion, die zu maximieren ist, um die Rekombinationsrate zwischen zwei Markern zu bestimmen. Durch den Bezug zu L(0,5), was der Wert für uneingeschränkte Rekombination ist, wird die Berechnung eines Scores möglich.

Dieser gibt an, ob eingeschränkte Rekombination vorliegt oder nicht. Bei hohem LOD liegt keine Rekombination, also Kopplung vor. Da ein hohes D` nicht notwendigerweise durch Kopplung entstehen muss, ergänzt der LOD Score die Interpretation von D`.

Die Zahlen in den Rhomben sind die Werte für den Korrelationskoeffizienten r² zwischen den entsprechenden beiden Markern. Ein Eintrag fehlt, wenn r² = 1 ist. Dies ist in sechs Rhomben der Fall.

!<

&

LD Plot für die Einzelnukleotid Polymorphismen von im gesamten Patientinnenkollektiv.

Weiß: D` < 1 und LOD < 2. Rot:

D` = 1 und LOD 2. Blau: D` = 1 und LOD < 2. Zahlen in den Rhomben: r² in „%“. Keine Zahlen: r² = 1 und D` = 1.

Zwischen den Varianten in Exon 3 und 9 und zwischen denen in Exon 3 und Intron 12 herrscht hohes Kopplungsungleichgewicht. Zwischen den Varianten in Exon 9 und Intron 12 kann von vollständigem Kopplungsungleichgewicht ausgegangen werden. r² = 95 % zwischen Exon 3 und Exon 9 bzw. Intron 12 kann durch Rekombination erklärt werden, die für die weiteren Betrachtungen vernachlässigt werden kann (s. o.)

Zwischen den Varianten in Intron 5, Intron 9 und Exon 10 besteht untereinander eine perfekte Korrelation und vollständiges Kopplungsungleichgewicht im untersuchten Gesamtkollektiv.

Weiterhin vollständiges Kopplungsungleichgewicht und hohe Kopplung lässt sich zwischen Exon 3 und 8 und zwischen Exon 8 und Exon 9 und Intron 12 feststellen. Dass hier sowie im Falle der beiden Dreierkombinationen von SNPs ein hohes Maß an Kopplung vorliegt (hoher LOD Score), wurde mit einer alternativen Färbung der Rhomben in HaploView festgestellt.

Wegen der besseren Übersichtlichkeit wurde dies hier nicht zur Darstellung gebracht, sondern durch die einheitliche Rotfärbung gekennzeichnet. Die entsprechende Korrelation zwischen den genannten Varianten ist mit 20 bzw. 21 % gering. Dies wird sich auf die Wahl der tagSNPs (s. u.) auswirken.

Für Intron 11 kann keine Kopplung belegt werden. Auch wenn D` = 1 ist, sind in diesem Fall die geringe Allelfrequenz und der geringe Probenumfang zu berücksichtigen. Das gilt ebenso insbesondere für die Varianten, die nur einmal gefunden werden konnten.

Zusammenfassend finden sich erneut die Vermutungen bestätigt, die die Betrachtung der Allelfrequenzen (vgl. Kap. 4.6.1) und der Haplotypen (s. o.) ergab.

!0 Durch das Tagging der SNPs ergaben sich die in Abb. 4.27 durch kleine auf der Spitze stehende Dreiecke gekennzeichneten tagSNPs. Geht man von einem Block aus, sind als tagSNPs diejenigen in Exon 3, Intron 5, Exon 8 und Intron 11 zu wählen. Setzt man zwei Blöcke voraus, können diese durch die Kenntnisse über die Kopplungsungleichgewichte mit denselben SNPs rekonstruiert werden, wobei ein geringer Fehler durch die Rekombinationsmöglichkeit in dem Bereich erwogen werden muss. Nach der Bestimmung der Blöcke können diese dann für Assoziationsstudien genutzt werden.

$651"//$$)7)($#$"5+"$6"/*"

In den vorangegangenen Kapiteln zur Analyse von Polymorphismen wurden mit Methoden der Bioinformatik analog zu Auswirkungen auf den Spleißvorgang untersucht. Hierfür wurden die eine Variante in Intron 1 (IVS1 7 C>T) und die in Intron 8 (IVS8 6 C>T) mittels MaxEntScore auf die Beeinflussung von Spleißstellen hin getestet. In Exon 9 (p.K279K) wurde mittels ESEfinder auf die Veränderung von Erkennungssequenzen für Enhancer hin geprüft.

Da in den sequenzierten Proben keine „missense“ Mutationen gefunden wurden, fallen sie als mögliche Ursache für die Beeinträchtigung der Funktion des codierten Proteins aus.

In den folgenden Kapiteln soll mit denselben Methoden wie (vgl. Kap. 4.7) auf Kopplungsungleichgewicht bzw. Korrelation von SNPs hin untersucht werden. Ziele sind, tagSNPs für Assoziationsstudien vorzuschlagen, Haplotypen zu rekonstruieren, und aus den Haplotypen und den damit verbundenen Kopplungsungleichgewichten Hypothesen über die Assoziation mit der Erkrankung am familiären Mammakarzinom herleiten zu können.

"6/55)#"$$#*

Die folgende Tabelle zeigt die mittels Gensequenzierung gefundenen Genotypen und ihre Häufigkeiten im deutschen Patientinnenkollektiv.

!

- &Genotypen von und Häufigkeiten für das deutsche Patientinnenkollektiv.

Schwarz = Wildtyp; andere Farben = Unterscheidung der SNPs. Fett und farbig = SNPs. Grauer Hintergrund = Übereinstimmung im weißrussischen Kollektiv. * = „oder 4“ bezieht sich auf eine Probe, für die nicht mehr der Genotyp von Exon 9 bestimmt werden konnte. Die anderen SNPs stimmen aber überein.Index „R“ = kann durch Rekombination oder Neumutation entstanden sein.

Intron 1.1 = IVS1–31 G>A. Intron 1.2 = IVS1–7 C>T.

Die fett gedruckten Basen in Schwarz bezeichnen die Wildtypvariante von gemäß NC_000019 der NCBI Datenbank (vgl. Kap. 3.3.6). Die homozygote Wildtypvariante tritt mengenmäßig hinter den heterozygoten Genotypen mit dem SNP in Intron 3 zurück; dieser SNP ist bei fast allen Genotypen zu finden. Seine Allelfrequenz ist genauso hoch wie die des Wildtyps (vgl. Tab. 4.14).

Die Polymorphismen in Intron 1.1 (bezeichnet die Variante IVS1 31 G>A) und Intron 3 kommen jeder für sich und auch gemeinsam vor. Die bedeutendste Auffälligkeit ist, dass die Varianten in Intron 1.2 (bezeichnet die andere Variante in Intron 1 IVS1 7 C>T), Intron 6, Intron 8 und Exon 9 immer gemeinsam vorkommen und immer gemeinsam mit der Variante in Intron 3. Eine Ausnahme bildet der vorletzte Genotyp. Hier ist die Variante in Intron 1 (IVS1–7 C>T) homozygot, während die anderen heterozygot vorliegen. Somit stellt sich hier die Frage nach einer Rekombination zwischen Intron 1 bei IVS1–7 C>T und Intron 3, der ein

„Crossing over“ mit dem Wildtyp zu Grunde liegen würde. Eine Neumutation wäre allerdings auch möglich.

Die Betrachtung der Genotypen ergänzt die der Allelfrequenzen (vgl. Kap. 4.6.2) und unterstützt die Vermutung der Korrelation von IVS1 7 C>T, IVS6 50 G>A, IVS8 6 C>T und p.K279K.

# # ' ! "#

& & $ $ & & $ $ & &

% ' % %

&

& %

$ % % & $ % & *+ ( ,-

%) % % & $ % &

$ % % % & $ % &

! "6/578)#"$$#*

Die folgende Tabelle zeigt die Zusammenstellung der Genotypen, die bei der Sequenzierung der weißrussischen Patientinnenproben gefunden wurden.

# # ' ! "#

& & $ $ & & $ $ & &

% ' % %

&

& %

$ % % & $ % & '

% % % % % %

$ % % % & $ % &

- &Genotypen von und Häufigkeiten für das weißrussische Patientinnenkollektiv.

Schwarz = Wildtyp; andere Farben = Unterscheidung der SNPs. Fett und farbig = SNPs. Grauer Hintergrund = Übereinstimmung im deutschen Kollektiv.

Die Genotypen des deutschen und weißrussischen Kollektivs stimmen weitgehend überein.

Das gemeinsame Vorkommen aller fünf SNPs von Intron 1.2 (IVS1–7 C>T) bis Exon 9 findet sich hier sogar als homozygote Form. Der Wildtyp ist seltener als der Genotyp mit der Variante in Intron 3.

Der Basenaustausch in Intron 1.1 (IVS1–31 G>A) und Intron 3 findet sich auch unabhängig voneinander, während die SNPs in Intron 1.2, Intron 6, Intron 8 und Exon 9 immer gemeinsam auftreten.

Die Betrachtung der Genotypen unterstützt auch in diesem Kollektiv die Vermutung der Korrelation der Varianten von Intron 1 (IVS1 7 C>T), Intron 6, Intron 8 und Exon 9. Die homozygoten Genotypen erhärten den Verdacht des Kopplungsungleichgewichts.

2/$"6/)51"//$$6

Die folgenden Ergebnisse wurden ebenso wie für mit dem Programm HaploView4.1 erzielt (vgl. Kap. 3.11.6). Es sollten Haplotypen rekonstruiert und Kopplungsungleichgewichte berechnet werden, um Hypothesen über eine Assoziation mit

!=

familiärem Mammakarzinom aufstellen zu können. Das Kopplungsungleichgewicht diente außerdem für die Festlegung von tagSNPs. Für die Berechnungen wurden beide Kollektive, wie bereits für erläutert, zu einem zusammengefasst.

Mit den Daten für war die Haplotypbestimmung mit mehreren Optionen möglich.

Da die Option „Four Gamete Rule“ (vgl. Kap. 4.7.4) die meisten Informationen lieferte, bildet sie die Grundlage für die folgenden Abbildungen.

=& Rekonstruierte Haplotypen von für das gesamte Patientinnenkollektiv. Analyse nach „Four Gamete Rule“. Dicke Linie: mehr als 15 % Zuordnung. Dünne Linie: mehr als 1 % Zuordnung. Die kleinen Dreiecke weisen mit der Spitze auf die tagSNPs (vgl. Kap. 3.11.7).

Das Gen kann in zwei Haplotypblöcke eingeteilt werden. Alle durch die unterschiedlich starken Linien verbundenen Haplotypen passen zu den Genotypen in Kap. 4.8.2 und 4.8.3.

Das heißt, dass neben dem Wildtyp noch Haplotypen vorkommen, die ausschließlich die Variante in Intron 3 aufweisen oder ausschließlich in Intron 1.2 (IVS1–7 C>T) oder ausschließlich in Intron 1.1 (IVS1–31 G>A). Als fünfter Haplotyp kommt derjenige vor, in dem alle Varianten in Intron 1.2 bis Exon 9 vorliegen und bei dem lediglich Intron 1.1 vom Wildtyp ist.

Legt man für die Konfiguration der dünnen Linien fest, dass sie erst ab einem Wert von mehr als 1,1 % dargestellt werden sollen, so fällt die Verbindung von GT zu AGCG weg. Das bedeutet, dass der Haplotyp mit der einzigen Variante in IVS1 7 C>T nur zu ca. 1 % vorkommt. Deshalb ist er für weitere Untersuchungen vernachlässigbar. Es verbleiben dann drei häufige Haplotypen. Der Wildtyp kommt zu ca. 42 % vor, der Haplotyp mit der Variante in Exon 3 zu ca. 30 % und der Haplotyp mit allen fünf Varianten von IVS1 7 C>T bis p.K279K zu ca. 18 %. Mit ca. 9 % ist der Haplotyp vertreten, der lediglich die Variante IVS1 31 G>A aufweist.

Das zwischen den Blöcken angegebene multiallelische D` von 0,73 weist darauf hin, dass in diesem Bereich Rekombination stattfinden könnte. Die von HapMap zur Verfügung gestellten Rekombinationsraten (HapMap Data Rel27 Phase II+III, Feb09, on NCBI B36 assembly, dbSNP b126) in dem genetisch untersuchten Bereich von sind ca. 0,5 cM/Mb, so dass man davon ausgehen darf, dass sie die Haplotypfrequenzen nicht wesentlich beeinflussen

! werden. Da zwischen IVS1 7 C>T und IVS3+41 A>T ca. 3000 Basen liegen, könnte hier ein Rekombinationsereignis mit einer 1,5 % igen Wahrscheinlichkeit stattgefunden haben.

Die in der Abbildung durch die auf dem Kopf stehenden Dreiecke angegebenen tagSNPs dienen der Identifizierung der Haplotypen des jeweiligen Blocks.

Die folgende Abbildung stellt die Stärke des Kopplungsungleichgewichts zwischen den einzelnen SNPs wie in Kap. 4.7 beschrieben graphisch dar. Die Zahlen in den Rhomben geben den Korrelationskoeffizienten r² an. Für die Analyse wurde wieder die Option „Four Gamete Rule“ gewählt.

!& LD Plot für die Einzelnukleotid

Polymorphismen von im gesamten

Patientinnenkollektiv. Blöcke gemäß „Four Gamete Rule“. Weiß: D` < 1 und LOD < 2. Rot: D` = 1 und LOD 2. Blau: D` = 1 und LOD < 2. Zahlen in den Rhomben: r² in „%“. Keine Zahlen: r² = 1 und D` = 1.

Die roten Rhomben weisen auf das vollständige Kopplungsungleichgewicht zwischen Intron 3, Intron 6, Intron 8 und Exon 9 hin. Die Korrelation dieser Kopplungsgruppe mit Intron 1.2 (IVS1 –7 C>T) von 92 % ist ausschließlich durch den Fall bedingt, in dem die Variante IVS1 7 C>T ohne die Varianten in Intron 6, 8 und Exon 9 vorkommt. Ohne Berücksichtigung des dazugehörigen Genotypen wäre die Korrelation 100 %. Die Korrelation zwischen IVS1 7 C>T und IVS3+41 A>T wäre 21 % statt 16 % bei ebenfalls rotem Rhombus, der auf ein hohes Maß an Kopplungsungleichgewicht hinweist. Die Korrelation von 23 % bzw. 21 % zwischen IVS3+41 A>T und den Varianten IVS1 7 C>T, IVS6 50 G>A, IVS8 6 C>T und p.K279K zeigt an, dass die Variante in Intron 3 auch ohne die Viererkombination von SNPs vorkommt. IVS1 31 G>A weist zwar D` = 1 auf, aber ein LOD < 2 bei praktisch keiner Korrelation.