• Keine Ergebnisse gefunden

1 Einleitung und Ziele der Arbeit

2.1 Genomstruktur und Genomaufbau

2.1.3 Molekulare Marker

Verbreitung beider Pseudogenarten mit chromosomaler Größe korreliert ist, scheinen nicht prozessierte Pseudogene in Regionen mit hoher Gendichte gehäuft vorzukommen. Vom humanen Genom wird vermutet, dass die Anzahl Pseudogene die Menge an kodierenden Genen übersteigt, wie auch Abbildung 2.5 verdeutlicht (Torrents et al. 2003).

Die Mehrzahl bakterieller Genome besitzt nur wenige Pseudogene (Lawrence et al.

2001) und bei der Fruchtfliege (Drosophila melanogaster) wurden bislang ca. 100 nachgewiesen (Harrison et al. 2003). Auch das Vogel-Genom ist bekannt für seinen geringen Anteil (15% des Genoms) an repetitiven Sequenzen und Pseudogenen (Burt et al.

2002).

50

40

20 30

10

0

0 20 40 60 80 100 120 140

Anzahl Gene / Pseudogene

Position (Mb) Gene

Pseudogene (nicht prozessiert) Pseudogene (prozessiert)

Abbildung 2.5: Darstellung der Gen/Pseudogenverteilung auf Chromosom 8 des Menschen (HSA8). Insgesamt wurden auf Chromosom HSA8 921 funktionelle Gene in einer durchschnittlichen Dichte von 6,4 Genen pro Mb und ebenso 872 Pseudogene in einer durchschnittlichen Dichte von 6,1 Genen pro Mb lokalisiert. Von Pseudogenen waren 479 prozessiert und 175 nicht prozessiert (nach Torrents et al. 2003, verändert).

Artenschutz, Kriminalistik, Verhaltensforschung, Tier- und Pflanzenzüchtung (Goldstein

& Schlötterer 1999).

Traditionelle Klassifizierung definiert Typ I Marker als polymorphe Gene und Typ II Marker als hochpolymorphe, nicht kodierende DNA-Abschnitte. DNA-Sequenzierung ermöglicht es, Polymorphie bis auf Nukleotidebene zu definieren, sodass auch Einzel-Nukleotid-Austausche (SNP) nutzbare Marker darstellen. Vorteile und Anwendungs-möglichkeiten molekularer Marker in der Tierzucht ergeben sich durch die Möglichkeit der Erkennung von Genotypen vor der Zuchtbenutzung und der Leistungsprüfung durch Kopplungsanalysen von Marker und Selektionsmerkmal.

2.1.3.1 Mikrosatelliten

Repetitive DNA Sequenzen im Genom können in isoliert verstreute repetitive Sequenzen (SINE) oder tandem-wiederholte Sequenzen (LINE) differenziert werden.

Mikrosatelliten oder «simple sequence repeats» (SSR) oder auch «short tandem repeats»

(STR) stellen derartige Tandemwiederholungen von 1 bis 6 Basenpaarmotiven dar (Tautz

& Schlötterer 1994), die in allen prokaryontischen und eukaryontischen Genomen auftreten. Sie kommen in kodierenden und nicht kodierenden genomischen Bereichen vor und sind gewöhnlich durch einen hohen Grad an Längenpolymorphie gekennzeichnet (Zane et al. 2002). Das humane Genom beherbergt mindestens 50000 Mikrosatelliten Loci (Halliburton 2004). Die Ursache dieser Art von Polymorphismus ist noch immer ungeklärt und wird in der Literatur als durch «slippage events» während der DNA Replikation verursacht beschrieben (Tautz et al. 1986, Schlötterer & Tautz 1992), vorzugsweise in solchen Sequenzregionen, wo DNA-Nadelstrukturen ausgebildet werden können. Dabei scheint die Veränderung eines Mikrosatelliten in der Mehrzahl der Fälle durch Abnahme oder Zunahme einzelner Wiederholungseinheiten zu erfolgen (Ellegren et al. 1997) obwohl auch darüber hinaus weitere Veränderungen möglich sind (Amos et al. 1996, Primmer et al. 1996). Derartige Längenvariation stellt eine Quelle von Polymorphismen zwischen engverwandten Individuen dar und wird aus diesem Grund in der Tierzucht gerne zu evolutionsgenetischen- und Diversitätsstudien, sowie zur Charakterisierung von Rassen und Verwandtschaftsstrukturen genutzt (MacHugh et al. 1994, 1997, 1999, Moazami-Goudarzi et al. 1997, Arranz et al. 2001, Beja-Pereira et al. 2003, Wiener et al. 2004, Baumung et al. 2006). Mikrosatellitensequenzen können durch PCR und mit Hilfe flankierender Primer amplifiziert und DNA-Längenpolymorphismen auf Agarose- bzw.

Polyacrylamidgelen dargestellt werden (Litt & Luty 1989, Weber & May 1989).

Beim Schwein wird die Anzahl der Mikrosatelliten-VNTR, bei einer Genomgröße von

~ 3.000 Mb (Rohrer et al. 2004), auf 65.000-100.000 geschätzt (Wintero et al. 1992).

Abhängig von der Anzahl der nutzbaren Mikrosatelliten können bei dieser Spezies alleine mit diesen Markern dichte Kopplungskarten erstellt werden.

2.1.3.2 Restriktions Fragmentlängen Polymorphismen (RFLP)

Die erste Generation von DNA-Markern waren Restriktions Fragmentlängen Polymorphismen (RFLP). Grodzicker et al. konnten 1974 zeigen, dass Restriktionsfragment Bandenmuster genutzt werden können, um genetische Unterschiede darzustellen. Jedoch mussten zu dieser Zeit Typisierungen über Southern Blots mit radioaktiv markierten Proben dargestellt werden. Dessen ungeachtet wurde die erste humane genetische Karte des Menschen auf diese Weise konstruiert (Botstein et al. 1980).

1966 1980 1985 1990 1995 2000 2003

relative Popularit

Allozymes

RAPDs SNPs

Minisatelliten Mikrosatelliten

RFLPs AFLPs

DNA Sequenzierung

Abbildung 2.6: Darstellung der im Zeitablauf sich ändernden Anwendungshäufigkeit unterschiedlicher molekularer Marker, gemessen an der Frequenz ihrer Publikationen. Die horizontale Achse repräsentiert die Zeit. An jedem Zeitpunkt korrespondiert die vertikale Achse mit der gesamten Anwendung molekularer Marker. Wenn mehr als ein molekularer Marker an einem gegebenen Zeitpunkt verwendet wurde, ist sein relativer Anteil an Wichtigkeit auf der vertikalen Achse aufgetragen (nach Schlötterer 2004, verändert).

Der Vorteil der RFLP-Technik liegt heute in der vereinfachten Anwendung durch Auswahl der möglichen Restriktionsenzyme per Datenbank und Sequenzabgleich (z.B.

REBASE, URL: 6), dem Mikrotiterplattenformat der Verdaus der PCR-Produkte und der Typisierung durch Auftrennung auf Agarosegelen, ebenfalls im Mikrotiterraster. Die Informativität von RFLP liegt in der Kodominanz beider Allele und in dem Erkennen von Polymorphie an definierten Loci. Wird kodierende Sequenz auf diese Weise untersucht, können anschließend Gene kartiert werden. Durch RFLP-Kartierung und molekulare Klonierung konnten speziesübergreifende komparative Karten erstellt werden und in der Genomanalyse der wichtigsten Nutzpflanzen stellen sie die Grundlage der genetischen Kartierung dar (Kowalski et al. 1994, Van Deynze et al. 1998, Brubaker et al. 1999, Livingstone et al. 1999).

Ein grundsätzlicher Nachteil dieser Technik liegt jedoch in ihrer begrenzten Informativität verglichen mit z.B. Mikrosatellitenmarkern. RFLP besitzen lediglich zwei Allele: Die Enzym-Erkennungsstelle ist vorhanden oder nicht; die maximale Heterozygotie beträgt 0.5. Vor allem zwischen verwandten Individuen kann dieser Nachteil wesentlich werden. So können Familienmaterialien eng gezüchteter Linien wie bei Holstein Rindern oder innerhalb der bekannten Schweinerassen, oft nur mit erheblichem Sequenzieraufwand über PCR-RFLP typisiert und charakterisiert werden. Durch die neuerliche Sequenzierung kompletter Genome sowie durch die Verfügbarkeit in großer Anzahl, gewinnen jedoch Einzel-Nukleotid-Austausche (SNP) wieder an Bedeutung (Eck et al. 2009, Allen et al.

2010).

2.1.3.3 Single Nucleotide Polymorphism (SNP)

Im menschlichen Genom wurden bislang 1,42 Mill. SNP gefunden (Sachidanandam et al. 2001), d.h. 1 SNP pro 500-1000 bp (Lander et al. 2001, Daly & Day 2001). Durch die Sequenzierung kompletter Genome ergeben sich neue Vergleichsmöglichkeiten zwischen Spezies. Der Abgleich gesamtgenomischer Sequenz zeigte, dass Mäuse (Waterstone et al.

2002) und Ratten (Gibbs et al. 2004) eine annähernd doppelt so hohe Nukleotidsubstitutionsrate wie der Mensch (Lander et al. 2001) besitzen.

Es existieren öffentliche Datenbanken humaner SNP (URL 1), die aus Ergebnissen genomweiter Screens zusammengestellt wurden, sowie boviner in silico SNP (URL 22), die eine Ableitung aus Alignments veröffentlichter boviner EST und mRNA Sequenzen darstellen. Aufgrund von Substitutions- (Transitionen, Transversionen), Deletions- und Insertionsereignissen, erzeugen SNP-Polymorphismen die Möglichkeit zur Differenzierung an einzelnen Nukleotidpositionen und sind als bi-allelische Marker charakterisiert. Mit nur zwei Allelen (in seltenen Fällen bis drei Allelen), sind SNP Marker in der Regel weniger

informativ als Mikrosatelliten Marker. Genetische Karten für Kopplungsstudien auf der Basis von SNP benötigen deshalb wenigstens die dreifache Menge an Markern verglichen mit Mikrosatelliten Karten bei gleicher Auflösung (Kruglyak 1999). Die zurzeit rapide zunehmende Verfügbarkeit gesamtgenomischer Sequenzen eröffnet jedoch eine intensive Nutzungsmöglichkeit von SNP. Dies geht einher mit Neuentwicklungen wie z.B.

Microarrays, die stark erhöhten Durchsatz ermöglichen, so dass die geringere Informativität des einzelnen SNP durch die Datenmenge mehr als ausgeglichen werden kann (Butcher et al. 2005, Duijvesteijn et al. 2010, Verbyla et al. 2010).

Assoziationsstudien zwischen QTL und Kandidatengenen wurden in den vergangenen Jahren vorwiegend für einzelne Allele durchgeführt. SNP befinden sich aber häufig in einem Kopplungsungleichgewicht und sind deshalb aus statistischer Sicht nicht unabhängig voneinander (Belmont & Gibbs 2004). Bei der Erforschung quantitativer Merkmale, die heute im Mittelpunkt vieler Untersuchungen stehen, ist es jedoch wahrscheinlich, dass nicht nur ein einzelner SNP eine deutliche Veränderung der Eigenschaft bewirkt, sondern dass mehrere SNP in verschiedenen Genen und in Wechselwirkung mit der Umwelt die Ausprägung der Eigenschaft bewirken und dies im Besonderen für Merkmale mit niedrigen Heritabilitäten. Der Einfluss des einzelnen SNP ist daher oft quantitativ gering und wird erst in Wechselwirkung mit bestimmten anderen SNP und spezifischen Umweltbedingungen deutlich. Davon ausgehend scheint die Untersuchung von spezifischen Kombinationen von Polymorphismen über größere chromosomale Entfernungen in Form von SNP-Haplotypen eine attraktive Nutzungsmöglichkeit genomischer Variation in der Tierzucht darzustellen (Hayes et al.

2007, Marques et al. 2008).

2.1.3.4 Expressed Sequence Tag (EST)

EST sind kurze, 200 - 500 bp große, im Genom einmalig vorkommende DNA Sequenzen, deren genomische Position bekannt ist. EST sind STS-Marker, die aus cDNA abgeleitet sind. Vor der Zeit von gesamtgenomischer Sequenz wurde durch die Produktion von EST Markern genfragmentarische Sequenz generiert. Diese ermöglichte, durch differentielle Beprobung gewebespezifische Expressionsmuster zu erstellen.

Ausgehend von cDNA Sequenz kann genomische Sequenzierung vorgenommen werden, die je nach Sequenzierrichtung unterschiedliche Arten von EST Fragmenten generiert. Sequenzierungen der 'upstream' Region führen zu 5' EST, die in der Regel eine proteinkodierende Genregion darstellen. Diese Regionen neigen dazu innerhalb Spezies

konserviert zu sein und verändern sich nicht sehr innerhalb Genfamilien. Sequenzierung der 'downstream' Region von cDNA-Molekülen generiert 3' EST. EST aus dem 3'-Ende eines Transkripts beinhalten in der Regel die nicht translatierte Sequenzregion (UTR) und können Variation zeigen.

Neben SNP stützt sich die aussagekräftigste Kartierungs-technik auf Marker, die kurze wieder erkennbare und einmalige Sequenzfragmente darstellen (STS).

Aufgrund ihrer Einzigartigkeit stellen EST eine häufig genutzte STS Variante dar und liefern darüber hinaus Informationen über exprimierte Gene (Everts-van der Wind et al. 2004).