• Keine Ergebnisse gefunden

P HYLOGENETISCHE A NALYSEN ALS H ILFSMITTEL DER E PIDEMIOLOGIE

2. LITERATUR

2.5 P HYLOGENETISCHE A NALYSEN ALS H ILFSMITTEL DER E PIDEMIOLOGIE

2.5 Phylogenetische Analysen als Hilfsmittel der Epidemiologie

Epidemiologische Untersuchungen werden zunehmend durch phylogenetische Analysemethoden ergänzt. So entstanden umfangreiche Fallstudien über die epidemiologische Geschichte weltweit verbreiteter Viruserkrankungen, wie z.B. HIV-1, Influenza-A oder dem Hepatitis-C-Virus (HCV) (KANDATHIL et al., 2005; TEO, 2005; MOURY et al., 2006;

ZHAO, 2007).

In der veterinärmedizinischen Virologie liegen vor allem Untersuchungen zu RNA-Viren vor (HAAS, 1997; HUNGNES et al., 2000). Anhand von Untersuchungen von Pestiviren (VILCEK et al., 2005; GREISER-WILKE et al., 2006) konnten Rückschlüsse auf Verbreitungswege, Interspeziesübertragung sowie die Unterscheidung von Feld- und Impfvirusstämmen gezogen werden.

Phylogenetische Analysen können unter anderem mit morphologischen, ätiologischen und molekularen Daten durchgeführt werden. Die seit den 1960er Jahren stark zunehmenden Erkenntnisse zur molekularen Evolution sowie die Anhäufung von molekularen Daten betreffend Protein- und Nukleinsäuresequenzen haben parallel zum Fortschritt in der Computertechnologie die Entwicklung und breite Anwendung zahlreicher Verfahren zur

Literatur

Untersuchung der evolutionären Geschichte von Organismen und Makromolekülen vorangetrieben.

Für computergestützte phylogenetische Analysen steht eine Vielzahl von Programmpaketen zur Verfügung. Diese sind häufig auf einen methodischen Schwerpunkt ausgerichtet. Unter der www-Adresse http://evolution.genetics.washington.edu/phylip/software.html befinden sich Links zu den meisten Anbietern kommerzieller und frei erhältlicher Software. Das Programmpaket Phylip (Phylogenetic Inference Package, FELSENSTEIN 1989) bietet den Vorteil, dass es weit verbreitet ist und eine Vielzahl von Einzelprogrammen mit unterschiedlichen Methoden enthält. Zudem ist es frei erhältlich und verfügt über detaillierte Dokumentationen (SANDERSON, 1990).

2.5.1 Darstellung phylogenetischer Analysen

Pylogenetische Analysen werden graphisch als Dendrogramme dargestellt. Ein phylogenetischer Baum stellt die evolutionären Beziehungen zwischen verschiedenen Arten oder anderen Einheiten dar, von denen man vermutet, dass sie einen gemeinsamen Vorfahren besitzen. Im phylogenetischen Kontext ist ein Baum eine mathematische Konstruktion, welche die stammesgeschichtlichen Verwandtschaftsverhältnisse (Phylogenie) einer Gruppe von Lebewesen widerspiegelt. Ein Stammbaum besteht aus Knoten (Verzweigungspunkten), die durch Kanten (Äste) miteinander verbunden sind. In einem phylogenetischen Baum repräsentiert jeder Knoten den Vorfahren der nächsten gemeinsamen Verwandten (LI, 1997).

Die Kantenlänge entspricht der Anzahl der Mutationen während dieser Entwicklung. Jeder Knoten in einem phylogenetischen Baum wird als taxonomische Einheit bezeichnet. Innere Knoten symbolisieren die hypothetischen Vorfahren für jene Taxa, die sich in einem anschließenden Aufspaltungsprozess in zwei Tochterlinien geteilt haben (HILLIS, 1997). Die Anordnung der Zweige ergibt die Topologie des Baumes (Abbildung 4). Die äußeren Knoten repräsentieren Organismen, für die reale Daten vorliegen wie z. B. DNA-Sequenzen. Sie werden auch als Operational Taxonomic Units (OTUs) bezeichnet. Phylogenetische Bäume werden heute meist anhand von Nukleotid- oder Aminosäuresequenzen definierter Genabschnitte berechnet. Dabei berechnet man ein Sequenzalignment des gleichen Gens (oder

der gleichen Gene) dieser Arten und verwendet die im Alignment erscheinenden Ähnlichkeiten und Unterschiede, um phylogenetische Analysen durchzuführen. Arten, deren Sequenzen ähnlich sind, liegen im Dendrogramm dann wahrscheinlich näher beieinander als solche mit stark unterschiedlichen Sequenzen. Zu einer der dabei am häufigsten angewendeten Algorithmen der molekular-phylogenetischen Analysen gehört das Neighbor-Joining (N-J) (FELSENSTEIN, 1992), bei dem einem definierten Algorithmus folgend Schritt für Schritt ein Dendrogramm erstellt wird (2.4.2). Ziel der Erstellung phylogenetischer Analysen ist es, die Evolution möglichst detailliert zu erklären. Allerdings weiß man heute, dass die Gene sich nicht gleichmäßig entwickelt haben. Einige Gene, die heute beim Menschen vorkommen, haben beispielsweise nur gemeinsame Vorfahren mit dem Schimpansen, andere kommen bei allen Säugetieren vor. Deshalb können bei der Analyse verschiedener Gene der gleichen Spezies unterschiedliche phylogenetische Bäume entstehen, die für sich jedoch alle korrekt sind. Um die Entstehungspunkte und Verzweigungen bei der Evolution der einzelnen Arten festzustellen, müssen deshalb verschiedene Genregionen untersucht werden. Weiterhin sollten Ergebnisse aus der klassischen Phylogenie sowie morphologische Merkmale zur Interpretation hinzugezogen werden (HAESELER u. LIEBERS, 2003; KNOOP u. MUELLER, 2006).

Abbildung 4: Bestandteile eines einfachen phylogenetischen Baumes Äußere Knoten (endständiges Taxon, OTU) Interne Knoten

(Verzweigungspunkt, hypothetischer Vorfahre) Wurzel (Vorfahre aller

untersuchten Taxa)

Nukleotidaustausche pro Länge

0,01

Literatur

2.5.2 Für phylogenetischen Analysen verwendete Algorithmen

Grundlage der phylogenetischen Analyse von Sequenzdaten ist ein Sequenzvergleich. Hierbei werden die einzelnen Substitutionen, Insertionen oder Deletionen unterschiedlich gewichtet und anhand dieser Werte die OTUs so angeordnet, dass die Kriterien des jeweils angewendeten Algorithmus optimal erfüllt werden. Dieses Vorgehen wird als Alignment bezeichnet. Für ein Alignment müssen die Sequenzen von definierten (festgelegten) Genomfragmenten stammen und immer die gleiche Länge aufweisen.

Die Berechnung eines phylogenetischen Baumes kann auf zwei unterschiedlichen Methoden basieren (SWOFFORD et al., 1996). Dies ist einerseits ein auf einem Direktvergleich der Sequenzen beruhenden Algorithmus, (Parismony, Maximum-Likelihood) oder andererseits auf einer Distanzmatrix basierenden Methode, zu denen die UPGMA (Unweighted Pair-Group Method) und die Neighbor-Joining (N-J) Methode gehören.

Die am häufigsten in der molekularen Phylogenie verwendete Methode ist der Neighbor-Joining-Algorithmus (N-J), bei dem aus den Sequenzen zuerst eine Distanzmatrix berechnet wird (SAITOU u. NEI, 1986). Die Sequenzen selber werden danach nicht mehr verwendet.

Distanzbasierende Methoden berechnen die Distanz für alle Sequenzpaare eines Alignements.

Das Ergebnis ist die Distanzmatrix, aus welcher ein Baum rekonstruiert wird, welcher die Anzahl der Substitutionen aller Sequenzpaare wiedergibt. Aus dieser Matrix berechnet das Programm entweder einen bewurzelten (rooted) oder einen unbewurzelten Baum (unrooted tree). Das Ziel des N-J ist, die Gesamtastlänge zu minimieren.

2.5.3 Überprüfung der Robustheit von Bäumen (Bootstrap-Werte)

Zur Überprüfung der Robustheit eines konstruierten phylogenetischen Baums wird das von Bradley Efron entwickelte Bootstrapping-Verfahren verwendet (EFRON, 1979; EFRON et al., 1996). Beim Bootstrap wird eine zufällige Stichprobe durch wiederholtes Ziehen mit Zurücklegen aus den bereits erhobenen Daten generiert, die Pseudoreplikate genannt werden.

Häufig werden auf diese Weise 1000 bis 10000 Bäume berechnet. Kommt dabei eine bestimmte Gruppierung in allen Bäumen vor, so bedeutet dies einen Bootstrap-Wert von

100 %. Für die verlässliche Rekonstruktion eines Dendrogramms ist die Stichprobengröße (Länge oder Anzahl der Sequenzen) von entscheidender Bedeutung. Das Bootstrapping ist ein statistischer Wert, der die Stabilität der Einteilung der Isolate in die einzelnen Gruppen und Genotypen angibt. Je höher der Wert ist, desto stabiler ist die Eingruppierung der untersuchten Sequenzen (s. o). Niedrige Bootstrap-Werte weisen dagegen nicht zwangsläufig auf ein falsches Ergebnis hin. Sie werden von den vorhandenen Sequenzen nicht genügend unterstützt, weil sie zu kurz sind oder weil eine zu geringe Anzahl an Sequenzen verfügbar ist (EFRON, 1979; FELSENSTEIN, 1992).