• Keine Ergebnisse gefunden

3. Methoden

3.4. DNA-Analytik

3.4.9. Statistische Auswertung

Autosomale STRs und Y-chromosomale Haplogruppen

Für die Genotypen der Individuen wurden zunächst die beobachtete und die erwarte-te Heerwarte-terozygotie bestimmt sowie auf Abweichungen zum Hardy-Weinberg-Gleichgewichtet getestet. Dafür wurde die Software Arlequin Version 3.5.1.2 (Excoffier et al. 2005) verwendet. Der exakte Test wurde exakt mit der Markov-Chain-Methode mit 1000000 Schritten durchgeführt, die dememorization steps-Anzahl betrug 100000. Anschließend wurden die Häufigkeiten der Allele sowie der Y-Haplogruppen verschiedener europäischer Populationen mit den gefundenen Häu-figkeiten aus der Kasseler Serie verglichen.

Exkurs: χ2-Tests

In der Statistik gibt es eine Reihe von Hypothesentests, deren Testprüfgröße χ2 -verteilt ist. Die χ2-Verteilung kann dabei von der Normalverteilung abgeleitet wer-den: bei n unabhängigen und normalverteilten Zufallsvariablen Zi ist sie mit n Frei-heitsgraden definiert als die Verteilung der Summe der quadrierten Zufallsvariablen Z12 Verteilungstest (Sind die Daten auf eine bestimmte Weise verteilt?)

Homogenitätstest (Entstammen zwei oder mehr Stichproben einer homogenen Grundgesamtheit?)

Methoden - Kapitel 3.4.

60

Für den Vergleich von autosomalen Allelfrequenzen sowie Y-chromosomaler Haplogruppen verschiedener Populationen zueinander ist folglich die letzte Testvari-ante von Bedeutung und soll kurz vorgestellt werden:

Beim Homogenitätstest soll überprüft werden, ob 2 oder mehr Stichproben diskreter Merkmale X1,…, Xm mit den Umfängen n1,…, nm aus derselben Grundgesamtheit stammen.

Die Nullhypothese lautet

H0: Die Merkmale X1,…, Xm stammen aus derselben Grundgesamtheit und entsprechend

H1: Die Merkmale X1,…, Xm stammen nicht aus derselben Grundgesamtheit Die untersuchte Zufallsvariable (z.B. die Allele eines STR-Systems) besitzt dabei k Merkmalskategorien (z.B. Allel 5 bis Allel 8 ohne Interallele, dann wäre k = 4). Die Stichproben Xi könnten in diesem Beispiel die verschiedenen Populationen sein. Die Frage wäre nun, ob sich die Allelhäufigkeiten zwischen den Populationen signifikant unterscheiden. Die Ergebnisse der Beobachtungen je Stichprobe (=Population) und Kategorie (=Allel) werden entsprechend in eine Kreuztabelle eingetragen:

Merkmale (=Allele) j Stichprobe

(=Population) Allel 5 Allel 6 Allel 7 Allel 8 Summe

X1 n11 n12 n13 n14 n1*

X2 n21 n22 n23 n24 n2*

X3 n31 n32 n33 n34 n3*

Summe n11+n21+n31=n*1 n*2 n*3 n*4 n Aus den Randverteilungen können nun im Folgenden die erwarteten Zellhäufigkeiten für jede Zelle unter der Annahme des Zutreffens der Nullhypothese bestimmt wer-den:

Mit Hilfe dieser Größe kann näherungsweise die χ2-verteilte Prüfgröße berechnet werden:

Methoden - Kapitel 3.4.

61

Um zu einer Testentscheidung zu gelangen, wird entweder der Wert der Prüfgröße mit einem zugehörigen kritischen Wert verglichen (einem entsprechendem Quantil der χ2-Verteilung, abhängig von der Anzahl der Freiheitsgrade und des Signifikanz-niveaus) oder der p-Wert direkt ermittelt. Die Nullhypothese wird abgelehnt, wenn mindestens zwei Stichprobenverteilungen signifikant verschieden sind. Um diesen Test anwenden zu dürfen, müssen mehrere Bedingungen erfüllt sein:

Der Stichprobenumfang n muss > 30 sein.

Der Erwartungswert Ei,j muss immer größer als 1 sein (d.h. keine Zelle darf

„leer“ sein).

Mindestens 80% der Ei,j müssen größer als 5 sein.

Gilt dies nicht, müssen Kategorien zusammengefasst werden, bis diese Bedingungen eingehalten werden.

Für die Anwendung des Homogenitätstest für den Frequenzvergleich der autosoma-len STR-Allele wurde zunächst die Anzahl der erhaltenen Allele bestimmt und eine entsprechende Frequenz berechnet. Die Frequenzdaten der weiteren Populationen wurden von der Datenbank ALLST*R (www.allstr.de, Qualitype AG, Deutschland) abgerufen. Um die Häufigkeiten vergleichen zu können, wurde der Erwartungswert bei n erfolgreich typisierten Allelen berechnet (Binomialverteilung, E = n * p). Die Tabelle zeigt eine Beispielverteilung für das System TH01 und die Frequenzen einer belgischen Population.

TH01 ≤ 6 7 8 9 ≥ 9.3

Belgien 0,2387 0,1347 0,1347 0,1449 0,347

Bei 252 Allelen erwartet 60 34 34 37 87

Für jeden Y-Haplotyp wurde mit Hilfe des online verfügbaren haplogroup predictors (http://www.hprg.com/hapest5/, Athey 2006) die jeweilige Haplogruppe bestimmt.

Die Häufigkeiten der Y-Haplogruppen wurde aus verschiedenen Publikationen (z.B.

Semino et al. 2000) zusammengetragen und analog vorgegangen.

Alle Häufigkeitsvergleiche wurden mit Hilfe eines Online-Tools, entwickelt von Preacher (2001, http://www.quantpsy.org/), durchgeführt.

Y-chromosomale STRs

Im Gegensatz zu den autosomalen STRs, bei denen weniger die individuelle Ausstat-tung als die allgemeinen Frequenzen der Allele von Interesse sind, ist bei den gekop-pelten Y-STRs die jeweilige Kombination von Bedeutung. Da bei der Vielzahl der Haplotypen ein direkter Frequenzvergleich statistisch wenig Sinn ergibt, müssen andere Verfahren genutzt werden.

Methoden - Kapitel 3.4.

62

Exkurs: Analysis of molecular variance (AMOVA)

Diese Methode erlaubt die Untersuchung der in einer Population und zwischen Popu-lationen angetroffenen Variation der genetischen Struktur auf molekularer Ebene (Excoffier et al. 1992). Das Verfahren berücksichtigt dabei nicht nur die Frequenz von Variationen, sondern auch deren molekulare Beziehung. Unterscheiden sich zwei Haplotypen z.B. nur in einem Locus um eine Wiederholungseinheit, sind sie sich sehr ähnlich. Diese Ähnlichkeit wird nicht berücksichtigt, wenn nur die identi-schen Haplotypen betrachtet werden.

Die AMOVA basiert auf Wrights F-Statistik (Wright 1950), dem am häufigsten ver-wendeten Modell zum Testen von Hypothesen bezüglich Genfluss und Isolation in-nerhalb von Spezies. Auf Basis der F-Werte wurden mehrere Analoge dazu entwi-ckelt, die speziell die evolutive Dynamik der untersuchten Marker berücksichtigen.

Für mitochondriale Haplotypen wurde von Excoffier 1992 ein F-Analogon, die soge-nannten φ-Werte, vorgeschlagen. Das Modell beruht auf der sogesoge-nannten single step mutation-Annahme (Ohta und Kimura 1973): Die durchschnittliche Entfernung des Haplotypes eines Individuums wird von jedem anderen analysierten Individuum in Form von 1-Schritt-Mutations-Unterschieden berechnet und durch die gesamte mo-lekulare Varianz σ2 beschrieben. Durch die Berücksichtigung des Ähnlichkeits-Kriteriums ist es möglich, genaue Aussagen über Populationen auf Basis der Haplo-typen zu erbringen. Der verwendete Signifikanztest ermöglicht es, die Unterschiede in der Varianz zweier Populationen statistisch zu bewerten: nicht-signifikante Unter-schiede zeigen an, dass sich zwei Populationen aufgrund der gefundenen Varianz sehr ähnlich sind, was auf engere Verwandtschaft hindeutet. Das Modell setzt eine kontinuierliche Mutationsrate voraus und berücksichtigt keine Rückmutationsereig-nisse.

Daher ist diese Grundannahme für mt-Haplogruppen nur eingeschränkt für STR-Systeme anwendbar, da diese mit gleicher Wahrscheinlichkeit sowohl eine Wieder-holungseinheit länger als auch kürzer werden können. Ohta und Kimura schlugen 1973 ein weiteres Modell vor, das stepwise mutation-Modell, das die Dynamik dieser Systemen besser beschreibt. Basierend darauf entwickelte Slatkin 1995 daher eine abgewandelte Form der φ-Werte, die R-Werte.

Insgesamt kann die Varianz-Korrelation für drei Ebenen ermittelt werden (analog zu den F-Werten von Excoffier et al. 1992):

• Die Varianz innerhalb von Populationen relativ zum Gesamtdatensatz (RST)

• Die Korrelation der Varianz von Populationen einer definierten Gruppe rela-tiv zum Gesamtdatensatz (RCT)

• Die Korrelation der Varianz von Populationen relativ zu der Varianz von zufälligen Datensätzen einer Region (RSC)

Methoden - Kapitel 3.4.

63

Die AMOVA wurde mit Hilfe der Website www.yhrd.org berechnet. Die Website ermöglicht eine Berechnung von paarweisen RST-Werten von maximal zehn dort erfassten Populationen mit 10.000 Permutationen.

Die RST-Werte liegen in der Regel zwischen 0 für identische Populationen und 1 für sich absolut unterscheidende Populationen. Bei sehr nahverwandten Populationen können die Werte auch leicht negativ sein. Auf Grundlage der erhaltenen Distanz-matrizen wurden die Abstände für eine bessere Interpretation in einem Baumdia-gramm dargestellt, dazu wurde die Neighbor Joining-Methode (NJ) gewählt (Saitou u. Nei 1987). Im Gegensatz zur UPGMA-Methode wird hierbei nicht nur ein Aus-gangspunkt für alle Populationen berechnet, sondern auch die genauen Beziehungen untereinander. NJ basiert auf dem minimum evolution-Kriterium (Cavalli-Sforza u.

Edwards 1967), setzt jedoch keine molekulare Uhr voraus, so dass ein unbalancierter Baum entsteht. Aufgrund der Einschränkungen bei der AMOVA über das Website-Tool können als Grundlage für die Bäume nur die Distanzmatrices genutzt werden, was zur Folge hat, dass keine bootstrap-Werte berechnet werden können. Da bei der NJ-Methode nicht alle möglichen Bäume berechnet werden, kann es möglich sein, dass nicht der optimale Baum dargestellt wird. Die Bäume wurden mit Hilfe der Website http://mobyle.pasteur.fr/cgi-bin/portal.py?form=quicktree erstellt.

Ergebnisse – Kapitel 4.1.

64

Abbildung 4.2: Einige Fragmente distaler Femurepiphysen, die keiner Diaphyse zuge-ordnet werden konnten.

Abbildung 4.1: Rekonstruierte Knochen (hier zwei Femora und eine Tibia)