Ubungen Molekulare Phylogenie ¨ Wintersemester 2006/07
Dr. Ivo Große
Institut f¨ur InformatikUniversit¨at Halle
Blatt 1
Aufgabe 1.1 Beweisen Sie:
(a) Sind Q eine stochastische Matrix vom Typ N ×N und ~p ein N-dimensionaler Wahrscheinlichkeitsvektor, so ist auch ~pQein Wahrscheinlichkeitsvektor.
(b) Sind Q und R stochastische Matrizen vom Typ N × N, so ist auch QR eine stochastische Matrix.
(c) Ist Qeine stochastische Matrix, so ist einer ihrer Eigenwerte gleich 1.
(d) Ist D eine Diagonalmatrix, so ist Dk diagonal und (Dk)ii= (Dii)k.
Aufgabe 1.2 Diese Aufgabe betrifft das zeit-diskrete Jukes-Cantor-Modell.
(a) Berechnen Sie die Eigenwerte und Eigenvektoren (bzw. Eigenr¨aume) der ¨Uber- gangsmatrix des Jukes-Cantor-Modells. Zeigen Sie, dass die in der Vorlesung angegebenen Vektoren erstens in den Eigenr¨aumen liegen und zweitens eine Or- thonormalbasis bilden.
(b) Zeigen Sie BTB =BBT =E.
(c) Berechnen Sie BTQB.
(d) Berechnen Sie BDkBT.
Aufgabe 1.3 Diese Aufgabe betrifft das zeit-stetige Jukes-Cantor-Modell.
(a) Plotten Sie P(X(t + ∆t) = b|X(t) = a) f¨ur a 6= b f¨ur die drei Mutationsraten µ1 = 0.5/109y, µ2 = 2/109y und µ3 = 5/109y als Funktion von ∆t f¨uer ∆t von 0 bis 109y.
(b) Leiten Sie den Maximum Likelihood Schtzer des Parameters ddes Jukes-Cantor- Modells her.
(c) Auf der Webseite zur Vorlesung finden Sie in den Dateien 1.txt, 2.txt und 3.txt je zwei alignierte DNA Sequenzen der L¨ange 1 kb. Bestimmen Sie f¨ur diese drei Sequenzpaare jeweils die beobachtete Anzahl der Substitutionen und Abgabe: 13.12.06
die gesch¨atzte Anzahl der tats¨achlich stattgefundenen Substitutionen. Sch¨atzen sie daraus und aus der Information, dass die Altersunterschiede zwischen der ersten und zweiten Sequenz 5×106y, 50×106yund 500×106ybetragen, die drei Mutationsraten.
Abgabe: 13.12.06