Sommersemester 2004 Abgabe am 07.07.2004 Prof. Dr. Stefan Posch, Dipl.-Inf. B. M¨oller, Dr. J. Wensch
13. ¨ Ubung
” Algorithmen der Bioinformatik I“
1. a) Gegeben sei eine ProteinsequenzS, so die zugeh¨orige SequenzS0, die ausS nach einem Evo- lutionsschritt durch Mutationen hervorgegangen ist. Wie l¨asst sich aus S und S0 die initiale WahrscheinlichkeitsmatrixM(1) mit den Eintr¨agen
M(1)
ij =P(ci →cj)
sch¨atzen, wobei P(ci → cj) die Wahrscheinlichkeit ist, dass das Protein ci in das Protein cj mutiert?
b) Wir nehmen an, dass sich die ¨Ubergangswahrscheinlichkeiten in einem Mutationsschritt im Ver- lauf der Evolution nicht ¨andern und gerade der in Teil a) gesch¨atzten Matrix entsprechen. Uns interessiert nun allgemein eine Matrix M(k), die die Mutationswahrscheinlichkeiten innerhalb der Proteinsequenz nach k Evolutionsschritten beschreibt. Wie kannM(k) direkt ausM(1) be- rechnet werden?
2. Ziel dieser Aufgabe soll es sein, sich mit den im Internet verf¨ugbaren Protein- und Genom-Datenbanken vertraut zu machen und die Anwendung der Algorithmen BLAST und FASTA in der Praxis zu erpro- ben. Die nachfolgenden Internetseiten k¨onnen als Einstieg dienen, da sie eine ¨Ubersicht ¨uber vorhan- dene Datenbanken und die jeweils m¨oglichen Suchanfragen bieten:
• http://www.bioscience.org/urllists/proserch.htm
• http://www.expasy.org
Versuchen Sie nun mit Hilfe der Datenbanken die folgenden Aufgaben zu l¨osen:
a) Finden Sie die Aminos¨aure- und DNA-Sequenzen der nachfolgenden Proteine heraus:
– Retinoic acid receptor alpha – Cystatin
– NP 001320
b) Auf der Internetseite zur Vorlesung finden Sie drei Dateien ”protein{1-3}.txt”, die jeweils Ami- nos¨aure- und DNA-Sequenzen eines Proteins enthalten. Versuchen Sie mit Hilfe der Datenban- ken herauszufinden, um welche Proteine es sich jeweils handelt, welche Funktionsweisen sie haben und wo sie auftreten.
c) Die Datei ”enolase-1.txt”, die sich ebenfalls auf der Internetseite zur Vorlesung befindet, enth¨alt Aminos¨aure- und DNA-Sequenzen des menschlichen Proteins ”Enolase 1”. Finden Sie heraus, ob dieses Protein in ¨ahnlicher Form auch in anderen Spezies (z.B. M¨ause, Fliegen) vorkommt.