• Keine Ergebnisse gefunden

” Algorithmen der Bioinformatik I“

N/A
N/A
Protected

Academic year: 2022

Aktie "” Algorithmen der Bioinformatik I“"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Sommersemester 2004 Abgabe am 07.07.2004 Prof. Dr. Stefan Posch, Dipl.-Inf. B. M¨oller, Dr. J. Wensch

13. ¨ Ubung

” Algorithmen der Bioinformatik I“

1. a) Gegeben sei eine ProteinsequenzS, so die zugeh¨orige SequenzS0, die ausS nach einem Evo- lutionsschritt durch Mutationen hervorgegangen ist. Wie l¨asst sich aus S und S0 die initiale WahrscheinlichkeitsmatrixM(1) mit den Eintr¨agen

M(1)

ij =P(ci →cj)

sch¨atzen, wobei P(ci → cj) die Wahrscheinlichkeit ist, dass das Protein ci in das Protein cj mutiert?

b) Wir nehmen an, dass sich die ¨Ubergangswahrscheinlichkeiten in einem Mutationsschritt im Ver- lauf der Evolution nicht ¨andern und gerade der in Teil a) gesch¨atzten Matrix entsprechen. Uns interessiert nun allgemein eine Matrix M(k), die die Mutationswahrscheinlichkeiten innerhalb der Proteinsequenz nach k Evolutionsschritten beschreibt. Wie kannM(k) direkt ausM(1) be- rechnet werden?

2. Ziel dieser Aufgabe soll es sein, sich mit den im Internet verf¨ugbaren Protein- und Genom-Datenbanken vertraut zu machen und die Anwendung der Algorithmen BLAST und FASTA in der Praxis zu erpro- ben. Die nachfolgenden Internetseiten k¨onnen als Einstieg dienen, da sie eine ¨Ubersicht ¨uber vorhan- dene Datenbanken und die jeweils m¨oglichen Suchanfragen bieten:

• http://www.bioscience.org/urllists/proserch.htm

• http://www.expasy.org

Versuchen Sie nun mit Hilfe der Datenbanken die folgenden Aufgaben zu l¨osen:

a) Finden Sie die Aminos¨aure- und DNA-Sequenzen der nachfolgenden Proteine heraus:

– Retinoic acid receptor alpha – Cystatin

– NP 001320

b) Auf der Internetseite zur Vorlesung finden Sie drei Dateien ”protein{1-3}.txt”, die jeweils Ami- nos¨aure- und DNA-Sequenzen eines Proteins enthalten. Versuchen Sie mit Hilfe der Datenban- ken herauszufinden, um welche Proteine es sich jeweils handelt, welche Funktionsweisen sie haben und wo sie auftreten.

c) Die Datei ”enolase-1.txt”, die sich ebenfalls auf der Internetseite zur Vorlesung befindet, enth¨alt Aminos¨aure- und DNA-Sequenzen des menschlichen Proteins ”Enolase 1”. Finden Sie heraus, ob dieses Protein in ¨ahnlicher Form auch in anderen Spezies (z.B. M¨ause, Fliegen) vorkommt.

Referenzen

ÄHNLICHE DOKUMENTE

Beschreiben Sie eine Methode, mit der alle maximalen Paare eines Strings der L¨ange gefunden werden k¨onnen und diskutieren Sie ihre Korrektheit.. Finden Sie nun auch

aus dem Algorithmus zum Finden optimaler globaler Ali- gnments von zwei Strings enth¨alt auch ohne zus¨atzlich abzuspeichernde Links zu den minimie- renden Vorg¨angern

PAM steht f¨ur point accepted mutations oder percent accepted mutations in Anbetracht der Tatsa- che, dass die 1-PAM Matrix gerade die Menge an Evolution wiederspiegelt, die

Insbesondere sollen grundlegende Ein- und Ausgabeoperationen in der Programmiersprache Ihrer Wahl (Java oder C++) realisiert werden sowie ein String-Objekt zur Verf¨ugung

Testen Sie die Verfahren und vergleichen Sie die Laufzeiten (real oder durch Z¨ahlung der Vergleiche) f¨ur verschiedene L¨angen des Muster- strings P und verschiedene Gr¨oßen

Zeigen Sie dazu zuerst, dass f¨ur jedes am Anfang von Phase i + 1 vorhandene Blatt die Regel I in Phase i + 1 genau einmal angewendet wird und dass es keine weiteren Anwendungen

Der Suffixbaum liege dabei wie in der Vorlesung angegeben mit einem gemeinsamen Termina- tionssymbol f¨ur alle Strings sowie mit Listen f¨ur die Markierungen in den Bl¨attern

Der Suffixbaum liege dabei wie in der Vorlesung angegeben mit einem gemeinsamen Terminationssymbol f¨ur alle Strings sowie mit Listen f¨ur die Markierun- gen in den Bl¨attern vor..