• Keine Ergebnisse gefunden

5. ¨Ubung ”Algorithmen der Bioinformatik I“

N/A
N/A
Protected

Academic year: 2022

Aktie "5. ¨Ubung ”Algorithmen der Bioinformatik I“"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Sommersemester 2006 Abgabe am 12. Mai 2006 Prof. Dr. Stefan Posch, Dipl.-Bioinform. Andr´e Gohr, Dipl.-Bioinform. Jan Grau

5. ¨ Ubung

Algorithmen der Bioinformatik I“

1. Gegeben sei ein StringS, in dem das Abschlußzeichen $ nicht vorkommt.

a) Warum wird der String S mit einem Abschlußzeichen versehen, wenn der zugeh¨orige Suffixbaum aufgebaut wird? (1 Punkt)

b) Zeigen Sie, dass f¨ur den SuffixbaumST(S$)gilt: Anzahl der inneren Knoten

≤ |S$|. (2 Punkte)

c) Zeigen Sie, dass f¨ur den SuffixbaumST(S$)gilt: Anzahl der Kanten≤2|S$|−

1. (2 Punkte)

2. Programmieraufgaben:

a) Implementieren Sie den Write Only Top Down Algorithmus zur Konstruktion eines Suffixbaums zu einem gegebenen TextT. Die Baumstruktur und der In- halt des Baums sollen mit einer Funktion ausgegeben werden k¨onnen. Diese Funktion ist nach jedem Iterationsschritt des Write Only Top Down Algorith- mus aufzurufen. (5 Punkte)

b) Implementieren Sie eine Funktion, die ein gegebenes MusterP in einem ge- gebenem Suffixbaum ST(T$)eines Textes T sucht. Geben Sie die Anfangs- indizes aller Vorkommen vonP inT aus. (2 Punkte)

Abgabe des Programms per E-Mail an{gohr|grau}@ informatik.uni-halle.de.

Referenzen

ÄHNLICHE DOKUMENTE

Ziel dieses ¨ Ubungsblattes soll es sein, eine funktionst¨uchtige Programmierumgebung zur Verf¨ugung zu haben, die als Ausgangspunkt zur L¨osung der Programmieraufgaben auf sp¨ateren

F¨ur diesen langen String wird der Suffixbaum aufgebaut, der dann noch leicht nachbearbeitet werden muss.. Alternativ kann man die Strings auch sequentiell mit dem

Dabei soll sowohl die minimale Edit-Distanz (welche Parameter hat die Kostenfunktion hier?) als auch ein zugeh¨origes optimales Alignment der beiden Strings ausgegeben

Ziel dieses ¨ Ubungsblattes soll es sein, eine funktionst¨uchtige Programmierumgebung zur Verf¨ugung zu haben, die als Ausgangspunkt zur L¨osung der Programmieraufgaben auf sp¨ateren

Hinweis: F¨ur jeden inneren Knoten v des Suffixbaums von S sollen maximal soviele Listen erzeugt werden, wie es Buchstaben im Alphabet gibt. Die Liste im Knoten v, die zum Buchstaben

Stefan Posch, Dipl.-Bioinform. Andr´e Gohr, Dipl.-Bioinform. Suffixarrays k¨onnen anstelle von Suffixb¨aumen zur Suche eines Musters P in einem Text T genutzt werden. In der

Die Kostenmatrix D(i, j) aus dem Algorithmus zum Finden optimaler globaler Align- ments von zwei Strings enth¨alt auch ohne zus¨atzlich abzuspeichernde Links zu den mi-

b) (Zusatzaufgabe) Welche Folgen h¨atte es, wenn man statt der maximalen ¨ Ahnlichkeit minimale Kosten f¨ur das optimale approximative maximale Pair verlangen w¨urde3.