• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik I ¨ Sommersemester 2007

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik I ¨ Sommersemester 2007"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik I ¨ Sommersemester 2007

Prof. Dr. Stefan Posch, Dipl. Bioinform. Jan Grau Institut f¨ur Informatik Universit¨at Halle

Blatt 12

Aufgabe 12.1 Gegeben sei die Levensthein-Distanz als Kostenfunktion. Ein globales Alignment zweier Strings werde mit der Technik des dynamischen Programmierens bestimmt. Zeigen Sie, dass f¨ur die Eintr¨age Di,j der dabei generierten Matrix gilt

|Di,j −Di,j−1| ≤1 fur i¨ ≥0, j ≥1

|Di,j −Di−1,j| ≤1 fur i¨ ≥1, j ≥0

Di,j −Di−1,j−1 ≥0 fur i¨ ≥1, j ≥1

(3 Punkte)

Aufgabe 12.2 Wir betrachten lokale Alignments. Statt der ¨Ahnlichkeit verwenden wir eine Kostenfunktion der folgenden Form:

δ(a, b) =

( 0, a=b

>0, sonst

Stellen Sie eine Hypothese ¨uber die so erhaltenen optimalen lokalen Alignments auf und begr¨unden Sie deren Korrektheit. (2 Punkte)

Aufgabe 12.3 Unter einem approximativen Pair eines Strings S verstehen wir ein Alignment zweier Teilstrings S1 = S[i1...j1] und S[i2..j2], wobei ausgeschlossen sei, dass ein Zeichen (an der selben Position) mit sich selbst aligniert wird.

Beispiel: F¨ur S =xaxb mit S1 =xax und S2 =xb kann man die Alignments

x a x −

− − x b und x a x x b −

angeben, wobei das erste Alignment kein approximatives Pair darstellt, da S(3) mit sich selbst aligniert wird, wohingegen das zweite Alignments ein approximatives Pair ist.

Ein optimales approximatives Pair ist ein approximatives Pair mit maximaler ¨Ahnlich- keit f¨ur das Alignment.

Entwickeln Sie einen Algorithmus, der zu String S ein optimales approximatives Pair bestimmt. Hinweis: Nutzen Sie die DP-Matrix f¨ur das lokale Alignment. Die Haupt- diagonale (alle Knoten (i, j) mit i = j) spielt dabei eine wichtige Rolle. (3 Punkte)

Abgabe: 28.06.2007

(2)

Aufgabe 12.4 Gegeben sei die Levensthein-Distanz als Kostenfunktion. Im Alignment-Graphen bezeichnen wir die Menge der Knoten (i, j) mit |i−j| ≤ k als Schlauch der Breite k um die Hauptdiagonale (alle Knoten (i, j) mit i=j).

Zeigen Sie:

(a) F¨ur StringsS1, S2 mit |S1|=|S2|und einer Distanz D(S1, S2)≤2k verbleibt der Pfad des optimalen Alignments im Schlauch der Breitekum die Hauptdiagonale.

(2 Punkte)

(b) F¨ur Strings S1, S2 mit einer Distanz D(S1, S2) ≤ k verbleibt der Pfad des opti- malen Alignments im Schlauch der Breitek um die Hauptdiagonale. (2 Punkte) (c) Zusatzaufgabe: Formulieren Sie eine sch¨arfere Absch¨atzung, die die Knoten ober- halb und unterhalb der Hauptdiagonalen getrennt betrachtet. (2 Zusatzpunkte)

Abgabe per E-Mail an grau@informatik.uni-halle.de oder in Raum 4.12.

Abgabe: 28.06.2007

Referenzen

ÄHNLICHE DOKUMENTE

(2 Punkte) Aufgabe 2.3 Implementieren Sie eine Funktion, die f¨ ur einen gegebenen String die Gr¨ oße der Z-Boxen an allen Positionen berechnet (Z-Algorithmus). Schreiben Sie dann

(ii) Beweisen Sie, dass in jeder Phase i + 1 des Ukkonen-Algorithmus alle Anwen- dungen von Regel I am Anfang durchgef¨ uhrt werden und dies so oft der Fall ist, wie es Bl¨ atter

Der Suffixbaum liege dabei wie in der Vorlesung angegeben mit einem gemeinsamen Terminationssymbol f¨ ur alle Strings sowie mit Li- sten f¨ ur die Markierungen in den Bl¨ attern

Aufgabe 9.1 Suffixarrays k¨ onnen anstelle von Suffixb¨ aumen zur Suche eines Mu- sters P in einem Text T genutzt werden. In der Vorlesung wurde ein Algorithmus vorgestellt, mit dem

“KITSCH”, die jeweils mindestens ein match, ein insert oder delete und ein replace enthalten. Mar- kieren Sie in diesem Edit-Graphen die Pfade, die den Alignments aus Aufgabe

(c) (4 Punkte) Implementieren Sie den naiven Algorithmus zur exakten Mustersuche und wenden Sie ihn auf die Sequenzen in der Datei an, um alle Vorkommen des Musters ”atg” in

(b) F¨ uhren Sie zwei unterschiedliche Modellierungen durch, indem Sie zwei verschie- dene (kontinuierliche) Verteilungen aus der Vorlesung f¨ ur die Daten annehmen?. Sch¨ atzen Sie

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester