• Keine Ergebnisse gefunden

9. ¨Ubung zur Vorlesung “Einf¨uhrung in die Bioinformatik I, 1. Teil”

N/A
N/A
Protected

Academic year: 2022

Aktie "9. ¨Ubung zur Vorlesung “Einf¨uhrung in die Bioinformatik I, 1. Teil”"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

9. ¨ Ubung zur Vorlesung

“Einf¨ uhrung in die Bioinformatik I, 1. Teil”

Wintersemester 2018/2019

Prof. Sebastian B¨ ocker, Emanuel Barth, Maximilian Collatz, Marcus Ludwig Ausgabe: 19. Dezember 2018,

Abgabe: 09. Januar 2019 zu Beginn der ¨ Ubung

Suffixb¨ aume

Aufgabe 1 (5 Punkte):

1. Bestimmen Sie f¨ur den String abrakadabra und abaababab den jeweiligen kompri- mierten Suffixbaum. Ist der komprimierte Suffixbaum nicht eindeutig, geben Sie bitte alle an.

Hinweis:Es ist ausreichend, eine alternative Beschriftung in anderer Farbe anzubrin- gen oder separat alternative Beschriftungen zu kennzeichnen.

2. Bestimmen Sie f¨ur die StringsAGTT,TACundGTAGden komprimierten generalisierten1 Suffixbaum.

Aufgabe 2 (5 Punkte): Wie kann man mit Hilfe eines Suffixbaumes in einem Text der L¨ange nden l¨angsten Teilstring finden, der in diesem Text auch r¨uckw¨arts vorkommt? In welcher asymptotischen Laufzeit ist dies m¨oglich?

Aufgabe 3 (5 Punkte): Geben Sie einen m¨oglichst schnellen Algorithmus an, der mit Hilfe ei- nes Suffixbaumes f¨ur zwei StringsS1,S2alle gemeinsamen Teilstrings berechnet, die l¨anger als eine gegebene L¨ange l sind. Begr¨unden Sie Korrektheit und Laufzeit des Algorithmus.

Aufgabe 4 (5 Punkte): Geben Sie einen Algorithmus an, der f¨urk StringsS1, S2, . . . Sk (Ge- samtl¨ange n) und alle q ∈ {1,2, . . . k} in O(kn) Zeit die L¨ange des l¨angsten Teilstrings berechnet, der in mindestens q der eingegebenen Strings vorkommt. Begr¨unden Sie Kor- rektheit und Laufzeit Ihres Algorithmus.

Bonusaufgabe (4 Punkte): Beweisen Sie mit Hilfe der Definition von Θ, dass max{f(n), g(n)}= Θ(f(n) +g(n)), mit f(n)≥0 und g(n)≥0.

1Der generalisierte Suffixbaum f¨ur k Strings S1, . . . , Sk ist der Suffixbaum f¨ur S1$1S2$2. . . Sk$k, wobei

$1,$2, . . . ,$k paarweise verschiedene Zeichen sind, die nicht im verwendeten Alphabet vorkommen.

1

Referenzen

ÄHNLICHE DOKUMENTE

ˆ W¨ ochentlich wird ein Aufgabenzettel online gestellt, dessen L¨ osung zu Beginn der n¨ achsten Ubung abgegeben werden muss ¨.. ˆ L¨ osungen werden in der ¨

Denken Sie sich je einen Text der L¨ ange zehn und ein Pattern der L¨ ange vier aus, sodass das Pattern genau einmal im Text vorkommt und der naive Textsuche-Algo- rithmus (a)

Aufgabe 1 (3 Punkte): Berechnen Sie f¨ ur die beiden Sequenzen GACAGGT und GAAGT die Ma- trix D und alle optimalen globalen Alignments

Aufgabe 1 (3 Punkte): Berechnen Sie f¨ ur die beiden Sequenzen GACAGGT und GAAGT die Ma- trix D und alle optimalen globalen Alignments

Beachten Sie, dass auch hier die B¨ aume nicht notwendig bin¨ ar (voll aufgel¨ ost) sein m¨ ussen?. Was f¨ allt Ihnen im Vergleich zur Aufgabe 2 (auch

Aufgabe 1 (5 Punkte): Verwenden Sie den Fitch-Algorithmus, um eine maximal sparsame Benennung der inneren Knoten des unten gegebenen Baumes

Denken Sie sich je einen Text der L¨ ange zehn und ein Pattern der L¨ ange vier aus, sodass das Pattern genau einmal im Text vorkommt und der naive Textsuche-Al- gorithmus (a)

Aufgabe 3 (5 Punkte): Finden Sie eine allgemeine Methode, um mit Hilfe der DP-Matrix alle optimalen Alignments zweier Strings zu bestimmen. Aufgabe 4 (5 Punkte): Geben Sie