Sommersemester 2004 Abgabe am 12.5.2004 Prof. Dr. Stefan Posch, Dipl.-Inf. B. M¨oller, Dr. J. Wensch
5. ¨ Ubung
” Algorithmen der Bioinformatik I“
1. Skizzieren Sie die Konstruktion der impliziten Suffixb¨aume f¨ur den String AGGTAGG ¨uber den li- nearen Ukkonen-Algorithmus. Vergessen Sie nicht, die Verwendung der Suffixlinks mit einzubezie- hen.
2. (i) Zeigen Sie, dass wenn in Phasei+1des Ukkonen-Algorithmus in einer Erweiterungjdie Regel III zutrifft, dann trifft Regel III auch f¨ur den Rest der Phasei+ 1zu.
Was bedeutet das f¨ur die Implementierung?
(ii) Beweisen Sie, dass in jeder Phasei+1des Ukkonen-Algorithmus alle Anwendungen von Regel I am Anfang durchgef¨uhrt werden und dies so oft der Fall ist, wie es Bl¨atter im Baum zu Beginn der Phasei+ 1gab.
3. Seit ∈ Σ∗ als Text ¨uber einem beliebigen Alphabet Σgegeben, und sei ferner eine beliebige Zahl k ∈Ngegeben. Entwerfen Sie unter Verwendung von Suffixb¨aumen einen Algorithmus mit linearer Laufzeit, der das k¨urzeste Teilwort vontfindet, das genauk-mal intauftritt.
4. Konstruieren Sie f¨ur jedesn ∈ Neine Zeichenreihe t ∈ {a, b}n, d.h. geben Sie eine Konstruktions- vorschrift an, so dass die Summe der L¨angen der Kantenmarkierungen als Zeichenreihen ausΣ+des zutgeh¨origen Suffix-Baumes mindestensO(n2)ist.