• Keine Ergebnisse gefunden

4. ¨Ubung ”Algorithmen der Bioinformatik I“

N/A
N/A
Protected

Academic year: 2022

Aktie "4. ¨Ubung ”Algorithmen der Bioinformatik I“"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Sommersemester 2006 Abgabe am 05. Mai 2006 Prof. Dr. Stefan Posch, Dipl.-Bioinform. Andr´e Gohr, Dipl.-Bioinform. Jan Grau

4. ¨ Ubung

Algorithmen der Bioinformatik I“

1. Implementieren Sie den Boyer-Moore-Algorithmus mit einfacher Bad Character Ruleund dem Strong Good Suffix Preprocessing. Verwenden Sie dabei den in der Vorlesung vorgestellten Algorithmus zur Berechnung derl0(i)in linearer Laufzeit.

(5 Punkte)

2. Im Folgenden sollen die Laufzeiten des naiven Algorithmus ( ¨Ubung 1), des Z- Algorithmus ( ¨Ubung 2), des naiven Algorithmus mit bad character rule ( ¨Ubung 3) und des Boyer-Moore-Algorithmus aus dieser ¨Ubung in Abh¨angigkeit von Al- phabetgr¨oße und Musterl¨ange untersucht werden.

Zur Analyse der Laufzeiten soll jeweils die Anzahl durchgef¨uhrter Vergleiche her- angezogen werden. Inkrementieren Sie dazu einen Z¨ahler vor oder nachjedemer- folgten Zeichenvergleich. Der Grund f¨ur diese (und keine m¨oglicherweise effizi- entere) Z¨ahlung ist, dass wir nun die OperationZeichenvergleich und Z¨ahlerinkre- mentierungals eine komplexere Vergleichsoperation betrachten k¨onnen und somit die Laufzeiten f¨ur die verschiedenen Algorithmen in gleichem Maße beeinflusst werden. Außerdem soll die Laufzeit (Realtime oder Usertime, je nach M¨oglichkeit) gemessen werden.

Auf der Internetseite zur Vorlesung finden sich Texte ¨uber einem Alphabet von 40 bzw. 80 Zeichen. Suchen Sie in diesen beiden Texten jeweils nach Mustern der L¨angen 10, 20, 50, 100, 200, 500, 1000, 2000 und 5000. Erstellen Sie anschließend f¨ur beide Alphabetgr¨oßen Diagramme, die die ben¨otigte Anzahl an Vergleichen pro Musterl¨ange zeigen, und Diagramme, die die Laufzeit pro Musterl¨ange zeigen, je- weils in Abh¨angigkeit der Musterl¨ange. Was l¨asst sich daraus ersehen? Welcher Algorithmus braucht f¨ur jede Musterl¨ange am wenigsten Vergleiche? Welcher Al- gorithmus braucht real am wenigsten Zeit? (5 Punkte)

Abgabe des Programms per E-Mail an{gohr|grau}@ informatik.uni-halle.de.

Referenzen

ÄHNLICHE DOKUMENTE

Geben Sie einen effizienten Algorithmus an, der alle optimalen globalen Alignments der beiden Strings ausgibt, dabei nicht auf eventuell zus¨atzlich gespeicherte Links zur¨uckgreift

Erweitern Sie Ihre Implementierung des naiven Exact-Matching Algorithmus aus der ersten ¨ Ubung um die bad character rule kombiniert mit Rechts-Links-Vergleichen. Uberpr¨ufen Sie

Tragen Sie die bei der Konstruktion des Suffixbaumes angewandten Regeln (I, IIa, IIb oder III) in eine Tabelle ein, wobei die Zeilen den Pha- sen i + 1 = 1, 2,.. Tragen Sie dabei

Die Kostenmatrix D(i, j) aus dem Algorithmus zum Finden optimaler globaler Align- ments von zwei Strings enth¨alt auch ohne zus¨atzlich abzuspeichernde Links zu den mi-

b) (Zusatzaufgabe) Welche Folgen h¨atte es, wenn man statt der maximalen ¨ Ahnlichkeit minimale Kosten f¨ur das optimale approximative maximale Pair verlangen w¨urde3.

Alternativ h¨atten wir (ebenfalls nach Satz 11.21) zeigen k¨onnen, daß s¨amtliche Eigenwerte von A positiv sind.. Dabei sind die Diagonalelemente von D die Eigenwerte von A und

Ziel dieses ¨ Ubungsblattes soll es sein, eine funktionst¨uchtige Programmierumgebung zur Verf¨ugung zu haben, die als Ausgangspunkt zur L¨osung der Programmieraufgaben auf sp¨ateren

Bestimmen welche der oben gegebenen Folgen mittels linearer Kongruenz- generatoren konstruiert ist.. Ferner Finden Sie die in der Vorlesung eingef¨uhrten Parameter a