• Keine Ergebnisse gefunden

” Algorithmen der Bioinformatik I“

N/A
N/A
Protected

Academic year: 2022

Aktie "” Algorithmen der Bioinformatik I“"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Sommersemester 2005 Abgabe am 6.5.2005 Prof. Dr. Stefan Posch, Dipl.-Inf. Birgit M¨oller

4. ¨ Ubung

” Algorithmen der Bioinformatik I“

1. Wir betrachten das Good Suffix Preprocessing im Boyer-Moore-Algorithmus.

i) Beweisen Sie, dassNj(P) =Zn

j+1(Pr)gilt.

ii) Beweisen Sie, dass der Algorithmus zur Berechnung derL0(i)aus denNj(P)korrekt arbeitet.

2. Implementieren Sie den Boyer-Moore-Algorithmus mit einfacher Bad Character Rule und dem Strong Good Suffix Preprocessing. Verwenden Sie dabei den in der Vorlesung vorgestellten Algorithmus zur Berechnung derl0(i)in linearer Laufzeit.

3. Im Folgenden sollen die Laufzeiten vom naiven Algorithmus mit Bad Character Rule und dem Boyer- Moore-Algorithmus in Abh¨angigkeit von Alphabetgr¨oße und Musterl¨ange untersucht werden.

Zur Analyse der Laufzeiten soll jeweils die Anzahl durchgef¨uhrter Vergleiche herangezogen werden.

Inkrementieren Sie dazu einen Z¨ahler vor oder nach jedem erfolgten Zeichenvergleich. Der Grund f¨ur diese (und keine m¨oglicherweise effizientere) Z¨ahlung ist, dass wir nun die Operation Zeichenver- gleich und Z¨ahlerinkrementierung als eine komplexere Vergleichsoperation betrachten k¨onnen und somit die Laufzeiten f¨ur die verschiedenen Algorithmen in gleichem Maße beeinflusst werden. Des weiteren soll die durchschnittliche L¨ange durchgef¨uhrter Shifts unter Anwendung der einzelnen Re- geln ermittelt werden.

Auf der Internetseite zur Vorlesung finden sich Texte ¨uber einem Alphabet von 40 bzw. 80 Zeichen.

Suchen Sie in diesen Texten jeweils nach Mustern der L¨angen 10, 20, 50, 100, 200, 500, 1000, 2000 und 5000. Erstellen Sie anschließend f¨ur beide Alphabetgr¨oßen Diagramme, die die ben¨otigte Anzahl an Vergleichen pro Musterl¨ange sowie die durchschnittliche L¨ange von Shifts jeweils f¨ur beide Re- geln (bad character und good suffix) zeigen, in Abh¨angigkeit der Musterl¨ange. Was l¨asst sich daraus ersehen?

Referenzen

ÄHNLICHE DOKUMENTE

• Beachten Sie, dass die einzelnen Teilaufgaben innerhalb einer Aufgabe weit- gehend unabh¨angig voneinander gel¨ost werden k¨onnen. • Notieren Sie alle Zwischenresultate

Eine reelle symmetrische Matrix ist positiv definit, genau dann, wenn alle ihre Eigenwerte positiv sind, und positiv semidefinit, wenn alle Eigenwerte gr¨ oßer gleich Null

An die Quellensektion schließen zwei direkt aneinander gekoppelte RFQ-(Radio-Frequency-Quadrupole)-Resonatoren mit einer Gesamtl¨ange von 6 m an, die die Ionen auf 0.5

Gegen¨ uberstellung der Phasen¨ uberg¨ ange eines Ferromagneten und einer Fl¨ ussigkeit.

Landau-Notation kann schlecht vorhersagen oder verleichen Analytische Kombinatorik kann. Bessere Modelle bereitstellen Irrelevante

Eine Priority Queue (dt.: Vorrangwarteschlange) ist eine Da- tenstruktur, die eine Menge von Elementen darstellt, wobei jedes Element einen Schl¨ ussel besitzt.. Die

Die Gesamtklausur ist mit 32 von 80 Punkten bestanden, wenn in jedem der beiden Teile der Klausur mindestens 10 von 40 Punkten erreicht werden!. Dieser Teil der Klausur umfasst

Zeigen Sie, dass das Problem in den drei Koordinaten separiert werden kann, und bestimmen Sie die Form der drei Eigenfunk- tionsanteile. Welche zwei Bedingungen, abgesehen von