• Keine Ergebnisse gefunden

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

Prof. Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 10

Aufgabe 10.1 (2 Punkte)

Leiten Sie den modifizierten EM-Algorithmus f¨ur Sequenzmotive unter Nutzung der φ Parametrisierung her.

Aufgabe 10.2 (2 Punkte)

Leiten Sie den Gibbs Sampling Algorithmus f¨ur ein PWM Mischmodell, ein WAM Mischmodell und ein Mischmodell aus PWMs und WAMs her.

Aufgabe 10.3 (2 Punkte)

Leiten Sie den Collapsed Gibbs Sampling Algorithmus f¨ur ein PWM Mischmodell, ein WAM Mischmodell und ein Mischmodell aus PWMs und WAMs her.

Aufgabe 10.4 (4 Punkte)

Auf der Seite zur Vorlesung finden Sie einen Datensatz (mix.txt) mit k¨unstlich er- zeugten Sequenzen der L¨ange L= 7. Ein Teil dieser Sequenzen wurde von einer PWM und ein anderer Teil der Sequenzen von einer WAM gezogen. F¨ur beide Modelle wurde eine equivalent sample sizevon = 32 genutzt.

(a) Lernen Sie ein Mischmodell aus einer PWM und einer WAM in der θ- Parametrisierung mit dem modifiziertem EM-Algorithmus. Berechnen Sie dann f¨ur jede Sequenzi die Werteγi,k mitk = 1,2. Ordnen Sie nun jede Sequenzider Komponente k (PWM oder WAM) mit dem maximalenγi,k zu.

(b) Starten Sie den Gibbs Sampling Algorithmus f¨ur ein Mischmodell aus einer PWM und einer WAM. Bestimmen Sie f¨ur jede Sequenzi, wie oft sie (im Zuge des Gibbs Samplings) der Klasse k = 1 (PWM) oder der Klasse k = 2 (WAM) zugeordnet wurde und w¨ahlen Sie die Klasse k mit der gr¨oßeren Anzahl von Zuordnungen.

(c) Auf der Seite zur Vorlesung finden Sie außerdem einen Datensatz (mix_classes.txt), der f¨ur jede der Sequenzen i die realen, bei der Generie- rung genutzten, Klassenzuordnungen enth¨alt. Verwenden Sie diesen Datensatz, um Ihre Ergebnisse aus Aufgabe a) und b) zu ¨uberpr¨ufen. Welches der beiden Verfahren hat die Zuordnung besser rekonstruiert?

Referenzen

ÄHNLICHE DOKUMENTE

(b) F¨ uhren Sie zwei unterschiedliche Modellierungen durch, indem Sie zwei verschie- dene (kontinuierliche) Verteilungen aus der Vorlesung f¨ ur die Daten annehmen?. Sch¨ atzen Sie

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester

Teilen Sie beide Datens¨ atze jeweils in zwei H¨ alften, so dass Sie zwei TFBS-Datens¨ atze F 1 und F 2 und zwei Hintergrunddatens¨ atze B 1 und B 2 erhalten.. F¨ ur diese Datens¨

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Er sagt Ihnen ausserdem, dass er geh¨ ort hat, dass zur L¨ osung

Welche der Aufgaben haben Ihnen zur Vertiefung und zum Verst¨ andnis des Vorlesungsstoffs besonders geholfen?. Welche Aufgaben fanden Sie weniger hilfreich oder g¨ anzlich

(b) Zeigen Sie, dass sich der ML-Sch¨ atzer der verbleibenden Mittelwerte, Varian- zen und Kovarianzen nicht ¨ andert, wenn einige der Mittelwerte, Varianzen oder Kovarianzen

Leiten Sie die beiden in der Vorlesung behandelten Vereinfachungen des Modifizierten EM-Algorithmus mit allen Zwischenschritten her.

π und q zu sch¨ atzen) des M-Schrittes des Modifizierten EM-Algorithmus f¨ ur Mischun- gen aus homogenen und inhomogenen Markov Modellen nullter und erster Ordnung her?. Verwenden