• Keine Ergebnisse gefunden

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

Prof. Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 9

Aufgabe 9.1 (6 Punkte)

Wir betrachten ein inhomogenes Markovmodell erster Ordnung und nehmen als A- Priori-Dichte der Parameter θ des Links-Rechts-Modells ein Produkt aus Dirichlet- Dichten (wie in der Vorlesung gegeben) mit einerequivalent sample sizeund ansonsten gleichverteilten Hyperparametern an.

(a) Leiten Sie f¨ur L = 3 und A = 2 die A-Priori-Dichte der Parameter φ und den MAP-Sch¨atzer von φ her.

(b) Wie lauten die A-Priori-Dichte und der MAP-Sch¨atzer der Parameter φ des Rechts-Links-Modells? Vergleichen Sie die Dichte und den MAP-Sch¨atzer des Links-Rechts-Modells mit denen des Rechts-Links-Modells. Transformieren Sie hierzu den MAP-Sch¨atzer des Links-Rechts-Modells in den Raum der Parameter des Rechts-Links-Modells und zeigen sie entweder, dass sich die A-Posteriori- Dichte nicht ¨andert, oder, dass zumindest der MAP-Sch¨atzer des Links-Rechts- Modells in den MAP-Sch¨atzer des Rechts-Links-Modells transformiert wird.

(c) Berechnen Sie f¨ur den Datensatz seq_1 den maximalen Wert der A-Posteriori- Dichte f¨urθlinks−rechtsrechts−linkslinks−rechtssowieφrechts−linksund vergleichen Sie die 4 Werte.

Aufgabe 9.2 (4 Punkte)

Leiten Sie den M-Schritt des modifizierten EM-Algorithmus f¨ur ein PWM-Mischmodell sowie ein WAM-Mischmodell in φ Parametrisierung her.

Aufgabe 9.3 (5 Punkte)

Im Folgenden wollen wir die Klassifikationsgenauigkeit derφParametrisierung mit der Klassifikationsgenauigkeit der θ Parametrisierung vergleichen. Als Maß f¨ur die Klassi- fikationsgenauigkeit bietet sich die Fl¨ache unter der ROC-Kurve (AUC) an.

Auf der Seite zur ¨Ubung finden Sie vier Datens¨atze: art1train, art2train, art1test, art2test. Diese Daten wurden jeweils generiert von einem WAM- Mischmodell mit zwei Komponenten. Die Wahrscheinlichkeiten (π1, π2) der Komponen- ten wurden von einer Beta-Dichte mit Hyperparametern (32,32) gezogen. Die Parame- ter beider WAM-Modelle wurden unabh¨angig von (π1, π2) und unabh¨angig voneinander jeweils von einem Produkt aus Dirichlet-Dichten mit Hyperparametern (8,8,8,8) f¨ur

(2)

die Startwahrscheinlichkeiten und (2,2,2,2) f¨ur die ¨Ubergangswahrscheinlichkeiten ge- zogen. Die Datens¨atzeart1trainundart1testsind Trainings- und Testdatensatz f¨ur Klasse 1. Die Datens¨atzeart2train und art2testsind Trainings- und Testdatensatz f¨ur Klasse 2.

(a) Lernen Sie auf den Trainingsdaten die WAM-Mischmodelle in der θ Parametri- sierung, analog zu Aufgabe 5.2, und die WAM-Mischmodelle in der φ Parame- trisierung, jeweils mit K = 2 Komponenten und = 64. Vergleichen Sie die Klassifikationsgenauigkeit der beiden Parametrisierungen auf den Testdatens¨at- zen anhand der AUC.

(b) Lernen Sie auf den Trainingsdaten seq_1, seq_3 aus Aufgabe 5.1 die WAM- Mischmodelle in der φ Parametrisierung mit K = 2 Komponenten und = 64.

Vergleichen Sie die Klassifikationsgenauigkeit auf den Testdatens¨atzen seq_2, seq_4 anhand der AUC mit der aus Aufgabe 5.1.

(c) Variieren Sie nun die equivalent sample size zwischen dem kleinstm¨oglichen Wert und 256, und plotten Sie die AUC-Werte als Funktionen von. Vergleichen Sie die 4 Kurven mit denen aus Aufgabe 5.2.

Aufgabe 9.4 (5 Punkte)

Zusatzaufgabe zu Aufgabe 9.1: Leiten Sie die entsprechende A-Priori-Dichte der Para- meter des Rechts-Links-Modells f¨ur beliebigesLund/oder beliebiges Aher. Wie lautet die A-Posteriori-Dichte der Parameter des Rechts-Links-Modells, und wie lautet der MAP-Sch¨atzer?

Abgabetermin: 16. Januar

Referenzen

ÄHNLICHE DOKUMENTE

Hinten: Die Kinder zeigen, ohne sich umzudrehen mit ausgestreckten Armen nach hinten.. Kreuz und quer: Die Kinder

Lilli steht auf ihrem rechten Fuß und hebt ihre rechte Hand hoch. Emma steht auf ihrem linken Fuß und hebt ihre linke

Copyright: H-Faktor GmbH, Niekao Lernwelten, Dortmund Verantwortlich für den Inhalt: Udo Kiel Autorin: Jana Bredemeier, Zeichnungen: cliparts2go Niekao Lernwelten ® 07/2012 ;

Der grüne Kegel steht zwischen dem roten und dem gelben Kegel, wobei der Gelbe links und der Rote rechts steht.. Der rote Kegel steht links vom grünen Kegel und der gelbe Kegel

Leiten Sie die vier Maximum-Likelihood-Sch¨ atzer f¨ ur φ her und tragen Sie die Sch¨ atzwerte in die entsprechenden Plots ein?. Kommt Ihnen diese Loglikelihoodfunktion

Wiederholen Sie Aufgabe 7.1, mit Ausnahme der Plots und der Berechnung der maxi- malen Likelihoodwerte, f¨ ur Sequenzen der L¨ ange N ¨ uber einem Alphabet mit A > 3

Wir betrachten ein inhomogenes Markovmodell erster Ordnung und nehmen als A- Priori-Dichte der Parameter des Links-Rechts-Modells ein Produkt aus Dirichlet- Dichten (wie in

(c) Auf der Seite zur Vorlesung finden Sie außerdem einen Datensatz (mix_classes.txt), der f¨ ur jede der Sequenzen i die realen, bei der Generie- rung genutzten,