• Keine Ergebnisse gefunden

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

Prof. Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 2

Aufgabe 2.1 (10 Punkte)

Der Datensatz coin enth¨alt 100 Bin¨arsequenzen der L¨ange L = 10, die durch ein Mischmodell zweier homogener Markov Modelle nullter Ordnung generiert wurden.

Hierbei stehenZ f¨ur Zahl und W f¨ur Wappen. Die beiden Klassenwahrscheinlichkeiten π1 = π2 = 0.5 sind extern vorgegeben. Die einzigen zu sch¨atzenden Parameter dieses Modells sind die Wahrscheinlichkeiten q1 und q2 der beiden M¨unzen 1 und 2, Zahl zu werfen. Die A-Priori-Dichte von q1 und q2 ist ein Produkt zweier Beta-Dichten, P(q1) und P(q2), mit Hyperparametern

(a) (1,1) und (1,1), (b) (1,1) und (10,10), (c) (10,10) und (1,1), (d) (10,10) und (10,10), (e) (1,10) und (1,10),

(f) (1,10) und (10,1), (g) (10,1) und (1,10), (h) (10,1) und (10,1).

L¨osen Sie die folgenden Teilaufgaben (außer 2.1 (k)) f¨ur jede der acht A-Priori-Dichten.

(a) Formulieren Sie die A-Priori-Annahme verbal.

(b) Plotten Sie den Logarithmus der A-Priori-Dichte als Funktion vonq1 und q2. (c) Vergleichen Sie die acht Plots, und diskutieren Sie die Unterschiede. Formulieren

Sie Ihre Vermutungen, in welche Richtung die verschiedenen A-Priori-Dichten die MAP-Sch¨atzung der Parameter q1 und q2 beeinflussen werden.

(d) Sch¨atzen Sie die Parameter q1 und q1 mittels MAP-Prinzip unter Nutzung der gegebenen Klassenzugeh¨origkeiten.

(e) Vergleichen Sie die acht verschiedenen Sch¨atzwerte, und vergleichen Sie das Er- gebnis mit Ihren Vermutungen.

(2)

(f) Ignorieren Sie f¨ur die folgenden Teilaufgaben die Klassenzugeh¨origkeiten, d. h.

betrachten Sie die Klassenzugeh¨origkeiten aus coinim folgenden als nicht gege- ben. Plotten Sie den Logarithmus der A-Posteriori-Dichte als Funktion von q1 und q2.

(g) Vergleichen Sie die acht Plots, und diskutieren Sie die Unterschiede.

(h) Bestimmen Sie die Maxima und Maximalstellen dieser Funktion mit geringem Aufwand durch ein Verfahren Ihrer Wahl (gitterbasierte Abrasterung, Maxi- mumssuche per Auge, Gradientenanstieg, etc.).

(i) Vergleichen Sie die acht verschiedenen Sch¨atzwerte, und vergleichen Sie das Er- gebnis mit Ihren Vermutungen.

(j) Vergleichen Sie die Maximalstellen mit den in Aufgabe 2.1 (d) gesch¨atzten Wer- ten, und diskutieren Sie die Unterschiede.

(k) Versuchen Sie, die Maximalstellen analytisch zu bestimmen, indem Sie die A- Posteriori-Dichte (oder deren Logarithmus) nach q1 und q2 ableiten und beide Ableitungen Null setzen. Worin liegt das Problem, dieses Gleichungssystem (mit lediglich zwei Gleichungen und zwei Unbekannten) analytisch zu l¨osen?

Abgabetermin: 7. November

Referenzen

ÄHNLICHE DOKUMENTE

(b) Zeigen Sie, dass sich der ML-Sch¨ atzer der verbleibenden Mittelwerte, Varian- zen und Kovarianzen nicht ¨ andert, wenn einige der Mittelwerte, Varianzen oder Kovarianzen

Leiten Sie die beiden in der Vorlesung behandelten Vereinfachungen des Modifizierten EM-Algorithmus mit allen Zwischenschritten her.

π und q zu sch¨ atzen) des M-Schrittes des Modifizierten EM-Algorithmus f¨ ur Mischun- gen aus homogenen und inhomogenen Markov Modellen nullter und erster Ordnung her?. Verwenden

Plotten Sie die ROC Kurven f¨ ur die beiden Modellkombinationen (PWM-Mischmodell f¨ ur Donor und PWM-Mischmodell f¨ ur Nicht-Donor, WAM-Mischmodell f¨ ur Donor und WAM-Mischmodell f¨

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Er sagt Ihnen ausserdem, dass er geh¨ ort hat, dass zur L¨ osung

Welche der Aufgaben haben Ihnen zur Vertiefung und zum Verst¨ andnis des Vorlesungsstoffs besonders geholfen?. Welche Aufgaben fanden Sie weniger hilfreich oder g¨ anzlich

(b) F¨ uhren Sie zwei unterschiedliche Modellierungen durch, indem Sie zwei verschie- dene (kontinuierliche) Verteilungen aus der Vorlesung f¨ ur die Daten annehmen?. Sch¨ atzen Sie

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester