• Keine Ergebnisse gefunden

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Sequenzanalyse II ¨ Wintersemester 2007/08

Prof. Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 7

Aufgabe 7.1 (3 Punkte)

Wir betrachten Tern¨arsequenzen der L¨ange N ¨uber dem Alphabet {A, B, C} und die dazugeh¨origen Likelihoodfunktionen eines homogenen Markovmodells nullter Ordnung.

Wie lautet f¨ur eine gegebene Tern¨arsequenz mit k1 As, k2 Bs und N −k1 −k2 Cs die Likelihood als Funktion von θ1 = P(A) und θ2 = P(B). Betrachten Sie nun die Parametertransformationf :θ →φmit φa= ln(θa3) f¨ura∈ {1,2}undθ3 = 1−θ1− θ2. Ist f invertierbar? Wie lautet die inverse Parametertransformation f−1 : φ → θ?

Wie lauten der Definitions- bzw. Wertebereich von f? Wie lauten die Likelihood und Loglikelihood als Funktion von φ? Plotten Sie die Loglikelihood f¨ur k1 = 3, k2 = 6, N = 10 als Funktion von θ1 und θ2 sowie als Funktion von φ1 und φ2. Leiten Sie den Maximum-Likelihood-Sch¨atzer f¨ur φ her und tragen Sie den Sch¨atzwert in die entsprechenden Plots ein. Wie groß ist die maximale Likelihood? Vergleichen Sie die Sch¨atzwerte als auch die maximale Likelihood mit den entsprechenden Werten f¨ur θ.

Aufgabe 7.2 (2 Punkte)

Wiederholen Sie Aufgabe 7.1, mit Ausnahme der Plots und der Berechnung der maxi- malen Likelihoodwerte, f¨ur Sequenzen der L¨ange N ¨uber einem Alphabet mit A > 3 Symbolen.

Aufgabe 7.3 (5 Punkte)

Analog zu Aufgabe 6.2 betrachten wir wieder Bin¨arsequenzen der L¨ange N = 2 ¨uber dem Alphabet {Z, W} und ein durch θ = P(Z) parametrisiertes homogenes Markov- modell nullter Ordnung. Gegeben sei die A-Priori-Dichte P1(θ) = 1. Plotten Sie die A-Priori-Dichte sowie f¨ur jede der vier Bin¨arsequenzen (ZZ, ZW, W Z, W W) die A-Posteriori-Dichte als Funktionen vonθ. Betrachten Sie nun die f¨unf Parametertrans- formationen

(a) φ=θ2, (b) φ=√

θ,

(c) φ= lnθ, (d) φ= ln(−lnθ), (e) φ= ln1−θθ ,

(2)

und berechnen und plotten Sie f¨ur jede der f¨unf Parametrisierungen die A-Priori-Dichte sowie f¨ur jede der vier Bin¨arsequenzen (ZZ, ZW,W Z,W W) die A-Posteriori-Dichte als Funktion von φ. Geben Sie in allen f¨unf F¨allen den Definitionsbereich der Dichten, also den Wertebereich von φ, an. Leiten Sie die f¨unf Maximum-A-Posteriori-Sch¨atzer f¨urφ her und tragen Sie jeden der sechs Sch¨atzwerte in jeden der sechs Plots ein. Wie groß sind die (vier mal sechs mal sechs) Maximalwerte der A-Posteriori-Dichten? Sind sie identisch? Falls nicht, welche Parametrisierung w¨urden Sie empfehlen? W¨are Ihre Empfehlung dieselbe f¨ur jeden der vier Datens¨atze (ZZ, ZW, W Z,W W)?

Abgabetermin: 19. Dezember

Referenzen

ÄHNLICHE DOKUMENTE

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Er sagt Ihnen ausserdem, dass er geh¨ ort hat, dass zur L¨ osung

Welche der Aufgaben haben Ihnen zur Vertiefung und zum Verst¨ andnis des Vorlesungsstoffs besonders geholfen?. Welche Aufgaben fanden Sie weniger hilfreich oder g¨ anzlich

(b) F¨ uhren Sie zwei unterschiedliche Modellierungen durch, indem Sie zwei verschie- dene (kontinuierliche) Verteilungen aus der Vorlesung f¨ ur die Daten annehmen?. Sch¨ atzen Sie

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester

Teilen Sie beide Datens¨ atze jeweils in zwei H¨ alften, so dass Sie zwei TFBS-Datens¨ atze F 1 und F 2 und zwei Hintergrunddatens¨ atze B 1 und B 2 erhalten.. F¨ ur diese Datens¨

(b) Zeigen Sie, dass sich der ML-Sch¨ atzer der verbleibenden Mittelwerte, Varian- zen und Kovarianzen nicht ¨ andert, wenn einige der Mittelwerte, Varianzen oder Kovarianzen

Leiten Sie die beiden in der Vorlesung behandelten Vereinfachungen des Modifizierten EM-Algorithmus mit allen Zwischenschritten her.

π und q zu sch¨ atzen) des M-Schrittes des Modifizierten EM-Algorithmus f¨ ur Mischun- gen aus homogenen und inhomogenen Markov Modellen nullter und erster Ordnung her?. Verwenden