• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07

Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 9

Aufgabe 9.1

(a) Beweisen Sie B(α, β) = Γ(α)Γ(β)/Γ(α+β).

(b) Leiten Sie das Maximum, den Erwartungswert und die Varianz der Betadichte her.

(c) Als a-priori Dichte des Parameters p einer M¨unze nehmen wir eine Betadichte mit Parameter (α, β) an. Nun werfen wir die M¨unze N mal und beobachten k mal Zahl. Bei welchem Wert pliegt das Maximum der a-posteriori Dichte von p, und wie lautet der Erwartungswert vonp bzgl. der a-posteriori Dichte von p?

(d) Beweisen Sie E((ˆθ−θ)2) = V ar(ˆθ) +Bias2(ˆθ).

Aufgabe 9.2 Auf der Internetseite zur Vorlesung finden Sie in der Datei expr.txt einen Datensatz mit Microarray Expressionsdaten f¨ur 50 Gene. Die Daten wurden bereits normiert und logarithmiert, und die daraus resultierenden Werte nennen wir im folgenden kurz Log-Intensit¨aten.

(a) Stellen Sie das Histogramm der log Log-Intensit¨aten grafisch dar. Berechnen Sie die Schiefe und den Exzess des Histogramms und vergleichen Sie diese Werte mit denen, die sie f¨ur eine Gaussverteilung erwarten w¨urden.

Wir wollen im folgenden annehmen, dass die Daten durch Ziehen aus einer Gaussverteilung (mit unbekannten Parametern µund σ2) generiert wurden.

(b) Stellen Sie die Log-Likelihood als Funktion von µ und σ2 grafisch dar. Berech- nen Sie den Maximum Likelihood Sch¨atzer vonµ und σ2 sowie die dazugeh¨orige Log-Likelihood. Ist der Sch¨atzer erwartungstreu? Falls nicht, geben Sie einen er- wartungstreuen Sch¨atzer von µ und σ2 an und berechnen Sie diesen sowie die dazugeh¨orige Log-Likelihood. Vergleichen Sie die vier Sch¨atzwerte sowie die bei- den Log-Likelihood Werte und diskutieren Sie die Unterschiede.

(c) Nun wird Ihnen mitgeteilt, dass auf Grund der angewendeten Normierung µ= 0 ist. D. h. Ihre Aufgabe besteht nun nur noch darin,σ2 zu sch¨atzen. Stellen Sie die Log-Likelihood als Funktion von σ2 grafisch dar. Berechnen Sie den Maximum Likelihood Sch¨atzer von σ2 sowie die dazugeh¨orige Log-Likelihood. Vergleichen Abgabe: 19.12.06

(2)

Sie den Sch¨atzwert als auch den Log-Likelihood Wert mit den entsprechenden Er- gebnissen aus Aufgabe (b) und diskutieren Sie die Unterschiede. Ist der Sch¨atzer erwartungstreu? Falls nicht, geben Sie einen erwartungstreuen Sch¨atzer vonσ2an und berechnen Sie diesen sowie die dazugeh¨orige Log-Likelihood. Vergleichen Sie die beiden Sch¨atzwerte sowie die beiden Log-Likelihood Werte und diskutieren Sie die Unterschiede.

Aufgabe 9.3 Auf der Internetseite zur Vorlesung finden Sie in der DateibioData.txt einen Datensatz, den Ihnen Ihr Haus-Biologe zur Analyse ¨ubersandt hat.

(a) Plotten Sie ein Histogramm der Daten.

(b) F¨uhren Sie zwei unterschiedliche Modellierungen durch, indem Sie zwei verschie- dene (kontinuierliche) Verteilungen aus der Vorlesung f¨ur die Daten annehmen.

Sch¨atzen Sie die jeweiligen Modellparameter.

(c) Plotten Sie die Log-Likelihood-Funktionen f¨ur geeignete Wertebereiche und dis- kutieren Sie die Diagramme.

(d) F¨ur welches Modell w¨urden Sie sich entscheiden?

Abgabe: 19.12.06

Referenzen

ÄHNLICHE DOKUMENTE

Diese p il bilden eine Ge- wichtsmatrix (PWM), wobei die l-te Spalte die Verteilung von X l beschreibt.. b) Bestimmen Sie die zu dieser Gewichtsmatrix (und zu diesem

Aber , wir w¨urden uns trotzdem freuen, wenn wir auf diesem Wege Feedback zur Veranstaltung bek¨amen und erfahren w¨urden, wie Sie ¨uber ”Algorithmen der Bioinformatik II” denken

Aufgabe 2.2 N = 300 verschiedene Markergene wurden mit einer BAC Bibliothek aus M = 5 × 10 4 BACs hybridisiert. Dabei stellte sich heraus, dass jedes Markergen mit genau einem

Wir nehmen an, daß diese Bande einen gewissen Anteil an funktionalen und nicht- funktionalen Sequenzen enth¨ alt, wobei die funktionalen Sequenzen auf Grund Ihrer Funktionalit¨ at

Leiten Sie weiterhin den Erwartungs- wertvektor und die Kovarianzmatrix eines polynomialverteilten Zufallsvektors her und beweisen Sie, dass die Randverteilung

Welche der beiden Verteilungen scheint Ihnen rein visuell (f¨ ur diesen Datensatz) geeigneter.

Aufgabe 10.2 Sie gehen ohne Misstrauen in eine Spielh¨ olle, in der mit einer M¨ unze gespielt wird: Der Spieler oder die Spielerin setzt gegen den “Direktor” des Etablis-

Aufgabe 12.1 Der Datensatz sigma70.txt auf der Homepage zur Vorlesung besteht aus 238 Sigma-70 Bindungsstellen der L¨ ange 12.?. a) Modellieren Sie eine Sigma-70 Bindungsstelle