• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07

Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 2

Aufgabe 2.1 Berechnen Sie von der geometrischen Verteilung und der Poisson Ver- teilung jeweils den Erwartungswert und die Varianz.

Aufgabe 2.2 N = 300 verschiedene Markergene wurden mit einer BAC Bibliothek aus M = 5×104 BACs hybridisiert. Dabei stellte sich heraus, dass jedes Markergen mit genau einem BAC hybridisierte, dass aber nicht alle 300, sondern nur L = 293, BACs verschieden sind. Dies erscheint auf den ersten Blick ¨uberraschend wenig und k¨onnte darauf hindeuten, dass die Gene nicht gleichm¨aßig ¨uber alle BACs verteilt sind.

Um dies genauer zu untersuchen, f¨uhren wir Simulationen und Berechnungen unter den folgenden Modellannahmen durch:

Alle M = 5×104 BACs sind gleich lang und ¨uberdecken das Genom vollst¨andig und nicht¨uberlappend. Die Wahrscheinlichkeit, dass Markergennauf BACmliegt, ist gleich 1/M f¨ur alle n = 1,2, . . . N und alle m= 1,2, . . . M.

a) F¨uhren Sie unter diesen Modellannahmen Simulationen durch und erstellen Sie ein Histogramm der Anzahl der hybridisierten BACs. Wie groß ist die Wahr- scheinlichkeit, genau L hybridisierte BACs zu finden f¨ur L = 293,294, . . . ,300?

Wie groß ist die Wahrscheinlichkeit,L= 293 oder weniger hybridisierte BACs zu finden?

b) Wie groß ist in der Simulation der Erwartungswert der hybridisierten BACs?

Berechnen Sie den Erwartungswert analytisch, und vergleichen Sie das analytische mit dem simulierten Ergebnis.

c) Berechnen Sie die Wahrscheinlichkeit analytisch, genau L hybridisierte BACs zu finden f¨urL= 300 undL= 299. (Zusatzaufgabe: Berechnen Sie die Wahrschein- lichkeit analytisch, genauL= 298 hybridisierte BACs zu finden.)

d) Approximieren Sie die Wahrscheinlichkeitsverteilung von M −L nun durch eine Poisson Verteilung mit Parameterλ =Mexp(−N/M). Berechnen Sie die Wahr- scheinlichkeit, genau L hybridisierte BACs zu finden f¨ur L = 293,294, . . . ,300?

Vergleichen Sie diese approximierten Wahrscheinlichkeiten mit denen aus der Si- mulation.

e) Vergleichen Sie graphisch die Poisson Verteilung mit dem aus den Simulationen gewonnenen Histogramm. Wie gut ist die Approximation?

Abgabe: 01.11.06

(2)

f) Was l¨asst sich aus diesen Simulationen und Berechnungen ¨uber die Verteilung der Markergene ¨uber die BACs aussagen?

Aufgabe 2.3 Nehmen Sie nun an, dass es zwei Klassen von BACs gibt. Die BACs aus Klasse 1 enthalten keine Gene. Die BACs aus Klasse 2 enthalten Gene, und die Gene sind gleichm¨aßig ¨uber alle BACs aus Klasse 2 verteilt. Unbekannt ist lediglich, wie viele BACs in Klasse 2 liegen. Bestimmen Sie nun die Anzahl der BACs in Klasse 2 so, dass der Erwartungswert von L mit dem experimentell beobachteten Wert von L = 293 ¨ubereinstimmt. Was l¨asst sich aus diesem Ergebnis ¨uber die Verteilung der Markergene ¨uber die BACs aussagen?

Abgabe: 01.11.06

Referenzen

ÄHNLICHE DOKUMENTE

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Er sagt Ihnen ausserdem, dass er geh¨ ort hat, dass zur L¨ osung

Leiten Sie weiterhin den Erwartungs- wertvektor und die Kovarianzmatrix eines polynomialverteilten Zufallsvektors her und beweisen Sie, dass die Randverteilung

Welche der beiden Verteilungen scheint Ihnen rein visuell (f¨ ur diesen Datensatz) geeigneter.

Falls nicht, geben Sie einen er- wartungstreuen Sch¨ atzer von µ und σ 2 an und berechnen Sie diesen sowie die dazugeh¨ orige Log-Likelihood.. Vergleichen Sie die vier Sch¨

Aufgabe 10.2 Sie gehen ohne Misstrauen in eine Spielh¨ olle, in der mit einer M¨ unze gespielt wird: Der Spieler oder die Spielerin setzt gegen den “Direktor” des Etablis-

Aufgabe 12.1 Der Datensatz sigma70.txt auf der Homepage zur Vorlesung besteht aus 238 Sigma-70 Bindungsstellen der L¨ ange 12.?. a) Modellieren Sie eine Sigma-70 Bindungsstelle

Aufgabe 9.1 Betrachten Sie folgendes Gl¨ ucksspiel, welches in Ihrer Lieblingsspielh¨ olle angeboten wird: Sie starten mit einem Kapital von i, 0 < i < S Euro, der Spielh¨

Teilen Sie beide Datens¨ atze jeweils in zwei H¨ alften, so dass Sie zwei TFBS-Datens¨ atze F 1 und F 2 und zwei Hintergrunddatens¨ atze B 1 und B 2 erhalten.. F¨ ur diese Datens¨