• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08

Prof. Dr. Stefan Posch, Dr. Birgit M¨ oller

Institut f¨ur Informatik Universit¨at Halle

Blatt 2

Aufgabe 2.1 Berechnen Sie den Erwartungswert und die Varianz der geometrischen Verteilung.

Aufgabe 2.2 Gegeben seien 4 M¨unzen M1, M2, M3, M4, die nacheinander jeweils mehrfach geworfen werden. Die M¨unzen sind zum Teil manipuliert und haben daher verschiedene Wahrscheinlichkeiten pMi daf¨ur, dass bei einem Wurf Kopf f¨allt:

pM1 = 0.4 , pM2 = 0.5 , pM3 = 0.3 , pM4 = 0.5

a) Wie gross ist die Wahrscheinlichkeit, dass eine einzelne WurfsequenzSN geworfen wird? Eine Sequenz SN sei gegeben durch 4 Werte, die jeweils die Anzahl von Kopfereignissen f¨ur die einzelnen M¨unzen beiN W¨urfen angeben.S10 = [3,5,6,8]

bedeutet also, dass bei 10 W¨urfen mit jeder M¨unze beiM1 3 mal Kopf fiel, usw.

b) Schreiben Sie eine Funktion, die Ihnen f¨ur eine gegebene Wurfsequenz SN deren Wahrscheinlichkeit errechnet. R¨uckgabewert soll dabei die logarithmierte Wahr- scheinlichkeit sein, die oftmals in der Praxis Verwendung findet. Was ist bei der numerischen Berechnung der Wahrscheinlichkeiten zu ber¨ucksichtigen? Testen Sie Ihre Funktion f¨ur verschiedene Sequenzen mit verschieden großen Werten f¨urN.

Aufgabe 2.3 Wir betrachten die idealisierte shot-gun Fragmentierung einer Sequenz der L¨ange G mit insgesamt N Fragmenten jeweils der L¨ange L. Das linke Ende je- des Fragments liege (wiederum vergr¨obert) gleichverteilt auf einer der Positionen im Interval [1, G].

(a) F¨ur welche Anzahl N der Fragmente wird die erwartete Anzahl C = e−aN ma- ximal? Wir halten dabei G und Lfest, a= LNG sei die coverage.

Vergleichen Sie dieses Ergebnis mit den Beispielzahlen der Vorlesung.

(b) F¨ur |x|klein gilt folgende Appoximation: ex ≈1 +x.

Nuzten Sie diese Appoximation f¨ur die coverage a in der Absch¨atzung ¨uber die erwartete contig-L¨ange Leaa−1. Interpretieren Sie das Ergebnis.

(c) Simulieren Sie diese shotgun-Fragmentierung f¨ur verschiedene Werte von G, L und N und vergleichen Sie die Resultate mit den Vorhersagen.

Andern die nun die Simulation, indem die L¨¨ ange L der Fragmente gleichverteilt aus dem Intervall [400,600] gezogen wird und vergleichen Sie.

Abgabe: 26.10.07

Referenzen

ÄHNLICHE DOKUMENTE

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Er sagt Ihnen ausserdem, dass er geh¨ ort hat, dass zur L¨ osung

Wir nehmen an, dass alle Positionen statistisch unabh¨ angig sind und die Nukleotide an jeder einzelnen Position gleichverteilt auftreten. (a) Wir betrachten wie in der Vorlesung die

Jedes Zeichen im String wurde, unabh¨ angig von den anderen Zeichen, mit dem gleichen DNA-W¨ urfel gew¨ urfelt.. Es existiert also ein freier Parameter (p C )

Aufgabe 6.1 Sie gehen ohne Misstrauen in eine Spielh¨ olle, in der mit einer M¨ unze gespielt wird: Der Spieler oder die Spielerin setzt gegen den “Direktor” des Etablis- sements,

Prof. Stefan Posch, Dr. Birgit M¨ oller Institut f¨ ur Informatik Universit¨ at Halle..

Bei einer Multinomialverteilung ist die Anzahl N und damit die Summe der beobachte- ten

Aufgabe 9.1 Betrachten Sie folgendes Gl¨ ucksspiel, welches in Ihrer Lieblingsspielh¨ olle angeboten wird: Sie starten mit einem Kapital von i, 0 < i < S Euro, der Spielh¨

Teilen Sie beide Datens¨ atze jeweils in zwei H¨ alften, so dass Sie zwei TFBS-Datens¨ atze F 1 und F 2 und zwei Hintergrunddatens¨ atze B 1 und B 2 erhalten.. F¨ ur diese Datens¨