• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08

Prof. Dr. Stefan Posch, Dr. Birgit M¨ oller

Institut f¨ur Informatik Universit¨at Halle

Blatt 1

Aufgabe 1.1

a) Berechnen Sie f¨ur die diskrete und die kontinuierliche Gleichverteilung, P(x) =

1

b−a, x∈[a, b], jeweils Erwartungswert und Varianz.

b) Generieren Sie verschiedene Listen mit kontinuierlich gleichverteilten Zufallszah- len, wobei die Anzahl der Elemente in den Listen und die Paramter der Gleich- verteilung jeweils variieren. Stellen Sie die resultierenden Verteilungen in einem Histogramm dar und berechnen Sie die Mittelwerte der einzelnen Verteilungen.

Vergleichen Sie diese mit den errechneten Erwartungswerten.

Aufgabe 1.2 Beweisen Sie f¨ur beliebige diskrete Zufallsvariablen X und Y E[X + Y] = E[X] + E[Y]

Aufgabe 1.3 Wir betrachten ein Genom, das mehrere tausend Replikationen eines Sequenzst¨uckes enth¨alt, welches f¨ur 5.8 S rRNA codiert. Diese Sequenzen sind aufgrund evolution¨arer Ereignisse unterschiedlich, einige haben auch ihre Funktionalit¨at verloren, sind aber im Genom erhalten geblieben.

Wir interessieren uns f¨ur einen Teil dieser Sequenzen und wollen diese clonieren, um sie anschließend sequenzieren zu k¨onnen. Zun¨achst nutzen wir PCR, da wir ein Primer- Paar kennen, das alle Sequenzen der 5.8 S rRNA codierenden Bereiche flankiert. Das PCR-Produkt wird mittels Gelelektrophorese bez¨uglich der L¨ange der Sequenzen ge- trennt, und im weiteren untersuchen wir eine der entstandenen Bande. Wir nehmen an, daß sie einen gewissen Anteil an funktionalen und nicht-funktionalen Sequenzen enth¨alt. Diese stammen von a bzw. b Replikaten im Genom, die jeweils funktionale bzw. nicht-funktionale 5.8 S rRNA codieren.

Aus dieser Bande clonieren wir nun N (individuelle) Molek¨ule und erhalten so eine clone library mitN clonen. Diesen Prozeß modellieren wir als Ziehen einer Stichprobe mit Zur¨ucklegen.

(a) Diskutieren Sie die geschilderte Modellierung.

(b) Wieviele Sequenzen f¨ur funktionale und nicht-funktionale 5.8 S rRNA haben wir im Mittel in unserer clone library?

Abgabe: 19.10.2007

(2)

(c) Wie groß m¨ussen wirN w¨ahlen, um mit Wahrscheinlichkeitφ mindestens je eine funktionale und nicht-funktionale 5.8 S rRNA in der clone library zu haben?

(d) F¨uhren sie f¨ur a = 900 und b = 100 Simulationen mit N = 10,100,1000,10000 durch und diskutieren Sie die Ergebnisse insbesondere im Vergleich zu den theo- retisch bestimmten Resultaten.

Hinweise zu praktischen Aufgaben (mehr Infos in der ersten ¨Ubung):

• Zur L¨osung der praktischen Aufgaben, die im Verlauf des Semesters gestellt wer- den, eignen sich insbesondere Mathematik-Pakete wie octave, Matlab oder R.

Dar¨uber hinaus zul¨assig (aber nicht unbedingt empfehlenswert. . . ) sind die Pro- grammiersprachen C, C++ und Java, außerdem Perl, Python und Ruby.

• Falls gefordert, k¨onnen gut dokumentierte Programme (Quellcode!) und Skripte per Email an birgit.moeller@informatik.uni-halle.de abgegeben werden.

Wenn Programme und Skripte nicht intuitiv compilierbar/ausf¨uhrbar sind, sollte eine kurze ”Gebrauchsanleitung” mitgeliefert werden.

• Die Programme sollten grunds¨atzlich unter Linux/Unix lauff¨ahig sein und insbe- sondere keine zus¨atzlichen Bibliotheken ben¨otigen, die nicht in jeder Standardin- stallation vorhanden sind.

Abgabe: 19.10.2007

Referenzen

ÄHNLICHE DOKUMENTE

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Er sagt Ihnen ausserdem, dass er geh¨ ort hat, dass zur L¨ osung

differentiell exprimierte Gene auf der einen Seite und eine Kontrollgruppe von nicht differentiell exprimierten Genen auf der anderen Seite.. Diese nennen wir im folgenden

Jedes Zeichen im String wurde, unabh¨ angig von den anderen Zeichen, mit dem gleichen DNA-W¨ urfel gew¨ urfelt.. Es existiert also ein freier Parameter (p C )

Aufgabe 6.1 Sie gehen ohne Misstrauen in eine Spielh¨ olle, in der mit einer M¨ unze gespielt wird: Der Spieler oder die Spielerin setzt gegen den “Direktor” des Etablis- sements,

Prof. Stefan Posch, Dr. Birgit M¨ oller Institut f¨ ur Informatik Universit¨ at Halle..

Bei einer Multinomialverteilung ist die Anzahl N und damit die Summe der beobachte- ten

Aufgabe 9.1 Betrachten Sie folgendes Gl¨ ucksspiel, welches in Ihrer Lieblingsspielh¨ olle angeboten wird: Sie starten mit einem Kapital von i, 0 < i < S Euro, der Spielh¨

Teilen Sie beide Datens¨ atze jeweils in zwei H¨ alften, so dass Sie zwei TFBS-Datens¨ atze F 1 und F 2 und zwei Hintergrunddatens¨ atze B 1 und B 2 erhalten.. F¨ ur diese Datens¨