• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2006/07

Dr. Ivo Große, Dipl.-Bioinf. Jan Grau

Institut f¨ur Informatik Universit¨at Halle

Blatt 5

Aufgabe 5.1 Beweisen Sie: Wenn X1, X2, . . . , XM statistisch unabh¨angig sind, gilt E(QM

m=1Xm) = QM

m=1E(Xm). Beweisen Sie weiterhin die folgenden beiden Eigenschaf- ten des Korrelationskoeffizienten ρ(X, Y): −1≤ ρ(X, Y)≤1 und ρ(X, Y) = ±1 gdw.

XundY linear voneinander abh¨angen. Finden Sie drei Beispiele f¨ur statistisch abh¨angi- ge Zufallsvariable, die unkorreliert sind, ein Beispiel f¨ur zwei funktional abh¨angige Zu- fallsvariable X und Y mit −1 < ρ(X, Y) < 1 und ein Beispiel f¨ur zwei funktional abh¨angige Zufallsvariable X und Y mit ρ(X, Y) = 0.

Aufgabe 5.2 In Aufgaben 3.2 und 4.2 haben wir uns mit der H¨aufigkeitsverteilung

¨uberlappender Trimere in Bin¨arsequenzen befasst.

(a) Leiten Sie f¨ur jedes Trimer die Varianzen von Nijk und Dijk als Funktionen von N her und vergleichen Sie diese mit denen der Simulation aus Aufgabe 3.2 und den analytisch berechneten Varianzen aus Aufgabe 4.2.

(b) Definieren Sie nun n1/2ijk = N

1/2

ijk−E(Nijk1/2) q

V ar(Nijk1/2) und dijk =n1ijk−n2ijk und wiederholen Sie Aufgabe 3.2(a-h), indem Sie ¨uberall Nijk1/2 durch n1/2ijk und Dijk durch dijk ersetzen.

(c) Welche Empfehlung w¨urden Sie einem angewandten Bioinformatiker geben, der das overlapping word paradox nicht kennt, aber dringend Sequenz- und Expressionsdaten wie in Aufgabe 3 beschrieben analysieren m¨ochte?

Aufgabe 5.3 Wir betrachten ein Genom, das mehrere tausend Replikate eines Sequenzst¨uckes enth¨alt, welches f¨ur 5.8 S rRNA kodiert. Diese Sequenzen sind aufgrund evolution¨arer Ereignisse unterschiedlich, einige haben auch ihre Funktionalit¨at verloren, sind aber im Genom erhalten geblieben.

Wir interessieren uns f¨ur einen Teil dieser Sequenzen und wollen diese klonieren, um sie anschließend sequenzieren zu k¨onnen. Zun¨achst nutzen wir PCR, da wir ein Primer- Paar kennen, das alle Sequenzen der 5.8 S rRNA kodierenden Bereiche flankiert. Das PCR-Produkt wird mittels Gelelektrophorese bez¨uglich der L¨ange der Sequenzen ge- trennt, und im weiteren untersuchen wir eine der entstandenen Bande.

Wir nehmen an, daß diese Bande einen gewissen Anteil an funktionalen und nicht- funktionalen Sequenzen enth¨alt, wobei die funktionalen Sequenzen auf Grund Ihrer Funktionalit¨at in zwei Klassen (I und II) eingeteilt werden k¨onnen. Wir nehmen wei- terhin an, dass die Sequenzen in der von uns untersuchten Bande von AI und AII

Abgabe: 21.11.06

(2)

Replikaten stammen, die funktionale 5.8 S rRNA kodieren, sowie von B Replikaten, die nicht-funktionale 5.8 S rRNA kodieren.

Aus dieser Bande klonieren wir nun N (individuelle) Molek¨ule und erhalten so eine Klonbibliothek mit N Klonen. Diesen Prozeß modellieren wir als Ziehen einer Stich- probe mit Zur¨ucklegen.

(a) Diskutieren Sie die geschilderte Modellierung.

(b) Wieviele Sequenzen f¨ur funktionale 5.8 S rRNA aus Klasse I, funktionale 5.8 S rR- NA aus Klasse II und nicht-funktionale 5.8 S rRNA haben wir im Mittel in unserer Klonbibliothek?

(c) Wie groß m¨ussen wir N w¨ahlen, um mit Wahrscheinlichkeit φ mindestens eine funktionale 5.8 S rRNA aus Klasse I, eine funktionale 5.8 S rRNA aus Klasse II und eine nicht-funktionale 5.8 S rRNA in der Klonbibliothek zu haben?

(d) F¨uhren sie f¨ur AI = 600, AII = 300 und B = 100 Simulationen mit N = 10,100,1000,10000 durch und diskutieren Sie die Ergebnisse insbesondere im Vergleich zu den theoretisch bestimmten Resultaten.

Abgabe: 21.11.06

Referenzen

ÄHNLICHE DOKUMENTE

Praktische Informatik 3: Funktionale Programmierung Vorlesung 10 vom 18.12.2018: Aktionen und Zustände.. Christoph Lüth Universität Bremen

differentiell exprimierte Gene auf der einen Seite und eine Kontrollgruppe von nicht differentiell exprimierten Genen auf der anderen Seite.. Diese nennen wir im folgenden

Aufgabe 4.1 In Aufgabe 3.1 haben wir uns mit der H¨ aufigkeit von nicht¨ uberlap- penden Trimeren in Bin¨ arsequenzen der L¨ ange N = 300 besch¨ aftigt.. Berechnen Sie nun analytisch

Finden Sie ein weiteres Beispiel f¨ ur drei stetige Zufallsvariablen, die paarweise statistisch abh¨ angig und paar- weise bedingt statistisch unabh¨ angig sind.. (d) Finden

In ersterem Fall erhalten Sie vom Spielh¨ ollenbesitzer einen Euro aus dessem Stapel, andernfalls m¨ ussen Sie einen r¨ uber- wandern lassen.. Das Spiel endet, sobald einer von

Wie kann in O(|t|) Zeit festgestellt werden, wie viele verschiedene Teilstrings der L¨ange k in t enthalten sind. Gib hierzu einen Algorithmus in

Beweise mit vollst¨andiger Induktion, dass jeder gewurzelte Baum, der keinen Knoten mit genau einem Kind besitzt, weniger Kanten als Knoten besitzt. Aufgabe

Gib weiter f¨ur jeden Knoten die ausgef¨uhrten Tests (basierend auf den DFS-Intervallen) und deren Ergebnis an