• Keine Ergebnisse gefunden

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08

N/A
N/A
Protected

Academic year: 2022

Aktie "Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Ubungen Algorithmen der Bioinformatik II ¨ Wintersemester 2007/08

Prof. Dr. Stefan Posch, Dr. Birgit M¨ oller

Institut f¨ur Informatik Universit¨at Halle

Blatt 12

Aufgabe 12.1 Bei der Beurteilung der Leistungsf¨ahigkeit von Klassifikatoren spie- len die Sensitivit¨at und die Spezifit¨at eine entscheidende Rolle. Oftmals werden dabei ROC-Kurven verwendet, um die Ergebnisse der Klassifikatoren an verschiedenen Ar- beitspunkten, d.h. bei verschiedenen Sensitivit¨aten bzw. Spezifit¨aten, zu vergleichen.

In dieser Aufgabe wollen wir Ergebnisse der beiden Klassifikatoren K1M L und K2M L vom vorherigen Aufgabenblatt miteinander vergleichen, die diese auf dem sigma70- Datensatz (Vordergrund und Hintergrund zusammen genommen) erzielen.

a) Beschreiben Sie Ihr Vorgehen, um f¨ur die beiden Klassifikatoren die ROC-Kurven zu erhalten.

b) Plotten Sie f¨ur beide Klassifikatoren die ROC-Kurven auf dem gegebenen Daten- satz und vergleichen Sie beide.

c) Sch¨atzen Sie f¨ur beide Kurven diearea under curve ab.

Aufgabe 12.2 F¨ur einen bekannten TypT1 von Transkriptionsfaktorbindestellen gilt, dass die darin enthaltenen Nukleotide statistisch mit gleicher Wahrscheinlichkeit auf- treten. In dem Labor, indem Sie nach Abschluss Ihres Studiums angestellt sind, wurden in einem Experiment Transkriptionsfaktorbindestellen unbekannten Typs identifiziert.

Aus den gegebenen Nukleotidsequenzen der TFBSs haben Sie die Parameter eines ho- mogenen Markov-Modells 0. Ordnung gesch¨atzt, die sich wiefolgt ergeben haben:

p(A) = 0.23 , p(C) = 0.23 , p(G) = 0.25 , p(T) = 0.29

Nun m¨ochte der Biologe, mit dem Sie zusammenarbeiten wissen, ob die gefundenen TFBSs m¨oglicherweise vom Typ T1 sein k¨onnten, oder ob es sich vielleicht eher um einen anderen Typ von TFBSs handelt. Er sagt Ihnen ausserdem, dass er geh¨ort hat, dass zur L¨osung dieses Problems wohl oft ein χ2-Test Anwendung findet, genaueres weiss er aber nicht.

a) Finden Sie heraus, was derχ2-Test ist und beschreiben Sie in wenigen S¨atzen das Prinzip dieses Tests. Geben Sie die Quellen Ihrer Informationen an.

b) Beschreiben Sie die Vorgehensweise, um mit Hilfe des Tests Ihr TFBS-Problem zu l¨osen. F¨uhren Sie den Test mit den gegebenen Daten durch. Welche Antwort k¨onnen Sie Ihrem Kollegen anschließend geben?

Abgabe: 18.01.08

Referenzen

ÄHNLICHE DOKUMENTE

differentiell exprimierte Gene auf der einen Seite und eine Kontrollgruppe von nicht differentiell exprimierten Genen auf der anderen Seite.. Diese nennen wir im folgenden

Wir nehmen an, dass alle Positionen statistisch unabh¨ angig sind und die Nukleotide an jeder einzelnen Position gleichverteilt auftreten. (a) Wir betrachten wie in der Vorlesung die

Jedes Zeichen im String wurde, unabh¨ angig von den anderen Zeichen, mit dem gleichen DNA-W¨ urfel gew¨ urfelt.. Es existiert also ein freier Parameter (p C )

Aufgabe 6.1 Sie gehen ohne Misstrauen in eine Spielh¨ olle, in der mit einer M¨ unze gespielt wird: Der Spieler oder die Spielerin setzt gegen den “Direktor” des Etablis- sements,

Prof. Stefan Posch, Dr. Birgit M¨ oller Institut f¨ ur Informatik Universit¨ at Halle..

Bei einer Multinomialverteilung ist die Anzahl N und damit die Summe der beobachte- ten

Aufgabe 9.1 Betrachten Sie folgendes Gl¨ ucksspiel, welches in Ihrer Lieblingsspielh¨ olle angeboten wird: Sie starten mit einem Kapital von i, 0 < i < S Euro, der Spielh¨

Teilen Sie beide Datens¨ atze jeweils in zwei H¨ alften, so dass Sie zwei TFBS-Datens¨ atze F 1 und F 2 und zwei Hintergrunddatens¨ atze B 1 und B 2 erhalten.. F¨ ur diese Datens¨