• Keine Ergebnisse gefunden

13. ¨Ubung ”Angewandte Bioinformatik mit Perl und R“

N/A
N/A
Protected

Academic year: 2022

Aktie "13. ¨Ubung ”Angewandte Bioinformatik mit Perl und R“"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Wintersemester 2006/2007 Abgabe am 25. Januar 2007 Prof. Dr. Stefan Posch, Dipl.-Bioinf. Jan Grau

13. ¨ Ubung

” Angewandte Bioinformatik mit Perl und R“

1. Laden Sie wiedergolub-Daten.

(a) Filtern Sie erneut die Gene mit den Kriterien (a), (b) und (c) aus der Aufgabe 3 der letzten Serie.

Benutzen Sie die Funktionhclustum die Proben der Golubdaten mit diesen Genen zu clu- stern. Verwenden Sie unterschiedliche Distanzfunktionen (z.B. aus dem package bioDist) und vergleichen Sie die Ergebnisse (jeweils visuell).

(b) Wiederholen Sie dies f¨ur unterschiedliche Teilmengen signifikanter Gene und wiederum unter- schiedliche Distanzen. Vergleichen Sie wiederum die Ergebnisse, was beeiflusst die Ergebnisse am st¨arksten.

(c) Verwenden Sie nun das k-means Verfahren (Funktionkmeans) f¨ur das Clustern. Vergleichen Sie erneute die Ergebnisse.

(d) Testen Sie einige weitere der genannten Clusterverfahren.

2. Versuchen Sie nun Genen zu clustern. ¨Uberlegen Sie sinnvolle Einschr¨ankungen.

Referenzen

ÄHNLICHE DOKUMENTE

• Sequenzenobjekte bestehen allgemein aus ihrer Sequenz und gegebenenfalls einem Namen (ei- ner ID,. ), sowohl Sequenz als auch Name sollen abgerufen werden k¨onnen.. • Eine

F¨ur dieses Gen sind bei NCBI (Genbank, http://www.ncbi.nlm.nih.gov/Genbank/index.html) meh- rere Sequenzen gespeichert, unter anderem auch eines der Chromosomen von Arabidopsis,

• Sequenzenobjekte bestehen allgemein aus ihrer Sequenz und gegebenenfalls einem Namen (ei- ner ID,. ), sowohl Sequenz als auch Name sollen abgerufen werden k¨onnen.. • Eine

Aus weiteren Experimenten scheint es wahrscheinlich, dass das zugeh¨orige Enzym eine Rolle im Zuckerhaushalt spielt.. Sie stehen nun vor der Aufgabe, mit Hilfe einer BLAST- Anfrage

Erzeugen Sie eine Vektor der L¨ange 100, wobei jedes Element nach einer Binomialverteilung mit n = 10, p = 0.3 gezogen wird.. Selektieren Sie aus diesem Vektor (in drei neue

Diese Zuweisung soll f¨ur beliebige data frames funktionieren, schreiben Sie also am besten eine kleine Funktion hierf¨ur..

Plotten Sie f¨ur alle Gene mit dem Teilstring “Lys” im Namen die Intensit¨aten ¨uber alle probes, und zwar einmal die perfect matches, dann die mis-matches.

(b) Wiederholen Sie dies f¨ur unterschiedliche Teilmengen signifikanter Gene und wiederum unter- schiedliche Distanzen.. Vergleichen Sie wiederum die Ergebnisse, was beeiflusst