• Keine Ergebnisse gefunden

3 Eigene Untersuchungen 55

3.4. Auswertung

3.4.3. Genexpressionsanalysen

3.4.3.1. Qualitätskontrolle der Genchips

Um die Qualität der Analyse zu gewährleisten, wurden vom Hersteller der Chips bestimmte Qualitätskontrollschritte eingebaut.

Durch die Hybridisierung des B2-Oligos können Grenzen des Arrays identifiziert werden. Der Oligo-B2 ist ein Sondensatz, der jedem Hybridisierungscocktail hinzugefügt wird und der jedes Scannerbild durch ein alternierendes Muster von Intensitäten an den Grenzen des Bildes kennzeichnet, ein Schachbrettmuster in jeder Ecke des Arrays darstellt und den Namen des verwendeten Arrays in der oberen Mitte des Arrays anzeigt.

Zur Hybridisierungslösung wurden eukaryotische Hybridisierungskontrollen (GeneChip Eukaryotic Hybridization Control Kit, Affymetrix) hinzugegeben, die prokaryotische Gene repräsentieren, die in der Maus normalerweise nicht existieren, deren Sondensätze jedoch als Kontrollen auf den Genchips vorhanden sind. Hierbei handelt es sich um die prokaryotischen Transkripte bioB, bioC und bioD aus Escherichia Coli und cre, einer Rekombinase aus dem Bakteriophagen P1. Diese exogenen Transkripte mit ihren definiert eingesetzten Konzentrationen ermöglichen eine Qualitätskontrolle der Arbeitsschritte Hybridisierung, Waschen und Färben. bioB

wird in der geringsten Konzentration eingesetzt und stellt die untere Nachweisgrenze des Systems dar.

Zur weiteren Kontrolle wurde der Parameter Percent Present berechnet. Dieser bezeichnet die relative Anzahl der detektierten Gene zur gesamten Anzahl der Gene auf dem Array. Diese sollte über alle Arrays ähnlich sein, wobei Variabilität in diesem Parameter eine normale biologische Variabilität repräsentieren kann.

3.4.3.2. Auswertung der Rohdaten

Die binären Rohdaten der eingescannten Arrays wurden mit der Affymetrix Microarray Suite 5.0 in ein Set aus metrischen Daten wie „Signal“ und „Detection Call“ umgewandelt. Dabei wurden die Standardeinstellungen des Programms angewendet. Mit Hilfe des einseitigen Wilcoxon Rangsummentests wird die Wahrscheinlichkeit p berechnet, mit der ein Gen detektiert, nicht detektiert oder marginal detektiert wird ("Detection p-Value"). Die Koordinierung der Affymetrixgeräte und die Auswertung der gescannten Daten erfolgte mit der GeneChip Operating Software GCOS 1.2, ebenfalls unter Verwendung der voreingestellten Standardwerte. Um die Werte zu normalisieren, wurde die Soll-Signalintensität eines jeden Arrays auf 150 gesetzt (MILLS u. GORDON 2001). Die erhaltenen Daten wurden als Microsoft-Excel-Tabelle exportiert, und die weitere Auswertung erfolgte mit Microsoft Excel Version 11.0.

EIGENE UNTERSUCHUNGEN - MATERIAL UND METHODEN

3.4.3.3. Auswahlkriterien für differentiell regulierte Gene

Um zu untersuchen, in welchen Genen sich die Proben unterschieden, wurden die Gene betrachtet, die gegenüber den Kontrollproben unterschiedlich, also differentiell, exprimiert wurden. Es wurden die Gene als differentiell heraufreguliert definiert, die in den Probenarrays mit einer hohen Wahrscheinlichkeit von p < 0,05 detektiert wurden und deren Signal Log Ratio (SLR) gegenüber den beiden Kontrollen > 1 betrug. Als differentiell herunterreguliert werden die Gene definiert, die in den Kontrollarrays mit einer hohen Wahrscheinlichkeit von p < 0,05 und einer Signal Log Ratio (SLR) gegenüber beiden Kontrollen < -1 detektiert wurden (HUBBELL et al. 2002;

CHTANOVA et al. 2004). Der Parameter Signal Log Ratio beschreibt die Größe und die Richtung eines Transkriptes, wenn zwei Arrays verglichen werden, und hat den Vorteil, dass bei nah verwandten Proben, bei denen eine ähnliche Genexpression erwartet wird, die Verteilung der SLR-Werte bei niedrigeren Intensitäten weiter ist (SHAROV et al. 2004). Er wurde berechnet, indem die Signalwerte zur Basis 2 logarithmiert wurden und dann die logarithmierten Signalwerte der Transkripte der Probenarrays durch die Signalwerte der Transkripte der Kontrollarrays geteilt wurden (HUBBELL et al. 2002). Die Berechnungen wurden mit Microsoft Excel durchgeführt.

Ein Signal Log Ratio von 1 bedeutet z. B., dass ein Gen in dem Probenarray zweimal stärker exprimiert wurde, als in den Kontrollarrays. Es wurden also alle Gene als differentiell exprimiert definiert, die mehr als zweifach gegenüber den Genen der Kontrollen reguliert waren (CHTANOVA et al. 2004).

3.4.3.4. Hierarchische Clusteranalyse

Um zu untersuchen, ob sich die Gewebeproben der Mausschwänze mit Eisenfolien signifikant von den Proben ohne Implantat unterscheiden lassen, wurden mit Hilfe des Opensource-Klassifikationsprogramms CLUSTER 3.0 (EISEN et al. 1998) die

Genexpressionsprofile der fünf Arrays analysiert und die Ergebnisse graphisch dargestellt. Beim hierarchischen Clusterverfahren werden Ähnlichkeiten zwischen Datenpunkten über einen Stammbaum repräsentiert, wobei die Länge der Äste mit dem Grad der Verwandtschaft, bzw. der Gemeinsamkeiten zwischen den Objekten umgekehrt proportional korreliert. Der Algorithmus dieses Programms ordnet sowohl die einzelnen Arrays als auch die einzelnen Gene entsprechend ihres Expressionsprofils mit einem Distanzmaß an, das auf der Pearson-Korrelation basiert. Das Ergebnis wurde mit Hilfe des Programms JAVA TreeView visualisiert (LINDEMEIER 2008).

3.4.3.5. Einordnung der Gene in funktionelle Gruppen

Nach dem oben beschriebenen Setzen der Auswahlkriterien erhält man als Ergebnis eine Liste von Genen, die aufgrund ihrer Expressionswerte in der Fragestellung als interessant bewertet werden. Um diese Gene in einen biologisch sinnvollen Zusammenhang zu bringen, werden sie in funktionelle Gruppen, sogenannte Gene-Ontology-(GO)-Terms des GO-Konsortiums eingeordnet. Das Gene Ontology Consortium hat es sich zur Aufgabe gemacht, ein Set von strukturierten, kontrollierten Begriffen für die Annotation von Genen, Genprodukten und Sequenzen zusammenzustellen (GENE ONTOLOGY CONSORTIUM 2010). Der Begriffskatalog ist hierarchisch geordnet und beschreibt mit sogenannten GO-IDs, festgelegten Kennnummern für jede funktionelle Kategorie, eindeutig die Ebene und die Funktion eines Gens. Der Katalog ist in die drei Unterkategorien „Biologischer Prozess",

„Molekulare Funktion“ und „Zelluläre Komponente“ unterteilt.

Um die Zellantwort auf den Eisenstimulus zu untersuchen, wurden die drei Proben mit jeweils beiden Kontrollen verglichen und die in Frage kommenden Gene nach oben genannten Methoden herausgefiltert. Die entstandenen Genlisten mit den regulierten Genen bzw. deren Transkripten wurden mit den Kennnummern des Herstellers Affymetrix und den Signalwerten in die frei im Internet nutzbaren

EIGENE UNTERSUCHUNGEN - MATERIAL UND METHODEN

Datenbanken „GO Tree Machine“ (GOTM) (ZHANG et al. 2004) und „DAVID:

Database for Annotation, Visualization and Integrated Discovery“ (DENNIS 2003;

HUANG et al. 2009) heraufgeladen. Ein Gen wird dabei jeweils einer bestimmten GO-Kategorie zugeordnet. Dabei werden statistisch überrepräsentierte (angereicherte) Gruppen hervorgehoben. Bei GOTM wurden die Signifikanzgrenzen für die überrepräsentierten GO-Kategorien bei ≥ drei Gene pro Kategorie gesetzt. Die zehn signifikantesten Kategorien für die vermehrt oder vermindert exprimierten Gene sollten angezeigt werden. Das Programm evaluiert die Anreicherungen mit Hilfe des hypergeometrischen Tests. Eine Fehlerkorrektur des p-Wertes wurde nach BENJAMINI und HOCHBERG (1995) durchgeführt. Das Programm DAVID errechnet die Signifikanz des Grades der Anreicherung mittels modifiziertem Fisher´s exact test, und der p-Wert wird als "Expression Analysis Systematic Explorer"-(EASE)-score bezeichnet (HOSACK et al. 2003; MÜLLER et al. 2006).