• Keine Ergebnisse gefunden

1. Einleitung

1.4. Genexpressionsanalysen

Die Untersuchung von Genexpression mit Hilfe der DNA-Chip-Technologie basiert auf der Hybridisierung von mRNA auf ein hochdichtes Raster von immobilisierten Nu-kleinsäuremolekülen, die mit den Sequenzen der zu untersuchenden Gene korrelieren.

Im Gegensatz zu älteren Techniken wie dem "Northern Blot", bei dem nur einzelne Ge-ne analysiert werden könGe-nen, ist es mit der DNA-Chip-Technologie möglich, die Genexpression von mehreren tausend Genen gleichzeitig zu untersuchen (Brown &

Botstein, 1999; Lockhart & Winzeler, 2000).

Die für Genexpressionsanalysen verwendeten DNA-Chips basieren häufig auf cDNA-Bibliotheken. Mittels PCR werden die klonierten cDNA-Fragmente amplifiziert, die PCR-Produkte werden anschliessend auf Chips aufgebracht. Alternativ werden auch oligoarrays mit bis zu 25 bp langen Oligonukleotiden verwendet, seltener sind micro-arrays im Einsatz, auf die synthetisierte Oligonukleotide mit einer Länge von 50-70 bp aufgebracht wurden. Ein Vorteil in der Verwendung von cDNA-Bibliotheken für Genexpressionsanalysen liegt darin, dass weder die Sequenz des zu untersuchenden Genoms, noch nähere Informationen über einzelne Gene bekannt sein müssen. Dadurch ist es aber nicht möglich, zwischen eventuell vorhandenen Spleiss-Varianten einzelner Gene zu differenzieren. Ist die Sequenz des Genoms bekannt, können gezielt Primer-Paare für eine Amplifikation oder lange Oligonukleotide ausgewählt werden, mit denen ganz spezielle Fragestellungen beantwortet werden können. Auch bei der Verwendung oligoarrays muss die Sequenz des zu analysierenden Genoms bekannt sein.

Für die Hybridisierung wird die RNA als komplexe Probe markiert, sie enthält also jede in dem zu untersuchenden biologischen Material vorhandene mRNA-Spezies entspre-chend ihrer Transkriptmenge. Je höher die Expression eines Gens ist, desto grösser ist sein Anteil in der markierten RNA und desto stärker ist das zugehörige Hybridisie-rungssignal (Freeman et al., 2000; Schena et al., 1995). Werden für die Markierung zweier Proben unterschiedliche Fluoreszenzfarbstoffe verwendet, die aufgrund ihrer Exzitations- und Emissionsspektren unabhängig voneinander detektiert werden können, ist die kompetitive Hybridisierung dieser beiden Proben möglich. Dazu werden die zu vergleichenden Zellzustände, respektive deren mRNA-Populationen, mit unterschiedli-chen Fluoreszenzfarbstoffen markiert und parallel auf einen Chip hybridisiert. Diese zwei Zellzustände können somit in einer einzelnen Hybridisierung direkt quantitativ miteinander verglichen werden.

Abb. 1.3: Genexpressionsanalysen mittels DNA-Chip-Technologie (Duggan et al., 1999). A) Zwei zu vergleichende RNA-Proben werden mit unterschiedlichen Fluoreszenzfarbstoffen mar-kiert und gemeinsam auf einen Chip cohybridisert. B) Nach sukzessiver Anregung und Detektion der beiden Farbstoffe werden die erhaltenen Bilder als Falschfarbendarstel-lung übereinandergelegt.

Bei radioaktiver Markierung der Proben können die Hybridisierungen der verschiede-nen Proben nur einzeln erfolgen, die Signalintensitäten müssen dann von Chip zu Chip verglichen werden.

In beiden Fällen schliesst sich an die Detektion und Quantifizierung der durch die Hy-bridisierung erhaltenen Signalintensitäten eine ausführliche bioinformatische Datena-nalyse an (Schuchhardt et al., 2000; Schadt et al., 2000; Tseng et al., 2001). Dabei wer-den die Daten zunächst normalisiert, um Hybridisierungen direkt miteinander ver-gleichbar zu machen. Unterschiede zwischen einzelnen Hybridisierungen, die eine Normalisierung erforderlich machen, können hervorgerufen werden durch ungleiche Ausgangsmengen von RNA oder cDNA, abweichende Effizienz der Markierungsreakti-on, Unterschiede in der Hybridisierungseffizienz oder dem abweichenden Verhalten der beiden Fluoreszenzfarbstoffe bei Markierung und Detektion. Da die Experimente zur statistischen Validierung der Ergebnisse meist mehrmals wiederholt werden (Lee et al., 2000), muss auch bei kompetitiven Hybridisierungen nicht nur eine Normalisierung innerhalb des Chips erfolgen, sondern auch zwischen verschiedenen Chips.

Wird in einem Experiment nur ein Zellzustand mit einem Kontrollzustand verglichen,

Exzitation

stem dargestellt werden (Beißbarth et al., 2000). Die normalisierten Signalintensitäten des einen Zellzustands werden gegen die normalisierten Signalintensitäten des Kon-trollzustands aufgetragen (Abb. 1.4). Der Faktor für Induktion bzw. Repression eines Gens ergibt sich, indem die Signalintensitäten beider Bedingungen für dieses Gen ins Verhältnis gesetzt werden (DeRisi et al., 1996; Chen et al.,1997). Gene, die unter bei-den Bedingungen gleich stark exprimiert werbei-den, liegen in dem Koordinatensystem entlang der Winkelhalbierenden mit der Steigung eins. Gene, die in dem zu untersu-chenden Zellzustand stärker exprimiert werden als unter der Kontrollbedingung, liegen oberhalb, Gene, die schwächer exprimiert werden, liegen unterhalb dieser Diagonale.

Abb. 1.4: Darstellung der Genexpression zweier zu vergleichender RNA-Proben im Diagramm

In dieser Arbeit wurde zur Normalisierung und Datenanalyse die Software M-Chips (Fellenberg et al., eingereicht) verwendet, die eigens für diesen Zweck entwickelt wur-de. Ein Bestandteil dieser Software ist die Korrespondenzanalyse (Greenacre, 1984).

Mit diesem Algorithmus, der seinen Ursprung in der Soziologie hat und nun speziell auf die Datenanalyse von Genexpressionsstudien mittels DNA-Chiptechnologie angepasst wurde, werden die Gene als Vektoren in einem multidimensionalen Raum dargestellt.

Die Anzahl der Dimensionen entspricht der Anzahl der untersuchten Bedingungen.

Ebenso wird jede Bedingung in einem multidimensionalen Raum dargestellt. Hier ergibt sich die Anzahl der Dimensionen aus der Anzahl der untersuchten Gene. Beide Räume werden anschliessend mit minimalem Informationsverlust kombiniert auf eine einzelne

Signalintensitäten Kontrolle

Gene, die im untersuchten Zellzustand gleich stark exprimiert werden wie im Kontrollzustand

Gene, die im untersuchten Zellzustand stärker exprimiert werden als im Kontroll-zustand

Gene, die im untersuchten Zellzustand schwächer exprimiert werden als im Kontrollzustand

Signalintensitäten Zellzustand 1

zweidimensionale Ebene projeziert. Induktion bzw. Repression der Gene kann nun di-rekt aus ihrer Lage in der Ebene abgelesen werden. Gene, die im Diagramm dicht bei-einander liegen, verhalten sich unter den untersuchten Bedingungen gleich oder sehr ähnlich (Fellenberg et al., 2001).