• Keine Ergebnisse gefunden

5.3 Weitere Auswertung der Lokalisationsdaten

5.3.4 Clusteranalyse

Um Signalanh¨aufungen (Cluster) der aus der Lokalisation der Einzelmolek¨ule erhal-tenen Positionsdaten zu detektieren und zu analysieren wurden verschiedene Ver-fahren entwickelt, welche hier vorgestellt werden sollen.

Anpassung ¨uberlagerter Gauß-Verteilungen

Bei vielen Proteinverteilungen im Zellkern kann beobachtet werden, dass diese sich zu Signalclustern anh¨aufen. Um diese Anh¨aufungen genauer zu analysieren, wurde das Skript ’GM’ geschrieben, welches die Lokalisationsdaten zun¨achst vorsegmen-tiert und dann ein gaussian mixture model an die Daten ann¨ahert. Dies besteht aus einer Superposition mehrerer zweidimensionaler Gauß-Verteilungen mit jeweils unabh¨angigen Kovarianzmatritzen. Zun¨achst werden die ungef¨ahren Positionen der Cluster ermittelt. Hierzu werden die einzelnen Positionen in ein Bild eingetragen.

Jeder Position wird mittels ’Nachbarlabel’ ein Wert zugeordnet, welcher der Anzahl benachbarter Signale innerhalb eines festzulegenden Radius entspricht. F¨ur den Wert dieses Parameters wird die durchschnittliche Gr¨oße der zu untersuchenden Struk-turen ungef¨ahr abgesch¨atzt und eingetragen. Dieser Wert muss nicht sehr genau sein, da zun¨achst nur die Zentren der Signalanh¨aufungen ermittelt werden sollen. Es werden diejenigen Punkte selektiert, deren Wert ¨uber dem Mittelwert benachbarter Signale f¨ur alle Positionen liegt. Aus den verbleibenden Punkten wird mit dem Befehl

’closing’, welcher eine morphologische Schließung [J¨ah05] (mit einem an die Signal-dichte angepassten Formparameter) durchf¨uhrt, eine Maske erstellt. Die einzelnen so entstandenen Strukturen werden registriert (’label’) und ihre Schwerpunkte wer-den bestimmt (durch setzen des Messparameters ’center’ im Aufruf von ’measure’).

In einer Schleife wird ¨uber diese Positionen der Reihe nach iteriert. Aus der Orte-matrix werden diejenigen Punkte ausgew¨ahlt, welche innerhalb einer einstellbaren Umgebung um das momentane Zentrum liegen. Befindet sich ein weiteres Zentrum innerhalb der Umgebung, wird diese automatisch erweitert. Innerhalb dieser Umge-bung wird versucht, ein gaussian mixture model, also eine ¨Uberlagerung mehrerer Gaußf¨ormiger Wahrscheinlichkeitsverteilungen mit unabh¨angigen Kovarianzmatrit-zen anzupassen. Die Anzahl der einzelnen Verteilungen wird hierbei doppelt so hoch gew¨ahlt wie die Anzahl der in der Umgebung befindlichen Zentren. Dem liegt die An-nahme zugrunde, dass ein Signalcluster prinzipiell gut durch zwei Gauß-Verteilungen angepasst werden kann. In Abbildung 5.6 ist dies f¨ur zwei Gaußf¨ormige Punktvertei-lungen mit jeweils 100 Positionen simuliert. Zu diesen wurde eine zuf¨allige Verteilung von 50 weiteren Positionen addiert. Diese wurde dann durch ein gaussian mixture model angen¨ahert.

Als Clusterbegrenzung wurde der Wert gew¨ahlt, f¨ur den die Wahrscheinlichkeitsdich-te auf 5% des MaximalwerWahrscheinlichkeitsdich-tes abgefallen ist. Hierdurch wird eine Fl¨ache begrenzt,

5.3 Weitere Auswertung der Lokalisationsdaten

1900 1920 1940 1960 1980 2000 2020 2040 940

960 980 1000 1020 1040 1060 1080

x

y

pdf(obj,[x,y])

(a) simulierte Punktverteilung

1900 1950

2000 950

1000 1050 0 1 2 3

x 10−4

x pdf(obj,[x,y])

y

(b) Wahrscheinlichkeitsdichtefunktion

Abbildung 5.6: Simulation zweier Signalcluster. In (a) sind zwei normalverteil-te Signalanh¨aufungen mit je 100 Positionen an unterschiedlichen Positionen und mit unterschiedlichen Kovarianzmatritzen simuliert. Zus¨atzlich wurden 50 Positio-nen zuf¨allig ¨uber das Beobachtungsvolumen verteilt. An diese wurde ein gaussian mixture model angen¨ahert, die Konturen geben die entsprechende Wahrscheinlich-keitsdichte wieder. In (b) ist die WahrscheinlichWahrscheinlich-keitsdichte f¨ur die gleiche Verteilung als Oberfl¨achenplot dargestellt.

welche als Maske verwendet werden kann, um mit dem Befehl ’measure’ Eigen-schaften des Clusters wie z.B. Ausdehnung, Fl¨ache oder Anzahl der enthaltenen Positionen zu bestimmen.

Nachbaranalyse

Um Signalanh¨aufungen zu detektieren, kann man auch den Verlauf der in einer Um-gebung um jede Molek¨ulposition vorhanden Signale bei wachsendem Radius bestim-men (Abbildungen 5.7 und 5.8). Hierzu wird das Skript ’Nachbarlabel’ verwendet und der Radius der Umgebung in einem vorgegeben Intervall vonr0bisrmaxvariiert.

Sind die Signale zufallsverteilt, ergeben sich, je nach Signaldichte, die in Abbildung 5.7 auf der linken Seite gezeigten Verl¨aufe, wobei die Anzahl quadratisch mit dem Radius w¨achst. In der Darstellung ist noch zus¨atzlich die Wahrscheinlichkeit farblich kodiert, die wahrscheinlichste AnzahlN(r) bei einem bestimmten Radius erh¨alt den Farbwert ’weiß’, um diesen Wert sind bei konstantem Radiusrdie Wahrscheinlichkei-ten f¨ur eine abweichende Signalzahl normalverteilt, mit einer Standardabweichung von σ(r) = p

N(r). Die Amplitude dieser Verteilung wurde auf 1 normiert, Die Farbwerte sind entsprechend dem rechts gezeigten Farbverlauf eingetragen.

zufällige Verteilung (simuliert) reale Verteilung (Pol-II)

0

max

max = 5000

max = 50 max = 250 max = 1000 n=1

n=50 n=10

n=100

r [nm]

200

0 Anzahl n innerhalb einer Umgebung mit dem Radius r n: Anzahl in einer 200 nm Umgebung

121

Abbildung 5.7: Zusammenhang der Anzahl benachbarter Signale und Radius.

Links ist der Verlauf im Falle einer Zufallsverteilung der Signale bei verschiedenen Signaldichten gezeigt. Farblich kodiert ist die Wahrscheinlichkeit, f¨ur eine gegebene Signaldichte bei einem bestimmten Radius eine bestimmte Anzahl an Signalen zu er-halten. Weiß entspricht dem h¨ochsten Wert, um diesen sind die Wahrscheinlichkeiten f¨ur jeden Radius normalverteilt (siehe Text). Rechts ist eine Tats¨achlich gemesse-ne Verteilung gezeigt. F¨ur diese wurde der Dynamische Bereich der Darstellung f¨ur verschiedene Bereiche der lokalen Dichte angepasst (entsprechend dem angegebenen Maximalwert und dem Farbverlauf rechts).

Da die Lokale Dichte stark variieren kann, ist es nicht zweckm¨assig, alle Abweichun-gen von einem bestimmten Dichteverlauf zu selektieren. Bei lokalen Signalanh¨ aufun-gen l¨asst sich ein charakteristischer Verlauf feststellen. Zun¨achst erfolgt ein Anstieg der Signalzahl mit dem Radius. Sobald der Radius ¨uber die Clustergrenze hinaus w¨achst, knickt die Kurve ab (siehe auch Abbildung 5.8) Dieser Wert liefert eine gro-be Absch¨atzung der Clusterausdehnung. Die Kurve liegt insgesamt ¨uber der Kurve einer zuf¨alligen Verteilung, f¨ur welche die lokale Dichte bei r =rmax angenommen wird. Als Selektionskriterien m¨ussen folgende Bedingungen erf¨ullt sein:

• Die Anzahl der benachbarten Signale steigt innerhalb der ersten 50nm sehr stark / die 1. Ableitung in diesem Bereich liegt ¨uber einem bestimmten Schwell-wert.

• Es gibt einen starken Rechtsknick im Verlauf / die 2. Ableitung hat einen Nulldurchgang und stark ausgepr¨agte Minima und Maxima.

• Innerhalb der ersten 30nm wird kein Plateau erreicht / die 1. Ableitung in diesem Bereich f¨allt nicht unter einen bestimmten Schwellwert.

5.3 Weitere Auswertung der Lokalisationsdaten

• Innerhalb der ersten 50nm gibt es mehr als 5 Nachbarn / der Verlauf liegt in diesem Bereich ¨uber einem bestimmten Schwellwert

Diese Kriterien k¨onnen auf die gesamte Signaldichte und die jeweiligen Fragestellun-gen angepasst werden. In Abbildung 5.8 sind einige beispielhafte Verl¨aufe vor und nach der Selektion gezeigt. Die Positionen der derart bestimmten Signale werden als Startpositionen f¨ur die weitere Analyse verwendet. Aus der Orte-Matrix wird ein Bereich ausgew¨ahlt, dessen Ausdehnung aus der Position des Rechtsknicks des Verlaufs bestimmt wird. Alle weitere Positionen in dies Auswahl, werden ebenfalls ber¨ucksichtigt. Die Signalpositionen in diesem Bereich werden in ein Bild einge-tragen. Dies wird mit einem Gaußkernel gefaltet, dessen Standardabweichung etwa 2% der abgesch¨atzten Clusterausdehnung entspricht, um das Bild zu gl¨atten. Mit einem Laplace-Filter [J¨ah05] werden die Umrandungen des Clusters ermittelt und mit einem ’measure’-Befehl vermessen. Auch hier werden Ausdehnung, Fl¨ache oder Anzahl der enthaltenen Positionen bestimmt.

0 50 100 150 200 0

10 20 30 40 50 60

Anzahl

r [nm] 00 50 100 150 200

10 20 30 40 50 60

r [nm]

Anzahl

0 50 100 150 200

0 2 4 6 8 10

r [nm]

/r Anzahl

0 50 100 150 200

0 2 4 6 8 10

r [nm]

/r Anzahl

0 50 100 150 200

−2

−1.5

−1

−0.5 0 0.5 1 1.5 2

2/2r Anzahl

r [nm]

0 50 100 150 200

−3

−2

−1 0 1 2 3

r [nm]

2/2r Anzahl

Abbildung 5.8:Anzahl benachbarter Signale mit ansteigendem Umgebungsradius.

Aus einer Lokalisationsaufnahme von RNA-Pol-II-Strukturen wurden, um noch eine gewisse ¨Ubersichtlichkeit zu gew¨ahrleisten, 1000 Verl¨aufe zuf¨allig ausgew¨ahlt (links).

Nach der Selektion bleiben die 73 gezeigten Verl¨aufe ¨ubrig (rechts). In der oberen Reihe ist der tats¨achliche Verlauf, in der mittleren die erste Ableitung und in der unteren die zweite Ableitung dargestellt.

5.3 Weitere Auswertung der Lokalisationsdaten

5.3.5 Bestimmung der axialen und lateralen Verschiebung bei