Automatische Identifikation von Doppelsignalen

6. Ergänzende Untersuchung 77

6.2. Automatische Identifikation von Doppelsignalen

In diesem Abschnitt soll unteruscht werden, inwieweit Doppelsignale automatisch als solche identfiziert werden können. In der Praxis kann es manchmal schwierig sein, Dop-pelsignale mit Sicherheit als solche zu identifizieren. In diesem Fall muss das Programm in der Lage sein selbstständig herauszufinden, wie viele Doppelsignale es gibt und welche dies sind. Dazu werden nun im folgenden einige Möglichkeiten aufgezeigt und getestet.

Hierbei soll vor allem auch getestet werden, wie schnell der Algorithmus ist, also wie viel Rechenzeit nötig ist, im Vergleich zur manuellen Identifikation der Doppelsignale. Die im folgenden beschriebene Routine zur Zuordnung von Doppelsignalen ist auf eine arte-faktfreie Liste von NOESY-Signalen angewiesen, da es sonst zu Verwechslungen kommt, ob ein NOESY-Signal sich nicht erfüllen lässt, weil es zu zwei Amidgruppen kommt oder weil es lediglich ein zu großes Volumen besitzt.

6.2.1. Methodik

Für die Suche nach einem Doppelsignal, wird zunächst in jeder NOE-Ebene die Anzahl an NOE-Signalen gezählt. Hierbei wird angenommen, dass es umso wahrscheinlicher ist, dass ein Signal ein Doppelsignal ist, je mehr NOE-Signale sich in einer NOE-Ebene be-finden. Im ersten Schritt wird dabei angenommen, dass nur ein Doppelsignal vorhanden ist. Dazu wird iterativ ausprobiert, ob eine fehlerfreie Optimierung möglich ist, wenn das gewählte Signal ein Doppelsignal ist. Die Auswahl der zu prüfenden Signale erfolgt dabei nach der Anzahl ihrer NOE-Signale in ihrer NOE-Ebene. Dabei wird mit demje-nigen Signal begonnen, welches die meisten NOE-Signale zeigt. Sobald eine fehlerfreie Optimierung durchgeführt wird, wird die Doppelsignalzuordnung beendet und das bis dahin als Doppelsignal zugeordnete Signale im folgenden als Doppelsignal behandelt.

Gelingt es nicht im ersten Schritt ein Doppelsignal als solches zu identifizieren und da-mit eine eindeutige Zuordnung zu erreichen, wird in einem zweiten Schritt angenommen, dass es zwei Doppelsignale gibt. Hierfür wird im Anschluss wiederum iterativ dasjeni-ge Signal mit den meisten Restraints dasjeni-gesucht und als Doppelsignal andasjeni-genommen. Nach dieser ersten Annahme wird jedes weitere Signal iterativ als zweites Doppelsignal an-genommen. So wird, falls die erste Annahme eines Doppelsignals falsch ist, zwar eine Vielzahl nicht zielführender Möglichkeiten überprüft. Allerdings lässt sich das Programm leicht paralellisieren. So können die einzelnen Überprüfungen gleichzeitig auf mehreren Prozessoren ausgeführt werden.

6.2.2. Ergebnisse

Im ersten Schritt wurde der Algorithmus am künstlich erzeugten Spektrum des YuaF aus Kapitel 4 getestet. Die beiden Amidsignale des Tyr62 und des Leu67 sind sich in diesem System so ähnlich, dass sie als Doppelsignal aufgefasst wurden. Das Doppelsignal hatte dabei die chemischen Verschiebungen vonδ¹⁵N = 120,50 ppmundδ¹H = 8,85 ppm.

Dieses Doppelsignal besitzt 11 NOE-Restraints. Um den Algorithmus zu testen, wurde die Information, dass dieses Signal das Doppelsignal ist nicht an das Programm überge-ben. Der Algorithmus fand nach einer Rechenzeit von lediglich 10 Sekunden heraus, dass dieses Signal das Doppelsignal ist und konnte damit eine für alle Signale, bis auf das terminale Ile84, eine eindeutige Zuordnung erzeugen. Dieses Ergebnis war in der Hinsicht zu erwarten, da kein anderes Signal 11 oder mehr Restraints besitzt und der Algorithmus somit das Doppelsignal auch als erstes als Doppelsignal prüft. Um zu zeigen, dass der Algorithmus dieses Signal auch dann richtigerweise als Doppelsignal zuordnet, wenn es nicht sofort als Doppelsignal identifiziert wird, wurden 4 Restraints entfernt, so dass noch 7 Restraints übrig blieben. Die 4 entfernten Restraints waren einerseits zwei Restraints ausgehend vom Tyr62 zum Ala30 und zum Ser61 sowie andererseits zwei Restraints aus-gehend vom Leu67 zum Val68 und zum Val69. Hierbei konnte nach einer Rechenzeit von 51 Sekunden die gleiche Zuordnung wie mit dem vollständigen Set erhalten werden.

Zudem wurde das Doppelsignal auch als solches identifiziert. In einem letzten Schritt wurde noch ein fünfter Restraint, derjenige vom Leu67 zum Val66, entfernt. Mit diesem erneut reduzierten Set konnte nach einer Rechenzeit von 178 Sekunden erneut das

Dop-pelsignal als solches identifiziert werden und wiederum die gleichen Zuordnungen wie mit dem vollständigen Set erhalten werden.

Um den entwickelten Algorithmus an einem möglichst realen System zu testen, wur-de das gemessene Spektrum wur-des Ubiquitin aus Kapitel 4 verwenwur-det. Da dieses keine Doppelsignale enthält, wurden die beiden Signale des Ile23 und des Ala28 zu einem Doppelsignal zusammengefasst. Als chemische Verschiebungen für dieses Doppelsignal wurden diejenigen des Ile23 (δ¹H = 8,51 ppm und δ¹⁵N = 121,45 ppm) verwendet. Wird der Algorithmus wie in Kapitel 4 aufgerufen und die Information, dass es sich bei diesem Signal um ein Doppelsignal handelt mitgegeben, so wird dieses Signal eindeutig diesen beiden Amidgruppen zugeordnet. In der Folge werden alle anderen Signale, die ohne die Zusammenfassung dieser beiden Signale zu einem Doppelsignal eindeutig zugeordnet wurden, immer noch eindeutig zugeordnet.

Wird der Algorithmus zur automatischen Bestimmung der Doppelsignale, wie be-schrieben, mit diesem Testsystem gestartet, so identifiziert der Algorithmus nach 59 Sekunden das Doppelsignal und kommt zum oben genannten Ergebnis. Auch hier ist es zunächst wenig verwunderlich, dass der Algorithmus das Doppelsignal so schnell findet, da dieses 8 Restraints und damit mehr Restraints als jedes andere Signal besitzt, wird auch hier direkt das Doppelsignal auch als solches geprüft und identifiziert. Um diesen Fall etwas anspruchsvoller zu gestalten, wurden von dem Doppelsignal zwei Restraints entfernt. Zum einen der Restraint vom Ile23 zum Thr22 und zum anderen der Restraint vom Ala28 zum Lys29. Nun verfügte das Doppelsignal nur noch über 6 Restraints. Nach einer Rechenzeit von 80 Sekunden führte auch die Rechnung mit diesem reuzierte Set von Restraints zum gleichen Ergebnis wie die Rechnung mit dem vollständigen Set an Restraints. Zudem wurde erneut das Doppelsignal auch als solches identifiziert.

Als drittes Testsystem wurde das Enzyme I verwendet, welches zwei Doppelsignale ent-hält. Dies ist einerseits das Signal mit den chemischen Verschiebungen δ¹H = 8,09 ppm und δ¹⁵N = 117,35 ppm, welches zu den beiden Amidgruppen der Aminosäuren Arg131 und Glu155 gehört sowie andererseits das Signale mit den chemischen Verschiebungen δ¹H = 8,28 ppmund δ¹⁵N = 117,85 ppm, welches zu den beiden Amidgruppen der Ami-nosäuren Ile31 und Glu109 gehört. Wird das Programm auf einem Prozessor ausgeführt, so werden nach einer Rechenzeit von 1676 Minuten, beide Doppelsignale als solche iden-tifiziert und die korrekte Zuordnung erhalten. Bei einer Berechnung auf 64 Prozessoren reduziert sich die Rechenzeit auf 120 Minuten. In beiden Fällen, wird eine UASR von 97% erhalten, so wie sie auch erhalten wird, wenn beide Doppelsignale als solche vorge-geben sind.

Zusammenfassend kann somit festgestellt werden, dass es möglich ist Doppelsignale auch automatisch als solche zu identifizieren. Der Zeitaufwand bei der Identifikation ei-nes Doppelsignals fällt in den meisten Fällen kaum ins Gewicht, bei zwei Doppelsignalen, steigt der Rechenaufwand allerdings deutlich an. Der zeitkritische Schritt konnte hier-bei allerdings gut paralellisiert werden, so dass die Rechenzeit wieder reduziert werden konnte.

Im Dokument Automatische Zuordnung von NMR chemischen Verschiebungen anhand einer bekannten Proteinstruktur (Seite 82-85)