• Keine Ergebnisse gefunden

4. Zuordnung basierend auf 1 H 15 N-4D-NOESY-Spektren 34

4.3.1. Performance Tests

Mit den gegebenen chemischen Verschiebungen wurde aus den 3D-Strukturen für alle drei Testsysteme jeweils ein künstliches 4D-Spektrum unter Verwendung der Beziehung V =A·r−6 erzeugt. Hierbei wurde für die KonstanteAder Wert 8192000 gewählt. Beim Ubiqutin wurde für alle Amidgruppen, deren Wasserstoffatome nicht weiter als 5,5Å entfernt waren ein NOESY-Signal erzeugt. Bei den beiden anderen Testsystemen wurde der Maximalabstand auf7,0Å festgelegt. Für Ubiquitin ergaben sich mit dem gewählten maximalen Abstand von5,5Å 338 NOE-Kontakte. Alle chemischen Verschiebungen der Amidsignale im Ubiquitin waren verschieden genug, so dass auf Doppelsignale verzichtet werden konnte.

Die Zuordnung wurde mit Hilfe der Rate eindeutig zugeordneter Signale, im folgen-den als UASR (unambigous assignment rate) abgekürzt, bewertet. Diese entspricht dem Anteil eindeutig zugeordneter Amidsignale im Protein. Im Falle des Ubiquitins konnte

eine UASR von 95 % erreicht werden. Auf einem Kern einer Intel i7-3770 CPU betrug die Rechenzeit lediglich7,7 s.

Im Anhang in Kapitel B.1 sind alle Zuordnungsmöglichkeiten nach der Initialisie-rungsphase dem ersten Aufruf der Reduce Assignment-Routine und dem Abschluss der Optimierungsroutine gezeigt. Dabei zeigt sich, dass bereits vor Aufruf der routine einige eindeutige Zuordnungen erreicht werden konnten. In der Optimierungs-routine können dann, nach der Überprüfung einiger weniger Äste, durch den erneuten Aufruf derReduce assignment-Routine die anderen Mehrdeutigkeiten aufgelöst werden, so dass sich eine vollständige eindeutige Zuordnung ergibt. Für vier Aminosäuren konn-ten experimentell keine Amidresonancen bestimmt werden; somit ergibt dies eine UASR von 7276 = 95 %.

Im Falle des YuaF resultieren, mit einem Maximalabstand von 7,0Å, 366 NOE-Kontakte. Hier fallen die beiden Amidsignale der Aminosäuren Tyr62 und Leu67 so dicht zusammen, dass sie als Doppelsignal behandelt wurden. Auch hier konnten bereits nach der Initialisierung und dem ersten Aufruf der Reduce Assignment-Routine einige eindeutige Zuordnungen erhalten werden. Folglich können auch hier nach dem Über-prüfen einiger weniger Äste und dem erneuten Aufruf der Reduce Assignment-Routine fast alle Mehrdeutigkeiten entfernt werden, so dass auch hier eine entsprechend kurze Rechenzeit von nur6,6s resultiert. Auf Grund fehlender Restraints zur Amidgruppe des Ile84, kann der Algorithmus nicht unterscheiden, ob das Signal tatsächlich zum Ile84 oder zu einer der fehlenden Aminosäuren (Ser2, His3, Asn73) gehört. Somit sind dann alle Aminosäuren, bis auf die sieben fehlenden und das terminale Ile84, eindeutig zugeordnet, was einer UASR von 7684 = 90 %entspricht.

Beim Enzyme I resultieren 1276 NOE-Kontakte, wobei hier die Aminosäuren Ile31 und Glu109 sowie die Aminosäuren Arg131 und Glu155 so dicht beieinander liegen, dass sie als Doppelsignale behandelt werden. Nach dem ersten Aufruf der Reduce Assignment -Routine konnte noch kein einziges Signal eindeutig zugeordnet werden, weswegen hier zahlreiche Äste in der Optimierungsroutine überprüft werden müssen, um eindeutige Zuordnungen erhalten zu können. Erst ein darauf folgender erneuter Aufruf der Reduce Assignment-Routine kann dann zahlreiche eindeutige Signale ergeben. Folglich ist die Rechenzeit für das Enzyme I mit 392 s deutlich länger als für die beiden ersteren Bei-spiele. Dafür konnten aber nach Abschluss der Optimierung alle Signale außer einem eindeutig zugeordnet werden. Für das Signal, das zur Aminosäure His189 gehört, kann der Algorithmus nicht entscheiden, ob dieses zur Aminosäure His189 oder zur fehlen-den Aminosäure Ser191 gehört, weil sich beide Aminosäuren räumlich sehr nahe sind und alle drei Restraints sich für beide Aminosäuren erfüllen lassen. Insgesamt konnten 251 Signale eindeutig zugeordnet werden entsprechend einer UASR von 251259 = 97 %. Die Ergebnisse sind in der Tabelle 4.1 nochmals zusammengefasst.

Betrachtung von Unsicherheiten

Motiviert von den vielversprechenden Ergebnissen, die für die künstlich erzeugten 4D-Spektren erhalten wurden, soll nun überprüft werden, wie robust der Ansatz ist. Auf Grund der Flexibilität des zu untersuchenden Proteins und auf Grund der begrenzten

Tabelle 4.1.: Übersicht der Ergebnisse an Tests an künstlichen erzeugten Spektren.

Protein maximaler Abstand [Å] Anzahl NOE-Kontakte UASR [%] Rechenzeit [s]

Ubiquitin 5,5 338 95 7,7

YuaF 7,0 366 90 6,6

Enzyme I 7,0 1276 97 392

Auflösung eines Spektrums treten bei realen Spektren zwangsläufig Ungenauigkeiten in den Integralen und den daraus resultierenden Restraints auf.

Dies wurde an den künstlichen Spektren simuliert, indem einzelne Restraints verlän-gert oder ganz entfernt wurden. Dazu wurde in einer ersten Testreihe für Ubiquitin zu jedem Restraint eine zufällige Unsicherheit zwischen Null und einem Maximalwert ad-diert. Mit diesen so erhaltenen Restraints wurde die Berechnung dann wiederholt. Eine Verkürzung einzelner Restraints ergibt keinen Sinn, da dies auf Grund des dead end -Mechanismus zwangsläufig zum Programmabbruch führt. Dieses Problem wird in der Realität dadurch umgangen, dass das Referenzsignal iterativ bestimmt und so die Um-rechnungskonstante A entsprechend größer bestimmt wird. Wie später gezeigt, führen die aus solchen Artefakten resultierenden Restraints für alle anderen Signale aber zu schlechteren Zuordnungsraten und im ungünstigsten Fall zur Entfernung der korrekten Zuordnung. Deswegen wird später ein Ansatz beschrieben, um einzelne Artefakte zu identifizieren und zu entfernen.

Die Ergebnisse dieser Testreihe für das Ubiquitin sind in Tabelle 4.2 zusammengefasst.

Dabei zeigte sich, dass Unsicherheiten bis zu1,0Å zu keinen Problemen führen, da dann immer noch alle Signale eindeutig zugeordnet werden können. Lediglich die Rechenzeit steigt etwas an. Allerdings ist sie bei einem maximalen Fehler von1,0Å mit13,0 simmer noch sehr kurz. Bei einer weiteren Steigerung des maximalen Fehlers auf bis zu 2,0Å wird immer noch eine eindeutige Zuordnung für die meisten Signale erhalten, bei einigen Signalen kommt es dann aber zu Mehrdeutigkeiten. Diese Signale entsprechen denjeni-gen Amidgruppen im Protein, die nur durch wenige Restraints beschrieben werden. Ein Beispiel sind die beiden Aminosäuren Asp39 und Gln40, die auf der einen Seite von den beiden Prolinen Pro37 und Pro38 abgegrenzt sind und auf der anderen Seite nur weni-ge Restraints zu den weiteren Aminosäuren zeiweni-gen. Sind diese dann zu lang, kann nicht mehr eindeutig unterschieden werden, welches Signal zu welcher der beiden Aminosäuren gehört. Ähnlich verhält es sich bei den dem Lösemittel zugewandten Aminosäuren, die nur Restraints zu ihren Nachbarn zeigen. Sind diese Restraints für beide Aminosäuren zu lang, so kann nicht mehr unterschieden werden, welches Signal zu welcher Amidgrup-pe gehört. Nicht überraschend ist der deutliche Anstieg der Rechenzeit auf bis zu 151 Sekunden. Zunächst werden weniger eindeutige Zuordnungen zu Beginn der Optimie-rung erhalten, so dass anschließend mehr Äste untersucht werden müssen. Im weiteren Verlauf können bei der Zuordnung weiterer Amidgruppen durch die folgenden Aufrufe derReduce Assignment-Routine weniger Zuordnungsmöglichkeiten entfernt werden. Mit nur151,6 sist die Rechenzeit aber auch dann noch recht kurz.

bbb

Abbildung 4.5.: Übersicht über die UASR-Raten abhängig von der Anzahl verbleibender Restraints. In schwarz die beste und in blau die schlechteste der 100 Rechnungen.

Tabelle 4.2.: Übersicht über die Zuordnungen bei der Hinzunahme von Unsicherheiten.

Maximaler Fehler [Å ] UASR [%] Rechenzeit [s] Mehrdeutige Aminosäuren

0,0 95 2,8

0,2 95 2,8

0,4 95 5,1

0,6 95 5,8

0,8 95 4,6

1,0 95 13,0

1,2 92 17,9 D39/Q40

1,4 95 23,8

1,6 89 23,6 D39/Q40 und D52/G53

1,8 87 81,0 E34/G35/I36 und D39/Q40/Q41

2,0 87 151,6 E34/G35 und D39/Q40 und D52/G53

Neben der Verlängerung von Restraints sollte nun auch noch getestet werden, wie robust der Ansatz gegenüber fehlenden Restraints ist. Dies soll der Tatsache Rechnung tragen, dass in realen Spektren kleine Signale manchmal hinter größeren verschwinden oder je nach Auflösung des Spektrums auch einzelne Signale im Rauschen nicht mehr aufzulösen sind. Hierzu wurde das vollständige künstlich erzeugte Ubiquitinspektrum verwendet. Aus diesem wurden dann zufällig eine bestimmte Anzahl an Restraints ent-fernt. Da es auch darauf ankommt, welche Restraints entfernt werden, wurden 100 Rech-nungen durchgeführt, bei denen jeweils zufällig die gleiche Anzahl Restraints entfernt wurden. Von diesen 100 Rechnungen wurde für jede die UASR berechnet. Es wurden dann jeweils die beiden Rechnungen mit der höchsten und mit der niedrigsten UASR betrachtet. Dabei ergaben sich die in Abbildung 4.5 gezeigten Ergebnisse.

Dabei fällt zunächst auf, dass bei den besten Ergebnissen selbst bei mehr als der Hälf-te an fehlenden Restraints noch alle Signale eindeutig zugeordnet wurden. Dies war zu erwarten, da ein NOESY-Spektrum zunächst symmetrisch ist, so dass jeder Restraint genau zwei mal auftaucht. Werden also nur Restraints entfernt deren symmetrieäqui-valenter Restraint noch enthalten ist, geht keinerlei Information verloren. Von größerer Bedeutung sind die schlechtesten Fälle. Bei diesen fällt auf, dass selbst dann noch eine recht hohe UASR von über 80 % erreicht werden kann, wenn die Hälfte aller Restraints entfernt wurde.

Danach kommt es zu einem plötzlichen Zusammenbruch und die UASR fällt sehr schnell auf 0 %. Dieser Zusammenbruch tritt im Bereich von 100 bis 150 verbleibenden Restraints auf. Um diesen Zusammenhang besser zu verstehen, ist es hilfreich, die Res-traints in 3D zu betrachten (Abbildung 4.6). Die α-Helix im Bereich der Aminosäuren 1 bis 33 ist nur durch sehr wenige Restraints mit dem Rest des Proteins verbunden. Die Unterbrechnung des Restraintsnetzwerks beruht besonders darauf, dass am Ende der Helix zwei Proline folgen, die keine Amidprotonen besitzen. Innerhalb der Helix liegen allerdings viele Restraints zwischen den einzelnen Amidgruppen vor. Solange es gelingt,

die Amidgruppen der Helix zuzuordnen, werden diese Zuordnungsmöglichkeiten bei den anderen Signalen entfernt, so dass dann auch diese eindeutig zugeordnet werden kön-nen. Lediglich bei einigen Gruppen, insbesondere dem C-Terminus, die nur sehr wenige Restraints haben, kann es auf Grund fehlender Restraints dann zu einzelnen Mehrdeutig-keiten kommen. Gelingt es aber nicht mehr, die Signale der Helix zuzuordnen, verbleiben zu viele Möglichkeiten im Rest des Proteins, so dass dann gar keine Amidgruppe mehr eindeutig zugeordnet werden kann und die UASR auf 0 % fällt.

Abbildung 4.6.: Darstellung der Restraints im Ubiquitin. Rechts Nahansicht derα-Helix.

Im zuletzt beschriebenen Test wurde die Symmetrie des NOESY-Spektrums nicht be-trachtet und die Restraints rein zufällig entfernt. Um nun auch der Symmetrie Rechnung zu tragen, wurde der Test wiederholt und es wurden jeweils beide über die Symmetrie zusammengehörigen Signale entfernt. Dazu wurden erneut jeweils 100 Rechnung durch-geführt, bei denen rein zufällig die entsprechende Anzahl an Restraints entfernt wurde, nur dass dieses Mal auch der über die Symmetrie zugehörige Restraint entfernt wurde.

Die Ergebnisse sind in Abbildung 4.7 dargestellt. Auffallend ist im Bezug auf die blauen Kurve, welche die jeweils schlechteste Berechnung darstellt, dass sie zunächst bei noch mehr verbleibenden Restraints stärker abfällt. Aber auch in diesem Fall, bei noch bis zu 200 verbleibenden Restraints, kann mit einer UASR von etwa 80 % ein gutes Ergebnis erreicht werden. Hier kommt es dann bei Amidgruppen, die nur wenige Restraints zeigen schneller zu Mehrdeutigkeiten, es bleiben aber diejenigen Gruppen und insbesondere die Helix, die noch viele Restraints zeigen, eindeutig zugeordnet. Erst bei weniger als 150 verbleibenden Restraints kommt es zum Zusammenbruch, so dass dann eine UASR von 0 % resultiert. Bei der schwarzen Kurve, die die besten Ergebnisse beschreibt, kommt es bereits ab weniger als 200 verbleibenden Restraints zu einzelnen Mehrdeutigkeiten.

Zusammenfassend kann also die Aussage getroffen werden, dass wenn etwa ein Drittel aller Restraints fehlt immer noch eine UASR von mehr als etwa 80 % erreicht werden kann.