• Keine Ergebnisse gefunden

Minimierung unerwünschter und falscher Zuordnungen

3.Material und Methoden

________________________________________MATERIAL UND METHODEN abgespeichert. Dieser Quotient ergibt dabei immer eine ganze Zahl (Integerzahl), welche

5.2 Verbesserung der Zuordnungsqualität

5.2.3 Zunahme der Zuordnungssicherheit

5.2.3.1 Minimierung unerwünschter und falscher Zuordnungen

Das Programm KNOWNOE wendet bei der Zuordnung von zwei- und dreideutigen NOESY- Signalen einen statistischen bzw. wissensbasierten Ansatz an. Ziel hierbei ist es, möglichst vielen NOESY-Signalen das Atompaar mit jeweils einer hohen Wahrscheinlichkeit von den vorhandenen Zuordnungsmöglichkeiten zuzuweisen, welches das in Frage stehende Signalvolumen zu mindestens 90 Prozent erklärt. Diese Zuordnungen bilden eine besonders gute Basis für eine exakte Abstandbestimmung. Da es sich hierbei allerdings um ein statistisches Verfahren handelt, kommen zu einem gewissen Prozentsatz auch weniger geeignete Signalzuordnungen vor, welche, zumindest theoretisch, zu einem mehr oder weniger großen Abstandsfehler führen. Diese wiederum können während der Strukturrechnung zur Verzerrung der zu untersuchenden Proteinstruktur führen bzw. die Bestimmung der wirklichen Konformation erschweren. Deshalb war ein wichtiges Ziel der Arbeit, neben der Steigerung der Gesamtzahl von Signalzuordnungen, den Anteil nicht geeigneter Zuordnungen zu minimieren. Generell kann man zwischen zwei Arten von ungeeigneten Zuordnungen unterscheiden:

1. Dem in Frage stehenden NOESY-Signal wird ein Atompaar zugewiesen, das nicht wirklich den größten Teil des vorhandenen Signalvolumens erklärt (hier auch als falsche Zuordnung bezeichnet). Hierbei ist immer eine Zuordnung vorhanden, welche einen größeren Anteil am Signalvolumen, als die jeweils gewählte Zuordnung besitzt.

_________________________________________________________________________________________DISKUSSION

2. Es erfolgt eine Zuordnung obwohl es kein Atompaar innerhalb der Struktur gibt, welches das betreffende NOESY-Signal zu mindestens 90 % erklärt (hier auch als unerwünschte Zuordnung bezeichnet).

Hierbei ist allerdings zu berücksichtigen, dass, unter Anwendung der ISPA-Methode, der resultierende Abstandsfehler auch bei prozentual geringeren Beiträgen von der gewählten Zuordnungsmöglichkeit zum Signalvolumen, oft relativ gering ausfällt. Wie in Abbildung 5.2 zu sehen führt beispielsweise die Abstandsberechung für ein Atompaar, welches nur 40%

eines in Frage stehenden Signalvolumens erklärt, zu einem nur etwa 16% kürzeren Abstand, im Vergleich zu dem Abstand den man erhalten hätte, wenn das Atompaar mehr als 90% des Signalvolumens erklären würde. Aus diesem Grunde kann man sagen, dass auch Zuordnungen bzw. Atompaare mit Beiträgen ab etwa 40% zum Gesamtvolumen eines NOESY-Signals für die Praxis noch brauchbare Abstände liefern.

46,80

30,80 22,40

16,40 12,40

8,80 6,00

3,60 0,64 0

10 20 30 40 50

0 10 20 30 40 50 60 70 80 90 100

Volumenanteil (%)

Abstandsfehler (%)

Es konnte gezeigt werden, dass die prozentualen Anteile dieser Art von Zuordnungen unter Benutzung der neuen Datenbank 3 deutlich erhöht werden konnte. Dies zeigt sich insbesondere bei sehr kleinen eingestellten Suchradien (s. Abb. 5.3), da bei diesen, wie bereits erwähnt, die Anteile von Atompaaren mit relativ geringen Beiträgen zum Signalvolumen unter den potentiellen Zuordnungsmöglichkeiten, sehr hoch ist.

Abbildung 5.2: Abstandsfehler. Die Grafik zeigt den prozentualen Abstandsfehler, der sich theoretisch ergeben würde, wenn einem NOESY-Signal ein Atompaar zugeordnet wird, welches sein Signalvolumen in Wirklichkeit zu 10%, 20% usw. erklärt. Die Überlegung beruht auf der Annahme, dass zwischen dem Abstand r zweier Atome und dem Signalvolumen V eines NOESY-Signals die Beziehung V~1/r6 gilt (ISPA-Methode).

_________________________________________________________________________________________DISKUSSION

Die Auswirkung von falschen Zuordnungen für die Abstandsbestimmung muss, in Anbetracht der oben gemachten Überlegungen, differenzierter betrachtet werden. Anhand der Abbildung 5.2 kann man sagen, dass falsche Zuordnungen zu einem umso größeren Abstandsfehler (zu kurzer Abstand) führen werden je größer der Anteil der richtigen Zuordnung am Gesamtvolumen des in Frage stehenden NOESY-Signals ist. Somit haben falsche Zuordnungen von NOESY-Signalen, die von keinem Atompaar zu mindestens 90% erklärt werden generell eine geringere negative Auswirkun auf die Abstandsbestimmung als falsche Zuordnungen innerhalb von NOESY-Signalen, welche durch ein bestimmtes Atompaar stark (mind. 90%) dominiert werden. Es hat sich ergeben, dass unter Anwendung der neuen Datenbank 3, im Vergleich zur herkömmlichen Datenbank, innerhalb beider genannter Gruppen, der prozentuale Anteil an falschen Zuordnungen deutlich verringert werden konnte.

Dies zeigte sich besonders deutlich bei sehr kleinen eingestellten Suchradien unter denen, wie bereits in Kapitel 4.2.2.4 gezeigt, der prozentuale Anteil falscher Zuordnungen im allgemeinem besonders hoch ist.

Es konnte gezeigt werden, dass unter Anwendung der neuen Datenbank 3 und bei jeweils denselben Versuchbedingungen, die Fehlerquoten wesentlich geringer ausfielen. So konnte bei einem Suchradius von 0,6 nm und einer eingestellten Wahrscheinlichkeitsgrenze von P=0,98 für die Gruppe von NOESY-Signalen, welche durch kein bestimmtes Atompaar

Abbildung 5.3: Zunahme brauchbarer Zuordnungen. Die Grafik zeigt jeweils die prozentualen Anteile von zugeordneten zwei- und dreideutigen NOESY-Signalen, deren zugewiesene Zuordnung mindestens 40% vom Signalvolumen erklärt (=brauchbare Zuordnung). Der orangefarbene Balken zeigt die Werte bei der Benutzung der herkömmlichen Datenbank, der grüne Balken steht für die neue Datenbank 3 und der hellgrüne Balken für die neue Datenbank 3 unter Berücksichtigung vom Suchradius.

Die Werte sind für die simulierten 2D-NOESY-NMR-Spektren der Proteine CSP und HPr bei einem eingestellten Suchradius von 0,6nm dargestellt. Die Wahrscheinlichkeitsgrenze betrug P=0,98.

_________________________________________________________________________________________DISKUSSION

dominiert (mind. 90%) werden, die Fehlerquote von 39% auf 28% (Protein CSP) und von 37% auf 31% (Protein HPr) erniedrigt werden. Für die entsprechend andere Gruppe konnte die Fehlerquote von durchschnittlich 14-15% auf etwa 3-4% verringert werden. Für die Strukturbestimmung ist die erreichte Reduzierung von falschen Zuordnungen innerhalb der letztgenannten Gruppe von NOESY-Signalen besonders wichtig, da hier falsche Zuordnungen zu besonders großen Abstandsfehlern führen. Darüber hinaus wäre hier noch anzumerken dass, wie in Kapitel 4.2.2.8 gezeigt, die Anteile falscher Zuordnungen mit steigendender Wahrscheinlichkeitsgrenze, unabhängig von der benutzten Datenbank, sinken. Allerdings geschieht dies unter Verwendung der neuen Datenbank 3 schneller.

Besonders destruktiv auf die Strukturbestimmung wirken sich solche Zuordnungen von NOESY-Signalen aus, die fälschlicherweise eine räumliche Nähe von sequentiell weit auseinanderliegenden (langreichweitigen) Atompaaren propagieren. Während der Strukturrechung genügt bereits nur eine dieser Zuordnungen, um die Struktur in eine völlig falsche Konformation zu führen. Solche Zuordnungen können besonders zu Anfang der Strukturbestimmung verhängnisvoll sein, da in diesem Moment eine einigermaßen richtige Grobfaltung des zu untersuchenden Proteins für den Erfolg des weiteren Strukturbestimmungsprozesses entscheidend ist. Zusätzlich ist anzumerken, dass sich falsche Zuordnungen, aufgrund des zu Anfang vorliegenden relativ unrealistischen Strukturmodells, nur sehr schwer erkennen bzw. ausschließen lassen. Deshalb ist es wichtig, dass es gar nicht erst zu solcher Art von Zuordnungen kommt. Die Testreihen zeigten, dass unter Benutzung der herkömmlichen Datenbank oft solche gefährlichen Zuordnungen vorkommen. So konnten z.B. bei einem Suchradius von 10,0 nm und einer gewählten Wahrscheinlichkeitsgrenze von P=0,98 für das simulierte 2D-NOESY-NMR Spektrum vom Protein CSP gleich drei falsch zugeordnete NOESY-Signale mit Zuordnungen bzw. Atompaaren mit jeweils über 20 Aminosäuren Sequenzabstand beobachtet werden. Bei Benutzung der neuen Datenbank 3 wurde hingegen, unter der eingestellten Wahrscheinlichkeitsgrenze von P=0,98, unabhängig von Spektrum oder Suchradius, keine falsche langreichweitige Zuordnung beobachtet. Dieses Resultat lässt sich, wie aus den Grafiken der Kapitel 4.1.2.3 deutlich zu entnehmen, mit der allgemein geringen statistischen Wahrscheinlichkeit für eine räumlichen Nähe (≤ 0,5nm) sequentiell weit entferner Atome begründen. Aus demselben Grund erhielten, wie in Kapitel 4.2.2.6 gezeigt, unter Benutzung der neuen Datenbank 3, langreichweitige zwei- und dreideutige NOESY-Signale, im Falle einer erstellten Zuordnung, immer jeweils eine falsche und zugleich sequentiell kürzere Zuordnungsmöglichkeit (=Atompaar) zugewiesen. Unter Benutzung der herkömmlichen Verteilungen konnten hingegen wenige richtige

_________________________________________________________________________________________DISKUSSION

langreichweitige Zuordnungen beobachtet werden. Da diese, genau wie die bereits erwähnten falschen langreichweitigen Zuordnungen, vermutlich auf Unstimmigkeiten innerhalb der Verteilungen zurückzuführen sind, kann man solche Zuordnungen nicht positiv bewerten.

Zusammenfassend kann man aufgrund der Ergebnisse sagen, dass die neuen Wahrscheinlichkeitsdichteverteilungen die statistischen Verteilungen interatomarer Abstände innerhalb von Proteinen, im Vergleich zu den herkömmlichen Verteilungen, besser wiedergeben. Die dadurch erreichte größere Sicherheit der Zuordnungen führte wiederum zu geringeren Abstandsfehlern, wie bereits in Kapitel 4.2.2.7 gezeigt werden konnte.