• Keine Ergebnisse gefunden

5.6 Definition einer Schnittstelle zur Pflege der Publikationsdaten der SWEET-

5.6.7 Entwicklung einer webbasierten Umgebung zur Eingabe von

Mit der immer größer werdenden Bedeutung dieser Messmethode für die Aufklärung von Glykanen, Lipopolysacchariden oder Proteinglykosylierungen[54, 117] sollte der Datenbestand der SWEET-DB um diese Spektren erweitert werden. Damit besteht eine bessere Möglichkeit, nach Spektren und Massenpeaks suchen zu können.

Damit es möglich ist, auch gemessene Spektren in der Datenbank abzulegen, sollte für die Eingabe und Verwaltung dieser Messdaten ebenfalls eine webbasierte

Arbeitsumgebung geschaffen werden, die es ermöglicht Spektren und die

dazugehörenden Daten dezentral zu speichern und bei Bedarf freizugeben, damit diese in anderen Datenbanken gespeichert werden können.

Dabei wurde von einem typischen Forschungsprojekt der Glykobiologie ausge-gangen, das zum Ziel hat, die Glykosylierungen eines Proteins mit Hilfe der Massenspektrometrie zu untersuchen[116, 118]. Bei der Analyse dieser Messmethoden ergab sich eine große Anzahl von Parametern, die in allen Publikationen enthalten waren. Daher müssen sie auch zusammen mit dem

Spektrum gespeichert werden, damit sie einfach wieder zur Verfügung stehen. Dazu gehörten Angaben zur Taxonomie, Gewebeart oder Spezies aus dem das

Kohlenhydrat gewonnen worden ist. Des Weiteren sollte abgespeichert werden, welche Art von Protein untersucht wurde und in welcher Publikation das Spektrum zum Schluss veröffentlicht worden ist.

5.6.7.1 Anforderungen

Um einen Schutz der Daten zu gewährleisten, wird die Eingabe einer

Benutzerkennung und eines dazugehörenden Passwortes verlangt. Das Passwort kann jederzeit geändert werden, und nachdem der Benutzer eine Stunde lang keine Eingabe mehr gemacht hat, sollte eine automatische Abmeldung erfolgen.

Die Authentifizierung des Benutzers erfolgte auf dieselbe Art und Weise wie bei der Eingabe der NMR-Spektren.

5.6.7.2 Technische Umsetzung

Bei der Entwicklung der Arbeitsumgebung zur Eingabe von Massenspektren konnte auf dieselbe Technik zurückgegriffen werden, die auch zur Eingabe der NMR-Spektren benötigt wurde. Dieses gewährleistet ein einheitliches Aussehen der Eingabe-Formulare und eine identische Installation der benötigten Komponenten.

5.6.7.3 Auswertung der Messwert-Datei

In der Regel besteht bei der Software, die bei den Massenspektrometern mitgeliefert wird, eine Möglichkeit, die Messwerte in der Form einer Massenliste als Datei zu exportieren, so dass hier sämtliche Messwerte in dieser Datei an den

Datenbankserver übermittelt werden können.

Abbildung 85: Eingabefelder zur Eingabe der Messwertdatei

Natürlich muss eine möglichst große Anzahl von Dateiformaten der einzelnen

Hersteller unterstützt werden. Es sind dies zurzeit die Formate der Firmen Micromass (pkl) und Sequest (dta). Außerdem werden zwei neutrale Formate unterstützt. Dabei handelt es sich zum einen um eine einfache Darstellung der Peaks und Intensitäten in reiner ASCII-Form:

159.076 77.8 175.084 11.9 175.119 15.8

Zum andern wird aber auch das Einlesen von Dateien im CDF-Format unterstützt.

Beim CDF-Format handelt es sich um eine Sammlung von Routinen zum Verwalten von Informationen, die sehr gut in Arrays dargestellt werden können. In dieser Dateiform sind auch zusätzliche Parameter, wie die maximale Intensität oder

Peakgrenzen, mit abgespeichert. Diese Informationen können zwar mit ausgelesen werden, sie gehen aber bei der anschließenden Speicherung der Daten verloren. Sie sind aber auch für die SWEET-DB von keinerlei Interesse.

5.6.7.4 Überprüfung auf Plausibilität

Hat der Benutzer alle Daten eingegeben, so kann er durch Anklicken des <save data>-Buttons die Daten abschicken und sie werden dann in die Datenbank geschrieben. Dabei werden die Daten überprüft und bei Fehlen einzelner Werte erfolgt eine Fehlermeldung.

Abbildung 86: Fehlermeldung der Eingabemaske

Sehr wichtig war dabei die Überprüfung des eingegebenen Spektrums auf Plausibilität. Das heißt es wird überprüft, ob das Spektrum zu der eingegebenen Struktur passt. Dazu wird von dieser Struktur mit Hilfe des Programms GLYCO-FRAGMENT ein theoretisches Spektrum berechnet. Dieses wird dann mit dem eingegebenen Spektrum verglichen, wobei mehr als 50 Prozent der Peaks auch darin enthalten sein sollten. Sollte der Wert geringer sein, wird aber nur mit einer Warnmeldung darauf hingewiesen. Da es durchaus sein kann, dass es sich nur um ein schlecht gemessenes Spektrum handelt. Der Benutzer kann diese Meldung dann ignorieren und die Werte werden dann trotzdem in die Datenbank eingetragen.

There are only 31 percent of the expected peaks in the submitted spectra!

Dieses Feature kann aber auch von vornherein abgeschaltet werden, wenn feststeht, dass das Spektrum unter Bedingungen aufgenommen worden ist, bei denen nur sehr wenige von den von Domon und Costello beschriebenen Ionen enthalten sind.

5.6.7.5 Visualisierung der Messwerte

Natürlich muss es auch eine detaillierte grafische Darstellung der eingegebenen Daten geben. Dazu ist es nötig, aus dem Spektrum eine Darstellung des

Massenspektrums zu berechnen. Dieses führt zu der folgenden Darstellung:

Abbildung 87: Detaillierte Darstellung der einzelnen Daten mit Bild des eingegebenen Spektrums

5.6.7.6 Diskussion und Ausblick

Ein erster Test durch Studenten der Biologie zeigte, dass es mit Hilfe dieser

Arbeitsumgebung möglich ist, auch eine größere Anzahl von Spektren einzugeben und zu verwalten. Durch die Verwendung von XML-Containern und etablierten Protokollen zur Übertragung der Daten in die SWEET-DB konnte die Anzahl der gespeicherten Spektren in der Zeit von sechs Monaten um 347 Spektren erweitert werden, was einer Steigerung um 15% entspricht. Durch das Webinterface kann der Benutzer seine Daten direkt über das Internet verwalten, und er ist so unabhängig von einem bestimmten Rechner oder Arbeitsplatz. Im Falle einer Publikation kann er seine Daten freigeben, und sie stehen sofort dem Datenbestand der SWEET-DB zur Verfügung. Durch die Entwicklung des Formulargenerators können ohne Probleme auch Eingabemasken für 31P- oder 17N-NMR-Spektren zur Verfügung gestellt werden.

Um die Eingabe von NMR-Spektren in Zukunft zu beschleunigen, sollte auch die Möglichkeit gegeben sein, die Kurvenzüge der Messwerte als JCAMP-Datei einzulesen. Die Eingabe von NMR- und Massenspektren verkürzt sich durch die Arbeitsumgebung sehr stark, und durch die einfache Übertragungsmöglichkeit an die SWEET-DB brauchen Daten nicht doppelt eingegeben werden. Es braucht daher keine aufwendige Kontrolle durch einen Experten erfolgen.

Durch die sorgfältige Entwicklung der Schnittstellen zum Datentransfer ist auch für zukünftige Anwendungen eine Basis geschaffen, die einen weiteren Ausbau des Datenbestandes der SWEET-DB gestattet.