• Keine Ergebnisse gefunden

1. Einleitung

1.3 Dereplikation

Für die agrarchemische und pharmazeutische Industrie stellen Sekundärstoffe eine wichtige Quelle biologisch aktiver Substanzen dar, da sie als Leitstrukturen für die Entwicklung neuer Wirkstoffe genutzt werden können. Im Zuge des technischen Fortschritts wurden vollautomatisierte Methoden entwickelt und so eine immer schnellere Analyse von komplexen Sekundärstoffmischungen und Reinsubstanzen ermöglicht. Das Ergebnis dieser Bemühungen spiegelt sich in den über 250000 natürlichen und semisynthetischen Substanzen wieder, die in der aktuellen Ausgabe des Dictionary of Natural Products verzeichnet sind.

Doch trotz des immer größer werdenden Probendurchsatzes stagniert die Zahl der jährlich identifizierten Naturstoffe mit wirklich neuartigen Strukturen seit Beginn der Naturstoffforschung in den 1960er Jahren. Zwischen 1960 und 1980 wurden allein aus Streptomyceten ca. 75 neue Antibiotika pro Jahr entdeckt, bis zum Jahr 2000 hat sich diese Zahl auf bereits auf ca. 20 verringert30. Durch das High-Troughput-Screening und standardisierte Bioassays werden tausende Extrakte von Pflanzen oder Mikroorganismen auf ihre physiologische Aktivität überprüft. Durch evolutionäre Zusammenhänge gibt es jedoch wiederkehrende Motive bei den biologisch aktiven Naturstoffen, so das nur wenige der aktuell isolierten Substanzen über eine völlig neuartige Struktur verfügen. Aus diesem Grund ist es nötig die Strategien und Methoden für die Suche nach neuen Naturstoffen immer wieder zu hinterfragen und zu optimieren.

Die Effizienz der Naturstoffforschung kann durch eine möglichst frühzeitige Dereplikation, d. h. Identifikation bereits bekannter Verbindungen, entscheidend verbessert werden, da so der Arbeitsaufwand für die Isolierung und Strukturaufklärung von Reinsubstanzen minimiert werden kann. Das hierzu verwendete Standardverfahren ist die Analyse der Extrakte durch eine Kopplung von Hochleistungs-Flüssigchromatographie (HPLC), UV-Spektrometrie (DAD) und Massenspektrometrie (MS), kurz LC-MS31. Auf diese Weise ist es möglich einzelne Substanzen anhand ihrer Retentionszeiten, UV-Spektren und Molmassen zu charakterisieren und mit bereits bekannten Verbindungen zu vergleichen. In der Praxis birgt dieses Verfahren jedoch viele Tücken32. Es gibt keine öffentlich zugängliche oder kommerzielle Datenbank, in der die HPLC-Chromatogramme mit den MS-Spektren der bekannten Sekundärstoffe korreliert sind, so dass ein Abgleich mit den erhaltenen Daten nur eingeschränkt möglich ist. Die an den Universitäten verwendeten internen LC-MS-Datenbanken beinhalten meist nur eine kleine Auswahl hauseigener Substanzen und haben

somit eine geringe Aussagekraft. Ein weiteres Problem liegt in den verwendeten Massenspektrometern. Meist wird durch den Einsatz von Quadrupol-Ionenfallen in den Massenspektrometern nur die nominelle, also ganzzahlige Masse der Substanzen erfasst, so dass die Suche in den kommerziellen Datenbanken zu zahlreichen Treffern führt und die Gefahr falscher Identifikation besteht. Die Ionisierung erfolgt in der Regel durch electrospray-ioniozation (ESI) oder atmospheric pressure ionization (API), wodurch nur eine geringe substanzcharakteristische Fragmentierung der Ionen erreicht wird33.

Es gibt zahlreiche Möglichkeiten die Dereplikation mittels LC-MS zu verbessern. Die Bestimmung der akkuraten Masse einer Substanz mit time-of-flight (TOF)- oder fouriertransformation-ioncyclotronresonance (FT-ICR)-MS ermöglicht die Berechnung der Summenformeln und gestattet somit eine eindeutigere Suche in kommerziellen Datenbanken.

Auch bei der Verfügbarkeit von Daten konnten erste Fortschritte erzielt werden. Von J. SMEDSGAARD et. al. wurden 474 Mycotoxine mittels LC-MS analysiert und die resultierenden Retentionszeiten, UV-Spektren, akuraten Massen und Ionenmuster veröffentlicht34. Durch die Tandem-Massenspektrometrie (MS/MS) kann der Informations-gehalt der Massenspektren so erhöht werden, dass die Dereplikaton nur aufgrund massenspektrometrischer Verfahren möglich ist. Durch die Kombination von drei hintereinander geschalteten Quadrupol-Ionenfallen gelingt eine MS-Charakterisierung der Einzelkompomponenten des Extrakts. Zunächst wird die gesamte Probe ionisiert und der erste Massenanalysator so eingestellt, dass nur Ionen einer definierten Masse passieren können. In der zweiten Ionenfalle wird das selektierte Ion durch einen Elektronenstoß fragmentiert und im dritten Gerät auf seine Masse analysiert. Ein Vergleich der erhaltenen Fragment-Ionen mit Referenzdaten ermöglicht in der Regel eine eindeutige Identifikation35.

selektieren fragmentieren detektieren

Abbildung 9: Prinzip der Tandem-Massenspektrometrie durch die Kombination von drei Quadrupol-Ionenfallen.

Die neusten Entwicklungen im Bereich der Dereplikation beruhen auf einer Kombination der HPLC mit der bis dato nur für die Strukturauflärung von Reinsubstanzen genutzten Spektroskopie (LC-NMR). Hier werden die Extrakte per HPLC fraktioniert und durch NMR-Spektroskopie eine Strukturaufklärung der Substanzen im μg-Maßstab ermöglicht36. Der instrumentelle Anspruch dieses Verfahren ist jedoch sehr hoch und erfordert eine weitere Optimierung der eingesetzten HPLC- und NMR-Techniken. Im Bereich der Massenspektrometrie bietet sich durch eine Erweiterung der Tandem-MS um zusätzliche Fragmentierungsschritte (MSn) eine Erhöhung der Aussagekraft37.

Die Fortschritte im Bereich der Genomforschung könnten in absehbarer Zeit die Dereplikation enorm erleichtern. Schon heute ist es möglich, ausgehend von einer Sequenzierug des Genoms, vorherzusagen welche Naturstoffklassen von einem Organismus produziert werden können, da die Sequenz auf Homologie zu bekannten PKS-, NRPS-, und DMATS-Genen überprüft werden kann. Falls es gelingen sollte auch die an der späten Biosynthese der Naturstoffe beteiligten Enzyme zuverlässig vorherzusagen, könnte die Aussagekraft der LC-MS-Analytik deutlich erhöht werden, da gezielt nach Biosynthese-Produkten gesucht werden könnte. Da jedoch viele dieser Enzyme, wie z.B.

Methyltransferasen, Oxidorekuktasen oder Acyltransferasen, nicht exclusiv vom Sekunärstoffwechsel genutzt werden stellt dies heute ein ungelöstes Problem dar. Solange es nicht gelingt ausgehend vom Gencluster die exakte Struktur eines Naturstoffs vorherzusagen, ist eine Überprüfung der tätsächlichen Sekundärstoffproduktion und damit eine möglichst zuverlässige Dereplikation unabdingbar.