• Keine Ergebnisse gefunden

Die zweite Neurolin-Domäne aus dem Goldfisch

3.2 Design molekularer Konstrukte

3.2.1 Die zweite Neurolin-Domäne aus dem Goldfisch

Unter der Annahme, dass die Polydispersität des Konstruktes von Drees et al. (2008) vom Domain-swapping herrührt, wurde das molekulare Konstrukt überarbeitet. Dazu wurde die Aminosäure-Sequenz von dem Goldfisch-Neurolin gegen publizierte Protein-Strukturen in der Protein Data Bank (pdb) (Berman et al., 2007) mit der web-basierenden Software BLAST (Altschul et al., 1990) abgeglichen. Dieser Ansatz ist insofern unüblich, da die Termini einer Ig-Domäne von unbekannter Struktur üblicherweise anhand von Sequenz-Motiven der verschiedenen Immunglobulin Klassen V, C1, C2 und I ermittelt werden. Bei dem Vergleich mit publizierten Protein-3D-Strukturen stellte sich jedoch heraus, dass die zweite humane

3.2 Design molekularer Konstrukte

31

RAGE-Domäne (Receptor for Advanced Glycation Endproducts, pdb: 3CJJ) (Koch et al., 2010) die höchste Sequenz-Homologie mit der Region der zweiten Neurolin Domäne des Goldfisches besitzt (Abb. 3.4). Vor allem das Muster hydrophober Reste und der beiden Cysteine deutete auf eine ähnliche strukturelle Topologie der beiden Proteine in diesem Sequenzbereich hin. Ein bedeutender Unterschied ergab sich bezüglich der Konstrukt-Termini und der Immunglobulin-Klassen. Ihrer Struktur nach gehört die zweite RAGE-Domäne zu dem C1-Typ der Ig-Moleküle und umfasst 115 Aminosäuren der Positionen 133 – 248. Die zweite Neurolin-Domäne wurde ursprünglich jedoch sequenzspezifisch dem V-Typ zugeordnet, und sollte demnach die Reste 132 – 228, also nur 96 Aminosäuren umfassen. Im Zuge der Optimierung des Protokolls für die Strukturaufklärung der zweiten Neurolin-Domäne wurde daher die Sequenz des Neurolin-Konstruktes an die Sequenz der zweiten RAGE-Domäne angepasst. Dies umfasste die Verlängerung am N-Terminus um zwei Reste, und am C-Terminus um 13 Reste. Es ergab sich ein Konstrukt von 110 Aminosäuren Länge und einem Molekulargewicht von 12.2kDa, welches fünf Reste kürzer war als die RAGE-Sequenz. Die fünf fehlenden Reste bei Neurolin ergaben sich aus zwei Lücken in dem Sequenzvergleich der beiden Proteindomänen (Abb. 3.4). Die resultierende Sequenz für die zweite Neurolin-Domäne umfasste die Positionen 130 – 240 des gesamten Rezeptors, und hatte im Abgleich 25% identische und 47% ähnliche Aminosäuren innerhalb der Positionen 133 – 248 von RAGE. Das Muster der hydrophoben Aminosäuren und der beiden Cysteine ist jedoch nicht nur bei RAGE und Neurolin ähnlich, sondern auch bei anderen Vertretern des CD166 Clusters. Ein wichtiger Unterschied zwischen den Sequenzen von RAGE, Neurolin und anderen Vertretern des CD166 Clusters ist jedoch, dass Neurolin an der Position 172 ein Glycosilierungsmotiv NQT (Asparagin-Glutamin-Threonin) enthält. Sowohl RAGE als auch die anderen Vertreter des CD166 Clusters wie SC1/BEN, DM-GRASP, oder ALCAM enthalten weder an entsprechender Stelle, noch in der Sequenz, welche die zweite Domäne umschließt, ein Glycosylierungsmotif (Abb. 3.4). Dies könnte ein Anzeichen dafür sein, dass die Glycosylierung von Neurolin keine funktionelle Aufgabe erfüllt, sondern als ein Relikt der Evolution in den Fischen geblieben ist, bei phylogenetisch höher entwickelten Organismen wie Vögeln und Säugern mit der Zeit jedoch verloren gegangen ist.

32

Abbildung 3.4: Sequenzvergleich des CD166-Clusters verschiedener Organismen (Goldfisch, Mensch, Haushuhn, Maus) mit dem RAGE Rezeptor (aus dem Menschen) im Bereich der zweiten Immunglobulin-Domäne. Die Pfeile repräsentieren die β-Stränge aus der Struktur des RAGE Rezeptors (pdb: 3CJJ) (Koch et al., 2010), beziehungsweise der Neurolin Domäne aus dem Goldfisch (Abschnitt 3.4, Seite 54). Die Homologie in den Sequenzen ist rot markiert. Eine besonders hohe Homologie tritt bei den hydrophoben Resten und den beiden Cysteinen (gelb) auf, welche für die globuläre Faltung des Proteins entscheidend sind. Neurolin aus dem Goldfisch ist der einzige Vertreter, der ein Glycosylierungsmotiv (Glc) NQT in der zweiten Domäne enthält. Der unterstrichene Teil der Neurolin-Sequenz fehlte bei dem ursprünglichen Konstrukt aus Abschnitt 3.1 und wurde aufgrund der Homologie zu dem RAGE Rezeptor eingefügt.

Wie bereits in Abschnitt 1.4 und 1.5 beschrieben, ist das größte Problem während der heterologen Expression eukaryotischer Proteine in E. coli die Löslichkeit, Expressionsrate und die korrekte Faltung des Proteins. Um diese Nachteile zu kompensieren, kommen vorwiegend Methoden zum Einsatz, bei welchen das zu untersuchende Protein als ein Fusionskonstrukt mit einem weiteren Protein exprimiert wird (Francis and Page, 2010).

Dieses „Hilfs-Protein“ sollte eine hohe Löslichkeit und einen etablierten Faltungsmechanismus in E. coli aufweisen. Wichtigste Vertreter sind das Maltose-Bindeprotein (MBP) mit 43.0kDa und die Glutathion-S-Transferase (GST) mit 28.1kDa. Für die vorliegende Studie wurde jedoch das Protein SUMO (Small Ubiquitin-like MOdifier) als Fusionspartner gewählt (Malakhov et al., 2004), welches am N-Terminus zusätzlich einen Histidin6-tag enthält (Abb. 3.5).

3.2 Design molekularer Konstrukte

33

Abbildung 3.5: Schematische Darstellung des Sequenz-optimierten Fusions-Konstruktes der zweiten Neurolin-Domäne aus dem Goldfisch. Ein Histidin6-tag und SUMO (blau) sind an die Sequenz-optimierte Neurolin-Domäne aus dem Goldfisch (rot) fusioniert, welche aus den Aminosäuren 130 – 240 des gesamten Rezeptors besteht.

Wie MBP und GST weist auch SUMO eine hohe Löslichkeit und einen robusten Faltungsmechanismus in E. coli auf. Mit einem relativ geringen Molekulargewicht von 12.2kDa ist SUMO jedoch insbesondere für NMR Studien geeignet, da das resultierende Fusionsprotein mit einem Molekulargewicht von 24.4kDa immer noch für Standard-NMR-Methoden zugänglich ist. Ein weiterer Vorteil der Nutzung von SUMO ist die Möglichkeit einer sehr selektiven Abspaltung vom Fusionspartner. Die hohe Selektivität der Abspaltung kommt von der dafür zuständigen Protease ULP1 (Ubiquitin-Like protein specific Protease).

Diese erkennt im Gegensatz zu den in der Biochemie gängigen Proteasen nicht nur eine spezifische Peptidsequenz, sondern geht während der Proteolyse viele spezifische elektrostatische Wechselwirkungen mit SUMO ein (Abb. 3.6) (Mossessova and Lima, 2000).

Durch die native Spaltstelle können nur Proteine gespalten werden, welche eine gefaltete SUMO-Domäne enthalten, und es bleiben keine zusätzlichen Aminosäuren einer Spaltsequenz am Zielprotein übrig, wie im Falle von z.B. Thrombin. Bei der vorliegenden Studie stellte sich heraus, dass sowohl das komplette Fusionsprotein, als auch die vom SUMO abgespaltene zweite Neurolin-Domäne monodispers vorliegen (Abb. 3.7), und in Konzentrationen von 1mM in Lösung langzeitstabil sind (siehe Abschnitt 3.3.1, Seite 44). Ein weiterer Vorteil des Einsatzes von SUMO ist eine höhere Gesamtausbeute der gereinigten zweiten Neurolin Domäne von 28.5mg pro Liter Medium (vgl. 18.9mg pro Liter in Abschnitt 3.1, Seite 26).

34

Abbildung 3.6: Die ULP1 (rot) bindet SUMO (blau) über viele spezifische elektrostatische Wechselwirkungen (schwarz gestrichelt) (pdb: 1EUV). So werden sehr spezifisch nur SUMO-Fusionsproteine gespalten (Mossessova and Lima, 2000).

Abbildung 3.7: Überlagerung von 1H-15N-HSQC-Spektren von dem kompletten Fusionsprotein SUMO-NIg2 (schwarz) und den beiden Spaltprodukten SUMO (blau) und der zweiten Neurolin Domäne aus dem Goldfisch (NIg2) (rot). Sowohl die Signale von dem kompletten Fusionsprotein, als auch jene der isolierten Neurolin-Domäne weisen eine gleichmäßige Signalform auf. Dies spricht für eine monodisperse Proteinlösung, und eine isotrope Bewegung der Moleküle in Lösung. Die Resonanzen des kompletten Fusionsproteins sind zum größten Teil mit den Resonanzen der beiden Spaltprodukte

3.2 Design molekularer Konstrukte

35 vergleichbar.