• Keine Ergebnisse gefunden

3. Ergebnisse

3.2 Charakterisierung der Glykogensynthase-Kinase 3 (GSK3) aus

3.2.2 In silico-Untersuchung von LmxGSK3

LmxGSK3α besteht aus 843 Aminosäuren und besitzt ein durchschnittliches Molekular-gewicht von ~90,9 kDa und einen isoelektrischen Punkt (pI) bei pH 6,5.

LmxGSK3β ist aus 355 Aminosäuren aufgebaut und hat ein durchschnittliches Molekular-gewicht von ~40,7 kDa und einen pI bei pH 7,6.

Beim Sequenzvergleich beider parasitärer Glykogensynthase-Kinasen mit den humanen Enzymen zeigt sich für LmxGSK3α eine nur mäßige Homologie, sowohl zu GSK3α als auch zu GSK3β von Homo sapiens (zu ~18 % bzw. ~19 % gleiche und zu ~25 % bzw. ~26 % ähnliche Aminosäurereste). LmxGSK3β entspricht mit ~37 % Sequenzgleichheit und über 52 % Sequenzähnlichkeit als Homolog eher der humanen GSK3β. Zudem besitzt LmxGSK3β ein höheres Maß an Homologie zur humanen GSK3α (~32 % Gleichheit und

~46 % Ähnlichkeit), als dies für LmxGSK3α der Fall ist. In dieser Arbeit wurde in Anlehnung an die Nomenklatur in Säugetieren, das in L. mexicana identifizierte kürzere Homolog als „β“

und die längere Form als „α“ gekennzeichnet. Es sei hiermit darauf hingewiesen, dass es sich bei LmxGSK3α und LmxGSK3β nicht um eindeutige Äquivalente von GSK3α und GSK3β von Säugetieren handelt.

GSK3α

Lmx Lin Lmj Tb Tc LmxGSK3β Hsap

Lmx 83,4 78,1 25,3 24,9 17,9 18,2

Lin 85,8 79,4 25 24,9 18 18,8

Lmj 80,4 80,7 28 28,9 20,7 19,7

Tb 34,1 33,9 38,2 53,4 28,7 27,8

Tc 34,3 33,8 39,2 66,5 29,1 29

LmxGSK3β 26,4 26,9 30,7 42 42,8 32,6

Hsap 25,7 26,6 28,1 39,2 39,8 46,8

Tab. 2: Aminosäurengleichheit (in %; oberhalb der Diagonale) und Aminosäurenähnlichkeit (in

%; unterhalb der Diagonale) von LmxGSK3α im Vergleich zu homologen Proteinen anderer Kinetoplastiden sowie zur humanen GSK3α und zu LmxGSK3β. Lmx: L. mexicana, Lmj: L. major, Lin: L. infantum, Tb: T. brucei, Tc: T. cruzi, Hsap: Homo sapiens. Die Zugangsnummer der jeweiligen Aminosäuresequenz findet sich unter 2.2.12.1. Die Tabelle wurde mit Emboss Needle erstellt.

LmxGSK3α weist ein großes Maß an Homologie zu der langen GSK3 der anderen Leish-manienspezies auf (Siehe Tabelle 2). Mit der langen Form von L. infantum und L. major teilt sie eine um die 80 % gleiche und zwischen 80 und 85 % ähnliche Aminosäuresequenz. Die

für das Homolog aus L. donovani annotierte Sequenz umfasst lediglich 147 Aminosäuren.

Die Translation der sich der annotierten Sequenz anschließenden Gensequenz zeigt eine Fortsetzung der anzunehmenden Aminosäuresequenz in einem anderen Leseraster. Für GSK3α aus L. braziliensis liegt für den C-Terminus keine Gensequenz vor. Die vermutlich nicht vollständigen Aminosäuresequenzen dieser Proteine wurden für Homologievergleiche nicht herangezogen. Zu GSK3α von T. brucei bzw. T. cruzi besteht eine Sequenzgleichheit von ~25 % und Sequenzähnlichkeit von ~34 %.

GSK3β

Lmx Lin Lmj Lbr Tb Tc LmxGSK3α Hsap

Lmx 98,6 96,9 93 65,1 68,3 17,9 37,3

Lin 99,7 98 93,5 65,1 68 17,8 37,5

Lmj 98,6 99,2 93,5 65,7 68,3 18,4 37,5

Lbr 96,3 96,9 95,8 66,9 66,6 17,4 37,8

Tb 79,9 80,2 80,9 80,6 77,9 18,3 39,2

Tc 83,4 83,1 83,1 82,9 90,4 18,9 38,8

LmxGSK3α 26,4 26,1 26,9 25,1 25,9 26,5 19,2

Hsap 52,8 52,8 53 53,4 54,3 54,7 26,8

Tab. 3: Aminosäurengleichheit (in %; oberhalb der Diagonale) und Aminosäurenähnlichkeit (in

%; unterhalb der Diagonale) von LmxGSK3β im Vergleich zu homologen Proteinen anderer Kinetoplastiden sowie zur humanen GSK3β und zu LmxGSK3α. Lmx: L. mexicana, Lin:

L. infantum, Lmj: L. major, Lbr: L. braziliensis, Tb: T. brucei, Tc: T. cruzi, Hsap: Homo sapiens. Die Zugangsnummer der jeweiligen Aminosäuresequenz findet sich unter 2.2.12.1. Die Tabelle wurde mit Emboss Needle erstellt.

Die GSK3β-Vertreter von Leishmanien sind aus der gleichen Anzahl von Aminosäuren aufgebaut und weisen ein hohes Maß an Homologie auf. Die Sequenz der Form aus L. donovani stimmt exakt mit der L. infantum-Sequenz überein und ist der L. mexicana-Sequenz am ähnlichsten (über 98 % Gleichheit und mehr als 99 % Ähnlichkeit). Auch die Aminosäuresequenz von GSK3β von L. major (~97 % Gleichheit, ~99 % Ähnlichkeit) und L. braziliensis (93 % Gleichheit, ~93 % Ähnlichkeit) zeigt ein großes Maß an Überein-stimmung zu LmxGSK3β (Siehe Tabelle 3).

Hinsichtlich ihrer Aminosäuresequenz weisen die humane GSK3α und GSK3β zu ~66 % gleiche und zu ~73 % in ihrer Eigenschaft ähnliche Reste auf. Zu ~97 % ähnliche Reste und ein hohes Maß an Übereinstimmung von ~91 % zeigt die Kinasedomäne beider humanen GSKs. Der Sequenzvergleich zeigt: Die beiden in L. mexicana identifizierten GSK3-Formen besitzen untereinander eine viel geringere Ähnlichkeit von ~26 % und weisen zu knapp 18 % an den jeweiligen Postionen die gleichen Reste auf. Gleichermaßen verhält es sich für ihre Kinasedomäne, diese ist zu ~22 % aus gleichen und zu fast 32 % aus Resten mit ähnlichen Eigenschaften aufgebaut. Der Blick auf die Sequenz gibt Aufschluss, wie dieses geringe Maß an Homologie zustande kommt. Im Vergleich zu den humanen Formen und zu LmxGSK3β besitzt LmxGSK3α innerhalb der Kinasedomäne drei zusätzliche Einschübe sowie eine deutlich längere CMGC-Insertion zwischen Domäne X und XI. Zwischen der

Domäne III und IV von GSK3α findet sich ein Einschub von 53 Aminosäuren (AS) Länge für Leishmania spec und 50 Aminosäuren Länge für Trypanosoma (Sequenzalignment Abbildung 39). Der zweite und dritte Sequenzeinschub von 52 bzw. 67 Aminosäuren zwischen Domäne IV und V bzw. V und VIa stellt sich nur bei der alpha-Form der aufgeführten Leishmanien-Spezies dar, nicht jedoch bei der von Trypanosomen. Bei diesen Einschüben handelt es sich um Schleifen, die sich zwischen den konservierten Domänen befinden. Für die Schleifen werden so gut wie keine Sekundärstrukturelemente vorhergesagt (Abb. 39). Das CMGC-Insert umfasst bei LmxGSK3α 165 Aminosäuren und ist somit deutlich länger als bei der langen Form von Trypanosomen (T. brucei: 73 AS, T. cruzi: 65 AS), Homo sapiens (36 AS) und LmxGSK3β (39 AS). Werden die Einschübe und die Verlängerung der CMGC-Insertion bei Homologie-Vergleichen der Kinasedomäne nicht mit einbezogen, zeigt sich eine deutliche Zunahme der Übereinstimmung zwischen den Spezies: Die Kinase-domäne von LmxGSK3α besitzt dann zur KinaseKinase-domäne der humanen GSK3α bzw. GSK3β eine Gleichheit der Aminosäuresequenz von knapp 45 % und eine Ähnlichkeit von ~ 63 %.

Für LmxGSK3β sind dies im Vergleich 49 % Gleichheit und ~ 69 % Ähnlichkeit zu der Kinasedomäne der humanen Formen. Zu der Kinasedomäne von LmxGSK3β stimmt die von LmxGSK3α dann zu ~ 42 % überein und zeigt eine Sequenzähnlichkeit von ~ 60 %.

Die Glykogensynthase-Kinasen von Trypanosomatiden teilen dieselbe, für alle Protein-kinasen charakteristische Grundstruktur. Ihre katalytische Domäne setzt sich aus den 12 bekannten Subdomänen zusammen. Die zentralen konservierten Reste sind für alle unter-suchten GSK3s gleich (Siehe Sequenzalignment GSK3α bzw. GSK3β in Abb. 39). GSK3s aus L. mexicana weisen für Serin-/Threoninkinasen charakteristische Motive (Hanks et al., 1988) auf. Die Abfolge D-L-K-P-A-N von LmxGSK3α bzw. D-I-K-P-H-N von LmxGSK3β in Subdomäne VIb und C-S-R-Y-Y-R-A-P-E in Subdomäne VIII beider Leishmanien-GSK3s repräsentieren die für Ser-/Thr-Kinasen typischen Motive D-L-K-P-E-N und G-T/S-x-x-Y/F-x-A-P-E. Ein weiteres konserviertes Merkmal von Ser-/Threoninkinasen findet sich in S189 von LmxGSK3β bzw. S502 von LmxGSK3α in der katalytischen Schleife, welches mit dem positiv geladenen Rest K153 bzw. K464 interagiert (Krupa et al., 2004). Das RD-Motiv in Subdomäne VIb findet sich in Proteinkinasen, welche durch Phosphorylierung in der Aktivierungsschleife reguliert werden (Johnson et al., 1996). Dieses Motiv ist auch in GSK3 vorhanden. Das für die CMGC-Kinasefamilie spezifische Konsensusmotiv L-G-x-P, hier für LmxGSK3α L-G-A-P und LmxGSK3β L-G-C-P, findet sich am Start der für CMGC-Kinasen charakteristischen Insertion zwischen Subdomäne X und XI (Kannan und Neuwald, 2004).

Für diesen nicht konservierten C-terminalen Bereich von LmxGSK3α wurden vier α-Helices vorhergesagt. Das 39 Aminosäuren lange CMGC-Insert von LmjGSK3β weist zwei α-Helices mit dazwischenliegender 3/10-Helix auf.

A. GSK3α Sequenzalignment

Lmx MGACVCVCVCLPLTSLFTLLFAVPSSPAPLSPRICPSPPRVSCRSSQTASLRVCVCVCVCLG--ERIGAEAGPCCSYTR 77 Lin MGACVCVHVFRLLLCSRFFLFAVPSSSP---APPSRVSCPSSQKAFLRARVCVPRRASRCGSGSSRHRAPVARIR 72 Lmj --- Lbr --- Tb --- Tc --- Hs ---MSGGGPSGGGPGGSG 15 LmxGSK3b ---

Lmx TCTRVSYLPKVLSKCCPVTPLPIS---RVLYSSSPLPSLQVMSEKSMQPRRPLSSSRASARASAAS--- 140 Lin TFTRIAHSPKALSKYCPFTPLSTSSCFSRFAFFRPPFPLPTLQVMSEKSVRSRRPLSVSRASARASAAS--- 141 Lmj ---MRSRRPLSASRASARASAAS--- 20 Lbr ---MSDKPTRSRRPLSAAQISARASGAS--- 25 Tb ---MSERILPS--TLRGVTNGQKEVTASVGERVPLLPR 33 Tc ---MRKLSGDLKATAATPLT 17 Hs RARTSSFAEPGGGGGGGGGGPGGSASGPGGTGGGKASVGAMGGGVGASSSGGGPGGSGGGGSGGPGAGTSFPPPGVKLG 94 LmxGSK3b --- .

Lmx ----RPQPHRTVSSDGASRSQTTTPMYRPLRYVGRGSFGVVLLAEEVHTGDKVAIKRVHYDARLHNREVAILNSVLVDN 215 Lin ----RPQLHRTVSSDGASPSQATAPMYRPLRYVGRGSFGVVLLAEEVHTGVKVAIKRVHYDARLHNREVAILNSVLVDN 216 Lmj ----RPQPHTTVSSDDASRSQTTAPIYRPLRYVGRGSFGVVLLAEEVHTGDRVAIKRVHYDARLHNREVAILNSVLVDN 95 Lbr ----RPQAQRSVSSGGTARAQATTPVYRPLRYVGRGSFGVVVLAEELHTGEKVAIKRVHYDARLHNREVAILNSVLVDD 100 Tb RFSARPQGNQEAQERTAVKCEQVR--YAIQEVIGRGAFGEVSSAEVVGTRDLVAIKRVIHDGRLRQRELTLMRDHLG-- 108 Tc PPVTTPQPQPDGTDRSKSAGGQAT--YEPLHVLGQGSFGVVMMARVRETGKMVAVKKVLFDRRLHHRELLLLRDHLG-- 92 Hs RDSGKVTTVVATLGQGPERSQEVA--YTDIKVIGNGSFGVVYQARLAETRELVAIKKVLQDKRFKNRELQIMRKL---- 167 LmxGSK3b ---MSLNAADAADERSRKEMDR--FLVERMAGQGTFGTVQLGKEKSTGMSVAIKKVIQDPRFRNRELQIMQDLAVL- 71

: . *.*:** * .. * **:*:* * *:::**: ::..

I II III

Lmx PRHQQPSNTAVDSNDTSRLPDGATRISSTSSPSALSSSHTVEDVHLWPGTH--HPNIVELLDFYVTYDTASSEQVL 289 Lin PRHQQPSHTVVDSNDASRLPGGAARASSTSFLSASSSSHTVEDVHLWPGTH--HPNIVELLDFYVTYDTASSEQAL 290 Lmj PRHQQPSSTAVDSNDASRRPGGAARASCTSFLSASSSSHTVEDVHLWPGTH--HPNIVELLDFYVTYDTASSEQAL 169 Lbr PRHQQTSSTVGGSTGVSRLSGGTIGASLSPSLSASSSSHTVEDVHLWAGRH--HPNIVELLDFYVTYDTSS-EQAL 173 Tb PNTQQGGVSSLDVGNGVGAHATSVTGSNGEEANGTTAIDGLESWN-MPTIVPYHPCVVKLLDHFFASDPSG-VQ-- 180 Tc PGTHAGQAGTGNHDD-PGKEAGKTDPSNTNNSAGEVGFTPLGDLASVPTTVSYHPCIVRLLDHFTVAGPNG-EQ-- 164 Hs ---DHCNIVRLRYFFYSSGEKKDE--- 188 LmxGSK3b ---HHPNIVQLQSYFYTLGERDRRD-- 93

* :*.* .: . IV

Lmx GADMVGTGGAGAGFEFLPSHHPTAHRYPLSGGSGAASASAPPASAPLAAFAYLEMVMSYLPMDLCYVKKYYFRFHDM 366 Lin GPDMVGVGGASAGFESLPSHHPAAHRYPLSGGSGAASTNAPPVSAPLAAFAYLEMVMSYLPMDLCYVKKYYFRFHDM 367 Lmj GADMVGAGGAGAGFEFLPSYHPAAHRYPLSGGSGAASASAPPVPAPLAAFAYLEMVMSYLPMDLCYVKRYYFRFHDM 246 Lbr GLDMVGAGGTGAGFEFLSSHHPTEHRYPLSGGRGPTSPGVLSASAPLSAFAYLEMVMGYLPMDLCYMKKHFFRFHEI 250 Tb ---YLFMVMDYIPLDVRRLHHMFLRQREQ 206 Tc ---YLYIVMDYLPLDIHHLHHIYLRQKQQ 190 Hs ---LYLNLVLEYVPETVYRVARHFTKAKLT 215 LmxGSK3b ---IYLNVVMEYVPDTLHRCCRNYYRRQVA 120

** :*: *:* : : : : : V

Lmx PTMVTSSSSSPLASPEQAPTDLSSGELPEGTADRSPASPKHAGTGCNGSNSSRHGSTGSSGADVCNHLPLRWVKVVLF 444 Lin PTMVTSSSPSPLASPEQAAAELLSGELPEGTADRPPASPKHAGTGCNGSNSSRHSSTGGSGGDAFNHLPLRWVKVVLF 445 Lmj PTIATSSSSSPIASPEQAPTELSSGELPEGTADRLPASPKHAGTGCNGNNSSRHSSTSSSGGDVCNHLPLRWVKVVLF 324 Lbr PSRIASSSASPLVSPVQAPTDLSSGELPECMAGRPPTSPKHPGTDCKRSSSCCHSSTGTSGGDFHNHLPLNWVKVVLF 328 Tb ---QMPIILVKVIMF 218 Tc ---RMPFILVKVIMF 202 Hs ---IPILYVKVYMY 226 LmxGSK3b ---PPPILIKVFLF 131

* :** ::

Lmx QLARALAFMH--VRHVCHRDLKPANVLVDPDTGRVRLCDFGSAKLIARPG----EEKNVSYICSRYYRAPELLFGALH 516 Lin QLARALAFMH--VRHVCHRDLKPANVLVDPDTGRVQVCDFGSAKQIARPA----EEKNVSYICSRYYRAPELLFGALH 517 Lmj QLARALAFMH--VRHVCHRDLKPANVLVDPDTGRVQVCDFGSAKQITRPA----EEKNVSYICSRYYRAPELLFGALH 396 Lbr QLARALAFMH--ARHVCHRDLKPGNVLVDPHTGRVQLCDFGSAKQIMQPA----EEKNVSYICSRYYRAPELLFGALH 400 Tb QLARALAFLH--ARGICHRDVKPNNILVDQETGVVKLCDFGSAKKMQAVGGEGPREKNVPYIFSRYYRAPELLLGSQY 294 Tc QLARALMFLH--LRGICHRDVKPSNLLIDPETGVLKLCDFGSAKVMQPQGVNGPIEKNVSYICSRYYRAPELLLGSLY 278 Hs QLFRSLAYIH--SQGVCHRDIKPQNLLVDPDTAVLKLCDFGSAKQLVRG---EPNVSYICSRYYRAPELIFGATD 296 LmxGSK3b QLIRSIGCLHLPSVNVCHRDIKPHNVLVNEAEGTLKLCDFGSAKKLSPS---EPNVAYICSRYYRAPELIFGNQH 203

** *:: :* :****:** *:* . :::******* : * **.** *********::*

VIa VIb VII VIII

Lmx YGCPVDMWSFGCIAAELLRESGKPLFRG-CTTIDQMAELFKVLGAPSKREMYAMNPQCAEALLRTRAMHRHQSLDNDP 593 Lin YGCAVDMWSFGCIAAELLRESGKPLFRG-CTSIDQMAELFKVLGAPSKREMYAMNPQCAEALLRTRAMHRHQSLDTDP 594 Lmj YGCAVDMWSFGCIAAELLRESGKPLFRG-CTSIDQMAELFKVLGAPSKREMYAMNPQCAEALLRTRAMHRHQSLDNDP 473 Lbr YGCAVDMWSFGCIAAELLRESGRPLFRG-CTSIDQMAELFKVLGAPSKREMYAMNPQCAEALLRTHAMHRNQSFRHRP 477 Tb YHFHVDMWAFGCVLAELL--CGKVLFKGSSSTMDQLVEIIKVLGKPSERELFALNPQSAGSALIRTWGDSHNASQLSP 370 Tc YHFHVDMWAAGCVLAELL--CGEVLFKG-ASTVDQMAEIFKVLGAPSRQELLALNPQGAEALFHATG---AGLEV 347 Hs YTSSIDVWSAGCVLAELL--LGQPIFPG-DSGVDQLVEIIKVLGTPTREQIREMNPNYTEFKFPQ--- 358 LmxGSK3b YTTSVDIWSVGCIFAEMM--LGEPIFRG-DNSAGQLHEIVRVLGCPSREVLRKLNPSHTDVDLYN--- 265

* :*:*: **: **:: *. :* * . .*: *:.:*** *:.. : :**. : . :

IX X

Lmx HSGSR----GGVRQGRSCGLELEVDYQVEEDNDVELRGSARQGGYDVDSHGEFLRDALDDGLSSQTSASPGMATASPP 667 Lin HSGSG----GGVRQDRSCGLELEVDYQAEEEDDVELRGGAQQGGYDVDGHGDFLRDALDDGISSQASASPGMATASPP 668 Lmj HSGSG----GGVRQDRSCGLELEVDYQAEEEDDVELRGGAQQGGYDVDSHGEFLRDALDDGISSQASASPGMATASPP 547 Lbr HSGARGCGSGAERRNRSCGLALGVGYQAEEEEDDELHSGLQQAEYDAENHGDFLRDALDDGILSQASVSPGMATGSQV 555 Tb TPSGP---LPSSNSANADYMQRRSAPRVKSLLWVEVLPPN--- 414 Tc TPTSA---ANTATSS--DYLQRYHALRIKALQWQNVLPPN--- 389 Hs --- LmxGSK3b ---

Lmx PSSTKDPRDYKTRFSASPSTAATATLDDVAPTPFEEYYDVLKVRAIPWRRLFPAD---TPMEAVTLVASLLCYAPDKR 742 Lin SSCTKDPRDYKTAFSAPPSTAATATLDDVAPTPFEEYYDVLKVHAIPWRRLFPAD---TPTEAVALVASLLCYAPDKR 743 Lmj SSSTKDPRDYKTTFSAPPSTAATAMLDDVAPTPFEEYYDVLKVRAIPWRRLFPVD---TPTEAVALVASLLCYAPDKR 622 Lbr SS--- 557 Tb ---TSQAALSLIEQLLRYTPEER 427 Tc ---TPPAAVSLVGELLRYTPAER 402 Hs ---IKAHPWTKVFKSR---TPPEAIALCSSLLEYTPSSR 391 LmxGSK3b ---SKGIPWSTVFCDHSLKDAKEAYDLLSALLQYLPEDR 301

. * * ** * * .*

XI

Lmx LTAAELVEHPFFDDLFSAADAQLRTGDLDPATAMESGATMSPSDDDGVASAALRLPNGRLMPLSMFQVTEVERGLYTD 820 Lin LTAAELVEHPFFDDLFSAADAQLGAVGRDTATAMASGTTNSPSEDDGVASAALRLPNGRLMPLSMFQVTEVERGLYTD 821 Lmj LTAAELVEHPFFDDLFSAADAQLATVDRDAATAVASGATMSPSEDDGVASAALRLPNGRLMPLSMFQVTEVERGLYTD 700 Lbr --- Tb LTSAEVLEHVFFDELFSDDAR---LPNGAPLPASMFQVTREEAEILPPWLLERMAAAEGVAKGRELNQS 493 Tc LSAAEVLEHSFFDDIFAEDAS---LPNGAPLPVSMFEVTAEEMEALPPWLLERMASAEASARRRHVSAG 468 Hs LSPLEACAHSFFDELRCLGTQ---LPNNRPLPP-LFNFSAGELSIQPSLNAILIPPHLRSPAGTTTLTP 456 LmxGSK3b MKPYEALCHPYFDELHDSATK---LPNHKNLPEDLFRFLPSEIEVM---SEAQKAKLVR 354 :.. * * :**:: : . . :

Lmx AFLTRMARQAELVAAAMKQDEYP---- 843 Lin AFLTRMARQAELVAAAMKQDEYP---- 844 Lmj AFLTRMARQAELVAAVMKQDEYP---- 723 Lbr --- Tb ATAPENAI--- 501 Tc GSGKVVPPQKRQEQEGRK--- 486 Hs SSQALTETPTSSDWQSTDATPTLTNSS 483

LmxGSK3b K--- 355

A: Vergleich der Aminosäuresequenz von LmxGSK3α und homologen Proteinen. CLUSTAL2.1 multiple sequence alignment (Larkin et al., 2007) mit anschließender Optimierung des Alignments durch manuelle Abgleichung. Lmx: L. mexicana, Lin: L. infantum, Lmj: L. major, Lbr: L. braziliensis, Tb:

T. brucei, Tc: T. cruzi, Hs: Homo sapiens. Die Zugangsnummer der jeweiligen Aminosäuresequenz findet sich unter 2.2.12.1.

B. GSK3β Sequenzalignment

Lmx ---MSLNAADAADER---SRKEMDR 19 Lmj ---MSLNAAAAADER---SRKEMDR 19 Lin ---MSLNAADAADER---SRKEMDR 19 Lbr ---MSLNAADAADDR---SRKEMDR 19 Tb ---MSLNLTDAADDR---SYKEMEK 19 Tc ---MSLNLAEAADER---SQREMEK 19 Crei ---MKELNIKDKDDEAGSSKAQQNAATAEIFEGRLIEGDLKTGGHVLSASSGTGASRQTYN 58 Hs MSGRPRTTSFAESCKPVQQPSAFGSMKVSRDKD----GSKVTTVVATPGQGP---DRPQEVS 55 : . :

Lmx FLVERMAGQGTFGTVQLGKEKSTGMSVAIKKVIQDPRFRNRELQIMQDLAVLHHPNIVQLQSYFYTL-GERDRR-DIYLNV 98 Lmj FQVERMAGQGTFGTVQLGKEKSTGMSVAIKKVIQDPRFRNRELQIMQDLAVLHHPNIVQLQSYFYTL-GERDRR-DIYLNV 98 Lin FQVERMAGQGTFGTVQLGKEKSTGMSVAIKKVIQDPRFRNRELQIMQDLAVLHHPNIVQLQSYFYTL-GERDRR-DIYLNV 98 Lbr FQVERMAGQGTFGTVQLGKEKSTGMSVAIKKVIQDPRFRNRELQIMQDLAVLHHPNIVQLQSYFYTL-GERDRR-DIYLNV 98 Tb YTVERVAGQGTFGTVQLARDKSTGSLVAIKKVIQDPRFKNRELQIMQHLARLRHPNIVMLKNYFYTVGGE-GRRNDVYLNV 99 Tc YLVERVAGQGTFGTVQLAREKNTGVNVAIKKVIQDPRFKNRELQIMQDLSRLRHPNIVLLKNYFYTVLGD-HRHNDVYLNV 99 Crei YSTDRVVGNGSFGVVFQATCLETGETVAIKKVLQDKRFKNRELQIMKL---VDHPNIVKLKHCFYS-HTD---KDETYLHL 132 Hs YTDTKVIGNGSFGVVYQAKLCDSGELVAIKKVLQDKRFKNRELQIMRK---LDHCNIVRLRYFFYS-SGE--KKDEVYLNL 130 : :: *:*:**.* . .:* ******:** **:*******: : * *** *: **: : : : **::

I II III IV

Lmx VMEYVPDTLHRCCRNYYRRQVAPPPILIKVFLFQLIRSIGCLHLPSVNVCHRDIKPHNVLVNEAEGTLKLCDFGSAKKLSP 179 Lmj VMEYVPDTLHRCCRNYYRRQVAPPPILIKVFLFQLIRSIGCLHLPSVNVCHRDIKPHNVLVNEADGTLKLCDFGSAKKLSP 179 Lin VMEYVPDTLHRCCRNYYRRQVAPPPILIKVFLFQLIRSIGCLHLPSVNVCHRDIKPHNVLVNEADGTLKLCDFGSAKKLSP 179 Lbr VMEYVPDTLHRCCRNYYRRQTTPPPILIKVFLFQLIRSIGCLHLPSVNVCHRDIKPHNVLVNEAEGTLKLCDFGSAKKLSP 179 Tb VMEFVPETLHRTCRNYYRRMTNPPLILVKVFMFQLLRSIACLHIPVINICHRDIKPHNVLVDEQTGELKLCDFGSAKRLAA 180 Tc VMEFVPDTLHRVCRAYYRRLASPPMILVKVFMYQLLRGIACLHLPAVNVCHRDIKPHNVLVDESTGDLKLCDFGSAKKLSP 180 Crei VLEFVPDTVYRISKHYAKNNQRMPNLFVKLYAYQMCRALNSIHKM--GICHRDIKPQNLLVNTETHQLKLCDFGSAKVLVK 211 Hs VLDYVPETVYRVARHYSRAKQTLPVIYVKLYMYQLFRSLAYIHSF--GICHRDIKPQNLLLDPDTAVLKLCDFGSAKQLVR 209 *:::**:*::* .: * : * : :*:: :*: *.: :* .:*******:*:*:: ********** * V VIa VIb VII

Lmx SEPNVAYICSRYYRAPELIFGNQHYTTSVDIWSVGCIFAEMMLGEPIFRGDNSAGQLHEIVRVLGCPSREVLRKLNPSHTD 260 Lmj SEPNVAYICSRYYRAPELIFGNQHYTTAVDIWSVGCIFAEMMLGEPIFRGDNSAGQLHEIVRVLGCPSREVLRKLNPSHTD 260 Lin SEPNVAYICSRYYRAPELIFGNQHYTTSVDIWSVGCIFAEMMLGEPIFRGDNSAGQLHEIVRVLGCPSREVLRKLNPSHTD 260 Lbr SEPNVAYICSRYYRAPELIFGNQHYTTAVDIWSVGCIFAEMMLGEPIFRGDNSAGQLHEIVRVLGCPPREVLRKLNPSHTD 260 Tb DEPNVAYICSRYYRAPELIFGNQFYTTAVDIWSVGCIFAEMLLGEPIFCGENTSGQLREIVKILGKPTKEELHKLNGSSTE 261 Tc SEPNVAYICSRYYRAPELIFGNQYYSTAVDVWSVGCIFAEMLLGEPIFCGENTSGQLREIVRVLGRPSREELHKLSTSNVE 261 Crei GEPNISYICSRYYRAPELIFGATDYTSAIDVWSVGCVLAELLLGQPLFPGESGVDQLVEIIKVLGTPTREEINAMNPNYTE 292 Hs GEPNVSYICSRYYRAPELIFGATDYTSSIDVWSAGCVLAELLLGQPIFPGDSGVDQLVEIIKVLGTPTREQIREMNPNYTE 290 .***::*************** *::::*:**.**::**::**:*:* *:. .** **:::** *.:* :. :. . .:

VIII IX X

Lmx VDLYNSKGIPWSTVFCDHSLKDAKEAYDLLSALLQYLPEDRMKPYEALCHPYFDELHDSATKLPNHKNLPEDLFRFLPSEI 341 Lmj VDLYNSKGIPWSNVFSDHSLKDAKEAYDLLSALLQYLPEERMKPYEALCHPYFDELHDPATKLPNNKDLPEDLFRFLPNEI 341 Lin VDLYNSKGIPWSSVFCDHSLKDAKEAYDLLSALLQYLPEDRMKPYEALCHPYFDELHDSATKLPNNKDLPEDLFRFLPSEI 341 Lbr VDLYNSKGIPWSNVFCDQSLKDAKEAHDLLSGLLQYLPEERTKPYEALCHPYFDELRDSATKLPNNKDLPDDLFHFLPAEV 341 Tb INAN-AKATPWENVFKQP---LPAEVYDLCGKIFKYVPDQRITPLDALCHPFFNELREPTTKLPSGNPLPAHLYQFTPDEV 338 Tc LNVPTNKSTPWEDVFKRP---LPAEVYDLCAKIFKYLPEQRITPLEAICHPFFDELHDATVKLPSGNALPAHLFTFLPEEI 339 Crei FKFPQIKAHPWTKVFSK---RMPPDAVDLVSKLLQYAPQKRMTAVQAMTHPFFDELRDPATRLPNGRALPP-LFNWLPGEL 369 Hs FKFPQIKAHPWTKVFRP---RTPPEAIALCSRLLEYTPTARLTPLEACAHSFFDELRDPNVKLPNGRDTPA-LFNFTTQEL 367 .. *. ** ** . :. * . :::* * * .. :* *.:*:**::. .:**. . * *: : . *:

XI

Lmx EVMS---EAQKAKLVRK--- 355 Lmj EVMS---EAQKAKLVRK--- 355 Lin EVMS---EAQKAKLVRK--- 355 Lbr ETMT---DVQKGKLIRK--- 355 Tb EAMT---EAQREYLLKK--- 352 Tc NEMT---EAQRSQLVQK--- 353 Crei DEVP--ADIVR----KLQPVAKAS--- 387

Hs SSNPPLATILIPPHARIQAAASTPTNATAASDANTGDRGQTNNAASASASNST 420

. . : .

B: Vergleich der Aminosäuresequenz von LmxGSK3β und homologen Proteinen. CLUSTAL2.1 multiple sequence alignment mit anschließender Optimierung durch manuelle Abgleichung. Lmx:

L. mexicana, Lmj: L. major, Lin: L. infantum, Lbr: L. braziliensis, Tb: T. brucei, Tc: T. cruzi, Crei:

C. reinhardtii, Hs: Homo sapiens. Die Sequenz von L. infantum entspricht der von L. donovani. Die Zugangsnummer der jeweiligen Aminosäuresequenz findet sich unter 2.2.12.1.

Abb. 39: Erläuterungen zu A und B: Sterne markieren konservierte Reste, Doppelpunkte Reste mit sehr ähnlichen Eigenschaften (Scoring > 0,5 in der Gonnet PAM 250 Matrix) und Punkte Reste mit Eigenschaften von geringer Ähnlichkeit (Scoring <= 0,5 in der Gonnet PAM 250 Matrix). Der weiße Stern kennzeichnet Beginn und Ende der katalytischen Domäne. Die 12 Subdomänen sind mit römischen Zahlen beziffert. Insertionen sind mit gestrichelten Linien unterlegt. Zentrale konservierte Reste und Motive sind farbig unterlegt: Hellgrau: Glycin-reiches Sequenzmotiv G-x-G-x-Ω-G-x-V (Ω steht für eine aromatische Aminosäure, für GSK3 ist dies Phenylalanin; x entspricht jeder beliebigen Aminosäure). DFG-Motiv am Anfang und APE-Motiv am Ende der katalytischen Schleife. D-x-x-x-x-G Motiv in Subdomäne IX. L-G-x-P−Motiv in Kinasen der CMGC-Familie. Die im Folgenden angegebene Aminosäureposition ist von LmxGSK3β und die von LmxGSK3α steht in Klammern. Blau: Ionenpaar K49/E61 (K192/E204) welches mit die ATP-Bindung koordiniert. Dunkelgrau: N156 (N467) und D170 (D481) koordinieren die Metallionen, das Asparagin zusätzlich die katalytische Base. Türkis: D151 (D462) katalytische Base der Phosphotransfer-Reaktion. Pink: R60, R150 und K175 (R203, R461 und K486) bilden die positiv geladene Tasche zur Bindung der „priming“-Phosphatgruppe aus. Blaugrün:

K153 und S189 (K464, S502) in Ser-/Thr-Kinasen konservierte Reste bzw. Motive (blaugrüner Balken). Oliv: Invariantes R301 (R742) 12 Reste vor Ende der katalytischen Domäne. Gelb:

„gatekeeper“-Rest M100 (M346). Grün: Phosphorylierungsstelle in der Aktivierungsschleife Y186 (Y499). Rot: nachgewiesen regulative Phosphorylierungsstellen in Homo sapiens: S9, T43, T390 in HsGSK3β und S21 in HsGSK3α. Kreise kennzeichnen die in dieser Arbeit mutierten Reste: weiß:

Inhibitorsensitive-Mutante (M->A); grau: K->M-Mutante; schwarz: Y->F-Mutante. Sekundärstruktur-elemente von LmjGSK3β bestimmt durch Röntgenkristallographie (PDB Code: 3E3P; Ojo et al., 2011) in farbigen Buchstaben: Rot: α-Helix; blau: β-Faltblatt; grün: Turn; orange: 3/10-Helix; lila: β-Brücke.

Sekundärstrukturelemente von LmxGSK3α und HsGSK3α vorhergesagt mit PSIPRED (Jones, 1999;

Server: Buchan et al., 2013): Rot: α-Helix; blau: β-Faltblatt.

In GSK3 von Säugetieren ist ein charakteristisches Tyrosin in der Aktivierungsschleife der Kinase konstitutiv phosphoryliert und für die Kinase-Aktivität wichtig. Dieses Tyrosin findet sich auch in der parasitären GSK3. In LmxGSK3α an Position 499 und in LmxGSK3β an Position 186. Eine negative Regulation ihrer Aktivität erfährt die humane Kinase durch Phosphorylierung an Serin-9 von GSK3β bzw. Serin-21 von GSK3α. Das Sequenzalignment zeigt im Bereich des N-Terminus kaum Übereinstimmung, so dass eine sichere Zuordnung eines Rests der LmxGSK3α-Sequenz zu dem humanen Serin-21 nicht möglich ist. Auch in der Sequenz der kurzen GSK3β von Trypanosomatiden ist kein Rest Serin-9 direkt zuorden-bar. Der „gatekeeper“ Rest ist in Leishmanien und Trypanosomen Methionin (LmxGSK3α:

M346; LmxGSK3β: M100) anstelle von Leucin der humanen GSK3. In der humanen GSK3α und GSK3β sowie in LmxGSK3β ist der „gatekeeper“ Rest Teil einer β-Faltblattstruktur. Für LmxGSK3α wird für diesen Bereich der Subdomäne V eine α-Helix vorhergesagt (Abb. 39).

Der C-terminale Bereich von GSK3β aus Trypanosomatiden fällt kürzer aus als der von GSK3α und der von GSK3β-Homologen aus anderen Organismen wie Säugetieren, Drosophila melanogaster oder Plasmodium spec. (für die beiden letztgenannten Spezies ist das Alignment nicht dargestellt). Der N-terminale Bereich, der der Kinasedomäne vorangeht, ist in der humanen GSK3α um einiges länger als in der humanen GSK3β. In GSK3α aus Homo sapiens ist er reich an Glycin-Resten. Auch LmxGSK3α zeichnet sich durch einen langen N-terminalen Bereich aus, welcher LmxGSK3β fehlt. Die Aminosäure Glycin ist in diesem Abschnitt nicht überproportional repräsentiert. Auffällig ist eine sich wiederholende CV-Sequenz kurz nach dem Start-Methionin (3 x CV) und weiter stromabwärts (4 x VC),

welche laut Sekundärstrukturvorhersage je eine β-Faltblattstruktur ausbildet. Ersterer schließt sich direkt eine α-Helix an. In allen Leishmanienspezies finden sich stromauf der Kinasedomäne von GSK3α ein oder zwei kurze CV-Sequenzwiederholungen (bei L. major und L. braziliensis vor dem annotierten Start). Aufgrund des langen, andersgearteten N-Terminus rückte LmxGSK3α ins Zentrum weiterer Untersuchungen mit Hilfe bioinfor-matischer Werkzeuge. Bei der Analyse der Sequenz auf charakterisierende Motive wurde als Besonderheit mittels „SignalP“ das Vorliegen eines N-terminalen, 22 Aminosäuren langen Signalpeptids festgestellt (Abb. 40). SignalP Version 4.0 ist ein auf künstlichen neuronalen Netzwerken basierendes Programm, mit welchem in Eukaryonten und Prokaryonten Signal-sequenzen des sekretorischen Weges identifiziert und von Transmembranregionen unter-schieden werden können (Petersen et al., 2011). Eine Schnittstelle der Signalpeptidase I wurde von der Software zwischen Aminosäureposition 22 und 23 gefunden (Abb. 40), wobei das reife Protein mit Valin-23 begänne.

Measure Position Value Cutoff Signal peptide?

max. C 23 0.357 max. Y 23 0.579 max. S 16 0.980 mean S 1-22 0.939

D 1-22 0.774 0.450 YES

Abb. 40: SignalP 4.0-Vorhersage für LmxGSK3α. Einstellungen: Organism group: Eucaryotes;

Method: Input sequences may include transmembrane regions. In der Graphik sind der C-, S- und Y-Score dargestellt, zusätzlich sind die numerischen Werte für den S-mean und D-Y-Score in der Tabelle angegeben. Die Ordinate gibt die Höhe des Scores an, wobei das Maximum bei 1.0 liegt. Die Abszis-se zeigt die zugehörige Aminosäureposition im dargestellten Sequenzabschnitt von LmxGSK3α an.

Der S-Score wird für jede einzelne Aminosäure angegeben, hohe Werte zeigen an, dass die korres-pondierende Aminosäure Teil eines Signalpeptids ist, niedrige Werte finden sich für das reife Protein.

Der C-Score ist der „cleavage site“ Score. Er wird für jeden einzelnen Rest berechnet und ist an der Peptidase-Schnittstelle signifikant erhöht. Y-max resultiert aus C-Score kombiniert mit dem S-Score und führt zu einer verbesserten Vorhersage de Peptidase-Schnittstelle. Der S-mean-Wert und der ver-besserte D-Score sagen etwas zum Vorliegen eines sekretorischen bzw. nicht-sekretorischen Proteins aus. Für nicht sekretierte Proteine sollten alle aufgeführten Werte idealerweise sehr niedrig ausfallen.

Die Sequenzanalyse mittels der Programme “Phobius” und “TMHMM“ ergab, ausgenommen vom Signalpeptid, keinen Hinweis auf Transmembran-Domänen, wie sie in membrangebun-denen Proteinen gefunden werden (Käll et al., 2004). Die meisten Oberflächenproteine in Trypanosomatiden werden mit einem C-terminalen GPI-Anheftungssignal synthetisiert, welches nach Transport in das ER durch einen GPI-Anker ersetzt wird (McConville et al., 2002). Die Suche nach einer GPI-Modifizierungsstelle in LmxGSK3α unter Zuhilfenahme der

Programme „big-PI Predictor“ (Einstellung: Protozoa) und „GPI-SOM“ (Eisenhaber et al., 1999; Fankhauser und Mäser, 2005) verlief erfolglos.