• Keine Ergebnisse gefunden

3 Material und Methoden

4.4 Homologe Proteine zu p170

Lange Zeit konnten in Datenbanken zu der hier vorgestellten cDNA keine EST-Sequenzen gefunden werden. Dies ist für eine Xenopus laevis Sequenz insofern nicht weiter überraschend, da sich EST-Sequenzierungsprojekte von diesem Organismus, wie bereits beschrieben, gerade erst im Anfangsstadium befinden. Im Gegensatz dazu gibt es jedoch zum Beispiel von Mensch und Maus schon seit mehreren Jahren EST-Sequenzdaten. Von häufig exprimierten Genen liegen meist mehrere EST-Klone vor.

Um so verwunderlicher war es deshalb, daß zunächst keine entsprechenden homologen EST-Sequenzen zu der p170 Xenopus-Sequenz identifiziert werden konnte. Daraus kann geschlußfolgert werden, daß es sich bei p170 entweder um ein Xenopus laevis spezifisches oder um ein sehr seltenes Genprodukt handelt. Die letzte Vermutung wurde bestätigt: Erst im Juni 2000 konnten mehrere EST-Klone aus anderen Organismen identifiziert werden, die eindeutig zu p170 homolog sind, und erst zu diesem Zeitpunkt in den Datenbanken veröffentlicht wurden.

Tabelle 11: Identifizierte homologe ESTs (Expressed Sequence Tags) Stand 10/00

Accession Nummer

Organismus cDNA-Bibliothek Länge in bp

AA907211 Mensch Lunge 233

AI184153 Mensch Hoden 342

AW627636 Mensch Genital-Trakt 434

BE197240 Maus Brustdrüsengewebe eines stillenden Weibchens 459

BE217475 Kuh Leber 317

BE012599 Schwein 11, 13, 15, 20, und 30 Tage alte Embryonen. 204

AI721793 Zebrafisch Unbefruchtetes Ei 550

In Abb. 18 ist die Lage der einzelnen EST-Klone bezogen auf den C Terminus von p170 (Klon C: p170 aa 629-1335) dargestellt. Die Sequenzen der einzelnen ESTs sind im Anhang auf Seite 131 zusammengestellt.

4 Ergebnisse 55

Abb. 18: Lage der homologen EST-Klone im p170 Carboxy-Terminus

Dargestellt sind die gefundenen EST-Klone von Mensch, Maus, Schwein, Kuh und Zebrafisch. Identische Aminosäuren werden in Prozent angegeben.

Im Carboxy-Terminus gibt es offensichtlich einen gut konservierten Bereich (vgl. Abb.

19).

X.l. p170 : 1125 EKIQHLKQKLEETNDTVCNLKTELQARNEVIKATNEVLILKESELTRL 1172 mouse EST: 61 EQLEKAKQELEEAQDTVSNLHQQVQDRNEVIEAANEALLIKESELTRL 121 human EST: 60 EQLEKAKLELEEAQDTVSNLHQQVQDRNEVIEAANEALLTKVSKKHIK 12 cow EST: 1 QVQDRNEVIEATNEALLIKESELTRL 26

Abb. 19: Konservierter Proteinsequenzbereich im p170 Carboxy–Terminus

Ein 45 Aminosäuren langer Bereich im Carboxy-Terminus von p170 ist in Mensch, Maus und Kuh im Vergleich zu Xenopus etwa 45% konserviert. Die Aminosäuresequenz ARNEVIKAT entspricht der Myc-Typ Helix loop Helix Dimerisierungs-Domäne nach PROSITE (Id.No. PS00038).

Im Mai 2000 konnte durch Datenbankrecherchen ebenfalls ein Xenopus laevis EST-Klon identifiziert werden (acc.No.: bl07g09.w1/ cDNA clone PBX0007G09) der identisch zu der hier vorgestellten cDNA ist. Dieser Klon liegt im C-terminalen Bereich von Klon C (Position bp 1071-1556) und wurde aus einer cDNA-Bibliothek aus unbefruchteten Eiern im Rahmen des Xenopus laevis-Sequenzierungsprojekts am National Institutes of Health/ USA (Blackshear, 2000) gewonnen.

4 Ergebnisse 56

Ausgehend von den menschlichen ESTs konnte das humane p170 Homolog durch Computervergleiche von sogenannten „High-Throughput Genomic Sequences“ (HTGs) identifiziert werden (Jang et al., 1999; Ouellette, 1999). Bei diesen HTG-Sequenzen handelt es sich um Rohdaten unsortierter genomischer DNA-Sequenzen, die auf diese Art schnell zugänglich gemacht werden sollen. Die chromosomale Lokalisation des menschlichen p170 wurde durch das Contig Al139421 festgestellt: Das menschliche p170 Gen ist auf Chromosom 1 im Bereich p21.2-22.3 lokalisiert (vgl. Abb. 20). Das Contig Al355822 besteht aus 144312 bp, das Contig Al139421 aus 86498 bp. Durch die genaue Analyse dieser beiden Contigs konnte das menschliche Homolog komplett assembliert werden.

Abb. 20: Chromosomale Lokalisation und Genstruktur des humanen p170 Gens

A: Das menschliche p170 Gen liegt auf Chromosom 1 im Bereich p 21.2-22.3. Die Lokalisation wurde vom Sanger Zentrum, England über Fluoreszenzhybridierung mit Sequenzabschnitten aus dem Contig Al139421 festgestellt.

B: Das menschliche p170 Gen ist aus 25 Exons zusammengesetzt, die sich über einen Bereich von ca.

107 kb erstrecken. Dargestellt sind die beiden Contigs Al139421 und Al355822 auf denen die 25 Exons identifiziert werden konnten. Die Reihenfolge der 16 Unter-Conigs von Al355822 ist bislang nicht geklärt gewesen, dies ist durch eine gestrichelte Linie dargestellt. Die Reihenfolge von 8 dieser Contigs konnte durch den p170 Vergleich ermittelt werden.

4 Ergebnisse 57

Das Contig Al355822 wird als „Working draft sequence“ bezeichnet und besteht aus 16 einzelnen Unter-Contigs, bei denen die richtige Reihenfolge bislang nicht bekannt war.

Das Contig Al139421 wird dagegen als fertig assemblierte Sequenz angesehen.Das menschliche p170 Gen setzt sich aus insgesamt 25 Exons zusammen, die sich über einen Bereich von ca. 107 kb erstrecken. Die Exon-Größen liegen dabei im Bereich von 50-450 bp. Die Intron-/Exongrenzen stimmen mit den in der Literatur beschriebenen Konsensus-Sequenzen (GT-AG) gut überein, Abweichungen davon (vgl. Tabelle 12, Exon 8) sind sehr wahrscheinlich auf Ungenauigkeiten der vorliegenden Sequenzinformation zurückzuführen. Das Contig Al355822 beinhaltet die ersten 23 Exons, das Contig Al139421 beginnt mit dem achten Exon und enthält zusätzlich die auf dem Contig Al355822 fehlenden letzten beiden Exons des p170-Gens.

Tabelle 12:Intron-Exon-Struktur des humanen p170 Gens

4 Ergebnisse 58

Erst durch einen Vergleich des Xenopus laevis- p170-Gens mit den beiden Contigs können diese in sich geordnet werden und in eine sinnvollen Reihenfolge gebracht werden. Beide Contigs definieren in dieser neuen Reihenfolge einen 107 kb großen Abschnitt auf Chromosom 1.

Die Translation der konstruierten cDNA des humanen p170 Gens resultiert in ein Protein mit 1244 Aminosäuren. Durch Erhalt der menschlichen p170 Sequenz konnte das Maus p170 Homolog zu großen Teilen auf Contig Ac074209 identifiziert werden.

Dieses Contig wird ebenfalls als „Working draft sequence“ bezeichnet, es besteht aus 224592 bp die sich auf 31 Unter-Contigs verteilen, bei denen die exakte Reihenfolge ebenfalls noch nicht geklärt ist. Auf dem genannten Contig liegen 21 Exons des p170- Maus-Homologs. Die Exons liegen in ungeordneter Reihenfolge vor. Der Carboxy-Terminus des Maus Homologs konnte bis auf 65 Aminosäuren (H.s.p170 973-1038) durch den Vergleich von weiteren Maus EST-Daten assembliert werden (vgl. Anhang:

Maus ESTs, Seite 131). Die fehlenden 65 Aminosäuren konnten bislang nicht identifiziert werden, da das Maus Genom-Sequenzierungsprojekt nach Angaben des National Institutes of Health, USA im Oktober 2000 erst zu 0,7% fortgeschritten ist, bzw. die meisten Daten noch nicht öffentlich zugänglich sind. Die fehlenden Aminosäuren entsprechen dem menschlichen p170 Exon Nr. 22. Die Aminosäure-Sequenzvergleiche von Mensch und Frosch ergeben, daß das p170 Protein in diesen beiden Organismen zu 63.8 % ähnlich und zu 43.9% identisch ist. Der Vergleich des p170 Proteins von Xenopus laevis zu Maus fällt ähnlich aus: 65% ähnliche Aminosäuren und 44.9% identische Aminosäuren. Die p170 Proteine von Maus und Mensch haben erwartungsgemäß höhere Übereinstimmung: hier konnten 91% der Aminosäuren als ähnlich und 84.5 % der Aminosäuren als identisch identifiziert werden (vgl. Abb. 21 Alignment von p170 Maus, Mensch und Frosch). Die Maus- und Mensch- p170 cDNA-Sequenz besitzt an gleicher Position ein Startcodon und 18 bp stromaufwärts ein Stopcodon (TGA) im 5‘-Bereich. Die Xenopus laevis Sequenz ist um 76 Aminosäuren länger als die von Maus und Mensch und besitzt kein Stopcodon im 5’-Bereich. Die in der Xenopus-Sequenz vorliegenden Sequenzmotive, Q-Stretch und zwei Leucin-Zipper, sind auch in p170 Mensch und p170 Maus konserviert. Auch für die p170 Homologe aus Mensch und Maus werden lange α-helicale Bereiche mit Präferenz zur Ausbildung von Coiled Coils vorhergesagt (Daten nicht gezeigt).

4 Ergebnisse 59

X.l. MELNMPTYNDQIEEPTDGLLLMGKLMQGEWSIEHEDEKRDHSSEHSLSRV 50

M.m. ...MEFAQFXGRVIQVSFSSVS 19 H.s. ...MEFAEFRGRVIQMFSSSAP 19 X.l. PLGLTLEDLEQSCKSRENLLRSRNTVSQNAGNSLRAFKDKPTNSQSGSLI 100

M.m. ..MDQEVKNLREKLHKLRQQNACLVTQNHSLMTKIESVHFELTQSKAKIA 67 H.s. ..VDQEIKSLREKLNKLRQQNACLVTQNHSLMTKFESIHFELTQSRAKVS 67 X.l. RNTEQQNRQLKEKLNFLQEQNASLVSQNHSLMNKIDCVQTELTKSRSRIR 150

M.m. MLESAQ.EQAANIPILEEQIINLEAEVSAQDKVLREAEDKLEQSQKMVIE 116 H.s. MLESAQ.QQAASVPILEEQIINLEAEVSAQDKVLREAENKLEQSQKMVIE 116 X.l. YVESAIGARAMRLPDLEERILTLEAKADAQENALRTTEDQLEHSRHILAE 200

M.m. KEHSLQEAKEECIKLKVDLLEQSKQGKRAERQRNEALYNAEELSKAFQLY 166 H.s. KEQSLQESKEECIKLKVDLLEQTKQGKRAERQRNEALYNAEELSKAFQQY 166 X.l. KERILQMFKDEMKALKEELFASCRLCKRTEKQRNEALFNAEELTKALQQY 250

M.m. KEKVAEKLEKVQDEEEILERNLSNCEKENKRLQEKCNLYKSELEILKEKF 216 H.s. KKKVAEKLEKVQAEEEILERNLTNCEKENKRLQERCGLYKSELEILKEKL 216 X.l. KNKMTEKMEKVQEEGELLKNKFSNCEKEQDALQQKCVMLDTELEKSRDAL 300

M.m. RELKQQHYTGKEQPMIMATNNSQLMSQLTESRQCILKLERELEDKDEIVR 266 H.s. RQLKEENNNGKEKLRIMAVKNSEVMAQLTESRQSILKLESELENKDEILR 266 X.l. RNLQSENIIRQERHQCVEAKNAELISLLTQSNQRILRLESELEHKEKALQ 350

M.m. EKFSLLNENRELKVRVATQNERLELCQQDIDN.SRVELKSLEKLITQ.RI 315 H.s. DKFSLMNENRELKVRVAAQNERLDLCQQEIES.SRVELRSLEKIISQLRI 315 X.l. EN...IDENKAMKDCFAKSKQSETISDQPKEQPADSASDGSGKLIADLRA 397

M.m. KLAIREAEIQKLHANLTVNQLSQN..VANDSQECGKVNTLETEPVKLG.. 360 H.s. KLAIKEAEIQKLHANLTANQLSQSLITCNDSQESSKLSSLETEPVKLG.. 363 X.l. KLLIREAENKELQAELVNGKLLTN..RYRNSLEKNCLDALEAEPVKLNLQ 445

M.m. GSQVGEYITFELLNKQYEREKQRLATGIEELRAKLTQIEAENSDLKVNMA 410 H.s. GHQVGKYI..ELFNKQYEKERQRLVTGIEELRTKLIQIEAENSDLKVNMA 411 X.l. NTAEEKYLQLELLCKQIQMDKERLTDCVKELQGKLGKAQIELTNTKLSME 495

M.m. HRTSQFQLIQEELLEKASNASKLENEMTKKCSQLLILEKQLEEKIIAYSS 460 H.s. HRTSQFQLIQEELLEKASNSSKLESEMTKKCSQLLTLEKQLEEKIVAYSS 461 X.l. QRTSQLQLIQQELLEKASKTTKLEQELVKKRMKISALQKLVEEKSQVYSA 545

M.m. IAAKNAELEQELMEK...IRSLESNINTEHEKICFAFEKAKKIHLEQHKE 507 H.s. IAAKNAELEQELMEKNEKIRSLETNINTEHEKICLAFEKAKKIHLEQHKE 511 X.l. AEARNAGLEEKLKNYKDQIVNLEDNINKEHAEVLLALERSKDIHQDQQKE 595

M.m. MEKQIEQVETQLEKRDQQFKEQEKTMSILQQDILCKQHHLESLDRLLTES 557 H.s. MEKQIERLEAQLEKKDQQFKEQEKTMSMLQQDIICKQHHLESLDRLLTES 561 X.l. LMKQIEHLQLQLEMKNLHAGEQKHTITILQQETLWHEQQLESVNHLLTQA 645

M.m. KQEMEKENMKKDEALKALQIHVSEETIKVRQLDSALEICKEELALHLNQL 607 H.s. K.EMKKENMKKDEALKALQNQVSEETIKVRQLDSALEICKEELVLHLNQL 609 X.l. RKELEIQTKNTSAAMKSLQNQVEVESAKVSQLESALTVCKEELALYLHEL 695

M.m. ERNKEKFERQLKKKSEEVYCLQKELKIKTHNLEETSEQNAILQHTLQQQQ 657 H.s. EGNKEKFEKQLKKKSEEVYCLQKELKIKNHSLQETSEQNVILQHTLQQQQ 660 X.l. EDNREQFENQIKTKSEELWCLQNEIKLRTQSLQETSEENVRLQQTLQQQQ 745

M.m. QMLQQETMRNGELEDTQSKLEKQVSKQEQELQKQRESSTEKLRKMEEKYE 707 H.s. QMLQQETIRNGELEDTQTKLEKQVSKLEQELQKQRESSAEKLRKMEEKCE 710 X.l. HMLQQGTGRIGELEDHHTELEKQVSKLEFELEKQRSMSEDMLQRTKDSLH 795

M.m. TAIREVDLKRQKIIELTGTARQAKLEMDQYKEELSKMEKEIIHLKRDGEN 757 H.s. SAAHEADLKRQKVIELTGTARQVKIEMDQYKEELSKMEKEIMHLKRDGEN 760 X.l. AANKELGLKTEEVQELCSTLNQVKLELKHTNVTLLQMEEELVSLKNKEEK 845

4 Ergebnisse 60

M.m. KSMQLSQLDMVLDQT..ELEKTTNSVKELERLQHHTETELTETMQKREAL 805 H.s. KAMHLSQLDMILDQTKTELEKKTNAVKELEKLQHSTETELTEALQKREVL 810 X.l. NASMLKLLQMDMQKTQVELDKKACAVLELEEKLHIAEKDS....KRTEEM 891

M.m. ENELQNAHGELKSTLRQLQELRDVLQKAQLSLEEKYTTIKDLTAELRECK 855 H.s. ETELQNAHGELKSTLRQLQELRDVLQKAQLSLEEKYTTIKDLTAELRECK 860 X.l. ETQLSGMQKELDGYTKQVEELQETLTKTHLSVEEKQVIIQGLTEKLRSYK 941

M.m. MEIEDKKQELIEMDQALKERNWELKQRAAQVTHLDMTIREHRGEMEQKII 905 H.s. MEIEDKKQELLEMDQALKERNWELKQRAAQVTHLDMTIREHRGEMEQKII 910 X.l. QELEERDHEVLDMDQLLKDRNWELKQRAAQLTQLDMSIRGHKGEMEQKII 991

M.m. KLEGTLEKSELELKECNKQVESLNEKLQNAKEQLGEKEFIMLQNEQEISQ 955 H.s. KLEGTLEKSELELKECNKQIESLNDKLQNAKEQLREKEFIMLQNEQEISQ 960 X.l. RLESALEKAELEARDHIKEISSLDERLQQARDQLCEKEFDLMQKDQIINQ 1041

M.m. LKKEIERTQQRMKEMESXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 1005 H.s. LKKEIERTQQRMKEMESVMKEQEQYIATQYKEAIDLGQELRLTREQVQNS 1010 X.l. LKKDIERSHQTVTDMEKTLKVQERRISEKHQDGVDLSKQVCLAQERMQLT 1091

M.m. XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXEQLEKAKQELEEAQDTV 1055 H.s. HTELAEARHQQVQAQREIERLSSELEDMKQLSKEKLEKAKLELEEAQDTV 1060 X.l. HQELLETRQQLAEAQKESDRLAQKLEGMDLISKEKIQHLKQKLEETNDTV 1141

M.m. SNLHQQVQDRNEVIEAANEALLIKESELTRLQAKISGHEKTEDTKYLPAP 1105 H.s. SNLHQQVQDRNEVIEAANEALLTKESELTRLQAKISGHEKAEDIKFLPAP 1110 X.l. CNLKTELQARNEVIKATNEVLILKESELTRLKARISSYERTLGLKQLSDT 1191

M.m. FTTLTEIIPDSQHPNFAKHSQISLFKCRKLRRSISASDLSFKSHGNDDLS 1155 H.s. FTSPTEIMPDVQDPKFAKCFHTSFSKCTKLRRSISASDLTFKIHGDEDLS 1160 X.l. TALPSISFTDPHPLDSSKHPEASDFKMWHISPSISASNLSLTDMSSLELP 1241

M.m. EELLQDLKKMQFEQTSAIESGHKTYLPNQSE...SFKPLPYNLEDDS. 1199 H.s. EELLQDLKKMQLEQPSTLEESHKNLTYTQPD...SFKPLTYNLEADS. 1204 X.l. KSMLEDLRNLAPPDSPPMKDTSEGVSCVSSDSLNNSSFNPLTYALDENSD 1291

M.m. .SESNDFSTLSGMLRYINKEVRLVK...KSSLQTATGLSQGGKL* 1240 H.s. .SENNDFNTLSGMLRYINKEVRLLK...KSSMQTGAGLNQGENV* 1244 X.l. FTDCPDLTTLTGMLKYIKKEMRLSEYPQEHSPSKAAGID.GGSLG* 1335

Abb. 21: Alignment von p170-Homologen

Die p170 Proteinsequenzen von Frosch (X.l.), Maus (M.m.), Mensch (H.s.) wurden mit dem Clustal X Programm ausgerichtet. Identische Aminosäuren sind durch schwarze Boxen, ähnliche Aminosäuren sind durch graue Boxen unterlegt (MacBox-Shade 2.15- Programm).

4 Ergebnisse 61

4.5 Bakterielle Expression von p170-Teilfragmenten und