细胞周期调节蛋白的制作方法

文档序号：3501730阅读：685来源：国知局

专利名称：细胞周期调节蛋白的制作方法
相关申请本申请要求保护2001年1月19日递交的美国临时专利申请号60/262885的利益，该文献引入本文作为参考。
背景技术：
已经鉴定了相对于健康细胞而言在肿瘤细胞中进行过量表达的各种各样的基因。人们期望这样的基因的鉴定将为抗癌药物的研制和癌症诊断提供药靶。
概述本发明基于人类细胞周期调节蛋白的发现，在肝癌患者中相对于正常相邻组织该蛋白在肝细胞中过量表达。将该蛋白命名为肝细胞瘤上调蛋白或HURP。全长人HURPcDNA(GenBank入藏号AB076695)显示如下人HURPcDNA序列AGCAAACCAATCGCAAGCCTCGTTGAGTGGAAGGGGT -181GGGATCTTCCCCGGAAGTTTTGGTTAAAGCCCCTCCAATCAGCGGCTCGGTGCGGCAAGTTTGAATTTCGTGGAGGCTCGGGTTGTGAGG -91GTTCCTGCTTCGGAGTCGGCGGTGGTCGTCCAGACCGAGTGTTCTTTACTTTTTGTTTGGTTGAGGTTTCACGCTAGAAGGTGGCTCAGG -1ATGTCTTCATCACATTTTGCCAGTCGACACAGGAAGGATATAAGTACTGAAATGATTAGAACTAAAATTGCTCATAGGAAATCACTGTCT 901M S S S H F A S R H R K D I S T E M I R T K I A H R K S L SCAGAAAGAAAATAGACATAAGGAATACGAACGAAATAGACACTTTGGTTTGAAAGATGTAAACATTCCAACCTTGGAAGGTAGAATTCTT 18031 Q K E N R H K E Y E R N R H F G L K D V N I P T L E G R I LGTTGAATTAGATGAGACATCTCAAGAGCTTGTTCCAGAAAAGACCAATGTTAAGCCAAGGGCAATGAAAACTATTCTAGGTGATCAACGA 27061 V E L D E T S Q E L V P E K T N V K P R A M K T I L G D Q RaAACAGATGCTCCAAAAATACAAAGAAGAAAAGCAACTTCAAAAATTGAAAGAGCAGAGAGAGAAAGCTAAACGAGGAATATTTAAAGTG 36091 K Q M L Q K Y K E E K Q L Q K L K E Q R E K A K R G I F K VGGTCGTTATAGACCTGATATGCCTTGTTTTCTTTTATCAAACCAGAATGCTGTGAAAGCTGAGCCAAAAAAGGCTATTCCATCTTCTGTA 450121 G R Y R P D M P C F L L S N Q N A V K A E P K K A I P S S VCGGATTACAAGGTCAAAGGCCAAAGACCAAATGGAGCAGACTAAGATTGATAACGAGAGTGATGTTCGAGCAATCCGACCTGGTCCAAGA 540151 R I T R S K A K D Q M E Q T K I D N E S D V R A I R P G P RCAAACTTCTGAAAAGAAAGTGTCAGACAAAGAGAAAAAAGTTGTGCAGCCTGTAATGCCCACGTCGTTGAGAATGACTCGATCAGCTACT 630181 Q T S E K K V S D K E K K V V Q P V M P T S L R M T R S A T
CAAGCAGCAAAGCAGGTTCCCAGAACAGTCTCATCTACCACAGCAAGAAAGCCAGTCACAAGAGCTGCTAATGAAAACGAACCAGAAGGA 720211 Q A A K Q V P R T V S S T T A R K P V T R A A N E N E P E GAAGGTGCCAAGTAAAGGAAGACCTGCCAAAAATGTACAAACAAAACCCGACAAGGGTATTTCTTGTAAAGTCGATAGTGAAGAAAATACT 810241 K V P S K G R P A K N V E T K P D K G I S C K V D S E E N TTTGAATTCACAAACTAATGCAACAAGTGGAATGAATCCAGATGGAGTCTTATCAAAAATGGAAAACTTACCTGAGATAAATACTGCAAAA 900271 L N S Q T N A T S G M N P D G V L S K M E N L P E I N T A KATAAAAGGGAAGAATTCCTTCGCACCTAAGGATTTTATGTTTCAGCCACTGGATGGTCTGAAGACCTATCAAGTAACACCTATGACTCCC 990301 I K G K N S F A P K D F N F Q P L D G L K T Y Q V T P M T PAGAAGTGCCAATGCTTTTTTGACACCCAGTTACACCTGGACTCCTTTAAAAACAGAAGTTGATGAGTCTCAAGCAACAAAAGAAATTTTG 1080331 R S A N A F L T P S Y T W T P L K T E V D E S Q A T K E I LGCACAAAAATGTAAAACTTACTCTACCAAGACAATACAGCAAGATTCAAATAAATTGCCATGTCCTTTGGGTCCTCTAACTGTTTGGCAT 1170361 A Q K C K T Y S T K T I Q Q D S N K L P C P L G P L T V W HGAAGAACATGTTTTAAATAAAAATGAAGCTACTACTAAAAATTTAAATGGCCTTCCAATAAAAGAAGTCCCATCACTTGAAAGAAATGAA 1260391 E E H V L N K N E A T T K N L N G L P I K E V P S L E R N EGGTCGAATTGCTCAGCCCCACCATGGTGTGCCATATTTCAGAAATATCCTCCAGTCAGAAACTGAGAAATTAACTTCACATTGCTTCGAG 1350421 G R I A Q P H H G V P Y F R N I L Q S E T R K L T S H C F ETGGGACAGGAAACTTGAATTGGACATTCCAGATGATGCTAAAGATCTTATTCGCACAGCAGTTGGTCAAACAAGACTCCTTATGAAGGAA 1440451 W D R K L E L D I P D D A K D L I R T A V G Q T R L L M K EAGGTTTAAACAGTTTGAAGGACTGGTTGATGATTGTGAATATAAACGAGGTATAAAGGAGACTACCTGTACAGATCTGGATGGATTTTGG 1530481 R F K Q F E G L V D D C E Y K R G I K E T T C T D L D G F WGATATGGTTAGTTTTCAGATAGAAGATGTAATCCACAAATTCAACAATCTGATCAAACTTGAGGAATCTGGGTGGCAAGTCAATAATAAT 1620511 D M V S F Q I E D V I H K F N N L I K L E E S G W Q V N N NATGAATCATAATATGAACAAAAATGTCTTTAGGAAAAAAGTTGTCTCAGGTATAGCAAGTAAACCAAAACAGGATGATGCTGGAAGAATT 1710541 M N H N M N K N V F R K K V V S G I A S K P K Q D D A G R IGCAGCGAGAAATCGCCTAGCTGCCATAAAAAATGCAATGAGAGAGAGAATTAGGCAGGAAGAATGTGCTGAAACAGCAGTTTCTGTGATA 1800571 A A R N R L A A I K N A M R E R I R Q E E C A E T A V S V ICCAAAGGAAGTTGATAAAATAGTGTTCGATGCTGGATTTTTCAGAGTTGAAAGTCCTGTTAAATTATTCTCAGGACTTTCTGTCTCTTCT 1890601 P K E V D K I V F D A G F F R V E S P V K L F S G L S V S SGAAGGCCCTTCTCAAAGACTTGGAACACCTAAGTCTGTCAACAAAGCTGTATCTCAGAGTAGAAATGAGATGGGCATTCCACAACAAACT 1980631 E G P S Q R L G T P K S V N K A V S Q S R N E M G I P Q Q TACATCACCAGAAAATGCCGGTCCTCAGAATACGAAAAGTGAACATGTGAAGAAGACTTTGTTTTTGAGTATTCCTGAAAGCAGGAGCAGC 2070661 T S P E N A G P Q N T K S E H V K K T L F L S I P E S R S SATAGAAGATGCTCAGTGTCCTGGATTACCAGATTTAATTGAAGAAAACCATGTTGTAAATAAGACAGACTTGAAGGTGGATTGTTTATCC 2160691 I E D A Q C P G L P D L I E E N H V V N K T D L K V D C L SAGTGAGAGAATGAGTTTGCCTCTTCTTGCTGGTGGAGTAGCAGATGATATTAATACTAACAAAAAAGAAGGAATTTCAGATGTTGTGGAA 2250721 S E R M S L P L L A G G V A D D I N T N K K E G I S D V V EGGAATGGAACTGAATTCTTCAATTACATCACAGGATGTTTTGATGAGTAGCCCTCAAAAAAATACAGCTTCACAAAATAGCATCTTAGAA 2360751 G M E L N S S I T S Q D V L M S S P E K N T A S Q N S I L EGAAGGGGAAACTAAAATTTCTCAGTCAGAACTATTTGATAATAAAAGTCTCACTACTGAATGCCACCTTCTTGATTCACCAGGTCTAAAC 2430781 E G E T K I S Q S E L F D N K S L T T E C H L L D S P G L NTGCAGTAATCCATTTACTCAGCTGGAGAGGAGACATCAAGAACATGCCAGACACATTTCTTTTGGTGGTAACCTGATTACTTTTTCACCT 2520811 C S N P F T Q L E R R H Q E H A R H I S F G G N L I T F S PCTACAACCAGGAGAATTTTGA2541841L Q P G E F (SEQ ID NO4)ATTTAAAAATAAATCCAAACATTTTCCTTCATATTATCAATGCTTATATATTCCTTAGACTATTGAAATTTTGGAGAAAATGTATTTGTG 2631TTCACTTCTATAGCATATAATGTTTTAATATTCTGTGTTCATCAAAGTGTATTTTAGATATACTCTTTCTCAAGGGAAGTGGGGATATTT 2721TGTACATTTTCAACACAGAATAAAAAATGTACTGTGCCTTG (SEQ ID NO6)2762已经克隆了鼠HURP基因。全长鼠HURP cDNA(GenBank入藏号AB076696)如下鼠HURP cDNA序列AGTTTATAGTGTGTCGCTGCGTCGCCTAGC-271GGGTTTACCGCCTCCCTCCTCCCCCTCGCCCTCCCGCTCCCAACCCTTTGCCTTCCAAACAATTTAAATGTCGCACAGAACCAACCTATC-181GCAAGCCTCGTTCGAGGGGAAGGGGCGGGAGCTTCCGGAAGTGTTGGCAAAAGTCCCTCCAATCAGCGGCTGGCAGCGGGAAATTTCAGT-91TCCGTGAAGGGTCGGTCCGGGAGTTCCTTCTGGGGATCGGTGGAGTTTTCTGTGTTGGGAAATTGTTGTGGATCCAGAAACTGCTTCAGG-1ATGCTGGTGTCACGTTTTGCCAGTCGGTTTCGGAAAGACTCGAGCACTGAGATGGTTAGAACCAACTTGGCTCATAGAAAGTCTCTGTCT901M L V S R F A S R F R K D S S T E M V R T N L A H R K S L SCAGAAGGAGAACAGACACAGGGTGTATGAGCGAAACAGACACTTCGGTTTGAAGGACGTCAACATTCCACTGGAAGGGCGAGAGCTTGGT18031 Q K E N R H R V Y E R N R H F G L K D V N I P L E G R E L GAATATACACGAGACATCGCAAGACCTCTCTCCAGAGAAGGCCAGCTCCAAAACAAGGTCAGTAAAAATGGTCCTGAGTGACCAACGGAAG27061 N I H E T S Q D L S P E K A S S K T R S V K M V L S D Q R KCAGCTCCTCCAGAAGTATAAGGAAGAAAAACAACTTCAAAAACTGAAAGAACAGCGAGAGAAAGCCAAACGTGGAGTGTTCAAAGTGGGT36091 Q L L Q K Y K E E K Q L Q K L K E Q R E K A K R G V F K V GCTCTATAGACCCGCTGCGCCTGGCTTTCTTGTCACAGACCAGAGGGGTGCGAAAGCTGAGCCAGAAAAGGCTTTTCCACATACTGGACGG450121 L Y R P A A P G F L V T D Q R G A K A E P E K A F P H T G RATTACAAGATCAAAGACCAAAGAATATATGGAGCAGACTAAGATTGGTAGCAGGAATGTTCCTAAAGCAACCCAGAGTGACCAAAGACAA540151 I T R S K T K E Y M E Q T K I G S R N V P K A T Q S D Q R QACTTCTGAAAAACAACCATTAGACAGAGAGAGAAAAGTTATGCAGCCTGTGCTGTTCACGTCAGGGAAAGGGACTGAATCAGCGGCTACT630181 T S E K Q P L D R E R K V M Q P V L P T S G K G T E S A A TCAGAGAGCCAAGCTGATGGCCCGAACAGTGTCATCCACTACAAGAAAGCCAGTCACAAGAGCCACGAATGAGAAAGGATCACAAAGAATG720211 Q R A K L M A R T V S S T T R K P V T R A T N E K G S E R MAGACCAAGTGGAGGGAGACCTGCCAAAAAACCAGAAGGCAAGCCGGACAAGGTCATTCCTTCCAAAGTTGAGCGGGACCAAAAGCATTTG810241 R P S G G R P A K K P E G K P D K V I P S K V E R D E K H LGATTCGCAGACCAGGGAAACAAGTGAAATGGGTCTGCTCGGAGTCTTCCGAGAAGTGGAAAGCTTGCCTCCAACAGCCCCTGCCCAAGGG900271 D S Q T R E T S E M G L L G V F R E V E S L P A T A P A Q GAAGGAAAGGAAGTCCTTTGCCCCCAAGCACTGTGTCTTCCAGCCCCCGTGTGGTCTGAAGAGCTACCAGGTGGCTCCCCTGAGCCCTAGA990301 K E R K S F A P K H C V F Q P P C G L K S Y Q V A P L S P RAGTGCCAACGCTTTCCTGACACCCAATTGTGATTGGAACCAGTTAAGACCAGAAGTTTTTAGCACTACAACTCAAGACAAAGCAAATGAA1080331 S A N A F L T P N C D W N Q L R P E V F S T T T Q D K A N EATCTTGGTACAGCAAGGATTGGAGTCGCTAACAGACCGTAGTAAAGAACATGTCTTAAATCAGAAGGGCGCTTCTACTTCAGATTCAAAT1170361 I L V Q Q G L E S L T D R S K E H V L N Q K G A S T S D S NCACGCTTCTGTGAAAGGAGTCCCATGCTCTCAAGGGAGCGAAGGCCAGACCTCTCAGCCCCCCCACGATGTGCCATACTTCAGAAAAATC1260391 H A S V K G V P C S E G S E G Q T S Q P P H D V P Y F R K ICTCCAATCAGAAACTGACAGGCTGACCTCGCACTGCCTGGAGTGGGAGGGGAAGCTGGACCTGGACATCTCTGATGAAGCTAAAGGTCTT1350421 L Q S E T D R L T S H C L E W E G K L D L D I S D E A K G LATCCGTACAACGGTTGGTCAAACAAGACTCCTTATCAAGGAGAGATTCAGACAGTTTGAAGGACTGGTGGACAACTGCGAGTATAAACGG1440451 I R T T V G Q T R L L I K E R F R Q F E G L V D N C E Y K RGGTGAAAAGGAGACGACCTGCACAGATCTGGATGGATTCTGGGATATGGTTAGTTTTCAGGTCGATGATGTGAACCAGAAATTCAACAAC1530481 G E K E T T C T D L D G F W D M V S F Q V D D V N Q K F N NCTGATCAAACTTGAGGCGTCAGGATGGAAAGACAGCAATAATCCAAGCAAAAAAGTCCTCCGGAAAAAAATTGTGCCTGGTAGAACAAGC1620511 L I K L E A S G W K D S N N P S K K V L R K K I V P G R T SAAAGCAAAGCAGGATGACGACGGACCAGCGGCAGCTAGGAGTCGCCTTGCTGCCATAAAGAATGCAATGAAAGGCAGGCCACAGCAGGAA 1710541 K A K Q D D D G R A A A R S R L A A I K N A M K G R P Q Q EGTGCAGGCCCACGCAGCAGCTCCGGAGACCACAAAGGAAGTTGACAAAATAGTGTTTGACGCTGGGTTTTTCAGAATCGAGAGCCCAGTG 1800571 V Q A H A A A P E T T K E V D K I V F D A G F F R I R S P VAAGTCATTCTCAGTCCTGTCTTCTGAACGTCGTTCTCAAAGATTTGGAACACCTCTGTCTGCCAGCAAAGTTGTGCCTGAGGGCAGGGCT 1890601 K S F S V L S S E R R S Q R F G T P L S A S K V V P E G R AGCAGGGGACCTTCTGAGACAGAAGATGCCACTGAAGAAGCCGGACCCTCAGAGCAGCAAGAGTGAGCATGTTGATCGGACGTTTTCAGAT 1980631 A G D L L R Q K M P L K K P D P Q S S K S E H V D R T F S DGGTCTTGAAAGCAGGTGCCACGTAGAAGACACCCCCTGTCCTGGAGAGCAAGATTCAAGTGACATAGAGCATGATGTAAATAAAATAAAT 2070661 G L E S R C H V E D T P C P G E Q D S S D I E H D V N K I NGTCAAGATGGATTGTTTCTCTGTTGAAACGAATTTGCCTCTTCCTGCTGGTGATGCTAATACCAATCAAAAAGAAGCAATCTCAGCCGTG 2160691 V K M D C F S V E T N L P L P A G D A N T N Q K E A I S A VGAAGGAGCGAGCACTGCAGTCACCTCCCAGGATTTGCTGATGAGCAACCCTGAGACAAATACCTCCTCACAGAGCAACACCTCACAAGAA 2250721 E G A S T A V T S Q D L L M S N P E T N T S S Q S N T S Q EGAAGCTGAGGCGTCGCAGTCAGTACTGTTACATAAAAGTCTCACTTCTGAATGCCACCTTCTTGAACCACCAGGCCTCAGCTGCACCAGC 2340751 E A E A S Q S V L L H K S L T S E C H L L E P P G L S C T SCCCTGCACTCGGGAGGAGACCAGACAGCCAGATCGCAGCAGACAGTTCTCCTTTGGAGGTGACCTCATTCTCTTCTCACCACTATGA 2427781 P C T R E E T R Q P D R S R Q F S F G G D L I L F S P L * (SEQ IDNO2)CCCTGAAGGGAACACCAGGAGGGCTTTAAATTTAACATGACTTTTAATATTAATTTAAATAAACATTCAGTGCTCGCCTTTAATCCCAGC 2517ACTCCGGGAGGTAGAGGCAGGCGGATTTCTGAGTTCGAGGCCAGCCTGGTCTACAGAGTGAGTTCCAGGACAGCCAGGACTATACAGAGA 2607AACCCTGTCTCGAAAAACCAAAATAAATAAATAAATAAATAAACAAACAAACAAACAAA (SEQ ID NO5) 2666
编码人HURP蛋白的核苷酸序列(即SEQ ID NO6的ATG起始密码子到紧接终止密码子之前的密码子)命名为SEQ ID NO3，编码鼠HURP蛋白的核苷酸序列(即SEQ ID NO5的ATG起始密码子到紧接终止密码子之前的密码子)命名为SEQ ID NO1。
本发明的特征为包括至少65％(例如至少70，75，80，85，90，95，98或100％)等同于SEQ ID NO2或4的氨基酸序列的纯化多肽。一旦在细胞中表达，该多肽加速G2/M的进行并且促进细胞存活。
“纯化多肽”是没有其他生物学大分子的多肽，例如它至少有干重量的75％(例如至少80，85，95或99％)的纯度。采用合适的标准方法，例如采用柱层析，聚丙烯酰胺凝胶电泳，或HPLC分析可以测量纯度。
利用如Karlin和Altschul修饰的Karlin和Altschul的算法(美国科学院年报905873-5877，1993)可以测定两个氨基酸序列的“等同百分数”(美国科学院年报872264-2268，1990)。这样的方法引入到Altschul等人的NBLAST和XBLAST程序(分子生物学杂志215403-410，1990)。用NBLAST程序进行BLAST核苷酸检索，评分为100，字节长＝12。用XBLAST程序进行BLAST蛋白检索，评分为50，字节长＝3。两个序列之间存在缺口，如Altschul等人描述进行缺口的BLAST(核酸研究253389-3402，1997)。当利用BLAST和有缺口的BLAST程序时，利用各个程序的默认参数(例如XBLAST和NBLAST)。参见http//www.ncbi.nlm.nih.gov。
一旦在细胞中表达，本发明多肽促进G2/M进行，即过量表达HURP的细胞具有较高的DNA合成，或在无血清培养基中，当从有丝分裂抑制状态释放时，过量表达HUPR的细胞需要较少的时间从M阶段发展到G1阶段。按照下面实施例5的描述，测定HURP过量表达对G2/M进行的加速。本发明多肽的表达也促进细胞存活，即在补充了0.5％，1％，或2％血清的培养基，过量表达HURP的细胞以稳定的速率生长，直到达到稳定水平，而没有过量表达HURP的细胞在初期之后不久停止增生，缓慢的生长。按照下面实施例6的描述，测定过量表达HURP对细胞存活的促进。
本发明的多肽可用于产生特异地结合到HURP蛋白的抗体(单克隆或多克隆)。依次这些抗体可用于检测HURP在组织和细胞的隔室的存在和分布。例如，通过测定HURP蛋白在细胞中分布，可将这样的抗体用于测定细胞是否没有分裂或是在G2/M阶段。或者，通过测定HURP蛋白在组织中是否过量表达将它们用于诊断生癌的组织(例如，肝癌组织)。
本发明的特征也在于编码本发明多肽的分离的核酸，和核酸的补体。本发明内核酸的例子是在严谨条件下(即在65℃，0.5×SSC杂交，接着在45℃，0.1×SSC洗涤)与SEQ ID NO1或3，或SEQ ID NO1或3的补体杂交的分离的核酸。这样的核酸有至少15(例如，至少30，50，100，200，500，或1000)核苷酸长度。通过测定HURP mRNA是否在组织或细胞中过量表达可将本发明的核酸用于诊断癌(例如，肝癌)。在基于PCR的检测方法中将该核酸用作为引物，或在核酸印迹法中用作为标记的探针(例如，Northern印迹)。
“分离的核酸”是其结构不完全相同于任何天然存在的核酸的或横跨三个以上的独立的基因的天然存在的基因组核酸的片段的核酸。因此术语包括例如(a)具有部分天然存在的基因组DNA分子的序列的DNA，其中序列的侧面不是两个编码序列，该两个编码序列以生物体的基因组的部分分子为侧面，其中该分子在该生物体天然存在；(b)以获得的分子与天然存在的载体或基因组DNA不完全相同的方式，掺入到载体或掺入到原核生物或真核细胞的基因组DNA的核酸；(c)例如cDNA，基因组片段，由聚合酶链反应(PCR)产生的片段或限制性片段的单独的分子；和(d)是杂合基因的一部分的重组核苷酸序列，即编码融合蛋白的基因。特定地从该定义排除的是存在于不同的(i)DNA分子，(ii)转染的细胞，或(iii)细胞克隆的混合物中的核酸，例如在DNA文库例如cDNA或基因组DNA文库中存在的核酸。
另外，本发明的特征是(1)在细胞中表达转录物，即在上面描述的高严谨条件下与SEQ ID NO1或3杂交的转录物I的方法，或(2)在细胞中表达转录物，即与转录物I互补的转录物II的方法。当在细胞中表达时转录物I可作为与内源的HURP mRNA结合的反义RNA以阻止其翻译为功能蛋白。因此将该方法用于基因治疗以治疗癌(例如，肝癌)。转录物II编码HURP蛋白，和当在细胞中表达时，转录物II翻译为HURP蛋白。因此，该方法可用于生产本发明的多肽或用于治疗具有与不足的HURP基因表达关联的疾病的患者。
本发明进一步的特征在于经过将来自患者的测试样品中HURP基因表达的水平与来自正常人的对照样品的HURP基因表达的水平进行比较而测定患者是否具有细胞增殖紊乱的诊断的方法。在测试样品中较高的HURP基因表达水平显示患者具有与HURP基因过量表达关联的细胞增殖紊乱，例如肝癌。在测试样品中低的HURP基因表达水平显示患者具有与HURP基因的不足的表达关联的细胞增殖紊乱。
本发明的特征还在于鉴定适用于治疗细胞增殖紊乱的候选化合物的方法。例如，通过用各个化合物处理表达HURP基因的细胞，和检测和比较测试化合物存在和缺乏时HURP基因表达水平可以筛选化合物文库。抑制HURP基因表达的化合物是治疗与HURP基因过量表达关联的细胞增殖，例如肝癌的候选物。加强HURP基因表达的化合物是用于治疗与HURP基因的不足的表达关联的细胞增殖的候选物。
本发明的一个或多个具体实施方案列于下文的描述。根据说明书和权利要求书本发明的其他特征，目的和优点是显而易见的。
详细描述本发明涉及新的细胞周期调节蛋白(肝细胞瘤上调蛋白或HURP)和编码该蛋白的核酸。如下文实施例1-2的描述已经克隆人和小鼠HURPcDNAs。
相对正常的肝细胞，HURP是在肝癌细胞中过量表达。在正常的人组织，HURP mRNA仅仅在增生的正常组织亚群，例如在胸腺，结肠和睾丸中，但是不在肝脏中，以高的水平表达。如通过HURP mRNA在(1)在同步HeLa细胞，和(2)在部分的肝切除术之后再生鼠肝的G2/M时期中表达升高所阐明，在细胞周期中，HURP mRNA的内源水平紧紧地受调节。除了差异表达，HURP蛋白的细胞分布依赖于细胞周期的时期而不同。免疫荧光法研究显示，在细胞周期的分裂间期HURP定位于胞液，在有丝分裂时移动到纺锤体极点。此外，在293T细胞中HURP的过量表达导致G2/M加快进行和在低血清培养基中加强细胞生长。
上面的结果显示(1)在细胞周期中HURP调节G2/M转变(2)当正常细胞受阻塞时，HURP的过量表达通过使细胞进入细胞周期，并减少对细胞外的生长因子的依赖而导致恶性肿瘤，和(3)HURP表达或活性的抑制使癌细胞恢复到更正常表现型。因此HURP是新的癌基因和因此是新的癌药物靶。HURP的用途本文描述的核酸分子，蛋白，蛋白同系物和抗体可用于一种或多种下面方法a)筛选分析；b)预测药物(例如诊断分析，预后的分析，监视临床的试验，和遗传药理学)；和c)治疗方法(例如治疗学的和预防性的)。
本发明的分离核酸分子可用于例如表达HURP蛋白(例如在基因治疗应用中借助于重组表达载体在宿主细胞中表达)，以探测HURP mRNA(例如，在生物学的样品)或在HURP基因中遗传的改变，和调节HURP活性。HURP蛋白可用于治疗特征为HURP底物的不足的或过多的产生或HURP抑制剂的产生的紊乱。此外，HURP蛋白可用于筛选天然存在的HURP底物，筛选调控HURP活性的药物或化合物，以及治疗特征为HURP蛋白不足的或过多的产生或HURP蛋白类型的产生的混乱，该HUPR蛋白类型与HURP野生型蛋白相比具有减少的、异常的或多余的活性(例如，在肝癌)。而且，本发明的抗-HURP抗体可用于检测和分离HURP蛋白，调节HURP蛋白的生物可利用率，和调控HURP活性。
提供评价与本发明HURP多肽相互作用(例如结合)的能力的化合物的方法。该方法包括将本发明的HURP多肽与化合物接触；和评价该化合物与本发明的HURP多肽相互作用，例如结合或形成复合物的能力。该方法可以在体外，例如在无细胞系统，或在体内，例如在二个杂合的交互作用的随机存取程序分析中进行。该方法可用于鉴定与本发明HURP多肽相互作用的天然存在的分子。还可用于寻找本发明的HURP多肽的天然的或合成的抑制剂。(a)筛选测试本发明提供了用于鉴定调控剂，即与HURP蛋白结合的候选物或测试化合物或试剂(例如蛋白，肽，模拟肽，类胨，小分子，或其他药物)的方法(本文也称作为“筛选分析”)，这些调控剂对例如HURP表达或HURP活性具有刺激或抑制的作用，或对例如HURP底物的表达或活性具有刺激或抑制的作用。如此鉴定的化合物可用于在治疗的方案中调控靶基因产物的活性(例如HURP基因)以详细说明靶基因产物的生物学的功能，或鉴定破裂正常的靶基因相互作用的化合物。
在一个具体方案中，本发明提供了用于筛选作为HURP蛋白或多肽或其生物学活性的部分的底物的候选物或测试化合物的分析。在另一个具体方案中，本发明提供了用于筛选与HURP蛋白或多肽或其生物学活性的部分结合或调控其活性的候选物或测试化合物的分析方法。
利用本领域已知的组合文库方法，有很多的途径获得本发明的测试化合物，这些方法包括生物学的文库；类胨文库(具有肽功能的大分子文库，但是有对酶的降解有抗性，但是没有保留生物活性的新的非肽主链；参见，例如，Zuckermann，R.N.等人(1994)医学化学杂志372678-85)；在空间地可寻址的平行固相或溶液相文库；需要反褶积的合成的文库方法，“一个珠一个化合物”文库方法，和使用亲和层析法选择的合成的文库方法可以获得本发明的测试化合物。将生物学文库和类胨文库途径限制到肽文库，而其他的四个途径可应用到肽，非肽寡聚物，或化合物的小分子文库(Lam，K.S.(1997)抗癌药物研究12145)。
在本领域可以找到用于分子文库合成的方法实例，例如在DeWitt等人(1993)美国科学院年报906909；Erb等人(1994)美国科学院年报9111422；Zuckermann等人(1994).医学化学杂志372678；cho等人(1993)科学2611303；Carrell等人(1994)Angew.Chem.Int.Ed.EngL 332059；Carell等(1994)Angew.Chem.Int.Ed.Engl.332061；和在Gallop等人(1994)医学化学杂志371233。
化合物文库可以以溶液存在(例如，Houghten(1992)，Biotechniques 134124-21)，在珠子(Lam(1991)自然35482-84)，在芯片(Fodor(1993)自然364555-556)，细菌(Ladner，USP 5,223,409)，孢子(Ladner USP’409)，质粒(Cull等人(1992)美国科学院年报891865-1869)，或在噬菌体(Scott和Smith(1990)科学249386-390；Devlin(1990)科学249404-406；Cwirla等人(1990)美国科学院年报876378-6382；Felici(1991)分子生物学杂志222301-310；Ladner见上文)。
在一个具体方案中，试验是基于细胞的分析，其中表达HURP蛋白或其生物学活性的部分的细胞与测试化合物接触，测定测试化合物调控HURP活性的能力。通过监视例如细胞周期调节的细胞的定位，完成对调控HURP活性的测试化合物的能力的测定。细胞例如可以是哺乳动物(例如人)来源。
还可以评价测试化合物调控HURP结合到化合物，例如HURP底物，或结合到HURP的能力。可以通过将该化合物，例如底物，与放射性同位素或酶标记物结合来完成，以便通过检测复合物中标记的化合物(例如底物)来测定化合物(例如底物)与HURP的结合。或者将HURP与放射性同位素或酶的标记物偶合以监视复合物中测试化合物调控HURP与HURP底物的结合的能力。例如将化合物(例如，HURP底物)直接地或间接地用125I，35S，14C，或3H标记，并通过直接计数放射散发或通过闪烁计数探测放射性同位素。或者，用辣根过氧化物酶，碱性的磷酸酶，或萤虫素酶酶标记该化合物，并通过测定适当的底物转变为产物而检测酶的标记物。
可以评价化合物(例如，HURP底物)与有或没有标记的相互作用剂存在时与HURP相互作用的能力。例如微生理功能测定可用于检测在化合物或HURP没有标记时化合物与HURP的相互作用(McConnell，H.M.等人(1992)科学2571906-1912)。例如本文使用过的，″微生理功能测定″(例如，细胞传感器)是利用光可寻址的传感器(LAPS)测量细胞使环境变酸的速率的分析仪器。酸化速率的变化可用作为化合物和HURP之间相互作用的指标。
在另一个具体实施方案中，提供了无细胞的测试，其中对HURP蛋白或其生物学活性的一部分与试验的化合物接触，对测试化合物与HURP蛋白或者其生物学活性部分结合的能力进行评价。用于本发明的测试的HURP蛋白的优选的生物学活性部分包括参与与非-HURP分子，例如具有高表面可能性评分的片段的相互作用的片段。
分离的蛋白(例如HURP蛋白，或者其生物学活性部分)的可溶的和/或膜结合的形式可应用到本发明的无细胞分析评价中。当蛋白的膜结合形式被使用时，利用增溶剂也许合乎需要。这样的增溶剂的例子包括类似n-辛基糖苷，n-十二基糖苷，n-十二基麦芽糖甙，辛酰-N-甲基葡糖酰胺，癸酰-N-甲基葡糖酰胺，Triton RX-100，Triton RX-114，ThesitR，Isotridecypoly(乙烯乙二醇醚)n，3-[(3-胆酰氨基丙基)二甲基amminio]-1-丙烷磺酸盐(CHAPS)，3-[(3-胆酰氨基丙基)二甲基amminio)-2-氢氧基-1-丙烷磺酸盐(CHAPS ○)，或者N-十二烷基N，N-二甲基-3-氨溶-1-丙烷磺酸盐的非离子去污剂。
无细胞的分析评价涉及在一定的条件和在完全能够允许2个组成部分相互作用和结合时制备靶基因蛋白和测试化合物的反应混合物从而形成可以被去除和/或检测的复合物。
另外，例如使用荧光管能量转移(FET)还可以检测两个分子之间的相互作用(参见，例如，Lakowicz等人，美国专利号5,631,169；Stavrianopoulos，等人美国专利号4868103)。选择在第一“供体”分子的荧光团标记，以便其发出的荧光的活力将按顺序能发荧光的能量被第二“受体”分子的荧光标记吸收，从而由于吸收的能量它能够发荧光。或者，’供体’蛋白分子可简单利用色氨酸残基的天然的荧光能量。选择发出不同波长光的标记物，以便’受体’分子标记物可以从“供体”区分。由于两个标记物之间的能量转移的效率与分子之间间隔的距离相关，可以评价分子之间的空间关系。在两个分子之间出现结合的情形下，该测试中“受体”分子发出的荧光应该是最大。采用本领域已知的标准荧光测量手段可以方便地测量结合的发生(例如，利用荧光测量计)。
在另一个实施方案中，利用实际的时间生物分子的相互作用分析(BIA)测定HURP蛋白与靶分子结合的能力(参见，例如，Sjolander，S.和Urbaniczky，C.(1991)化学分析632338-2345和Szabo等人(1995)Curr.Opin.Struct.BioL 5699-705)。没有对任何相互作用剂(例如，BIAcore)进行任何标记，″表面胞质团谐振″或″BIA″检测在实际的时间的生物特异性相互作用。在结合表面群体的改变(指明结合的发生)致使表面附近光的折射指数的改变(表面胞质团谐振(SPR)的光学现象)致使出现可用作为生物学分子之间的实际时间反应的指标的可检测信号。在一个具体的实施方案，靶基因产物或测试的底物被锚定到固相。在反应结束时可以测定固相上的靶基因产物/测试化合物的复合物。优选的说，可以直接或间接用本文讨论的可检测标记物对锚定到固相表面的靶基因产物和测试化合物(没有被锚定)进行标记。
使HURP，抗HURP的抗体或其靶分子固定以有助于将一个或两个蛋白的复合的与未复合的形式分离，或者该分析评价适应自动操作也许合乎需要。在候选化合物存在和缺乏时，在适用于含有反应剂的任何容器中可以完成测试化合物与HURP蛋白的结合，或HURP蛋白与靶分子的相互作用。这样的容器的例子包括微滴板，测试管，和微离心管。在一个具体实施方案中，提供了增加允许一个或多个蛋白结合到基质的区域的融合蛋白。例如可以将谷胱甘肽-S-转移酶/HURP融合蛋白或谷胱甘肽-S-转移酶/融合蛋白吸附到谷胱甘肽琼脂糖珠(Sigma化学St.Louis，MO)或谷胱甘肽衍生出的微滴板，然后将它与测试化合物结合或与测试化合物和非吸附的靶蛋白或HURP蛋白之一结合，和将其混合物在有助于复合物形成的条件下保温(例如，在生理条件下的盐和pH的)。在保温之后，将珠或微滴板洗涤以除掉任何未束缚的组成部分，固定到珠上的基质。例如按照上面所述直接或间接测定复合物。或者从基质解离复合物，利用标准技术测定HURP结合或活性水平。
将HURP蛋白或靶分子固定到基质的其他技术包括使用生物素和链生抗生物素蛋白的耦合。使用本领域已知的技术从生物素-NHS(N-氢氧基-琥珀酰亚胺)制备生物素化的HURP蛋白或靶分子(例如，生物素化试剂盒，Pierce化学品公司，Rockford，IL)，并且固定到链生抗生物素蛋白-包被的96孔平板的孔中(Pierce化学品公司)。
为了实施分析评价，非固定的组成部分加到包被的含有锚定的成分的表面。在反应完成之后，除掉未反应的成分(例如洗涤)以便形成的复合物保留在固体表面。可以许多方式完成锚钉着固体表面的复合物的检测。先前将非固定的成分预标记，检测固定在表面的标记物显示形成了复合物。而预先末将非固定的成分预标记，可将间接标记物用于检测锚定到表面的复合物；例如利用特异于固定的成分的标记的抗体(依次可利用标记的抗Ig抗体直接或间接标记抗体)。
在一个实施方案中，利用与HURP蛋白或靶分子反应的抗体进行测试，但是不干扰HURP蛋白结合到其靶分子。这样的抗体可以附着到平板的孔，和通过抗体耦合将未结合的靶或HURP蛋白诱捕于孔。除了上面描述的用于OST固定的复合物的那些，检测这样的复合物的方法包括利用与HURP蛋白或其靶分子反应的抗体，以及酶联测试方法免疫检测该复合物，所述测试依赖于对与HURP蛋白或靶分子相关的酶活性的检测。或者在液相进行无细胞的测试。在这样的测试中，采用许多标准技术将反应产物与未反应成分分离，包括但不限于分级离心(参见，例如，Rivas，G.，和Minton，A.P.，(1993)生物化学科学趋势18284-7)；层析(凝胶过滤层析，离子交换层析)；电泳(参见，例如，Ausubel，F.等人，当前的分子的生物学草案1999，3.Wiley纽约)；和免疫沉淀(参见，例如，Ausubel，F.等人，(1999)当前的分子生物学.Wiley纽约)。这样的树脂和层析技术是本领域内技术人员熟知的(参见，例如Heegaard，N.H.，(1998)JMolRecognit 11141-8；Hage，D.S.，和Tweed，S.A.(1997)JChromatogr B Biomed Sci Appl.699499-525)。此外，也可以方便地利用荧光能量传递，如本文所述，以检测没有进一步从溶液纯化复合物时的结合。
在优选的实施方案，测试分析包括将HURP蛋白或其生物学活性的部分与已知的化合物接触，该化合物结合HURP以形成测试混合物，将测试混合物与测试化合物接触，和测定测试化合物与HURP蛋白交互作用的能力，测定测试化合物与HURP蛋白交互作用的能力包括测定测试化合物优先与HURP或其生物学活性的部分结合的能力，或与已知化合物相比调节靶分子的活性。
本发明的靶基因产物体内可以与一个或多个细胞或胞外大分子，例如蛋白交互作用。为了讨论的目的，这样细胞和胞外大分子本文称作为“结合配体”。破坏这样的交互作用的化合物可用于调节靶基因产物的活性。这样的化合物包括，但是不限于分子如抗体，肽，和小分子。用于实施例的优选的靶基因/产物是本文鉴定的HURP基因。在可选的一个实施方案，本发明提供了通过调节HURP靶分子下游的效应基因的活性用于测定测试化合物调节HURP蛋白的活性的能力的方法。例如，可以测定效应物分子对适当的靶的活性，或测定效应物结合到适当的靶，如前所述。
为了鉴定化合物是否干扰靶分子产物和其细胞或胞外结合配体之间的交互作用，在允许二个产物形成复合物的条件和足够时间时，制备含有靶基因产物和结合配体反应混合物。为了测试抑制剂，在存在和没有测试化合物时提供反应混合物。在反应混合物中最初可以包括测试化合物，或在后来时间加入靶基因和它的细胞的或细胞外的结合配体。将对照反应混合物在没有测试化合物或有无效对照剂时孵育。然后探测靶基因产物和细胞的或细胞外的结合配体之间任何复合物的形成。对照反应中，复合物的形成，但是包含测试化合物的反应混合物不形成，显示该化合物干扰了靶基因产物和相互作用的结合配体的交互作用。另外，含有测试化合物和正常的靶基因产物的反应混合物内复合物的形成也可以与含有测试化合物和突变型靶基因产物的反应混合物内复合物的形成相比较。在鉴定分裂突变体但是不是正常的靶基因产物的交互作用的化合物的情况下这种对比是重要的。
这些试验可以以异种的或同种的形式进行。异种的试验涉及将靶基因产物和其结合配体锚定到固相，并且在反应结束时检测锚定到固相的复合物。在同种的试验，整个反应在液相进行。对任何一种途径，可以变化加反应物的次序以获得待测试化合物的不同的信息。例如，通过在测试物质存在下进行反应确定通过竞争干扰靶基因产物和结合配体之间的交互作用的测试化合物。或者在复合物已经形成之后通过将测试化合物加到反应混合物可以测试破坏预先形成的复合物的测试化合物，例如具有较高的从复合物替换组分之一的结合物质的化合物。各种的形式简单地描述如下。
在异种的试验系统中，将靶基因产物和相互作用的细胞的或细胞外的结合配体锚定到固体表面(例如，微滴板)，而直接地或间接地对非锚定的样本进行标记。通过非共价的或共价的接合可以固定锚定的样本。或者被锚定的特异于该样本的固定的抗体可用于将该样本锚定到固体表面。
为了进行试验，将固定的样本的配体暴露于用或没有用测试化合物包被的表面。在反应完成之后，去除未反应的成分(例如，通过洗涤)，形成的复合物将保持固定在固体表面。非固定的样本进行预标记，对固定到表面的标记物检测显示形成了复合物。若对未固定的样本不进行预标记，例如使用标记的特异于最初的非固定的样本的抗体的间接标记物用于探测固定到表面的复合物。依次用例如标记的抗-Ig抗体直接或间接对抗体进行标记。依据加入的反应组分的次序，可以探测抑制复合物形成或破坏预先形成的复合物的测试化合物。
或者，在测试化合物存在或缺乏时，在液相中进行反应，例如使用特异于结合成分之一的固定化抗体在溶液中锚定形成的复合物，和特异于其他的配体的标记的抗体以探测锚定的复合物，将反应产物与未反应的组分分开，探测复合物。又，依据加入到液相的反应物的次序，可以鉴定抑制复合物形成或破坏预先形成的复合物的测试化合物。
在可选的实施方案中，可以使用同种的试验。例如，制备靶基因产物和相互影响的细胞的或胞外的结合配体产物的预先形成的复合物以便对靶基因产物或其结合配体进行标记，但是由于复合物形成熄灭了标记物产生的信号(参见，例如，美国专利号4,109,496利用该途径进行免疫测定)。和预先形成复合物的一个样本竞争和替换的测试物质的加入致使上面的背景产生信号。以这种方式可以鉴定破坏靶基因产物结合配体的测试物质。
在另一个方面，可以以二个杂合分析方法或三个杂合分析方法将HURP蛋白用作为″饵蛋白″以鉴定其它蛋白，(参见，例如美国专利号5,283,317；Zervos等人(1993)细胞72223-232；Madura等人(1993)生物化学杂志26812046-12054；Bartel等人(1993)生物技术14920-924；Iwabuchi等人(1993)致癌基因81693-1696；和BrentWO94/l 0300)这些蛋白结合到或与HURP相互作用(″HURP-结合蛋白″或″HURP-bp″)和参与HURP活性。这样的HURP-bps可以是HURP蛋白或HURP靶的活化剂或信号的抑制剂，如作为HURP-介导的信号形成途径的下游元件。
二个杂合系统基于大多数的转录因子的模块化本性，这些因子由可分离的DNA-结合和活化区域组成。简短地说，试验利用二个不同的DNA构建体。在一个构建体中，将编码HURP蛋白的基因融合到编码已知的转录因子的DNA结合区域的基因(例如，GAL-4)。在另一个构建体中，将编码未鉴定的蛋白的来自于DNA序列文库的DNA序列(″捕食″或“样品”)融合到编码已知的转录因子的活化区域的基因。(或者将HURP蛋白融合到活化剂区域)。如果“饵”和″捕食″蛋白在体内能够相互作用形成HURP依赖性复合物，将转录因子的DNA-结合和活化区域促使紧密地接近。这种接近允许报道基因(例如，lacZ)的转录，可操作连接到对应于转录因子的转录调节位点。可以检溅报道基因的表达并且可以分离含有功能转录因子的细胞集落并且用于获得编码与HURP蛋白相互作用的蛋白的克隆基因。
在另一个实施方案，鉴定了HURP表达的调节子。例如将细胞或无细胞混合物与候选化合物接触并且相对于无侯选化合物存在下的HURP mRNA或蛋白的表达水平，评价HURP mRNA或蛋白的表达。当HURP-mRNA或蛋白的表达在候选化合物存在下比没有存在侯选化合物时更大时，则该候选化合物被鉴定为HURP mRNA或蛋白表达的刺激剂。或者，当在候选化合物存在下比没有存在侯选化合物时HURP mRNA或蛋白的表达更小(统计学上显著小)时，则将该候选化合物确定为HURPmRNA或蛋白表达的抑制剂。采用上文描述的用于检测HURP mRNA或蛋白的方法可以测定HURP mRNA或蛋白的表达水平。
在另一个方面，本发明提供了两个或多个本文描述的测试方法的组合。例如，利用基于细胞的或无细胞的测试可以鉴定调节剂以及确定调节HURP蛋白在体内例如在类似肝细胞癌的动物模型的动物中的活动的能力。
本发明进一步涉及采用上面描述的筛选测试方法鉴定新的因子。因此，进一步在合适的动物模型中使用本文鉴定的因子(例如，HURP调节剂，反义HURP的核酸分子，特异于HURP-的抗体或结合HURP-的配体)以测定这样的因子的功效，毒性，副作用或作用的机制，或治疗的机制也在本发明的范围内。此外，由上面描述的筛选测试鉴定的新的因子用于治疗例如肝脏癌。(b)HURP分子用作为替代标记物本发明的HURP分子也可用于作为紊乱或疾病状态的标记物，作为疾病状态的前体的标记物，作为疾病状态的预处理的标记物，作为药物活性的标记物或作为患者的药物遗传概况的标记物。利用本文描述的方法，可以对本发明的HURP分子的存在、缺乏和/或定量进行检测，并且可能在体内与一个或多个生物学状态有关。例如，本发明的HURP分子可用作为一个或多个紊乱或疾病状态或导致疾病的状态的替代标记物。如本文所述，“替代标记物”是与疾病或紊乱的存在或缺乏相关或与疾病或状态(例如与肝肿瘤的存在或缺乏)的进行相关的目的生化标记物。这样的标记物的存在或定量不依赖于疾病。因此，这些标记物可用于指明是否治疗的特定的过程在减轻疾病或紊乱时有效。当疾病状态或紊乱存在或程度难于采用标准的方法评价时(例如早期肿瘤)，替代标记物特别有用，或当达到潜在的危险性临床目标点之前期望对疾病的进展进行评价时(例如利用胆固醇水平作为替代标记物可以对心血管疾病进行评价，利用HIV RNA水平作为替代标记物进行HIV感染的分析，最好是在冠状动脉爱梗塞或完全发展的AIDS的不需要的临床缺陷加剧时)，替代标记物也是特别有用。在本领域内替代标记物的使用的例子包括Koomen等人描述的(2000)质谱杂志35258-264；和James(1994)AIDS治疗的新档案209。
本发明的HURP分子也可用作为药物动力学标记物。如本文描述，“药物动力学标记物”是特异性地与药物作用有关的目的生化标记物。药物动力学标记物的存在或定量与施用该药物治疗的疾病状态或紊乱无关；因此标记物的存在或定量表明药物在患者内的存在或活性。例如，药物动力学标记物可以指明生物组织中药物的浓度，因为该标记物在该组织中的表达或转录或不表达或不转录与该药物水平相关。以该方式，采用药物动力学标记物可以监测药物的分布或摄取。类似地，药物动力学标记物的存在或定量与药物的代谢产物的存在或定量相关，这样标记物的存在或定量是体内药物的相对破碎速率的指标。药物动力学的标记物特别可用于增加药效检测的敏感度，尤其以低的剂量给药时。甚至小量的药也完全能够激活多轮标记物(例如HURP标记物)的转录或表达，扩增的标记物可以是比药物本身更容易检测到的量。而且由于标记物本身独特性，利用本文描述的方法，可以更容易地检测标记物，抗-HURP抗体可用于基于免疫的监测系统作为HURP蛋白标记物，或HURP-特异性放射性标记的探针可用于检测HURP mRNA标记物。此外，由于药物治疗超过了可能的直接观测结果的范围，药物动力学标记物的使用可以提供基于机理的危险预言。本领域使用的药物动力学标记物的例子是在Matsuda等人，美国专利6,033,862；Hattis等人(1991)Env.Health Perspect.90229-238；Schentag(1999)Am.J Health-Syst.Pharm.56增刊 3S21-S24；和Nicolau(1999)Am，J Health-Syst.Pharm.56增刊 3S16-S20。
本发明的HURP分子可以作为药物遗传标记物。如本文使用，″药物遗传标记物″是与特异性临床药物应答相关或患者敏感的实用生化标记物(参见，例如McLeod等人(1999)欧洲癌症杂志351650-1652)。药物遗传的标记物的存在或定量与给药之前患者对特定的一种药物或一类药物的预测的应答相关。通过在患者中，对一个或多个药物遗传的标记物的存在或定量的评价，可以选择最适用于该患者、或预测具有更大程度的成功的药物治疗。例如，基于患者对特异性肿瘤标记物的RNA，或蛋白的存在或定量(例如，HURP蛋白或RNA)，可以选择最适合治疗似乎存在患者的特异性肿瘤的治疗的药物或过程。类似地，HURP DNA中存在或缺乏特异性序列突变可以与HURP药物应答相关。因此药物遗传标记物的使用允许对每个没有进行治疗的患者使用最合适的治疗。
(C)药物遗传学如由本文描述的筛选方法鉴定的本发明的HURP分子，以及因子或对HURP活性(例如，HURP基因表达)具有刺激或抑制作用的调节剂可用于对个体给药以治疗(预防或治疗)与畸变的或多余的HURP活力相关的HURP相关的紊乱(例如，肝癌)。与这样的治疗相结合，也考虑药物遗传学(即，研究个人遗传型和对外来化合物或药物的应答之间的关系)。关于疾病的新陈代谢的不同，通过改变药物学活性药物的剂量和血液浓度之间的关系而导致严重的毒性或治疗的失败。因此，医师或临床医生可以认为在决定是否以HURP分子或HURP调节剂给药，以及制作用HURP分子和HURP调节剂治疗的剂量和治疗方式时可以应用在相关药物遗传学研究获得的知识。
由于改变了受影响的人中药物沉淀和异常功能，药物遗传学处理对药物应答的临床显著遗传的变异。参见，例如，Biehelbaum，M.等人(1996)药物生理学的临床试验23983-985和Linder，M.W等人(1997)临床化学43254-266。通常，可以分为两种类型的药物遗传的状况。作为改变药物作用于身体的途径(改变药物的作用)的单个因子传递的遗传条件，或作为改变身体作用于药物的途径(改变药物代谢)的单个因子传递的遗传条件。由于罕有的遗传缺陷或天然存在的多态性可以出现这些药物遗传学的状况。例如，葡萄糖-6-磷酸脱氢酶的缺陷(G6PD)是共同的固有的酶病，其中在摄取氧化药物(抗-疟疾的，磺胺药物，止痛剂，nitroflirans)和吃蚕豆之后主要的临床复杂情况是溶血。
鉴定预测药物应答的药物遗传学途径，已知为″基因组-广泛的相关″主要地依赖于人基因组的高图形分辨率结构图，由已经已知的基因相关标记物组成(例如，″二-等位的’基因标记物图，由人基因组的60,000-100,000多态性或可变的位点组成，各个具有两个变异)。这样的高图形分辨率遗传结构图可以与参加阶段II/III药物试验以鉴定与特定的药物应答或副作用相关标记物的各个统计学显著量的患者基因组的图相对比。或者，可以从人基因组中千万已知的单个核苷酸多态性(SNP)的结合可以产生这样高的图形分辨率遗传结构图。如本文所述，″SNP″是发生在DNA整个长度中的单核苷酸碱基的共同的改变。例如DNA的每1000个碱基可以出现SNP一次。SNP参与疾病的过程，但是大量的SNP大多与疾病不相关。基于这样的SNP的出现给出遗传图，依据个体基因组的特定的SNP模式可以将个体分组为遗传目录。以这样的方式，考虑这样的遗传类似的个体共同的特性，将治疗模式制作为遗传类似的个体的组。
或者，将称作为″侯选基因途径″的方法用于鉴定预知药物应答的基因。根据该方法，如果编码药物靶的基因是已知(例如，本发明的HURP蛋白)，在群体中相当易于鉴定基因的所有共同的变异，可以测定一个基因相对另一个基因的变异是否与特定的药物应答相关。
或者，称作为″基因表达谱图″的方法可用于鉴定预知药物应答的基因。例如，给药(例如，本发明的HURP分子或HURP调节剂)的动物的基因表达可指示是否涉及毒性的基因途径已经开启。
从上面一个以上的药物遗传学途径产生的信息可用于决定合适的剂量和治疗方式以预防或治疗个体。当用于决定剂量或药物选择时，这些知识可以避免毒副作用或治疗失败，因此当用HURP分子或HURP调节剂，例如由本文描述的列举的筛选测试之一鉴定的调节剂治疗患者时加强了治疗或预防效率。
本发明进一步提供了鉴定新的因子或其结合物的方法，该方法基于鉴定调节由一个或多个本发明的基因编码的一个或多个基因产物的活性的因子，而这些产物与细胞对治疗剂的抗性相关。特定地说，由本发明的HURP基因编码的蛋白的活性可用作为鉴定克服基因抗性的因子的基础。通过阻止一个或多个抗性蛋白的活性，靶细胞例如人细胞将变得对该因子的处理敏感，该因子是未修饰靶细胞抵抗的因子。
检测因子(例如，药物)对HURP蛋白的表达和活性的影响可用于临床试验。例如，通过本文描述的筛选测试测定的的作用可提高HURP基因表达，蛋白水平、HURP活性的因子，可用于监测在显示降低的HURP基因表达，蛋白水平或HURP活性的患者的临床试验。或者，由降低HURP基因表达，蛋白水平或HURP活性的患者的筛选试验中测定的因子的作用可以用于在临床试验中监测升高的HURP基因表达，蛋白水平或活性。在这样的临床试验中，在例如HURP相关紊乱中暗示的HURP基因，和优选的是其他基因的表达或活性可用作为特定细胞的表现型的″读取″或标记物。
没有进一步的说明，相信本领域的技术人员基于上面公开的内容和下面的例子，利用本发明到最全面的程度。下面的例子仅仅用于说明本领域的技术人员怎样分离和使用本发明的多肽和核酸，并且不以任何方式限制。本文记载的所有出版物引入本文作为参考。
序列表<110>国立阳明大学<120>细胞周期调节蛋白<130>PI021536<150>60/262,885<151>2001-01-19<160>6<170>FastSEQ for windows Version 4.0<210>1<211>2424<212>DNA<213>Mus musculus<400>1atgctggtgt cacgttttgc cagtcggttt cggaaagact cgagcactga gatggttaga 60accaacttgg ctcatagaaa gtctctgtct cagaaggaga acagacacag ggtgtatgag 120cgaaacagac acttcggttt gaaggacgtc aacattccac tggaagggcg agagcttggt 180aatatacacg agacatcgca agacctctct ccagagaagg ccagctccaa aacaaggtca 240gtaaaaatgg tcctgagtga ccaacggaag cagctcctcc agaagtataa ggaagaaaaa 300caacttcaaa aactgaaaga acagcgagag aaagccaaac gtggagtgtt caaagtgggt 360ctctatagac ccgctgcgcc tggctttctt gtcacagacc agaggggtgc gaaagctgag 420ccagaaaagg cttttccaca tactggacgg attacaagat caaagaccaa agaatatatg 480gagcagacta agattggtag caggaatgtt cctaaagcaa cccagagtga ccaaagacaa 540acttctgaaa aacaaccatt agacagagag agaaaagtta tgcagcctgt gctgttcacg 600tcagggaaag ggactgaatc agcggctact cagagagcca agctgatggc ccgaacagtg 660tcatccacta caagaaagcc agtcacaaga gccacgaatg agaaaggatc agaaagaatg 720agaccaagtg gagggagacc tgccaaaaaa ccagaaggca agccggacaa ggtcattcct 780tccaaagttg agcgggacga aaagcatttg gattcgcaga ccagggaaac aagtgaaatg 840ggtctgctcg gagtcttccg agaagtggaa agcttgcctg caacagcccc tgcccaaggg 900aaggaaagga agtcctttgc ccccaagcac tgtgtcttcc agcccccgtg tggtctgaag 960agctaccagg tggctcccct gagccctaga agtgccaacg ctttcctgac acccaattgt 1020gattggaacc agttaagacc agaagttttt agcactacaa ctcaagacaa agcaaatgaa 1080atcttggtac agcaaggatt ggagtcgcta acagaccgta gtaaagaaca tgtcttaaat 1140cagaagggcg cttctacttc agattcaaat cacgcttctg tgaaaggagt cccatgctct 1200gaagggagcg aaggccagac ctctcagccc ccccacgatg tgccatactt cagaaaaatc 1260ctccaatcag aaactgacag gctgacctcg cactgcctgg agtgggaggg gaagctggac 1320ctggacatct ctgatgaagc taaaggtctt atccgtacaa cggttggtca aacaagactc 1380cttatcaagg agagattcag acagtttgaa ggactggtgg acaactgcga gtataaacgg 1440ggtgaaaagg agacgacctg cacagatctg gatggattct gggatatggt tagttttcag 1500gtcgatgatg tgaaccagaa attcaacaac ctgatcaaac ttgaggcgtc aggatggaaa 1560gacagcaata atccaagcaa aaaagtcctc cggaaaaaaa ttgtgcctgg tagaacaagc 1620aaagcaaagc aggatgacga cggacgagcg gcagctagga gtcgccttgc tgccataaag 1680aatgcaatga aaggcaggcc acagcaggaa gtgcaggccc acgcagcagc tccggagacc 1740acaaaggaag ttgacaaaat agtgtttgac gctgggtttt tcagaatcga gagcccagtg 1800aagtcattct cagtcctgtc ttctgaacgt cgttctcaaa gatttggaac acctctgtct 1860gccagcaaag ttgtgcctga gggcagggct gcaggggacc ttctgagaca gaagatgcca 1920ctgaagaagc cggaccctca gagcagcaag agtgagcatg ttgatcggac gttttcagat 1980ggtcttgaaa gcaggtgcca cgtagaagac accccctgtc ctggagagca agattcaagt 2040gacatagagc atgatgtaaa taaaataaat gtcaagatgg attgtttctc tgttgaaacg 2100aatttgcctc ttcctgctgg tgatgctaat accaatcaaa aagaagcaat ctcagccgtg 2160gaaggagcga gcactgcagt cacctcccag gatttgctga tgagcaaccc tgagacaaat 2220acctcctcac agagcaacac ctcacaagaa gaagctgagg cgtcgcagtc agtactgtta 2280cataaaagtc tcacttctga atgccacctt cttgaaccac caggcctcag ctgcaccagc 2340ccctgcactc gggaggagac cagacagcca gatcgcagca gacagttctc ctttggaggt 2400gacctcattc tcttctcacc acta 2424<210>2<211>808<212>PRT<213>Mus musculus<400>2Met Leu Val Ser Arg Phe Ala Ser Arg Phe Arg Lys Asp Ser Ser Thr1 5 10 15Glu Met Val Arg Thr Asn Leu Ala His Arg Lys Ser Leu Ser Gln Lys20 25 30Glu Asn Arg His Arg Val Tyr Glu Arg Asn Arg His Phe Gly Leu Lys35 40 45Asp Val Asn Ile Pro Leu Glu Gly Arg Glu Leu Gly Asn Ile His Glu50 55 60Thr Ser Gln Asp Leu Ser Pro Glu Lys Ala Ser Ser Lys Thr Arg Ser65 70 75 80Val Lys Met Val Leu Ser Asp Gln Arg Lys Gln Leu Leu Gln Lys Tyr85 90 95Lys Glu Glu Lys Gln Leu Gln Lys Leu Lys Glu Gln Arg Glu Lys Ala100 105 110Lys Arg Gly Val Phe Lys Val Gly Leu Tyr Arg Pro Ala Ala Pro Gly115 120 125Phe Leu Val Thr Asp Gln Arg Gly Ala Lys Ala Glu Pro Glu Lys Ala130 135 140Phe Pro His Thr Gly Arg Ile Thr Arg Ser Lys Thr Lys Glu Tyr Met145 150 155 160Glu Gln Thr Lys Ile Gly Ser Arg Asn Val Pro Lys Ala Thr Gln Ser165 170 175Asp Gln Arg Gln Thr Ser Glu Lys Gln Pro Leu Asp Arg Glu Arg Lys180 185 190Val Met Gln Pro Val Leu Phe Thr Ser Gly Lys Gly Thr Glu Ser Ala195 200 205Ala Thr Gln Arg Ala Lys Leu Met Ala Arg Thr Val Ser Ser Thr Thr210 215 220Arg Lys Pro Val Thr Arg Ala Thr Asn Glu Lys Gly Ser Glu Arg Met225 230 235 240Arg Pro Ser Gly Gly Arg Pro Ala Lys Lys Pro Glu Gly Lys Pro Asp245 250 255Lys Val Ile Pro Ser Lys Val Glu Arg Asp Glu Lys His Leu Asp Ser260 265 270Gln Thr Arg Glu Thr Ser Glu Met Gly Leu Leu Gly Val Phe Arg Glu275 280 285Val Glu Ser Leu Pro Ala Thr Ala Pro Ala Gln Gly Lys Glu Arg Lys290 295 300Ser Phe Ala Pro Lys His Cys Val Phe Gln Pro Pro Cys Gly Leu Lys305 310 315 320Ser Tyr Gln Val Ala Pro Leu Ser Pro Arg Ser Ala Asn Ala Phe Leu325 330 335Thr Pro Asn Cys Asp Trp Asn Gln Leu Arg Pro Glu Val Phe Ser Thr340 345 350Thr Thr Gln Asp Lys Ala Asn Glu Ile Leu Val Gln Gln Gly Leu Glu355 360365Ser Leu Thr Asp Arg Ser Lys Glu His Va1 Leu Asn Gln Lys Gly Ala370 375 380Ser Thr Ser Asp Ser Asn His Ala Ser Val Lys Gly Val Pro Cys Ser385 390 395 400Glu Gly Ser Glu Gly Gln Thr Ser Gln Pro Pro His Asp Val Pro Tyr405 410 415Phe Arg Lys Ile Leu Gln Ser Glu Thr Asp Arg Leu Thr Ser His Cys420 425 430Leu Glu Trp Glu Gly Lys Leu Asp Leu Asp Ile Ser Asp Glu Ala Lys435 440 445Gly Leu Ile Arg Thr Thr Val Gly Gln Thr Arg Leu Leu Ile Lys Glu450 455 460Arg Phe Arg Gln Phe Glu Gly Leu Val Asp Asn Cys Glu Tyr Lys Arg465 470 475 480Gly Glu Lys Glu Thr Thr Cys Thr Asp Leu Asp Gly Phe Trp Asp Met485 490 495Val Ser Phe Gln Val Asp Asp Val Asn Gln Lys Phe Asn Asn Leu Ile500 505 510Lys Leu Glu Ala Ser Gly Trp Lys Asp Ser Asn Asn Pro Ser Lys Lys515 520 525Val Leu Arg Lys Lys Ile Val Pro Gly Arg Thr Ser Lys Ala Lys Gln530 535 540Asp Asp Asp Gly Arg Ala Ala Ala Arg Ser Arg Leu Ala Ala Ile Lys545 550 555 560Asn Ala Met Lys Gly Arg Pro Gln Gln Glu Val Gln Ala His Ala Ala565 570 575Ala Pro Glu Thr Thr Lys Glu Val Asp Lys Ile Val Phe Asp Ala Gly580 585 590Phe Phe Arg Ile Glu Ser Pro Val Lys Ser Phe Ser Val Leu Ser Ser595 600 605Glu Arg Arg Ser Gln Arg Phe Gly Thr Pro Leu Ser Ala Ser Lys Val610 615 620Val Pro Glu Gly Arg Ala Ala Gly Asp Leu Leu Arg Gln Lys Met Pro625 630 635 640Leu Lys Lys Pro Asp Pro Gln Ser Ser Lys Ser Glu His Val Asp Arg645 650655Thr Phe Ser Asp Gly Leu Glu Ser Arg Cys His Val Glu Asp Thr Pro660 665 670Cys Pro Gly Glu Gln Asp Ser Ser Asp Ile Glu His Asp Val Asn Lys675 680685Ile Asn Val Lys Met Asp Cys Phe Ser Val Glu Thr Asn Leu Pro Leu690 695 700Pro Ala Gly Asp Ala Asn Thr Asn Gln Lys Glu Ala Ile Ser Ala Val705 710 715 720Glu Gly Ala Ser Thr Ala Val Thr Ser Gln Asp Leu Leu Met Ser Asn725 730 735Pro Glu Thr Asn Thr Ser Ser Gln Ser Asn Thr Ser Gln Glu Glu Ala740 745 750Glu Ala Ser Gln Ser Val Leu Leu His Lys Ser Leu Thr Ser Glu Cys755 760 765His Leu Leu Glu Pro Pro Gly Leu Ser Cys Thr Ser Pro Cys Thr Arg770 775 780Glu Glu Thr Arg Gln Pro Asp Arg Ser Arg Gln Phe Ser Phe Gly Gly785 790 795 800Asp Leu Ile Leu Phe Ser Pro Leu805<210>3<211>2538<212>DNA<213>Homo sapiens<400>3atgtcttcat cacattttgc cagtcgacac aggaaggata taagtactga aatgattaga 60actaaaattg ctcataggaa atcactgtct cagaaagaaa atagacataa ggaatacgaa 120cgaaatagac actttggttt gaaagatgta aacattccaa ccttggaagg tagaattctt 180gttgaattag atgagacatc tcaagagctt gttccagaaa agaccaatgt taagccaagg 240gcaatgaaaa ctattctagg tgatcaacga aaacagatgc tccaaaaata caaagaagaa 300aagcaacttc aaaaattgaa agagcagaga gagaaagcta aacgaggaat atttaaagtg 360ggtcgttata gacctgatat gccttgtttt cttttatcaa accagaatgc tgtgaaagct 420gagccaaaaa aggctattcc atcttctgta cggattacaa ggtcaaaggc caaagaccaa 480atggagcaga ctaagattga taacgagagt gatgttcgag caatccgacc tggtccaaga 540caaacttctg aaaagaaagt gtcagacaaa gagaaaaaag ttgtgcagcc tgtaatgccc 600acgtcgttga gaatgactcg atcagctact caagcagcaa agcaggttcc cagaacagtc 660tcatctacca cagcaagaaa gccagtcaca agagctgcta atgaaaacga accagaagga 720aaggtgccaa gtaaaggaag acctgccaaa aatgtagaaa caaaacccga caagggtatt 780tcttgtaaag tcgatagtga agaaaatact ttgaattcac aaactaatgc aacaagtgga 840atgaatccag atggagtctt atcaaaaatg gaaaacttac ctgagataaa tactgcaaaa 900ataaaaggga agaattcctt cgcacctaag gattttatgt ttcagccact ggatggtctg 960aagacctatc aagtaacacc tatgactccc agaagtgcca atgctttttt gacacccagt 1020tacacctgga ctcctttaaa aacagaagtt gatgagtctc aagcaacaaa agaaattttg 1080gcacaaaaat gtaaaactta ctctaccaag acaatacagc aagattcaaa taaattgcca 1140tgtcctttgg gtcctctaac tgtttggcat gaagaacatg ttttaaataa aaatgaagct 1200actactaaaa atttaaatgg ccttccaata aaagaagtcc catcacttga aagaaatgaa 1260ggtcgaattg ctcagcccca ccatggtgtg ccatatttca gaaatatcct ccagtcagaa 1320actgagaaat taacttcaca ttgcttcgag tgggacagga aacttgaatt ggacattcca 1380gatgatgcta aagatcttat tcgcacagca gttggtcaaa caagactcct tatgaaggaa 1440aggtttaaac agtttgaagg actggttgat gattgtgaat ataaacgagg tataaaggag 1500actacctgta cagatctgga tggattttgg gatatggtta gttttcagat agaagatgta 1560atccacaaat tcaacaatct gatcaaactt gaggaatctg ggtggcaagt caataataat 1620atgaatcata atatgaacaa aaatgtcttt aggaaaaaag ttgtctcagg tatagcaagt 1680aaaccaaaac aggatgatgc tggaagaatt gcagcgagaa atcgcctagc tgccataaaa 1740aatgcaatga gagagagaat taggcaggaa gaatgtgctg aaacagcagt ttctgtgata 1800ccaaaggaag ttgataaaat agtgttcgat gctggatttt tcagagttga aagtcctgtt 1860aaattattct caggactttc tgtctcttct gaaggccctt ctcaaagact tggaacacct 1920aagtctgtca acaaagctgt atctcagagt agaaatgaga tgggcattcc acaacaaact 1980acatcaccag aaaatgccgg tcctcagaat acgaaaagtg aacatgtgaa gaagactttg 2040tttttgagta ttcctgaaag caggagcagc atagaagatg ctcagtgtcc tggattacca 2100gatttaattg aagaaaacca tgttgtaaat aagacagact tgaaggtgga ttgtttatcc 2160agtgagagaa tgagtttgcc tcttcttgct ggtggagtag cagatgatat taatactaac 2220aaaaaagaag gaatttcaga tgttgtggaa ggaatggaac tgaattcttc aattacatca 2280caggatgttt tgatgagtag ccctgaaaaa aatacagctt cacaaaatag catcttagaa 2340gaaggggaaa ctaaaatttc tcagtcagaa ctatttgata ataaaagtct cactactgaa 2400tgccaccttc ttgattcacc aggtctaaac tgcagtaatc catttactca gctggagagg 2460agacatcaag aacatgccag acacatttct tttggtggta acctgattac tttttcacct 2520ctacaaccag gagaattt 2538<210>4<211>846<212>PRT<213>Homo sapiens<400>4Met Ser Ser Ser His Phe Ala Ser Arg His Arg Lys Asp Ile Ser Thr1 5 10 15Glu Met Ile Arg Thr Lys Ile Ala His Arg Lys Ser Leu Ser Gln Lys20 25 30Glu Asn Arg His Lys Glu Tyr Glu Arg Asn Arg His Phe Gly Leu Lys35 40 45Asp Val Asn Ile Pro Thr Leu Glu Gly Arg Ile Leu Val Glu Leu Asp50 55 60Glu Thr Ser Gln Glu Leu Val Pro Glu Lys Thr Asn Val Lys Pro Arg65 70 75 80Ala Met Lys Thr Ile Leu Gly Asp Gln Arg Lys Gln Met Leu Gln Lys85 90 95Tyr Lys Glu Glu Lys Gln Leu Gln Lys Leu Lys Glu Gln Arg Glu Lys100 105110Ala Lys Arg Gly Ile Phe Lys Val Gly Arg Tyr Arg Pro Asp Met Pro115 120 125Cys Phe Leu Leu Ser Asn Gln Asn Ala Val Lys Ala Glu Pro Lys Lys130 135 140Ala Ile Pro Ser Ser Val Arg Ile Thr Arg Ser Lys Ala Lys Asp Gln145 150 155 160Met Glu Gln Thr Lys Ile Asp Asn Glu Ser Asp Val Arg Ala Ile Arg165 170 175Pro Gly Pro Arg Gln Thr Ser Glu Lys Lys Val Ser Asp Lys Glu Lys180 185 190Lys Val Val Gln Pro Val Met Pro Thr Ser Leu Arg Met Thr Arg Ser195 200 205Ala Thr Gln Ala Ala Lys Gln Val Pro Arg Thr Val Ser Ser Thr Thr210 215 220Ala Arg Lys Pro Val Thr Arg Ala Ala Asn Glu Asn Glu Pro Glu Gly225 230 235 240Lys Val Pro Ser Lys Gly Arg Pro Ala Lys Asn Val Glu Thr Lys Pro245 250255Asp Lys Gly Ile Ser Cys Lys Val Asp Ser Glu Glu Asn Thr Leu Asn260 265 270Ser Gln Thr Asn Ala Thr Ser Gly Met Asn Pro Asp Gly Val Leu Ser275 280 285Lys Met Glu Asn Leu Pro Glu Ile Asn Thr Ala Lys Ile Lys Gly Lys290 295 300Asn Ser Phe Ala Pro Lys Asp Phe Met Phe Gln Pro Leu Asp Gly Leu305 310 315 320Lys Thr Tyr Gln Val Thr Pro Met Thr Pro Arg Ser Ala Asn Ala Phe325 330 335Leu Thr Pro Ser Tyr Thr Trp Thr Pro Leu Lys Thr Glu Val Asp Glu340 345 350Ser Gln Ala Thr Lys Glu Ile Leu Ala Gln Lys Cys Lys Thr Tyr Ser355 360 365Thr Lys Thr Ile Gln Gln Asp Ser Asn Lys Leu Pro Cys Pro Leu Gly370 375 380Pro Leu Thr Val Trp His Glu Glu His Val Leu Asn Lys Asn Glu Ala385 390 395 400Thr Thr Lys Asn Leu Asn Gly Leu Pro Ile Lys Glu Val Pro Ser Leu405 410 415Glu Arg Asn Glu Gly Arg Ile Ala Gln Pro His His Gly Val Pro Tyr420 425 430Phe Arg Asn Ile Leu Gln Ser Glu Thr Glu Lys Leu Thr Ser His Cys435 440 445Phe Glu Trp Asp Arg Lys Leu Glu Leu Asp Ile Pro Asp Asp Ala Lys450 455 460Asp Leu Ile Arg Thr Ala Val Gly Gln Thr Arg Leu Leu Met Lys Glu465 470 475 480Arg Phe Lys Gln Phe Glu Gly Leu Val Asp Asp Cys Glu Tyr Lys Arg485 490 495Gly Ile Lys Glu Thr Thr Cys Thr Asp Leu Asp Gly Phe Trp Asp Met500 505 510Val Ser Phe Gln Ile Glu Asp Val Ile His Lys Phe Asn Asn Leu Ile515 520 525Lys Leu Glu Glu Ser Gly Trp Gln Val Asn Asn Asn Met Asn His Asn530 535 540Met Asn Lys Asn Val Phe Arg Lys Lys Val Val Ser Gly Ile Ala Ser545 550 555560Lys Pro Lys Gln Asp Asp Ala Gly Arg Ile Ala Ala Arg Asn Arg Leu565 570 575Ala Ala Ile Lys Asn Ala Met Arg Glu Arg Ile Arg Gln Glu Glu Cys
580 585 590Ala Glu Thr Ala Val Ser Val Ile Pro Lys Glu Val Asp Lys Ile Val595 600 605Phe Asp Ala Gly Phe Phe Arg Val Glu Ser Pro Val Lys Leu Phe Ser610615 620Gly Leu Ser Val Ser Ser Glu Gly Pro Ser Gln Arg Leu Gly Thr Pro625 630 635 640Lys Ser Val Asn Lys Ala Val Ser Gln Ser Arg Asn Glu Met Gly Ile645 650 655Pro Gln Gln Thr Thr Ser Pro Glu Asn Ala Gly Pro Gln Asn Thr Lys660 665 670Ser Glu His Val Lys Lys Thr Leu Phe Leu Ser Ile Pro Glu Ser Arg675 680 685Ser Ser Ile Glu Asp Ala Gln Cys Pro Gly Leu Pro Asp Leu Ile Glu690 695 700Glu Asn His Val Val Asn Lys Thr Asp Leu Lys Val Asp Cys Leu Ser705 710 715 720Ser Glu Arg Met Ser Leu Pro Leu Leu Ala Gly Gly Val Ala Asp Asp725 730 735Ile Asn Thr Asn Lys Lys Glu Gly Ile Ser Asp Val Val Glu Gly Met740 745 750Glu Leu Asn Ser Ser Ile Thr Ser Gln Asp Val Leu Met Ser Ser Pro755 760765Glu Lys Asn Thr Ala Ser Gln Asn Ser Ile Leu Glu Glu Gly Glu Thr770 775 780Lys Ile Ser Gln Ser Glu Leu Phe Asp Asn Lys Ser Leu Thr Thr Glu785 790 795 800Cys His Leu Leu Asp Ser Pro Gly Leu Asn Cys Ser Asn Pro Phe Thr805 810 815Gln Leu Glu Arg Arg His Gln Glu His Ala Arg His Ile Ser Phe Gly820 825 830Gly Asn Leu Ile Thr Phe Ser Pro Leu Gln Pro Gly Glu Phe835 840 845<210>5<211>2966<212>DNA<213>Mus musculus<220><221>CDS<222>(301)...(2724)<400>5agtttatagt gtgtcgctgc gtcgcctagc gggtttaccg cctccctcct ccccctcgcc 60ctcccgctcc caaccctttg ccttccaaac aatttaaatg tcgcacagaa ccaacctatc 120gcaagcctcg ttcgagggga aggggcggga gcttccggaa gtgttggcaa aagtccctcc 180aatcagcggc tggcagcggg aaatttcagt tccgtgaagg gtcggtccgg gagttccttc 240tggggatcgg tggagttttc tgtgttggga aattgttgtg gatccagaaa ctgcttcagg 300atg ctg gtg tca cgt ttt gcc agt cgg ttt cgg aaa gac tcg agc act348Met Leu Val Ser Arg Phe Ala Ser Arg Phe Arg Lys Asp Ser Ser Thr15 10 15gag atg gtt aga acc aac ttg gct cat aga aag tct ctg tct cag aag396Glu Met Val Arg Thr Asn Leu Ala His Arg Lys Ser Leu Ser Gln Lys20 25 30gag aac aga cac agg gtg tat gag cga aac aga cac ttc ggt ttg aag444Glu Asn Arg His Arg Val Tyr Glu Arg Asn Arg His Phe Gly Leu Lys35 40 45gac gtc aac att cca ctg gaa ggg cga gag ctt ggt aat ata cac gag 492Asp Val Asn Ile Pro Leu Glu Gly Arg Glu Leu Gly Asn Ile His Glu50 55 60aca tcg caa gac ctc tct cca gag aag gcc agc tcc aaa aca agg tca 540Thr Ser Gln Asp Leu Ser Pro Glu Lys Ala Ser Ser Lys Thr Arg Ser65 70 75 80gta aaa atg gtc ctg agt gac caa cgg aag cag ctc ctc cag aag tat 588Val Lys Met Val Leu Ser Asp Gln Arg Lys Gln Leu Leu Gln Lys Tyr85 90 95aag gaa gaa aaa caa ctt caa aaa ctg aaa gaa cag cga gag aaa gcc 636Lys Glu Glu Lys Gln Leu Gln Lys Leu Lys Glu Gln Arg Glu Lys Ala100 105 110aaa cgt gga gtg ttc aaa gtg ggt ctc tat aga ccc gct gcg cct ggc 684Lys Arg Gly Val Phe Lys Val Gly Leu Tyr Arg Pro Ala Ala Pro Gly115 120 125ttt ctt gtc aca gac cag agg ggt gcg aaa gct gag cca gaa aag gct 732Phe Leu Val Thr Asp Gln Arg Gly Ala Lys Ala Glu Pro Glu Lys Ala130 135 140ttt cca cat act gga cgg att aca aga tca aag acc aaa gaa tat atg 780Phe Pro His Thr Gly Arg Ile Thr Arg Ser Lys Thr Lys Glu Tyr Met145 150 155 160gag cag act aag att ggt agc agg aat gtt cct aaa gca acc cag agt 828Glu Gln Thr Lys Ile Gly Ser Arg Asn Val Pro Lys Ala Thr Gln Ser165 170 175gac caa aga caa act tct gaa aaa caa cca tta gac aga gag aga aaa 876Asp Gln Arg Gln Thr Ser Glu Lys Gln Pro Leu Asp Arg Glu Arg Lys180 185 190gtt atg cag cct gtg ctg ttc acg tca ggg aaa ggg act gaa tca gcg 924Val Met Gln Pro Val Leu Phe Thr Ser Gly Lys Gly Thr Glu Ser Ala195 200 205gct act cag aga gcc aag ctg atg gcc cga aca gtg tca tcc act aca 972Ala Thr Gln Arg Ala Lys Leu Met Ala Arg Thr Val Ser Ser Thr Thr210 215 220aga aag cca gtc aca aga gcc acg aat gag aaa gga tca gaa aga atg 1020Arg Lys Pro Val Thr Arg Ala Thr Asn Glu Lys Gly Ser Glu Arg Met225 230 235 240aga cca agt gga ggg aga cct gcc aaa aaa cca gaa ggc aag ccg gac 1068Arg Pro Ser Gly Gly Arg Pro Ala Lys Lys Pro Glu Gly Lys Pro Asp245 250 255aag gtc att cct tcc aaa gtt gag cgg gac gaa aag cat ttg gat tcg 1116Lys Val Ile Pro Ser Lys Val Glu Arg Asp Glu Lys His Leu Asp Ser260 265 270cag acc agg gaa aca agt gaa atg ggt ctg ctc gga gtc ttc cga gaa 1164Gln Thr Arg Glu Thr Ser Glu Met Gly Leu Leu Gly Val Phe Arg Glu275 280 285gtg gaa agc ttg cct gca aca gcc cct gcc caa ggg aag gaa agg aag 1212Val Glu Ser Leu Pro Ala Thr Ala Pro Ala Gln Gly Lys Glu Arg Lys290 295 300tcc ttt gcc ccc aag cac tgt gtc ttc cag ccc ccg tgt ggt ctg aag 1260Ser Phe Ala Pro Lys His Cys Val Phe Gln Pro Pro Cys Gly Leu Lys305 310 315320agc tac cag gtg gct ccc ctg agc cct aga agt gcc aac gct ttc ctg 1308Ser Tyr Gln Val Ala Pro Leu Ser Pro Arg Ser Ala Asn Ala Phe Leu325 330 335aca ccc aat tgt gat tgg aac cag tta aga cca gaa gtt ttt agc act 1356Thr Pro Asn Cys Asp Trp Asn Gln Leu Arg Pro Glu Val Phe Ser Thr340 345 350aca act caa gac aaa gca aat gaa atc ttg gta cag caa gga ttg gag 1404Thr Thr Gln Asp Lys Ala Asn Glu Ile Leu Val Gln Gln Gly Leu Glu355 360 365tcg cta aca gac cgt agt aaa gaa cat gtc tta aat cag aag ggc gct 1452Ser Leu Thr Asp Arg Ser Lys Glu His Val Leu Asn Gln Lys Gly Ala370 375 380tct act tca gat tca aat cac gct tct gtg aaa gga gtc cca tgc tct 1500Ser Thr Ser Asp Ser Asn His Ala Ser Val Lys Gly Val Pro Cys Ser385 390 395 400gaa ggg agc gaa ggc cag acc tct cag ccc ccc cac gat gtg cca tac 1548Glu Gly Ser Glu Gly Gln Thr Ser Gln Pro Pro His Asp Val Pro Tyr405 410 415ttc aga aaa atc ctc caa tca gaa act gac agg ctg acc tcg cac tgc 1596Phe Arg Lys Ile Leu Gln Ser Glu Thr Asp Arg Leu Thr Ser His Cys420 425430ctg gag tgg gag ggg aag ctg gac ctg gac atc tct gat gaa gct aaa 1644Leu Glu Trp Glu Gly Lys Leu Asp Leu Asp Ile Ser Asp Glu Ala Lys435 440 445ggt ctt atc cgt aca acg gtt ggt caa aca aga ctc ctt atc aag gag 1692Gly Leu Ile Arg Thr Thr Val Gly Gln Thr Arg Leu Leu Ile Lys Glu450 455 460aga ttc aga cag ttt gaa gga ctg gtg gac aac tgc gag tat aaa cgg 1740Arg Phe Arg Gln Phe Glu Gly Leu Val Asp Asn Cys Glu Tyr Lys Arg465 470 475 480ggt gaa aag gag acg acc tgc aca gat ctg gat gga ttc tgg gat atg 1788Gly Glu Lys Glu Thr Thr Cys Thr Asp Leu Asp Gly Phe Trp Asp Met485 490 495gtt agt ttt cag gtc gat gat gtg aac cag aaa ttc aac aac ctg atc 1836Val Ser Phe Gln Val Asp Asp Val Asn Gln Lys Phe Asn Asn Leu Ile500 505 510aaa ctt gag gcg tca gga tgg aaa gac agc aat aat cca agc aaa aaa 1884Lys Leu Glu Ala Ser Gly Trp Lys Asp Ser Asn Asn Pro Ser Lys Lys515 520 525gtc ctc cgg aaa aaa att gtg cct ggt aga aca agc aaa gca aag cag 1932Val Leu Arg Lys Lys Ile Val Pro Gly Arg Thr Ser Lys Ala Lys Gln
530 535 540gat gac gac gga cga gcg gca gct agg agt cgc ctt gct gcc ata aag 1980Asp Asp Asp Gly Arg Ala Ala Ala Arg Ser Arg Leu Ala Ala Ile Lys545 550 555560aat gca atg aaa ggc agg cca cag cag gaa gtg cag gcc cac gca gca 2028Asn Ala Met Lys Gly Arg Pro Gln Gln Glu Val Gln Ala His Ala Ala565 570 575gct ccg gag acc aca aag gaa gtt gac aaa ata gtg ttt gac gct ggg 2076Ala Pro Glu Thr Thr Lys Glu Val Asp Lys Ile Val Phe Asp Ala Gly580 585 590ttt ttc aga atc gag agc cca gtg aag tca ttc tca gtc ctg tct tct 2124Phe Phe Arg Ile Glu Ser Pro Val Lys Ser Phe Ser Val Leu Ser Ser595 600 605gaa cgt cgt tct caa aga ttt gga aca cct ctg tct gcc agc aaa gtt 2172Glu Arg Arg Ser Gln Arg Phe Gly Thr Pro Leu Ser Ala Ser Lys Val610 615 620gtg cct gag ggc agg gct gca ggg gac ctt ctg aga cag aag atg cca 2220Val Pro Glu Gly Arg Ala Ala Gly Asp Leu Leu Arg Gln Lys Met Pro625 630 635 640ctg aag aag ccg gac cct cag agc agc aag agt gag cat gtt gat cgg 2268Leu Lys Lys Pro Asp Pro Gln Ser Ser Lys Ser Glu His Val Asp Arg645 650 655acg ttt tca gat ggt ctt gaa agc agg tgc cac gta gaa gac acc ccc 2316Thr Phe Ser Asp Gly Leu Glu Ser Arg Cys His Val Glu Asp Thr Pro660 665 670tgt cct gga gag caa gat tca agt gac ata gag cat gat gta aat aaa 2364Cys Pro Gly Glu Gln Asp Ser Ser Asp Ile Glu His Asp Val Asn Lys675 680 685ata aat gtc aag atg gat tgt ttc tct gtt gaa acg aat ttg cct ctt 2412Ile Asn Val Lys Met Asp Cys Phe Ser Val Glu Thr Asn Leu Pro Leu690 695 700cct gct ggt gat gct aat acc aat caa aaa gaa gca atc tca gcc gtg 2460Pro Ala Gly Asp Ala Asn Thr Asn Gln Lys Glu Ala Ile Ser Ala Val705 710 715 720gaa gga gcg agc act gca gtc acc tcc cag gat ttg ctg atg agc aac 2508Glu Gly Ala Ser Thr Ala Val Thr Ser Gln Asp Leu Leu Met Ser Asn725 730 735cct gag aca aat acc tcc tca cag agc aac acc tca caa gaa gaa gct 2556Pro Glu Thr Asn Thr Ser Ser Gln Ser Asn Thr Ser Gln Glu Glu Ala740 745 750gag gcg tcg cag tca gta ctg tta cat aaa agt ctc act tct gaa tgc 2604Glu Ala Ser Gln Ser Val Leu Leu His Lys Ser Leu Thr Ser Glu Cys755 760 765cac ctt ctt gaa cca cca ggc ctc agc tgc acc agc ccc tgc act cgg 2652His Leu Leu Glu Pro Pro Gly Leu Ser Cys Thr Ser Pro Cys Thr Arg770 775 780gag gag acc aga cag cca gat cgc agc aga cag ttc tcc ttt gga ggt 2700Glu Glu Thr Arg Gln Pro Asp Arg Ser Arg Gln Phe Ser Phe Gly Gly785 790 795 800gac ctc att ctc ttc tca cca cta tgaccctgaa gggaacacca ggagggcttt 2754Asp Leu Ile Leu Phe Ser Pro Leu805aaatttaaca tgacttttaa tattaattta aataaacatt cagtgctcgc ctttaatccc2814agcactccgg gaggtagagg caggcggatt tctgagttcg aggccagcct ggtctacaga2874gtgagttcca ggacagccag gactatacag agaaaccctg tctcgaaaaa ccaaaataaa2934taaataaata aataaacaaa caaacaaaca aa 2966<210>6<211>2979<212>DNA<213>Homo sapiens<220><221>CDS<222>(218)...(2755)<400>6agcaaaccaa tcgcaagcct cgttgagtgg aaggggtggg atcttccccg gaagttttgg60ttaaagcccc tccaatcagc ggctcggtgc ggcaagtttg aatttcgtgg aggctcgggt120tgtgagggtt cctgcttcgg agtcggcggt ggtcgtccag accgagtgtt ctttactttt180tgtttggttg aggtttcacg ctagaaggtg gctcagg atg tct tca tca cat ttt 235Met Ser Ser Ser His Phe15gcc agt cga cac agg aag gat ata agt act gaa atg att aga act aaa 283Ala Ser Arg His Arg Lys Asp Ile Ser Thr Glu Met Ile Arg Thr Lys10 15 20att gct cat agg aaa tca ctg tct cag aaa gaa aat aga cat aag gaa 331Ile Ala His Arg Lys Ser Leu Ser Gln Lys Glu Asn Arg His Lys Glu25 30 35tac gaa cga aat aga cac ttt ggt ttg aaa gat gta aac att cca acc 379Tyr Glu Arg Asn Arg His Phe Gly Leu Lys Asp Val Asn Ile Pro Thr40 45 50ttg gaa ggt aga att ctt gtt gaa tta gat gag aca tct caa gag ctt 427Leu Glu Gly Arg Ile Leu Val Glu Leu Asp Glu Thr Ser Gln Glu Leu55 60 65 70gtt cca gaa aag acc aat gtt aag cca agg gca atg aaa act att cta 475Val Pro Glu Lys Thr Asn Val Lys Pro Arg Ala Met Lys Thr Ile Leu75 80 85ggt gat caa cga aaa cag atg ctc caa aaa tac aaa gaa gaa aag caa 523Gly Asp Gln Arg Lys Gln Met Leu Gln Lys Tyr Lys Glu Glu Lys Gln90 95 100ctt caa aaa ttg aaa gag cag aga gag aaa gct aaa cga gga ata ttt 571Leu Gln Lys Leu Lys Glu Gln Arg Glu Lys Ala Lys Arg Gly Ile Phe105 110 115aaa gtg ggt cgt tat aga cct gat atg cct tgt ttt ctt tta tca aac 619Lys Val Gly Arg Tyr Arg Pro Asp Met Pro Cys Phe Leu Leu Ser Asn
120 125 130cag aat gct gtg aaa gct gag cca aaa aag gct att cca tct tct gta 667Gln Asn Ala Val Lys Ala Glu Pro Lys Lys Ala Ile Pro Ser Ser Val135 140 145 150cgg att aca agg tca aag gcc aaa gac caa atg gag cag act aag att 715Arg Ile Thr Arg Ser Lys Ala Lys Asp Gln Met Glu Gln Thr Lys Ile155 160 165gat aac gag agt gat gtt cga gca atc cga cct ggt cca aga caa act 763Asp Asn Glu Ser Asp Val Arg Ala Ile Arg Pro Gly Pro Arg Gln Thr170 175 180tct gaa aag aaa gtg tca gac aaa gag aaa aaa gtt gtg cag cct gta 811Ser Glu Lys Lys Val Ser Asp Lys Glu Lys Lys Val Val Gln Pro Val185 190 195atg ccc acg tcg ttg aga atg act cga tca gct act caa gca gca aag 859Met Pro Thr Ser Leu Arg Met Thr Arg Ser Ala Thr Gln Ala Ala Lys200 205 210cag gtt ccc aga aca gtc tca tct acc aca gca aga aag cca gtc aca 907Gln Val Pro Arg Thr Val Ser Ser Thr Thr Ala Arg Lys Pro Val Thr215 220 225 230aga gct gct aat gaa aac gaa cca gaa gga aag gtg cca agt aaa gga 955Arg Ala Ala Asn Glu Asn Glu Pro Glu Gly Lys Val Pro Ser Lys Gly235 240 245aga cct gcc aaa aat gta gaa aca aaa ccc gac aag ggt att tct tgt 1003Arg Pro Ala Lys Asn Val Glu Thr Lys Pro Asp Lys Gly Ile Ser Cys250 255 260aaa gtc gat agt gaa gaa aat act ttg aat tca caa act aat gca aca 1051Lys Val Asp Ser Glu Glu Asn Thr Leu Asn Ser Gln Thr Asn Ala Thr265 270275agt gga atg aat cca gat gga gtc tta tca aaa atg gaa aac tta cct 1099Ser Gly Met Asn Pro Asp Gly Val Leu Ser Lys Met Glu Asn Leu Pro280 285 290gag ata aat act gca aaa ata aaa ggg aag aat tcc ttc gca cct aag 1147Glu Ile Asn Thr Ala Lys Ile Lys Gly Lys Asn Ser Phe Ala Pro Lys295 300 305 310gat ttt atg ttt cag cca ctg gat ggt ctg aag acc tat caa gta aca 1195Asp Phe Met Phe Gln Pro Leu Asp Gly Leu Lys Thr Tyr Gln Val Thr315 320 325cct atg act ccc aga agt gcc aat gct ttt ttg aca ccc agt tac acc 1243Pro Met Thr Pro Arg Ser Ala Asn Ala Phe Leu Thr Pro Ser Tyr Thr330 335340tgg act cct tta aaa aca gaa gtt gat gag tct caa gca aca aaa gaa 1291Trp Thr Pro Leu Lys Thr Glu Val Asp Glu Ser Gln Ala Thr Lys Glu345 350355att ttg gca caa aaa tgt aaa act tac tct acc aag aca ata cag caa 1339Ile Leu Ala Gln Lys Cys Lys Thr Tyr Ser Thr Lys Thr Ile Gln Gln360 365 370gat tca aat aaa ttg cca tgt cct ttg ggt cct cta act gtt tgg cat 1387Asp Ser Asn Lys Leu Pro Cys Pro Leu Gly Pro Leu Thr Val Trp His375 380 385 390gaa gaa cat gtt tta aat aaa aat gaa gct act act aaa aat tta aat 1435Glu Glu His Val Leu Asn Lys Asn Glu Ala Thr Thr Lys Asn Leu Asn395 400 405ggc ctt cca ata aaa gaa gtc cca tca ctt gaa aga aat gaa ggt cga 1483Gly Leu Pro Ile Lys Glu Val Pro Ser Leu Glu Arg Asn Glu Gly Arg410 415 420att gct cag ccc cac cat ggt gtg cca tat ttc aga aat atc ctc cag 1531Ile Ala Gln Pro His His Gly Val Pro Tyr Phe Arg Asn Ile Leu Gln425 430 435tca gaa act gag aaa tta act tca cat tgc ttc gag tgg gac agg aaa 1579Ser Glu Thr Glu Lys Leu Thr Ser His Cys Phe Glu Trp Asp Arg Lys440 445 450ctt gaa ttg gac att cca gat gat gct aaa gat ctt att cgc aca gca 1627Leu Glu Leu Asp Ile Pro Asp Asp Ala Lys Asp Leu Ile Arg Thr Ala455 460 465 470gtt ggt caa aca aga ctc ctt atg aag gaa agg ttt aaa cag ttt gaa 1675Val Gly Gln Thr Arg Leu Leu Met Lys Glu Arg Phe Lys Gln Phe Glu475 480 485gga ctg gtt gat gat tgt gaa tat aaa cga ggt ata aag gag act acc 1723Gly Leu Val Asp Asp Cys Glu Tyr Lys Arg Gly Ile Lys Glu Thr Thr490 495 500tgt aca gat ctg gat gga ttt tgg gat atg gtt agt ttt cag ata gaa 1771Cys Thr Asp Leu Asp Gly Phe Trp Asp Met Val Ser Phe Gln Ile Glu505 510 515gat gta atc cac aaa ttc aac aat ctg atc aaa ctt gag gaa tct ggg 1819Asp Val Ile His Lys Phe Asn Asn Leu Ile Lys Leu Glu Glu Ser Gly520 525 530tgg caa gtc aat aat aat atg aat cat aat atg aac aaa aat gtc ttt 1867Trp Gln Val Asn Asn Asn Met Asn His Asn Met Asn Lys Asn Val Phe535 540 545 550agg aaa aaa gtt gtc tca ggt ata gca agt aaa cca aaa cag gat gat 1915Arg Lys Lys Val Val Ser Gly Ile Ala Ser Lys Pro Lys Gln Asp Asp555560 565gct gga aga att gca gcg aga aat cgc cta gct gcc ata aaa aat gca 1963Ala Gly Arg Ile Ala Ala Arg Asn Arg Leu Ala Ala Ile Lys Asn Ala570 575 580atg aga gag aga att agg cag gaa gaa tgt gct gaa aca gca gtt tct 2011Met Arg Glu Arg Ile Arg Gln Glu Glu Cys Ala Glu Thr Ala Val Ser585 590 595gtg ata cca aag gaa gtt gat aaa ata gtg ttc gat gct gga ttt ttc 2059Val Ile Pro Lys Glu Val Asp Lys Ile Val Phe Asp Ala Gly Phe Phe600 605 610aga gtt gaa agt cct gtt aaa tta ttc tca gga ctt tct gtc tct tct 2107Arg Val Glu Ser Pro Val Lys Leu Phe Ser Gly Leu Ser Val Ser Ser615 620 625 630gaa ggc cct tct caa aga ctt gga aca cct aag tct gtc aac aaa gct 2155Glu Gly Pro Ser Gln Arg Leu Gly Thr Pro Lys Ser Val Asn Lys Ala635 640 645gta tct cag agt aga aat gag atg ggc att cca caa caa act aca tca 2203Val Ser Gln Ser Arg Asn Glu Met Gly Ile Pro Gln Gln Thr Thr Ser650 655 660cca gaa aat gcc ggt cct cag aat acg aaa agt gaa cat gtg aag aag 2251Pro Glu Asn Ala Gly Pro Gln Asn Thr Lys Ser Glu His Val Lys Lys665 670 675act ttg ttt ttg agt att cct gaa agc agg agc agc ata gaa gat gct 2299Thr Leu Phe Leu Ser Ile Pro Glu Ser Arg Ser Ser Ile Glu Asp Ala680 685 690cag tgt cct gga tta cca gat tta att gaa gaa aac cat gtt gta aat 2347Gln Cys Pro Gly Leu Pro Asp Leu Ile Glu Glu Asn His Val Val Asn695 700 705 710aag aca gac ttg aag gtg gat tgt tta tcc agt gag aga atg agt ttg 2395Lys Thr Asp Leu Lys Val Asp Cys Leu Ser Ser Glu Arg Met Ser Leu715 720 725cct ctt ctt gct ggt gga gta gca gat gat att aat act aac aaa aaa 2443Pro Leu Leu Ala Gly Gly Val Ala Asp Asp Ile Asn Thr Asn Lys Lys730 735 740gaa gga att tca gat gtt gtg gaa gga atg gaa ctg aat tct tca att 2491Glu Gly Ile Ser Asp Val Val Glu Gly Met Glu Leu Asn Ser Ser Ile745 750 755aca tca cag gat gtt ttg atg agt agc cct gaa aaa aat aca gct tca 2539Thr Ser Gln Asp Val Leu Met Ser Ser Pro Glu Lys Asn Thr Ala Ser760 765 770caa aat agc atc tta gaa gaa ggg gaa act aaa att tct cag tca gaa 2587Gln Asn Ser Ile Leu Glu Glu Gly Glu Thr Lys Ile Ser Gln Ser Glu775 780 785 790cta ttt gat aat aaa agt ctc act act gaa tgc cac ctt ctt gat tca 2635Leu Phe Asp Asn Lys Ser Leu Thr Thr Glu Cys His Leu Leu Asp Ser795 800 805cca ggt cta aac tgc agt aat cca ttt act cag ctg gag agg aga cat 2683Pro Gly Leu Asn Cys Ser Asn Pro Phe Thr Gln Leu Glu Arg Arg His810 815 820caa gaa cat gcc aga cac att tct ttt ggt ggt aac ctg att act ttt 2731Gln Glu His Ala Arg His Ile Ser Phe Gly Gly Asn Leu Ile Thr Phe825 830 835tca cct cta caa cca gga gaa ttt tgaatttaaa aataaatcca aacattttcc2785Ser Pro Leu Gln Pro Gly Glu Phe840 845ttcatattat caatgcttat atattcctta gactattgaa attttggaga aaatgtattt 2845gtgttcactt ctatagcata taatgtttta atattctgtg ttcatcaaag tgtattttag 2905atatactctt tctcaaggga agtggggata ttttgtacat tttcaacaca gaataaaaaa 2965tgtactgtgc cttg 2979
权利要求
1.纯多肽，包含至少65％完全相同于SEQ D NO2或4的氨基酸序列，其中一旦在细胞过量表达，该多肽加速G2/M前进和促进细胞存活。
2.根据权利要求1所述的多肽，其中其氨基酸序列至少70％相同于SEQ ID NO4。
3.根据权利要求2所述的多肽，其中氨基酸序列至少80％相同于SEQID NO4。
4.根据权利要求3所述的多肽，其中氨基酸序列至少90％相同于SEQ IDNO4。
5.根据权利要求4所述的多肽，其中氨基酸序列是SEQ ID NO4。
6.编码权利要求1的多肽或其互补序列的分离的核酸。
7.编码权利要求2的多肽或其互补序列的分离的核酸。
8.编码权利要求3的多肽或其互补序列的分离的核酸。
9.编码权利要求4的多肽或其互补序列的分离的核酸。
10.编码权利要求5的多肽或其互补序列的分离的核酸。
11.与权利要求1的多肽选择性结合的抗体。
12.与权利要求2的多肽选择性结合的抗体。
13.与权利要求3的多肽选择性结合的抗体。
14.与权利要求4的多肽选择性结合的抗体。
15.与权利要求5的多肽选择性结合的抗体。
16.在高度严谨条件下与SEQ ID NO1或3，或其互补序列杂交的分离的核酸。
17.在细胞中表达转录物的方法，该方法包括将一个含有编码转录物的核酸的载体导入到细胞；和在细胞中表达转录物；其中在高严谨条件下该转录物与SEQ ID NO1或3，或其互补序列杂交。
18.根据权利要求17所述的方法，其中该转录物编码权利要求1所述的多肽。
19.测定患者是否具有细胞增殖紊乱的方法，该方法包括提供了来自于具有细胞增殖紊乱的患者的测试样品，和在测试样品中检测肝细胞瘤上调蛋白的基因表达，其中在测试样品中肝细胞瘤上调蛋白的基因表达的水平不同于来自于正常人的对照样品的肝细胞瘤上调蛋白的基因表达的水平，说明患者具有细胞增殖紊乱。
20.根据权利要求19所述的方法，其中在测试样品中肝细胞瘤上调蛋白的基因表达的水平高于对照样品的肝细胞瘤上调蛋白的基因表达的水平。
21.根据权利要求20所述的方法，其中细胞增殖紊乱是癌症。
22.根据权利要求21所述的方法，其中癌症是肝细胞癌或子宫颈癌。
23.根据权利要求19所述的方法，其中在测试样品中肝细胞瘤上调蛋白的基因表达的水平低于对照样品的肝细胞瘤上调蛋白的基因表达的水平。
24.鉴定可用于治疗细胞增殖紊乱的侯选化合物的方法，该方法包括在测试化合物存在下检测肝细胞瘤上调蛋白的基因表达，其中在测试化合物存在下肝细胞瘤上调蛋白的基因表达水平不同于没有测试化合物存在下肝细胞瘤上调蛋白的基因表达水平，说明测试化合物是可用于治疗细胞增殖紊乱的候选物。
25.根据权利要求24所述的方法，其中在测试化合物存在下肝细胞瘤上调蛋白的基因表达水平低于没有测试化合物存在下肝细胞瘤上调蛋白的基因表达水平。
26.根据权利要求25所述的方法，其中细胞增殖紊乱是癌症。
27.根据权利要求26所述的方法，其中癌症是肝细胞癌或子宫颈癌。
28.根据权利要求24所述的方法，其中在测试化合物存在下肝细胞瘤上调蛋白的基因表达水平高于没有测试化合物存在下肝细胞瘤上调蛋白的基因表达水平。
全文摘要
本发明涉及新的细胞周期调节蛋白和编码它们的核酸。
文档编号C07K14/47GK1412198SQ02107529
公开日2003年4月23日申请日期2002年1月21日优先权日2001年1月19日
发明者杨钜文, 邹安平, 戚谨文, 范明基, 周成功申请人:阳明大学, 台北荣民总医院, 财团法人卫生研究院, 国光生物科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨钜文;邹安平;戚谨文;范明基;周成功
技术所有人：阳明大学;台北荣民总医院;财团法人卫生研究院;国光生物科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、赵老师：1.电化学离子储存和分离技术 2.工业结晶
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。