哺乳动物的特洛德样基因和蛋白质的制作方法

文档序号:454326阅读:257来源:国知局
专利名称:哺乳动物的特洛德样基因和蛋白质的制作方法
相关申请交叉文献本申请要求了1998年12月11日提交的美国临时申请No.60/111,873和1998年4月3日提交的美国临时申请No.60/080,550的优先权。各申请均全部纳入本文作参考。
关于联邦政府赞助的研究或开发的声明有待决定。
背景技术
本发明涉及骨形态生成蛋白领域,更具体地涉及BMP-1/Tld家族中的基因和蛋白质。
哺乳动物如小鼠和人骨骼的形成受到一系列骨形态生成蛋白(BMP)的控制。在参与成骨的7种已知BMP中,6种(称为BPM-2到BMP-7)属于TGF-β超家族。第7种BMP(称为BMP-1)并不象TGF-β,而看来衍生自不同的基因家族。BMP-1基因家族成员通常含有下列结构域虾红素样金属蛋白酶结构域,一个或多个在其它蛋白中被认为与Ca++结合的EGF样基序,以及多个CUB结构域。CUB结构域是介导补体成分Clr/Cls中蛋白之间相互作用的一种基序,也已明确它存在于各种参与发育过程的蛋白中。Wozney,J.M.等在Science 242:1528-1534(1988)中描述了BMP-1的核苷酸序列。
其它非哺乳类动物中发现的蛋白质中也具有哺乳动物BMP-1结构域的结构。这些蛋白质包括果蝇属特洛德(tolloid)(Tld)(Shimell,M.J.,Cell 67:469-481(1991))、特洛德样果蝇属基因产物(Tlr-1或tolkin)(Nguyen,T.,Dev.Biol.166:569-586(1994)和Finelli,A.L.,等,Genetics 141:271-281(1995))、海胆BMP-1同系物(suBMP-1)(Hwang,S.-P.,等,Development 120:559-568(1994))、两种相关的海胆发育基因产物SpAN和BP10(Reynolds,S.D.,等,Development 114:769-786(1992)和Lepage,T.,等,Development 114:147-164(1992))、爪蟾属(Xenopus) BMP-1(xBMP-1)(Maeno,M.等,Gene 134:257-261(1993)、爪蟾属特洛德(Lin.J.等人,Develop.Growth Differ.39:43-51(1997))、称为索洛德(xolloid)的特洛德样爪蟾属基因产物(Piccolo,S.等人,Cell91:407-416(1997))、分离自斑马鱼的称为斑马鱼特洛德的该家族相关成员(Bladder,P.等人,Science 278:1937-1940(1997))、哺乳动物特洛德(mTld)(Takahara,K.等,J.Biol.Chem.269:32572-32578(1994))和哺乳动物特洛德样基因(mTll-1)(Takahara,K.等人,Genomics 34:157-165(1996))。编码这些蛋白质的基因的一些核酸序列是已知的。哺乳动物BMP1基因既编码BMP-1蛋白,又编码mTld蛋白,尽管靠的是两个不同的可变剪接的mRNA分子。本段中提到的论文均纳入本文作参考。
发明概述本发明概括地描述了一种新的哺乳动物特洛德样基因产物(mTll-2)及其关联的聚核苷酸基因mTLL-2,该基因与mTld以及其它所有已知的与BMP-1有关的基因产物及其关联的聚核苷酸(包括mTll(现在称为mTll-1))不同。本文的SEQ ID NO:1和SEQ ID NO:3分别报道了该基因的人和小鼠版本。其各自编码的氨基酸序列分别显示在SEQ ID NO:2和SEQ ID NO:4中。
本发明的一个目的是提供参与脊椎动物中胞外基质沉积(如成骨)的基因和基因产物。
本发明的另一个目的是为合理地开发出抑制特洛德样基因活性治疗纤维变性、结疤、瘢痕瘤、手术粘连等的药物提供靶分子。
本发明还有一个目的是提供一种重组DNA构建物、以及该构建物所编码的、用来加速伤口和骨折愈合的蛋白质。
本发明还有一个目的是提供对人染色体10的10q24区域以及小鼠染色体19的远端作图谱的标记。
本发明还有一个目的是提供作为探测哺乳动物细胞中非BMP-1骨形态生成蛋白基因的探针的核苷酸序列。
本发明的其它目的、特征和优点在参照附图进行下列详细叙述时将会更为清晰。
附图简述

图1A-1C(合称“图1”)比较了本发明公开的mTll-2人基因(htll-2)和鼠基因(mtll-2)的推导氨基酸序列与人mTld(人特洛德)以及人mTll-1(htll)基因的推导氨基酸序列。序列对比用PileUp程序(Genetics Computer Group,Madison,Wisconsin)进行,GAP加权值为12,长度加权值为4。蛋白质结构域的近似终点如临时申请60/080,550中所示,该申请纳入本文作参考。
发明详述哺乳动物特洛德样2(mTll-2)是以骨形态发生蛋白-1(BMP-1)为原型的虾红素样蛋白酶超家族中在基因水平上有所不同的成员。该蛋白酶超家族还包括哺乳动物特洛德(mTld)和哺乳动物特洛德样-1(mTll-1;以前称为mTll),该超家族在发育和稳态过程中在伤口愈合中、以及诸如纤维变性等病理过程中起关键的控制作用。编码mTll-2的基因具有与BMP-1家族其它成员不同的空间上和时间上的表达分布图,经对发育者、成年人和小鼠组织的RNA进行Northern和Master印迹(Clontech)确证,它在成年人和正发育的心脏软组织中表达的水平最高。本文列举的mTll-2基因特别可与BMP-1基因家族其它成员区别之处在于编码序列的3′端(编码mTll-2蛋白质的羧基端17个氨基酸)以及编码蛋白质前区(proregion)的部分。同样,其蛋白质也能与该家族中的其它蛋白质区分开来。
本发明者已经确定,与BMP-1、mTld和mTll-1不同,mTll-2并不是前胶原C-蛋白酶,并且不切割chordin。mTll-2将前赖氨酰氧化酶切割成成熟的活性形式的作用较弱。该蛋白质还可能切割参与基质沉淀、发育、体内平衡、伤口愈合和疾病的其它底物。同样,mTll-2蛋白最优切割的底物子集(subset)也与BMP-1、mTld以及mTll-1最优切割的底物子集不同,尽管这些蛋白的底物特异性有部分重叠。mTll-2是抗纤维变性药的潜在靶标,它可能会促进各种组织的愈合,并且还可用来研究发育和疾病过程和鉴定其功能性抑制剂。mTll-2的抑制可能会抑制纤维变性、过度结疤、或正常愈合或发育的其它紊乱。重组mTll-2(或其关联的核酸)可用于评价发育、疾病过程和治疗性干预的系统。
mTll-2蛋白可通过激活生长因子和形态发生素起作用。因此,如果外源性加入(或如果将其同源核酸加入细胞内,例如在基因治疗中),它可能加速愈合。
编码mTll-2的多核苷酸(例如基因组DNA、信使RNA和对应于信使RNA的cDNA)可用对应于以前报道的虾红素金属蛋白酶催化域保守区的引物,在合适的扩增条件下,从含有哺乳动物多核苷酸的模板文库扩增获得。下列的简并寡核苷酸引物(用标准IUPAC命名法显示)适合获得mTll-2基因的一部分,本发明者认为它们是较佳的引物1(正向)5′-CARGC MATGM GNCAC TGGGAG-3′(SEQ ID NO:5)引物2(正向)5′-CARGC MATGMGN CACTG GGAA-3′(SEQ ID NO:6)引物3(反向)5′GAADG TGTTVC KNGCRT ARTGC-3′(SEQ ID NO: 7)含有哺乳动物多核苷酸的合适的模板文库宜为性交后7天的小鼠胚胎或人胎盘的未扩增cDNA的合并物。此合并物中的cDNA宜用RT-PCR扩增的RNA来制备。合适的人和小鼠胎盘和胚胎cDNA合并物购自Clontech。模板cDNA的来源并不关键,只要该cDNA合并物包括至少一个能如所述那样扩增的模板序列即可。其它合适的模板包括,但不局限于,器官特异性的或其它类型的cDNA合并物或文库或基因组DNA或文库。
合适的扩增条件在下文实施例中有所描述,但是本领域技术人员能确定与本文报告的那些有所不同的可接受的条件。一旦获得了最初的PCR产物,就可用它来进行平板筛选cDNA或基因组文库。
可能需要分开建立编码mTll-2的cDNA序列的5′或3′端,例如采用只选择性扩增5′或3′端cDNA序列的方法,例如3′简并PCR或cDNA末端的迅速扩增方法(“RACE”),该方法在Frohman,M.A.″迅速扩增互补DNA末端来产生全长互补DNA加热RACE法″,Methods in Enzymology(Wu,R.编),218卷,340-362页,Academic Press,New York(1991),该文全部纳入本文作参考。
市售的5′和3′RACE扩增系统购自Clontech。适合5′和3′RACE的引物可从上述用简并引物进行最初PCR时获得的扩增cDNA序列,或通过筛选cDNA或基因组DNA文库获得的cDNA克隆序列推导出来。在较佳的实施方案中,根据平板筛选分离出的1.6kb cDNA 5′端设计的嵌套PCR的引物如下引物4 5′-TGTGGTGTCT GGGCTGCTCT CAGATGC-3′(SEQ ID NO:8)引物5 5′-ACTGTCTGCT TGGTCCAGTC TCTGG-3′(SEQ ID NO:9)对于3′-简并PCR,合适的嵌套引物对应于平板筛选分离的cDNA 3′端序列,合适的简并引物对应于在BMP-1/特洛德样蛋白CUB结构域5中发现的保守序列。合适的引物包括引物6 5′-TACCTGGAAG TCCGGGATGG CCCCACG-3′(SEQ ID NO:10)引物7 5′-GAGGATGTGA AATCGAGCTC CAACAGAC-3′(SEQ ID NO:11)引物8-11(简并引物)5′-RAANCCYTTYTTNNNDATNGTRTCRTC-3′(SEQ ID NO:12)对于3′RACE,对应于用3′-简并PCR扩增的cDNA片段3′端序列的合适的嵌套PCR引物是引物12 5′-CAACAACTAC CCGAGCGAGG CCCC-3′(SEQ ID NO:13)引物13 5′-GAAGCCTACG ACGGCTACGA CAGCTC-3′(SEQ ID NO:14)
本领域技术人员可将分开克隆的序列连接在一起,正如本发明者所做的那样,从人获得完整的全长cDNA,如SEQ ID NO:1所示。SEQ ID NO:1所示的是侧接了5′和3′非翻译序列的一个开放读框。该开放读框编码了称为mTll-2的哺乳动物特洛德样蛋白。该人mTll-2基因的基因图谱位于人染色体10q24。
SEQ ID NO:3显示了从小鼠源获得的第二种mTll-2基因。SEQ ID NO:4中报道了该小鼠mTll-基因编码的对应蛋白。该鼠版本基因与人mTll-2基因对应之处在于两者均具有相似的核酸和氨基酸序列。还不知道鼠mTll-2基因在鼠染色体基因图谱中在何位置。
如果DNA制品中已经除去了90%以上任何有DNA的宿主细胞的细胞物质,则认为任何来源的含有mTll-2基因序列的DNA分子制品是基本上纯的。例如,细胞物质可利用市售纯化试剂盒(如购自Qiagen(Chatsworth,CA)的试剂盒)从核酸制品中除去。较佳的是,核酸制品中超过10%的核酸分子含有全部或部分mTll-2基因。更佳的是,超过50%,甚至还要佳的是超过90%的核酸分子含有mTll-2基因全部或部分序列。
鉴于与其它特洛德样蛋白质的相似性,预计本发明公开的mTll-2基因所编码的产物将在发育以及体内平衡过程(如伤口愈合)中起关键作用。该蛋白参与胞外基质前体成熟为大分子结构(例如通过激活前赖氨酰氧化酶)。该蛋白还可能在体内和体外激活生长因子中起一定作用,当将有效量的蛋白质给予组织时,它可能会促进发育和体内平衡过程。另一方面,如果mTll-2蛋白质功能被抑制,这些过程本身可能被抑制,通过输送有效量的抑制剂就可有利地利用该特性来防止纤维变性和过度结疤或其它伤口愈合的异常情况。通过测试某剂量范围的该蛋白质对所选的认为在生物化学或生理学上类似于人的脊椎动物或模型动物的作用,就容易确定待输送给靶部位以激活发育和体内平衡特性的该蛋白质的有效量。例如,就皮肤或心脏伤口愈合或发育而言,猪皮肤或心脏是人皮肤和心脏的合适模型。大鼠或家兔心脏也是可以接受的系统。
同样,也可确定mTll-2蛋白抑制剂的有效量。有效量是指在给予后能比未治疗动物有效减少纤维变性、结疤或瘢痕瘤发生的用量,其中根据临床或兽医所接受的标准来评估上述病症。这种测试宜在通常被视为与人皮肤、心脏或其它受累组织有关的模型系统中进行。
由于该蛋白质在动物组织中的含量通常非常少,因此BMP系统蛋白质的工作能力受到阻遏。一种以前未知的基因,mTll-2,可以克隆入含有(在合适哺乳动物或昆虫宿主细胞内)有效的转录启动子的合适表达载体中,继而导入合适的(哺乳动物或昆虫)宿主细胞并在其中表达,并以天然构型纯化,所有这些均采用常规方法。可将cDNA插入可整合的(例如pCDNA3.1型)或游离型(例如pCEP4型)载体中,并在合适培养的哺乳动物细胞(如分别为293人胚肾细胞或2930EBNA细胞)中表达。pCDNA3.1和pCEP4载体(以及有关载体)购自Invitrogen。载体序列和载体的限制性图谱均从Invitrogen获得。cDNA还可插入杆状病毒载体(如BacPAK 6,购自Clontech)。
这样表达的蛋白质可保留在宿主细胞内,或可以分泌到胞外生长培养基中(如果构建物有合适的信号序列的话)。该蛋白质可用常规的方法从细胞或生长培养基中纯化获得。重组蛋白(及其同源mRNA)可用于功能试验和高产量筛选抑制剂。重组蛋白和蛋白质的诸部分可从本文公开序列的亚克隆产生,并可作X-线晶体图进行合理的药物设计。可设计出对mTll-2蛋白有特异性的抗体。
合适的转录启动子包括如在pCDNA3.1或pCEP载体中发现的巨细胞病毒立即早期启动子,或是在载体pFASTBacl(该载体可购自Gibco-BRL)上发现的杆状病毒极迟启动子。另一个合适的启动子是杆状病毒立即早期启动子,如在pAcPIE1载体(Novagen,Madison,WI)上发现的启动子。任何其它有利的表达元件如增强子、终止子等本领域已知的元件可包括在合适的表达载体中。
合适的宿主可以是昆虫组织培育细胞,如细胞系Sf21、Sf9、High Five(Invitrogen,sar Diego,CA)、或哺乳动物293或293-EBNA细胞。
也可将含有小于全部编码序列的该基因的合适部分克隆入合适的载体中,以形成基因重组构建物。应当理解,根据本发明制得的构建物不必含有整个mTll-2基因座或编码区,但应含有能编码所需功能的一个或多个部分,或含有该基因其它有用性能(如与所需基因组序列互补)的部分。本领域普通技术人员可以理解,mTll-2蛋白质(以及编码mTll-2蛋白质的相应的遗传物质)在大小和序列上的某些变化不会干扰其功能。在构建含有全部或部分mTll-2基因的基因构建物时,这些经修饰的形式可用已知的有利方法进行工程化,并表达在其编码的蛋白质中。
只要蛋白质保留了已知与该蛋白有关的所需功能,认为这些改变、修饰、添加和缺失均在本发明的范围内。如果蛋白质在进行这种切割的标准试验中保留了切断(前赖氨酰氧化酶的)能力,则该蛋白质是感受态蛋白。本领域技术人员对这些试验应伴有的必要的对照是熟悉的。或者,可能希望蛋白质由于这种变化而丧失某些功能,预计这类情况也包括在本发明的范围内。
这样制得的该蛋白质基本纯的制品被确定为一种制品,其中mTll-2蛋白质的特征性活性(例如对前赖氨酰氧化酶的较弱的切割作用)应不受制品中存在的其它蛋白质或分子的影响。根据该蛋白质将投入的用途,mTll-2蛋白质在基本纯的蛋白质制品中的量至少应为10%,至少50%为佳,至少75%为更佳,至少95%为最佳。通过用亲和标记物对该蛋白质作标记,并使制品通过对标记物有亲和性的柱,可增加此蛋白质制品中感兴趣的蛋白质。也可采用一种加工标记物,这样,就可从加有粗品的柱中洗脱获得适当加工形式(缺少切割前区)的该蛋白质。
当将鼠mTll-2蛋白质序列与其它特洛德样基因进行比较时,其与两个哺乳动物蛋白质(mTld和mTll)任一的前区或两个果蝇属蛋白质(Tld或Tlr-1)任一的前区没有广泛的同源性。图1将本发明公开的人和鼠mTll-2基因与人mTld以及人mTll-1基因作了氨基酸序列对比。序列对比用PileUp程序(Genetics Computer Group,Madison,Wisconsin)进行,GAP权值为12,长度权值为4。图1还显示了所示编码序列编码的蛋白质各结构域的大致边界。图1所示的氨基酸序列,从上到下,分别是人mTll-2、小鼠mTll-2、mTld和mTll-1。
mTll-2 mRNA转录物看来并非是可变剪接的,因为只检测到一个转录物,因为在每一种动物中进行cDNA文库筛选和PCR扩增时只分离出一种mTll-2 cDNA。
在胎盘和心脏观察到有相当强的mTll-2 mRNA表达。
具体预计的是,通过用经选择包含所述小鼠基因的mTll-2特异性部分的探针探测适当动物细胞的cDNA文库,或用与上述相似或不同的简并引物进行PCR扩增,可以自其它动物种类分离出mTll-2基因的等价物。通过比较小鼠mTll-2编码区核酸序列与BMP-1/mTld以及mTll-1的序列并选出在此二基因内均没有等价物的mTll-2基因部分,可获得小鼠mTll-2基因的mTll-2特异性部分。作为有效的探针,所选序列不应含有会与众多基因组位点相互杂交的重复序列。探针长度应至少约200个碱基。已经认识到,BMP-l家族基因在编码蛋白质前区和C端17个氨基酸的区域中最为可变,并且预计可以从mTll-2基因的那些区域分离出合适的探针。这样的探针片段可用切口翻译、末端标记或本领域已知的其它合适技术来转变成探针。还应理解,可用分子生物学家熟知的技术来体外合成所需的片段(或实际上是整个基因)。本领域技术人员能设计出对应于mTll-2所独有的区域或BMP-1/mTll-1/mTll-2蛋白家族成员中保守的区域的简并引物。
由于mTll-2中的缺陷可能导致人基因异常,因此如下文实施例所述已确定了人TLL-2基因的染色体位置(10q24)。该位置靠近与人遗传性疾病肌萎缩性痉挛性下身轻瘫有关的基因图位置。在用Trask,B.,Methods Cell Biol.35:1-35(1992)的方法伸展的人细胞分裂中期染色体上进行荧光原位杂交(FISH),并通过放射杂交筛选,对TLL基因独立作图谱。
通过选择预计侧接mTll-2基因(或该基因任何部分)的特异性引物,应当也可能用PCR来扩增对应于mTll-2区的基因组部分。该基因的两个mTll-2特异性部分可作为合适的引物。在该基因编码部分之外选择引物可能是无效的,因为非编码部分降低的选择性压力会导致小鼠和人以及其它动物之间在这些区域中出现更大的趋异。特别应注意的是,应对人和模型动物(如小鼠)BMP家族的基因进行特别搜寻,以探知它们与人畸形的关系(参见例如"The Chicken With a Duck′s Feet:It′s All in theBiochemical Signal,"The New York Times,National Edition,p.B6(1996年5月21日))。
也可特别预计到,可在宿主细胞中表达(或从宿主细胞中分泌)mTll-2基因编码的大量蛋白质,纯化成基本纯的制品,并用于随后的功能试验。在这样的一个功能试验中,将描述表达蛋白质的功能特征。预计该蛋白质的功能将包括金属蛋白酶活性、前赖氨酰氧化酶加工活性,以及激活TGF-β样蛋白的活性,鉴于其总体结构在结构域水平上与已知的蛋白质相似,因此这些预计是合理的。
在另一个试验中,该蛋白质可用来筛选对其有抑制活性的推定试剂。如果mTll-2能拯救BMP-1敲除小鼠,则它对于修饰或消除BMP-1蛋白功能以类似方式改变mTll-2蛋白功能的任何治疗系统是重要的。因此,任何一组这样的试剂都必需以mTll-2蛋白质进行筛选。在这样的试验中,所有支持mTll功能的试验成分可在合适的盐和pH条件下一同加入,并与一组推定的蛋白质功能抑制剂合用。采用已建立的蛋白质功能试验(在纳入本文其它处作为参考的文献中有所描述),将可以确定受测制剂是否能抑制蛋白质活性,从而使其成为以治疗量抑制纤维变性、减少结疤和减少瘢痕瘤的候选制剂。采用BMP-1基因家族的相关蛋白质的这种筛选努力正在进行。
现在也可用本发明所公开的蛋白质或其片段来进行合理的药物设计。在设计时,对该蛋白质或片段进行X-射线晶体图作分析,以确定它们的活性位点和可与推定治疗剂相互作用的位点。
目前表明,BMP-1编码的蛋白质可切割前胶原的C端附近。人们早就认为产生这种胶原所必需的C端-蛋白酶活性存在于一种预测的蛋白质中。因此,利用C端蛋白酶活性作为胶原相关疾病的治疗剂具有很高的商业价值。特别期望的是,mTll-2编码的蛋白质部分可用来产生另一种C端蛋白酶,两者均通过将基因导入重组载体中来体外生产治疗性蛋白,并在遗传疾病治疗中直接给药。人的基因特别适用于这些用途。
在考虑下列非限制性实施例后将能更好地理解本发明。
实施例来自人胎盘cDNA的人mTll-2用简并引物作PCR扩增。用对应于在BMP-1/特洛德样虾红素金属蛋白酶催化功能域中的一对保守区域的简并引物,从人胎盘Marathon-Ready cDNA文库(Clontech)扩增得到mTll-2基因的一部分(见Bond.J.S.和R.J.Benynon,Protein Science 4:1247-1261在1249页(1995),纳入本文作参考)。为了确定简并引物的合适序列,对人(Wozney等人,1988)、小鼠(Fukagawa等人,1994)和爪蟾属(Ma no等人,1993)BMP-1、果蝇属特洛德相关-1(Nguyen等人,1994)和小鼠(Takahara等人,1996)和人mTll-1的对应核苷酸序列作人工序列对比。一对5′(正向)寡核苷酸引物,为引物1:5′-CARGC MATGMGNCAC TGGGAG-3′(SEQ ID NO:5)和引物2:5′-CARGC MATGMGN CACTGGGAA-3′(SEQ ID NO:6),它对应于编码较多氨基端氨基酸保守残基AMRHWE的序列。两个正向引物的不同仅仅在于最3′端的碱基对应于E的密码子的摇摆位置。3′(反向)寡核苷酸引物为引物3:5′GAADG TGTTVC KNGCRT ARTGC-3′(SEQ ID NO:7),它对应于编码较多羧基端氨基酸保守的残基HYARNTF的序列。
PCR这样进行:95℃变性5分钟,然后是30轮的95℃45秒、50℃45秒、72℃2分钟,最后72℃延伸10分钟,采用0.5ng人胎盘cDNA作为模板。
从2%琼脂糖凝胶上切下电泳观察到的异源的375bp PCR产物,然后连接入市售的pCR2.1载体(Invitrogen)中,该载体的核酸序列已公布。连接反应用ApaⅠ来限制,该酶在BMP-1/mTld序列中切割,以降低BMP-1/mTld克隆的本底。克隆的序列分析揭示用引物2和引物3组合获得了约375bp的PCR产物。用引物1和引物3组合没有获得mTll-2或其它新的(例如非BMP-1/mTld或mTll-1)产物。通过对两条链测序,确认本文报告的人mTll-2序列。
cDNA文库筛选。用32p-dCTP(Amersham)通过随机引导对375bp的人mTll-2PCR片段作放射性标记(Feinberg,A.P.,和Vogelstein,B.(1983),“将DNA限制性内切核酸酶片段放射性标记成高比活的技术”,Anal.Biochem.132:6-13,该文全部纳入本文作参考),并用其来筛选gtll人胎盘cDNA文库(Clontech)的噬斑。杂交在65℃下进行18小时,用2×SSC、0.1%SDS室温洗涤30分钟;用2×SSC、0.1%SDS 65℃洗涤30分钟;并用0.1×SSC、0.1%SDS 65℃洗涤30分钟。
噬斑纯化得到一个强杂交阳性克隆,切下约1.6kb的插入物(大致对应于BMP-1家族基因常见的前区、催化结构域、CUB1和CUB2结构域),亚克隆到pBluescript ⅡKS+的EcoRⅠ位点内,通过如Lee S.-T.,等人,″编码人前α2(Ⅰ)胶原的全长cDNA的构建及其在前α2(Ⅰ)-缺陷型W8大鼠细胞中的表达″,J.Biol.Chem.263;13414-13418(1988)(该文全部纳入本文作参考)中所描述的双脱氧链终止法,从双链模板获得序列。
用T3和T7引物对亚克隆的两末端进行测序,通过引入缺失或采用与插入序列互补的引物使亚克隆的内部部分得以测序。平板筛选的进一步尝试未能产生编码新的mTll-2序列的其它阳性克隆。
用RACE-PCR和采用简并引物的PCR来完成人mTll-2 cDNA序列的5′和3′端。为了获得1.6kb片段(如上所述获得)和mTll-2 cDNA 5′端序列之间的所有序列,用Marathon cDNA扩增试剂盒按照生产商(Clontech)说明书,对0.5ng人胎盘Marathon-Ready cDNA模板进行5′RACE PCR扩增。对应于1.6kb片段5′端附近序列的嵌套引物是引物4:5′-TGTGGTGTCT GGGCTGCTCT CAGATGC-3′(SEQ ID NO:8)和引物5:5′-ACTGTCTGCT TGGTCCAGTC TCTGG-3′(SEQ ID NO:9)。嵌套PCR反应中的其余引物对应于Clontech合成并包括在市售的Marathon cDNA扩增试剂盒(它可用来进行嵌套PCR过程)中的RACE-PCR衔接子部分。
进行嵌套PCR,PCR的第一回合为95℃5分钟,然后是40轮的95℃45秒、60℃45秒、72℃2分钟,最后72℃延伸10分钟。嵌套PCR的第二回合在相同条件下进行,只是进行35轮而不是40轮。将PCR产物克隆到Invitrogen pCR2.1载体中进行序列分析。
获得了前区和所有信号肽的编码部分并含有约360bp 5′非翻译序列的约900bp的mTll-2 5′RACE-cDNA克隆。
最初,3′RACE PCR没有提供人mTll-2基因的附加的3′序列。因此,采用中间PCR扩增步骤,该步骤采用了对应于1.6kb cDNA 3′端序列的两个嵌套引物(引物6:5′-TACCTGGAAG TCCGGGATGG CCCCACG-3′(SEQ ID NO:10))和引物7(5′-GAGGATGTGA AATCGAGCTC CAACAGAC-3′(SEQ ID NO:11)),以及对应于人和小鼠mTld以及mTll-1蛋白的CUB结构域5中保守的氨基酸序列的四个交替简并寡核苷酸引物。简并反向引物8-11都具有序列5′-RAANCCYTTYT TNNNDATNGT-3′,但是各引物中的6个附加的3′端碱基不同。反向引物8-11的末端序列为引物8,5′-GTCGTC-3′;引物9,5′-ATCATC-3′;引物10,5′-GTCATC-3′;和引物11,5′-ATCGTC-3′。这四个简并引物在SEQ ID NO:12中列成单个简并引物,其中引物8、9、10和11中的变化反映在6个最3′端碱基的简并性上。
用人胎盘Marathon-Ready cDNA作为模板(0.5ng)。第一回合PCR这样进行,95℃5分钟,然后40轮的95℃45秒、60℃45秒、72℃4分钟,最后72℃延伸10分钟。PCR的第二个嵌套回合在相同条件下进行,只是采用35轮而不是40轮。
从0.8%琼脂糖凝胶上切下约1.3kb的特异性产物,克隆到pCR2.1中进行序列分析。1.3kb片段编码了人mTll-2的所有EGF1、CUB3、EGF2和CUB4结构域和大部分CUB5结构域,并且是用简并反向引物10(而不是引物8、9或11)与嵌套正向引物6或7组合获得的。
为了获得其余的人mTll-2 cDNA序列,用对应于1.3kb片段3′端附近序列的两个嵌套引物(引物12:5′-CAACAACTAC CCGAGCGAGG CCCC-3′(SEQ ID NO:13)和引物13:5′-GAAGCCTACG ACGGCTACGA CAGCTC-3′(SEQ ID NO:14)),以人胎盘Marathon-Ready cDNA作为模板(0.5ng),用Marathon cDNA扩增试剂盒根据生产商说明书(Clontech)来进行3′RACE PCR。嵌套PCR如下进行PCR的第一回合为95℃分钟,然后是40轮的95℃45秒、60℃45秒、72℃4分钟,最后72℃延伸10分钟。PCR的第二嵌套回合在相同条件下进行,只是采用35轮而不是40轮。从0.8%琼脂糖凝胶上切下约1.7kb的特异性产物(编码部分CUB5结构域并含有1.6kb的3′非翻译区,包括聚A尾部),并克隆到pCR2.1中进行序列分析。
鼠mTll-2用获得最初人375bp片段的相同简并引物和PCR条件(见上文),从小鼠cDNA获得约375bp的异源产物。在这种情况下,所用的模板为0.5ng的性交后7天(dpc)小鼠胚胎Marathon-Ready cDNA(Clontech)。对375bp PCR产物作电泳并从2%琼脂糖凝胶上切下,连接到pCR2.1中,连接反应用ApaⅠ限制,以降低BMP-1/mTld克隆的本底。与人序列相反,375bp mTll-2 PCR产物是用引物1与引物3组合获得的,但用引物2和引物3组合没有获得mTll-2或其它新的产物。
用375bp片段筛选鼠7dpc和17dpc cDNA文库,没有产生任何阳性mTll-2克隆。为了获得375bp片段和鼠mTll-2 cDNA 5′端序列之间的所有序列,用MarathoncDNA扩增试剂盒按照生产商(Clontech)说明书,用简并反向引物3(如上)和对应于375bp片段3′端附近序列的嵌套引物(引物14,5′-GCTTTCCTCATCTGTCCTCTCTACG-3′(SEQ ID NO:15)),以0.5ng 7dpc小鼠胎盘Marathon-Ready cDNA为模板,进行5′RACE PCR。嵌套PCR如下进行PCR的第一回合为94℃30秒,然后是5轮的94℃5秒、72℃4分钟;5轮的94℃5秒,70℃4分钟;30轮的94℃5秒,68℃4分钟,最后72℃延伸10分钟。PCR的第二个嵌套回合如下进行94℃30秒,然后是5轮的94℃5秒,72℃4分钟;5轮94℃5秒,70℃4分钟;25轮94℃5秒,68℃4分钟,最后72℃延伸10分钟。
将PCR产物克隆到Invitrogen pCR2.1载体中进行序列分析。获得约900bp的mTll-2PCR产物,它编码部分蛋白酶结构域、所有的信号肽和前区,并含有约200bp的5′非翻译序列。
为了获得375bp片段和小鼠mTll-2 cDNA序列3′端之间的序列,用简并正向引物1(上述)和对应于375bp片段5′端附近序列的嵌套引物(引物15,CCTGTGTGACCTTCGTAGAGAGG-3′(SEQ ID NO:16))进行3′RACE PCR。PCR条件与用于小鼠mTll-2序列5′RACE的条件(上述)相同。将PCR产物克隆到pCR2.1中作序列分析。获得约1200bp的mTll-2 PCR产物,它编码部分蛋白酶结构域、所有的结构域CUBl、CUB2、EGF1、CUB3、EGF2并终止于CUB3结构域内。用从1200bp片段获得的序列信息所设计出的寡核苷酸引物对编码序列的其余部分作PCR扩增。已经确定小鼠mTll-2基因的全长编码区,其位于bp191和3229之间或SEQ IDNO:3。
染色体排布。用辐射杂交图谱(Walter等人,1994)作TLL2图谱,该方法包括对从Research Genetics获得的4组辐射杂交物作聚合酶链反应(PCR)分析。正向引物5′-TGGGAGCTGAGCAATGCTAACTGC-3′(SEQ ID NO:17)和反向引物5′-GAAGGTGTTCCGGGCGTAGTGCAT-3′(SEQ ID NO:18)分别对应于TLL2内含子6和外显子7中的序列,用人基因组DNA模板得到1.4kb PCR产物,但用对照中国仓鼠基因组DNA模板没有得到产物。PCR用100ng模板DNA和10皮摩尔各引物进行,热循环程序为95℃5分钟,然后是30轮的95℃45秒、65℃45秒、72℃3分钟,最后72℃延伸10分钟。
在0.8%琼脂糖凝胶上对PCR产物作电泳,用溴乙锭显色,将得分提交给Whitehead Institute/MIT Center for Genome Research的WICGR给图服务机构。TLL2在GeneBridge 4 Panel辐射杂交物上清晰地图示位置位于染色体10q,距离标记D10S571 8.66cR,Lod评分为15。另外,Trask(1991)的方法伸展的在雄性中期染色体上进行荧光原位杂交(FISH),图示出TLL2在染色体10上的位置。将含有TLL2外显子的10kb BamHⅠ基因组片段亚克隆到pBluescript Ⅱ KS+中,并用洋地黄毒苷-11-dUTP(Boehringer Mannheim)通过随机引导作标记。获得可图象并如Takahara等人1994所述作分析。仅发现这两个染色体上的双荧光信号在测定的75%中期伸展体(15/20)中的10q24处,在其它染色体上没能将TLL2定位于该区域(未显示)。
组织切片作原位杂交将组织切片固定在玻片上进行原位杂交。小鼠组织将如Lyons等人,″发育骨骼肌中肌球蛋白基因的表达″,J.Cell Biol.111:1465-1476(1990)中所述那样固定和包埋。简言之,将组织固定在含4%多聚甲醛的磷酸缓冲盐溶液中,脱水,并用石蜡浸润。将5-7微米厚的系列切片固定在明胶化的玻片上。每个玻片固定1-3个切片,用二甲苯脱去石蜡,并重新水化。用蛋白酶K消化切片,后固定,用三乙醇胺/乙酸酐处理、洗涤并脱水。
原位杂交和洗涤程序使切片在52℃50%去离子甲酰胺、0.3M NaCl、20mM Tris-HCl、pH7.4、5mMEDTA、10mM NaPO4、10%硫酸葡聚糖、1×Denhardt′s溶液、50μg/ml酵母总RNA、25μmol/ml硫代ATP(Boehringer-Mannheim)和50-75,000cpm/μl35S标记的cRNA探针中杂交过夜。使组织在65℃的50%甲酰胺、2×SSC、10mM二硫苏糖醇中严格清洗;在磷酸盐缓冲盐水中漂清;并用20μg/ml RNase A 37℃处理30分钟。随后在37℃2×SSC和0.1×SSC中37℃清洗15分钟后,使载玻片脱水,将其浸在Kodak NTB-2核示踪乳液中,并在4℃、有干燥剂的不透光箱子中曝光一周。照片在Kodak D-19中显影。用Zeiss Axiophot显微镜的亮视野和暗视野镜片分析载玻片。
mTll-2基因的亚克隆和表达BMP-1、mTld、mTll-1和mTll-2的成熟活性形式的氨基酸序列是相似的。只是每种蛋白质的C端没有同源性。C端序列的这种独特性已被用来生产一系列能区别这些蛋白质形式的多克隆抗体。在小鼠mTll-2的情况下,使对应于mTll-2最后的17个氨基酸的合成的肽与蛋白质载体钥孔血兰素连接,悬浮在盐水中,与等体积弗氏佐剂混合乳化,注入两只兔子每只背部皮下3-4处。在加强免疫后12周和16周,放血取血清。这些抗体有商业用途,可用于试验显示细胞、组织和哺乳动物生物体(包括但不局限于模型动物体系如啮齿类动物和灵长类动物和人)中mTll-2蛋白质的产生和定位。
应注意,独特的序列存在于蛋白酶、这些蛋白质的CUB和前区内,并能用来检测和区分该家族的各成员。参见Lee,S.J.Biol.Chem.272:19059-19066(1997)。
由于对骨形态生成蛋白的了解进展迅速,因此区别各组分的能力不仅在研究方面重要,而且在监测BMP体系疾病患者的BMP系统组分的水平和分布上也很重要。这些疾病包括,例如,小鼠和人体的纤维变性疾病或心脏病。此外,由于TLL2基因的缺陷,还可能会有遗传性发育异常。采用本文所述的抗体和核酸探针就可确定mTll-2在这些遗传异常中起的作用。显然,mTll-2蛋白质在生物发育中是非常重要的,因为它在胎盘和发育的心脏中表达。
序列表<110>Greenspan,Daniel S.
Scott,Ian C.
Thomas,Christina L.<120>哺乳动物的特洛德样基因和蛋白质<130>960296.96111<140><141><150>60/111873<151>1998-12-11<150>60/080550<151>1998-04-03<160>18<170>PatentIn Ver.2.0<210>1<211>5021<212>DNA<213>人<220><221>CDS<222>(365)..(3412)<400>1cgcccattgg ctcctcagcc aagcacgtac accaaatgtc tgaacctgcg gttcctctcg 60tactgagcag gattaccatg gcaacaacac atcatcagta gggtaaaact aacctgtctc 120acgacggtct aaacccaggc agcctcggcc gccgggcaag tagctccgag cggctgcttc 180ccggttgcct cgaagaagac agggggcgcc gcgctccgct tgctccgcgc ctgagccatg 240cccagcagcc ctgtgtaacc accgagtccc ggccggagcc gaccgaccca gtgtgcgccg 300tctttcggcc gagctgagct ttcgtgcacg caactccctc tgccccagcc ggccccgcgc 360cacc atg ccc cgg gcg act gca ctt ggg gcc ctg gtg tca ctg ctg ctg 409Met Pro Arg Ala Thr Ala Leu Gly Ala Leu Val Ser Leu Leu Leu1 5 10 15ctg ctg ccg ctg cct cgc ggc gcc ggg gga ctc ggg gag cgc ccg gac 457Leu Leu Pro Leu Pro Arg Gly Ala Gly Gly Leu Gly Glu Arg Pro Asp
20 25 30gcc acc gca gac tac tca gag ctg gac ggc gag gag ggc acg gag cag 505Ala Thr Ala Asp Tyr Ser Glu Leu Asp Gly Glu Glu Gly Thr Glu Gln35 40 45cag ctg gag cat tac cac gac cct tgc aaa gcc gct gtc ttt tgg gga 553Gln Leu Glu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly50 55 60gac att gcc tta gat gaa gat gac ttg aag ctg ttt cac att gac aaa 601Asp Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys65 70 75gcc aga gac tgg acc aag cag aca gtg ggg gca aca gga cac agc aca 649Ala Arg Asp Trp Thr Lys Gln Thr Val Gly Ala Thr Gly His Ser Thr80 85 90 95ggt ggg ctt gaa gag cag gca tct gag agc agc cca gac acc aca gcc 697Gly Gly Leu Glu Glu Gln Ala Ser Glu Ser Ser Pro Asp Thr Thr Ala100 105 110atg gac act ggc acc aag gaa gct gga aag gat ggc cgg gag aat acc 745Met Asp Thr Gly Thr Lys Glu Ala Gly Lys Asp Gly Arg Glu Asn Thr115 120 125aca ctc ctg cac agc cct ggg acc ttg cat gcc gca gcc aag acc ttc 793Thr Leu Leu His Ser Pro Gly Thr Leu His Ala Ala Ala Lys Thr Phe130 135 140tct ccc cgg gtc cga aga gcc aca acc tca agg aca gag agg ata tgg 841Ser Pro Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp145 150 155cct gga gga gtc atc ccc tac gtc att gga ggg aac ttc act ggg agc 889Pro Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser160 165 170 175cag agg gcc att ttt aag cag gcc atg aga cac tgg gag aag cac acc 937Gln Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr180 185 190tgt gtg acc ttc ata gaa agg acg gat gag gaa agc ttt att gta ttc 985Cys Val Thr Phe Ile Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe195 200 205agt tac aga acc tgt ggc tgt tgc tcc tat gtt ggg cgc cga gga gga 1033Ser Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly210 215 220ggc cca cag gcc ata tcc att ggg aag aac tgt gac aag ttt ggc att 1081Gly Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile
225 230 235gtg gct cac gag ctg ggc cat gtg gtt ggg ttt tgg cat gaa cac acc 1129Val Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr240 245 250 255cgg cca gac aga gac caa cat gtc acc atc atc agg gaa aac atc cag 1177Arg Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln260 265 270cca ggt cag gag tat aat ttc tta aaa atg gaa gct ggg gaa gtg agc 1225Pro Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser275 280 285tct ctg gga gag aca tac gac ttt gac agc atc atg cac tac gcc cgg 1273Ser Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg290 295 300aac acc ttc tca aga gga gtt ttc tta gac acc atc ctt ccc cgt caa 1321Asn Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Gln305 310 315gat gac aat ggc gtc agg cca acc att ggc cag cgc gtg cgg ctc agt 1369Asp Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser320 325 330 335cag gga gac ata gct caa gcc cgg aag ctg tac aaa tgc cca gcg tgt 1417Gln Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys340 345 350ggg gag acc ctg cag gac aca acg gga aac ttt tct gca cct ggt ttc 1465Gly Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe355 360 365cca aat ggg tac cca tct tac tcc cac tgc gtc tgg agg atc tcg gtc 1513Pro Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val370 375 380acc cca ggg gaa aag atc gta tta aac ttc aca tcc atg gat ttg ttt 1561Thr Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Ser Met Asp Leu Phe385 390 395aaa agc cga ctg tgc tgg tat gat tac gtg gag gtc cgg gat ggt tac 1609Lys Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Tyr400 405 410 415tgg aga aaa gcc ccc ctt ttg ggc agg ttt tgt ggc gat aag atc ccg 1657Trp Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro420 425 430gag ccc ctc gtc tcc acg gac agc cgg ctc tgg gtg gag ttc cgc agc 1705Glu Pro Leu Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser
435 440 445agc agc aac atc ttg ggc aag ggc ttc ttt gca gcg tac gaa gct acc 1753Ser Ser Asn Ile Leu Gly Lys Gly Phe Phe Ala Ala Tyr Glu Ala Thr450 455 460tgc ggg gga gac atg aac aaa gat gcc ggt cag att caa tct ccc aac 1801Cys Gly Gly Asp Met Asn Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn465 470 475tat ccg gat gac tac aga cct tcc aag gaa tgt gtc tgg agg att acg 1849Tyr Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr480 485 490 495gtt tcg gag ggg ttt cac gtg gga ctt acc ttc caa gct ttt gag att 1897Val Ser Glu Gly Phe His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile500 505 510gaa agg cac gac agc tgt gca tat gac tac ctg gaa gtc cgg gat ggc 1945Glu Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly515 520 525ccc acg gaa gag agt gcc ctg atc ggc cac ttt tgt ggc tat gag aag 1993Pro Thr Glu Glu Ser Ala Leu Ile Gly His Phe Cys Gly Tyr Glu Lys530 535 540ccg gag gat gtg aaa tcg agc tcc aac aga ctg tgg atg aag ttt gtg 2041Pro Glu Asp Val Lys Ser Ser Ser Asn Arg Leu Trp Met Lys Phe Val545 550 555tcc gat ggc tct atc aat aaa gcg ggc ttt gca gcc aat ttt ttc aag 2089Ser Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys560 565 570 575gag gtg gat gag tgt tcc tgg cca get cac ggc ggg tgc gaa cat cgc 2137Glu Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu His Arg580 585 590tgt gtg aac acg ctg ggc agc tac sag tgt gcc tgt gac cct ggc tac 2185Cys Val Asn Thr Leu Gly Ser Tyr Lys Cys Ala Cys Asp Pro Gly Tyr595 600 605gag ctg gcc gcc gat aag aag atg tgt gaa gtg gcc tgt ggc ggt ttc 2233Glu Leu Ala Ala Asp Lys Lys Met Cys Glu Val Ala Cys Gly Gly Phe610 615 620att acc aag ctg aat gga acc atc acc agc cct ggg tgg ccg aag gag 2281Ile Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu625 630 635tat ccc aca aac aaa aac tgt gtc tgg cag gtg gtg gcc ccc gct cag 2329Tyr Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Ala Gln640 645 650 655tac cgg atc tcc ctt cag ttt gaa gtg ttt gaa ctg gaa ggc aat gac 2377Tyr Arg Ile Ser Leu Gln Phe Glu Val Phe Glu Leu Glu Gly Asn Asp660 665 670gtc tgt aag tac gac ttt gta gag gtg cgc agc ggc ctg tcc ccc gac 2425Val Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp675 680 685gcc aag ctg cac ggc agg ttc tgc ggc tct gag acg ccg gaa gtc atc 2473Ala Lys Leu His Gly Arg Phe Cys Gly Ser Glu Thr Pro Glu Val Ile690 695 700acc tcg cag agc aac aac atg cgc gtg gag ttc aag tcc gac aac acc 2521Thr Ser Gln Ser Asn Asn Mer Arg Val Glu Phe Lys Ser Asp Asn Thr705 710 715gtc tcc aag cgc ggc ttc agg gcc cac ttc ttc tca gat aag gac gag 2569Val Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu720 725 730 735tgt gcc aag gac aac ggc ggg tgt cag cat gag tgc gtc aac acc ttc 2617Cys Ala Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Phe740 745 750ggg agc tac ctg tgc agg tgc aga aac ggc tac tgg ctc cac gag aat 2665Gly Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Trp Leu His Glu Asn755 760 765ggg cat gac tgc aaa gag gct ggc tgt gca cac aag atc agc agt gtg 2713Gly His Asp Cys Lys Glu Ala Gly Cys Ala His Lys Ile Ser Ser Val770 775 780gag ggg acc ctg gcg agc ccc aac tgg cct gac aaa tac ccc agc cgg 2761Glu Gly Thr Leu Ala Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg785 790 795agg gag tgt acc tgg aac atc tct tcg act gca ggc cac aga gtg aaa 2809Arg Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys800 805 810 815ctc acc ttt aat gag ttt gag atc gag cag cac cag gaa tgt gcc tat 2857Leu Thr Phe Asn Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr820 825 830gac cac ctg gaa atg tat gac ggg ccg gac agc ctg gcc ccc att ctg 2905Asp His Leu Glu Met Tyr Asp Gly Pro Asp Ser Leu Ala Pro Ile Leu835 840 845ggc cgt ttc tgc ggc agc aag aaa cca gac ccc acg gtg gct tcc ggc 2953Gly Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Thr Val Ala Ser Gly
850 855 860agc agt atg ttt ctc agg ttt tat tcg gat gcc tca gtg cag agg aaa 3001Ser Ser Met Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys865 870 875ggc ttc cag gca gtg cac agc aca gag tgc ggg ggc agg ctg aag gct 3049Gly Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala880 885 890 895gaa gtg cag acc aaa gag ctc tat tcc cac gcc cag ttt ggg gac aac 3097Glu Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn900 905 910aac tac ccg agc gag gcc cgc tgt gac tgg gtg atc gtg gca gag gac 3145Asn Tyr Pro Ser Glu Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp915 920 925ggc tac ggc gtg gag ctg aca ttc cgg acc ttt gag gtt gag gag gag 3193Gly Tyr Gly Val Glu Leu Thr Phe Arg Thr Phe Glu Val Glu Glu Glu930 935 940gcc gac tgc ggc tac gac tac atg gaa gcc tac gac ggc tac gac agc 3241Ala Asp Cys Gly Tyr Asp Tyr Met Glu Ala Tyr Asp Gly Tyr Asp Ser945 950 955tca gcg ccc agg ctc ggc cgc ttc tgt ggc tct ggg cca tta gaa gaa 3289Ser Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu960 965 970 975atc tac tct gca ggt gat tcc ctg atg att cga ttc cgc aca gat gac 3337Ile Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe Arg Thr Asp Asp980 985 990acc atc aac aag aaa ggc ttt cat gcc cga tac acc agc acc aag ttc 3385Thr Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe99510001005cag gat gcc ctg cac atg aag aaa tag tgctgatgtt cttgaaagac 3432Gln Asp Ala Leu His Met Lys Lys10101015agaaactgag aatttttttg ttttgttttg tttttaacaa caatagcacc ttgaaaatct 3492gccctaaaac agtgtacagt atttttctca aacaaaaact cagaatccag ccttagaggt 3552atatatttga atgaaagtct tgtaagtttg gccaacaagg tggagaaaaa aatgttcttt 3612tgcttctgtc tgcaatgttg tcattcatga actgttaaag tgttaaagat taggattgga 3672gtcactgacc attccggcta tgcttcttca taccattctc cttgttgtcc cttgctccta 3732tgtggcaaaa ggtcagcctt ggggttggcc gttcctctaa tctggacttg cttgcaaagg 3792tgccaggctg tcttctgtcc atgttgggca taagggatga aaacttggcc gagactaatg 3852tgtggcccac agctttggct ggaatcattt tctttctctc tgccagggac atgtcaacca 3912agaaacctga aaatatggat ggatgtcagg actaaaaaaa ggcatcacag tgagcagtga 3972gcacagaggg agtttcgagt ataagaatca ttgtcatgaa gttaggagac cacaaagcca 4032tttctcagag tcattcactc tccttgtccc tttggtttcc ccccttcctt aattgcagtg 4092ggggctaagg tatccattat gaatacagca gaacatttgc tggcgagagt cctgtctgct 4152gagaagacaa tattgtggct cgtcctgata ttttttcatt cattgacttt gagaagactc 4212cacctgtgct tggaattcca tgggcttcaa agaacatttc ttcttttagc tttggaggca 4272cttgccgtgg cacacctgga ctccttgaca tccaattcaa actgcatttg caaaatgtgc 4332aaagacctct tatgagggac caattcaggt cccttatggg gtgaacactg ttgaagactg 4392gttaattata agttatgtaa gaatcatcgc cttgtggaac aagtcaatca gtgactagct 4452tcctgtagcc aatcaggtta aagagggcgt tggtaatttt gttctgattt aactagtatt 4512caatcaccaa cttgcaaaca gaattcataa cacttggcac ttgttctaga gaagtgtaga 4572ggatgatgtt aacataattt tagcacttca aggtataatt taaacagtga ggtagttttg 4632aatggcattt cattaaggca tctatgggca ttatgagcta aaagctgtgg tatgttagct 4692ttaaaagagt atttatgttg gaataatttt taaataatgt ttacataact gtaagtcctg 4752tttggttgtt gttggacgca gggcggcaca tgagtgtttt tggttagagc caagatagct 4812cccatgcacc ggaattcctt tgggatgaat cagcatcatt ttaaacaaag tatatgtaaa 4872aggtgaaagg ttatattttt tacagatcag aatgtggcac cagaggactg tgtctcatta 4932aagtgattgc tgggagcaaa aactagaatg atacaaagaa aggtcagaga aatgcatggg 4992aatatttttt ctttaaaaaa aaaaaaaaa 5021<210>2<211>1015<212>蛋白质<213>人<400>2Met Pro Arg Ala Thr Ala Leu Gly Ala Leu Val Ser Leu Leu Leu Leu1 5 10 15Leu Pro Leu Pro Arg Gly Ala Gly Gly Leu Gly Glu Arg Pro Asp Ala20 25 30Thr Ala Asp Tyr Ser Glu Leu Asp Gly Glu Glu Gly Thr Glu Gln Gln35 40 45Leu Glu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp50 55 60Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys Ala65 70 75 80Arg Asp Trp Thr Lys Gln Thr Val Gly Ala Thr Gly His Ser Thr Gly85 90 95Gly Leu Glu Glu Gln Ala Ser Glu Ser Ser Pro Asp Thr Thr Ala Met100 105 110Asp Thr Gly Thr Lys Glu Ala Gly Lys Asp Gly Arg Glu Asn Thr Thr115 120 125Leu Leu His Ser Pro Gly Thr Leu His Ala Ala Ala Lys Thr Phe Ser130 135 140Pro Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro145 150 155 160Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln165 170 175Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys180 185 190Val Thr Phe Ile Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser195 200 205Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly210 215 220Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val225 230 235 240Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg245 250 255Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro260 265 270Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser275 280 285Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn290 295 300Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Gln Asp305 310 315 320Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln325 330 335Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly340 345 350Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro355 360 365Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr370 375 380Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Ser Met Asp Leu Phe Lys385 390 395 400Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Tyr Trp405 410 415Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu420 425 430Pro Leu Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser435 440 445Ser Asn Ile Leu Gly Lys Gly Phe Phe Ala Ala Tyr Glu Ala Thr Cys450 455 460Gly Gly Asp Met Asn Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr465 470 475 480Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val485 490 495Ser Glu Gly Phe His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile Glu500 505 510Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Pro515 520 525Thr Glu Glu Ser Ala Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro530 535 540Glu Asp Val Lys Ser Ser Ser Asn Arg Leu Trp Met Lys Phe Val Ser545 550 555 560Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu565 570 575Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu His Arg Cys580 585 590Val Asn Thr Leu Gly Ser Tyr Lys Cys Ala Cys Asp Pro Gly Tyr Glu595 600 605Leu Ala Ala Asp Lys Lys Met Cys Glu Val Ala Cys Gly Gly Phe Ile610 615 620Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr625 630 635 640Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Ala Gln Tyr645 650 655Arg Ile Ser Leu Gln Phe Glu Val Phe Glu Leu Glu Gly Asn Asp Val660 665 670Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala675 680 685Lys Leu His Gly Arg Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr690 695 700Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val705 710 715 720Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys725 730 735Ala Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Phe Gly740 745 750Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Trp Leu His Glu Asn Gly755 760 765His Asp Cys Lys Glu Ala Gly Cys Ala His Lys Ile Ser Ser Val Glu770 775 780Gly Thr Leu Ala Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Arg785 790 795 800Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Leu805 810 815Thr Phe Asn Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp820 825 830His Leu Glu Met Tyr Asp Gly Pro Asp Ser Leu Ala Pro Ile Leu Gly
835 840 845Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Thr Val Ala Ser Gly Ser850 855 860Ser Met Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly865 870 875 880Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu885 890 895Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn900 905 910Tyr Pro Ser Glu Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly915 920 925Tyr Gly Val Glu Leu Thr Phe Arg Thr Phe Glu Val Glu Glu Glu Ala930 935 940Asp Cys Gly Tyr Asp Tyr Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser945 950 955 960Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile965 970 975Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe Arg Thr Asp Asp Thr980 985 990Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln99510001005Asp Ala Leu His Met Lys Lys10101015<210>3<211>4661<212>DNA<213>小鼠<220><221>CDS<222>(191)..(3229)<400>3agtcgtgttt agcagcggct tcccgggtgt ccaggccgga cgagaacgcc ttactgggct 60tgcttggtac cctaccggtg cctggcagcc aagcagcagc caccacaacc gaccctgtac 120gtggtgtctc tctggatccg agctttctgt gcaggttaag tccctcgggc cccgccgacc 180ccttgccact atg ccc ctt gcg acc act ctt ggc acc ctg gtg cta ctg 229Met Pro Leu Ala Thr Thr Leu Gly Thr Leu Val Leu Leu1 5 10ttg ctg cta ccg ctg ccc cgc ggt gct gaa gtg act ggg gac cat tcg 277Leu Leu Leu Pro Leu Pro Arg Gly Ala Glu Val Thr Gly Asp His Ser15 20 25aat gtc gcc ttg gac tac gga gcc ttg gaa ggc gag gag ggc acg gag 325Asn Val Ala Leu Asp Tyr Gly Ala Leu Glu Gly Glu Glu Gly Thr Glu30 35 40 45cag cag ctg cat tac cac gac ccc tgc aaa gct gct gtc ttc tgg gga 373Gln Gln Leu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly50 55 60gat att gct ctg gat gaa gat gat ctc aag tta ttt cac atc gac aag 421Asp Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys65 70 75gct gag gac tgg acc aag cca tcc att gac aaa cca gga cat gac act 469Ala Glu Asp Trp Thr Lys Pro Ser Ile Asp Lys Pro Gly His Asp Thr80 85 90gga ggc ctt gag gag aca tct gca agg tgg cca aac gat aca gcc tct 517Gly Gly Leu Glu Glu Thr Ser Ala Arg Trp Pro Asn Asp Thr Ala Ser95 100 105aac gcc agc atc cag gca cca aga aag gat ggc aag gat gcc acc aca 565Asn Ala Ser Ile Gln Ala Pro Arg Lys Asp Gly Lys Asp Ala Thr Thr110 115 120 125ttt ctg cct aac cct ggg acc tca aac acc acc gct aag acc ttc tct 613Phe Leu Pro Asn Pro Gly Thr Ser Asn Thr Thr Ala Lys Thr Phe Ser130 135 140gct cga gtt cga aga gct aca acc tca agg aca gag cgg att tgg cct 661Ala Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro145 150 155gga ggg gtc att cct tat gtc att gga gga aac ttt act ggt acc cag 709Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Thr Gln160 165 170agg gcc att ttc aaa cag gcc atg agg cac tgg gag aag cac acc tgt 757Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys175 180 185gtg acc ttc gta gag agg aca gat gag gaa agc ttc att gta ttc agt 805Val Thr Phe Val Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser190 195 200 205tac agg acc tgt ggt tgt tgt tcc tac gtg gga cgc cga gga ggt ggc 853Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly210 215 220ccg cag gcc ata tcc atc ggg aaa aac tgt gac aag ttc ggc att gtg 901Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val225 230 235gct cac gag ctg ggc cat gtg gtt ggg ttc tgg cat gaa cac act cgg 949Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg240 245 250cca gac cga gac caa cat gtc acc atc atc aga gaa aac atc cag cca 997Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro255 260 265ggt cag gag tat aat ttc tta aaa atg gaa gcc ggc gag gtg agc tct 1045Gly Gln Glu Tyr Ash Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser270 275 280 285ctg gga gag acc tac gac ttc gac agc atc atg cac tat gcc cgg aac 1093Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn290 295 300acc ttc tca aga gga gtt ttc tta gac acc atc ctc ccc cgt cga gac 1141Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Arg Asp305 310 315gac aat ggc gtc agg cca acc att ggc caa cgc gtg cgg crc agt cag 1189Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln320 325 330gga gat ata gct caa gcc agg aag ctg tac aaa tgc cca gca tgt ggg 1237Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly335 340 345gag aca cta cag gac acg aca gga aac ttt tcg gca cct ggt ttc cca 1285Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro350 355 360 365aat ggc tac ccc tcc tat tcc cac tgc gtc tgg agg atc tcc gtc acc 1333Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr370 375 380cca ggg gaa aag atc atc cta aat ttc acc tcc atg gat ttg ttt aag 1381Pro Gly Glu Lys Ile Ile Leu Asn Phe Thr Ser Met Asp Leu Phe Lys385 390 395agc cgc ctg tgc tgg tac gat tac gtg gag atc cgg gat ggt tac tgg 1429Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Ile Arg Asp Gly Tyr Trp400 405 410aga aag gcc ccc ctg ttg ggg agg ttc tgt ggc gat aag ata cct gag 1477Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu415 420 425tcc ctt gtc tcc tcg gac agc cgg ctc tgg gtg gaa ttc cgt agc agc 1525Ser Leu Val Ser Ser Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser430 435 440 445agc agc agc ctg ggc aaa ggc ttc ttt gct gta tat gaa gcc atg tgt 1573Ser Ser Ser Leu Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Met Cys450 455 460ggg gga gac ata acc aaa gat gca ggc cag att cag tct ccc aac tac 1621Gly Gly Asp Ile Thr Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr465 470 475cct gac gac tac aga cct tcc aag gaa tgt gtg tgg agg atc aca gtg 1669Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val480 485 490ccc gac ggg ttc cat gtg gga ctt acc ttc cag tcc ttc gag atc gaa 1717Pro Asp Gly Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu495 500 505agg cat gac agt tgt gca tat gac tat ctg gaa atc cga gac ggt ccc 1765Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Ile Arg Asp Gly Pro510 515 520 525aca gag gac agc acc ctg att ggc cac ttc tgt ggc tac gag aag ccg 1813Thr Glu Asp Ser Thr Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro530 535 540gag gcc gtg aaa tcc agc gct aac cga ctg tgg gtg aag ttt gtg tcc 1861Glu Ala Val Lys Ser Ser Ala Asn Arg Leu Trp Val Lys Phe Val Ser545 550 555gac ggc tcc atc aat aaa gcg ggc ttt gca gcc aat ttc ttc aag gag 1909Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu560 565 570gtg gat gag tgc tcc tgg cca gac cat ggt gga tgt gag cag cgc tgt 1957Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu Gln Arg Cys575 580 585gta aac aca ctc ggc agc tac acg tgt gcc tgt gac cct ggc tac gaa 2005Val Asn Thr Leu Gly Ser Tyr Thr Cys Ala Cys Asp Pro Gly Tyr Glu590 595 600 605ctg gct gcc gac aag aag aca tgt gaa gtg gcc tgt ggt ggc ttc att 2053Leu Ala Ala Asp Lys Lys Thr Cys Glu Val Ala Cys Gly Gly Phe Ile610 615 620acc aag cta aac ggc acc atc acc agc cct gga tgg ccg aag gag tat 2101Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr625 630 635ccc acc aac aag aac tgt gtc tgg cag gtg gtg gct ccc gtg cag tac 2149Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Val Gln Tyr640 645 650cgc atc tca ctg cag ttc gaa gcc ttt gag ctg gaa ggc aat gac gtc 2197Arg Ile Ser Leu Gln Phe Glu Ala Phe Glu Leu Glu Gly Asn Asp Val655 660 665tgt aag tat gac ttc gta gag gtg cgc agt ggc ctg tcc cca gat gcc 2245Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala670 675 680 685aag ctt cac ggc aaa ttc tgt ggc tcc gag acc ccg gag gtc atc aca 2293Lys Leu His Gly Lys Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr690 695 700tcg cag agc aac aac atg cga gtg gaa ttc aag tct gac aac acc gtc 2341Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val705 710 715tcc aag cga ggc ttc agg gct cac ttc ttc tca gac aaa gac gag tgt 2389Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys720 725 730gcc aaa gac aat ggc ggc tgc cag cag gag tgt gtc aac acg ttc ggg 2437Ala Lys Asp Asn Gly Gly Cys Gln Gln Glu Cys Val Asn Thr Phe Gly735 740 745agt tac ctg tgc aga tgc agg aac ggg tac cga ctg cat gag aac gga 2485Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Arg Leu His Glu Asn Gly750 755 760 765cac gac tgc aaa gag gct ggc tgc gcc tac aag atc agc agt gca gag 2533His Asp Cys Lys Glu Ala Gly Cys Ala Tyr Lys Ile Ser Ser Ala Glu770 775 780ggg acc ctg atg agt cct aac tgg cca gac aaa tac ccc agc cgg aag 2581Gly Thr Leu Met Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys785 790 795gaa tgt acc tgg aac att tca tca acc gca ggc cac agg gtg aaa att 2629Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Ile800 805 810aca ttc agt gag ttc gag att gag cag cac cag gaa tgt gcc tat gac 2677Thr Phe Ser Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp815 820 825cac ctg gaa ctg tac gat ggg aca gac agc ttg gcc ccc arc ctt ggc 2725His Leu Glu Leu Tyr Asp Gly Thr Asp Ser Leu Ala Pro Ile Leu Gly830 835 840 845cgc ttc tgc ggc agc aag aag ccg gat ccc gtg gtg gcg aca ggc agc 2773Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Val Val Ala Thr Gly Ser850 855 860agc cta ttc ctc agg ttt tac tcg gac gcc tca gtg cag cgg aaa ggc 2821Ser Leu Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly865 870 875ttc cag gct gtg cac agc aca gag tgt ggg ggc agg ctg aag gct gaa 2869Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu880 885 890gta cag acc aaa gag ctc tat tcc cat gcc cag ttt ggg gac aac aac 2917Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn895 900 905tac ccg agc cag gcc cgc tgt gac tgg gtg ata gtg gca gaa gac ggt 2965Tyr Pro Ser Gln Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly910 915 920 925tat ggc gtg gag ctg ata ttc cgg acc ttt gaa gtt gag gag gaa gct 3013Tyr Gly Val Glu Leu Ile Phe Arg Thr Phe Glu Val Glu Glu Glu Ala930 935 940gac tgt ggc tac gac ttc atg gag gct tat gat ggg tac gac agc tcg 3061Asp Cys Gly Tyr Asp Phe Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser945 950 955gca ccc agg ctc ggc cgc ttc tgt ggc tca ggg cca tta gag gaa atc 3109Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile960 965 970tac tcc gcc gga gac tcg cta atg atc cgc ttc cac acg gac gac acc 3157Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe His Thr Asp Asp Thr975 980 985atc aac aag aaa ggc ttt cac gcc cgg tac act agc acc aag ttc caa 3205Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln990 99510001005gac gcc ttg cac atg agg aag tag cgcctcagtt ctggaaaggc agagagactg 3259Asp Ala Leu His Met Arg Lys1010agggtgtttt aaacacttgc gagtgagcag cctcccatgt acagtgtttt ttctccacaa 3319caaaaaccca aactatgttc ttgaaactct atatctgggt gacagtacat gcctttggcc 3379aacgggagga gagagagggg ccgttggttc tggctgtggc gttatcagtc gcagcttctg 3439gaggaggtca aagtttgatg ttagcgacca aacaggatga cttcttcaca tttgtctcta 3499agctttgctc ctgtggctcc gaaggccagc ctggggcaaa aggacagctt agggcaaaag 3559actgcctctc tctcaactct ggcccggctt ccatagatgg catgagccca gtgtgctggt 3619gacttggctg ccctctgact actgggcatg gaggattata gattggcagc ggcttcgctg 3679atactcgcag gtgtggctga acgcttctgt gcagttctac cagagtcaag ccaatcaaga 3739aaccggagac cgtggacacg agagttaagg tggcatccca gggcacaggg agggggctca 3799acctgggaac cacataatgg cgctggaaga ccttgagcat cttcctctgg ccctgcttgt 3859ccttgtcacc tctggggagc ccctgtcatc agtctccatt cagaaaggag aacccacggt 3919cactcctagc agaacattcg ctggcgagca cccccaggtt gctgagagga cgcctagctt 3979cacccaatat ttctcctctg ctcagaggct tagaagatga tgtcacctgc gctggggttc 4039ccagatgtca cctgggctgg ggttcccatg ggcttccagg aacctcccag ctgaaggcac 4099ctgctctggc gaacctcagc cgctggacag ccagttcaaa cagcatctgc gagacgtgtc 4159aagtcatctc aggaccaatc cacgtctcac tgggagaaaa ctagtaattc cacattatct 4219aagagccacc gtctctggaa caaggtggtc tgtggtacga ctcatgtaac cagacaggtt 4279agagtgcgtg gacggctttg ctgggattaa ccgggaccca gccgccctct tgcactcaga 4339attctcagca cccctgcact tgctctagcg gcgtgttaag ggtgatgttt acataatttt 4399agcacctcaa ggtataatcg aaatagtgag gtagttttga atggcatttc gttaaggcat 4459ctctgggcat tatgagctta aaagctgtgg tacgttagct ttctaagagc atttatgttg 4519gaatactttt aaaataatgt ttacattaac taactgcaag tcctgttggt tgggttggtg 4579gcaaacgcag ggcggcggca caggagactg ttgctgttag agatggcgta gctcccaagc 4639accagaatcc ctatgtgatc ta 4661<210>4<211>1012<212>蛋白质<213>小鼠<400>4Met Pro Leu Ala Thr Thr Leu Gly Thr Leu Val Leu Leu Leu Leu Leu1 5 10 15Pro Leu Pro Arg Gly Ala Glu Val Thr Gly Asp His Ser Asn Val Ala20 25 30Leu Asp Tyr Gly Ala Leu Glu Gly Glu Glu Gly Thr Glu Gln Gln Leu35 40 45His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala50 55 60Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys Ala Glu Asp65 70 75 80Trp Thr Lys Pro Ser Ile Asp Lys Pro Gly His Asp Thr Gly Gly Leu85 90 95Glu Glu Thr Ser Ala Arg Trp Pro Asn Asp Thr Ala Ser Asn Ala Ser100 105 110Ile Gln Ala Pro Arg Lys Asp Gly Lys Asp Ala Thr Thr Phe Leu Pro115 120 125Asn Pro Gly Thr Ser Asn Thr Thr Ala Lys Thr Phe Ser Ala Arg Val130 135 140Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly Val145 150 155 160Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Thr Gln Arg Ala Ile165 170 175Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr Phe180 185 190Val Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser Tyr Arg Thr195 200 205Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly Pro Gln Ala210 215 220Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Ala His Glu225 230 235 240Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg Pro Asp Arg245 250 255Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln Glu260 265 270Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser Leu Gly Glu275 280 285Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe Ser290 295 300Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Arg Asp Asp Asn Gly305 310 315 320Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln Gly Asp Ile325 330 335Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly Glu Thr Leu340 345 350Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro Asn Gly Tyr355 360 365Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr Pro Gly Glu370 375 380Lys Ile Ile Leu Asn Phe Thr Ser Met Asp Leu Phe Lys Ser Arg Leu385 390 395 400Cys Trp Tyr Asp Tyr Val Glu Ile Arg Asp Gly Tyr Trp Arg Lys Ala405 410 415Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu Ser Leu Val420 425 430Ser Ser Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser Ser Ser Ser435 440 445Leu Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Met Cys Gly Gly Asp450 455 460Ile Thr Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp Asp465 470 475 480Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val Pro Asp Gly485 490 495Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His Asp500 505 510Ser Cys Ala Tyr Asp Tyr Leu Glu Ile Arg Asp Gly Pro Thr Glu Asp515 520 525Ser Thr Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro Glu Ala Val530 535 540Lys Ser Ser Ala Asn Arg Leu Trp Val Lys Phe Val Ser Asp Gly Ser545 550 555 560Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Val Asp Glu565 570 575Cys Ser Trp Pro Asp His Gly Gly Cys Glu Gln Arg Cys Val Asn Thr580 585 590Leu Gly Ser Tyr Thr Cys Ala Cys Asp Pro Gly Tyr Glu Leu Ala Ala595 600 605Asp Lys Lys Thr Cys Glu Val Ala Cys Gly Gly Phe Ile Thr Lys Leu610 615 620Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr Pro Thr Asn625 630 635 640Lys Asn Cys Val Trp Gln Val Val Ala Pro Val Gln Tyr Arg Ile Ser645 650 655Leu Gln Phe Glu Ala Phe Glu Leu Glu Gly Asn Asp Val Cys Lys Tyr660 665 670Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala Lys Leu His675 680 685Gly Lys Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr Ser Gln Ser690 695 700Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val Ser Lys Arg705 710 715 720Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ala Lys Asp725 730 735Asn Gly Gly Cys Gln Gln Glu Cys Val Asn Thr Phe Gly Ser Tyr Leu740 745 750Cys Arg Cys Arg Asn Gly Tyr Arg Leu His Glu Asn Gly His Asp Cys755 760 765Lys Glu Ala Gly Cys Ala Tyr Lys Ile Ser Ser Ala Glu Gly Thr Leu770 775 780Met Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys Thr785 790 795 800Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Ile Thr Phe Ser805 810 815Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu Glu820 825 830Leu Tyr Asp Gly Thr Asp Ser Leu Ala Pro Ile Leu Gly Arg Phe Cys
835 840 845Gly Ser Lys Lys Pro Asp Pro Val Val Ala Thr Gly Ser Ser Leu Phe850 855 860Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln Ala865 870 875 880Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Val Gln Thr885 890 895Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro Ser900 905 910Gln Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly Tyr Gly Val915 920 925Glu Leu Ile Phe Arg Thr Phe Glu Val Glu Glu Glu Ala Asp Cys Gly930 935 940Tyr Asp Phe Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser Ala Pro Arg945 950 955 960Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile Tyr Ser Ala965 970 975Gly Asp Ser Leu Met Ile Arg Phe His Thr Asp Asp Thr Ile Asn Lys980 985 990Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln Asp Ala Leu99510001005His Met Arg Lys1010<210>5<211>20<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物1<400>5cargcmatgm gnactgggag20<210>6<211>21<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物2<400>6cargcmatgm gncactggga a 21<210>7<211>22<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物3<400>7gaadgtgttv ckngcrtart gc 22<210>8<211>27<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物4<400>8tgtggtgtct gggctgctct cagatgc 27<210>9<211>25<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物5<400>9actgtctgct tggtccagtc tctgg 25<210>10<211>27<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物6<400>10tacctggaag tccgggatgg ccccacg 27<210>11<211>28<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物7<400>11gaggatgtga aatcgagctc caacagac28<210>12<211>27<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物8-11<400>12raanccytty ttnnndatng trtcrtc 27<210>13<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物12<400>13caacaactac ccgagcgagg cccc24<210>14<211>26<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物12<400>14gaagcctacg acggctacga cagctc 26<210>15<211>25<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物14<400>15gctttcctca tctgtcctct ctacg 25<210>16<211>23<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物15<400>16cctgtgtgac cttcgtagag agg 23<210>17<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物16<400>17tgggagctga gcaatgctaa ctgc24<210>18<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物17<400>18gaaggtgttc cgggcgtagt gcat 2权利要求
1.一种分离的多核苷酸,它包含能在聚合酶链反应中扩增的核苷酸序列,该聚合酶链反应使用含有SEQ ID NO:7所示序列的第一简并扩增引物和含有选自SEQ IDNO:5和SEQ ID NO:6所示序列的第二简并扩增引物,其中多核苷酸不被ApaⅠ切割。
2.根据权利要求1所述的多核苷酸,其中多核苷酸可从人获得。
3.根据权利要求2所述的多核苷酸,它包含SEQ ID NO:1的核苷酸365至3409的序列。
4.根据权利要求3所述的多核苷酸,它包含SEQ ID NO:1的序列。
5.根据权利要求1所述的多核苷酸,其中多核苷酸可从小鼠获得。
6.根据权利要求5所述的多核苷酸,它包含SEQ ID NO:3的核苷酸191至3229的序列。
7.根据权利要求4所述的多核苷酸,它包含SEQ ID NO:3的序列。
8.一种基因构建物,它包含转录启动子以及与转录启动子操作性相连的多核苷酸,该多核苷酸包含能在聚合酶链反应中扩增的核苷酸序列,该聚合酶链反应使用含有SEQ ID NO:7所示序列的第一简并扩增引物和含有选自SEQ ID NO:5和SEQ IDNO:6所示序列的第二简并扩增引物,其中多核苷酸不被ApaⅠ切割。
9.根据权利要求8所述的基因构建物,其中多核苷酸可从人获得。
10.根据权利要求9所述的基因构建物,它包含SEQ ID NO:1的核苷酸365至3409的序列。
11.根据权利要求10所述的基因构建物,它包含SEQ ID NO:1的序列。
12.根据权利要求8所述的基因构建物,其中多核苷酸可从小鼠获得。
13.根据权利要求12所述的基因构建物,它包含SEQ ID NO:3的核苷酸191至3229的序列。
14.根据权利要求12所述的基因构建物,它包含SEQ ID NO:3的序列。
15.一种多肽,它含有选自SEQ ID NO:2和SEQ ID NO:4的序列。
16.一种选择调节mTll-2蛋白活性的试剂的方法,该方法包括下列步骤在支持mTll-2蛋白功能、有和没有一种或多种推定的活性调节剂的条件下,评价mTll-2蛋白的活性;和从一种或多种推定的调节剂中选出与没有试剂时的该蛋白质活性相比能调节该蛋白质活性的试剂。
全文摘要
本发明提供了编码与人或小鼠BMP-1/mTld不同且与人或小鼠mTll-1不同的特洛德样蛋自的哺乳动物基因。该基因在结构上与BMP-1家族成员的基因相似,但是在基因图谱中位于不同的位置,并编码了具有不同活性的不同蛋白。该基因编码的蛋白质可用来筛选抑制BMP-1家族基因活性以防止结疤、纤维变性等疾病的治疗剂。
文档编号C12N1/21GK1302332SQ9980654
公开日2001年7月4日 申请日期1999年4月2日 优先权日1998年4月3日
发明者D·S·格林斯潘, I·C·斯科特, C·L·托马斯 申请人:威斯康星校友研究基金会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1