人肿瘤抑制基因的制作方法

文档序号:968178阅读:796来源:国知局
专利名称:人肿瘤抑制基因的制作方法
技术领域
本发明涉及一种人肿瘤抑制基因,该基因的表达受生长因子处理所抑制,还涉及组成该基因的DNA以及该DNA编码的蛋白质。
由于重组生长激素(rhGH)刺激生长的作用,它在世界上已广泛用作治疗药物来治疗患GH分泌缺陷、Turner综合征或慢性肾病的儿童[Neely E.K.和Rosenfeld R.G.,Ann.Rev.Med.,45407-420(1994)]。另外,由于它表现出各种生理效应,因此预计GH在例如脂质代谢、蛋白质组成代谢、骨质疏松和造血以及更广泛地在衰老上有更广的药物用途。
高等动物具有大约100000个基因,其中约15%在细胞内表达并控制生命活动的所有过程(即发育、增殖、分化、体内环境稳定、细胞周期调节等)。这些基因的表达对蛋白合成的调节主要是在转录(mRNA)和翻译水平上,而且认为GH与这些功能紧密相关。
另一方面,通过对肿瘤(由细胞异常增殖引起)的研究,在70年代提出存在肿瘤基因,然后Hanabusa等人首次鉴定了一种肿瘤基因v-src。后来,通过分析遗传性肿瘤,发现了各种肿瘤抑制基因,这些基因的抑制是引起肿瘤的原因,而且也已积累了许多证据表明某些肿瘤的进展受到抑制细胞增殖的肿瘤抑制基因所抑制。
通常测定肿瘤抑制基因的标准是(1)在肿瘤两个等位基因中发现点突变和缺失,和(2)在遗传性肿瘤高发病率的癌家族中,在含有一个等位基因的生殖细胞中发现了突变。肿瘤抑制基因的特征在于其功能的丧失会导致癌发生。
已经表明,在癌的发展和进展中,涉及到一系列基因突变,包括由于基因缺失或突变引起的肿瘤基因的激活和肿瘤抑制基因的灭活[Schmandt,R.等人,Clin.Chem.,392375-2385(1993)]。通过肿瘤抑制基因的鉴定以及表明许多肿瘤细胞中缺少正常等位基因的证据积累,肿瘤抑制基因在生理上的重要性已经得到认同[Knudson,A.G.等人,Proc.Natl.Acad.Sci.9010914-10921(1993)]。
目前已经发现了10个以上的主要肿瘤抑制基因,它们包括RB1基因(其突变导致成视网膜细胞瘤[Friend,S.H.等人,Proc.Natl.Acad.Sci.USA 849059-9063(1987)])、p53基因(导致结肠癌[Lane,D.P.等人,Nature,278261-263(1979)])和WTI基因(导致Wilms肿瘤[Call,K.M.等人,Cell,60509-520(1990)])。
最近,进行了许多研究来弄清某些类型肿瘤与染色体13q缺失之间的关系。借助于不同的多态性DNA标记,限制性片段长度多态性(RFLP)已经能检测染色体特定区域中等位基因的缺失(例如杂合性的丧失(LOH))。
在前列腺、卵巢、子宫颈、结肠、输尿管和乳腺肿瘤中观察到染色体13q12上缺失了等位基因[Gudmundsson,J.等人,Cancer Res.,554830-4832(1995)]。例如,两种癌敏感型基因(染色体17q21上的BRCA1和染色体13q12上的BRCA2)被认为是导致具有多起女性早发性乳房癌病例的美国家庭中约80%乳房癌病例的原因[Gayther,S.A.等人,Mol.Med.-Today,3168-174(1997)]。然而,该数字只是针对美国人群获得的,预计其它国家将有所不同。例如,在芬兰乳房癌家庭中,由BRCA1和BRCA2基因突变引起的总共只占21%[Verhmanen,P.等人,Hum.Mol.Genet.,62309-2315(1997)]。这些数据表明其它一些乳房和乳房-卵巢癌易感基因可能是重要的,预计它们中的一些在染色体13q12-13q13上[Van Den Berg J.,等人,Br.J.Cancer,741615-1619(1996)]。
在许多类型的人肺癌中发现染色体13(包括染色体13q12)缺失,这些肺癌例如是小细胞癌[Yokota,J.等人,Proc.Natl.Acad.Sci.USA,849252-9256(1987)]、鳞状细胞癌、大细胞癌和腺癌[Weston,A.等人,Proc.Natl.Acad.Sci.USA,865099-5103(1989)]。然而,由于染色体13的延伸区丢失,不可能对出问题的基因座精确定点。对于非小细胞肺癌获得了准确得多的数据表明特异性地丧失13q12[Virmani,A.K.等人,Gene Chromosome Cancer,21308-319(1998)]。另外,预计该区域中还存在着一些未知的肿瘤抑制基因[Tamura,K.等人,Int.J.Cancer,7445-49(1997)]。
在67%的肝细胞癌中(不论乙型肝炎病毒是阳性还是阴性)[Jacob,A.N.等人,Oncogene,13213-221(1996),Walker,G.J.等人,Cancer Res.,514367-4370(1991)],在头颈鳞状细胞癌中(据信是由于其它还未鉴定的位于染色体13q、特别是13q12上的肿瘤抑制基因的缺失引起的)[Kirkpatrick,H.等人,Oncogene,142189-2193(1997)],在胰癌[Schutte,M.等人,Proc.Natl.Acad.Sci.USA 925950-5954(1995)]和腺癌[Jacob,A.N.等人,Oncogene,13213-221(1996)]中,在垂体腺瘤中(反映具有预后标记的潜在价值的侵蚀型生物活性)[Pearce,S.H.等人,Clin.Endocrinol.(Oxf.),45195-200(1996),Bates,A.S.等人,J.Clin.Endocrinol.Metab.,82818-824(1997)],在甲状旁腺腺瘤中[Pearce,S.H.等人,Clin.Endocrinol.(Oxf.),45195-200(1996),Yoshimoto,K.等人,Clin.Endocrinol.(Oxf.),4867-72(1998)],在脂肪瘤中[Mandahl,N.等人,J.Cancer Res.Clin.Oncol.,120707-711(1994),Sreekantaiah,C.等人,Cancer Genet.Gytogenet.,39281-288(1989)],均发现染色体13Q12基因座明显缺失。
对于下述某些血癌获得了与染色体13q12丧失相关的进一步的资料多发性骨髓瘤和浆细胞性白血病[Avet-Loiseau,H.等人,Genes Chromosomes Cancer,19124-133(1997)]、骨髓增生性肿瘤[Still,I.H.等人,Ann.Hum.-Genet.,61(Pt1)15-24(1997)]和与T-细胞白血病/淋巴瘤以及外周血液嗜酸细胞增多症相关的非特异性骨髓增生性疾病[Still,I.H.等人,Blood,903136-3141(1997)]、慢性成淋巴细胞白血病[Garcia-Marco,J.A.等人,Cancer Genet.Cytogenet.,9452-58(1997),Garcia-Marco,J.A.等人,Blood,881568-1575(1996),Catovsky,D.,Hematol.Cell Ther.,39 Suppl.1S5-S11(1997),Garcia-Marco,J.A.等人,Br.J.Haematol.,99708-709(1997)]。这些文献中有一些预示了新的肿瘤抑制基因位于染色体13q12上[Garcia-Marco,J.A.等人,Cancer Genet.Cytogenet.,9452-58(1997),Garcia-Marco,J.A.等人,Blood,881568-1575(1996),Catovsky,D.,Hematol.Cell Ther.,39 Suppl.1S5-S11(1997)]。
预计这些肿瘤抑制基因在生物种属中是保守的,参与调节细胞增殖和凋亡,肿瘤抑制基因的许多产物在调节细胞周期中起作用。因此,已经揭示肿瘤抑制基因产物与细胞粘附蛋白、信号引导分子、转录因子、细胞周期调节分子或凋亡调节分子有关。
另一方面,最近的基因分析表明,约80%的人基因与黑尾果蝇(Drosophilamelanogaster)同源,预计果蝇是在分子水平研究人肿瘤发展的很好的模型[Cookson,C.,Financial Times,1997年6月14日]。包含果蝇基因组的基因数约为10,000。尽管该数目低于人所含基因组的基因数(即约100000),但是认为人基因与昆虫基因是相似的,因为大多数人基因是多样的衍生的基因。许多蛋白及其结构域和整个复合物以及各种代谢和信号转导系统在人和果蝇之间是保守的[Artavanis-Tsakonas S.等人,Science,268225-232(1995)]。
另外,已发现黑尾果蝇产生的肿瘤具有人肿瘤的共同特征,且黑尾果蝇的肿瘤基因和肿瘤抑制基因与人的肿瘤基因和肿瘤抑制基因同源[Miklos,G.L.G.和Rubin,G.M.,Cell,86521-529(1996)]。因此,采用黑尾果蝇基因数据的方法提供了搜寻新基因的强大工具[Tian Xu,等人,Developments,1211053-1063(1995)]。
在上述背景下,本发明的目的是提供一种新的共基因表达受人生长激素等抑制的人肿瘤抑制基因,组成该基因的DNA以及由该基因编码的蛋白。
如下文所要描述的,在采用家兔软骨细胞的研究中,本发明者发现某些基因的表达受到生长因子(如生长激素GH)的抑制,并在分离后检查和鉴定了该基因。结果是,本发明者得出结论,该基因可能是一种新的肿瘤抑制基因,因此是到了本发明。
因此,本发明提供了具有序列表中SEQ ID NO1或SEQ ID NO2所示核苷酸序列的DNA。
另外,本发明提供了构成一种人基因的DNA,该基因的表达受到生长因子的抑制,该DNA具有序列表中SEQ ID NO1或SEQ ID NO2所示核苷酸序列或是相对于此二者任一所述核苷酸序列有一个或多个碱基缺失、替代或增加的核苷酸序列。
另外,本发明提供了构成所述人基因的DNA,其中生长因子是人生长激素或胰岛素样生长因子-1。
另外,本发明提供了构成一种人基因的DNA,该人基因编码肿瘤抑制蛋白,具有序列表中SEQ ID NO1或SEQ ID NO2所示核苷酸序列或是相对于此二者任一所述核苷酸序列有一个或多个碱基缺失、替代或增加的核苷酸序列。
另外,本发明提供了具有序列表中SEQ ID NO3或SEQ ID NO4所示氨基酸序列的蛋白质。
另外,本发明提供了其表达受生长因子抑制的蛋白,该蛋白具有序列表中SEQ IDNO3或SEQ ID NO4所示氨基酸序列或是相对于此二者任一所述氨基酸序列有一个或多个氨基酸缺失、替代或增加的氨基酸序列。
另外,本发明提供了上述蛋白质,其中生长因子是人生长激素或胰岛素样生长因子-1。
另外,本发明提供了一种肿瘤抑制蛋白,该蛋白具有序列表中SEQ ID NO3或SEQ ID NO4所示氨基酸序列或是相对于此二者任一所述氨基酸序列有一个或多个缺失、替代或增加的氨基酸序列。
另外,本发明提供了一种DNA,该DNA包含编码具有前述氨基酸序列的一种蛋白的核苷酸序列。
另外,本发明提供了一种探针,该探针包含与组成前述核苷酸序列之一的DNA杂交的DNA。
另外,本发明提供了一种重组载体,该载体包括组成前述一种核苷酸序列的DNA。
另外,本发明提供了一种DNA片段,该片段用作引物,并由前述一种核苷酸序列的部分序列组成。
另外,本发明提供了一种人用诊断性药物制剂,该制剂包含前述探针。诊断性药物制剂可用于侏儒症、巨人症、肢端肥大症、血管病、糖尿病性肾病、或心脏病或恶性肿瘤(包括白血病),以检查受到生长因子抑制的肿瘤抑制基因的表达。
另外,本发明提供了含有前述蛋白之一的抗肿瘤药物制剂。
另外,本发明提供了针对前述蛋白之一的多克隆或单克隆抗体。
另外,本发明提供了含有前述一种抗体的诊断性药物制剂来检查肿瘤抑制基因的表达。
因此,构成本发明基因的DNA、它们的转录物mRNA及其翻译的蛋白可用作心脏病、血管病、糖尿病性肾病和恶性肿瘤(如乳房癌、肾腺癌、结肠直肠癌和白血病)的治疗、诊断和预防药物,这些疾病在诸如巨人症/肢端肥大症中因生长激素分泌过多或侏儒症中给予过多生长激素的情况下由水平升高的生长激素或IGF-1所诱生。
对84个散发性、家族性和遗传性乳房癌原发性肿瘤样品中的LOH进行了分析。结果,在34%的肿瘤样品中发现LOH在BRCA2(乳房癌易感基因)区域内,在27%的样品中发现LOH在RB1区域内。然而发现只有7%的肿瘤LOH选择性地位于BRAC2中LOH选择性位于RB1内也只有7%。
另外,证实了一些肿瘤有限制性缺失图形,这提示在BRCA2的邻近和远端都有额外的肿瘤抑制基因。还提示了BRCA2内的LOH和早期复发与死亡之间有着非常显著的且独立的关系。结果表明,13q12-13q13区域内的一个或多个肿瘤抑制基因的灭活,赋予了肿瘤生长的强烈潜在可能,并导致家族性和散发性乳房癌的不良预后。
利用mRNA差别性显示和PCR选择cDNA扣除法,本发明者主要试图检测受生长激素调节的基因,从而证明家兔软骨细胞中存在受生长激素调节的基因。因此,利用mRNA差别性显示,发现电泳条带N119受到生长激素处理的抑制。切下该条带,抽提其中所含DNA,克隆并测序。发现该DNA片段只有219碱基长,没有发现其与已知基因或EST(表达的序列标记)有有意义的同源性。对应于条带N119的DNA与对应于条带N62、71、111和112的DNA同源。因此,将这5条条带的DNA归为一个同源簇HCD10,而感兴趣的家兔基因命名为HCD10(119)。除了发现生长激素的抑制作用外,还发现HCD10(119)基因的转录由伴刀豆球蛋白A激活。
用5′-RACE(5′-cDNA末端的快速扩增)方法克隆编码HCD10(119)蛋白的基因的一部分。对该基因的2.5kb片段作DNA测序,发现其与黑尾果蝇warts肿瘤抑制基因同源。
另外,在本研究中,在用家兔软骨细胞的实验中发现,某些基因的表达受生长激素(GH)抑制。根据这些资料,本发明者预计存在一种表达受GH抑制的肿瘤抑制基因(GHTSG受生长激素抑制的肿瘤抑制基因),并继续进行了调查。
然后,在采用2.5kb家兔HCD10(119)基因片段的DNA序列作BLAST搜寻中,本发明者发现了一些人EST,并用DNASIS(Hitachi Software Engineering Co.Ltd.)将它们编译成人类似物的推测性1.65kb区域(hGHITS人生长激素抑制的肿瘤抑制基因)。不幸的是,用该方法不能获得可靠的基因序列。因为EST基本上是不准确的[Sudo,K.等人,Genomics,24276-279(1994),Frigeno,J.-M.,Hum.Mol.Genet.4(1)37-43(1995),Lanfranchi,G.等人,Genome Research,635-42(1996)]。然后,偿试了用一组引物测序。
用OLIGO(一种分析引物的软件购自National Bioscience,Inc.)设计覆盖1.65kb人DNA片段的5个正向引物和5个反向引物,在PCR中用通用cDNA文库作为模板,采用下列7组引物1)H119U142+H119L739,2)H119U142+H119L1048,3)H119U142+H119L1499,4)H119U736+H119L1048,5)H119U736+H119L1499,6)H119U782+H119L1048,和7)H119U782+H119L1499。
最后,选择引物组1)和7),因为它们产生了在表观上大小合适最适于用作杂交探针的DNA条带。
用组1和组7为引物,一组14个分离的cDNA文库作为模板,反复进行PCR。根据所得结果,选择了人肺cDNA文库(λgt10),因为用任何一对引物对其扩增均产生了强的DNA条带。
将如此获得的DNA条带克隆到质粒载体(pMOSBlueAmersham)中,由于DNA测序确认了它们的真实性,因此用下述方法产生特异性杂交探针使携带各自质粒的大肠杆菌菌株生长,纯化质粒DNA,用EcoRI和SalI限制性酶对它们进行消化,电泳分离DNA片段,纯化DNA插入物。
回收携带hGHITS基因不同区域的17个噬菌体克隆。纯化它们的DNA,重新克隆到质粒载体(pUC18Pharmacia)中并测序。重新构建4892碱基的核苷酸序列,但是缺少全长基因的5′和3′端。
用OLIGO设计该核苷酸序列两个末端的引物对引物对H3111U13和H311L320用于5′区,引物对H316U39和H319L498用于基因的3′区。用这些引物扩增克隆的噬菌体DNA片段产生PCR产物,用琼脂糖凝胶电泳分离。然后不进行克隆将它们直接用作探针。回收获得13个与5′探针杂交的噬菌体克隆和12个与3′探针杂交的噬菌体克隆,并进行分析。
分析这些噬菌体克隆表明,存在两个可能有功能的等位基因。装配成全长5486碱基的核苷酸序列hGHITS1(序列表中SEQ ID NO1)和hGHITS2(SEQ ID NO2)。推导出分别对应于hGHITS1和hGHITS2编码区的1088氨基酸残基序列组成的蛋白质(SEQ ID NO3和SEQ ID NO4)。在这些核苷酸序列的蛋白编码区中发现三处不同hGHITS1等位基因在核苷酸第467位携带"g"(因而氨基酸27是Lys),在1357位携带"c"(因而氨基酸324是Ala),在1473位是"g"(因此,氨基酸363是Gly),而hGHITS2等位基因在核苷酸第467位携带"a"(氨基酸没有改变),在1357位携带"t"(因而氨基酸324是Val),在1473位是"a"(氨基酸363是Ser)。这些序列之间的三处不同属于正常/突变类型目前还未确定。
根据PSORT分析,最有可能的是该蛋白是一种酶并位于细胞核内,氨基酸60和61之间可能有断裂位点。
用BLASTP搜寻法,将hGHITS蛋白的氨基酸序列与已知的多肽序列相比较。果蝇肿瘤抑制基因warts[Justice R.W.等人,Genes & Dev.,9534-546(1995)](也称为基因"lats"Xu,T.等人,Development,1211053-1063(1995))显示出与hGHITS基因的同源性最高。用"GeneStream align"将hGHITS和warts基因作序列对比,结果清晰地表明在该酶的C端有显著的同源性。MOTIF(基序)搜寻揭示有8个基序位于与果蝇warts基因(也是一种蛋白激酶)高度同源的区域内,包括丝氨酸/苏氨酸蛋白激酶活性位点特征和蛋白激酶ATP结合区域特征(signature)。
众所周知的是,与家族其它成员差异有限的蛋白激酶催化结构域预计在细胞生理学中起类似的作用[Hanks,S.K.等人,Science 24142-52(1988)]。另一方面,已经分离出黑尾果蝇肿瘤抑制基因的人同源物,并表明其在功能上是保守的[Maie,A.R.St.J.%Xu.T.,Am.J.Hum.Genet.,611006-1010(1997)]。黑尾果蝇肿瘤抑制基因warts是细胞正常生长以及维持其正常形态所必需的。该基因被认为是一种肿瘤抑制基因,因为发现它的丧失会导致异常增殖,它类似于人肌肉营养不良激酶。这些事实强有力地支持这样一个观点,即hGHITS是一种肿瘤抑制基因。
hGHITS表现出与称为DRES7的1053bp长的EST的同源性最高。DRES7位于13q12基因座[GenBank Accession U69566]。然而,在染色体该区域中已经发现另外两个肿瘤抑制基因乳房癌易感(BRCA2)基因位于染色体13q12[Wooster,R.等人,Science,2652088-2099(1994)],和成视网膜细胞瘤(RB1)基因位于13q14[Walbaum,R.等人,Hum.Genet.,44219-226(1978)]。
根据本发明者的实验,家兔HCD10(119)受到人生长激素抑制,揭示受hGHITS基因影响的癌类型的另一种方法是观察生长激素或胰岛素样生长因子-1(IGF-1)量的升高与各自癌发展之间的关系。
例如,已经在几类不同的肿瘤中发现IGF-1的受体,这些肿瘤包括前列腺癌[Lamharzi,N.等人,Proc.Natl.Acad.Sci.USA,958864-8868(1998)]、胰癌[Bergmann,U.,等人,Cancer Res.,552007-2011(1995)]、骨和软组织肉瘤[Sekyi-Otu,A.等人,CancerRes.,55129-134(1995)]、Wilm′s肿瘤、小细胞肺癌、结肠癌、脑膜瘤、成神经细胞瘤、横纹肌肉瘤和成淋巴细胞白血病[Daughaday,W.H.,Endocrinology,1271-4(1990)]。已知一些肿瘤受生长激素或IGF-1所激活。例如,已知急性白血病受人生长激素激活上调了其受体[Giesbert,S.等人,Ann.Hematol.,74253-257(1997)]。
从上文可以预计,用生长因子对抗剂会导致一些肿瘤被抑制人骨肉瘤生长可用生长抑素类似物抑制[Pinski,J.等人,Int.J.Cancer,65870-874(1996)]。生长激素释放激素对抗剂抑制人肾腺癌增殖[Jungwirth,A.等人,Proc.Natl.Acad.Sci.USA,945810-5813(1997)]。
发现患者的身高和一些肿瘤的发病存在正相关性。例如,研究表明,成髓细胞瘤可能受生长激素产生的影响[Robertson,S.C.等人,Neurosurgery,41561-565(1997)]。然而,在乳房癌中有未解决的矛盾。一些研究者相信,IGF-1是一种强效的乳房促分裂原[Yang,X.F.等人,Cancer Res.,561509-1511(1996)]。它们使生长激素参与人乳房生长,并表明在一些经生长激素治疗的儿童中产生男乳房女性化,且高身材和肢端肥大症与乳房癌发病率的增加有关[Ng,S.T.等人,Nat.Med.,31141-1144(1997)]。然而,其它研究者相信,他们发现当女性达到其最高高度(并不是总计到达的高度)时的年龄是乳房癌的一个危险因素[Li,C.I.等人,Epidemiology,8559-565(1997)]。据称,相对于到达最终高度的年龄的增长,乳房癌有危险有下降的倾向。
肢端肥大症患者中的发现提供了关于高水平生长激素诱导疾病的其它信息。肢端肥大症患者体内生长激素的水平的增加导致发生结肠腺癌[Vasen,H.F.等人,Eur.J.Endocrinol.,131(3)235-237(1994)]、结直肠癌[Jenkins.PJ等人,Clin Endocrinol oxf47(1)17-22(1997)]、心血管疾病[Lombardi,G.等人,J.Pediatr.Endocrinol.Metab.,10553-560(1997)]以及所有恶性疾病[Orme,S.M.等人,J.Clin.Endocrinol.Metab.,832730-2734(1998)]的风险增加。
在用辛利肽(octreotide)(生长抑素的类似物)治疗时,肿瘤细胞增殖活性减少、心脏功能改善以及血清IGF-1水平同时降低,此结果确认了生长激素是上述疾病的一个原因[Cascinu,S.等人,Gastroenterology,113767-772(1997),Lombardi,G.等人,Horm.Res.,48 Supple.438-42(1997)]。在心血管疾病例中,病根似乎并不只是心室质量的增长,因为它与其它体内器官的大小的增加不相称,据报道肢端肥大症心肌病的严重性与“疾病持续时间”的关系比与循环性生长激素和/或IGF-1水平的关系更密切[Lombardi,G.等人,J.Endocrinol.,155 Supple.1S33-S37(1997)]。这使我们猜测是基因受某阈值水平生长激素所抑制导致了心血管疾病的发作。
另外,以结肠作为主要的靶,用等量的抽提自不同正常细胞和癌细胞的mRNA以及hGHITS特异性探针进行Northern杂交。与正常结肠组织(结果未显示)相比,结肠腺癌SW480中观察到的hGHITS转录至少增加10倍。在8个受测试的癌细胞培养中,该表达水平显然是最高的。这表明结肠腺癌中的某些显著突变产生了该基因的无功能性同系物。
尽管预计功能性hGHITS转录的增加会抑制肿瘤生长,但是绝对没有预计到结果是Burkitt′s淋巴瘤Raji的细胞培养缺少了可见的hGHITS mRNA表达(数据未显示)。该结果提示hGHITS基因的缺陷可能导致Burkitt′s淋巴瘤发展和增殖。
上述发现总地表明,本发明的DNA、其转录产物mRNA以及翻译蛋白可能可用作治疗药物,通过将组成本发明的基因的DNA导入患者体内或将mRNA或蛋白施加到受影响的部位来治疗心脏病、血管疾病、糖尿病性肾病和恶性肿瘤如乳房癌、结肠直肠癌和白血病(当在巨人症/肢端肥大症中或侏儒症中过多分泌或给予生长激素的情况下由升高水平的生长激素或IGF-1所诱导)。另外,本发明还表明,诱导或促进本发明基因表达的某些物质(例如刺激本发明基因转录的物质如伴刀豆球蛋白A)可能用作治疗药物来治疗上述疾病。
另外,利用hGHITS基因表达和癌发展之间的关系,包含hGHITS基因部分(或全部)DNA的DNA,能提供以hGHITS基因表达状况为基础的癌症诊断手段,以及在癌症患者体内预后的手段(例如通过提供针对hGHITS基因转录物的探针或PCR引物)。
根据病因学研究,在持续经受过量生长激素水平的巨人症或肢端肥大症患者体内,这些疾病的发病率(如肿瘤发展和血管疾病)更高。这表明,这些疾病(即肿瘤发展和血管疾病)可能是由于本发明的肿瘤抑制基因受到血液中持续存在的过量生长激素抑制而引起的。另外,生长激素的生理性分泌以脉冲方式产生。因此,预计生长激素水平高于临界值的“时间”内负责抑制本发明基因的表达。这还表明,在生长激素治疗中,出于安全性考虑,以脉冲方式给药的方法(而非连续给药的方法)才是较佳的,这符合自然的生理循环。通常,在选择药物和确定治疗患者的剂量时,还需要参考个别患者的遗传资料。
因此,在用生长激素治疗儿童侏儒症时,可用根据本发明基因及其类似物设计的探针和引物作为诊断性药物来测定本发明的肿瘤抑制基因的表达水平,然后用所得结果评价患者对治疗的适应性并确定合适的治疗时间和剂量,从而减少肿瘤发展的危险。
尽管需要大规模的研究来获得最终结论,但是可以合理地预计,在人群中,低的hGHITS基因表达水平或其非功能性等位基因的表达与日后癌症发展的危险之间有正相关性。因此,通过用根据本发明基因获得的探针和引物检测个体的hGHITS基因表达,就可能初步诊断个体内日后肿瘤发展的可能性。另外,除了这种监测外,从那些能促进或诱导hGHITS基因表达的物质中还可选出合适的物质(如伴刀豆球蛋白A)来预防肿瘤发展。
本发明的DNA不仅包括具有序列表中SEQ ID NO1或SEQ ID NO2具体指出的核苷酸序列的DNA,而且还包括构成基因的性质基本相同、相对于此二者任一核苷酸序列之一有一个或多个碱基缺失、取代或添加的DNA。术语“一个或多个碱基”通常包括高达10个碱基,通常为几个(例如3个或4个)碱基。本发明的蛋白不仅包括具有SEQ ID NO3和SEQ ID NO4具体指出的氨基酸序列的蛋白质,而且还包括具有基本相同性质的、相对于此二者任一氨基酸序列具有一个或多个氨基酸缺失、取代或添加的蛋白质。术语“一个或多个氨基酸”通常包括高达10个氨基酸,通常为几个(例如3个或4个)氨基酸。另外,本发明还包括编码这些蛋白的DNA序列。这类各种核苷酸序列易用众所周知的密码子简并知识制得。
利用重组DNA技术易获得各种突变体。首先,可以通过不同的嵌合和/或酶促过程将突变导入DNA克隆片段中,然后对这样获得的突变型DNA测序,以选择具有预期优点的特定突变体。该方法允许系统性地制备不同的突变体而不论它们的表型如何。制备突变型DNA克隆的常用方法如下1.利用一个寡核苷酸在给定的DNA序列中直接进行取代、缺失、插入或增加。该方法能在小的DNA区域中导入多个突变。
2.利用较长的寡核苷酸可以合成所需的基因。
3.利用利用区域特异性诱变技术,可将一个所需的突变导入大的(1-3kb)DNA区域中。
4.DNA接头区扫描性诱变是一种适用于将一串点突变导入相对较小的(4-10bp)DNA区域中的方法。
5.PCR也可用作直接导入突变的方法。从上述方法获得了制备能表达包括不同突变的所需基因的质粒和载体的方法。即,利用限制性酶和连接酶的组合将携带所需基因的DNA插入表达载体的DNA中,很容易构建携带所需基因的重组质粒。然后将这样获得的重组质粒导入不同的细胞中转染,进而产生转化的细胞。可采用的细胞范围从原核细胞(例如大肠杆菌)到酵母、昆虫、动植物细胞。。
用氯化钙方法或电穿孔可将重组质粒导入宿主细胞内。氯化钙方法能有效地转化并且不需要特殊装置。为了获得更高的效率,建议采用电穿孔。常用于动物细胞系的已知的转染方式有两种,即瞬时和永久。在瞬时转染中,培养转化的细胞1-4天以实现转染基因的转录和复制,然后收获细胞并分析它们的DNA。另外,在许多研究中,产生了稳定的转化细胞系,其中转染的基因被掺入染色体中。转染方法的例子包括磷酸钙法、电穿孔和脂质体融合方法。用本领域熟知的方法很容易制得针对本发明的肿瘤抑制基因编码的蛋白(多肽)或其片段和类似物的多克隆和单克隆抗体。一旦纯化,这些抗体可用作与本发明肿瘤抑制基因有关的疾病的实验室试剂和诊断性试剂。所得抗体可用于制备抗体柱、免疫沉淀和用Western印迹鉴定抗原。
以毫克规模制备针对本发明肿瘤抑制基因所编码蛋白的单克隆抗体的通用方法如下用抗原蛋白接种小鼠进行免疫,从表现出足够抗体滴度的小鼠体内取出脾脏。分离脾细胞,使所选B细胞与B细胞来源的骨髓瘤细胞融合形成分泌抗体的杂交瘤细胞。用亲和层析柱、离子交换或凝胶过滤等方法从培养基中纯化获得杂交瘤细胞分泌的单克隆抗体。本发明的多克隆抗体也可用常规方法制得用家兔、马、小鼠和豚鼠作为受免疫动物,用本领域已知的免疫动物的一种方案接种抗原蛋白,然后从收集的血清中分离IgG等。本发明将参照下列实施例作进一步详细描述。然而,本发明的范围并不局限于这些实施例。
<引物的制备>
用DNASIS软件和OLIGO软件设计hGHITS的特异性引物。M13通用测序引物(USP)(gtaaaa cgacg gccagtSEQ ID NO5)和M13反向测序引物(cagga aacag ctatgacSEQ ID NO8)用于对pUC18载体中的插入物测序,下列hGHITS特异性引物购自Nisshinbo Tokyo Research CentreH119U89(tccaaa tattacca gaaag ggagccaSEQ ID NO7)、H119U142(gacct ctggga tgatgtgtSEQ ID NO8)、H119U219(agagg tcttgg gcaca tttca ctggtSEQ ID NO9)、H119U736(cctgag cacgca ttttacgSEQ ID NO10)、H119U782(acaatg gctacc cctttcgSEQ ID NO11)、H119L739(ttcgta aaatgc gtgctcSEQ ID NO12)、H119L1048(cctgttt gggtttt cttggtSEQ ID NO13)、H119L1493(tcatca ccttgc tcacac ttccc tattaSEQ ID NO14)、H119L1499(catcac cttgctc acacttccSEQ ID NO15)、H119L1515(gtcgg aaatca cagccac atcatcaSEQ ID NO16)、H311U13(ttcgttt gcgtc ctaccacSEQ ID NO17)、H311L320(gcggc gtcttg ctctgSEQ ID NO18)、H316U39(ctgctct ggtctca atttaagSEQ ID NO19)、H316L498(caagtc tgctgt gcctgtcSEQ ID NO20)。
用DNA合成仪391型PCR-mate EpTM(Applied Biosystems,USA)合成正向T7启动子引物(ctaat acgact cactat agggaSEQ ID NO21)和反向U-20聚体引物(ggtttt cccagtcacga cgtSEQ ID NO22),来对克隆pMOSBlue T-载体中的插入物测序。
<搜寻合适的人cDNA文库>
在搜寻具有hGHITS基因最佳代表性的文库时,采用了含有等份的14个分开的cDNA文库和一等份组合文库(Universal cDNA Library)的快速筛选人cDNA文库组(QUICK-Screen Human cDNA Library Panel(Clontech))。
在带帽MicroAmp反应管(Perkin Elmer)中制备反应混合物各10微升6.4微升H2O、1微升10×扩增缓冲液(100mM Tris-HCl,pH8.3,500mM KCl,15mM MgCl2,0.01%w/v明胶)、0.2微升dNTP混合物(各2.5mM)、1微升正向引物(2μM)、1微升反向引物(2μM)、0.2微升热处理过的cDNA文库等份、和0.2微升聚合酶混合物
。用移液管上下吸取混合物以充分混合。按照下列扩增循环在GeneAmp PCR系统9600型热循环仪(Perkin Elmer)上进行PCR[重复40轮]10秒96℃(变性)1分钟56℃(退火)1分钟72℃(延伸)[最后步骤]4℃(放置)用微波炉将1%琼脂糖GP-36(Nacalai Tesque)融化在含有0.5微克/毫升溴化乙啶的0.5×TBE缓冲液(45mM Tris,45mM硼酸、1mM EDTA、pH8.3)中,将溶液倒入110×60×7.5mm Mupid-2 Mini-Gel电泳系统模具(Advance)中,使其在室温下固化至少30分钟并插入梳子,制备分离胶。
使每个PCR反应混合物与2微升10×加样缓冲液(50%甘油、0.01%溴酚蓝)混合并加样到凝胶上。用Mupid-2 Mini-Gel电泳系统以100V进行凝胶电泳30分钟,缓冲室中含有0.5×TBE缓冲液。
在用透射仪透射凝胶时拍摄照片。从凝胶上切下合适的PCR片段。
<PCR片段的纯化>
用QIAEX II凝胶抽提试剂盒(QIAGEN)纯化DNA片段。对于100bp-4kbp的DNA片段来说,1体积的凝胶中加入3体积的QX1缓冲液。振荡30秒重悬QIAEX II,在每份样品中加入10微升树脂。在Thermo Alumi Bath ALB-120(Iwaki)中50℃培育混合物12分钟。每隔2分钟稍稍振荡样品。18000×g(15000rpm,在TOMY MRX-150型高速微量冷冻离心机上)离心试管1分钟,弃去上清。在每份含沉淀的DNA中加入500微升QX1缓冲液,稍稍振荡、18000×g离心1分钟,完全除去上清。在每份含沉淀的DNA中加入500微升PE缓冲液,稍稍振荡、18000×g离心1分钟,完全除去上清。再一次重复该洗涤步骤。空气干燥沉淀25-30分钟直至它们变白。避免采用真空干燥,因为过分干燥的沉淀会导致回收率更低。每份样品中加入纯化的水,振荡重悬沉淀,在室温下培育5分钟并间或振荡混合物。18000×g离心样品1分钟并将含DNA上清转移到清洁的试管中。重复该步骤,在50℃下培育混合物。合并同一PCR产物的第一和第二DNA洗脱液,用琼脂糖电泳测试1微升等份。-20℃保藏纯化的DNA片段。
<克隆纯化的PCR片段>
用pMOSBlue平头克隆试剂盒(Amersham)来克隆经如此扩增和纯化的条带产物。将3.75微升每份纯化的浓缩物和0.5微升10×pK缓冲液、0.25微升100mM DTT以及0.5微升pK酶混合物混合在1.5毫升试管中。用移液管嘴轻轻搅拌混合物,在微量离心机中稍稍旋转离心。在Sanyo培养箱中22℃培育试管40分钟。在ThermoAlumi Bath中75℃热灭活反应物约10分钟,在冰上冷却2分钟,稍稍离心以收集冷凝物。
混合5微升的上述产物和0.5微升pMOSBlue载体(50毫微克/微升)和0.5微升T4DNA连接酶(2 Weiss单位),制得各连接反应物。用移液管嘴轻轻搅拌混合物,在微量离心机中稍稍旋转离心。在Sanyo培养箱中22℃培育试管过夜。
解冻含200微升pMOSBlue感受态细胞的一个试管,搅拌使悬浮的细胞均匀混合。将15微升感受态细胞移液到各预冷的1.5毫升试管中。将1微升连接混合物直接加入细胞中并轻微搅拌混合。其余的细胞再次冷冻用于下次转化(转化效率有一些损失)。试管于冰上放置30分钟。在Thermo Alumi Bath ALB-120中42℃下热休克细胞正好45秒,在冰上放置30秒。在室温下将80微升SOC培养基加入各试管,使试管置于37℃1小时。
用100微升20毫克/毫升X-Gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷)和20微升100mM IPTG(异丙基-β-D-硫代半乳糖吡喃糖苷)铺涂在含有1.5%Bacto-Agar(Difco)、30胶囊/升的CircleGrow(Bio101,Inc.,)、75微克/毫升氨苄青霉素和15微克/毫升四环素的平板上。在接种前使琼脂板浸泡至少30分钟。
将全部体积的各转化细胞悬液铺涂在琼脂板上。倒置平板37℃培育过夜。观察到有四种不同的表型深蓝、浅蓝、白色带蓝色中心(所谓的“牛眼”)和白色。发现插入物只在白色噬斑中。
<质粒DNA的纯化>
用无菌牙签挑取含有转化子的白色菌落。将细菌转移到有含100微克/毫升氨苄青霉素的2.5毫升CircleGrow培养基的14毫升带盖聚丙烯管(Falcon)中。37℃、200rpm摇动试管16-72小时(培育1天提供的质粒DNA产量最大)。
用RPM AFS试剂盒(Bio 101,Inc.)从细菌培养中迅速分离和纯化双链DNA。一次最多能纯化12个质粒DNA。18000×g(15000rpm,TOMY MRX-150高速微量冷冻离心机)离心2毫升Safe-Lock管(Eppendorf)中的细菌细胞1分钟。倾析并弃去上清。通过振荡将细胞重悬于1毫升水中并再次离心。倾析并弃去上清。将每份细胞沉淀振荡重悬于200微升Pre-Lysis 1号缓冲液中直至细胞完全重悬。在细胞悬液中直接加入400微升2号碱性裂解液,轻轻倒置试管15次。1分钟后,加入300微升冰冷的3号中和液,剧烈振荡试管3-5次直至形成均匀的白色沉淀。在冰上培育混合物5分钟,室温离心5分钟,将上清转移到新的2毫升试管中。
在上清中加入500微升4号Glassmilk SpinBuffer,上下颠倒5分钟以使DNA与Glassmilk液有效结合,18000×g离心2秒。倾析并弃去上清。将每份Glassmilk/DNA复合物重悬于500微升5号洗涤溶液中(通过移液管嘴轻轻搅拌然后上下吹吸),并转移到试剂盒提供的RPM AFS旋转过滤器(spin filter)中。旋转过滤器10秒以使洗涤液平面降低至沉淀平面但不使沉淀干燥。清空Catch试管,重新组装旋转过滤器。在每份旋转过滤器中加入500微升洗涤液,然后离心2分钟以干燥过滤器中的物质。将旋转过滤物质转移到新的试剂盒提供的RPM AFS Catch试管中。在每份样品中加入140微升8号洗脱液(RNA酶/DNA酶/无热原水),以手指轻拍将Glassmilk/DNA复合物混合成浆液。15000rpm离心3分钟收集Catch管中的质粒DNA。-20℃保藏DNA溶液。
<DNA插入物的检测>
对经限制性内切核酸酶消化的质粒DNA进行琼脂糖电泳,以确定插入物的存在以及用于DNA测序的合适量的DNA溶液。使质粒DNA溶液各2微升与11.1微升H2O、1.5微升10×H通用缓冲液(0.5M Tris-HCl,pH7.5,100mM MgCl2,10mM DTT,1M NaCl)、0.2微升SalI(10U/微升)(购自Takara)、0.2微升EcoRI(10U/微升)(购自Takara)混合,并且37℃培育至少2小时。
用微波炉将含1%琼脂糖GP-36(Nacalai Tesque)、0.5微克/毫升溴化乙啶(Sigma)和0.5×TBE缓冲液的混合物融化,制得分离胶,将溶液倒入Mupid-2 Mini-Gel电泳系统模具(Advance)中,使其室温下固化至少30分钟。
使每份消化的质粒DNA与1.5微升10×加样缓冲液(50%甘油、0.01%溴酚蓝)混合并加样到凝胶上。用pHY标记(Takara)作为DNA分子量标准标记。用缓冲室中含有0.5×TBE缓冲液的Mupid-2 Mini-Gel电泳系统以100V进行凝胶电泳30分钟。用FAS-II(Toyobo)产生图片用电子紫外透射仪照射凝胶,用XC-75/75CE CCD视频相机模块(Sony)拍摄图片,并用视频图像打印机UP-880(Sony)打印。从携带长度合适插入物的克隆选取DNA用于DNA测序以获得最终的确认。
<DNA测序样品的制备>
用具有AmpliTaq DNA聚合酶FS的ABI PRISMTM染色终止循环测序反应试剂盒(Dye Terminator Cycle Sequencing Ready Reaction Kit)进行DNA测序。一次最多加工18个PCR产物。如下所述,在带盖MicroAmp反应管(Perkin Elmer)中制备反应混合物8微升Terminator Ready Reaction Mix、2微升正向或反向引物(2μM)、0.1-0.5微克质粒DNA(所需DNA溶液体积根据电泳图片估计)并加水至最终体积为20微升。用移液管上下吹吸混合物以充分混合。根据下列扩增循环在GeneAmp PCR系统9600型热循环仪(Perkin Elmer)上进行PCR[重复25轮]10秒96℃(变性)5秒50℃(退火)4分钟60℃(延伸)[最后步骤]4℃(放置)用乙醇沉淀纯化PCR产物。对于每份反应产物,在1.5毫升微量离心管中加入2微升3M乙酸钠(pH5.2)和50微升99.5%乙醇。将每个反应管中全部20微升物质转移到含有乙醇溶液的微量离心管中。振荡试管并置于冰上10分钟。然后4℃、18000×g(15000rpm,在TOMY MC-150高速微量离心机上)离心混合物20分钟。用微量移液管仔细吸出乙醇溶液。加入250微升70%乙醇洗涤沉淀并15000rpm离心1分钟。用微量移液管仔细吸出乙醇溶液以避免搅乱沉淀。真空干燥试管10分钟。干燥的沉淀可立即使用或-20℃保藏。
<DNA测序>
用373-18DNA测序仪(Applied Biosystems)对质粒DNA测序。由于玻璃仪器的清洁度对于可信、准确地测序非常重要,因此用水仔细洗涤玻璃仪器,然后用异丙醇擦洗。用含8.3M尿素的4.75%变性PAGG分离PCR产物在50毫升离心管中,混合19.94克尿素、4.75毫升40%(19∶1)丙烯酰胺/Bis溶液(Bio-Rad Laboratories)和8毫升5×TBS缓冲液,加入蒸馏水至40毫升。剧烈搅拌试管,在微波炉中旋转1周温热,并再次剧烈搅拌直至所有尿素结晶溶解。在装有am A-3S抽吸器的干燥器中使溶液脱气,同时准备凝胶浇注装置(约10分钟)。加入18微升TEMED(Sigma)和160微升10%过硫酸铵(-20℃保藏),轻微混合30秒并倒入玻璃板模具(420×250×0.25mm)中。使凝胶在室温下固化2-5小时。
混合52微升甲酰胺和10微升含3%蓝色葡聚糖(Sigma)的50mM EDTA(pH8.0),制得加样缓冲液。将测序样品溶解在3微升该缓冲液中,在Thermo Alumi BathALB-120(Iwaki)中94℃加热2分钟,然后置于冰上。再一次仔细清洗有凝胶的玻璃板,扫描检查,并组装电泳室。将鲨鱼齿形梳插入浸液1mm,将1×TBE缓冲液倒入两个缓冲室中,预先进行电泳20-30分钟。PMT电压设定为900V,运行参数设定为2500V、20mA和30W。用注射器以1×TBE缓冲液仔细清洗诸孔,将样品加入孔中,进行电泳9小时。电泳开始后立即开启数据收集计算机程序。
数据收集完毕后自动激活ANALYSIS计算机程序。手动修正软件错误。核苷酸序列的最初分析采用DNASIS软件来进行。
<杂交探针的制备>
按“插入物的检测”部分所述从具有适当插入物的质粒DNA储备液制备杂交探针。混合纯化的DNA样品和0.116体积的10×H通用缓冲液以及SalI(10U/微升)和EcoRI(10U/微升)各0.02体积。37℃消化过夜。于50V进行琼脂糖凝胶电泳50分钟,从凝胶上切下DNA插入物,如“PCR片段的纯化”部分所述,合并相同的级分并纯化。
<噬菌体接种细胞的制备>
为了获得高效的噬菌体感染,在对数生长期收获用于噬菌体生长的细胞且基本上没有死细胞非常重要。发现XL1-Blue MRF′菌株是使用最方便的。其基因型是Δ(mcrA)183Δ(mcrCB-hsdSMR-mrr)173 endA1 supE44 thi-l recA1 gyrA96 relA1lac[F′proAB lacqZ ΔM15 Tn10(Tetr)]。菌株在添加了25微克/毫升四环素的CG琼脂板(1.6%Bacto-Agar(Difco)和40胶囊/升Circle Grow(Bio101,Inc.))上培养。每两周将细胞重新划线到新鲜平板上,37℃培养过夜并4℃保藏。
在接种阶段的前一天,从CG琼脂板挑取单菌落接种到添加了0.4%麦芽糖和25微克/毫升四环素的3毫升CG肉汤(40胶囊/升CircleGrow)中,并37℃摇动培育过夜。
将1.0毫升过夜培养物加入47毫升同一预先温热的生长培养基中,37℃剧烈摇动培养3小时。用装备了0.1毫升石英玻璃槽的Beckman DU640分光光度计评估细胞浓度。OD600通常在0.3左右(1.5×108细胞/毫升)。将培养物转移到无菌的50毫升带盖聚碳酸酯离心瓶(Beckman)中,采用Beckman JA20转头在Beckman J2-MC离心机中4℃、3000rpm旋转10分钟。将细胞沉淀重悬在冰冷的无菌10mM MgSO4中,制得2×109细胞/毫升的悬浮液。将细胞置于冰上并立即用于滴定和接种噬菌体以便筛选。
<噬菌体滴定>
用含有添加了25微克/毫升四环素的CG琼脂的100mm Petri皿(Falcon)进行滴定。使倒入琼脂的平皿敞开盖子在室温下静置20分钟以使琼脂固化,然后在无菌橱中(SCV-1301EC II BHitachi)吹无菌空气干燥30分钟并4℃保藏。使用前,从冰箱中取出皿并在恒温室中37℃温热1小时。
使2微升噬菌体混合物与198微升SM缓冲液混合(100mM NaCl、8mM MgSO4、0.01%明胶(Sigma)和50mM Tris-HCl,pH7.5)。该稀释度标为104,因为在接种10微升稀释液时,平板上的一个噬斑等价于原来噬菌体原种中的104pfu/ml。以相同方式用SM缓冲液制备连续稀释液直到109。
用90微升SM缓冲液稀释10微升的各个噬菌体稀释液,和悬浮在10mM MgCl2中的100微升细胞混合,并在Thermo Alumi Bath ALB-120的金属容器中37℃培育15分钟。
在微波炉中融化CG顶层琼脂(0.8%I-B型琼脂糖(Sigma)、40胶囊/升CircleGrow),加入20%麦芽糖至最终浓度为0.4%。将3毫升等份的顶层琼脂糖加入16×125mm带盖组织培养管(Falcon)中,使用前置于Thermo Alumi Bath ALB-120中48℃。
将各接种化合物加入含有融化琼脂糖的试管中,颠倒试管5次迅速混合,然后倒在添加了25微克/毫升四环素的100mm平板中的干CG琼脂上。在取出平板前使顶层琼脂糖完全凝固3分钟。将平板倒置并在恒温室中37℃培育5小时,然后在室温下过夜。计数噬斑数量,通过将噬斑总数乘以稀释度来计算噬菌体滴度。
<噬菌体接种和将噬斑转移到膜上>
接种过程基本上和上述噬菌体的滴定相同。一次最多能处理12个平板。用死于外伤的75岁男性白种人的肺(Clontech)通过寡(dT)加随机引导方法构建λgt10克隆载体的cDNA文库。
对于首次筛选,使SM缓冲液稀释的100微升噬菌体文库(含有50000-500000pfu(噬斑形成单位))与悬浮在10mM MgCl2中的等体积的细胞混合,37℃培育15分钟,通过5次颠倒和7毫升48℃的CG顶层琼脂糖充分混合,并倒在添加了25微升/毫升四环素的CG琼脂平板(150mmFalcon)上。将平板倒置,37℃培育5小时,然后在室温下过夜。
将HybondTM-N+(圆形,132mm,带格,带正电荷的尼龙膜(Amersham))铺到含噬斑琼脂平板上。用21G针刺三点以标记滤膜的方向。取下滤膜,将其面朝上放在台上干燥至少3分钟。对于DNA固定,将滤膜置于2层浸透了0.4M NaOH的Whatman滤纸上10-30分钟。用5×SSPE缓冲液(20×SSPE3.0M NaCl,0.2M NaH2PO4,0.02MEDTA,pH7.4,购自GibcoBRL)充分洗膜2次,并用水洗一次,以除去细菌碎片和碱,用纸巾吸干并在室温下干燥。
<探针的标记和纯化>
用Multiprime DNA标记系统(Amersham)标记探针。用水将大约各25毫微克回收的DNA插入物调至27微升,在Thermo Alumi Bath ALB-120中98℃加热5分钟并在冰上冷却。18000×g(15000rpm,在TOMY MRX-150型高速微量冷冻离心机上)离心试管1秒,使试管内的物质下降。如下所述,在冰上在带盖MicroAmp反应管中建立四种反应物全部体积的变性的DNA探针、10微升标记缓冲液、5微升引物/BSA溶液、6微升[α-32P]dCTP(约110TBq/毫摩尔,370MBq/ml)(Amersham)和2微升Klenow酶。通过上下吹吸稍稍混合混合物,在GeneAmp PCR系统2400型中37℃培育30分钟,置于20℃3-4小时直至除去未掺入的核苷酸,然后杂交。
用QIAquick除核苷酸试剂盒(Qiagen)纯化标记的探针。使每份标记混合物与1.5毫升试管中的500微升缓冲液PN混合。将QIAquich旋转柱置于提供的2毫升收集管中。为了结合DNA,将样品加样到QIAquick旋转柱中,6000rpm离心1分钟(TOMY高速微量离心机MC-150)。将QIAquich柱置于清洁的2毫升收集管中,保留放射活性流穿液以便随后计算掺入DNA中的标记。为了洗涤QIAquick柱,加入500微升缓冲液PE并6000rpm离心1分钟。弃去流穿液,用另500微升缓冲液PE重复洗涤。弃去流穿液,再次13000rpm离心QIAquick柱1分钟以除去残余的液体。将QIAquick柱置于清洁的1.5毫升微量离心管中。为了从柱中洗脱DNA,在柱中心加入100微升缓冲液EB(10mM Tris-HCl,pH8.5),静置1分钟,然后13000rpm离心1分钟。
将洗脱的每份标记DNA转移到带盖MicroAmp反应管中,在GeneAmp PCR系统2400型中99.9℃加热5分钟,然后冷却至4℃。将变性的探针加入含有450微升杂交缓冲液的1.5毫升试管中,用β(γ)测量器TGS-133(Aloka)评价标记掺入的效率并和未掺入核苷酸的放射活性比较。
<噬斑杂交>
为了精确地定位滤膜以切下阳性噬斑,在低温下进行杂交和滤膜洗涤是有利的。如下制备100毫升杂交缓冲液50毫升甲酰胺、去离子、测试的核酸酶和蛋白酶(Nacalai Tesque),25毫升20×SSPE缓冲液(3M NaCl,0.2M NaH2PO4,20mM EDTA,pH7.4GibcoBRL),5毫升10%SDS,18毫升水;2管1.5毫升试管各自含有200微升10毫克/毫升腓精DNA溶液(GibcoBRL)和0.8毫升水,使其在Thermo Alumi BathALB-120中98℃加热5分钟,在冰上冷却,然后和杂交缓冲液合并。由于SDS易于随温度降低而沉淀,使用前将杂交缓冲液(在冬季)温热至大约40℃。
将80毫升杂交缓冲液倒入150mm圆形塑料容器中,一张接一张地浸渍12张滤膜,应注意每张膜的前面应接触相邻膜的前面,每张膜的背面接触相邻膜的背面。合上盖子,在Thomastat Shaker T-22S中32℃、40rpm进行预杂交至少3小时。
将杂交缓冲液从预杂交滤器倒入另一150mm圆形塑料容器中,其余的杂交缓冲液与四个标记探针混合,如上所述浸泡滤膜。合上容器盖子,在Thomastat ShakerT-22S中32℃、40rpm杂交过夜。
将滤膜置于另一带盖子的圆形塑料容器中,采用下列各洗涤方案通过在Thomastat Shaker T-22S中摇动40rpm来进行洗涤1)2×SSPE缓冲液,0.1%SDS 32℃ 10分钟2)2×SSPE缓冲液,0.1%SDS 50℃ 1.5小时3)0.5×SSPE缓冲液,0.1%SDS 50℃ 1.5小时吸出滤膜中剩余的洗涤缓冲液,使滤膜室温至少干燥1.5小时。在两个35.6×43.2-cm Fuji EC-A匣中排列12个滤膜,曝光Hyperfilm-MP X射线胶片(Amersham)3-4天。
<噬菌体回收>
使X-射线胶片显影,凭借照明用Bright Light Box根据取向标记确定阳性噬斑的位置。用21G针头切下中心与X射线胶片上阳性信号重合的5×5mm顶层琼脂糖栓塞(plug),并放入各含有0.3毫升SM缓冲液的4毫升带盖样品管中。4℃洗脱噬菌体1天。
<第二次筛选噬菌体>
第二次筛选噬菌体基本上和上述第一次筛选相同。在初步调节后,不需要再为平板接种而滴定噬菌体洗脱液发现在大多数情况下对应于每150mm Petri平皿0.0001微升噬菌体洗脱液的噬斑量是合适的。用添加了14微升DMSO(二甲基亚砜)的0.2毫升SM缓冲液4℃洗脱单个噬斑1天,-70℃保藏直至用于繁殖和纯化噬菌体DNA。
<噬菌体DNA的制备>
在接种阶段的前一天早上,从CG琼脂平板挑取大肠杆菌XL1-Blue MRF′单菌落,接种到3毫升添加了0.4%麦芽糖和25微克/毫升四环素的CG肉汤(40胶囊/升CircleGrow)中,并37℃振摇培育。当天晚上,在47毫升同样预温热的生长培养基中加入50微升培养物,并剧烈摇动37℃培育过夜。第二天早上,将培养物转移到无菌的50毫升带盖聚碳酸酯离心瓶(Beckman)中,并用Beckman JA20转子4℃、3000rpm旋转10分钟。将所得细胞沉淀重悬在4.5毫升冰冷的无菌10mM MgSO4中,然后置于冰上。
用含有添加了25微克/毫升四环素的1.2%CG琼脂糖GP-36的150mm Petri平皿(Falcon)繁殖噬菌体。倒入琼脂的Petri平皿在固化后没有干燥。将它们保藏在冰箱中,使用前在恒温室中37℃温热1小时。
使50微升含有约5×106pfu的噬菌体洗脱液和450微升SM缓冲液以及500微升细胞悬液充分混合,37℃培育15分钟,和6毫升融化的琼脂糖混合并铺涂到Petri皿上。3分钟后,倒置平皿并37℃培育约8小时。
为了洗脱噬菌体,用8毫升SM缓冲液和200微升氯仿覆盖每个平板,将平板固定到Rotary Shaker R-20mini(Taitec)上,4℃、150rpm振动过夜。
将噬菌体洗脱液转移到15毫升锥形离心管(Greiner)中,用另外2毫升SM缓冲液室温洗涤平板1小时。合并第一次和第二次洗脱液,3500rpm旋转试管10分钟(TOMY TS-7转头低速离心机TOMY LC-122)。
用QIAGENλ微量试剂盒(QUIAGEN)纯化噬菌体DNA。将8毫升澄清的平板裂解液转移至新的15毫升离心管中,和25微升缓冲液LI(300mM NaCl,100mM Tris-HCl,pH7.5,10mM EDTA,0.2毫克/毫升BSA,20毫克/毫升RNA酶A和6毫克/毫升DNA酶I)混合,在Thermo Alumi Bath ALB-120(Iwaki)中37℃培育30分钟。将裂解液和1.6毫升冰冷的缓冲液L2(30%聚乙二醇PEG6000,3M NaCl)合并,于冰上培育60分钟。将试管内物质转移到16×76mm离心管(Beckman)中,在L70超离心机(Beckman)的50Ti转头中4℃、15000rpm离心15分钟。弃去上清液,将试管倒置1分钟,以排干残余液。前一步骤中进行的PEG沉淀所形成噬菌体沉淀很难用肉眼看见,因为它是透明的,并且分布在整个试管壁上。因此,用0.65毫升缓冲液L3(100mM NaCl,100mM Tris-HCl,pH7.5,25mM EDTA)分几次沿管壁吹吸,以确保沉淀完全重悬,将该物质转移至2毫升Safe-Lock管(Eppendorf)中。在试管中加入等体积的缓冲液4(4%十二烷基硫酸钠),轻轻混合,在Thermo Alumi Bath ALB-120中70℃加热10分钟,然后在冰上冷却。将0.65毫升缓冲液L5(3M乙酸钾,pH5.5)倒入试管中,立即稍稍混合,并15000rpm、4℃离心30分钟(高速微量冷冻离心机MRX-150(TOMY))。将上清转移到新的2毫升管中,室温再次15000rpm离心10分钟以除去残余的悬浮或颗粒状物质。
在进行离心的同时,将QIAGEN-tip 20放入废液盘上方的QIAtrack 1中,用1毫升缓冲液QBT(750mM NaCl,50mM MOPS,pH7.0,15%乙醇,0.15%Triton X-100)平衡柱。使QIAGEN-tip完全排干。QIAGEN-tip可以无人管理,因为树脂床保留了一些缓冲液,不容易变干。
迅速将上清液加样到QIAGEN-tip上,使其靠重力流经通过树脂。尖嘴用1毫升缓冲液QC(1.0M NaCl,50mM MOPS,pH7.0,15%乙醇)洗涤两次。将QIArack 1的上部放在装有清洁的1.5毫升管的下方支架的上面,用0.75毫升缓冲液QC(1.25MNaCl,50mM Tris-HCl,pH8.5,15%乙醇)洗脱DNA两次至两个1.5毫升微量离心管(Treff Lab)中。
用0.7体积异丙醇沉淀DNA,并室温15000rpm离心30分钟。仔细取出上清液弃去。室温用0.5毫升70%乙醇稍稍洗涤DNA沉淀,然后重新离心。重复室温用70%乙醇洗涤。完全除去乙醇。空气干燥沉淀5分钟,将每管中的DNA溶解在18微升NaOH(pH8)中,合并含有相同DNA的两个管中的物质。
<噬菌体插入物的重新克隆>
为了确定噬菌体插入物的序列,将来自合适克隆的DNA片段重新克隆到pUC18载体中。
使36微升λDNA溶液和4.5微升10×H缓冲液以及4.5微升EcoRI(10U/微升)(Takara)混合。37℃消化过夜,然后在三个孔中分配混合物,用1%琼脂糖GP-36凝胶50V电泳50分钟。按“PCR片段的纯化”所述,用QIAEX II凝胶抽提试剂盒纯化插入物。
使5微升洗脱的片段和15微升水混合,并加入Ready-To-Go pUC18 EcoRI/BAP+连接酶(Pharmacia Biotech)的管中。室温培育混合物3分钟,然后在MIR-153培养箱(Sanyo)中16℃培育0.5-30小时。用0.5微升连接反应混合物转化25微升DH5高度感受态的细胞(Toyobo)。转化基本上根据“纯化的PCR片段的克隆”过程实旋。将1/10的转化子铺涂到含1.4%Bacto-Agar(Difco)、40胶囊/升CircleGrow(Bio 101,Inc.)和100微克/毫升氨苄青霉素的平板上。37℃培育平板过夜。
每次转化挑取3个克隆,在添加了100微克/毫升氨苄青霉素的2.5毫升CircleGrow培养基中37℃下生长16-72小时。按照“质粒DNA的纯化”所述的那样,用RPM AFS试剂盒纯化质粒DNA。
用2U EcoRI消化2微升DNA溶液,然后在1%琼脂糖凝胶上电泳来估计插入物的存在和纯化的DNA的大约浓度。按照上述方法用M13通用测序引物和M13反向测序引物通过DNA测序确定插入物的取向。
<嵌套缺失的构建>
用外切核酸酶III控制DNA的消化来构建双链DNA中的单向缺失,以便对重新克隆的DNA插入物进行测序。该酶仅对双链DNA有3′外切核酸酶活性平头和5′突出末端易被消化,而三个碱基或更长的3′突出端对该酶有抗性。另外,由于磷酸骨架中的硫代磷酸酯键对外切核酸酶III的消化有抗性,因此已经“填入”硫代核苷酸凹陷的3′末端(5′突出端)对消化也有抗性。用至少两个携带该基因各个DNA区的独立的克隆和双链嵌套缺失试剂盒(Pharmacia Biotech)从相反的两端产生缺失。
合适的限制性内切核酸酶一定不能切割DNA插入物。如果可采用产生3′和5′突出端或平头末端的一对合适的限制性酶,那么用这些酶消化2微克纯化的质粒DNA至少3小时。用各2微升等份通过琼脂糖凝胶电泳监测消化的进展。当消化完成后,70℃加热DNA样品10分钟以灭活酶。
当不能找到合适的一对限制性酶且两个内切核酸酶均不产生3′突出端时,可以选择硫代核苷酸的末端保护。在这种情况下,在10微升的体积中用第一限制性内切核酸酶消化2微克质粒DNA溶液。最多用3微升的该反应混合物来监测反应的进展。混合FPLCpure Klenow片段(1单位/微升)和20微升1×Klenow缓冲液(50mM Tris-HCl,pH7.5;10mM MgCl2和0.1mM DTT),制得稀释的Klenow片段(0.05单位/微升)。在1.5毫升微量离心管中加入下列物质7微升限制性消化的DNA、1微升10×Klenow缓冲液、1微升dNTPαS Mix(含有dATPαS,dCTPαS,dGTPαS和dTTPαS各400μM的水溶液)和1微升稀释的Klenow片段。轻轻混合试管,简单离心并37℃培育15分钟。65℃加热反应混合物20分钟,然后加入20微升NaCl/糖原(含有250mMNaCl和250毫微克/微升糖原的水溶液)和75微升乙醇。将混合物置于干冰上10分钟,或-80℃冷却至少1小时。4℃、15000rpm离心10分钟,收集DNA沉淀。仔细取出上清液弃去。用250微升70%乙醇清洗沉淀,离心1分钟。仔细除去上清液。真空干燥沉淀5分钟,重新溶于10微升水中。在20微升的最终反应体积中用第二限制性酶消化DNA,70℃加热10分钟以灭活酶。
在微量离心管中,如下制得S1核酸酶/缓冲液混合物33微升S1缓冲液、66微升蒸馏水和1微升S1核酸酶。将3微升该混合物移液到20个微量离心管中,并置于冰上。
制备24微升含合适NaCl浓度的2×ExoIII缓冲液。在用等体积的双消化DNA稀释后,NaCl的浓度应为75mM或更低。
在1.5毫升微量离心管中,混合20微升2×ExoIII缓冲液和20微升(2微克)双消化的DNA,在Thermo Alumi Bath ALB-120中30℃平衡2-3分钟。取出2微升等份作为“0时间”对照样品,并置入含有3微升S1核酸酶/缓冲液的合适的试管中,充分混合并置于冰上。
加入1微升外切核酸酶,轻轻混合,继续30℃培育。每隔5分钟从反应混合物中取出2微升样品,立即和3微升S1核酸酶/缓冲液充分混合。所有这些试管均置于冰上直至从外切核酸酶III反应混合物中取出了所有的定时样品。
在取出所有的定时样品并和S1核酸酶/缓冲液混合后,在室温下同时培育这些样品30分钟。
向每份样品中加入1微升S1核酸酶终止溶液,65℃培育试管30分钟。用每份定时样品的一半来电泳分析缺失,另一半用于通过连接重新环化。所有样品均同时进行这两个步骤,然后用缺失分析的结果选择重新环化的样品用于转化。
混合3微升各份样品和2微升加样缓冲液(50%甘油、1mM EDTA和0.01%溴酚蓝),在含有0.5微克/毫升溴化乙啶的1%琼脂糖凝胶(琼脂糖凝胶GP-36,购自NacalaiTesque)上电泳30分钟进行分析。
在进行电泳的同时,用各定时样品的其余3微升进行重新连接。在1.5毫升微量离心管中混合下列物质制备连接混合物40微升10×连接缓冲液,80微升25%PEG,2微升T4 DNA连接酶和218微升蒸馏水。将17微升的该连接混合物加入3微升各定时样品中,轻轻混合并室温培育2小时。
在电泳完成后,检查凝胶以确定哪个定时样品含有感兴趣的缺失。用含有感兴趣缺失的那些样品转化大肠杆菌细胞。用2微升连接反应混合物转化10微升DH5高度感受态细胞(Toyobo)。根据“纯化的PCR片段的克隆”所述的方法,实施转化。将1/10转化子铺涂到含1.4%Bacto-Agar(Difco)、40胶囊/升CircleGrow(Bio 101,Inc.)和100微克/毫升氨苄青霉素的平板上。使各平板的两个菌落生长,如上所述对经EcoRI消化的质粒DNA进行电泳然后作DNA测序,以分析缺失程度。将DNA序列与质粒DNASIS计算机程序相联,以编译全长插入物。
<测序数据的计算机分析>
用DNASIS计算机程序和下列一些通过因特网获得的软件来分析核苷酸序列BLAST(基本局部序列对比搜索工具"Basic Local Alignment Search Tool")、MOTIF(蛋白质序列基序搜索"Protein Sequence Motif Search")、PSORT(蛋白分拣信号和氨基酸序列中定位的预测"Prediction of Protein Sorting Signal and Localization Sites in AminoAcid Sequences")、SOSUI(预测跨膜节段)、SIM(蛋白质序列对比工具)和GeneStream序列对比。
<Northern杂交>
如上文“噬斑杂交”中所述的那样,使每条泳道含有约2微克多聚A+RNA的多重组织Northern(MTN)印迹(Clontech)和hGHITS特异性探针杂交。
预杂交和杂交在42℃而不是32℃进行。
进行下列洗涤1)2×SSPE缓冲液,0.1%SDS 42℃ 10分钟2)2×SSPE缓冲液,0.1%SDS 65℃ 1.5小时3)0.5×SSPE缓冲液,0.1%SDS 65℃ 1.5小时4)0.1×SSPE缓冲液,0.1%SDS 65℃ 1.5小时
5)0.1×SSPE缓冲液,0.1%SDS 65℃ 1.5小时采用BIOMAX MS科学显影胶片(Kodak),因为其敏感性比Hyperfilm-MP儿乎高8倍。用具有增感屏的Fuji EC-A匣使胶片在-80℃下受膜曝光3周。在胶片显影前,在室温下温热此匣至少1小时。
序列表(1)一般信息(i)申请人JCR Pharmaceuticals Co.,Ltd.
(ii)发明名称人肿瘤抑制基因(iii)序列数目22(2)SEQ ID NO1的信息(i)序列特征(A)长度5486碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO1cgcggcgtga gcgccccggg aagatggagc agtcgccgtc cacgccaccg ccgccgcccg 60gggctccccc gtccctgcgg ggccagcagc agctccagcc accagtgccc ggtctcccgg120cgcgagaggc ccgggagccg ccggccagga cgcccccgag ggtgtagacc gcgcccctgg180agagagtgat aatcttcaaa atgaagactt tggaaaattt taggttctct ataggaacta240caaaaatgga aggaaagaac attttcaaaa ggaaattatt ttgaaagtat gtttacaaca300aactgatact attgacagtt ttttttttta aataataaaa cactttaaga agattgtatt360tatggtaaaa ggaaactgga ctaaca atg agg cca aag act ttt cct gcc acg 413Met Arg Pro Lys Thr Phe Pro Ala Thr1 5act tat tct gga aat agc cgg cag cga ctg caa gag att cgt gag ggg 461Thr Tyr Ser Gly Asn Ser Arg Gln Arg Leu Gln Glu Ile Arg Glu Gly10 15 20 25tta aag cag cca tcc aag tct tcg gtt cag ggg cta ccc gca gga cca 509Leu Lys Gln Pro Ser Lys Ser Ser Val Gln Gly Leu Pro Ala Gly Pro30 35 40aac agt gac act tcc ctg gat gcc aaa gtc ctg ggg agc aaa gat gcc 557Asn Ser Asp Thr Ser Leu Asp Ala Lys Val Leu Gly Ser Lys Asp Ala45 50 55acc agg cag cag cag cag atg aga gcc acc cca aag ttc gga cct tat 605Thr Arg Gln Gln Gln Gln Met Arg Ala Thr Pro Lys Phe Gly Pro Tyr60 65 70cag aaa gcc ttg agg gaa atc aga tat tcc ttg ttg cct ttt gct aat 653Gln Lys Ala Leu Arg Glu Ile Arg Tyr Ser Leu Leu Pro Phe Ala Asn75 80 85gaa tcg ggc acc tct gca gct gca gaa gtg aac cgg caa atg ctg cag 701Glu Ser Gly Thr Ser Ala Ala Ala Glu Val Asn Arg Gln Met Leu Gln90 95 100 105gaa ctg gtg aac gca gga tgc gac cag gag atg gct ggc cga gct ctc 749Glu Leu Val Asn Ala Gly Cys Asp Gln Glu Met Ala Gly Arg Ala Leu110 115 120aag cag act ggc agc agg agc atc gag gcc gcc ctg gag tac atc agc 797Lys Gln Thr Gly Ser Arg Ser Ile Glu Ala Ala Leu Glu Tyr Ile Ser125 130 135aag atg ggc tac ctg gac ccg agg aat gag cag att gtg cgg gtc att 845Lys Met Gly Tyr Leu Asp Pro Arg Asn Glu Gln Ile Val Arg Val Ile140 145 150aag cag acc tcc cca gga aag ggg ctc atg cca acc cca gtg acg cgg 893Lys Gln Thr Ser Pro Gly Lys Gly Leu Met Pro Thr Pro Val Thr Arg155 160 165agg ccc agc ttc gaa gga acc ggc gat tcg ttt gcg tcc tac cac cag 941Arg Pro Ser Phe Glu Gly Thr Gly Asp Ser Phe Ala Ser Tyr His Gln170 175 180 185ctg agc ggt acc ccc tac gag ggc cca agc ttc ggc gct gac ggc ccc 989Leu Ser Gly Thr Pro Tyr Glu Gly Pro Ser Phe Gly Ala Asp Gly Pro190 195 200acg gcg ctg gag gag atg ccg cgg ccg tac gtg gac tac ctt ttc ccc 1037Thr Ala Leu Glu Glu Met Pro Arg Pro Tyr Val Asp Tyr Leu Phe Pro205 210 215gga gtc ggc ccc cac ggg ccc ggc cac cag cac cag cac cca ccc aag 1085Gly Val Gly Pro His Gly Pro Gly His Gln His Gln His Pro Pro Lys220 225 230ggc tac ggt gcc agc gta gag gca gca ggg gca cac ttc ccg ctg cag 1133Gly Tyr Gly Ala Ser Val Glu Ala Ala Gly Ala His Phe Pro Leu Gln235 240 245ggc gcg cac tac ggg cgg ccg cac ctg ctg gtg cct ggg gaa ccc ctg 1181Gly Ala His Tyr Gly Arg Pro His Leu Leu Val Pro Gly Glu Pro Leu250 255 260 265ggc tac gga gtg cag cgc agc ccc tcc ttc cag agc aag acg ccg ccg 1229Gly Tyr Gly Val Gln Arg Ser Pro Ser Phe Gln Ser Lys Thr Pro Pro270 275 280gag acc ggg ggt tac gcc agc ctg ccc acg aag ggc cag gga gga ccg 1277Glu Thr Gly Gly Tyr Ala Ser Leu Pro Thr Lys Gly Gln Gly Gly Pro285 290 295cca ggc gcc ggc ctc gct ttc cca ccc cct gcc gcc ggg ctc tac gtg 1325Pro Gly Ala Gly Leu Ala Phe Pro Pro Pro Ala Ala Gly Leu Tyr Val300 305 310ccg cac cca cac cac aag cag gcc ggt ccc gcg gcc cac cag ctg cat 1373Pro His Pro His His Lys Gln Ala Gly Pro Ala Ala His Gln Leu His315 320 325gtg ctg ggc tcc cgc agc cag gtg ttc gcc agc gac agc ccc ccg cag 1421Val Leu Gly Ser Arg Ser Gln Val Phe Ala Ser Asp Ser Pro Pro Gln330 335 340 345agc ctg ctc act ccc tcg cgg aac agc ctc aac gtg gac ctg tat gaa 1469Ser Leu Leu Ihr Pro Ser Arg Asn Ser Leu Asn Val Asp Leu Tyr Glu350 355 360ttg ggc agc acc tcc gtc cag cag tgg ccg gct gcc acc ctg gcc cgc 1517Leu Gly Ser Thr Ser Val Gln Gln Trp Pro Ala Ala Thr Leu Ala Arg365 370 375cgg gac tcc ctg cag aag ccg ggc ctg gag gcg ccg ccg cgc gcg cac 1565Arg Asp Ser Leu Gln Lys Pro Gly Leu Glu Ala Pro Pro Arg Ala His380 385 390gtg gcc ttc cgg cct gac tgc cca gtg ccc agc agg acc aac tcc ttc 1613Val Ala Phe Arg Pro Asp Cys Pro Val Pro Ser Arg Thr Asn Ser Phe395 400 405aac agc cac cag ccg cgg ccc ggt ccg cct ggc aag gcc gag ccc tcc 1661Asn Ser His Gln Pro Arg Pro Gly Pro Pro Gly Lys Ala Glu Pro Ser410 415 420 425ctg ccc gcc ccc aac acc gtg acg gct gtc acg gcc gcg cac atc ttg 1709Leu Pro Ala Pro Asn Thr Val Thr Ala Val Thr Ala Ala His Ile Leu430 435 440cac ccg gtg aag agc gtg cgt gtg ctg agg ccg gag ccg cag acg gct 1757His Pro Val Lys Ser Val Arg Val Leu Arg Pro Glu Pro Gln Thr Ala445 450 455gtg ggg ccc tcg cac ccc gcc tgg gtg ccc gcg cct gcc ccg gcc ccc 1805Val Gly Pro Ser His Pro Ala Trp Val Pro Ala Pro Ala Pro Ala Pro460 465 470gcc ccc gcc ccc gcc ccg gct gcg gag ggc ttg gac gcc aag gag gag 1853Ala Pro Ala Pro Ala Pro Ala Ala Glu Gly Leu Asp Ala Lys Glu Glu475 480 485cat gcc ctg gcg ctg ggc ggc gca ggc gcc ttc ccg ctg gac gtg gag 1901His Ala Leu Ala Leu Gly Gly Ala Gly Ala Phe Pro Leu Asp Val Glu490 495 500 505tac gga ggc cca gac cgg agg tgc ccg cct ccg ccc tac ccg aag cac 1949Tyr Gly Gly Pro Asp Arg Arg Cys Pro Pro Pro Pro Tyr Pro Lys His510 515 520ctg ctg ctg cgc agc aag tcg gag cag tac gac ctg gac agc ctg tgc 1997Leu Leu Leu Arg Ser Lys Ser Glu Gln Tyr Asp Leu Asp Ser Leu Cys525 530 535gca ggc atg gag cag agc ctc cgt gcg ggc ccc aac gag ccc gag ggc 2045Ala Gly Met Glu Gln Ser Leu Arg Ala Gly Pro Asn Glu Pro Glu Gly540 545 550ggc gac aag agc cgc aaa agc gcc aag ggg gac aaa ggc gga aag gat 2093Gly Asp Lys Ser Arg Lys Ser Ala Lys Gly Asp Lys Gly Gly Lys Asp555 560 565aaa aag cag att cag acc tct ccc gtt ccc gtc cgc aaa aac agc aga 2141Lys Lys Gln Ile Gln Thr Ser Pro Val Pro Val Arg Lys Asn Ser Arg570 575 580 585gac gaa gag aag aga gag tca cgc atc aag agc tac tcg cca tac gcc 2189Asp Glu Glu Lys Arg Glu Ser Arg Ile Lys Ser Tyr Ser Pro Tyr Ala590 595 600ttt aag ttc ttc atg gag cag cac gtg gag aat gtc atc aaa acc tac 2237Phe Lys Phe Phe Met Glu Gln His Val Glu Asn Val Ile Lys Thr Tyr605 610 615cag cag aag gtt aac cgg agg ctg cag ctg gag caa gaa atg gcc aaa 2285Gln Gln Lys Val Asn Arg Arg Leu Gln Leu Glu Gln Glu Met Ala Lys620 625 630gct gga ctc tgt gaa gct gag cag gag cag atg cgg aag atc ctc tac 2333Ala Gly Leu Cys Glu Ala Glu Gln Glu Gln Met Arg Lys Ile Leu Tyr635 640 645cag aaa gag tct aat tac aac agg tta aag agg gcc aag atg gac aag 2381Gln Lys Glu Ser Asn Tyr Asn Arg Leu Lys Arg Ala Lys Met Asp Lys650 655 660 665tct atg ttt gtc aag atc aaa acc ctg ggg atc ggt gcc ttt gga gaa 2429Ser Met Phe Val Lys Ile Lys Thr Leu Gly Ile Gly Ala Phe Gly Glu670 675 680gtg tgc ctt gct tgt aag gtg gac act cac gcc ctg tac gcc atg aag 2477Val Cys Leu Ala Cys Lys Val Asp Thr His Ala Leu Tyr Ala Met Lys685 690 695acc cta agg aaa aag gat gtc ctg aac cgg aat cag gtg gcc cac gtc 2525Thr Leu Arg Lys Lys Asp Val Leu Asn Arg Asn Gln Val Ala His Val700 705 710aag gcc gag agg gac atc ctg gcc gag gca gac aat gag tgg gtg gtc 2573Lys Ala Glu Arg Asp Ile Leu Ala Glu Ala Asp Asn Glu Trp Val Val715 720 725aaa ctc tac tac tcc ttc caa gac aaa gac agc ctg tac ttt gtg atg 2621Lys Leu Tyr Tyr Ser Phe Gln Asp Lys Asp Ser Leu Tyr Phe Val Met730 735 740 745gac tac atc cct ggt ggg gac atg atg agc ctg ctg atc cgg atg gag 2669Asp Tyr Ile Pro Gly Gly Asp Met Met Ser Leu Leu Ile Arg Met Glu750 755 760gtc ttc cct gag cac ctg gcc cgg ttc tac atc gca gag ctg act ttg 2717Val Phe Pro Glu His Leu Ala Arg Phe Tyr Ile Ala Glu Leu Thr Leu765 770 775gcc att gag agt gtc cac aag atg ggc ttc atc cac cga gac atc aag 2765Ala Ile Glu Ser Val His Lys Met Gly Phe Ile His Arg Asp Ile Lys780 785 790cct gat aac att ttg ata gat ctg gat ggt cac att aaa ctc aca gat 2813Pro Asp Asn Ile Leu Ile Asp Leu Asp Gly His Ile Lys Leu Thr Asp795 800 805ttc ggc ctc tgc act ggg ttc agg tgg act cac aat tcc aaa tat tac 2861Phe Gly Leu Cys Thr Gly Phe Arg Trp Thr His Asn Ser Lys Tyr Tyr810 815 820 825cag aaa ggg agc cat gtc aga cag gac agc atg gag ccc agc gac ctc 2909Gln Lys Gly Ser His Val Arg Gln Asp Ser Met Glu Pro Ser Asp Leu830 835 840tgg gat gat gtg tct aac tgt cgg tgt ggg gac agg ctg aag acc cta 2957Trp Asp Asp Val Ser Asn Cys Arg Cys Gly Asp Arg Leu Lys Thr Leu845 850 855gag cag agg gcg cgg aag cag cac cag agg tgc ctg gca cat tca ctg 3005Glu Gln Arg Ala Arg Lys Gln His Gln Arg Cys Leu Ala His Ser Leu860 865 870gtg ggg act cca aac tac atc gca ccc gag gtg ctc ctc cgc aaa ggg 3053Val Gly Thr Pro Asn Tyr Ile Ala Pro Glu Val Leu Leu Arg Lys Gly875 880 885tac act caa ctc tgt gac tgg tgg agt gtt gga gtg att ctc ttc gag 3101Tyr Thr Gln Leu Cys Asp Trp Trp Ser Val Gly Val Ile Leu Phe Glu890 895 900 905atg ctg gtg ggg cag ccg ccc ttt ttg gca cct act ccc aca gaa acc 3149Met Leu Val Gly Gln Pro Pro Phe Leu Ala Pro Thr Pro Thr Glu Thr910 915 920cag ctg aag gtg atc aac tgg gag aac acg ctc cac att cca gcc cag 3197Gln Leu Lys Val Ile Asn Trp Glu Asn Thr Leu His Ile Pro Ala Gln925 930 935gtg aag ctg agc cct gag gcc agg gac ctc atc acc aag ctg tgc tgc 3245Val Lys Leu Ser Pro Glu Ala Arg Asp Leu Ile Thr Lys Leu Cys Cys940 945 950tcc gca gac cac cgc ctg ggg cgg aat ggg gcc gat gac ctg aag gcc 3293Ser Ala Asp His Arg Leu Gly Arg Asn Gly Ala Asp Asp Leu Lys Ala955 960 965cac ccc ttc ttc agc gcc att gac ttc tcc agt gac atc cgg aag cag 3341His Pro Phe Phe Ser Ala Ile Asp Phe Ser Ser Asp Ile Arg Lys Gln970 975 980 985cca gcc ccc tac gtt ccc acc atc agc cac ccc atg gac acc tcg aat 3389Pro Ala Pro Tyr Val Pro Thr Ile Ser His Pro Met Asp Thr Ser Asn990 9951000ttc gac ccc gta gat gaa gaa agc cct tgg aac gat gcc agc gaa ggt 3437Phe Asp Pro Val Asp Glu Glu Ser Pro Trp Asn Asp Ala Ser Glu Gly100510101015agc acc aag gcc tgg gac aca ctc acc tcg ccc aat aac aag cat cct 3485Ser Thr Lys Ala Trp Asp Thr Leu Thr Ser Pro Asn Asn Lys His Pro102010251030gag cac gca ttt tac gaa ttc acc ttc cga agg ttc ttt gat gac aat 3533Glu His Ala Phe Tyr Glu Phe Thr Phe Arg Arg Phe Phe Asp Asp Asn103510401045ggc tac ccc ttt cga tgc cca aag cct tca gga gca gaa gct tca cag 3581Gly Tyr Pro Phe Arg Cys Pro Lys Pro Ser Gly Ala Glu Ala Ser Gln1050 105510601065gct gag agc tca gat tta gaa agc tct gat ctg gtg gat cag act gaa 3629Ala Glu Ser Ser Asp Leu Glu Ser Ser Asp Leu Val Asp Gln Thr Glu107010751080ggc tgc cag cct gtg tac gtg tagatggggg ccaggcaccc ccaccactcg3680Gly Cys Gln Pro Val Tyr Val1085ctgcctccca ggtcagggtc ccggagccgg tgccctcaca ggccaatagg gaagccgagg 3740gctgttttgt tttaaattag tccgtcgatt acttcacttg aaattctgct cttcaccaag 3800aaaacccaaa caggacactt ttgaaaacag gactcagcat cgctttcaat aggcttttca 3860ggaccttcac tgcattaaaa caatattttt gaaaatttag tacagtttag aaagagcact 3920tattttgttt atatccattt tttcttacta aattataggg attaactttg acaaatcatg 3980ctgctgttat tttctacatt tgtattttat ccatagcact tattcacatt taggaaaaga 4040cataaaaact gaagaacatt gatgagaaat ctctgtgcaa taatgtaaaa aaaaaaaaga 4100taacactctg ctcaatgtca cggagaccat tttatccaca caatggtttt tgttttttat 4160tttttcccat gtttcaaaat tgtgatataa tgatataatg ttaaaagctg ctttttttgg 4220ctttttgcat atctagtata ataggaagtg tgagcaaggt gatgatgtgg ctgtgatttc 4280cgacgtctgg tgtgtggaga gtactgcatg agcagagttc ttctattata aaattaccat 4340atcttgccat tcacagcagg tcctgtgaat acgtttttac tgagtgtctt taaatgaggt 4400gttctagaca gtgtgctgat aatgtattgt gcgggtgacc tcttcgctat gattgtatct 4460cttactgttt tgttaaagaa atgcagatgt gtaactgaga agtgatttgt gtgtgtgtct 4520tggttgtgat tggattcttt gggggggggg gaactgaaac atttgtcata tactgaactt 4580atatacatca aaagggatta atacagcgat gccaaaaagt ttaatcacgg acacacgtcc 4640gtttctgtag tccgtatgct ctttcattct tggtagagct ggtatgtgga atgccatacc 4700tctgacccta ctacttacct ttttactgac agactgccca cactgaaagc ttcagtgaat 4760gttcttagtc ctgttttctt ctgttactgt caggaaactg agtgatctaa tggttctctc 4820actttttttt tgttctttta gtgtactttg aagtatcaaa tcttaacttg gtttaaacaa 4880tacatattcc taacctttgt aaaaaagcaa agattcttca aaatgacatt gaaataaaaa 4940gtaagccata cgtattttct tagaagtata gatgtatgtg cgtgtataca cacacacaca 5000cacacacaga gataaacaca atattcctta tttcaaatta gtatgattcc tatttaaagt 5060gatttatatt tgagtaaaaa gttcaattct tttttgcttt ttaaaaaatc tgatgcttca 5120taattttcat tatattattc cacatatttt tccttgaagt tcttagcata atgtatccat 5180tacttagtat atatctaggc aacaacactt agaagtttat cagtgtttaa actaaaaaaa 5240taaagattcc tgtgtactgg tttacatttg tgtgagtggc atactcaagt ctgctgtgcc 5300tgtcgtcgtg actgtcagta ttctcgctat tttatagtcg tgccatgttg ttactcacag 5360cgctctgaca tactttcatg tggtaggttc tttctcagga actcagttta actattattt 5420attgatatat cattaccttt gaaaagcttc tactggcaca atttattatt aaaattttga 5480atccag 5486(2)SEQ ID NO2的信息(i)序列特征(A)长度5486碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO1cgcggcgtga gcgccccggg aagatggagc agtcgccgtc cacgccaccg ccgccgcccg 60gggctccccc gtccctgcgg ggccagcagc agctccagcc accagtgccc ggtctcccgg120cgcgagaggc ccgggagccg ccggccagga cgcccccgag ggtgtagacc gcgcccctgg180agagagtgat aatcttcaaa atgaagactt tggaaaattt taggttctct ataggaacta240caaaaatgga aggaaagaac attttcaaaa ggaaattatt ttgaaagtat gtttacaaca300aactgatact attgacagtt ttttttttta aataataaaa cactttaaga agattgtatt360tatggtaaaa ggaaactgga ctaaca atg agg cca aag act ttt cct gcc acg 413Met Arg Pro Lys Thr Phe Pro Ala Thr1 5act tat tct gga aat agc cgg cag cga ctg caa gag att cgt gag ggg 461Thr Tyr Ser Gly Asn Ser Arg Gln Arg Leu Gln Glu Ile Arg Glu Gly10 15 20 25tta aaa cag cca tcc aag tct tcg gtt cag ggg cta ccc gca gga cca 509Leu Lys Gln Pro Ser Lys Ser Ser Val Gln Gly Leu Pro Ala Gly Pro30 35 40aac agt gac act tcc ctg gat gcc aaa gtc ctg ggg agc aaa gat gcc 557Asn Ser Asp Thr Ser Leu Asp Ala Lys Val Leu Gly Ser Lys Asp Ala45 50 55acc agg cag cag cag cag atg aga gcc acc cca aag ttc gga cct tat 605Thr Arg Gln Gln Gln Gln Met Arg Ala Thr Pro Lys Phe Gly Pro Tyr60 65 70cag aaa gcc ttg agg gaa atc aga tat tcc ttg ttg cct ttt gct aat 653Gln Lys Ala Leu Arg Glu Ile Arg Tyr Ser Leu Leu Pro Phe Ala Asn75 80 85gaa tcg ggc acc tct gca gct gca gaa gtg aac cgg caa atg ctg cag 701Glu Ser Gly Thr Ser Ala Ala Ala Glu Val Asn Arg Gln Met Leu Gln90 95 100 105gaa ctg gtg aac gca gga tgc gac cag gag atg gct ggc cga gct ctc 749Glu Leu Val Asn Ala Gly Cys Asp Gln Glu Met Ala Gly Arg Ala Leu110 115 120aag cag act ggc agc agg agc atc gag gcc gcc ctg gag tac atc agc 797Lys Gln Thr Gly Ser Arg Ser Ile Glu Ala Ala Leu Glu Tyr Ile Ser125 130 135aag atg ggc tac ctg gac ccg agg aat gag cag att gtg cgg gtc att 845Lys Met Gly Tyr Leu Asp Pro Arg Asn Glu Gln Ile Val Arg Val Ile140 145 150aag cag acc tcc cca gga aag ggg ctc atg cca acc cca gtg acg cgg 893Lys Gln Thr Ser Pro Gly Lys Gly Leu Met Pro Thr Pro Val Thr Arg155 160 165agg ccc agc ttc gaa gga acc ggc gat tcg ttt gcg tcc tac cac cag 941Arg Pro Ser Phe Glu Gly Thr Gly Asp Ser Phe Ala Ser Tyr His Gln170 175 180 185ctg agc ggt acc ccc tac gag ggc cca agc ttc ggc gct gac ggc ccc 989Leu Ser Gly Thr Pro Tyr Glu Gly Pro Ser Phe Gly Ala Asp Gly Pro190 195 200acg gcg ctg gag gag atg ccg cgg ccg tac gtg gac tac ctt ttc ccc 1037Thr Ala Leu Glu Glu Met Pro Arg Pro Tyr Val Asp Tyr Leu Phe Pro205 210 215gga gtc ggc ccc cac ggg ccc ggc cac cag cac cag cac cca ccc aag 1085Gly Val Gly Pro His Gly Pro Gly His Gln His Gln His Pro Pro Lys220 225 230ggc tac ggt gcc agc gta gag gca gca ggg gca cacttc ccg ctg cag 1133Gly Tyr Gly Ala Ser Val Glu Ala Ala Gly Ala His Phe Pro Leu Gln235 240 245ggc gcg cac tac ggg cgg ccg cac ctg ctg gtg cct ggg gaa ccc ctg 1181Gly Ala His Tyr Gly Arg Pro His Leu Leu Val Pro Gly Glu Pro Leu250 255 260 265ggc tac gga gtg cag cgc agc ccc tcc ttc cag agc aag acg ccg ccg 1229Gly Tyr Gly Val Gln Arg Ser Pro Ser Phe Gln Ser Lys Thr Pro Pro270 275 280gag acc ggg ggt tac gcc agc ctg ccc acg aag ggc cag gga gga ccg 1277Glu Thr Gly Gly Tyr Ala Ser Leu Pro Thr Lys Gly Gln Gly Gly Pro285 290 295cca ggc gcc ggc ctc gct ttc cca ccc cct gcc gcc ggg ctc tac gtg 1325Pro Gly Ala Gly Leu Ala Phe Pro Pro Pro Ala Ala Gly Leu Tyr Val300 305 310ccg cac cca cac cac aag cag gcc ggt ccc gtg gcc cac cag ctg cat 1373Pro His Pro His His Lys Gln Ala Gly Pro Val Ala His Gln Leu His315 320 325gtg ctg ggc tcc cgc agc cag gtg ttc gcc agc gac agc ccc ccg cag 1421Val Leu Gly Ser Arg Ser Gln Val Phe Ala Ser Asp Ser Pro Pro Gln330 335 340 345agc ctg ctc act ccc tcg cgg aac agc ctc aac gtg gac ctg tat gaa 1469Ser Leu Leu Thr Pro Ser Arg Asn Ser Leu Asn Val Asp Leu Tyr Glu350 355 360ttg agc agc acc tcc gtc cag cag tgg ccg gct gcc acc ctg gcc cgc 1517Leu Ser Ser Thr Ser Val Gln Gln Trp Pro Ala Ala Thr Leu Ala Arg365 370 375cgg gac tcc ctg cag aag ccg ggc ctg gag gcg ccg ccg cgc gcg cac 1565Arg Asp Ser Leu Gln Lys Pro Gly Leu Glu Ala Pro Pro Arg Ala His380 385 390gtg gcc ttc cgg cct gac tgc cca gtg ccc agc agg acc aac tcc ttc 1613Val Ala Phe Arg Pro Asp Cys Pro Val Pro Ser Arg Thr Asn Ser Phe395 400 405aac agc cac cag ccg cgg ccc ggt ccg cct ggc aag gcc gag ccc tcc 1661Asn Ser His Gln Pro Arg Pro Gly Pro Pro Gly Lys Ala Glu Pro Ser410 415 420 425ctg ccc gcc ccc aac acc gtg acg gct gtc acg gcc gcg cac atc ttg 1709Leu Pro Ala Pro Asn Thr Val Thr Ala Val Thr Ala Ala His Ile Leu430 435 440cac ccg gtg aag agc gtg cgt gtg ctg agg ccg gag ccg cag acg gct 1757His Pro Val Lys Ser Val Arg Val Leu Arg Pro Glu Pro Gln Thr Ala445 450 455gtg ggg ccc tcg cac ccc gcc tgg gtg ccc gcg cct gcc ccg gcc ccc 1805Val Gly Pro Ser His Pro Ala Trp Val Pro Ala Pro Ala Pro Ala Pro460 465 470gcc ccc gcc ccc gcc ccg gct gcg gag ggc ttg gac gcc aag gag gag 1853Ala Pro Ala Pro Ala Pro Ala Ala Glu Gly Leu Asp Ala Lys Glu Glu475 480 485cat gcc ctg gcg ctg ggc ggc gca ggc gcc ttc ccg ctg gac gtg gag 1901His Ala Leu Ala Leu Gly Gly Ala Gly Ala Phe Pro Leu Asp Val Glu490 495 500 505tac gga ggc cca gac cgg agg tgc ccg cct ccg ccc tac ccg aag cac 1949Tyr Gly Gly Pro Asp Arg Arg Cys Pro Pro Pro Pro Tyr Pro Lys His510 515 520ctg ctg ctg cgc agc aag tcg gag cag tac gac ctg gac agc ctg tgc 1997Leu Leu Leu Arg Ser Lys Ser Glu Gln Tyr Asp Leu Asp Ser Leu Cys525 530 535gca ggc atg gag cag agc ctc cgt gcg ggc ccc aac gag ccc gag ggc 2045Ala Gly Met Glu Gln Ser Leu Arg Ala Gly Pro Asn Glu Pro Glu Gly540 545 550ggc gac aag agc cgc aaa agc gcc aag ggg gac aaa ggc gga aag gat 2093Gly Asp Lys Ser Arg Lys Ser Ala Lys Gly Asp Lys Gly Gly Lys Asp555 560 565aaa aag cag att cag acc tct ccc gtt ccc gtc cgc aaa aac agc aga 2141Lys Lys Gln Ile Gln Thr Ser Pro Val Pro Val Arg Lys Asn Ser Arg570 575 580 585gac gaa gag aag aga gag tca cgc atc aag agc tac tcg cca tac gcc 2189Asp Glu Glu Lys Arg Glu Ser Arg Ile Lys Ser Tyr Ser Pro Tyr Ala590 595 600ttt aag ttc ttc atg gag cag cac gtg gag aat gtc atc aaa acc tac 2237Phe Lys Phe Phe Met Glu Gln His Val Glu Asn Val Ile Lys Thr Tyr605 610 615cag cag aag gtt aac cgg agg ctg cag ctg gag caa gaa atg gcc aaa 2285Gln Gln Lys Val Asn Arg Arg Leu Gln Leu Glu Gln Glu Met Ala Lys620 625 630gct gga ctc tgt gaa gct gag cag gag cag atg cgg aag atc ctc tac 2333Ala Gly Leu Cys Glu Ala Glu Gln Glu Gln Met Arg Lys Ile Leu Tyr635 640 645cag aaa gag tct aat tac aac agg tta aag agg gcc aag atg gac aag 2381Gln Lys Glu Ser Asn Tyr Asn Arg Leu Lys Arg Ala Lys Met Asp Lys650 655 660 665tct atg ttt gtc aag atc aaa acc ctg ggg atc ggt gcc ttt gga gaa 2429Ser Met Phe Val Lys Ile Lys Thr Leu Gly Ile Gly Ala Phe Gly Glu670 675 680gtg tgc ctt gct tgt aag gtg gac act cac gcc ctg tac gcc atg aag 2477Val Cys Leu Ala Cys Lys Val Asp Thr His Ala Leu Tyr Ala Met Lys685 690 695acc cta agg aaa aag gat gtc ctg aac cgg aat cag gtg gcc cac gtc 2525Thr Leu Arg Lys Lys Asp Val Leu Asn Arg Asn Gln Val Ala His Val700 705 710aag gcc gag agg gac atc ctg gcc gag gca gac aat gag tgg gtg gtc 2573Lys Ala Glu Arg Asp Ile Leu Ala Glu Ala Asp Asn Glu Trp Val Val715 720 725aaa ctc tac tac tcc ttc caa gac aaa gac agc ctg tac ttt gtg atg 2621Lys Leu Tyr Tyr Ser Phe Gln Asp Lys Asp Ser Leu Tyr Phe Val Met730 735 740 745gac tac atc cct ggt ggg gac atg atg agc ctg ctg atc cgg atg gag 2669Asp Tyr Ile Pro Gly Gly Asp Met Met Ser Leu Leu Ile Arg Met Glu750 755 760gtc ttc cct gag cac ctg gcc cgg ttc tac atc gca gag ctg act ttg 2717Val Phe Pro Glu His Leu Ala Arg Phe Tyr Ile Ala Glu Leu Thr Leu765 770 775gcc att gag agt gtc cac aag atg ggc ttc atc cac cga gac atc aag 2765Ala Ile Glu Ser Val His Lys Met Gly Phe Ile His Arg Asp Ile Lys780 785 790cct gat aac att ttg ata gat ctg gat ggt cac att aaa ctc aca gat 2813Pro Asp Asn Ile Leu Ile Asp Leu Asp Gly His Ile Lys Leu Thr Asp795 800 805ttc ggc ctc tgc act ggg ttc agg tgg act cac aat tcc aaa tat tac 2861Phe Gly Leu Cys Thr Gly Phe Arg Trp Thr His Asn Ser Lys Tyr Tyr810 815 820 825cag aaa ggg agc cat gtc aga cag gac agc atg gag ccc agc gac ctc 2909Gln Lys Gly Ser His Val Arg Gln Asp Ser Met Glu Pro Ser Asp Leu830 835 840tgg gat gat gtg tct aac tgt cgg tgt ggg gac agg ctg aag acc cta 2957Trp Asp Asp Val Ser Asn Cys Arg Cys Gly Asp Arg Leu Lys Thr Leu845 850 855gag cag agg gcg cgg aag cag cac cag agg tgc ctg gca cat tca ctg 3005Glu Gln Arg Ala Arg Lys Gln His Gln Arg Cys Leu Ala His Ser Leu860 865 870gtg ggg act cca aac tac atc gca ccc gag gtg ctc ctc cgc aaa ggg 3053Val Gly Thr Pro Asn Tyr Ile Ala Pro Glu Val Leu Leu Arg Lys Gly875 880 885tac act caa ctc tgt gac tgg tgg agt gtt gga gtg att ctc ttc gag 3101Tyr Thr Gln Leu Cys Asp Trp Trp Ser Val Gly Val Ile Leu Phe Glu890 895 900 905atg ctg gtg ggg cag ccg ccc ttt ttg gca cct act ccc aca gaa acc 3149Met Leu Val Gly Gln Pro Pro Phe Leu Ala Pro Thr Pro Thr Glu Thr910 915 920cag ctg aag gtg atc aac tgg gag aac acg ctc cac att cca gcc cag 3197Gln Leu Lys Val Ile Asn Trp Glu Asn Thr Leu His Ile Pro Ala Gln925 930 935gtg aag ctg agc cct gag gcc agg gac ctc atc acc aag ctg tgc tgc 3245Val Lys Leu Ser Pro Glu Ala Arg Asp Leu Ile Thr Lys Leu Cys Cys940 945 950tcc gca gac cac cgc ctg ggg cgg aat ggg gcc gat gac ctg aag gcc 3293Ser Ala Asp His Arg Leu Gly Arg Asn Gly Ala Asp Asp Leu Lys Ala955 960 965cac ccc ttc ttc agc gcc att gac ttc tcc agt gac atc cgg aag cag 3341His Pro Phe Phe Ser Ala Ile Asp Phe Ser Ser Asp Ile Arg Lys Gln970 975 980 985cca gcc ccc tac gtt ccc acc atc agc cac ccc atg gac acc tcg aat 3389Pro Ala Pro Tyr Val Pro Thr Ile Ser His Pro Met Asp Thr Ser Asn990 9951000ttc gac ccc gta gat gaa gaa agc cct tgg aac gat gcc agc gaa ggt 3437Phe Asp Pro Val Asp Glu Glu Ser Pro Trp Asn Asp Ala Ser Glu Gly10051010 1015agc acc aag gcc tgg gac aca ctc acc tcg ccc aat aac aag cat cct 3485Ser Thr Lys Ala Trp Asp Thr Leu Thr Ser Pro Asn Asn Lys His Pro102010251030gag cac gca ttt tac gaa ttc acc ttc cga agg ttc ttt gat gac aat 3533Glu His Ala Phe Tyr Glu Phe Thr Phe Arg Arg Phe Phe Asp Asp Asn103510401045ggc tac ccc ttt cga tgc cca aag cct tca gga gca gaa gct tca cag 3581Gly Tyr Pro Phe Arg Cys Pro Lys Pro Ser Gly Ala Glu Ala Ser Gln105010551060 1065gct gag agc tca gat tta gaa agc tct gat ctg gtg gat cag act gaa 3629Ala Glu Ser Ser Asp Leu Glu Ser Ser Asp Leu Val Asp Gln Thr Glu107010751080ggc tgc cag cct gtg tac gtg tagatggggg ccaggcaccc ccaccactcg 3680Gly Cys Gln Pro Val Tyr Val1085ctgcctccca ggtcagggtc ccggagccgg tgccctcaca ggccaatagg gaagccgagg 3740gctgttttgt tttaaattag tccgtcgatt acttcacttg aaattctgct cttcaccaag 3800aaaacccaaa caggacactt ttgaaaacag gactcagcat cgctttcaat aggcttttca 3860ggaccttcac tgcattaaaa caatattttt gaaaatttag tacagtttag aaagagcact 3920tattttgttt atatccattt tttcttacta aattataggg attaactttg acaaatcatg 3980ctgctgttat tttctacatt tgtattttat ccatagcact tattcacatt taggaaaaga 4040cataaaaact gaagaacatt gatgagaaat ctctgtgcaa taatgtaaaa aaaaaaaaga 4100taacactctg ctcaatgtca cggagaccat tttatccaca caatggtttt tgttttttat 4160tttttcccat gtttcaaaat tgtgatataa tgatataatg ttaaaagctg ctttttttgg 4220ctttttgcat atctagtata ataggaagtg tgagcaaggt gatgatgtgg ctgtgatttc 4280cgacgtctgg tgtgtggaga gtactgcatg agcagagttc ttctattata aaattaccat 4340atcttgccat tcacagcagg tcctgtgaat acgtttttac tgagtgtctt taaatgaggt 4400gttctagaca gtgtgctgat aatgtattgt gcgggtgacc tcttcgctat gattgtatct 4460cttactgttt tgttaaagaa atgcagatgt gtaactgaga agtgatttgt gtgtgtgtct 4520tggttgtgat tggattcttt gggggggggg gaactgaaac atttgtcata tactgaactt 4580atatacatca aaagggatta atacagcgat gccaaaaagt ttaatcacgg acacacgtcc 4640gtttctgtag tccgtatgct ctttcattct tggtagagct ggtatgtgga atgccatacc 4700tctgacccta ctacttacct ttttactgac agactgccca cactgaaagc ttcagtgaat 4760gttcttagtc ctgttttctt ctgttactgt caggaaactg agtgatctaa tggttctctc 4820actttttttt tgttctttta gtgtactttg aagtatcaaa tcttaacttg gtttaaacaa 4880tacatattcc taacctttgt aaaaaagcaa agattcttca aaatgacatt gaaataaaaa 4940gtaagccata cgtattttct tagaagtata gatgtatgtg cgtgtataca cacacacaca 5000cacacacaga gataaacaca atattcctta tttcaaatta gtatgattcc tatttaaagt 5060gatttatatt tgagtaaaaa gttcaattct tttttgcttt ttaaaaaatc tgatgcttca 5120taattttcat tatattattc cacatatttt tccttgaagt tcttagcata atgtatccat 5180tacttagtat atatctaggc aacaacactt agaagtttat cagtgtttaa actaaaaaaa 5240taaagattcc tgtgtactgg tttacatttg tgtgagtggc atactcaagt ctgctgtgcc 5300tgtcgtcgtg actgtcagta ttctcgctat tttatagtcg tgccatgttg ttactcacag 5360cgctctgaca tactttcatg tggtaggttc tttctcagga actcagttta actattattt 5420attgatatat cattaccttt gaaaagcttc tactggcaca atttattatt aaaattttga 5480atccag 5486(2)SEQ ID NO3的信息(i)序列特征(A)长度1088氨基酸(B)类型PRT(vi)来源(A)生物智人(xi)序列描述SEQ ID NO3Met Arg Pro Lys Thr Phe Pro Ala Thr Thr Tyr Ser Gly Asn Ser Arg1 5 10 15Gln Arg Leu Gln Glu Ile Arg Glu Gly Leu Lys Gln Pro Ser Lys Ser20 25 30Ser Val Gln Gly Leu Pro Ala Gly Pro Asn Ser Asp Thr Ser Leu Asp35 40 45Ala Lys Val Leu Gly Ser Lys Asp Ala Thr Arg Gln Gln Gln Gln Met50 55 60Arg Ala Thr Pro Lys Phe Gly Pro Tyr Gln Lys Ala Leu Arg Glu Ile65 70 75 80Arg Tyr Ser Leu Leu Pro Phe Ala Asn Glu Ser Gly Thr Ser Ala Ala85 90 95Ala Glu Val Asn Arg Gln Met Leu Gln Glu Leu Val Asn Ala Gly Cys100 105 110Asp Gln Glu Met Ala Gly Arg Ala Leu Lys Gln Thr Gly Ser Arg Ser115 120 125Ile Glu Ala Ala Leu Glu Tyr Ile Ser Lys Met Gly Tyr Leu Asp Pro130 135 140Arg Asn Glu Gln Ile Val Arg Val Ile Lys Gln Thr Ser Pro Gly Lys145 150 155 160Gly Leu Met Pro Thr Pro Val Thr Arg Arg Pro Ser Phe Glu Gly Thr165 170 175Gly Asp Ser Phe Ala Ser Tyr His Gln Leu Ser Gly Thr Pro Tyr Glu180 185 190Gly Pro Ser Phe Gly Ala Asp Gly Pro Thr Ala Leu Glu Glu Met Pro195 200 205Arg Pro Tyr Val Asp Tyr Leu Phe Pro Gly Val Gly Pro His Gly Pro210 215 220Gly His Gln His Gln His Pro Pro Lys Gly Tyr Gly Ala Ser Val Glu225 230 235 240Ala Ala Gly Ala His Phe Pro Leu Gln Gly Ala His Tyr Gly Arg Pro245 250 255His Leu Leu Val Pro Gly Glu Pro Leu Gly Tyr Gly Val Gln Arg Ser260 265 270Pro Ser Phe Gln Ser Lys Thr Pro Pro Glu Thr Gly Gly Tyr Ala Ser275 280 285Leu Pro Thr Lys Gly Gln Gly Gly Pro Pro Gly Ala Gly Leu Ala Phe290 295 300Pro Pro Pro Ala Ala Gly Leu Tyr Val Pro His Pro His His Lys Gln305 310 315 320Ala Gly Pro Ala Ala His Gln Leu His Val Leu Gly Ser Arg Ser Gln325 330 335Val Phe Ala Ser Asp Ser Pro Pro Gln Ser Leu Leu Thr Pro Ser Arg340 345 350Asn Ser Leu Asn Val Asp Leu Tyr Glu Leu Gly Ser Thr Ser Val Gln355 360 365Gln Trp Pro Ala Ala Thr Leu Ala Arg Arg Asp Ser Leu Gln Lys Pro370 375 380Gly Leu Glu Ala Pro Pro Arg Ala His Val Ala Phe Arg Pro Asp Cys385 390 395 400Pro Val Pro Ser Arg Thr Asn Ser Phe Asn Ser His Gln Pro Arg Pro405 410 415Gly Pro Pro Gly Lys Ala Glu Pro Ser Leu Pro Ala Pro Asn Thr Val420 425 430Thr Ala Val Thr Ala Ala His Ile Leu His Pro Val Lys Ser Val Arg435 440 445Val Leu Arg Pro Glu Pro Gln Thr Ala Val Gly Pro Ser His Pro Ala450 455 460Trp Val Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala465 470 475 480Ala Glu Gly Leu Asp Ala Lys Glu Glu His Ala Leu Ala Leu Gly Gly785 490 495Ala Gly Ala Phe Pro Leu Asp Val Glu Tyr Gly Gly Pro Asp Arg Arg500 505 510Cys Pro Pro Pro Pro Tyr Pro Lys His Leu Leu Leu Arg Ser Lys Ser515 520 525Glu Gln Tyr Asp Leu Asp Ser Leu Cys Ala Gly Met Glu Gln Ser Leu530 353 340Arg Ala Gly Pro Asn Glu Pro Glu Gly Gly Asp Lys Ser Arg Lys Ser545 550 555 560Ala Lys Gly Asp Lys Gly Gly Lys Asp Lys Lys Gln Ile Gln Thr Ser565 570 575Pro Val Pro Val Arg Lys Asn Ser Arg Asp Glu Glu Lys Arg Glu Ser580 585 590Arg Ile Lys Ser Tyr Ser Pro Tyr Ala Phe Lys Phe Phe Met Glu Gln595 600 605His Val Glu Asn Val Ile Lys Thr Tyr Gln Gln Lys Val Asn Arg Arg610 615 620Leu Gln Leu Glu Gln Glu Met Ala Lys Ala Gly Leu Cys Glu Ala Glu625 630 635 640Gln Glu Gln Met Arg Lys Ile Leu Tyr Gln Lys Glu Ser Asn Tyr Asn645 650 655Arg Leu Lys Arg Ala Lys Met Asp Lys Ser Met Phe Val Lys Ile Lys660 665 670Thr Leu Gly Ile Gly Ala Phe Gly Glu Val Cys Leu Ala Cys Lys Val675 680 685Asp Thr His Ala Leu Tyr Ala Met Lys Thr Leu Arg Lys Lys Asp Val690 695 700Leu Asn Arg Asn Gln Val Ala His Val Lys Ala Glu Arg Asp Ile Leu705 710 715 720Ala Glu Ala Asp Asn Glu Trp Val Val Lys Leu Tyr Tyr Ser Phe Gln725 730 735Asp Lys Asp Ser Leu Tyr Phe Val Met Asp Tyr Ile Pro Gly Gly Asp740 745 750Met Met Ser Leu Leu Ile Arg Met Glu Val Phe Pro Glu His Leu Ala755 760 765Arg Phe Tyr Ile Ala Glu Leu Thr Leu Ala Ile Glu Ser Val His Lys770 775 780Met Gly Phe Ile His Arg Asp Ile Lys Pro Asp Asn Ile Leu Ile Asp785 790 795 800Leu Asp Gly His Ile Lys Leu Thr Asp Phe Gly Leu Cys Thr Gly Phe805 810 815Arg Trp Thr His Asn Ser Lys Tyr Tyr Gln Lys Gly Ser His Val Arg820 825 830Gln Asp Ser Met Glu Pro Ser Asp Leu Trp Asp Asp Val Ser Asn Cys835 840 845Arg Cys Gly Asp Arg Leu Lys Thr Leu Glu Gln Arg Ala Arg Lys Gln850 855 860His Gln Arg Cys Leu Ala His Ser Leu Val Gly Thr Pro Asn Tyr Ile865 870 875 880Ala Pro Glu Val Leu Leu Arg Lys Gly Tyr Thr Gln Leu Cys Asp Trp885 890 895Trp Ser Val Gly Val Ile Leu Phe Glu Met Leu Val Gly Gln Pro Pro900 905 910Phe Leu Ala Pro Thr Pro Thr Glu Thr Gln Leu Lys Val Ile Asn Trp915 920 925Glu Asn Thr Leu His Ile Pro Ala Gln Val Lys Leu Ser Pro Glu Ala930 935 940Arg Asp Leu Ile Thr Lys Leu Cys Cys Ser Ala Asp His Arg Leu Gly945 950 955 960Arg Asn Gly Ala Asp Asp Leu Lys Ala His Pro Phe Phe Ser Ala Ile965 970 975Asp Phe Ser Ser Asp Ile Arg Lys Gln Pro Ala Pro Tyr Val Pro Thr980 985 990Ile Ser His Pro Met Asp Thr Ser Asn Phe Asp Pro Val Asp Glu Glu995 10001005Ser Pro Trp Asn Asp Ala Ser Glu Gly Ser Thr Lys Ala Trp Asp Thr101010151020Leu Thr Ser Pro Asn Asn Lys His Pro Glu His Ala Phe Tyr Glu Phe1025103010351040Thr Phe Arg Arg Phe Phe Asp Asp Asn Gly Tyr Pro Phe Arg Cys Pro104510501055Lys Pro Ser Gly Ala Glu Ala Ser Gln Ala Glu Ser Ser Asp Leu Glu106010651070Ser Ser Asp Leu Val Asp Gln Thr Glu Gly Cys Gln Pro Val Tyr Val107510801085(2)SEQ ID NO4的信息(i)序列特征(A)长度1088氨基酸(B)类型PRT(vi)来源(A)生物智人(xi)序列描述SEQ ID NO4Met Arg Pro Lys Thr Phe Pro Ala Thr Thr Tyr Ser Gly Asn Ser Arg1 5 10 15Gln Arg Leu Gln Glu Ile Arg Glu Gly Leu Lys Gln Pro Ser Lys Ser20 25 30Ser Val Gln Gly Leu Pro Ala Gly Pro Asn Ser Asp Thr Ser Leu Asp35 40 45Ala Lys Val Leu Gly Ser Lys Asp Ala Thr Arg Gln Gln Gln Gln Met50 55 60Arg Ala Thr Pro Lys Phe Gly Pro Tyr Gln Lys Ala Leu Arg Glu Ile65 70 75 80Arg Tyr Ser Leu Leu Pro Phe Ala Asn Glu Ser Gly Thr Ser Ala Ala85 90 95Ala Glu Val Asn Arg Gln Met Leu Gln Glu Leu Val Asn Ala Gly Cys100 105 110Asp Gln Glu Met Ala Gly Arg Ala Leu Lys Gln Thr Gly Ser Arg Ser115 120 125Ile Glu Ala Ala Leu Glu Tyr Ile Ser Lys Met Gly Tyr Leu Asp Pro130 135 140Arg Asn Glu Gln Ile Val Arg Val Ile Lys Gln Thr Ser Pro Gly Lys145 150 155 160Gly Leu Met Pro Thr Pro Val Thr Arg Arg Pro Ser Phe Glu Gly Thr165 170 175Gly Asp Ser Phe Ala Ser Tyr His Gln Leu Ser Gly Thr Pro Tyr Glu180 185 190Gly Pro Ser Phe Gly Ala Asp Gly Pro Thr Ala Leu Glu Glu Met Pro195 200 205Arg Pro Tyr Val Asp Tyr Leu Phe Pro Gly Val Gly Pro His Gly Pro210 215 220Gly His Gln His Gln His Pro Pro Lys Gly Tyr Gly Ala Ser Val Glu225 230 235 240Ala Ala Gly Ala His Phe Pro Leu Gln Gly Ala His Tyr Gly Arg Pro245 250 255His Leu Leu Val Pro Gly Glu Pro Leu Gly Tyr Gly Val Gln Arg Ser260 265 270Pro Ser Phe Gln Ser Lys Thr Pro Pro Glu Thr Gly Gly Tyr Ala Ser275 280 285Leu Pro Thr Lys Gly Gln Gly Gly Pro Pro Gly Ala Gly Leu Ala Phe290 295 300Pro Pro Pro Ala Ala Gly Leu Tyr Val Pro His Pro His His Lys Gln305 310 315 320Ala Gly Pro Val Ala His Gln Leu His Val Leu Gly Ser Arg Ser Gln325 330 335Val Phe Ala Ser Asp Ser Pro Pro Gln Ser Leu Leu Thr Pro Ser Arg340 345 350Asn Ser Leu Asn Val Asp Leu Tyr Glu Leu Ser Ser Thr Ser Val Gln355 360 365Gln Trp Pro Ala Ala Thr Leu Ala Arg Arg Asp Ser Leu Gln Lys Pro
370 375 380Gly Leu Glu Ala Pro Pro Arg Ala His Val Ala Phe Arg Pro Asp Cys385 390 395 400Pro Val Pro Ser Arg Thr Asn Ser Phe Asn Ser His Gln Pro Arg Pro405 410 415Gly Pro Pro Gly Lys Ala Glu Pro Ser Leu Pro Ala Pro Asn Thr Val420 425 430Thr Ala Val Thr Ala Ala His Ile Leu His Pro Val Lys Ser Val Arg435 440 445Val Leu Arg Pro Glu Pro Gln Thr Ala Val Gly Pro Ser His Pro Ala450 455 460Trp Val Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala465 470 475 480Ala Glu Gly Leu Asp Ala Lys Glu Glu His Ala Leu Ala Leu Gly Gly785 490 495Ala Gly Ala Phe Pro Leu Asp Val Glu Tyr Gly Gly Pro Asp Arg Arg500 505 510Cys Pro Pro Pro Pro Tyr Pro Lys His Leu Leu Leu Arg Ser Lys Ser515 520 525Glu Gln Tyr Asp Leu Asp Ser Leu Cys Ala Gly Met Glu Gln Ser Leu530 353 340Arg Ala Gly Pro Asn Glu Pro Glu Gly Gly Asp Lys Ser Arg Lys Ser545 550 555 560Ala Lys Gly Asp Lys Gly Gly Lys Asp Lys Lys Gln Ile Gln Thr Ser565 570 575Pro Val Pro Val Arg Lys Asn Ser Arg Asp Glu Glu Lys Arg Glu Ser580 585 590Arg Ile Lys Ser Tyr Ser Pro Tyr Ala Phe Lys Phe Phe Met Glu Gln595 600 605His Val Glu Asn Val Ile Lys Thr Tyr Gln Gln Lys Val Asn Arg Arg610 615 620Leu Gln Leu Glu Gln Glu Met Ala Lys Ala Gly Leu Cys Glu Ala Glu625 630 635 640Gln Glu Gln Met Arg Lys Ile Leu Tyr Gln Lys Glu Ser Asn Tyr Asn645 650 655Arg Leu Lys Arg Ala Lys Met Asp Lys Ser Met Phe Val Lys Ile Lys660 665 670Thr Leu Gly Ile Gly Ala Phe Gly Glu Val Cys Leu Ala Cys Lys Val675 680 685Asp Thr His Ala Leu Tyr Ala Met Lys Thr Leu Arg Lys Lys Asp Val690 695 700Leu Asn Arg Asn Gln Val Ala His Val Lys Ala Glu Arg Asp Ile Leu705 710 715 720Ala Glu Ala Asp Asn Glu Trp Val Val Lys Leu Tyr Tyr Ser Phe Gln725 730 735Asp Lys Asp Ser Leu Tyr Phe Val Met Asp Tyr Ile Pro Gly Gly Asp740 745 750Met Met Ser Leu Leu Ile Arg Met Glu Val Phe Pro Glu His Leu Ala755 760 765Arg Phe Tyr Ile Ala Glu Leu Thr Leu Ala Ile Glu Ser Val His Lys770 775 780Met Gly Phe Ile His Arg Asp Ile Lys Pro Asp Asn Ile Leu Ile Asp785 790 795 800Leu Asp Gly His Ile Lys Leu Thr Asp Phe Gly Leu Cys Thr Gly Phe805 810 815Arg Trp Thr His Asn Ser Lys Tyr Tyr Gln Lys Gly Ser His Val Arg820 825 830Gln Asp Ser Met Glu Pro Ser Asp Leu Trp Asp Asp Val Ser Asn Cys835 840 845Arg Cys Gly Asp Arg Leu Lys Thr Leu Glu Gln Arg Ala Arg Lys Gln850 855 860His Gln Arg Cys Leu Ala His Ser Leu Val Gly Thr Pro Asn Tyr Ile865 870 875 880Ala Pro Glu Val Leu Leu Arg Lys Gly Tyr Thr Gln Leu Cys Asp Trp885 890 895Trp Ser Val Gly Val Ile Leu Phe Glu Met Leu Val Gly Gln Pro Pro900 905 910Phe Leu Ala Pro Thr Pro Thr Glu Thr Gln Leu Lys Val Ile Asn Trp915 920 925Glu Asn Thr Leu His Ile Pro Ala Gln Val Lys Leu Ser Pro Glu Ala
930 935 940Arg Asp Leu Ile Thr Lys Leu Cys Cys Ser Ala Asp His Arg Leu Gly945 950 955 960Arg Asn Gly Ala Asp Asp Leu Lys Ala His Pro Phe Phe Ser Ala Ile965 970 975Asp Phe Ser Ser Asp Ile Arg Lys Gln Pro Ala Pro Tyr Val Pro Thr980 985 990Ile Ser His Pro Met Asp Thr Ser Asn Phe Asp Pro Val Asp Glu Glu995 10001005Ser Pro Trp Asn Asp Ala Ser Glu Gly Ser Thr Lys Ala Trp Asp Thr101010151020Leu Thr Ser Pro Asn Asn Lys His Pro Glu His Ala Phe Tyr Glu Phe1025103010351040Thr Phe Arg Arg Phe Phe Asp Asp Asn Gly Tyr Pro Phe Arg Cys Pro104510501055Lys Pro Ser Gly Ala Glu Ala Ser Gln Ala Glu Ser Ser Asp Leu Glu106010651070Ser Ser Asp Leu Val Asp Gln Thr Glu Gly Cys Gln Pro Val Tyr Val107510801085(2)SEQ ID NO5的信息(i)序列特征(A)长度17碱基对(B)类型DNA(vi)来源(A)生物M13噬菌体(xi)序列描述SEQ ID NO5gtaaaacgac ggccagt17(2)SEQ ID NO6的信息(i)序列特征(A)长度17碱基对(B)类型DNA(vi)来源
(A)生物M13噬菌体(xi)序列描述SEQ ID NO6caggaaacag ctatgac17(2)SEQ ID NO7的信息(i)序列特征(A)长度26碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO7tccaaatatt accagaaagg gagcca 26(2)SEQ IDNO8的信息(i)序列特征(A)长度19碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO8gacctctggg atgatgtgt 19(2)SEQ ID NO9的信息(i)序列特征(A)长度26碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO9agaggtcttg ggcacatttc actggt 26
(2)SEQ ID NO10的信息(i)序列特征(A)长度19碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO10cctgagcacg cattttacg 19(2)SEQ ID NO11的信息(i)序列特征(A)长度19碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO11acaatggcta cccctttcg 19(2)SEQ ID NO12的信息(i)序列特征(A)长度18碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO12ttcgtaaaat gcgtgctc 18(2)SEQ ID NO13的信息(i)序列特征(A)长度20碱基对(B)类型DNA
(vi)来源(A)生物智人(xi)序列描述SEQ ID NO13cctgtttggg ttttcttggt 20(2)SEQ ID NO14的信息(i)序列特征(A)长度28碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO14tcatcacctt gctcacactt ccctatta28(2)SEQ ID NO15的信息(i)序列特征(A)长度21碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO15catcaccttg ctcacacttc c 21(2)SEQ ID NO16的信息(i)序列特征(A)长度25碱基对(B)类型DNA(vi)来源(A)生物智人
(xi)序列描述SEQ ID NO16gtcggaaatc acagccacat catca 25(2)SEQ ID NO17的信息(i)序列特征(A)长度19碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO17ttcgtttgcg tcctaccac 19(2)SEQ ID NO18的信息(i)序列特征(A)长度16碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO18gcggcgtctt gctctg 16(2)SEQ ID NO19的信息(i)序列特征(A)长度21碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO19ctgctctggt ctcaatttaa g 21
(2)SEQ ID NO20的信息(i)序列特征(A)长度19碱基对(B)类型DNA(vi)来源(A)生物智人(xi)序列描述SEQ ID NO20caagtctgct gtgcctgtc 19(2)SEQ ID NO21的信息(i)序列特征(A)长度22碱基对(B)类型DNA(vi)来源(A)生物T7噬菌体(xi)序列描述SEQ ID NO21ctaatacgac tcactatagg ga 22(2)SEQ ID NO22的信息(i)序列特征(A)长度20碱基对(B)类型DNA(vi)来源(A)生物T7噬菌体(xi)序列描述SEQ ID NO22ggttttccca gtcacgacgt 20
权利要求
1.一种DNA,它具有序列表中SEQ ID NO1或SEQ ID NO2所示核苷酸序列。
2.一种构成人基因的DNA,该基因的表达受生长因子抑制,它具有序列表中SEQ ID NO1或SEQ ID NO2所示的核苷酸序列或相对于任一所述核苷酸序列有一个或多个碱基缺失、取代或增加的核苷酸序列。
3.根据权利要求2所述的构成人基因的DNA,其中生长因子是人生长激素或胰岛素样生长因子-1。
4.一种构成人基因的DNA,该基因编码肿瘤抑制蛋白,它具有序列表中SEQ IDNO1或SEQ ID NO2所示的核苷酸序列或相对于任一所述核苷酸序列有一个或多个碱基缺失、取代或增加的核苷酸序列。
5.一种蛋白,它具有序列表中SEQ ID NO3或SEQ ID NO4所示的氨基酸序列。
6.一种蛋白,该蛋白的表达受生长因子抑制,它具有序列表中SEQ ID NO3或SEQ ID NO4所示的氨基酸序列或相对于任一所述氨基酸序列有一个或多个氨基酸缺失、替代或增加的氨基酸序列。
7.根据权利要求6所述的蛋白,其中生长因子是人生长激素或胰岛素样生长因子-1。
8.一种肿瘤抑制蛋白,它具有序列表中SEQ ID NO3或SEQ ID NO4所示的氨基酸序列或相对于任一所述的氨基酸序列有一个或多个氨基酸缺失、替代或增加的氨基酸序列。
9.一种DNA,它包含编码具有权利要求5-8所述氨基酸序列的蛋白质的核苷酸序列。
10.一种探针,它包含与权利要求1、2、3或4所述的核苷酸序列组成的DNA杂交的DNA。
11.一种探针,它包含与权利要求9所述的核苷酸序列组成的DNA杂交的DNA。
12.一种重组载体,它包括由权利要求1、2、3或4所述的核苷酸序列组成的DNA。
13.一种重组载体,它包括由权利要求9所述的核苷酸序列组成的DNA。
14.一种用作引物的DNA片段,它由权利要求1、2、3或4所述的核苷酸序列的部分序列组成。
15.一种用作引物的DNA片段,它由权利要求9所述的核苷酸序列的部分序列组成。
16.一种人用诊断性药物制剂,它包含权利要求10所述的探针。
17.一种人用诊断性药物制剂,它包含权利要求11所述的探针。
18.权利要求16所述的诊断性药物制剂在侏儒症、巨人症、肢端肥大症、血管病、糖尿病性肾病、或心脏病、或包括乳房癌、肾腺癌、结肠直肠癌和白血病的恶性肿瘤中用于检查受生长激素抑制的肿瘤抑制基因的表达。
19.权利要求17所述的诊断性药物制剂在侏儒症、巨人症、肢端肥大症、血管病、糖尿病性肾病、或心脏病、或包括乳房癌、肾腺癌、结肠直肠癌和白血病的恶性肿瘤中用于检查受生长激素抑制的肿瘤抑制基因表达的应用。
20.一种抗肿瘤药物制剂,它含有权利要求5-8之一所述的蛋白。
21.一种针对权利要求5-8之一所述的蛋白的多克隆或单克隆抗体。
22.一种诊断性药物制剂,它含有权利要求21所述的抗体用来检查肿瘤抑制基因的表达。
全文摘要
本发明提供了一种新的人肿瘤抑制基因,它编码肿瘤抑制蛋白,它的表达受人生长激素的抑制。本发明还提供了组成该基因的DNA以及该基因编码的蛋白。该DNA具有序列表中SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列。
文档编号A61K38/27GK1263154SQ9912696
公开日2000年8月16日 申请日期1999年12月21日 优先权日1999年1月25日
发明者古贺淳一, 河野惠子, F·N·佐洛塔里奥夫 申请人:日本化学研究株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1