新型dna及用其制备蛋白质的方法

文档序号:3550023阅读:263来源:国知局
专利名称:新型dna及用其制备蛋白质的方法
技术领域
本发明涉及新型的DNA及用该DNA采用基因工程的方法制备具有抑制破骨细胞分化和/或成熟作用(以下称作抑制破骨细胞形成作用)的蛋白质的方法。具体地涉及编码具有抑制破骨细胞形成作用的蛋白质的基因组DNA,以及用该基因组DNA采用基因工程的方法制备蛋白质的方法。
背景技术
人的骨胳是不断反复地吸收与再形成的,在此过程中起核心功能的细胞是起骨形成作用的成骨细胞和起骨吸收作用的破骨细胞。因与这些细胞有关的骨代谢的异常而发生的疾病可举骨质疏松症为代表。这种疾病是由破骨细胞引起的骨吸收超过成骨细胞引起的骨形成而导致的疾病,然而,关于这种疾病的发生机制,目前仍未完全阐明。这种疾病发生骨痛,而由于骨脆弱成为骨折的原因。因而,随着高龄人口的增加,这种疾病成为因骨折而卧床的老人的发生原因,也已成为社会问题,其治疗药的开发正成为当务之急。这样的骨代谢异常所致骨量减少症,期望通过抑制骨吸收、促进骨形成或改善它们的平衡而加以治疗。
与骨形成有关的对细胞的增殖、分化或激活的促进,或对与骨吸收有关的细胞的增殖,分化或激活的抑制,可望促进骨形成。近年来,对具有这种生理活性的蛋白质(细胞因子)的关注增多,并进行了集中精力的研究。有人报导了促进成骨细胞增殖或分化的细胞因子有成纤维细胞生长因子家族(fibroblast growthfactor;FGFRodan S.B.et al.,Endocrinology vol.121,p1917,1987)、胰岛素样生长因子-I(insulin like growth factor-I;IGF-I;Hock J.M.et al.,Endocrinologyvol.122,p254,1988)、胰岛素样生长因子-II(IGF-II;McCarthy T.et al.,Endocrinology vol.124,p301,1989)、激活素A(Activin A;Centrella M.et al.,Mol.Cell.Biol.vol.ll,p250,1991)、转化生长因子-β(transforming growth factor-β;NodaM.,The Bone,vol.2,p29,1988)促血管蛋白(Vasculotropin;Varonique M.et al.,Biochem.Biophys.Res.Commun.vol.199,p380,1994)、和骨形态发生蛋白系列(bone morphogenetic protein;BMP;BMP-2;Yamaguchi,A et al.,J.Cell Biol.Vol.113,p682,1991,OP-1 Sampath T.K.et al.,J.Biol Chem.vol.267,p20532,1992、Knutsen R.et al.,Biochem,Biophys.Res.Commun.vol.194,p1352,1993)等细胞因子。
另一方面,作为抑制破骨细胞形成即破骨细胞的分化和/或成熟的细胞因子,据报告有转化生长因子-β(transforming growth factor-β;Chenu C.et al.,Proc.Natl.Acad.Sci.USA,vol.85,p5683,1988)及白介素-4(interleukin-4;Kasano K.et al.,Bone-Miner.,vol.21,p179,1993)等。而抑制因破骨细胞所致骨吸收的细胞因子,据报告有降钙素(calcitonin;Bone-Miner.,vol.17,p347,1992)、巨噬细胞集落刺激因子(macrophage colony-stimulating factor;Hattersley G.et al.J.Cell.Physiol.vol.137,p199,1988)、白介素-4(Watanabe,K.et al.,Biochem.Biophys.Res.Commun.vol.172,p1035,1990)、及γ-干扰素(interferon-γ;Gowen M.et al.,J.Bone Miner.Res.,vol.1,p469,1986)等。
这些细胞因子可望成为通过促进骨形成和抑制骨吸收作用而改善骨量减少症的药物。胰岛素样生长因子-I和骨形态发生蛋白家族的细胞因子等,就上述细胞因子的一部分而言,作为骨代谢改善剂,正在进行临床试验。而降钙素作为骨质疏松症的治疗药和镇痛药已有市售。目前,作为治疗与骨有关的疾病及缩短治疗周期的医药品,在临床上使用的有活性型维生素D3、降钙素及其衍生物、雌二醇等激素制剂、依普黄酮(ipriflavone)或钙制剂等。然而,采用这些药品的治疗法,其效果和治疗结果是不能令人满意的,期望开发代替这些医药品的新治疗药。
本发明者们鉴于这样的现状进行锐意探索的结果,已发现在人胎儿肺成纤维细胞IMR-90(保藏于ATCC-保藏号CCL186)的培养液中存在具有抑制破骨细胞形成作用即抑制破骨细胞分化·成熟的作用的蛋白质OCIF(PCT/JP96/00374)。对于该具有抑制破骨细胞形成作用的蛋白质OCIF的来源,进一步进行锐意探索,于是确定了来源于人的OCIF的基因组DNA的碱基序列。即,本发明以提供编码具有抑制破骨细胞形成作用的蛋白质OCIF的基因组DNA及采用基因工程的方法用来制备该蛋白质的方法作为课题。
发明的揭示本发明涉及编码具有抑制破骨细胞形成作用的蛋白质OCIF的基因组DNA,以及用该基因组DNA采用基因工程的方法制备蛋白质的方法。序列表序列1和2包含本发明的DNA的碱基序列。
本发明还涉及将含序列表中序列1和2的碱基序列的DNA插入表达载体,制成可表达具有如下理化性质、有抑制破骨细胞分化和/或成熟作用的蛋白质的载体,用此载体用基因工程方法制备该蛋白质的方法。
(a)分子量(用SDS-PAGE法测得)(i)在还原条件下约为60kD(ii)在非还原条件下约为60kD和约为120kD(b)氨基酸序列具有序列表中序列3的氨基酸序列。
(C)亲和性对阳离子交换剂和肝素有亲和性。
(D)热稳定性(i)70℃、10分钟或56℃、30分钟的热处理降低抑制破骨细胞分化、成熟的活性。
(ii)90℃、10分钟的热处理,使抑制破骨细胞分化、成熟的作用消失。
本发明的基因表达所得的蛋白质具有抑制破骨细胞形成的作用,可用作以治疗和改善骨质疏松症等骨量减少症、风湿性或变形性关节炎等骨代谢异常疾病或多发性骨髓肿瘤等骨代谢异常疾病为目的的医药组合物,或用作确立这些疾病的免疫学诊断的抗原。
附图的简单说明

图1表示在实施例4(iii)中将本发明的基因组DNA表达所得的蛋白质的Western印迹试验的结果。其中,1为标记,2为转染了载体pWESRαOCIF的COS7细胞培养上清液(实施例4(iii)),3为转染了载体pWESRα的COS7细胞培养上清液(对照)。
实施发明的最佳方案用人胎盘基因组DNA和粘粒载体制成粘粒文库,以基于OCIF cDNA制成的DNA片断为探针筛选该文库,可得到本发明的编码具有抑制破骨细胞形成作用的蛋白质OCIF的基因组DNA。将这样得到的基因组DNA插入适当的表达载体,制成表达OCIF的粘粒,按常规方法转染各种细胞和菌株等宿主,进行表达,可制成重组型OCIF。所得的具有抑制破骨细胞形成作用的蛋白质(破骨细胞形成抑制因子),可用作以治疗和改善骨质疏松症等骨量减少症或其它骨代谢异常疾病为目的的医药组合物,或用作确立这些疾病的免疫学诊断的抗原。含本发明的蛋白质的制剂作为含有破骨细胞形成抑制因子活性成分的医药组合物,可对人或动物安全地给药。医药组合物的形态可为注射用组合物、点滴用组合物、栓剂、经鼻剂、舌下剂、经皮吸收剂等。注射用组合物是药理有效量的本发明的破骨细胞形成抑制因子和制药学上允许的载体的混合物,其中也可添加氨基酸、糖类、纤维素衍生物及其它有机/无机化合物等一般注射用组合物中使用的赋形剂/激活剂。在用本发明的破骨细胞形成抑制因子和这些赋形剂/激活剂制备注射剂时,根据需要可添加pH调节剂、缓冲剂。稳定剂、增溶剂等,按常规方法制成各种注射剂。
以下列举实施例对本发明作详细说明,它们仅仅作为例子,本发明并不受其限制。
实施例1粘粒文库的制备用人胎盘基因组DNA(Clonetech;Cat.No.6550-2)和pWE15粘粒载体(Stratagene)制成粘粒文库。基本上按照Stratagene公司的pWE15粘粒载体药盒所附的方案进行,但操作DNA、大肠杆菌、噬菌体的一般方法参照Molecular CloningA Laboratory Manual(Cold Spring Harbor Laboratory(1989))。
(i)人基因组DNA限制酶分解物的制备在4个1.5ml Eppendorf试管(试管A、B。C、D)中分别加入溶于含10mMTris-HCl、10mM MgCl2、100mM NaCl的溶液750μl的人胎盘基因组DNA 100μg,在试管A中加入0.2单位、试管B中加入0.4单位、试管C中加入0.6单位、试管D中加入0.8单位的限制酶MboI,消化1小时。然后,在各试管中分别加入EDTA,使其成为20mM,以终止反应,用苯酚/氯仿(1∶1)提取,在水相中加入2倍量的乙醇,使DNA沉淀。离心分离回收DNA后,用70%乙醇洗涤,将各试管中的DNA溶于100μl TE中。将4个试管的DNA合并成一管,68℃保温10分钟后回升至室温,将其在离心管(38ml)中用配制成的10%-40%线性蔗糖密度梯度上铺层。蔗糖密度梯度在含20mM Tris-HCl(pH8.0)、5mMEDTA、1M NaCl的缓冲液中配成。将该离心管用日立制作所的SRP28SA转子于20℃、26,000rpm离心24小时后,用分级收集器将蔗糖密度梯度分成各0.4ml的级分。将各级分的一部分经0.4%琼脂糖电泳确定DNA的大小后,收集全部含30kb(千碱基对)至40kb长度的DNA的级分,用TE将糖浓度稀释成10%以下,加入2.5倍量乙醇以沉淀DNA。将DNA溶于TE(10mM HCl(pH8.0)+1mM EDTA缓冲液(以下称作TE)),保存于4℃。
(ii)粘粒载体的准备按照粘粒载体药盒所附的方案,将Stratagene公司的pWE15粘粒载体用限制酶BamHI完全消化后,用乙醇沉淀回收DNA,溶于TE,使浓度为1mg/ml。用小牛肠碱性磷酸酶除去该DNA5′末端的磷酸后,通过苯酚提取和乙醇沉淀回收DNA,溶于TE,使其浓度为1mg/ml。
(iii)基因组DNA的载体连接和体外包装将1.5μg按大小分级的基因组DNA与以3μg限制酶BamHI消化的pWE15粘粒载体用Pharmacia公司的Ready-To-Go T4DNA连接酶在20μl反应液中进行连接。将连接后的DNA用Giga Pack II包装提取物(Stratagene公司)按所附方案进行体外包装。包装反应后,将部分反应液用SM缓冲液梯级式地稀释,与悬浮于10mM MgCl2的大肠杆菌XL1-Blue MR(Stratagene公司)混合,使感染噬菌体,然后接种在含50μg/ml氨苄西林的LB琼脂糖板上,计数生成的集落数。根据该结果计算出包装反应液每μl的集落数。
(iv)粘粒文库的制备将用上述方法制得的包装反应液与大肠杆菌XL1-Blue MR混合,接种在含氨苄西林的琼脂糖板上,使每块直径15cm的琼脂糖板生成50,000个集落。37℃保温一夜,每块板加3mlLB培养基,将大肠杆菌的集落混悬,回收。将琼脂糖板再用3ml LB培养基洗涤一次,与原来的大肠杆菌悬浮液合并。将全部从琼脂糖板回收的大肠杆菌收集在一个离心管中,添加甘油使浓度为20%,再加入氨苄西林使浓度为50μg/ml。充分混合后取出一部分,其余的保存于-80℃。将分取的大肠杆菌分步稀释,接种于琼脂糖板上,计算出每ml的集落数。
实施例2粘粒文库的筛选和集落的纯化将直径14.2cm的硝基纤维素滤膜(Millipore公司)放在含50μg/ml氨苄西林的直径15cm的LB琼脂糖板上,在其上面散布粘粒文库,使每块板上产生50,000个大肠杆菌集落,37℃保温过夜。按常规方法将硝基纤维素滤膜上的大肠杆菌转移到别的硝基纤维素滤膜上,制成双份滤膜。按照粘粒载体药盒所附的方案将双份滤膜上的大肠杆菌用碱中和,用Strate接头(Strategene公司)将DNA固定在硝基纤维素滤膜上。再将此滤膜在减压烘箱中80℃加热2小时。用从人OCIF的5′末端和3′末端制成的两种DNA作为探针将经这样处理所得到的硝基纤维素滤膜进行杂交。即从含OCIFcDNA的大肠杆菌pBK/OIFIO(通商产业省工业技术院生命工程工业技术研究所寄存,保藏号FERM BP-5267)提纯质粒,用限制酶KpnI和EcoRI消化含OCIFcDNA的质粒,用琼脂糖凝胶分离产生的片断,然后用QIAEX II凝胶提取药盒(Qiagen公司)提纯0.2kb的KpnI/EcoRI片断。用MegaprimeDNA标记系统(Amasham公司制)以32P标记此DNA(5′-DNA探针)。此外,将所得的质粒用限制酶BamHI和限制酶EcoRV消化,同样地提纯产生的0.2kb的BamHI/EcoRV片断,用上述方法于32P标记(3′-DNA探针)。将上述双份滤膜之一与5′-DNA探针、另一片与3′-DNA探针杂交。按如上所述粘粒药盒所附的方案进行集落杂交和滤膜洗涤。放射自显影的结果对于各个探针检出数个阳性信号,而检出一个两个探针均杂交阳性信号。纯化在琼脂糖板上与该信号相应的集落,分离纯化集落。按常规方法从纯化的集落提纯粘粒,命名为pWEOCIF。包含在该粘粒中的人基因组DNA的大小约为38kb。
实施例3人OCIF基因组DNA碱基序列的测定(i)OCIF基因组DNA的亚克隆用限制酶EcoRI消化粘粒pWEOCIF,将产生的片断用0.7%琼脂糖凝胶分离后,用Southern印迹技术将DNA转移到尼龙膜上(Hybond-N Amersham公司),用Strata接头(Stratagene公司)将DNA固定在尼龙膜上。另一方面,用限制酶EcoRI将质粒pBKOCIF消化,用琼脂糖凝胶分离含人OCIFcDNA的1.6Kb的片断,然后用MegaprimeDNA标记系统(Amersham公司)用32P进行标记。按常规方法将上述尼龙膜与32P标记的1.6kb的OCIFcDNA进行杂交的结果,确认6kb、4kb、3.6kb、2.6kb的DNA发生了杂交。用琼脂糖凝胶分离这些与人OCIFcDNA杂交的片断,然后按常规方法分别亚克隆成pBluescript II SK+载体(Stratagene公司)的EcoRI位点,将所得的质粒分别命名为pBSE6、PBSE4、PBSE3.6和pBSE2.6。
(ii)碱基序列的测定测定亚克隆在上述质粒上的人OCIF基因组DNA的碱基序列采用ABIDideoxy Terminator Cycle Sequencing Ready Reaction Kit(Perkin Elmer Co.)和373测序系统(Applied Biosystems公司)。测定碱基序列所用的引物是从人OCIFcDNA的碱基序列(序列表中的序列4)进行合成的。测得的碱基序列表示为序列表的序列1和序列2。序列1中包含OCIF基因的第一外显子,序列2中包含第二、第三、第四、第五外显子。第一和第二外显子之间存在约17kb的核苷酸。
实施例4从COS-7细胞产生重组OCIF(i)表达OCIF基因组DNA的粘粒的制备为了在动物细胞中表达OCIF基因组DNA,将表达质粒pcDL-SRα296(Molecular and Cellar Biology,vol.8,p466-472,1988)的表达单位插入粘粒载体pWE15(Stratagene公司)。首先,用限制酶SalI消化表达质粒pcDL-SRα296,切出含有SRα启动子、SV40后期剪接信号、多聚(A)附加信号的约为1.7kb的表达单位,用琼脂糖电泳分离后,用QIAEXII凝胶提取药盒(Qiagen公司)加以精制。另一方面,用限制酶EcoRI消化粘粒pWE15,用琼脂糖电泳分离后,用QIAEXII凝胶提取药盒(Qiagen公司)将8.2kb的pWE15 DNA加以精制。用DNA削平末端药盒(宝酒造社)将两种DNA片断末端平齐化,用DNA连接药盒(宝酒造社)使其连接,引入大肠杆菌DH5α(Gibco BRL公司)。将所得的转化体增殖,用Qiagen柱(Qiagen公司)纯化含表达单位的表达粘粒pWESRα。
将插入上述(i)中所得的插入了约38kb的OCIF基因组DNA的粘粒pWEOCIF用限制酶NotI消化,切出约38kb的OCIF基因组DNA,用琼脂糖电泳分离后,用QIAEX II凝胶提取药盒(Qiagen公司)加以精制。另一方面,用限制酶EcoRI消化表达粘粒pWESRα,用苯酚、氯仿提取后,乙醇沉淀,溶于TE。用T4 DNA连接酶(宝酒造社)将被限制酶EcoRI消化后的pWESRα与EcoRI-XmnI-NotI接头(#1105、#1156,New England biolaboratory Co.)连接,用琼脂糖电泳分离成游离结合体后,用QIAEX II凝胶提取药盒(Qiagen公司)进行纯化。用T4 DNA连接酶(宝酒造社)将被限制酶NotI消化后的约37kb的OCIF基因组DNA与添加了结合体的pWESRα结合,用GigapackII包装提取物(Stratagene公司)进行体外包装,使感染大肠杆菌XL1-Blue MR(Stratagene公司)。使所得的转化体增殖,用Qiagen柱(Qiagen公司)精制插入了OCIF基因组DNA的表达粘粒pWESRαOCIF。将OCIF表达粘粒pWESRαOCIF用乙醇沉淀后,溶于无菌蒸馏水,用于以下操作。
(ii)OCIF基因组DNA的瞬时表达和OCIF活性的测定用上述(i)中所得的OCIF表达粘粒pWESRαOCIF按如下方法表达重组OCIF,测定其活性。用含10%胎牛血清(Gibco BRL公司)的DMEM培养基(GibcoBRL公司)将8×105个COS-7细胞(理化学研究所细胞开发银行,RCB0539)植入六孔板的每个孔中,次日除去培养基后,用无血清DMEM培养基洗涤细胞。按照转染用试剂lipophectamine(Gibco BRL公司)所附的方案,先将用OPTI-MEM培养基(Gibco BRL公司)稀释的OCIF表达粘粒pWESRαOCIF与lipophectamine混合,然后将此混合液加到各孔的细胞中。用表达粘粒pWESRα作为对照,同样地加到细胞中。所用的粘粒DNA和lipophectamine的量分别为3μg和12μl。24小时后,除去培养基,加入1.5ml新的EX-CELL301培养基(JRH生物科学公司),再经48小时后,回收培养基,将其作为测定OCIF活性用样品。按久米川正好等的方法(蛋白质·核酸·酶Vol.34,p999(1989))和Takahashi N.等的方法(Endrocrinology Vol.122,p1373(1988))进行OCIF的活性测定。通过诱导耐酒石酸酸性磷酸酶的活性,试验出生后约17日的小鼠骨髓细胞在活性型维生素D3存在下的破骨细胞形成,作为具有抑制破骨细胞形成作用的蛋白质(OCIF)的活性。即,在96孔微量测定板的各孔中,加入以含2×10-82活性型维生素D3和用含10%胎牛血清的α-MEM培养基(Gibco BRL公司)稀释的样品100μl,将出生后约17日的小鼠的骨髓细胞3×105个悬浮在含10%胎牛血清的α-MEM培养基100μl中进行接种,于5%CO2、37℃、湿度100%的条件下培养一周。在培养的第3天和第5天,弃去培养液中的160μl,添加以含1×10-8M活性型维生素D3和用含10%胎牛血清的α-MEM培养基稀释的样品160μl。培养7天后,用以磷酸盐缓冲的生理盐水洗涤细胞,然后用乙醇/丙酮(1∶1)溶液将细胞在室温下固定1分钟,用酸性磷酸酶活性测定药盒(酸性磷酸酶、白细胞、Cat.No.387-A,Sigma公司)通过染色检出破骨细胞的形成,将酒石酸存在下酸性磷酸酶活性阳性细胞的减少作为OCIF活性。结果见表1。从该结果可以确定,该培养液与从IMR-90培养液所得天然型OCIF及CHO细胞产生的重组OCIF具有同样的活性。
表1Cos-7细胞表达的培养液中的OCIF活性稀释率1/101/201/401/801/160 1/320OCIF基因组DNA导入 ++ ++ ++ ++ + -载体导入- - - -- -未处理 - - - -- -(表中,++表示抑制破骨细胞形成80%以上的活性,+表示抑制破骨细胞形成30-80%的活性,-表示未检出活性。)(iii)用Western印迹试验鉴定产物取上述(ii)中所得的OCIF活性测定用样品10μl,加入10μl的SDS-PAGE用样品缓冲液(0.5M Tris-HCl,20%甘油、4%SDS、20μg/ml溴酚兰,pH6.8),100℃煮沸3分钟后,在还原状态下进行10%SDS聚丙烯酰胺电泳。用半干印迹装置(Biorad公司)将蛋白质从凝胶印迹到PVDF膜(ProBlott,PerkinElmer公司)上。将此膜封闭后,与按常规方法将先前得到的OCIF蛋白质用辣根过氧化物酶标记的辣根过氧化物酶标记的抗OCIF抗体一起37℃保温2小时。洗涤后,用ECL系统(Amersham公司)检出抗OCIF抗体结合的蛋白质。如图1所示,从转染pWESRαOCIF的COS-7细胞的培养上清液中检出分子量约为120kD和60kD的2个区带。另一方面,用同样的方法解析仅转染pWESRα载体的COS-7细胞的培养上清液,结果未检出120kD和60kD的区带。从此结果确定所得的蛋白质是OCIF。
产业上利用的可能性本发明提供编码具有抑制破骨细胞形成作用的蛋白质OCIF的基因组DNA及采用基因工程的方法用来制备该蛋白质的方法。本发明的基因表达所得的蛋白质具有抑制破骨细胞形成的作用,可用作以治疗和改善骨质疏松症等骨量减少症、风湿性或变形性关节炎等骨代谢异常疾病或多发性骨髓肿瘤等骨代谢异常疾病为目的的医药组合物,或用作确立这些疾病的免疫学诊断的抗原。
关于微生物的说明保藏机构通商产业省工业技术院生命科学和人体技术研究所地址日本茨城县筑波市东1丁目1番3号保藏日1995年6月21日(原保藏于1995年6月21日,按布达佩斯条约于1995年10月25日移存为国际保藏)保藏号FERM BP-5267
序列表序列号1序列长度1316序列类型核酸链的数目2拓扑学直链状序列种类基因组DNA(人OCIF基因组DNA-1)序列CTGGAGACAT ATAACTTGAA CACTTGGCCC TGATGGGGAA GCAGCTCTGC AGGGACTTTT 60TCAGCCATCT GTAAACAATT TCAGTGGCAA CCCGCGAACT GTAATCCATG AATGGGACCA 120CACTTTACAA GTCATCAAGT CTAACTTCTA GACCAGGGAA TTAATGGGGG AGACAGCGAA 180CCCTAGAGCA AAGTGCCAAA CTTCTGTCGA TAGCTTGAGG CTAGTGGAAA GACCTCGAGG 240AGGCTACTCC AGAAGTTCAG CGCGTAGGAA GCTCCGATAC CAATAGCCCT TTGATGATGG 300TGGGGTTGGT GAAGGGAACA GTGCTCCGCA AGGTTATCCC TGCCCCAGGC AGTCCAATTT 360TCACTCTGCA GATTCTCTCT GGCTCTAACT ACCCCAGATA ACAAGGAGTG AATGCAGAAT 420AGCACGGGCT TTAGGGCCAA TCAGACATTA GTTAGAAAAA TTCCTACTAC ATGGTTTATG 480TAAACTTGAA GATGAATGAT TGCGAACTCC CCGAAAAGGG CTCAGACAAT GCCATGCATA 540AAGAGGGGCC CTGTAATTTG AGGTTTCAGA ACCCGAAGTG AAGGGGTCAG GCAGCCGGGT 600ACGGCGGAAA CTCACAGCTT TCGCCCAGCG AGAGGACAAA GGTCTGGGAC ACACTCCAAC 660TGCGTCCGGA TCTTGGCTGG ATCGGACTCT CAGGGTGGAG GAGACACAAG CACAGCAGCT 720GCCCAGCGTG TGCCCAGCCC TCCCACCGCT GGTCCCGGCT GCCAGGAGGC TGGCCGCTGG 780CGGGAAGGGG CCGGGAAACC TCAGAGCCCC GCGGAGACAG CAGCCGCCTT GTTCCTCAGC 840CCGGTGGCTT TTTTTTCCCC TGCTCTCCCA GGGGACAGAC ACCACCGCCC CACCCCTCAC 900GCCCCACCTC CCTGGGGGAT CCTTTCCGCC CCAGCCCTGA AAGCGTTAAT CCTGGAGCTT 960TCTGCACACC CCCCGACCGC TCCCGCCCAA GCTTCCTAAA AAAGAAAGGT GCAAAGTTTG 1020GTCCAGGATA GAAAAATGAC TGATCAAAGG CAGGCGATAC TTCCTGTTGC CGGGACGCTA 1080TATATAACGT GATGAGCGCA CGGGCTGCGG AGACGCACCG GAGCGCTCGC CCAGCCGCCG 1140CCTCCAAGCC CCTGAGGTTT CCGGGGACCA CA ATG AAC AAG TTG CTG TGC TGC1193Met Asn Lys Leu Leu Cys Cys-20 -15GCG CTC GTG GTAAGTCCCT GGGCCAGCCG ACGGGTGCCC GGCGCCTGGG1242ALa Leu ValGAGGCTGCTG CCACCTGGTC TCCCAACCTC CCAGCGGACC GGCGGGGAGA AGGCTCCACT 1302CGCTCCCTCC CAGG1816序列号2序列长度9898序列类型核酸链的数目2拓扑学直链状序列种类基因组DNA(人OCIF基因组DNA-2)序列GCTTACTTTG TGCCAAATCT CATTAGGCTT AAGGTAATAC AGGACTTTGA GTCAAATGAT 60ACTGTTGCAC ATAAGAACAA ACCTATTTTC ATGCTAAGAT GATGCCACTG TGTTCCTTTC 120TCCTTCTAG TTT CTG GAC ATC TCC ATT AAG TGG ACC ACC CAG GAA ACG TTT 171Phe Leu Asp Ile Ser Ile Lys Trp Thr Thr Gln Glu Thr Phe-10 -5 1CCT CCA AAG TAC CTT CAT TAT GAC GAA GAA ACC TCT CAT CAG CTG TTG219Pro Pro Lys Tyr Leu His Tyr Asp Glu Glu Thr Ser His Gln Leu Leu5 10 15TGT GAC AAA TGT CCT CCT GGT ACC TAC CTA AAA CAA CAC TGT ACA GCA 267Cys Asp Lys Cys Pro Pro Gly Thr Tyr Leu Lys Gln His Cys Thr Ala20 25 30 35AAG TGG AAG ACC GTG TGC GCC CCT TGC CCT GAC CAC TAC TAC ACA GAC 315Lys Trp Lys Thr Val Cys Ala Pro Cys Pro Asp His Tyr Tyr Thr Asp40 45 50AGC TGG CAC ACC AGT GAC GAG TGT CTA TAC TGC AGC CCC GTG TGC AAG 363Ser Trp His Thr Ser Asp Glu Cys Leu Tyr Cys Ser Pro Val Cys Lys55 60 65GAG CTG CAG TAC GTC AAG CAG GAG TGC AAT CGC ACC CAC AAC CGC GTG 411Glu Leu Gln Tyr Val Lys Gln Glu Cys Asn Arg Thr His Asn Arg Val70 75 80TGC GAA TGC AAG GAA GGG CGC TAC CTT GAG ATA GAG TTC TGC TTG AAA 459Cys Glu Cys Lys Glu Gly Arg Tyr Leu Glu Ile Glu Phe Cys Leu Lys85 90 95CAT AGG AGC TGC CCT CCT GGA TTT GGA GTG GTG CAA GCT G GTACGTGTCA 509His Arg Ser Cys Pro Pro Gly Phe Gly Val Val Gln Ala100 105 110ATGTGCAGCA AAATTAATTA GGATCATGCA AAGTCAGATA GTTGTGACAG TTTAGGAGAA 569CACTTTTGTT CTGATGACAT TATAGGATAG CAAATTGCAA AGGTAATGAA ACCTGCCAGG629TAGGTACTAT GTGTCTGGAG TGCTTCCAAA GGACCATTGC TCAGAGGAAT ACTTTGCCAC689TACAGGGCAA TTTAATGACA AATCTCAAAT GCAGCAAATT ATTCTCTCAT GAGATGCATG749ATGGTTTTTT TTTTTTTTTT TAAAGAAACA AACTCAAGTT GCACTATTGA TAGTTGATCT809ATACCTCTAT ATTTCACTTC AGCATGGACA CCTTCAAACT GCAGCACTTT TTGACAAACA869TCAGAAATGT TAATTTATAC CAAGAGAGTA ATTATGCTCA TATTAATGAG ACTCTGGAGT929GCTAACAATA AGCAGTTATA ATTAATTATG TAAAAAATGA GAATGGTGAG GGGAATTGCA989TTTCATTATT AAAAACAAGG CTAGTTCTTC CTTTAGCATG GGAGCTGAGT GTTTGGGAGG 1049GTAAGGACTA TAGCAGAATC TCTTCAATGA GCTTATTCTT TATCTTAGAC AAAACAGATT 1109GTCAAGCCAA GAGCAAGCAC TTGCCTATAA ACCAAGTGCT TTCTCTTTTG CATTTTGAAC 1169AGCATTGGTC AGGGCTCATG TGTATTGAAT CTTTTAAACC AGTAACCCAC GTTTTTTTTC 1229TGCCACATTT GCGAAGCTTC AGTGCAGCCT ATAACTTTTC ATAGCTTGAG AAAATTAAGA 1289GTATCCACTT ACTTAGATGG AAGAAGTAAT CAGTATAGAT TCTGATGACT CAGTTTGAAG 1349CAGTGTTTCT CAACTGAAGC CCTGCTGATA TTTTAAGAAA TATCTGGATT CCTAGGCTGG 1409ACTCCTTTTT GTGGGCAGCT GTCCTGCGCA TTGTAGAATT TTGGCAGCAC CCCTGGACTC 1469TAGCCACTAG ATACCAATAG CAGTCCTTCC CCCATGTGAC AGCCAAAAAT GTCTTCAGAC 1529ACTGTCAAAT GTCGCCAGGT GGCAAAATCA CTCCTGGTTG AGAACAGGGT CATCAATGCT 1589AAGTATCTGT AACTATTTTA ACTCTCAAAA CTTGTGATAT ACAAAGTCTA AATTATTAGA 1649CGACCAATAC TTTAGGTTTA AAGGCATACA AATGAAACAT TCAAAAATCA AAATCTATTC 1709TGTTTCTCAA ATAGTGAATC TTATAAAATT AATCACAGAA GATGCAAATT GCATCAGAGT 1769CCCTTAAAAT TCCTCTTCGT ATGAGTATTT GAGGGAGGAA TTGGTGATAG TTCCTACTTT 1829CTATTGGATG GTACTTTGAG ACTCAAAAGC TAAGCTAAGT TGTGTGTGTG TCAGGGTGCG 1889GGGTGTGGAA TCCCATCAGA TAAAAGCAAA TCCATGTAAT TCATTCAGTA AGTTGTATAT 1949GTAGAAAAAT GAAAAGTGGG CTATGCAGCT TGGAAACTAG AGAATTTTGA AAAATAATGG 2009AAATCACAAG GATCTTTCTT AAATAAGTAA GAAAATCTGT TTGTAGAATG AAGCAAGCAG 2069GCAGCCAGAA GACTCAGAAC AAAAGTACAC ATTTTACTCT GTGTACACTG GCAGCACAGT 2129GGGATTTATT TACCTCTCCC TCCCTAAAAA CCCACACAGC GGTTCCTCTT GGGAAATAAG 2189AGGTTTCCAG CCCAAAGAGA AGGAAAGACT ATGTGGTGTT ACTCTAAAAA GTATTTAATA 2249ACCGTTTTGT TGTTGCTGTT GCTGTTTTGA AATCAGATTG TCTCCTCTCC ATATTTTATT 2309TACTTCATTC TGTTAATTCC TGTGGAATTA CTTAGAGCAA GCATGGTGAA TTCTCAACTG 2369TAAAGCCAAA TTTCTCCATC ATTATAATTT CACATTTTGC CTGGCAGGTT ATAATTTTTA 2429TATTTCCACT GATAGTAATA AGGTAAAATC ATTACTTAGA TGGATAGATC TTTTTCATAA 2489AAAGTACCAT CAGTTATAGA GGGAAGTCAT GTTCATGTTC AGGAAGGTCA TTAGATAAAG 2549CTTCTGAATA TATTATGAAA CATTAGTTCT GTCATTCTTA GATTCTTTTT GTTAAATAAC 2609TTTAAAAGCT AACTTACCTA AAAGAAATAT CTGACACATA TGAACTTCTC ATTAGGATGC 2669AGGAGAAGAC CCAAGCCACA GATATGTATC TGAAGAATGA ACAAGATTCT TAGGCCCGGC 2729ACGGTGGCTC ACATCTGTAA TCTCAAGAGT TTGAGAGGTC AAGGCGGGCA GATCACCTGA 2789GGTCAGGAGT TCAAGACCAG CCTGGCCAAC ATGATGAAAC CCTGCCTCTA CTAAAAATAC 2849AAAAATTAGC AGGGCATGGT GGTGCATGCC TGCAACCCTA GCTACTCAGG AGGCTGAGAC 2909AGGAGAATCT CTTGAACCCT CGAGGCGGAG GTTGTGGTGA GCTGAGATCC CTCTACTGCA 2969CTCCAGCCTG GGTGACAGAG ATGAGACTCC GTCCCTGCCG CCGCCCCCGC CTTCCCCCCC 8029AAAAAGATTC TTCTTCATGC AGAACATACG GCAGTCAACA AAGGGAGACC TGGGTCCAGG 3089TGTCCAAGTC ACTTATTTCG AGTAAATTAG CAATGAAAGA ATGCCATGGA ATCCCTGCCC 3149AAATACCTCT GCTTATGATA TTGTAGAATT TGATATAGAG TTGTATCCCA TTTAAGGAGT 3209AGGATGTAGT AGGAAAGTAC TAAAAACAAA CACACAAACA GAAAACCCTC TTTGCTTTGT 3269AAGGTGGTTC CTAAGATAAT GTCAGTGCAA TGCTGGAAAT AATATTTAAT ATGTGAAGGT 3329TTTAGGCTGT GTTTTCCCCT CCTGTTCTTT TTTTCTGCCA GCCCTTTGTC ATTTTTGCAG 3389GTCAATGAAT CATGTAGAAA GAGACAGGAG ATGAAACTAG AACCAGTCCA TTTTGCCCCT 3449TTTTTTATTT TCTGGTTTTG GTAAAAGATA CAATGAGGTA GGAGGTTGAG ATTTATAAAT 3509GAAGTTTAAT AAGTTTCTGT AGCTTTGATT TTTCTCTTTC ATATTTGTTA TCTTGCATAA 3569GCCAGAATTG GCCTGTAAAA TCTACATATG GATATTGAAG TCTAAATCTG TTCAACTAGC 3629TTACACTAGA TGGAGATATT TTCATATTCA GATACACTGG AATGTATGAT CTAGCCATGC 3689GTAATATAGT CAAGTGTTTG AAGGTATTTA TTTTTAATAG CGTCTTTAGT TGTGGACTGG 3749TTCAAGTTTT TCTGCCAATG ATTTCTTCAA ATTTATCAAA TATTTTTCCA TCATGAAGTA 3809AAATGCCCTT GCAGTCACCC TTCCTGAAGT TTGAACGACT CTGCTGTTTT AAACAGTTTA 3869AGCAAATGGT ATATCATCTT CCGTTTACTA TGTAGCTTAA CTGCAGGCTT ACGCTTTTGA 3929GTCAGCGGCC AACTTTATTG CCACCTTCAA AAGTTTATTA TAATGTTGTA AATTTTTACT 3989TCTCAAGGTT AGCATACTTA GGAGTTGCTT CACAATTAGG ATTCAGGAAA GAAAGAACTT 4049CAGTAGGAAC TGATTGGAAT TTAATGATGC AGCATTCAAT GGGTACTAAT TTCAAAGAAT 4109GATATTACAG CAGACACACA GCAGTTATCT TGATTTTCTA GGAATAATTG TATGAAGAAT 4169ATGGCTGACA ACACGGCCTT ACTGCCACTC AGCGGAGGCT GGACTAATGA ACACCCTACC 4229CTTCTTTCCT TTCCTCTCAC ATTTCATGAG CGTTTTGTAG GTAACGAGAA AATTGACTTG 4289CATTTGCATT ACAAGGAGGA GAAACTGGCA AAGGGGATGA TGGTGGAAGT TTTGTTCTGT 4349CTAATGAAGT GAAAAATGAA AATGCTAGAG TTTTGTGCAA CATAATAGTA GCAGTAAAAA 4409CCAAGTGAAA AGTCTTTCCA AAACTGTGTT AAGAGGGCAT CTGCTGGGAA ACGATTTGAG 4469GAGAAGGTAC TAAATTGCTT GGTATTTTCC GTAG GA ACC CCA GAG CGA AAT ACA 4523Gly Thr Pro Glu Arg Asn Thr115GTT TGC AAA AGA TGT CCA GAT GGG TTC TTC TCA AAT GAG ACG TCA TCT 4571Val Cys Lys Arg Cys Pro Asp Gly Phe Phe Ser Asn Glu Thr Ser Ser120 125 130 135AAA GCA CCC TGT AGA AAA CAC ACA AAT TGC AGT GTC TTT GGT CTC CTG 4619Lys Ala Pro Cys Arg Lys His Thr Asn Cys Ser Val Phe Gly Leu Leu140 145 150CTA ACT CAG AAA GGA AAT GCA ACA CAC GAC AAC ATA TGT TCC GGA AAC 4667Leu Thr Gln Lys Gly Asn Ala Thr His Asp Asn Ile Cys Ser Gly Asn155 160 165AGT GAA TCA ACT CAA AAA TGT GGA ATA G GTAATTACAT TCCAAAATAC4715Ser Glu Ser Thr Gln Lys Cys Gly Ile170 175GTCTTTGTAC GATTTTGTAG TATCATCTCT CTCTCTGAGT TGAACACAAG GCCTCCAGCC 4775ACATTCTTGG TCAAACTTAC ATTTTCCCTT TCTTGAATCT TAACCAGCTA AGGCTACTCT 4835CGATGCATTA CTGCTAAAGC TACCACTCAG AATCTCTCAA AAACTCATCT TCTCACAGAT 4895AACACCTCAA AGCTTGATTT TCTCTCCTTT CACACTGAAA TCAAATCTTG CCCATAGGCA 4955AAGGGCAGTG TCAAGTTTGC CACTGAGATG AAATTAGGAG AGTCCAAACT GTAGAATTCA 5015CGTTGTGTGT TATTACTTTC ACGAATGTCT GTATTATTAA CTAAAGTATA TATTGGCAAC 5075TAAGAAGCAA AGTGATATAA ACATGATGAC AAATTAGGCC AGGCATGGTG GCTTACTCCT 5135ATAATCCCAA CATTTTGGGG GGCCAAGGTA GGCAGATCAC TTGAGGTCAG GATTTCAAGA 5195CCAGCCTGAC CAACATGGTG AAACCTTGTC TCTACTAAAA ATACAAAAAT TAGCTGGGCA 5255TGGTAGCAGG CACTTCTAGT ACCAGCTACT CAGGGCTGAG GCAGGAGAAT CGCTTGAACC 5315CAGGAGATGG AGGTTGCAGT GAGCTGAGAT TGTACCACTG CACTCCAGTC TGGGCAACAG 5375AGCAAGATTT CATCACACAC ACACACACAC ACACACACAC ACACATTAGA AATGTGTACT 5435TGGCTTTGTT ACCTATGGTA TTAGTGCATC TATTGCATGG AACTTCCAAG CTACTCTGGT 5495TGTGTTAAGC TCTTCATTGG GTACAGGTCA CTAGTATTAA GTTCAGGTTA TTCGGATGCA 5555TTCCACGGTA GTGATGACAA TTCATCAGGC TAGTGTGTGT GTTCACCTTG TCACTCCCAC 5615CACTAGACTA ATCTCAGACC TTCACTCAAA GACACATTAC ACTAAAGATG ATTTGCTTTT 5675TTGTGTTTAA TCAAGCAATG GTATAAACCA GCTTGACTCT CCCCAAACAG TTTTTCGTAC 5735TACAAAGAAG TTTATGAAGC AGAGAAATGT GAATTGATAT ATATATGAGA TTCTAACCCA 5795GTTCCAGCAT TGTTTCATTG TGTAATTGAA ATCATAGACA AGCCATTTTA GCCTTTGCTT 5855TCTTATCTAA AAAAAAAAAA AAAAAAATGA AGGAAGGGGT ATTAAAAGGA GTGATCAAAT 5915TTTAACATTC TCTTTAATTA ATTCATTTTT AATTTTACTT TTTTTCATTT ATTGTGCACT 5975TACTATGTGG TACTGTGCTA TAGAGGCTTT AACATTTATA AAAACACTGT GAAAGTTGCT 6035TCAGATGAAT ATAGGTAGTA GAACGGCAGA ACTAGTATTC AAAGCCAGGT CTGATGAATC 6095CAAAAACAAA CACCCATTAC TCCCATTTTC TGGGACATAC TTACTCTACC CAGATGCTCT 6155GGGCTTTGTA ATGCCTATGT AAATAACATA GTTTTATGTT TGGTTATTTT CCTATGTAAT 6215GTCTACTTAT ATATCTGTAT CTATCTCTTG CTTTGTTTCC AAAGGTAAAC TATGTGTCTA 6275AATGTGGGCA AAAAATAACA CACTATTCCA AATTACTGTT CAAATTCCTT TAAGTCAGTG 6335ATAATTATTT GTTTTGACAT TAATCATGAA GTTCCCTGTG GGTACTAGGT AAACCTTTAA 6395TAGAATGTTA ATGTTTGTAT TCATTATAAG AATTTTTGGC TGTTACTTAT TTACAACAAT 6455ATTTCACTCT AATTAGACAT TTACTAAACT TTCTCTTGAA AACAATGCCC AAAAAAGAAC 6515ATTAGAAGAC ACGTAAGCTC AGTTGGTCTC TGCCACTAAG ACCAGCCAAC AGAAGCTTGA 6575TTTTATTCAA ACTTTGCATT TTAGCATATT TTATCTTGGA AAATTCAATT GTGTTGGTTT 6635TTTGTTTTTG TTTGTATTGA ATAGACTCTC AGAAATCCAA TTGTTGAGTA AATCTTCTGG 6695GTTTTCTAAC CTTTCTTTAG AT GTT ACC CTG TGT GAG GAG GCA TTC TTC AGG 6747Asp Val Thr Leu Cys Glu Glu Ala Phe Phe Arg180 185TTT GCT GTT CCT ACA AAG TTT ACG CCT AAC TGG CTT AGT GTC TTG GTA 6795Phe Ala Val Pro Thr Lys Phe Thr Pro Asn Trp Leu Ser Val Leu Val190 195 200GAC AAT TTG CCT GGC ACC AAA GTA AAC GCA GAG AGT GTA GAG AGG ATA 6843Asp Asn Leu Pro Gly Thr Lys Val Asn Ala Glu Ser Val Glu Arg Ile205 210 215AAA CGG CAA CAC AGC TCA CAA GAA CAG ACT TTC CAG CTG CTG AAG TTA 6891Lys Arg Gln His Ser Ser Gln Glu Gln Thr Phe Gln Leu Leu Lys Leu220 225 230 235TGG AAA CAT CAA AAC AAA GAC CAA GAT ATA GTC AAG AAG ATC ATC CAA G 6940Trp Lys His Gln Asn Lys Asp Gln Asp Ile Val Lys Lys Ile Ile Gln240 245 250GTATGATAAT CTAAAATAAA AAGATCAATC AGAAATCAAA GACACCTATT TATCATAAAC 7000CAGGAACAAG ACTGCATGTA TGTTTAGTTG TGTGGATCTT GTTTCCCTGT TGGAATCATT 7060GTTGGACTGA AAAAGTTTCC ACCTGATAAT GTAGATGTGA TTCCACAAAC AGTTATACAA 7120GGTTTTGTTC TCACCCCTGC TCCCCAGTTT CCTTGTAAAG TATGTTGAAC ACTCTAAGAG 7180AAGAGAAATG CATTTGAAGG CAGGGCTGTA TCTCAGGGAG TCGCTTCCAG ATCCCTTAAC 7240GCTTCTGTAA GCAGCCCCTC TAGACCACCA AGGAGAAGCT CTATAACCAC TTTGTATCTT 7300ACATTGCACC TCTACCAAGA AGCTCTGTTG TATTTACTTG GTAATTCTCT CCAGGTAGGC 7360TTTTCGTAGC TTACAAATAT GTTCTTATTA ATCCTCATGA TATGGCCTGC ATTAAAATTA 7420TTTTAATGGC ATATGTTATG AGAATTAATG AGATAAAATC TGAAAAGTGT TTGAGCCTCT 7480TGTAGGAAAA AGCTAGTTAC AGCAAAATGT TCTCACATCT TATAAGTTTA TATAAAGATT 7540CTCCTTTAGA AATGGTGTGA GAGAGAAACA GAGAGAGATA GGGAGAGAAG TGTGAAAGAA 7600TCTGAAGAAA AGGAGTTTCA TCCAGTGTGG ACTGTAAGCT TTACGACACA TGATGGAAAG 7660AGTTCTGACT TCAGTAAGCA TTGGGAGGAC ATGCTAGAAG AAAAAGGAAG AAGAGTTTCC 7720ATAATGCAGA CAGGGTCAGT GAGAAATTCA TTCAGGTCCT CACCAGTAGT TAAATGACTG 7780TATAGTCTTG CACTACCCTA AAAAACTTCA AGTATCTGAA ACCGGGGCAA CAGATTTTAG 7840GAGACCAACG TCTTTGAGAG CTGATTGCTT TTGCTTATGC AAAGAGTAAA CTTTTATGTT 7900TTGAGCAAAC CAAAAGTATT CTTTGAACGT ATAATTAGCC CTGAAGCCGA AAGAAAAGAG 7960AAAATCAGAG ACCGTTAGAA TTGGAAGCAA CCAAATTCCC TATTTTATAA ATGAGGACAT 8020TTTAACCCAG AAAGATGAAC CGATTTGGCT TAGGGCTCAC AGATACTAAG TGACTCATGT 8080CATTAATAGA AATGTTAGTT CCTCCCTCTT AGGTTTGTAC CCTAGCTTAT TACTGAAATA 8140TTCTCTAGGC TGTGTGTCTC CTTTAGTTCC TCGACCTCAT GTCTTTGAGT TTTCAGATAT 8200CCTCCTCATG GAGGTAGTCC TCTGGTGCTA TGTGTATTCT TTAAAGGCTA GTTACGGCAA 8260TTAACTTATC AACTAGCGCC TACTAATGAA ACTTTGTATT ACAAAGTAGC TAACTTGAAT 8320ACTTTCCTTT TTTTCTGAAA TGTTATGGTG GTAATTTCTC AAACTTTTTC TTAGAAAACT 8880GAGAGTGATG TGTCTTATTT TCTACTGTTA ATTTTCAAAA TTAGGAGCTT CTTCCAAAGT 8440TTTGTTGGAT GCCAAAAATA TATAGCATAT TATCTTATTA TAACAAAAAA TATTTATCTC 8500AGTTCTTAGA AATAAATGGT GTCACTTAAC TCCCTCTCAA AAGAAAAGGT TATCATTGAA 8560ATATAATTAT GAAATTCTGC AAGAACCTTT TGCCTCACGC TTGTTTTATG ATGGCATTGG 8620ATGAATATAA ATGATGTGAA CACTTATCTG GGCTTTTGCT TTATGCAG AT ATT GAC 8676Asp Ile AspCTC TGT GAA AAC AGC GTG CAG CGG CAC ATT GGA CAT GCT AAC CTC ACC 8724Leu Cys Glu Asn Ser Val Gln Arg His Ile Gly His Ala Asn Leu Thr255 260 265 270TTC GAG CAG CTT CGT AGC TTG ATG GAA AGC TTA CCG GGA AAG AAA GTG 8772Phe Glu Gln Leu Arg Ser Leu Met Glu Ser Leu Pro Gly Lys Lys Val275 280 285GGA GCA GAA GAC ATT GAA AAA ACA ATA AAG GCA TGC AAA CCC AGT GAC 8820Gly Ala Glu Asp Ile Glu Lys Thr Ile Lys Ala Cys Lys Pro Ser Asp290 295 300CAG ATC CTG AAG CTG CTC AGT TTG TGG CGA ATA AAA AAT GGC GAC CAA 8868Gln Ile Leu Lys Leu Leu Ser Leu Trp Arg Ile Lys Asn Gly Asp Gln305 310 315GAC ACC TTG AAG GGC CTA ATG CAC GCA CTA AAG CAC TCA AAG ACG TAC8916Asp Thr Leu Lys Gly Leu Met His Ala Leu Lys His Ser Lys Thr Tyr320 325 330CAC TTT CCC AAA ACT GTC ACT CAG AGT CTA AAG AAG ACC ATC AGG TTC8964His Phe Pro Lys Thr Val Thr Gln Ser Leu Lys Lys Thr Ile Arg Phe335 340 345 350CTT CAC AGC TTC ACA ATG TAC AAA TTG TAT CAG AAG TTA TTT TTA GAA9012Leu His Ser Phe Thr Met Tyr Lys Leu Tyr Gln Lys Leu Phe Leu Glu355 360 365ATG ATA GGT AAC CAG GTC CAA TCA GTA AAA ATA AGC TGC TTA9054Met Ile Gly Asn Gln Val Gln Ser Val Lys Ile Ser Cys Leu370 375 380TAACTGGAAA TGGCCATTGA GCTGTTTCCT CACAATTGGC GAGATCCCAT GGATGAGTAA 9114ACTGTTTCTC AGGCACTTGA GGCTTTCAGT GATATCTTTC TCATTACCAG TGACTAATTT 9174TGCCACAGGG TACTAAAAGA AACTATGATG TGGAGAAAGG ACTAACATCT CCTCCAATAA 9234ACCCCAAATG GTTAATCCAA CTGTCAGATC TGGATCGTTA TCTACTGACT ATATTTTCCC 9294TTATTACTGC TTGCAGTAAT TCAACTGGAA ATTAAAAAAA AAAAACTAGA CTCCACTGGG 9354CCTTACTAAA TATGGGAATG TCTAACTTAA ATAGCTTTGG GATTCCAGCT ATGCTAGAGG 9414CTTTTATTAG AAAGCCATAT TTTTTTCTGT AAAAGTTACT AATATATCTG TAACACTATT 9474ACAGTATTGC TATTTATATT CATTCAGATA TAAGATTTGG ACATATTATC ATCCTATAAA 9534GAAACGGTAT GACTTAATTT TAGAAAGAAA ATTATATTCT GTTTATTATG ACAAATGAAA 9594GAGAAAATAT ATATTTTTAA TGGAAAGTTT GTAGCATTTT TCTAATAGGT ACTGCCATAT 9654TTTTCTGTGT GGAGTATTTT TATAATTTTA TCTGTATAAG CTGTAATATC ATTTTATAGA 9714AAATGCATTA TTTAGTCAAT TGTTTAATGT TGGAAAACAT ATGAAATATA AATTATCTGA 9774ATATTAGATG CTCTGAGAAA TTGAATGTAC CTTATTTAAA AGATTTTATG GTTTTATAAC 9834TATATAAATG ACATTATTAA AGTTTTCAAA TTATTTTTTA TTGCTTTCTC TGTTGCTTTT 9894ATTT 9898序列号3序列长度401序列类型氨基酸链的数目1拓扑学直链状序列种类蛋白质序列Met Asn Asn Leu Leu Cys Cys Ala Leu Val Phe Leu Asp Ile Ser-20 -15 -10Ile Lys Trp Thr Thr Gln Glu Thr Phe Pro Pro Lys Tyr Leu His-5 1 5Tyr Asp Glu Glu Thr Ser His Gln Leu Leu Cys Asp Lys Cys Pro10 15 20Pro Gly Thr Tyr Leu Lys Gln His Cys Thr Ala Lys Trp Lys Thr25 30 35Val Cys Ala Pro Cys Pro Asp His Tyr Tyr Thr Asp Ser Trp His40 45 50Thr Ser Asp Glu Cys Leu Tyr Cys Ser Pro Val Cys Lys Glu Leu55 60 65Gln Tyr Val Lys Gln Glu Cys Asn Arg Thr His Asn Arg Val Cys70 75 80Glu Cys Lys Glu Gly Arg Tyr Leu Glu Ile Glu Phe Cys Leu Lys85 90 95His Arg Ser Cys Pro Pro Gly Phe Gly Val Val Gln Ala Gly Thr100 105 110Pro Glu Arg Asn Thr Val Cys Lys Arg Cys Pro Asp Gly Phe Phe115 120 125Ser Asn Glu Thr Ser Ser Lys Ala Pro Cys Arg Lys His Thr Asn130 135 140Cys Ser Val Phe Gly Leu Leu Leu Thr Gln Lys Gly Asn Ala Thr145 150 155His Asp Asn Ile Cys Ser Gly Asn Ser Glu Ser Thr Gln Lys Cys160 165 170Gly Ile Asp Val Thr Leu Cys Glu Glu Ala Phe Phe Arg Phe Ala175 180 185Val Pro Thr Lys Phe Thr Pro Asn Trp Leu Ser Val Leu Val Asp190 195 200Asn Leu Pro Gly Thr Lys Val Asn Ala Glu Ser Val Glu Arg Ile205 210 215Lys Arg Gln His Ser Ser Gln Glu Gln Thr Phe Gln Leu Leu Lys220 225 230Leu Trp Lys His Gln Asn Lys Asp Gln Asp Ile Val Lys Lys Ile235 240 245Ile Gln Asp Ile Asp Leu Cys Glu Asn Ser Val Gln Arg His Ile250 255 260Gly His Ala Asn Leu Thr Phe Glu Gln Leu Arg Ser Leu Met Glu265 270 275Ser Leu Pro Gly Lys Lys Val Gly Ala Glu Asp Ile Glu Lys Thr280 285 290Ile Lys Ala Cys Lys Pro Ser Asp Gln Ile Leu Lys Leu Leu Ser295 300 305Leu Trp Arg Ile Lys Asn Gly Asp Gln Asp Thr Leu Lys Gly Leu310 315 320Met His Ala Leu Lys His Ser Lys Thr Tyr His Phe Pro Lys Thr325 330 335Val Thr Gln Ser Leu Lys Lys Thr Ile Arg Phe Leu His Ser Phe340 345 350Thr Met Tyr Lys Leu Tyr Gln Lys Leu Phe Leu Glu Met Ile Gly355 360 365Asn Gln Val Gln Ser Val Lys Ile Ser Cys Leu370 375 380序列号4序列长度1206序列类型核酸链的数目1拓扑学直链状序列种类cDNA序列ATGAACAACT TGCTGTGCTG CGCGCTCGTG TTTCTGGACA TCTCCATTAA GTGGACCACC60CAGGAAACGT TTCCTCCAAA GTACCTTCAT TATGACGAAG AAACCTCTCA TCAGCTGTTG 120TGTGACAAAT GTCCTCCTGG TACCTACCTA AAACAACACT GTACAGCAAA GTGGAAGACC 180GTGTGCGCCC CTTGCCCTGA CCACTACTAC ACAGACAGCT GGCACACCAG TGACGAGTGT 240CTATACTGCA GCCCCGTGTG CAAGGAGCTG CAGTACGTCA AGCAGGAGTG CAATCGCACC 300CACAACCGCG TGTGCGAATG CAAGGAAGGG CGCTACCTTG AGATAGAGTT CTGCTTGAAA 360CATAGGAGCT GCCCTCCTGG ATTTGGAGTG GTGCAAGCTG GAACCCCAGA GCGAAATACA 420GTTTGCAAAA GATGTCCAGA TGGGTTCTTC TCAAATGAGA CGTCATCTAA AGCACCCTGT 480AGAAAACACA CAAATTGCAG TGTCTTTGGT CTCCTGCTAA CTCAGAAAGG AAATGCAACA 540CACGACAACA TATGTTCCGG AAACAGTGAA TCAACTCAAA AATGTGGAAT AGATGTTACC 600CTGTGTGAGG AGGCATTCTT CAGGTTTGCT GTTCCTACAA AGTTTACGCC TAACTGGCTT 660AGTGTCTTGG TAGACAATTT GCCTGGCACC AAAGTAAACG CAGAGAGTGT AGAGAGGATA 720AAACGGCAAC ACAGCTCACA AGAACAGACT TTCCAGCTGC TGAAGTTATG GAAACATCAA 780AACAAAGACC AAGATATAGT CAAGAAGATC ATCCAAGATA TTGACCTCTG TGAAAACAGC 840GTGCAGCGGC ACATTGGACA TGCTAACCTC ACCTTCGAGC AGCTTCGTAG CTTGATGGAA 900AGCTTACCGG GAAAGAAAGT GGGAGCAGAA GACATTGAAA AAACAATAAA GGCATGCAAA 960CCCAGTGACC AGATCCTGAA GCTGCTCAGT TTGTGGCGAA TAAAAAATGG CGACCAAGAC 1020ACCTTGAAGG GCCTAATGCA CGCACTAAAG CACTCAAAGA CGTACCACTT TCCCAAAACT 1080GTCACTCAGA GTCTAAAGAA GACCATCAGG TTCCTTCACA GCTTCACAAT GTACAAATTG 1140TATCAGAAGT TATTTTTAGA AATGATAGGT AACCAGGTCC AATCAGTAAA AATAAGCTGC 1200TTATAA 120权利要求
1.含序列表中序列1和2的碱基序列的DNA。
2.如权利要求1所述的DNA,其中序列1包含OCIF基因的第1外显子,序列2包含第2、3、4和5外显子,而且,第1外显子和第2外显子之间存在约17kb核苷酸。
3.具有抑制破骨细胞分化和/或成熟作用和具有如下理化性质的蛋白质(a)分子量(用SDS-PAGE法测得)(i)在还原条件下约为60kD(ii)在非还原条件下约为60kD和约为120kD(b)氨基酸序列具有序列表中序列3的氨基酸序列。(C)亲和性对阳离子交换剂和肝素有亲和性。(D)热稳定性(i)70℃、10分钟或56℃、30分钟的热处理降低抑制破骨细胞分化、成熟的活性。(ii)90℃、10分钟的热处理,使抑制破骨细胞分化、成熟的作用消失。
4.具有抑制破骨细胞分化和/或成熟作用的蛋白质的制备方法,其特征在于将含序列表中序列1和2的碱基序列的DNA插入表达载体,制成可表达具有如下理化性质、有抑制破骨细胞分化和/或成熟作用的蛋白质的载体,用此载体用基因工程方法制备该蛋白质所述理化性质为(a)分子量(用SDS-PAGE法测得)(i)在还原条件下约为60kD(ii)在非还原条件下约为60kD和约为120kD(b)氨基酸序列具有序列表中序列3的氨基酸序列。(C)亲和性对阳离子交换剂和肝素有亲和性。(D)热稳定性(i)70℃、10分钟或56℃、30分钟的热处理降低抑制破骨细胞分化、成熟的活性。(ii)90℃、10分钟的热处理,使抑制破骨细胞分化、成熟的作用消失。
全文摘要
序列表中序列1和2所示的DNA及将该DNA插入表达载体,用基因工程方法制备分子量约为60kD(还原条件下)、约为60kD和约120kD(非还原条件下)的具有抑制破骨细胞形成作用的蛋白质的方法。该蛋白质具有抑制破骨细胞形成的作用,在骨质疏松症、风湿病的治疗上有用。
文档编号C07H21/00GK1198776SQ97191093
公开日1998年11月11日 申请日期1997年8月19日 优先权日1996年8月19日
发明者中川信明, 保田尚孝, 森永伴法 申请人:雪印乳业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1