一种新的人基因序列、其编码的多肽及制备方法

文档序号:452064阅读:304来源:国知局
专利名称:一种新的人基因序列、其编码的多肽及制备方法
技术领域
本发明涉及基因工程领域,具体地,本发明涉及一种新的人基因和蛋白。更具体地说,本发明涉及了一种新的sec1基因家族的成员HSly1。本发明提供了该人HSly1的cDNA编码序列、该序列编码的多肽,以及利用重组技术生产所述的新的人HSly1的方法。本发明还提供了这种新人HSly1的应用。
在真核细胞中,高尔基体是细胞内大分子运输的一个主要的交通枢纽。由内质网合成的蛋白质、脂类在高尔基体中被加工、分类与包装,然后分别运送到细胞特定的部位或分泌到细胞外。高尔基体的分泌途径主要分两类在固有性分泌途径中,通过连续的胞吐作用将蛋白质和磷脂运送到细胞表面;在调节性分泌途径中,分泌泡成熟后暂时储存在细胞质中,在外来信号刺激下,分泌泡内含物向细胞外释放(《细胞生物学》,(1995),高等教育出版社,翟中和主编)。目前发现在两种途径的运输中都涉及膜的转运和融合,并与膜上的受体有关。由几个相关的基因家族,共同指导囊泡出芽、定向移动和不同区室间发生的融合。突触融合蛋白(syntaxin)和sec1就是这样的两个基因家族。
突触融合蛋白基因家族编码一族囊泡运输过程中膜上的受体,与两类分泌途径中膜的转运均有关。该家族的成员包括哺乳动物细胞中突触融合蛋白1A,1B,2,3A-3E,4,5,6和酵母中的Pep12p,Sso1/2p和Sed5p等(Dascher C et al,J.Biol.Chem,1994,269(47),29363-29366)。其中,突触融合蛋白1A/B、2、3、4均为细胞膜上的停靠受体,与囊泡上的膜蛋白识别并结合,促进囊泡膜与细胞膜的融合和内含物的释放。(Bennett MK et al,Proc.Natl.Acad.Sci.U.S.A,1993,90,2559-2563)。而突触融合蛋白5是在高尔基体区域中发现的,它是将内质网合成的产物运至高尔基体囊堆的囊泡运输过程中必须的蛋白质(Dascher C et al,J.Biol.Chem,1994,269(47),29363-29366)。稳定状态下,突触融合蛋白5主要与高尔基体内侧的活动有关,它在内质网和前高尔基体或高尔基体内侧之间的区室中被迅速地循环利用(Walch-Solimena C et al.,J.Cell.Biol,1995,128,637)。突触融合蛋白5的过度表达会导致前高尔基体中间物在细胞中的积累。此外,突触融合蛋白5还可能与前高尔基体中间物的形成和成熟有关。突触融合蛋白5存在下,中间体才能正常的生成,形成高尔基体内侧的网络,为高尔基体的成熟提供基础(Presley JFet al.,Nature,1997,389,81)。
sec1基因家族的成员包括神经元中特有的Munc-18/n-Sec1/rb-Sec1、酵母中的Sly1、Vps33、Vps45和在哺乳动物中广泛表达的同种型Munc-18等(William EB etal.,J Biol.Chem.(1996)Vol 271(27),15866-15869)。该家族成员在囊泡运输过程中具体的作用机制尚不详,但由于它们都能与功能已知的突触融合蛋白家族、ras家族的成员形成复合物,影响后者的功能,所以可以推测sec1家族的成员在囊泡运输中必定有着非常重要的功能。其中,酵母Sly1可以与突触融合蛋白基因家族的不同成员如Sed5、突触融合蛋白1、2、3、4分别形成复合物,还可与真核细胞细胞中分泌途径必须的调控因子Ypt1形成复合物(Ossig R et al.,Mol.Cell.Biol,1991,Vol11(6),2980-2993)。Ypt1是ras基因超家族的一个成员,是小的GTP结合蛋白。因为有些蛋白在结合GTP或GDP时,在分泌途径中囊泡出芽或不同区室间发生融合等事件中表现出不同的活性,不同分泌途径中胞内运输和囊泡内蛋白分选的特异性最终取决于许多不同部位的GTP结合蛋白,包括Ypt1、Sec4p、ARF1、ARF2等。缺少Ypt1将引起内质网至高尔基体运输路线的阻断。Sly1的点突变能抑制Ypt1的功能缺失(Dascher MR et al.,Mol Cell.Biol,1991,Vol11,872-885)。Sly1基因的产物在分泌途径早期发挥作用,实验观察到,缺少Sly1的细胞中将积累内质网,无法正常分泌蛋白。1995年Peterson MR等人首先在鼠的肝脏中发现哺乳动物中Sly1的同源基因,命名为rSly1。其蛋白产物可以与突触融合蛋白5形成复合物,调控突触融合蛋白5在内质网到高尔基体运输中的功能(Peterson MR et al,Gene,(1996),169,293-294)。在本发明之前还没有公开或发表过人体中的Sly1的同源基因。
本发明的一个目的是提供一种新的多核苷酸,该多核苷酸编码sec1基因家族的一个新成员,本发明新的人sec1家族的基因被命名为HSly1。
本发明的另一个目的是提供一种新的sec1蛋白家族成员,该蛋白被命名为HSly1蛋白。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人HSly1的方法。
本发明还涉及这种人HSly1基因序列和多肽的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括编码具有人HSly1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.6所示的序列。更佳地,该序列具有SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列。
在本发明的另一方面,提供了一种分离的HSly1蛋白多肽,它包括具有SEQID NO.6氨基酸序列的多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.6序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有HSly1蛋白活性的多肽的方法,该方法包括(a)将编码具有HSly1蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成HSly1蛋白表达载体,所述的核苷酸序列与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成HSly1蛋白的重组细胞;(c)在适合表达HSly1蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有HSly1蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为583个核苷酸,其详细序列见SEQ ID NO.5,其中开放读框位于35-1888位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“HSly1蛋白(或多肽)编码序列”指编码具有HSly1蛋白活性的多肽的核苷酸序列,如SEQ ID NO.5中35-1888位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.5序列的编码框35-1888位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.5中35-1888位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.6所述的序列。该术语还包括能在中度严紧条件下,更佳地在高度严紧条件下,与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列杂交的核苷酸序列。此外,该术语还包括与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%的核苷酸序列。
该术语还包括能编码具有与人HSly1相同功能的蛋白的、SEQ ID NO.5中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“HSly1蛋白多肽”指具有HSly1蛋白活性的SEQ ID NO.6序列的多肽。该术语还包括具有与人HSly1蛋白相同功能的、SEQ IDNO.6序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括HSly1蛋白的活性片段和活性衍生物。
该多肽的变异形式包括同源序列、等位变异体、天然突变体、诱导突变体、在高或低的严谨度条件下能与HSly1 DNA杂交的DNA所编码的蛋白、以及利用抗HSly1多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含HSly1多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还提供了HSly1多肽的可溶性片段。通常,该片段具有HSly1多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供HSly1蛋白或多肽的类似物。这些类似物与天然HSly1多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还可以包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸、磷酸丝氨酸、磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明还包括HSly1多肽编码序列的反义序列。这种反义序列可用于抑制细胞内HSly1的表达。
本发明还包括一种可用作探针或引物的核苷酸分子。该探针分子通常具有HSly1核苷酸序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码HSly1的核酸分子。
本发明还包括检测HSly1核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于HSly1多肽的编码序列,可位于该编码序列的两侧或中间。引物长度一般为20-50个核苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对HSly1 DNA或是其片段编码的多肽具有特异性抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于HSly1基因产物或片段。较佳地,指那些能与HSly1基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制HSly1蛋白的分子,也包括那些并不影响HSly1蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的HSly1基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的HSly1基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达HSly1或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断HSly1功能的抗体以及不影响HSly1功能的抗体。本发明的各类抗体可以利用HSly1基因产物的片段或功能区,通过免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与HSly1基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明的HSly1核苷酸序列全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按已知方法制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。当然,通过先合成多个小片段,然后再进行连接而获得序列很长的片段。
在本发明的一个实施方案中,本发明的多核苷酸全长为1992个核苷酸,其详细序列见SEQ ID NO.5,其中开放读框位于35-1888位核苷酸。该多核苷酸是如此获得的,以人脑λgt11cDNA文库(购自Clontech公司)为模板,合成正向引物A5′-TATTCGGGAAAGGCAGACAGTGG-3′(SEQ ID NO.1)、正向引物C5’-TTGGACATATCAAGCATTGGTGC-3’(SEQ ID NO.3)和反向引物B5′-AACAGCTGATG TTAGCTTAGCGG-3′(SEQ ID NO.2)、反向引物D5’-TTAGGACACTGTTACAG AGAAGG-3’(SEQ ID NO.4)进行两次PCR,获得1992bp的目的片段。测序后得到SEQ ID NO.5的全长cDNA序列。
根据同源比较的结果,本发明的核苷酸序列及其编码的蛋白质序列与不同来源的sec1家族成员显示了显著的同源性,因此,这表明它是sec1家族的一个新成员,并且具有sec1家族蛋白的一些重要功能。
HSly1是人体细胞中蛋白分泌机制的重要组成,在囊泡运输(尤其是从内质网到高尔基体的囊泡运输)中有着重要的功能,还可能与高尔基体的成熟及功能正常行使有关。当细胞受到外来压力时,HSly1能够改变生化合成的方向,显著提高特定蛋白的产量并促进蛋白的释放。
在附图中,

图1为本发明的人HSly1核酸序列(HSLY1N)与鼠RSLY1的核酸序列(RSLY1N)的同源比较图。其中,相同的核苷酸用“|”标出。
图2为本发明的人HSly1蛋白(HSLY1P)与鼠RSLY1蛋白(RSLY1P)的氨基酸序列的同源比较图。其中,相同的氨基酸在两个序列之间用“|”标出,相似的氨基酸用“·”标出。相似氨基酸是A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New YorkCold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1HSly1的cDNA序列的克隆和测定1.引物扩增以人脑λgt11cDNA文库(购自Clontech公司)为模板,用两对寡核苷酸为引物——A5′-TATTCGGGAAAGGCAGACAGTGG-3′(SEQ ID NO.1)和C5’-TTGGACATATCAAGCATTGGTGC-3’(SEQ ID NO.3)为正向引物,寡核苷酸B5′-AACAG CTGATGTTAGCTTAGCGG -3′(SEQ ID NO.2)和D5’-TTAGGACACTGTTACAGAGAAGG-3’(SEQ ID NO.4)为反向引物,进行PCR。A/B引物对和C/D引物对的PCR条件均为93℃4分钟,随之以93℃1分钟、67℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟。电泳检测得到的PCR片断分别为1117、1211bp的目的片段。
2.PCR产物的测序将如上获得的两段PCR扩增产物分别与pGEM-T载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTMDNA测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后用电脑软件拼接顺序,获得全长cDNA序列,共1992bp,详细序列见SEQ ID NO.5,其中开放读框位于35-1888位核苷酸。
根据得到的全长cDNA序列推导出HSly1的氨基酸序列,共617个氨基酸残基,其氨基酸序列详见SEQ ID NO.6。
实施例2同源比较用HSly1的全长cDNA序列及其编码蛋白在Non-redundant GenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBank CDS translations+PDB+SwissProt+Spupdate+PIR数据库中用BLAST进行核酸和蛋白同源检索。发现它们与sec1基因家族的成员具有较高的同源性,其中与鼠的rSly1基因在核酸水平上达到85.5%相同(图1),在蛋白水平上达到96%相同,98%相似(图2)。因而可以认为我们所找到的基因是rSly1的同源基因,是sec1基因家族的一个新成员。
rSly1与酵母的Sly1是同源基因(核酸的同源性为30%),它的开放阅读框编码了一个分子量为72~73kD的亲水蛋白。该蛋白可以与突触融合蛋白5形成复合物,正调控突触融合蛋白5在内质网到高尔基体运输中的功能。可能的调控机制是rSly1与突触融合蛋白5的结合可以促进停靠-融合复合物的形成。突触融合蛋白5的过度表达将用竭内源性的rSly1,未形成复合物的突触融合蛋白5将阻碍囊泡停靠和融合过程中正常的蛋白质复合物的形成。仅当rSly1表达相当于或过量于突触融合蛋白5时,突触融合蛋白5才能正常的行使功能。而过量表达的rSly1本身对内质网到高尔基体的运输无显著负效应。(William EB et al.,J Biol.Chem.(1996)Vol 271(27),15866-15869)。rSly1与sec1家族其他成员一样,没有穿膜区。已经在鼠的八个不同组织中发现了rSly1的表达,其中在脑中和肺中最多。rSly1的广泛表达暗示rSly1可能在所有组织中的内质网到高尔基体的运输中发挥作用(Peterson MR et al,Gene(1996),169,293-294)。
迄今所进行的研究都表明,蛋白分泌机制中的必要组成在进化中是高度保守的。由对HSly1的序列分析和同源性比较的结果,可以推测,HSly1是人体细胞中蛋白分泌机制的重要组成,在囊泡运输(尤其是从内质网到高尔基体的囊泡运输)中有着重要的功能,还可能与高尔基体的成熟及功能正常行使有关。由于,高尔基体在内膜系统中处于中介地位,许多重要的大分子的运输和分泌都要通过高尔基体,如腺体细胞的分泌颗粒、血细胞的细胞质颗粒和精细胞的顶体。高尔基体还与新的细胞质膜、细胞壁的形成和蛋白质的改造有关。高尔基体和蛋白分泌途径的异常将使细胞发生病理性的变化,或发生分化程度的改变,引起骨节炎等病症。
在另一项研究中发现,rSly1(在此项研究中该基因的蛋白产物又被命名为RA410,Matsuo N et al.,J.Biol.Chem.,1997,Vol272(26),16438)与后高尔基体的蛋白加工和运输有关,当星形胶质细胞因局部缺血而缺氧后重新给氧时,RA410在细胞中的表达量会明显增加。这意味着RA410很可能是星形胶质细胞受到外来压力时进行的蛋白质运输的主要功能组成。星形胶质细胞在中枢神经系统中有非常重要的功能,与血脑屏障的维持和兴奋性神经递质的移动均有关系。星形胶质细胞能够生成细胞因子,如白介素IL-1,IL-6和干扰素等。已经证实,星形胶质细胞局部缺血后重新给氧时,会生成IL-6。但如果RA410的表达被抑制,IL-6将无法正常生成。可见,RA410在缺氧后重新得氧的星形胶质细胞中为IL-6提供了最优化的运输。可以推测,在人体中发现的Sly1的同源基因产物也可能与RA410有类似的功能,即当细胞受到外来压力时能够改变生化合成的方向,显著提高特定蛋白的产量并促进蛋白的释放。
对HSly1的结构和序列的了解,不仅有助于对其功能的进一步研究,更有助于进一步阐明细胞内物质运输的分子机制,为相关疾病的治疗提供理论依据。
本发明的人HSly1除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人HSly1还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人HSly1的N端与鼠RSly1的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人HSly1的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
此外,本发明人HSLY1核酸(编码序列或反义序列)可以被引入细胞,以提高人HSLY1的表达水平或者抑制人HSLY1的过度表达。本发明的人HSLY1蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人HSLY1缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
实施例3HSly1在大肠杆菌中的表达在该实施例中,将在实施例1中获得的两个片段分别用Xmn I酶切,混合并加入连接酶连接,连接完成后走电泳,鉴定并回收正确连接的全长片段。将编码HSly1的DNA序列作为模板,用对应于该DNA序列的5’,3’端的PCR寡核苷酸引物进行扩增,获得HSly1的cDNA作为插入片段。
5′寡核苷酸引物序列为5′-GCATGGATCCATGTTGAATTTCAATGTGC-3′(SEQ ID NO.7),该引物含有BamHI限制性内切酶的酶切位点,接之是由起始密码子开始的HSly1编码序列的19个核苷酸;3’寡核苷酸引物序列为5’-ACAGGTCGACTTACTTTTGTCCAAGTTGT-3’(SEQ ID NO.8),该引物含有SalI限制性内切酶的酶切位点,一个翻译终止子和HSly1的编码序列。
限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
用BamHI和SalI消化pQE-9载体及插入片段,随后将插入片段连接到pQE-9载体并保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的阳性转化子克隆。抽提质粒,用HindIII酶切鉴定插入片段大小及方向,测序验证结果表明HSly1的cDNA插入片段已正确装入载体。
过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大体积培养基中,培养细胞生长至600光密度(OD600)为0.4-0.6时,加入IPTG(“异丙基硫代-β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收集细胞并将细胞沉淀溶于6M的盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结合的条件下,用镍-螯合柱层析从溶液中纯化溶解的HSly1。用6M盐酸胍(pH5.0)从柱中洗脱HSly1。可用几种方法从盐酸胍中变性沉淀蛋白。首先,使用透析步骤除去盐酸胍,或者从镍-螯合柱中分离出的纯化蛋白可以结合到第二个柱中,该柱中具有递减的线性盐酸胍梯度。在结合到该柱时蛋白质变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的蛋白质用PBS进行透析,然后将蛋白质保存在终浓度为10%(w/v)甘油的贮存液中。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为70KDa。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.6的序列一致。
实施例4HSly1在真核细胞(CHO细胞株)中的表达在该实施例中,将在实施例1中获得的两个片段分别用Xmn I酶切,混合并加入连接酶连接,连接完成后走电泳,鉴定并回收正确连接的全长片段。将编码HSly1的DNA序列作为模板,用对应于该DNA序列的5’,3’端的PCR寡核苷酸引物进行扩增,获得HSly1的cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为5′-GCATGGATCCATGTTGAATTTCAATGTGC-3′(SEQ ID NO.9),该引物含有BamHI限制性内切酶的酶切位点,接之是由起始密码子开始的HSly1编码序列的19个核苷酸;3′端引物序列为5’-ACAGGAATTCTTACTTTTGTCCAAGTTGT-3’(SEQ ID NO.10)该引物含有EcoRI限制性内切酶的酶切位点、一个翻译终止子和HSly1的编码序列。
引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个噬菌体复制起点(f1 ori)、一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、一个SV40启动子、一个SV40加尾信号和相应的polyA顺序、一个BGH加尾信号和相应的polyA顺序。
用BamHI和EcoRI消化pcDNA3载体及插入片段,随后将插入片段连接到pcDNA3载体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒,测序验证结果表明HSly1的cDNA插入片段已正确装入载体。
质粒转染是采用脂转染法,用Lipofectin试剂盒(GiBco Life)进行的。转染48小时后,经2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活力。去G418,连续传代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法破碎细胞。以含0.05%Triton的50mM Tris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mM Tris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris·HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述蛋白的活性峰。然后以PBS(pH7.4)为透析液对表达蛋白溶液进行透析。最后冻干保存。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为70KDa。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.6的序列一致。
实施例5制备抗体将实施例3和4中获得的重组蛋白用来免疫动物以产生抗体,具体如下。重组蛋白用层析法进行分离后备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下,并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血清的特异反应活性用它在体外沉淀HSly1基因翻译产物的能力加以评估。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表(1)一般信息(i)申请人上海新黄浦复旦基因工程有限公司(ii)发明名称一种新的人基因序列、其编码的多肽及制备方法(iii)序列数目10(2)SEQ ID NO.1的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.1TATTCGGGAA AGGCAGACAG TGG 23(2)SEQ ID NO.2的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.2AACAGCTGAT GTTAGCTTAG CGG 23(2)SEQ ID NO.3的信息(i)序列特征
(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.3TTGGACATAT CAAGCATTGG TGC 23(2)SEQ ID NO.4的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.4TTAGGACACT GTTACAGAGA AGG 23(2)SEQ ID NO.5的信息(i)序列特征(A)长度1992bp(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO.51 TATTCGGGAA AGGCAGACAG TGGCTTTGAA GCGTATGTTG AATTTCAATG TGCCTCATAT61 TAAAAACAGC ACAGGAGAAC CAGTATGGAA GGTACTCATT TATGACAGAT TTGGCCAAGA121 TATAATCTCT CCTCTGCTAT CTGTGAAGGA GCTAAGAGAC ATGGGAATCA CTCTGCATCT181 GCTTTTACAC TCTGATCGAG ATCCTATTCC AGATGTTCCT GCAGTATACT TTGTAATGCC241 AACTGAAGAA AATATTGACA GAATGTGCCA GGATCTTCGA AATCAACTAT ATGAATCATA301 TTATTTAAAT TTTATTTCTG CTATTTCAAG AAGTAAACTG GAAGATATTG CAAATGCAGC361 GTTAGCAGCT AGTGCAGTAA CACAAGTAGC CAAGGTTTTT GACCAATATC TCAATTTTAT421 TACTTTGGAA GATGATATGT TTGTATTATG TAATCAAAAT AAGGAGCTTG TTTCATATCG481 TGCCATTAAC AGGCCAGATA TCACAGACAC GGAAATGGAA ACTGTTATGG ACACTATAGT541 TGACAGCCTC TTCTGCTTTT ATGGTACTCT GGGTGATGTT CCTATAATCA GATGTTCAAG601 AGGAACAGCA GCAGAAATGG TAGCAGTGAA ACTAGACAAG AAACTTCGAG AAAATCTAAG661 AGATGCAAGA AACAGTCTTT TTACAGGTGA TACACTTGGA GCTGGCCAAT TCAGCTTCCA721 GAGGCCCTTA TTAGTCCTTG TTGACAGAAA CATAGATTTG GCAACTCCTT TACATCATAC781 TTGGACATAT CAAGCATTGG TGCACGATGT ACTGGATTTC CATTTAAACA GGGTTAATTT841 GGAAGAATCT TCAGGAGTGG AAAACTCTCC AGCTGGTGCT AGACCAAAGA GAAAAAACAA901 GAAGTCTTAT GATTTAACTC CGGTTGATAA ATTTTGGCAA AAACATAAAG GAAGTCCATT961 CCCAGAAGTT GCAGAATCAG TTCAGCAAGA ACTAGAATCT TACAGAGCAC AGGAAGATGA1021 GGTCAAACGA CTTAAAAGCA TTATGGGACT AGAAGGGGAA GATGAAGGAG CCATAAGTAT1081 GCTTTCTGAC AATACCGCTA AGCTAACATC AGCTGTTAGT TCTTTGCCAG AACTCCTTGA1141 GAAAAAAAGA CTTATTGATC TCCATACAAA TGTTGCCACT GCTGTTTTAG AACATATAAA1201 GGCAAGAAAA TTGGATGTAT ATTTTGAATA TGAAGAAAAA ATAATGAGCA AAACTACTCT1261 GGATAAATCT CTTCTAGATA TAATATCAGA CCCTGATGCA GGAACTCCAG AAGATAAAAT1321 GAGGTTGTTT CTTATCTATT ATATAAGCAC ACAGCAAGCA CCTTCTGAGG CTGATTTGGA1381 GCAATATAAA AAAGCTTTAA CTGATGCAGG ATGCAACCTT AATCCTTTAC AATATATCAA1441 ACAGTGGAAG GCTTTTACCA AGATGGCCTC AGCTCCGGCC AGCTATGGCA GCACTACCAC1501 TAAACCAATG GGTCTTTTAT CACGAGTCAT GAATACAGGA TCACAGTTTG TGATGGAAGG1561 AGTGAAGAAC CTGGTTTTGA AACAGCAAAA TCTACCTGTT ACTCGTATTT TGGACAATCT1621 TATGGAGATG AAGTCAAACC CCGAAACTGA TGACTATAGA TATTTTGATC CCAAAATGCT1681 GCGGGGCAAT GACAGCTCAG TTCCCAGAAA TAAAAATCCA TTCCAAGAGG CCATTGTTTT1741 TGTGGTGGGA GGAGGCAACT ACATTGAATA TCAGAATCTT GTTGACTACA TAAAGGGGAA1801 ACAAGGCAAA CACATTTTAT ATGGCTGCAG TGAGCTTTTT AATGCTACAC AGTTCATAAA1861 ACAGTTGTCA CAACTTGGAC AAAAGTAACA CAGAAGAACC TTACTATGAT AATCTACTTG1921 GAATGTGGAT AAATGTAAAA AGAAGAAAAG TTAGAAGAGC AATATGTTTC CTTCTCTGTA1981 ACAGTGTCCT AA(2)SEQ ID NO.6的信息(i)序列特征(A)长度617个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型多肽(xi)序列描述SEQ ID NO.61 Met Leu Asn Phe Asn Val Pro His Ile Lys Asn Ser Thr Gly Glu16 Pro Val Trp Lys Val Leu Ile Tyr Asp Arg Phe Gly Gln Asp Ile31 Ile Ser Pro Leu Leu Ser Val Lys Glu Leu Arg Asp Met Gly Ile46 Thr Leu His Leu Leu Leu His Ser Asp Arg Asp Pro Ile Pro Asp61 Val Pro Ala Val Tyr Phe Val Met Pro Thr Glu Glu Asn Ile Asp76 Arg Met Cys Gln Asp Leu Arg Asn Gln Leu Tyr Glu Ser Tyr Tyr91 Leu Asn Phe Ile Ser Ala Ile Ser Arg Ser Lys Leu Glu Asp Ile106 Ala Asn Ala Ala Leu Ala Ala Ser Ala Val Thr Gln Val Ala Lys121 Val Phe Asp Gln Tyr Leu Asn Phe Ile Thr Leu Glu Asp Asp Met136 Phe Val Leu Cys Asn Gln Asn Lys Glu Leu Val Ser Tyr Arg Ala151 Ile Asn Arg Pro Asp Ile Thr Asp Thr Glu Met Glu Thr Val Met166 Asp Thr Ile Val Asp Ser Leu Phe Cys Phe Tyr Gly Thr Leu Gly181 Asp Val Pro Ile Ile Arg Cys Ser Arg Gly Thr Ala Ala Glu Met196 Val Ala Val Lys Leu Asp Lys Lys Leu Arg Glu Asn Leu Arg Asp211 Ala Arg Asn Ser Leu Phe Thr Gly Asp Thr Leu Gly Ala Gly Gln226 Phe Ser Phe Gln Arg Pro Leu Leu Val Leu Val Asp Arg Asn Ile241 Asp Leu Ala Thr Pro Leu His His Thr Trp Thr Tyr Gln Ala Leu256 Val His Asp Val Leu Asp Phe His Leu Asn Arg Val Asn Leu Glu271 Glu Ser Ser Gly Val Glu Asn Ser Pro Ala Gly Ala Arg Pro Lys286 Arg Lys Asn Lys Lys Ser Tyr Asp Leu Thr Pro Val Asp Lys Phe301 Trp Gln Lys His Lys Gly Ser Pro Phe Pro Glu Val Ala Glu Ser316 Val Gln Gln Glu Leu Glu Ser Tyr Arg Ala Gln Glu Asp Glu Val331 Lys Arg Leu Lys Ser Ile Met Gly Leu Glu Gly Glu Asp Glu Gly346 Ala Ile Ser Met Leu Ser Asp Asn Thr Ala Lys Leu Thr Ser Ala361 Val Ser Ser Leu Pro Glu Leu Leu Glu Lys Lys Arg Leu Ile Asp376 Leu His Thr Asn Val Ala Thr Ala Val Leu Glu His Ile Lys Ala391 Arg Lys Leu Asp Val Tyr Phe Glu Tyr Glu Glu Lys Ile Met Ser406 Lys Thr Thr Leu Asp Lys Ser Leu Leu Asp Ile Ile Ser Asp Pro421 Asp Ala Gly Thr Pro Glu Asp Lys Met Arg Leu Phe Leu Ile Tyr436 Tyr Ile Ser Thr Gln Gln Ala Pro Ser Glu Ala Asp Leu Glu Gln451 Tyr Lys Lys Ala Leu Thr Asp Ala Gly Cys Asn Leu Asn Pro Leu466 Gln Tyr Ile Lys Gln Trp Lys Ala Phe Thr Lys Met Ala Ser Ala481 Pro Ala Ser Tyr Gly Ser Thr Thr Thr Lys Pro Met Gly Leu Leu496 Ser Arg Val Met Asn Thr Gly Ser Gln Phe Val Met Glu Gly Val511 Lys Asn Leu Val Leu Lys Gln Gln Asn Leu Pro Val Thr Arg Ile526 Leu Asp Asn Leu Met Glu Met Lys Ser Asn Pro Glu Thr Asp Asp541 Tyr Arg Tyr Phe Asp Pro Lys Met Leu Arg Gly Asn Asp Ser Ser556 Val Pro Arg Asn Lys Asn Pro Phe Gln Glu Ala Ile Val Phe Val571 Val Gly Gly Gly Asn Tyr Ile Glu Tyr Gln Asn Leu Val Asp Tyr586 Ile Lys Gly Lys Gln Gly Lys His Ile Leu Tyr Gly Cys Ser Glu601 Leu Phe Asn Ala Thr Gln Phe Ile Lys Gln Leu Ser Gln Leu Gly616 Gln Lys(2)SEQ ID NO.7的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.7GCATGGATCC ATGTTGAATT TCAATGTGC 29(2)SEQ ID NO.8的信息(i)序列特征(A)长度29碱基
(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.8ACAGGTCGAC TTACTTTTGT CCAAGTTGT 29(2)SEQ ID NO.9的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.9GCATGGATCC ATGTTGAATT TCAATGTGC C 29(2)SEQ ID NO.10的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.10ACAGGAATTC TTACTTTTGT CCAAGTTGT 29
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人HSly1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.6所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列。
4.一种分离的HSly1蛋白多肽,其特征在于,它包括具有SEQ ID NO.6氨基酸序列的多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.6序列的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.如权利要求7所述的宿主细胞,其特征在于,该细胞是大肠杆菌。
9.如权利要求7所述的宿主细胞,其特征在于,该细胞是真核细胞。
10.一种产生具有HSly1蛋白活性的多肽的方法,其特征在于,该方法包括(a)将编码具有HSly1蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成HSly1蛋白表达载体,所述的核苷酸序列与SEQ ID NO.5中从核苷酸35-1888位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成HSly1蛋白的重组细胞;(c)在适合表达HSly1蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有HSly1蛋白活性的多肽。
11.如权利要求10所述的方法,其特征在于,该序列为SEQ ID NO.5中从核苷酸35-1888位。
12.一种能与权利要求4所述的HSly1蛋白多肽特异性结合的抗体。
13.一种核苷酸分子,其特征在于,它是权利要求1所述DNA分子的反义序列。
14.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中约8-100个连续核苷酸。
全文摘要
本发明提供了一种新的secl基因家族的成员HSyl1。本发明提供了该人HSyc1的cDNA编码序列、该序列编码的多肽,以及利用重组技术生产所述的新的人HSly1的方法。本发明还提供了这种新人HSly1基因和多肽的应用。
文档编号C12N15/11GK1250095SQ98120920
公开日2000年4月12日 申请日期1998年10月6日 优先权日1998年10月6日
发明者余龙, 赵勇, 傅强, 张宏来, 赵寿元 申请人:上海新黄浦复旦基因工程有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1