一种尿激酶原基因突变体及其制备方法

文档序号:423326阅读:356来源:国知局
专利名称:一种尿激酶原基因突变体及其制备方法
技术领域
本发明涉及生物工程领域,尤其涉及一种尿激酶原基因突变体及其制备方法。
背景技术
尿激酶原(pro-UK,单链尿激酶性纤溶酶原激活剂,scu-PA)是一种单链丝氨酸蛋白酶原,成熟蛋白分子由411个氨基酸残基组成,分子量54KD。尿激酶原在纤溶酶、胰蛋白酶和激肽释放酶等作用下,在158位赖氨酸和159位亮氨酸(Ile)之间发生断裂,断裂之后形成的A和B两条肽链,两条链通过第148位与第279位的半胱氨酸(Cysl48-Cys279)之间形成的二硫键相互连 在一起,形成高分子尿激酶(HMW-UK)。高分子尿激酶的分子量与尿激酶原相同。高分子尿激酶能在纤溶酶作用下进一步发生水解,在Lysl35-Lysl36之间产生断裂,失去前面的135个氨基酸,形成低分子量尿激酶(LMW-UK)。尿激酶原、高分子量尿激酶和低分子量尿激酶均能激活纤维蛋白溶解酶原(plasminogen),使之成为纤维蛋白溶解酶(plasmin)。纤维蛋白溶解酶可以将血栓处的纤维蛋白和和其它血浆蛋白降解。因此,尿激酶原、高分子尿激酶和低分子尿激酶均能用于血栓治疗。但是,作为溶解血栓的药物,以尿激酶原最为安全,因为它在到达栓塞部位之前是没有活性的,到达治疗部位之后在原位发生降解,才生成能够激活纤维蛋白溶解酶原活性的尿激酶。由于这个缘故,使用尿激酶原作为溶栓药物时,可以通过一次性注射达到溶解血栓的用药剂量,治疗效果比较好;而尿激酶本身具有生物活性,能对给药通路上的血管壁产生影响,使用时必须控制给药速度,通过分步用药,逐渐达到治疗剂量。因此,当阻断血管的栓塞较大时,尿激酶的治疗效果不如尿激酶原好。尿激酶原是一种糖蛋白,蛋白质分子在体内合成之后需要进一步加工,在某些氨基酸残基(糖基化位点)上增加糖链。但是,作为溶栓药物,糖基化对尿激酶并不重要,在尿激酶原分子上增加糖链,既不能大幅提高它的生物活性,也不能有效降低它的分子在血液中被清除的速度。基于上述原因,工业化生产尿激酶原蛋白质,既可以采用真核细胞大规模培养技术,也可以采用基因工程细菌大规模发酵工艺。尿激酶原是一种真核生物蛋白质,其编码基因使用的遗传密码与原核生物有所不同,存在许多对于大肠杆菌来说是稀有的密码子。由于大肠杆菌中对应于这些稀有密码子的转移RNA丰度很低,蛋白质合成过程受到某些氨基酸供应的限制,故天然尿激酶原基因在基因重组大肠杆菌中的表达水平很低。若想采用微生物发酵技术大规模生产尿激酶原,必须采用的关键技术之一,就是优化基因中氨基酸的遗传密码,用大肠杆菌偏爱的密码子替换动物基因惯用的密码子。本发明分析了公开发表的人尿激酶原基因序列,发现若要在大肠杆菌中有效表达该基因,基因序列中有多达20个遗传密码需要替换。这些密码子在基因序列中的位置分散,难以用基因定点突变等简单操作将基因序列完全优化
发明内容
本发明的目的在于提供了一种尿激酶原基因突变体及其制备方法,它是适宜在大肠杆菌中表达的新型尿激酶原基因,实现了通过大肠杆菌发酵技术生产尿激酶原。本发明是这样来实现的,一种尿激酶原基因突变体,其特征在于在保持蛋白质的氨基酸组成和序列不变的前提下,在基因序列的5’端增加了两个核苷酸G和T,在序列的3’端增加了核酸内切酶Sall的识别序列GTCGAC,其基因突变体的核苷酸序列为序列表I ;突变基因序列包含一系列密码子替换;密码子代换的详细资料如下:第34位亮氨酸的密码子从CTA变为CTT,第64位异亮氨酸的密码子从ATA变为ATC,第79位精氨酸的密码子从CGA变为CGT,第107位组氨酸的密码子从CAC被更换成CAT,第108位精氨酸的密码子从AGA变为CGC,第123位精氨酸的密码子从AGG变为CGC,第128、129、130位连续三个精氨酸的密码子从CGG CGA AGG变换为CGC CGT CGC,第198位和199位两个精氨酸的密码子从AGG AGG变为CGC CGT,第201位精氨酸的密码子从CGG变换成CGC,第243位精氨酸的密码子从AGG变为CGT,第273位组氨酸的密码子从CAC变为CAT,第287位精氨酸密码由AGG变为CGC,第293位精氨酸密码子从AGG变为CGT,第295位异亮氨酸的密码子从ATA更换为ATT,第343位精氨酸的密码子从CGG变为CGC,第411位精氨酸的密码子从AGA变换成CGC。其制备方法包括以下步骤:(I)合成单链核苷酸片段;采用单链DNA片段合成方法,它按照尿激酶原基因突变体的序列设计,从基因5’端到3’端划分为20个片段,分别进行合成;设计出的20个合成片段,涵盖尿激酶原基因全部411个氨基酸的编码序列,合成基因5’端起始于尿激酶原天然分子的首位氨基酸丝氨酸的密码子AGC,其3’端结束于翻译终止密码子TGA;为了便于进一步基因操作,便于用特异的表达载体在大肠杆菌中生产出天然尿激酶原蛋白质分子,借助基因两端引物的合成,预先对合成基因的两个末端做出适当处理。在5’端增加了两个核苷酸GT,为的是在把基因插入表达载体时能够恢复蛋白酶Xa的识别位点第4个氨基酸精氨酸的编码;同时,为便于将基因插入表达载体,在其3’端增加了一个核酸内切酶识别位点GTCGAC ;这20个合成片段的主要特点有两个:第一,20个片段依基因序列按顺序从头至尾排列;第二,1、3、5... 等奇数片段的核苷酸排列与基因正链相同,2、4、6... 等 偶数片段的核苷酸序列与基因的负链相同;第三,相邻两个片段有13-15个碱基互补,可以退火连接在一起;(2) PCR产生双链DNA片段;为了应用PCR延伸技术获得双链DNA,这些片段的序列资料取自双链DNA分子的两条互补链;标有奇数的片段的DNA序列,其核苷酸排列顺序与mRNA的核苷酸排列完全相同;而标有偶数的片段的DNA序列,其核苷酸序列与mRNA的核苷酸序列互补;为了退火的需要,相邻两个片段之间有13-15bp碱基的互补区,在拼接基因的时候,相邻的两个片段可以借助互补区相互搭在一起,形成局部双链区,并通过PCR延伸反应把其余的单链区转换成双链,通过片段之间反复退火与延伸,将各个片段整合在一起,获得尿激酶原的全基因序列,采用单链DNA片段退火和PCR延伸的方法,将合成的单链DNA片段组装成双链DNA片段,单链片段1_4组装成双链片段A ;单链片段5-8组装成双链片段B ;9-12组装成C; 13-16组装成D ; 17-20组装成E ;
(3)拼接尿激酶原基因突变体的全序列;接种培养含有尿激酶原基因A,B, C,D, E片段的细菌克隆,提取质粒DNA,分离A,B, C,D, E片段DNA。以这些DNA片段为材料,按照基因设计图上各个片段的顺序关系,采用相互退火和PCR延伸的方法,将A片段和B片段连接在一起,得到长度为500bp的AB片段;将C片段和D片段扩增为长度500bp的⑶片段。然后,在1.5%的琼脂糖凝胶电泳上分离和回收上述AB片段和CD片段,并直接用作模板进行退火和PCR延伸,将它们连接在一起,得到800bp的ABCD片段;最后,采用同样的方法,将尾部的小片段E连接到大片段AB⑶的3’端,得到1200bp的完整片段,完成全序列的拼接;(4)尿激酶原基因突变体序列测定和分析;在完成全基因DNA序列的拼接之后,利用事先合成的一对PCR引物,将全基因序列进行了扩增,并把它克隆到PUC18载体上,提取重组质粒DNA进行测序分析;对于序列分析中发现的错误碱基,采用定点突变的方法全部予以纠正,直至全基因序列完全符合设计要求为止。所述的退火和PCR延伸是逐步完成的,详细操作步骤分述如下:第一步,通过相邻片段退火和PCR延伸,将相邻的两个片段I和2、3和4、5和6、7和8、9和10、11和12、13和14、15和16、17和18、19和20,从长度约为70个碱基的单链DNA片段,转换成长度约为140bp的双链DNA片段;第二步,用1.5%琼脂糖凝胶电泳分离和回收上述片段,并以它们为模板进行下一轮PCR扩增,把四个原始合成片段,即片段1- 4,、5-8、9-12、13-16、17- 20,扩增成为250bp的大片段;同样,用1.5%琼脂糖凝胶电泳分离和回收这些片段,并用钝端连接的方法,把它们插入到PUC18载体的Smal位点,转化大肠杆菌DH5alpha,获得含有上述5个大片段的细菌克隆;从含有上述5个250bp片段的5组细克隆库中个挑选6个克隆扩大培养,提取质粒DNA进行测序分析;通过解析DNA序列测定资料,从经过测序的5组克隆中,各挑选2个克隆,编号保存其DNA样本和菌体。本发明的技术效果是:本发明通过人工合成全基因的方法,不仅优化了全部遗传密码子,而且对基因两端进行了适当修饰,使之易于进行测序分析和构建表达载体等进一步基因操作;从而开发一种适宜在大肠杆菌中表达的新型尿激酶原基因,以便通过大肠杆菌发酵技术生产尿激酶原。本发明合成的突变基因,其核苷酸序列与天然基因有许多不同之处,但它编码的蛋白质仍然是人的尿激酶原,其氨基酸组成和排列顺序与天然尿激酶原相同。


图1为本发明合成的20个DNA片段的相对位置图。图2为拼接尿激酶原基因突变体的过程示意图。图3为尿激酶原基因片段拼接的过程示意图。
具体实施例方式为清楚地显示本发明的创新点,序列2中列出了天然尿激酶原cDNA基因的核苷酸序列,在序列I中列出了本发明新设计的基因突变体的核苷酸序列,在序列4中给出了天然尿激酶原的氨基酸序列,序列5为尿激酶原基因突变编码的氨基酸序列。本发明不仅优化了全部遗传密码子,而且对基因两端进行了适当修饰,使之易于进行测序分析和构建表达载体等进一步基因操作。本发明的目标是开发一种适宜在大肠杆菌中表达的新型尿激酶原基因,以便通过大肠杆菌发酵技术生产尿激酶原。本发明合成的突变基因,其核苷酸序列与天然基因有许多不同之处,但它编码的蛋白质仍然是人的尿激酶原,其氨基酸组成和排列顺序与天然尿激酶原相同。下面结合附图和实施例对本发明做进一步阐述;1.基因突变体核苷酸序列的设计
尿激酶原是一个真核生物的蛋白质,它对应的基因具有外显子和内含子等真核生物基因的特征,基因的氨基酸编码序列是不连续的。而大肠杆菌等原核生物的基因编码是连续的,因此,在大肠杆菌中表达尿激酶原基因,只能使用它的CDNA基因,S卩,使用从人体组织中分离的尿激酶原信使RNA (mRNA)作为模板,通过反转录生成一条所载遗传信息与mRNA完全相同的DNA,就是cDNA基因。要获得cDNA基因,第一步工作是取活体组织,从中分离纯化尿激酶原的特异mRNA,然后以它为模板反转录生成cDNA基因。即便如此,所获得的基因也不能直接用于表达,因为真核生物cDNA基因的遗传密码不完全符合在大肠杆菌中实现高效表达的要求。具体到尿激酶原基因,有两个问题:第一,尿激酶原cDNA基因的长度是1296个核苷酸,编码一条长度为431个氨基酸的肽链,其中411个氨基酸组成有生物活性的尿激酶原分子,最前边20个氨基酸组成一条引导肽。引导肽的生物学功能,是引导新合成的蛋白质分子分泌到细胞之外,在细菌中不但没有用处,而且影响基因的表达,必须去除。第二,在编码尿激酶原蛋白的411个遗传密码中,有20个密码子是大肠杆菌不常使用的稀有密码子,必须全部更换成大肠杆菌偏爱的密码子。这20个需要被更换的密码子,散布在基因的全序列中,难以使用定点突变等简便技术将它们全部替换,只能采用人工合成基因片段的方法,将需要替换的密码子包括在内,通过拼接合成片段,获得序列优化的尿激酶原基因。因此,实施本发明的第一个工作步骤,是全面设计基因突变体的DNA序列,使之最适宜在大肠杆菌中表达,并参照合成DNA片段的成本和拼接工作的可操作性,合理划分需合成的寡核苷酸片段,送专门合成DNA的商业公司进行DNA合成。然后,按照序列设计和合成寡的核苷酸片段,逐步进行DNA拼接,最终获得理想的基因序列。为达到上述目标,本发明的序列去掉了基因5’端编码引导肽的60个核苷酸,使基因突变体从第21位丝氨酸的编码age开始。同时,在保持不改动氨基酸的前提下,把全部20个稀有密码子代换成大肠杆菌常用的密码子。具体的密码子代换如下 第34位亮氨酸的密码子从cta更换为ctt ;第64位异亮氨酸的密码子从ata更换为ate ;第79位精氨酸的密码子从Cga更换为Cgt ;第107位组氨酸的密码子 从cac更换成cat ;第108位精氨酸的密码子从aga更换成cgc ;第123位精氨酸的密码子从agg更换成cgc ;第128位、129位和130位连续三个精氨酸的密码子从egg cga agg更换为cgc cgt cgc ;第198、199位两个精氨酸的编码从agg agg更换为cgc cgt ;第201位精氨酸的密码子从egg更换为cgc ;第243位精氨酸的密码子从agg更换成cgt ;第273位组氨酸的密码子从cac更换成cat ;第287位、293位和295位精氨酸、精氨酸和异亮氨酸的密码子,分别从agg、egg和ata更换成cgc、cgt和att ;第343位精氨酸的密码子从egg更换成cgc ;第411位精氨酸的密码子从aga更换曾cgc。此外,为了便于把突变基因插入专用表达载体进行表达,通过引物设计对基因的两端进行了必要修饰,在第一个密码子前端增加了两个核苷酸GT,在翻译终止密码子之后增加了一个核酸内切酶识别位点GTCGAC。序列表2是天然尿激酶原的cDNA序列,由1302个碱基组成,编码一条431个氨基酸的肽链,其中N端前20个氨基酸是引导肽,负责将肽链分泌出细胞的功能。在肽链从细胞中分泌出来之时,引导肽自动脱落,生成一条411个氨基酸的态链,是尿激酶原的成熟蛋白。序列表I中给出了密码子优化之后的尿激酶原基因突变体的序列,从序列表I中可以看到,突变基因从第一个氨基酸丝氨酸的密码子age开始,到最后一个氨基酸亮氨酸为止,共编码411个氨基酸,组成成熟尿激酶原蛋白质。序列中所有被替换的密码子,均用黑体字母表示,并在下边划线加以强调。通过对比天然尿激酶原的氨基酸序列,说明密码子优化并未影响蛋白质的氨基酸组成与排列顺序,突变基因在细菌中进行实现表达之后,广生的蛋白质氣基酸序列与天然蛋白质没有区别。从序列表I和序列表2对比可以看出,本发明优化中删除了编码引导肽20个氨基酸的序列,即atgagagccc tgctggcgcgcctgcttctc tgcgtcctgg tcgtgagcga ctccaaaggc ;把20个稀有的密码子更换成细菌所偏爱的密码,为便利序列加工,在基因5’端增加了 GT,在3’端增加核酸内切酶位点GTCGAC。序列表4和序列表5对比可以表明真核细胞新合成的前尿激酶原肽链由431个氨基酸组成,新合成的肽分子分泌出细胞时,N端的20个氨基酸被切掉,形成了 411个氨基酸的成熟尿激酶原分子。本发明设计的尿激酶原基因突变体改变了 20个氨基酸的遗传密码,但不改变它们编码的氨基酸,由突变基因序列推导的重组蛋白质,其氨基酸序列与天然尿激酶原分子完全相同。2.人工合成尿激酶原基因突变体
2.1.合成单链核苷酸片段
目前,化学合成技术只能合成比较短的单链寡聚核苷酸片段,而且合成的片段与越长,成功率越低,收费越高。为此,我们根据人工合成DNA技术的准确率、每个碱基的合成价格、基因拼接操作的难易程度和自身的操作水平等因素,选择了一种单链DNA片段合成方案。按照尿激酶原基因突变体的序列设计,从基因5’端到3’端划分为20个片段,分别进行合成。设计出的20个合成片段,涵盖尿激酶原基因全部411个氨基酸的编码序列,合成基因5’端起始于尿激酶原天然分子的首位氨基酸丝氨酸的密码子AGC,其3’端结束于翻译终止密码子TGA。为了便于进一步基因操作,便于用特异的表达载体在大肠杆菌中生产出天然尿激酶原蛋白质分子,借助基因两端引物的合成,预先对合成基因的两个末端做出适当处理。在5’端增加了两个核苷酸GT,为的是在把基因插入表达载体时能够恢复蛋白酶Xa的识别位点第4个氨基酸精 氨酸的编码;同时,为便于将基因插入表达载体,在其3’端增加了一个核酸内切酶识别位点GTCGAC。这20个合成片段的主要特点有两个:第一,20个片段依基因序列按顺序从头至尾排列;第二,1、3、5... 等奇数片段的核苷酸排列与基因正链相同,2、4、6... 等偶数片段的核苷酸序列与基因的负链相同;第三,相邻两个片段有13-15个碱基互补,可以退火连接在一起。序列表3给出了 20个合成片段的详细序列。2.2.PCR产生双链DNA片段
图1中列出了这20个DNA片段的相对位置,其按照基因突变体的序列设计,合成了20条长度为63 -79bp的寡核苷酸片段,相邻的两个片段有13-15bp的互补区,这20个片段覆盖基因突变体的全序列。它们包含了向天然尿激酶原基因序列中导入的全部突变信息。为了应用PCR延伸技术获得双链DNA,这些片段的序列资料取自双链DNA分子的两条互补链。标有奇数的片段的DNA序列,其核苷酸排列顺序与mRNA的核苷酸排列完全相同;而标有偶数的片段的DNA序列,其核苷酸序列与mRNA的核苷酸序列互补。为了退火的需要,相邻两个片段之间有13_15bp碱基的互补区,在拼接基因的时候,相邻的两个片段可以借助互补区相互搭在一起,形成局部双链区,并通过PCR延伸反应把其余的单链区转换成双链。采用这种PCR策略,可以通过片段之间反复退火与延伸,将各个片段整合在一起,获得尿激酶原的全基因序列。
按照图1所示的人工合成基因片段之间的关系,采用相邻片段间互补区退火和PCR延伸,最终获得了密码子优化的尿激酶原基因。相邻的合成片段相互退火和PCR延伸是逐步完成的,详细操作步骤分述如下。第一步,通过相邻片段退火和PCR延伸,将相邻的两个片段(I 和 2、3 和 4、5 和 6、7 和 8、9 和 10,11 和 12,13 和 14,15 和 16,17 和 18,19 和 20),从长度约为70个碱基的单链DNA片段,转换成长度约为140bp的双链DNA片段。第二步,用1.5%琼脂糖凝胶电泳分离和回收上述片段,并以它们为模板进行下一轮PCR扩增,把四个原始合成片段(片段1- 4,、5-8、9-12、13-16、17- 20)扩增成为250bp的大片段。同样,用1.5%琼脂糖凝胶电泳分离和回收这些片段,并用钝端连接的方法,把它们插入到PUC18载体的Smal位点,转化大肠杆菌DH5alpha,获得含有上述5个大片段的细菌克隆。从含有上述5个250bp片段的5组细克隆库中个挑选6个克隆扩大培养,提取质粒DNA进行测序分析。通过解析DNA序列测定资料,从经过测序的5组克隆中,各挑选2个克隆,编号保存其DNA样本和菌体。通过这一步操作,极易因分解而遭到破坏的人工合成寡核苷酸片段(一种化学制品),转化为可再生的永久性材料(一种生物元件)。所以,这个操作步骤是这项工作的关键步骤,一旦把人工合成的单链核苷酸(寡核苷酸)小片段转变成细菌生物合成的双链DNA大片段,把化学合成材料变成可自我更新的生物材料,获得尿激酶原基因突变体的目标就有保证,有多种办法可以把基因片段串联起来。拼接尿激酶原基因突变体的过程,可以用图2示意采用单链DNA片段退火和PCR延伸的方法,将合成的单链DNA片段组装成双链DNA片段。单链片段1-4组装成双链片段A ;单链片段5-8组装成双链片段B ;9_12组装成C; 13-16组装成D ; 17-20组装成E。2.3.拼接尿激酶原基因突变体的全序列
接种培养含有尿激酶原基因A,B,C,D,E片段的细菌克隆,提取质粒DNA,分离A, B, C,D, E片段DNA。以这些DNA片段为材料,按照基因设计图上各个片段的顺序关系,采用相互退火和PCR延伸的方法,将A片段和B片段连接在一起,得到长度为500bp的AB片段;将C片段和D片段 扩增为长度500bp的CD片段。然后,在1.5%的琼脂糖凝胶电泳上分离和回收上述AB片段和CD片段,并直接用作模板进行退火和PCR延伸,将它们连接在一起,得到800bp的ABCD片段。最后,采用同样的方法,将尾部的小片段E连接到大片段ABCD的3’端,得到1200bp的完整片段,完成全序列的拼接。上述基因拼接的过程如图3所示,克隆和保存的尿激酶原基因片段A、B、C、D、E经过三次拼接,获得经过密码子优化的尿激酶原基因突变体。2.4.尿激酶原基因突变体序列测定和分析
与其它方法相比,用人工合成的寡核苷酸小片段拼接完整的基因有许多优点,最重要的是可以人为优化序列中的遗传密码,不仅可以把稀有密码子变成使用频率最高的密码子,即使对于那些非稀有密码,也可以调节同一种密码子的使用频率,以利于蛋白质的合成。例如,组氨酸的遗传密码有两种,分别是CAC和CAT,两种密码子的出现频率差不多,但基因序列中有时会碰到连续两三个CACCAC或CATCATCAT,此时,若将该处的遗传密码改为CACCAT和CATCACCAT,可以使两种tRNA都得到利用,显然更有利于基因表达。但是,人工合成基因有一个主要缺点,它需要反复进行PCR扩增,扩增的次数越多,发生碱基错配的几率越高,在基因序列中引入错误突变不可避免。为此,我们在完成全基因DNA序列的拼接之后,利用事先合成的一对PCR引物,将全基因序列进行了扩增,并把它克隆到pUC18载体上,提取重组质粒DNA送上海英骏生物技术公司进行测序分析。对于序列分析中发现的错误碱基,采用定点突变的方法全部予以纠正,直至全基因序列完全符合设计要求为止。序列表I列出正确的尿激酶原基因突变体的DNA序列, 其氨基酸组成和排列顺序与天然尿激酶原完
全一样。
权利要求
1.一种尿激酶原基因突变体,其特征在于在保持蛋白质的氨基酸组成和序列不变的前提下,在基因序列的5’端增加了两个核苷酸G和T,在序列的3’端增加了核酸内切酶Sall的识别序列GTCGAC,其基因突变体的核苷酸序列为序列表I ;突变基因序列包含一系列密码子替换;密码子代换的详细资料如下:第34位亮氨酸的密码子从CTA变为CTT,第64位异亮氨酸的密码子从ATA变为ATC,第79位精氨酸的密码子从CGA变为CGT,第107位组氨酸的密码子从CAC被更换成CAT,第108位精氨酸的密码子从AGA变为CGC,第123位精氨酸的密码子从AGG变为CGC,第128、129、130位连续三个精氨酸的密码子从CGG CGA AGG变换为CGC CGT CGC,第198位和199位两个精氨酸的密码子从AGG AGG变为CGC CGT,第201位精氨酸的密码子从CGG变换成CGC,第243位精氨酸的密码子从AGG变为CGT,第273位组氨酸的密码子从CAC变为CAT,第287位精氨酸密码由AGG变为CGC,第293位精氨酸密码子从AGG变为CGT,第295位异亮氨酸的密码子从ATA更换为ATT,第343位精氨酸的密码子从CGG变为CGC,第411位精氨酸的密码子从AGA变换成CGC。
2.如权利要求1所述的一种尿激酶原基因突变体的制备方法,其特征在于所述的制备方法包括以下步骤: (1)合成单链核苷酸片 段 采用单链DNA片段合成方法,它按照尿激酶原基因突变体的序列设计,从基因5’端到3’端划分为20个片段,分别进行合成;设计出的20个合成片段,涵盖尿激酶原基因全部411个氨基酸的编码序列,合成基因5’端起始于尿激酶原天然分子的首位氨基酸丝氨酸的密码子AGC,其3’端结束于翻译终止密码子TGA ;为了便于进一步基因操作,便于用特异的表达载体在大肠杆菌中生产出天然尿激酶原蛋白质分子,借助基因两端引物的合成,预先对合成基因的两个末端做出适当处理;在5’端增加了两个核苷酸GT,为的是在把基因插入表达载体时能够恢复蛋白酶Xa的识别位点第4个氨基酸精氨酸的编码;同时,为便于将基因插入表达载体,在其3’端增加了一个核酸内切酶识别位点GTCGAC ;这20个合成片段的主要特点有两个:第一,20个片段依基因序列按顺序从头至尾排列;第二,1、3、5.. 等奇数片段的核苷酸排列与基因正链相同,2、4、6... 等偶数片段的核苷酸序列与基因的负链相同;第三,相邻两个片段有13-15个碱基互补,可以退火连接在一起; (2)PCR产生双链DNA片段 为了应用PCR延伸技术获得双链DNA,这些片段的序列资料取自双链DNA分子的两条互补链;标有奇数的片段的DNA序列,其核苷酸排列顺序与mRNA的核苷酸排列完全相同;而标有偶数的片段的DNA序列,其核苷酸序列与mRNA的核苷酸序列互补;为了退火的需要,相邻两个片段之间有13_15bp碱基的互补区,在拼接基因的时候,相邻的两个片段可以借助互补区相互搭在一起,形成局部双链区,并通过PCR延伸反应把其余的单链区转换成双链,通过片段之间反复退火与延伸,将各个片段整合在一起,获得尿激酶原的全基因序列;采用单链DNA片段退火和PCR延伸的方法,将合成的单链DNA片段组装成双链DNA片段,单链片段1-4组装成双链片段A ;单链片段5-8组装成双链片段B ;9-12组装成C; 13-16组装成D ; 17-20组装成E ; (3)拼接尿激酶原基因突变体的全序列 接种培养含有尿激酶原基因A,B,C,D,E片段的细菌克隆,提取质粒DNA,分离A, B, C,D,E片段DNA;以这些DNA片段为材料,按照基因设计图上各个片段的顺序关系,采用相互退火和PCR延伸的方法,将A片段和B片段连接在一起,得到长度为500bp的AB片段;将C片段和D片段扩增为长度500bp的CD片段;然后,在1.5%的琼脂糖凝胶电泳上分离和回收上述AB片段和CD片段,并直接用作模板进行退火和PCR延伸,将它们连接在一起,得到800bp的ABCD片段;最后,采用同样的方法,将尾部的小片段E连接到大片段ABCD的3’端,得到1200bp的完整片段,完成全序列的拼接; (4)尿激酶原基因突变体序列测定和分析 在完成全基因DNA序列的拼接之后,利用事先合成的一对PCR引物,将全基因序列进行了扩增,并把它克隆到PUC18载体上,提取重组质粒DNA进行测序分析;对于序列分析中发现的错误碱基,采用定点突变的方法全部予以纠正,直至全基因序列完全符合设计要求为止。
3.如权利要求2所述的一种尿激酶原基因突变体的制备方法,其特征在于所述的退火和PCR延伸是逐步完成的,详细操作步骤分述如下:第一步,通过相邻片段退火和PCR延伸,将相邻的两个片段I和2、3和4、5和6、7和8、9和10、11和12、13和14、15和16、17和18、19和20,从长度约为70个碱基的单链DNA片段,转换成长度约为140bp的双链DNA片段;第二步,用1.5%琼脂糖凝胶电泳分离和回收上述片段,并以它们为模板进行下一轮PCR扩增,把四个原始合成片段,即片段1- 4,、5-8、9-12、13-16、17- 20,扩增成为250bp的大片段;同样,用1.5%琼脂糖凝胶电泳分离和回收这些片段,并用钝端连接的方法,把它们插入到pUC18载体的Smal位点,转化大肠杆菌DH5alpha,获得含有上述5个大片段的细菌克隆;从含有上述5个250bp片段的5组细克隆库中个挑选6个克隆扩大培养,提取质粒DNA进行测序分析;通过解析DNA序列测定资料,从经过测序的5组克隆中,各挑选2个克隆,编号保存其DNA样本和菌体 。
全文摘要
一种尿激酶原基因突变体及其制备方法,它在保持蛋白质的氨基酸组成和序列不变的前提下,在基因序列的5’端增加了两个核苷酸G和T,在序列的3’端增加了核酸内切酶Sal1的识别序列GTCGAC,其基因突变体的核苷酸序列为序列表1;其制备方法包括(1)合成单链核苷酸片段;(2)PCR产生双链DNA片段;(3)拼接尿激酶原基因突变体的全序列;(4)尿激酶原基因突变体序列测定和分析;本发明通过人工合成全基因的方法,不仅优化了全部遗传密码子,而且对基因两端进行了适当修饰,使之易于进行测序分析和构建表达载体等进一步基因操作;从而开发一种适宜在大肠杆菌中表达的新型尿激酶原基因,以便通过大肠杆菌发酵技术生产尿激酶原。
文档编号C12N15/10GK103146727SQ20131005867
公开日2013年6月12日 申请日期2013年2月25日 优先权日2013年2月25日
发明者陈永福, 熊晓云 申请人:南昌市万华生化药业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1