类人胶原蛋白基因、其不同重复数的同向串联基因、含有串联基因的重组质粒及制备方法

文档序号:442391阅读:516来源:国知局
专利名称:类人胶原蛋白基因、其不同重复数的同向串联基因、含有串联基因的重组质粒及制备方法
技术领域
本发明属于基因工程技术领域,具体的说涉及一种类人胶原蛋白基因,还涉及该 基因的不同重复数的串联基因,以及含有串联基因的重组质粒及重组质粒的制备方法。

背景技术
胶原蛋白(也称胶原)是动物体中含量最丰富的一类蛋白质家族。胶原蛋白具有 很强的生物活性及生物功能,能参与细胞的迁移、分化和繁殖,使结缔组织具有机械 强度,同时胶原蛋白还能促进细胞生长,具有止血、生物相容性和生物降解性能。基 于这些特性,胶原蛋白在烧伤、创伤、眼角膜疾病、保健、美容、矫形、硬组织修复、 创面止血、药物传递、缓释技术等医药卫生领域有着广泛的应用。另外,胶原蛋白也 可作为食品添加剂、饲料添加剂、絮凝剂、照相乳胶材料、表面活性剂和固定化酶载 体材料等应用于各个工业和实验室领域。
目前,胶原蛋白的生产主要是利用酸、碱法处理动物来源的组织(猪皮、牛皮、 驴皮、鱼皮等),从中提取胶原蛋白。但所得到的产品成分复杂,主要应用于饲料添加 及微生物发酵培养基。四川铭让生物科技有限公司采用生物酶定向剪切技术,生产的 胶原蛋白组成稳定,具有生物活性。但以上这些方法得到的胶原蛋白产品都有一定的 病毒隐患(如疯牛病、口蹄疫、猪瘟疫、禽流感等),特别是应用于人体时易引起异体 异种的排异反应,从而限制了胶原蛋白在医药方面的应用。
随着DNA重组技术迅速发展,为了能充分利用胶原蛋白的优良特性,科研工作者 开始寻求动物本身以外的胶原蛋白来源。有许多学者利用基因工程技术,选用各种宿 主细胞(包括哺乳动物、昆虫、酵母、大肠杆菌、转基因烟草、转基因鼠、转基因
蚕细胞等),生产重组人胶原蛋白,产品具有安全性好、重现性好、质量稳定等优点。 但是,同样存在着许多不足和困难。如绢丝腺能分泌人胶原蛋白的转基因蚕,生产的
人胶原蛋白长度仅有真正的人胶原蛋白全长的1/5,且含量只有1%左右。总体来说,
表达量不高、生产周期长和培养难度大、成本高是以高等动植物细胞为宿主时普遍存 在的问题,且不能满足产业化、大批量生产的要求。而细菌表达系统普遍存产生的致 热原致使表达产物难以应用于临床;表达的蛋白常以包涵体形式表达,致产物纯化困 难;原核表达系统的翻译后加工修饰体系不完善,表达产物的生物活性较低等不足。


发明内容
本发明的目的在于提供一种类人胶原蛋白基因Gel。
本发明的目的还在于提供一种类人胶原蛋白基因进行不同重复数同向串联所获的 基因。
本发明的目的还在于提供一种类人胶原蛋白基因不同重复数同向串联基因的重组 质粒。
本发明的目的还在于提供一种制备上述的不同重复数同向串联基因重组质粒的方法。
实现本发明目的的技术解决方案 一种类人胶原蛋白基因,其碱基序列如序列表
中SEQIDNO: 1所示,艮卩
其核酸长度为322bp。
一种含有上述的类人胶原蛋白基因的重组质粒。
一种对上述的类人胶原蛋白基因进行不同重复数同向串联所获的基因。
一种与上述的碱基序列至少有70%同一性的基因。
本发明类人胶原蛋白基因不同重复数同向串联基因,其碱基序列如序列表中SEQ ID NO: 2所示,或其碱基序列如序列表中SEQIDNO: 3所示,或其碱基序列如序 列表中SEQIDNO: 4所示,其中SEQIDNO: 4编码的蛋白质的氨基酸序列如序列 表中SEQIDNO: 5所示。
一种含有上述的类人胶原蛋白基因不同重复数同向串联基因的重组质粒。 本发明的重组质粒,它是可在宿主中复制和生存的表达质粒。 一种制备上述的不同重复数同向串联基因重组质粒的方法,包括以下步骤
① 选择一对同尾酶,使其位于目的基因单体的两端,即碱基序列如序列表中SEQ ID NO: 1所示的类人胶原蛋白基因的两端;设计包含上述同尾酶识别位点的接头DNA 片断;
② 将用上述一对同尾酶酶切得到的目的基因单体进行体外连接;
③ 歩骤②得到的连接产物利用接头DNA片断,直接连入己含有目的基因单体的 质粒,获得重复数两个或两个以上的重组质粒;
将歩骤③重复数的质粒进行重复数翻倍的连接,获得含有目的基因单体的重复 数较高的重组质粒;
⑤将歩骤④重复数较高的重组质粒继续进行重复数翻倍的连接,构建含有目的基 因单体的重复数更高的重组质粒;
◎将构建好的适当重复数的串联基因克隆到选定的表达质粒中,获得可以转化宿 主细胞用于表达的重组质粒。
本发明与现有技术相比,其显著优点是(1)设计的类人胶原蛋白基因Gd是全 新的序列,且长度上大大少于天然人胶原蛋白基因(数Kbp),实现了在分子水平的操 作简单化,更易实现胶原蛋白的基因工程菌发酵生产;(2)该类人胶原蛋白基因Gd 同时包含天然人胶原蛋白基因的特征,其表达得对应类人胶原蛋白将具有天然人胶原 蛋白的优良特征;(3)在类人胶原蛋白的分子长度方面,通过制备不同重复数同向串 联基因重组质粒力求在进一步的酵母表达研究中实现接近较大的分子量的天然人胶原 蛋白的类人胶原蛋白的表达生产;(4)该种不同重复数同向串联基因重组质粒的制备 方法,仅仅通过简单的体外酶切连接反应和具有成熟技术的原核转化和筛选,实现了 任意重复数的目的基因(类人胶原蛋白基因Gd)的串联连接;(5)该法比较现有的许 多应用PCR技术实现重复更具有可行性和更易获得成功,避免了达到重复串联基因目 的PCR操作中需要的高难度的引物设计和条件探索工作。



图1是本发明重复串联类人胶原蛋白基因重组质粒的酶切电泳图。 图2是本发明重组质粒pPIC9KG6的EcoRI和Notl双酶切电泳图。

具体实施例方式
本发明的类人胶原蛋白基因,其碱基序列如序列表中SEQIDNO: 1所示,即:
其核酸长度为322bp,命名为Gel。
结合图1,本发明含有上述的类人胶原蛋白基因的重组质粒。将类人胶原蛋白基因 Gel克隆于质粒pUC57的Smal位点,得到的重组质粒命名为pUC57Gel。重组质粒 pUC57Gel的EcoRI单酶切电泳结果见附图1的泳道2,其中泳道l、 5为DNA分子量 标准DL15000 (购于大连宝生物工程有限公司)。
对碱基序列如序列表中SEQIDNO: 1所示的类人胶原蛋白基因进行两个或两个 以上的不同重复数同向串联而获得的基因。例如重复数分别为2, 3, 6的类人胶原蛋 白基因同向串联基因的碱基序列如序列表中SEQIDNO: 2, 3, 4所示,核酸长度分 别为619bp, 900bp, 2106bp。
本发明还包括碱基序列至少与序列表中SEQIDNO: 1, 2, 3, 4所示的碱基序列 有70%同一性的基因。
本发明类人胶原蛋白基因六重复数同向串联基因,其碱基序列如序列表中SEQID NO: 4所示,它编码的类人胶原蛋白的氨基酸序列如序列表中SEQIDNO: 5所示。 该类人胶原蛋白的氨基酸长度为696个氨基酸,分子量约为65Ku,等电点为4.5。
本发明含有类人胶原蛋白基因不同重复数同向串联基因的重组质粒。将类人胶原 蛋白基因不同重复数的同向串联基因克隆到各种质粒中可以得到不同的重组质粒,例 如pPIC9KG6。
上述的重组质粒可在宿主中复制和生存的表达质粒。例如pUC57Gel, pPIC9KG6 等,真核的表达质粒为pPIC9K、 pCDNA3.0等,原核的表达质粒为pUC18、 pET32等。 即将类人胶原蛋白基因Gel,类人胶原蛋白基因的重复数为2, 3, 4, 6等的同向串联 基因克隆到真核表达质粒pPIC9K或pCDNA3.0,原核表达质粒为pUC18或pET32后
得到的重组质粒。
以下实施例说明不同重复数同向串联基因重组质粒的制备方法,任何欲进行重复 同向串联的DNA片段(基因)都可以通过这样的制备方法达到构建含有不同重复数基 因、并同向串联的重组质粒。质粒包括任何可以在大肠杆菌、酵母、植物、动物细胞 内进行克隆和/或表达的质粒。
该制备方法可以实现任何重复数的基因单体的同向串联,例如以下步骤中涉及和 得到的重复数为2, 3, 4, 6的类人胶原蛋白基因的同向串联基因,另外,通过该方法 可以制备重复数为5, 8, 12等的其他重复数的类人胶原蛋白基因的同向串联基因。
1、选择一对同尾酶,使其位于目的基因单体的两端,设计包含上述同尾酶识别位 点的接头DNA片断;
首先选择一对同尾酶,使其存在于目的基因单体的两端,即欲重复同向串联的DNA 片段的两端。接头的设计应同时考虑目的基因和欲选用的质粒(表达质粒)本身序列 的特点, 一般接头序列设计为一端具有这样的酶切位点基因本身不具有该酶切位点 而质粒具有该限制性内切酶的单个酶切位点;另一端具有己选用的一对同尾酶中某一 个的酶切位点。并且考虑接头序列的长度,使得目的基因匹配所选质粒的开放读码框。 并且一个接头可以附加考虑添加标记肽或者蛋白成熟过程中剪切掉的信号肽、前导肽 等;另一个接头可以考虑添加终止密码子、标记肽(如GST、 His标记)等。
具体来讲,设计的类人胶原蛋白基因单体(Gel)作为目的基因单体,该单体碱基 序列见序列表SEQ ID NO: 1 ,由上海捷瑞生物工程有限公司合成,并克隆在质粒pUC57 的Smal位点,得到的重组质粒命名为pUC57Gel,质粒pUC57Gel的EcoRI单酶切电 泳结果见附图1的泳道2,其中泳道1,5为DNA分子量标准DL15000 (购于宝生物工 程有限公司)。选择的一对同尾酶为DmlII和Van91I,位于类人胶原蛋白基因单体(Gd)
的两端。设计的接头为A1 (由碱基序列如序列表SEQIDNO: 6与SEQIDNO: 7的 单链DNA复性而得)和A2 (由碱基序列如序列表SEQ ID NO: 8与SEQ ID NO: 9 的单链DNA复性而得)。其中Al含有的酶切位点为EcoRI和DraIII, A2含有的酶切 位点为Notl和Van91I。选择的表达质粒为pPIC9K。
2、 将用一对同尾酶酶切得到的目的基因单体进行体外连接
将重组质粒pUC57Gel采用CaCl2法转化大肠杆菌DH5a,经过含Amp的LB平板 筛选得到含有质粒pUC57Gel的重组大肠杆菌,命名为DH5a/pUC57Gel。液体LB培 养基过夜培养DH5a/pUC57Gel,提取质粒,得到大量的pUC57Gel。以一对同尾酶DraIII 和Van91I双酶切质粒pUC57Gel,电泳回收约3()0bp的小片段,获得大量类人胶原蛋 白基因单体,将这部分类人胶原蛋白基因单体用T4DNA连接酶进行连接,4'C过夜, 得到含有不同重复数胶原蛋白基因单体的连接体,电泳显示重复数集中在2、 3,还有 大量未参与连接的游离类人胶原蛋白基因单体。
3、 步骤2得到的连接产物利用接头,直接连入己含有目的基因单体的质粒,获得重 复数较少的重组质粒
将歩骤2得到连接产物加入到含有pUC57Gel的EcoRI/Dra111双酶切后电泳回收 得到的大片段和EcoRI酶切回收的复性接头Al的连接体系中,4'C过夜连接。连接产 物采用CaCl2法转化大肠杆菌T叩10F,,经过含Amp的LB平板筛选阳性克隆,经过提 取筛选到的阳性克隆的质粒并进行酶切电泳检验含有质粒的长度判断得到的重组大肠 杆菌所含有的质粒中包含类人胶原蛋白基因单体的重复数,主要出现包含有2、 3、 4 重复数的重组质粒的大肠杆菌。将含有重复数为3的质粒定名为pUC57AlG3,含有该 pUC57AlG3质粒的重组大肠杆菌命名为ToplOF,/pUC57AlG3。质粒pUC57AlG3的 EcoRI单酶切电泳结果见附图1的泳道3。
4、 将重复数较少的质粒进行重复数翻倍的连接,获得含有目的基因的重复数较高的 重组质粒
液体LB培养基过夜培养ToplOF'/pUC57AlG3,提取质粒,得大量的pUC57AlG3。 以限制性内切酶EcoRI和Van911双酶切质粒pUC57AlG3,电泳回收约900bp的小片 段,获得大量类人胶原蛋白基因三联体DNA片段。另外以限制性内切酶EcoRI和DmIII 双酶切质粒pUC57AlG3,电泳回收大片段,得到含有3重复类人胶原蛋白基因单体的 pUC57AlG3质粒大片段。将上述回收得到的两种片断用T4DNA连接酶连接,4'C过 夜,得到的连接产物直接采用CaCl2法转化大肠杆菌ToplOF',经过含Amp的LB平板 筛选得到含有pUC57 A1G6 (含有6个类人胶原蛋白基因单体重复的重组质粒)的重组 大肠杆菌,命名为ToplOF7pUC57AlG6。质粒pUC57AlG6的EcoRI单酶切电泳结果 见附图1的泳道4。
5、 将重复数较高的重组质粒继续进行重复数翻倍的连接,构建含有目的基因的重复 数更高的重组质粒
此歩骤可以选择不做或者做一次或者做两次以上,得到重复数为12或更多的类人 胶原蛋白基因的同向串联基因。具体操作参考步骤4。
6、 将构建好的适当重复数的串联基因克隆到选定的表达质粒中,获得可以转化宿主 细胞(大肠杆菌、酵母、植物、动物细胞等)用于表达的重组质粒
液体LB培养基过夜培养ToplOF7pUC57AlG6,提取质粒,得到大量的 pUC57AlG6。以限制性内切酶EcoRI和Van91I双酶切质粒pUC57AlG6,电泳回收约 1800bp的小片段,获得大量类人胶原蛋白基因六联体DNA片段。加入到含有pPIC9K 的EcoR固otI双酶切后电泳回收得到的大片段和Notl酶切回收的复性接头A2的连接 体系中,4'C过夜连接。得到的连接产物直接采用CaCl2法转化大肠杆菌ToplOF,,经 过含Amp的LB平板筛选得到含有pPIC9KG6 (含有6个类人胶原蛋白基因单体重复 以及接头Al和A2的重组表达质粒)的重组大肠杆菌,命名为ToplOF'/pPIC9KG6。 在以液体LB培养基过夜培养T叩10F7pPIC9KG6,提取质粒,即得到大量可用于转化 毕赤酵母(尸/c/j/a Awto〃、)的pPIC9KG6质粒。重组质粒pPIC9KG6的£coRI与iVort 双酶切电泳结果见附图2的泳道2,其中,泳道1为DNA分子量标准DL2000 (购于 宝生物工程有限公司);泳道3为DNA分子量标准DL15000 (购于宝生物工程有限公 司)。
本发明所最终获得的表达载体pPIC9KG6,已经完成了类人胶原蛋白基因的构建工
作,可以直接用于转化酵母,并且所得到的重组酵母可以用于表达产生类人胶原蛋白。 重组酵母所产生的类人胶原蛋白将会是本发明中的六重复串联类人胶原蛋白基因所编 码的蛋白质,其氨基酸序列见序列表SEQIDNO: 3。本发明为利用重组生物反应器实 现工业化廉价生产优质的类人胶原蛋白提供基因资源。本发明所提供的不同重复数同 向串联基因重组质粒的制备方法,可以指导其它类型的基因构建重复同向串联基因重 组质粒的工作。序列表
<U0>南京理工大学
<120>类人胶原蛋白基因、其不同重复数的同向串联基因、含有串联基闲的重组质粒及制 备方法
<160> 9
<170> Patentln Version3.3
<210> 1 <211>322 <212>DNA <213>人工序列
<220>
<223>类人胶原蛋白基因Gel
<400> 1
3g3ggtcc3cccggtgagccaggtaacccsggttctccagtcascctggs60
aacaagggttctcctggssaicccaggtcaacctggt33cgagggacsaccaggtcaacct120
ggtcsaaacggtcaaccaggtgagcctggatctaacggtcctcaaggttcccaaggtaac180
ccaggtaagaacggtcaaccaggttctccaggttcccaaggttctcctgg240
tctccsggtcaaccaggtascccsggtcaacctggagagcaaggtaagccaggtasccaa300
ggtccsgccggtggttsaag33322
<210>2 <211>619 <212>DNA <213>人工序列
<220>
<223>类人胶原蛋白基因二重复同向串联基因
<400> 2
agaggtccacccggtgagccaggtaacccaggttctccaggaasccaaggtcaacctggs60
aacasgggttctcctggsascccaggtcaacctggtsacgagggacaaccaggtcaacct120
ggtc333scggtcaaccaggtgagcctggatctsacggtcctcaaggttcccaaggtaac180
ccaggt33g33cggtc33ccsggttctccaggttccc33ggttctcctgg240
tctccaggtcasccaggtaacccaggtcaacctggagsgcaaggtaagccaggtaaccaa300
ggtccagccggtgagccaggtaacccaggttctccaggaaaccaaggtcaacctggaaac360
aagggttctcctggaaacccaggtcaacctggtaacgagggsca3CC3ggtcsacctggt420
caaaacggtcasccaggtgagcctggatctaacggtcctcaaggttcccasggtaaccc3480
ggtaagaacggtcsaccaggttctccaggttcccaaggttctcctggaeiaccasggttct540
ccsggtcsaccaggtaacccaggtC33cctggagagcaaggtsagccaggtaaccaaggt600ccagccggtg gttsaagsa 619
<210>3 <211>900 <212>DNA <213>人工序列
<220>
<223>类人胶原蛋白基因三重复同向串联基因
<400> 3
agaggtccacccggtgagccaggtaacccaggttctccsgg333cc33ggtcaacctgga60
aacaagggttctcctggaaacccaggtcaacctggtaacgsgggaca3ccaggtcaacct120
ggtcaas3cggtcaaccaggtgagcctggatctaacggtcctcaaggttccc33ggt33c180
ccaggtaagaacggtcaaccaggttctccaggttcccaaggttctcctggaaaccaaggt240
tctccaggtccccaggtc3acctggagagcasggta3gccaggtaaccaa300
ggtccsgccggtgagccaggt3sccc3ggttctccaggssaccaaggtcaacctggaaac360
sagggttctcctggsaacccaggtcaacctggtsscgsggtcascctggt420
caaaacggtcaaccaggtgagcctggatctaacggtcctcaaggttcccaaggtaaccca480
ggtaagaacggtcasccaggttctccaggttcccaaggttctcctggaaacc33ggttct540
ccaggtca3Ccaggtsscccsggtcaacctgtaagccaggtaaccaaggt600
ccagccggtgcccaggttctccaggaaaccaaggtcaacc660
ggttctcctggaaacccaggtcaacctggt3acgagggsc33ccaggtcsacctggtcaa720
aacggtcaaccaggtgagcctggatctaacggtcctcaaggttcccaaggtaacccaggt780
3agadcggtcaaccaggttctccaggttcccaaggttctcctggaaaccaaggttctcca840
ggtcaaccaggtsacccsggtcascctggagagcasggtaagccaggtaaccaaggtcca900
<210>4 <2U>2106 <212>DNA <213>人工序列
<220>
<223>类人胶原蛋白基因六重复同向串联基因
<220> <221>CDS <222>(1)... (2091)
<400> 4
3tgagatttc cttcaatttt tactgcsgtt ccagtcaaca ctacaacaga agatgaaacg tactcagatt tagaagggga tttcgatgtt sscgggttst tgttt3t3ss tsctsctstt
ttattcgcag catcctccgc attagctgct 60
gcacaaattc cggctgaagc tgtcatcggt 120
gctgttttgc csttttccsa cagcacasat 180
gccagcattg ctgctaaaga agaaggggta 240
tctctcgeigstgaagcttacgtsgaattcctcgagasaagaggtccaccc300
ggtgagccaggtaacccaggttctccaggaaacctggaaacaagggttct360
cctggasacccaggtcaacctggtsscgsgggacaaccaggtcaacctggtcaaaacggt420
caaccsggtgagcctggatctsscggtcctcaaggttccc480
ggtcaaccaggttctccaggttcccaaggttctcctggsaaccaaggttctccsggtcsa540
cc3ggta3cccaggtcaacctggagagcadggtaagccsggtaaccaaggtccagccggt600
gagccaggtaacccaggttctccsggassccaaggtcaacctggaaacaagggttctcct660
gg333ccc3ggtcaacctggcaaccaggtcaacctggtca720
ccaggtgagcctggatctaacggtcctcaaggttcccasggtsacccaggtaagaacggt780
caaccsggttctccaggttcccaaggttctcctggaaaccaaggttctccaggtcsacca840
ggtaacccaggtcaacctggagagcaaggtasgccsggtaaccaaggtccagccggtgag900
ccaggtaacccaggttctccggtcaacctggasacaagggttctcctgga960
aacccaggtcaacctggtaacgagggscaaccsggtcaacctggtc3333cggtcascca1020
ggtgsgcctggatctascggtcctcasggttcccsaggtaacccaggtaag33cggtca31080
ccsggttctcc3ggttccc3aggttctcctgttctccaggtcssccsggt1140
sscccaggtcaacctggagagcsaggtaagcc3ggtascca3ggtcc3gccggtgagcca1200
ggtsacccaggttctccaggaaaccaaggtacaagggttctcctggas3c1260
cc3ggtc33cctggtaacgagggacasccaggtcaacctggtcaasacggtcaaccaggt1320
gagcctggatctsacggtcctcaaggttcccaaggtsacccggtcaacca1380
ggttctccaggttcccaaggttctcctggsctccaggtcaacc3ggt33Cl"0
cc3ggtc33cctggagagcaaggtaagccsggt33cca3ggtccagccggtgagccaggt1500
3sccc3ggttcc3sggtcsacctgg33acsagggttctcctggaaacccs1560
ggtcaacctggtaacgagggacaaccaggtcaacctggtcaaaacggtcaaccaggtgag1620
cctgg3tct3acggtcctcaaggttcccaaggtaacccaggtasgsacggtcaaccaggt1680
tctccaggttcccaaggttctcctggaaaccaaggttctccaggtcaaccaggtaaccca1740
ggtcaacctggagagcaaggtaagccaggtaaccaaggtccagccggtgagccaggtaac1,
ccaggttctccaggaaacca3ggtc33cctgttctcctggaaacccaggt1860
cascctggt3scgagggacaaccaggtcaacctggtcssascggtc3sccaggtgagcct1920
ggatctsscggtcctcssggttccc33ggtaacccaggtaagaacggtcaaccaggttct1980
ccaggttcccaaggttctccggttctccaggtcaaccaggtaacccaggt2040
caacctgg3ggccsggtaaccaaggtccagccggtggttasgcggccgcg2100
2106
<210>5 <211>696 <212> PRT <213>人工序列
<220>
<223>重组质粒pPIC9KG6中外源基因对应的类人胶原蛋白 <400> 5
Met Arg Phe Pro Ser lie Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 15 10 15
Ala !>eu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gin
20 25 30
lie Pro Ala Glu Ala Val lie Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe lie Asn Thr Thr lie Ala Ser lie Ala Ala Lys Glu Glu Gly Val 65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala Tyr Val Glu Phe Leu Glu Lys
85 90 95
Arg Gly Pro Pro Gly Glu Pro Gly Asn Pro Gly Ser Pro Gly Asn Gin
100 105 110
Gly Gin Pro Gly Asn Lys Gly Ser Pro Gly Asn Pro Gly Gin Pro Gly
115 120 125
Asn Glu Gly Gin Pro Gly Gin Pro Gly Gin Asn Gly Gin Pro Gly Glu
130 135 140
Pro Gly Ser Asn Gly Pro Gin Gly Ser Gin Gly Asn Pro Gly Lys Asn 145 150 155 160
Gly Gin Pro Gly Ser Pro Gly Ser Gin Gly Ser Pro Gly Asn Gin Gly
165 170 175
Ser Pro Gly Gin Pro Gly Asn Pro Gly Gin Pro Gly Glu Gin Gly Lys
180 185 190
Pro Gly Asn Gin Gly Pro Ala Gly Glu Pro Gly Asn Pro Gly Ser Pro
195 200 205
Gly Asn Gin Gly Gin Pro Gly Asn Lys Gly Ser Pro Gly Asn Pro Gly
210 215 220
Gin Pro Gly Asn Glu Gly Gin Pro Gly Gin Pro Gly Gin Asn Gly Gin 225 230 235 240
Pro Gly Glu Pro Gly Ser Asn Gly Pro Gin Gly Ser Gin Gly Asn Pro
245 250 255
Gly Lys Asn Gly Gin Pro Gly Ser Pro Gly Ser Gin Gly Ser Pro Gly
260 265 270
Asn Gin Gly Ser Pro Gly Gin Pro Gly Asn Pro Gly Gin Pro Gly Glu
275 280 285
Gin Gly Lys Pro Gly Asn Gin Gly Pro Ala Gly Glu Pro Gly Asn Pro
290 295 300
Gly Ser Pro Gly Asn Gin Gly Gin Pro Gly Asn Lys Gly Ser Pro Gly 305 310 315 320
Asn Pro Gly Gin Pro Gly Asn Glu Gly Gin Pro Gly Gin Pro Gly Gin
325 330 335
Asn Gly Gin Pro Gly Glu Pro Gly Ser Asn Gly Pro Gin Gly Ser Gin
340 345 350
Gly Asn Pro Gly Lys Asn Gly Gin Pro Gly Ser Pro Gly Ser Gin Gly 355 360 365
Ser Pro Gly Asn Gin Gly Ser Pro Gly Gin Pro Gly Asn Pro Gly Gin
370 375 380
Pro Gly Glu Gin Gly Lys Pro Gly Asn Gin Gly Pro Ala Gly Glu Pro 385 390 395 400
Gly Asn Pro Gly Ser Pro Gly Asn Gin Gly Gin Pro Gly Asn Lys Gly
405 410 415
Ser Pro Gly Asn Pro Gly Gin Pro Gly Asn Glu Gly Gin Pro Gly Gin
420 425 430
Pro Gly Gin Asn Gly Gin Pro Gly Glu Pro Gly Ser Asn Gly Pro Gin
435 440 445
Gly Ser Gin Gly Asn Pro Gly Lys Asn Gly Gin Pro Gly Ser Pro Gly
450 455 460
Ser Gin Gly Ser Pro Gly Asn Gin Gly Ser Pro Gly Gin Pro Gly Asn 465 470 475 480
Pro Gly Gin Pro Gly Glu Gin Gly Lys Pro Gly Asn Gin Gly Pro Ala
485 490 495
Gly Glu Pro Gly Asn Pro Gly Ser Pro Gly Asn Gin Gly Gin Pro Gly
500 505 510
Asn Lys Gly Ser Pro Gly Asn Pro Gly Gin Pro Gly Asn Glu Gly Gin
515 520 525
Pro Gly Gin Pro Gly Gin Asn Gly Gin Pro Gly Glu Pro Gly Ser Asn
530 535 540
Gly Pro Gin Gly Ser Gin Gly Asn Pro Gly Lys Asn Gly Gin Pro Gly 545 550 555 560
Ser Pro Gly Ser Gin Gly Ser Pro Gly Asn Gin Gly Ser Pro Gly Gin
565 570 575
Pro Gly Asn Pro Gly Gin Pro Gly Glu Gin Gly Lys Pro Gly Asn Gin
580 585 590
Gly Pro Ala Gly Glu Pro Gly Asn Pro Gly Ser Pro Gly Asn Gin Gly
595 600 605
Gin Pro Gly Asn Lys Gly Ser Pro Gly Asn Pro Gly Gin Pro Gly Asn
610 615 620
Glu Gly Gin Pro Gly Gin Pro Gly Gin Asn Gly Gin Pro Gly Glu Pro 625 630 635 640
Gly Ser Asn Gly Pro Gin Gly Ser Gin Gly Asn Pro Gly Lys Asn Gly
645 650 655
Gin Pro Gly Ser Pro Gly Ser Gin Gly Ser Pro Gly Asn Gin Gly Ser
660 665 670
Pro Gly Gin Pro Gly Asn Pro Gly Gin Pro Gly Glu Gin Gly Lys Pro
675 680 685
Gly Asn Gin Gly Pro Ala Gly Gly 690 695
<210> 6 <2U>31 <212>DNA <213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列Al-l <400> 6
cgcgaattcc tcgagaaaag aggtccaccc g 31
<210>7 <211>28 <212>DNA <213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列Al-2 <400> 7
gtggscctct tttctcgsgg 33ttcgcg 28
<210>8 <211>20 <212> DNA
<2i3>人:i:序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列A2-1 <400> 8
gtggttssgc ggccgcstgc 20
<210>9 <2U>23 <212> DNA <213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列A2-2 <400> 9
gcatgcggcc gcttaaccac egg 2权利要求
1、一种类人胶原蛋白基因,其碱基序列如序列表中SEQ ID NO1所示,即agaggtccacccggtgagccaggtaacccaggttctccaggaaaccaaggtcaacctggaaacaagggttctcctggaaacccaggtcaacctggtaacgagggacaaccaggtcaacctggtcaaaacggtcaaccaggtgagcctggatctaacggtcctcaaggttcccaaggtaacccaggtaagaacggtcaaccaggttctccaggttcccaaggttctcctggaaaccaaggttctccaggtcaaccaggtaacccaggtcaacctggagagcaaggtaagccaggtaaccaaggtccagccggtggttaaagaa,其核酸长度为322bp。
2、 一种含有权利要求1所述的类人胶原蛋白基因的重组质粒。
3、 一种对权利要求1所述的类人胶原蛋白基因进行不同重复数同向串联所获的基因。
4、 一种与权利要求1或3所述的碱基序列至少有70%同一性的基因。
5、 根据权利要求3所述的类人胶原蛋白基因不同重复数同向串联基因,其碱基序 列如序列表中SEQIDNO: 2所示,或其碱基序列如序列表中SEQIDNO: 3所示, 或其碱基序列如序列表中SEQIDNO: 4所示,其中SEQIDNO: 4编码的蛋白质的 氨基酸序列如序列表中SEQ ID NO: 5所示。
6、 一种含有权利要求3所述的类人胶原蛋白基因不同重复数同向串联基因的重组 质粒。
7、 一种含有权利要求5所述的类人胶原蛋白基因不同重复数同向串联基因的重组 质粒。
8、 根据权利要求2、 6或7所述的重组质粒,它是可在宿主中复制和生存的表达 质粒。
9、 根据权利要求8所述的重组质粒,真核的表达质粒为pPIC9K或pCDNA3.0, 原核的表达质粒为pUC18或pET32。
10、 一种制备权利要求6或7所述的不同重复数同向串联基因重组质粒的方法, 包括以下步骤①选择一对同尾酶,使其位于目的基因单体的两端,即碱基序列如序列表中SEQ ID NO: 1所示的类人胶原蛋白基因的两端;设计包含上述同尾酶识别位点的接头DNA片断;②将用上述一对同尾酶酶切得到的目的基因单体进行体外连接;(D歩骤②得到的连接产物利用接头DNA片断,直接连入已含有目的基因单体的质粒,获得重复数两个或两个以上的重组质粒; 将歩骤③重复数的质粒进行重复数翻倍的连接,获得含有目的基因单体的重复数较高的重组质粒; 将步骤④重复数较高的重组质粒继续进行重复数翻倍的连接,构建含有目的基 因单体的重复数更高的重组质粒;⑥将构建好的适当重复数的串联基因克隆到选定的表达质粒中,获得可以转化宿 主细胞用于表达的重组质粒。
全文摘要
本发明公开了一种类人胶原蛋白基因、其不同重复数的同向串联基因、含有串联基因的重组质粒及制备方法。本发明类人胶原蛋白基因Gel,其碱基序列如序列表中SEQ ID NO1所示,并通过对该基因的体外酶切和拼接获得了不同重复数的串联基因,以及含有该不同重复数串联基因的重组质粒。本发明是全新的序列,且长度上大大少于天然人胶原蛋白基因,实现了在分子水平的操作简单化,更易实现胶原蛋白的基因工程菌发酵生产;该类人胶原蛋白基因Gel同时包含天然人胶原蛋白基因的特征,其表达得对应类人胶原蛋白将具有天然人胶原蛋白的优良特征;其制备方法仅仅通过简单的体外酶切连接反应和具有成熟技术的原核转化和筛选,实现了任意重复数的目的基因的串联连接。
文档编号C12N15/12GK101200718SQ20061009829
公开日2008年6月18日 申请日期2006年12月11日 优先权日2006年12月11日
发明者储卫华, 唐红玉, 孟广荣, 李新柱, 杨树林, 薇 沈, 钮小松, 高力虎 申请人:南京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1