红豆杉紫杉烷c13-侧链-n-苯甲酰转运酶蛋白及其编码基因的制作方法

文档序号:72575阅读:351来源:国知局
专利名称:红豆杉紫杉烷c13-侧链-n-苯甲酰转运酶蛋白及其编码基因的制作方法
技术领域
本发明涉及分子生物学、基因工程技术领域
。具体地,本发明涉及一种在红豆杉中表达的紫杉烷C13-侧链-N-苯甲酰转运酶及其核酸序列。
背景技术
紫杉醇(taxol)是上世纪70年代由Wani等从短叶红豆杉(Taxus brevifolia)树皮中提取出来的具有独特抗癌作用的天然产物。紫杉醇是经FDA认证的目前最好的天然抗癌药物之一,它是治疗卵巢癌的首选药物,并且对白血病、肺癌、脑癌和其他的一些实体瘤等均有很好的疗效,并且毒副作用很小。现在,紫杉醇生产面临的唯一困难就是药源的严重匮乏。
近几年来对寻找及扩大紫杉醇药源途径的研究取得了极大的进展.由于目前基本阐明了紫杉醇生物合成代谢途径及其关键酶,故利用基因工程技术在基因水平上快速、高效地改良红豆杉,获得遗传修饰的高含量紫杉醇的红豆杉成为可能。相比之下,利用现代生物技术,特别是基因工程技术改良有机体,生产紫杉醇具有很大的优势,因而利用基因工程技术是生产紫杉醇及其药源的最佳途径。
在对现有文献的分析中,虽然“The Proceedings of the National Academy ofSciences of the United States of American(美国国家科学院进展)2002,99(14),9166-9171”报道从加拿大红豆杉中克隆了紫杉醇生物合成途径中最后的一个酰基转运酶(DBTNBT)基因,但是并没见有进一步研究这个基因家族的其他成员如曼地亚红豆杉(高产紫杉醇的商业品种)种的该基因的同源基因。由于这个基因编码的酶催化紫杉醇合成的最后一步并对紫杉醇合成效率具有重要影响,因此,最后的这一步是基因工程遗传改良红豆杉的重要切入点。

发明内容
本发明的目的在于克服现有技术中的不足,提供一种红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶蛋白编码序列。使其包含所说基因的融合基因构建体,携带该构建体的新的重组表达载体,被所说的表达载体转化植物细胞,以及由转化细胞产生的所说基因的转基因植物及其后代,包括植物种子及植物组织,所获得的转基因植物将具有显著提高的紫杉醇含量。
本发明是通过以下技术方案实现的,本发明所分离出的DNA分子包括编码具有红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.1中从核苷酸第36-1352位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55℃条件下与SEQ ID NO.1中从核苷酸第36-1352位的核苷酸序列杂交。
较佳地,所述的序列编码具有SEQ ID NO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.1中从核苷酸第36-1352位的核苷酸序列。
本发明分离出的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶多肽,它包括具有SEQID NO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.2序列的多肽。
本发明所提供的载体DNA分子转化的宿主细胞,它是真核细胞。它包含所述的DNA分子中8-100个连续核苷酸。
本发明用上述载体。在实例中该宿主细胞是烟草。
在本发明中,“分离的”、“纯化的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组分分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶(或多肽)的编码基因”指编码具有红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶活性的多肽的核苷酸序列,如SEQ ID NO.1中第36-1352位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.1序列的编码框第36-1352位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ IDNO.1中第36-1352位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的氨基酸序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.1中从核苷酸第36-1352位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.1中从核苷酸第36-1352位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶相同功能的蛋白的SEQ ID NO.1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,术语“红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶或多肽”指具有红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶活性的SEQ ID NO.2序列的多肽。该术语还包括具有与天然红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶相同功能的SEQ ID NO.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的活性片段和活性衍生物。
本发明的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶DNA杂交的DNA所编码的蛋白、以及利用红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶多肽的血清获得的多肽或蛋白。
在本发明中,“红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶保守性变异多肽”指与SEQ ID NO.2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1




表278% identity in 1007 nt overlapQuery184 tgttagtctacaatgcctctaacaccatttctgcagatcctgcgactgtaattcgggagg 243|||| || | ||||||| || ||| ||||||||||||||||| | ||||| | ||||Sbjct143 tgttggttttcaatgcccctgacaacatttctgcagatcctgtaaaaataattagagagg 202Query244 ctctctccaaggtgttggtgtattattttccttttgctgggcggatgagaaacaaaggag 303||||||||||||||||||||||||||| ||| ||||||||||| | |||| |||| |Sbjct203 ctctctccaaggtgttggtgtattatttccctcttgctgggcggctcagaagtaaagaaa 262Query304 atggggaactggaagtggattgcacgggggaaggtgctctgtttgtagaagccatggcgg 363||||||||| |||||||| ||||| ||||| |||||||||||||| |||||||||| ||Sbjct263 ttggggaacttgaagtggagtgcacaggggatggtgctctgtttgtggaagccatggtgg 322Query364 acgacaacctttcagtgttgggaggttttgattaccacaatccagcatttgggaagctac 423| |||| | ||||||| || ||| | | ||| ||| ||||||| ||||| | || ||Sbjct323 aagacaccatttcagtcttacgagatctggatgacctcaatccatcatttcagcagttag 382Query424 tttactcactaccactggatacccctattcacgacctccatcctctggttgttcaggtaa 483||| | | ||| |||| || ||||| | || || |||| | || ||||||||||||Sbjct383 ttttttggcatccattggacactgctattgaggatcttcatcttgtgattgttcaggtaa 442Query484 ctcgttttacctgcggggggtttgttgtgggattaagtttggaccatagtatatgtgatg 543| |||||||| || ||||| ||| || ||| | | |||| ||||||| |||||||||Sbjct443 cacgttttacatgtgggggcattgccgttggagtgactttgccccatagtgtatgtgatg 502Query544 gacgtggtgcaggtcaatttcttaaagccctagcagagatggcgaggggagaggctaagc 603
||||||| |||| || ||| ||| ||| || |||||||||||||||||||||| |||||Sbjct503 gacgtggagcagcccagtttgttacagcactggcagagatggcgaggggagaggttaagc 562Query604 cctcattggaaccaatatggaatagagagttgttgaagcccgaagaccttatacgcctgc 663||||| | |||||||||||||||||||| |||||||| || ||||||| | ||| || |Sbjct563 cctcactagaaccaatatggaatagagaattgttgaaccctgaagaccctctacatctcc 622Query664 aattttatcactttgaatcgatgcgtccacctccaatagttgaagaaattgttcaagcat 723| || |||| ||||| ||||| | ||||||||||| | || ||| | | |||||| |Sbjct623 agttaaatcaatttgattcgatatgcccacctccaatgctggaggaattgggtcaagctt 682Query724 ctattattgtaaactctgagacaataagtaatatcaaacaatacattatggaagaatgta 783|| || || ||||| ||| || ||| |||| || |||| | ||||| |||||||Sbjct683 cttttgttataaacgttgacaccatagaatatatgaagcaatgtgtcatggaggaatgta 742Query784 aagaatctagttttgcatttgaggtcgtagcagcattggcctggctagcgaggacaaggg 843| |||| | ||| | ||||| || || |||||||||| ||| |||| |||||| ||Sbjct743 atgaattttgttcgtcttttgaagtagtggcagcattggtttggatagcacggacaaagg 802Query844 cttttcaaattccacatacagagaatgtaaagcttctttttgcagtggatacgaggagat 903|| ||||||||||||||||| ||||||| |||||||| ||||| ||||| ||||| ||Sbjct803 ctcttcaaattccacatactgagaatgtgaagcttctctttgcgatggatttgaggaaat 862Query904 catttgatccaccacttccaaaaggttactatggtaatgccgctggtaatgcatgtgcaa 963|||| |||| ||||||||||| || || |||||||||||| ||||| ||||| |||||Sbjct863 tatttaatcccccacttccaaatggatattatggtaatgccattggtactgcatatgcaa 922Query964 tggataatgttcaagacctcttaaatggatctctattgcgggctgtaatgattataaaga 1023|||||||||| ||||||||||||||||||||||| ||||| ||| ||||||||||||| |Sbjct923 tggataatgtccaagacctcttaaatggatctcttttgcgtgctataatgattataaaaa 982Query1024 aatcaaaggtctctttaaatgagaa-tat--aagggcaaaaacagtgatgagaccatctg 1080|| |||||| |||||| || || ||| ||| ||| ||| | | |||| |Sbjct983 aagcaaaggctgatttaaaagataattattcgaggtcaagggtagttacaaacccatatt 1042Query1081 caatagatgtgaatatgaaacatgaaagcacagttggattaagtgatttgaggcacttgg 1140|| |||||||||| | |||| || | || ||| ||| ||||| | ||||| ||||Sbjct1043 cattagatgtgaacaagaaatccgacaacattcttgcattgagtgactggaggcggttgg 1102Query1141 gatttaatgaagtggactttgggtggggagatgcattaaatgcaagt 1187||||| |||||| || ||||||||||||| | || | |||| ||||Sbjct1103 gattttatgaagccgattttgggtggggaggtccactgaatgtaagt 1149Query曼地亚红豆杉TmDBTNBT蛋白的核酸序列sbjct加拿大红豆杉TcDBTNBT蛋白的核酸序列(AF466397)表2为本发明的曼地亚红豆杉TmDBTNBT蛋白与加拿大红豆杉TcDBTNBT蛋白的核苷酸序列的同源比较(GAP)表。
表361% identity in 433 aa overlap,76% similarity in 433 aa overlapQuery1 MEKAGSSTEFHVKISDPVMVPPCIPSPKTILQLSAVDNYPAVRGNILDCLLVYNASNTIS 60MEKAGS T+FHVK DPVMV P+PSPK +QLS VD+ RG I + LLV+NA + ISSbjct1 MEKAGS-TDFHVKKFDPVMVAPSLPSPKATVQLSVVDSLTICRG-IFNTLLVFNAPDNIS 58Query61 ADPATVIREALSKVLVYYFPFAGRMRNKGDGELEVDCTGEGALFVEAMADDNLSVLGGFD 120
ADP +IREALSKVLVYYFP AGR+R+K GELEV+CTG+GALFVEAM +D +SVL DSbjct59 ADPVKIIREALSKVLVYYFPLAGRLRSKEIGELEVECTGDGALFVEAMVEDTISVLRDLD 118Query121 YHNPAFGKLLYSLPLDTPIHDLHPLVVQVTRFTCGGFVVGLSLDHSICDGRGAGQFLKAL 180NP+F +L++ PLDT I DLH ++VQVTRFTCGG VG++L HS+CDGRGA QF+ ALSbjct119 DLNPSFQQLVFWHPLDTAIEDLHLVIVQVTRFTCGGIAVGVTLPHSVCDGRGAAQFVTAL 178Query181 AEMARGEAKPSLEPIWNRELLKPEDLIRLQFYHFESMRPPPIVEEIVQASIIVNSETISN 240AEMARGE KPSLEPIWNRELL PED + LQ F+S+ PPP++EE+ QAS ++N +TISbjct179 AEMARGEVKPSLEPIWNRELLNPEDPLHLQLNQFDSICPPPMLEELGQASFVINVDTIEY 238Query241 IKQYIMEECKESSFAFEVVAALAWLARTRAFQIPHTENVKLLFAVDTRRSFDPPLPKGYY 300+KQ +MEEC E +FEVVAAL W+ART+A QIPHTENVKLLFA+D R+ F+PPLP GYYSbjct239 MKQCVMEECNEFCSSFEVVAALVWIARTKALQIPHTENVKLLFAMDLRKLFNPPLPNGYY 298Query301 GNAAGNACAMDNVQDLLNGSLLRAVMIIKKSKVSLNENI-RAKTVMRPSAIDVNMKHEST 359GNA G A AMDNVQDLLNGSLLRA+MIIKK+K L +N R++ V P ++DVN K ++Sbjct299 GNAIGTAYAMDNVQDLLNGSLLRAIMIIKKAKADLKDNYSRSRVVTNPYSLDVNKKSDNI 358Query360 VGLSDLRHLGFNEVDFGWGDALNASLVQ---HGVIQQNYFLFLQPSKNMNGGIKIAM-FM 415+LSD R LGF E DFGWG LN S +Q +G+ +FL+L P+KN + GIK+ + MSbjct359 LALSDWRRLGFYEADFGWGGPLNVSSLQRLENGLPMFSTFLYLLPAKNKSDGIKLLLSCM 418Query416 PQSKVKPFKIEMEALISKYATKV 438P + +K FKI MEA+I KY +KVSbjct419 PPTTLKSFKIVMEAMIEKYVSKV 441Query曼地亚红豆杉TmDBTNBT蛋白氨基酸序列Sbjct加拿大红豆杉TcDBTNBT蛋白氨基酸序列(GenBank Accession No.AAM75818)表3为本发明的曼地亚红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶(TmDBTNBT)与加拿大红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶(TcDBTNBT)蛋白氨基酸序列的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。
发明还包括红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶或多肽的类似物。这些类似物与天然酰基转运酶多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶多肽时,可以将红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的编码基因的核酸序列可操作地连于表达调控序列,从而形成红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶表达载体。
如本发明所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”为真核细胞。常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。
还可用Northern印迹法技术分析红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶基因产物的表达,即分析红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的RNA转录物在细胞中的存在与否和数量。
此外,本发明中可用作探针的核酸分子,该分子通常具有红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的核酸分子。
本发明涉及检测样品中是否存在红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶同源基因或同源蛋白。
为了得到与红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶基因相关的红豆杉cDNAs的点阵,可以用DNA探针筛选红豆杉cDNA文库,这些探针是在低严紧条件下,用32P对红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自红豆杉的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的基因家族的核苷酸序列。
本发明的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
利用本发明的红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶,通过各种常规筛选方法,可筛选出与红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶发生相互作用的物质,或者受体、抑制剂或拮剂等。本发明催化苯甲酰CoA和去苯甲酰紫杉醇生成紫杉醇的酶,在抗性试验中具有明显的作用,对保护人民的健康生长有所帮助。因此,具有很大的应用价值。
具体实施方式
下面结合实验室具体的试验数据和结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆实验室手册(New YorkColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1曼地亚红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶基因的克隆1.组织分离(isolation)红豆杉(品种为“曼地亚”)幼嫩叶片来源于西南师范大学,采取材料后,立即置于液氮中冷冻保存。
2.RNA的分离(RNA isolation)取部分组织,用研钵研碎,加入盛有裂解液的1.5mL EP管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至1.5mL EP管中,抽提总RNA(TRIzol Reagents,GIBCO BRL,USA)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。
3.基因的全长克隆(Cloning of Full-length cDNA)根据一些植物酰基转运酶的氨基酸保守序列,设计保守引物,利用同源性基因克隆原理,采用Smart-RACE方法(Clonetech试剂盒)进行cDNA全长克隆,分三个阶段进行(1)5’-RACEPCR(UPM+R2)得到TMR2’(0.7kb),回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知植物酰基转运酶基因(如紫杉烷C13-侧链-N-苯甲酰转运酶基因等)的同源性很高,故初步认为它是一个酰基转运酶基因。
(2)3’-RACE根据5’RACE结果,设计正向特异引物F2,经PCR(UPM+F2)得到TMF2’(1.0kb)(过程同(1))。回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。
(3)将5’RACE测序结果与3’RACE测序结果比序后进行拼接,得到全长片段序列信息,并设计一对特异引物进行PCR扩增TmDBTNBT编码区(KF1+KR1)得到TmDBTNBT编码区(1.32kb)(过程同(1))。
BLAST的结果证明从红豆杉中新得到的基因确为一个植物酰基转运酶基因。由于已知的加拿大红豆杉TcDBTNBT蛋白具有催化苯甲酰CoA和去苯甲酰紫杉醇生成紫杉醇的功能(Walker,et al.,2002),故推测此新克隆的基因具有相同的功能。
通过组合使用上述3种方法,获得了候选的红豆杉TmDBTNBT蛋白的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物TmDBTNBTF15’-GATTCTCAGCCCATCGTTTCATC-3’(SEQ ID NO.3)为正向引物,寡核苷酸TmDBTNBTR15’-GCGGGTTCAAATATTATTTGGAAAATAC-3’(SEQ ID NO.4)为反向引物,以总RNA为模板,进行RT-PCR扩增,F1/R2的PCR条件为94℃5分钟,随之以94℃ 1分钟、58℃ 1分钟和72℃ 2分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为1401bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ ID NO.1所示的序列。
实施例2红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶基因的序列信息与同源性分析本发明新的红豆杉酰基转运酶全长cDNA的长度为1401bp,详细序列见SEQ IDNO.1,其中开放读框位于36-1352位核苷酸。根据全长cDNA推导出红豆杉酰基转运酶的氨基酸序列,共438个氨基酸残基,分子量48410.92,pI为6.10。详细序列见SEQ IDNO.2。
将曼地亚红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundantGenBank CDS translations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与加拿大红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶(TcDBTNBT)基因(AF466397)在核苷酸水平上具有78%的同源性(附表2);在氨基酸水平上,它与加拿大红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶(GenBank Accession No.AAM75818)有61%的相同性和76%的相似性(见表3)。由此可见,曼地亚红豆紫杉烷C13-侧链-N-苯甲酰转运酶与加拿大红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶无论从核酸还是蛋白水平上都存在较高的同源性,故可以认为曼地亚红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶在催化苯甲酰CoA和去苯甲酰紫杉醇生成紫杉醇的反应上也具有相似的功能。
实施例3红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶在大肠杆菌中进行原核表达及提纯在该实施例中,将全长的红豆杉TmDBTNBT编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
将红豆杉TmDBTNBT多肽以融合蛋白的形式在大肠杆菌中进行原核表达。
原核表达载体的构建,以及转化大肠杆菌根据红豆杉TmDBTNBT的氨基酸序列,设计蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将红豆杉TmDBTNBT基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-TmDBTNBT表达载体的工程菌BL21-pET32a(+)-TmDBTNBT。
表达Trx-TmDBTNBT重组蛋白的工程菌的分离鉴定挑取单菌落的BL21-pET32a(+)-TmDBTNBT工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达Trx-TmDBTNBT融合蛋白的工程菌。
Trx-TmDBTNBT融合蛋白的提取纯化按上述方法诱导表达Trx-TmDBTNBT融合表达蛋白的工程菌BL21-pET32a(+)-TmDBTNBT,经离心沉淀收集菌体,并根据厂家(Novagen)的说明书以BugBuster试剂和Benzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mMCAPS,pH 11.0,0.3% N-lauroylsarcosine)来溶解,再用透析缓冲液(200mMTris-HCl,pH8.5)来透析。然后用组氨酸结合(His·Bind)树脂进行亲和层析,并经洗脱缓冲液(1M imidazole,500mM NaCl,20mM Tris-HCl pH 7.9)洗脱来收集Trx-TmDBTNBT融合蛋白。融合蛋白经肠激酶20℃酶切16小时后即可分离获得TmDBTNBT的表达蛋白。
实施例4红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶在红豆杉中进行真核细胞表达将含目的基因(红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶基因)的表达载体的构建,根据红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶的全长序列(SEQ ID NO.1),设计扩增出完整编码阅读框的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶基因cDNA克隆至中间载体(如pBluescript),进一步克隆到双元表达载体(如pBI121和改进的pCAMBIA2300),在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌中,利用幼嫩的茎段转化曼地亚红豆杉。利用发根农杆菌Ri质粒介导的曼地亚红豆杉的遗传转化1.发根农杆菌A4。使用前自冰箱取出,传代2次,传代用固体培养基为YEB培养基。菌种在使用前接种于YEB液体培养基中,27℃培养过夜。
2.经种子萌发生长8周左右的曼地亚红豆杉的无菌嫩枝条。
3.经过夜培养的菌液,用转化液(B5培养液中加入100μmol/L乙酰丁香酮,10mg/mL的甜菜碱)稀释为100个细菌/mL。取无菌红豆杉顶芽、侧芽、叶、茎、根等植物不同部位,用无菌的解剖刀划以“+”字形伤口,放入上述转化中,60rpm/min振荡培养8h取出,用无菌水冲洗3次,放入含250-500mg/L卡那霉素和不同浓度6-BA(0.5mg/L-3mg/L)的B5培养基中,每2周转移到新鲜培养基中1次,待长出毛状根后分离毛状根,转移至含250-500mg/L卡那霉素无激素的B5培养基中培养,转移4-5次直至无细菌为止,然后再转移至不含卡那霉素的无激素B5培养基中培养。
4.把在固体培养基中的毛状根的继代培养物,接种于装有100mL无激素B5,培养基的500mL三角瓶中,培养温度、光照、转速等培养条件与愈伤组织液体悬浮培养条件相同,培养20天,将毛状根从培养基上取出放入冷冻干燥机中进行干燥,然后称重,贮存于-70℃备用。毛状根中的紫杉醇抽提按Richard(1993)、Saito(1992)的方法。紫杉醇含量的测定采用HPLC(Catalatic,1993)和紫杉醇单克隆抗体(HawaiiBiotechnology Group Inc.)间接联酶免疫法(蒋成淦,1984)。
<110>上海交通大学
<120>红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶蛋白及其编码基因<160>4<170>PatentIn version 3.1<210>1<211>1431<212>DNA<213>曼地亚红豆杉(Taxus media)<220>
<221>CDS<222>(36)..(1352)<223>
<400>1gattctcagc ccatcgtttc atctttgatc cagtc atg gag aag gca ggc tca 53Met Glu Lys Ala Gly Ser1 5tca aca gag ttc cat gta aag atc tct gat cca gtc atg gtg ccc ccc 101Ser Thr Glu Phe His Val Lys Ile Ser Asp Pro Val Met Val Pro Pro10 15 20tgc atc cct tcc ccc aaa aca atc ctc cag ctc tcc gcc gta gac aat 149Cys Ile Pro Ser Pro Lys Thr Ile Leu Gln Leu Ser Ala Val Asp Asn25 30 35tac cca gcg gta aga gga aat att ctc gac tgc ctg tta gtc tac aat 197Tyr Pro Ala Val Arg Gly Asn Ile Leu Asp Cys Leu Leu Val Tyr Asn40 45 50gcc tct aac acc att tct gca gat cct gcg act gta att cgg gag gct 245
Ala Ser Asn Thr Ile Ser Ala Asp Pro Ala Thr Val Ile Arg Glu Ala55 60 65 70ctc tcc aag gtg ttg gtg tat tat ttt cct ttt gct ggg cgg atg aga 293Leu Ser Lys Val Leu Val Tyr Tyr Phe Pro Phe Ala Gly Arg Met Arg75 80 85aac aaa gga gat ggg gaa ctg gaa gtg gat tgc acg ggg gaa ggt gct 341Asn Lys Gly Asp Gly Glu Leu Glu Val Asp Cys Thr Gly Glu Gly Ala90 95 100ctg ttt gta gaa gcc atg gcg gac gac aac ctt tca gtg ttg gga ggt 389Leu Phe Val Glu Ala Met Ala Asp Asp Asn Leu Ser Val Leu Gly Gly105 110 115ttt gat tac cac aat cca gca ttt ggg aag cta ctt tac tca cta cca 437Phe Asp Tyr His Asn Pro Ala Phe Gly Lys Leu Leu Tyr Ser Leu Pro120 125 130ctg gat acc cct att cac gac ctc cat cct ctg gtt gtt cag gta act 485Leu Asp Thr Pro Ile His Asp Leu His Pro Leu Val Val Gln Val Thr135 140 145 150cgt ttt acc tgc ggg ggg ttt gtt gtg gga tta agt ttg gac cat agt 533Arg Phe Thr Cys Gly G1y Phe Val Val Gly Leu Ser Leu Asp His Ser155 160 165ata tgt gat gga cgt ggt gca ggt caa ttt ctt aaa gcc cta gca gag 581Ile Cys Asp Gly Arg Gly Ala Gly Gln Phe Leu Lys Ala Leu Ala Glu170 175 180atg gcg agg gga gag gct aag ccc tca ttg gaa cca ata tgg aat aga 629Met Ala Arg Gly Glu Ala Lys Pro Ser Leu Glu Pro Ile Trp Asn Arg185 190 195
gag ttg ttg aag ccc gaa gac ctt ata cgc ctg caa ttt tat cac ttt 677Glu Leu Leu Lys Pro Glu Asp Leu Ile Arg Leu Gln Phe Tyr His Phe200 205 210gaa tcg atg cgt cca cct cca ata gtt gaa gaa att gtt caa gca tct 725Glu Ser Met Arg Pro Pro Pro Ile Val Glu Glu Ile Val Gln Ala Ser215 220 225 230att att gta aac tct gag aca ata agt aat atc aaa caa tac att atg 773Ile Ile Val Asn Ser Glu Thr Ile Ser Asn Ile Lys Gln Tyr Ile Met235 240 245gaa gaa tgt aaa gaa tct agt ttt gca ttt gag gtc gta gca gca ttg 821Glu Glu Cys Lys Glu Ser Ser Phe Ala Phe Glu Val Val Ala Ala Leu250 255 260gcc tgg cta gcg agg aca agg gct ttt caa att cca cat aca gag aat 869Ala Trp Leu Ala Arg Thr Arg Ala Phe Gln Ile Pro His Thr Glu Asn265 270 275gta aag ctt ctt ttt gca gtg gat acg agg aga tca ttt gat cca cca 917Val Lys Leu Leu Phe Ala Val Asp Thr Arg Arg Ser Phe Asp Pro Pro280 285 290ctt cca aaa ggt tac tat ggt aat gcc gct ggt aat gca tgt gca atg 965Leu Pro Lys Gly Tyr Tyr Gly Asn Ala Ala Gly Asn Ala Cys Ala Met295 300 305 310gat aat gtt caa gac ctc tta aat gga tct cta ttg cgg gct gta atg 1013Asp Asn Val Gln Asp Leu Leu Asn Gly Ser Leu Leu Arg Ala Val Met315 320 325att ata aag aaa tca aag gtc tct tta aat gag aat ata agg gca aaa 1061
Ile Ile Lys Lys Ser Lys Val Ser Leu Asn Glu Asn Ile Arg Ala Lys330 335 340aca gtg atg aga cca tct gca ata gat gtg aat atg aaa cat gaa agc 1109Thr Val Met Arg Pro Ser Ala Ile Asp Val Asn Met Lys His Glu Ser345 350 355aca gtt gga tta agt gat ttg agg cac ttg gga ttt aat gaa gtg gac 1157Thr Val Gly Leu Ser Asp Leu Arg His Leu Gly Phe Asn Glu Val Asp360 365 370ttt ggg tgg gga gat gca tta aat gca agt ctg gtg caa cat ggg gta 1205Phe Gly Trp Gly Asp Ala Leu Asn Ala Ser Leu Val Gln His Gly Val375 380 385 390att caa caa aat tat ttt ctt ttc cta caa cct tcc aag aac atg aat 1253Ile Gln Gln Asn Tyr Phe Leu Phe Leu Gln Pro Ser Lys Asn Met Asn395 400 405ggt gga ata aag ata gca atg ttc atg ccc caa tca aaa gtg aag cca 1301Gly Gly Ile Lys Ile Ala Met Phe Met Pro Gln Ser Lys Val Lys Pro410 415 420ttc aaa ata gaa atg gaa gcc cta ata agc aaa tat gca act aaa gtg 1349Phe Lys Ile Glu Met Glu Ala Leu Ile Ser Lys Tyr Ala Thr Lys Val425 430 435tga aactacaaca acttgagctt tgtattttcc aaataatatt tgaacccgca 1402aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 1431<210>2<211>438<212>PRT
<213>曼地亚红豆杉(Taxus media)<400>2Met Glu Lys Ala Gly Ser Ser Thr Glu Phe His Val Lys Ile Ser Asp1 5 10 15Pro Val Met Val Pro Pro Cys Ile Pro Ser Pro Lys Thr Ile Leu Gln20 25 30Leu Ser Ala Val Asp Asn Tyr Pro Ala Val Arg Gly Asn Ile Leu Asp35 40 45Cys Leu Leu Val Tyr Asn Ala Ser Asn Thr Ile Ser Ala Asp Pro Ala50 55 60Thr Val Ile Arg Glu Ala Leu Ser Lys Val Leu Val Tyr Tyr Phe Pro65 70 75 80Phe Ala Gly Arg Met Arg Asn Lys Gly Asp Gly Glu Leu Glu Val Asp85 90 95Cys Thr Gly Glu Gly Ala Leu Phe Val Glu Ala Met Ala Asp Asp Asn100 105 110Leu Ser Val Leu Gly Gly Phe Asp Tyr His Asn Pro Ala Phe Gly Lys115 120 125Leu Leu Tyr Ser Leu Pro Leu Asp Thr Pro Ile His Asp Leu His Pro130 135 140Leu Val Val Gln Val Thr Arg Phe Thr Cys Gly Gly Phe Val Val Gly145 150 155 160
Leu Ser Leu Asp His Ser Ile Cys Asp Gly Arg Gly Ala Gly Gln Phe165 170 175Leu Lys Ala Leu Ala Glu Met Ala Arg Gly Glu Ala Lys Pro Ser Leu180 185 190Glu Pro Ile Trp Asn Arg Glu Leu Leu Lys Pro Glu Asp Leu Ile Arg195 200 205Leu Gln Phe Tyr His Phe Glu Ser Met Arg Pro Pro Pro Ile Val Glu210 215 220Glu Ile Val Gln Ala Ser Ile Ile Val Asn Ser Glu Thr Ile Ser Asn225 230 235 240Ile Lys Gln Tyr Ile Met Glu Glu Cys Lys Glu Ser Ser Phe Ala Phe245 250 255Glu Val Val Ala Ala Leu Ala Trp Leu Ala Arg Thr Arg Ala Phe Gln260 265 270Ile Pro His Thr Glu Asn Val Lys Leu Leu Phe Ala Val Asp Thr Arg275 280 285Arg Ser Phe Asp Pro Pro Leu Pro Lys Gly Tyr Tyr Gly Asn Ala Ala290 295 300Gly Asn Ala Cys Ala Met Asp Asn Val Gln Asp Leu Leu Asn Gly Ser305 310 315 320Leu Leu Arg Ala Val Met Ile Ile Lys Lys Ser Lys Val Ser Leu Asn325 330 335Glu Asn Ile Arg Ala Lys Thr Val Met Arg Pro Ser Ala Ile Asp Val
340 345 350Asn Met Lys His Glu Ser Thr Val Gly Leu Ser Asp Leu Arg His Leu355 360 365Gly Phe Asn Glu Val Asp Phe Gly Trp Gly Asp Ala Leu Asn Ala Ser370 375 380Leu Val Gln His Gly Val Ile Gln Gln Asn Tyr Phe Leu Phe Leu Gln385 390 395 400Pro Ser Lys Asn Met Asn Gly Gly Ile Lys Ile Ala Met Phe Met Pro405 410 415Gln Ser Lys Val Lys Pro Phe Lys Ile Glu Met Glu Ala Leu Ile Ser420 425 430Lys Tyr Ala Thr Lys Val435<210>3<211>23<212>DNA<213>曼地亚红豆杉(Taxus media)<400>3gattctcagc ccatcgtttc atc<210>4<211>28<212>DNA
<213>曼地亚红豆杉(Taxus media)<400>4gcgggttcaa atattatttg gaaaatac
权利要求
1.一种编码红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶蛋白的核酸,其特征在于具有SEQ ID NO.1所示的核苷酸序列。
2.一种红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶蛋白,其特征在于具有SEQ ID NO.2所示的氨基酸序列。
专利摘要
一种红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶蛋白及其编码基因,属于基因工程领域。所分离出的DNA分子包括编码具有红豆杉紫杉烷C13-侧链-N-苯甲酰转运酶活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.1中从核苷酸第36-1352位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55℃条件下与SEQID NO.1中从核苷酸第36-1352位的核苷酸序列杂交。本发明是一种催化苯甲酰CoA和去苯甲酰紫杉醇生成紫杉醇的酶,对保护人民的健康生长有所帮助。
文档编号C12N15/82GKCN1273600SQ200410016769
公开日2006年9月6日 申请日期2004年3月4日
发明者唐克轩, 开国银, 苗志奇, 李柱刚, 赵凌侠 申请人:上海交通大学导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1