丹参3-羟基-3-甲基戊二酰辅酶a还原酶基因及其编码的蛋白质和应用的制作方法

文档序号:596402阅读:248来源:国知局

专利名称::丹参3-羟基-3-甲基戊二酰辅酶a还原酶基因及其编码的蛋白质和应用的制作方法
技术领域
:本发明属于生物
技术领域
,具体说,是涉及在丹参中表达的3-羟基-3-甲基戊二酰辅酶A还原酶基因及其编码的蛋白质和应用。
背景技术
:心脑血管疾病与糖尿病、癌症等是目前对人类威胁最大的三大类疾病。其中心脑血管疾病位于这三大疾病之首。据统计,全世界每年大约有1700万人死于心脑血管疾病,约占全球总死亡人数的1/3;我国每年大约有260万人死于心脑血管疾病,心脑血管疾病已成为威胁全人类健康与生命的"头号杀手"。因此积极研究及开发高效、低毒和廉价的治疗心脑血管疾病的临床药物对提高人类健康水平具有十分深远的意义。中药丹参系唇形科鼠尾草属植物丹参(Sa/Wam/WoA7/7/zaBunge)的干燥根及根茎,因其色红且形状似参而得名"丹参",是一种主治心血管系统疾病的常用中药。丹参作为一种传统中药材在我国沿用已久,始载于《神农本草经》,被列为上品。《本草经疏》、《本草纲目》中亦有记载。传统中医认为丹参具有祛瘀止痛、活血通经、清心除烦的作用,主治冠心病、心绞痛、心烦不眠、月经不调、经闭痛经等症。研究表明丹参活性成分主要分为两大类即脂溶性二萜类化合物(丹参酮l、丹参酮IIA、隐丹参酮等)和水溶性酚酸类化合物(丹酚酸A、丹酚酸B、紫草酸、迷迭香酸、原儿茶醛、丹参素等)。现代药理研究表明丹参对心血管系统,血液系统的疾病疗效十分显著。以丹参为主的多种复方制剂如复方丹参注射液、复方丹参片、复方丹参胶囊和复方丹参滴丸等,被临床广泛用于治疗心血管疾病、肾病、肝病及抗感染等,近年来还发现丹参具有抗肿瘤活性,因此,丹参在临床上具有十分广泛的用途。然而由于丹参的市场需求巨大,而野生资源日益减少,加之丹参为多年生草本植物,其生长周期较长,药用活性成分含量低,在传统的栽培模式下,面临着品质严重退化及品种选育成本过高等诸多弊端。因此,如何使得丹参这一原料药材的供应在数量和质量上能更好地满足临床应用的需求成了一个研究热点。现代生3了新的途径。利用现代基因工程技术将丹参药用活性成分生物合成途径中的关键酶基因导入到丹参中,获得转基因的发根、细胞系或再生植株,并进行大规模的培养,是提高丹参药用活性成分的含量和拓展丹参活性产物来源的最佳途径之一。丹参酮类化合物(如丹参酮I、丹参酮IIA及隐丹参酮等)属于二萜化合物,最新研究表明不论是甲羟戊酸(MVA)途径还是1-去氧木糖-5-磷酸(DXP)途径都可以为萜类物质(包括丹参酮和青蒿素等)的生物合成提供前体物质。3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR)是MVA途径中公认的最为重要一个关键酶,催化合成关键前体MVA,因此该步骤是萜类物质代谢工程的关键调控靶点。在对现有文献的分析中,"Biosciencer印orts(生物科学报告),2006,26(2):171-181"报道了从杜仲中克隆了-羟基-3-甲基戊二酰辅酶A还原酶基因,但至今尚未有从药物植物丹参中分离克隆出全长3-羟基-3-甲基戊二酰辅酶A还原酶基因的文献报道。由于这个基因编码的酶对于丹参酮类二萜成分的生物合成具有显著影响,因此,这一步是利用基因工程技术来调控丹参酮生物合成的关键切入点。
发明内容本发明的目的在于提供一种丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因。本发明第二个目的是提供该基因编码的蛋白质。本发明还提供了含有该基因的重组载体和宿主细胞。本发明的另一个目的在于提供该基因的应用。本发明所提供的丹参3-羟基-3-甲基戊二酰辅酶A还原酶(SmHMGR)基因,为以下核苷酸序列之一(1)具有SEQIDNo.1所示的核苷酸序列;(2)SEQIDNo.1所示的核苷酸序列添加、取代、插入或缺失一个或多个核苷酸的同源序列或者其等位基因及其衍生的核苷酸序列。该基因所编码的蛋白质为丹参3-羟基-3-甲基戊二酰辅酶A还原酶,是以下氨基酸序列之一(1)具有SEQIDNo.2所示的氨基酸序列;(2)SEQIDNo.2添加、取代、插入或缺失一个或多个氨基酸的同源序列。含有本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因全序列或部分片段重组载体,如质粒或植物表达载体均属于本发明的保护范围含有本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因全序列或部分片段的宿主细胞,如含有上述的重组载体的宿主细胞也属于本发明的保护范围。所述宿主细胞为大肠杆菌细胞、农杆菌细胞、酵母细胞、丹参细胞、烟草细胞或丹参发根细胞。所述宿主细胞优选大肠杆菌细胞、农杆菌细胞或丹参发根细胞。本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的应用,包括用所述的重组载体,如植物表达载体转化丹参细胞;或者用所述含有该基因的农杆菌与丹参细胞共培养,得到转基因的丹参发根系;或者用所述的丹参发根细胞再生丹参植株;或者用所述的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因序列遗传转化获得转基因丹参植株。本发明技术方案中涉及的概念具体内容如下所说的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的DNA分子包括编码具有丹参3-羟基-3-甲基戊二酰辅酶A还原酶活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQIDNO.1中从核苷酸第69—1766位的核苷酸序列有至少70。/。的同源性;或者所述的核苷酸序列能在40—55'C条件下与SEQIDNO.1中从核苷酸第69—1766的核苷酸序列杂交。较佳地,所述的序列编码具有SEQIDNO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQIDNO.1中从核苷酸第69—1766位的核苷酸序列。本发明分离出的丹参3-羟基-3-甲基戊二酰辅酶A还原酶多肽包括:具有SEQIDNO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQIDNO.2序列的多肽。本发明中的DNA分子包含所述的DNA分子中8-100个连续核苷酸。在本发明中,"分离的"、"纯化的"DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段己经与天然状态下伴随核酸的组分分开,而且已经与在细胞中伴随其的蛋白质分开。本发明中术语"丹参3-羟基-3-甲基戊二酰辅酶A还原酶(或多肽)基因"指编码具有丹参3-羟基-3-甲基戊二酰辅酶A还原酶活性的多肽的核苷酸序列,如SEQIDNO.1中第69—1766位核苷酸序列及其简并序列。该简并序列是指,位于SEQIDNO.1序列的编码框第69—1766位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQIDNO.1中第69—1766位核苷酸序列同源性低至约70。/。的简并序列也能编码出SEQIDNO.2所述的序列。还包括能在中度严谨条件下,更佳的在高度严谨条件下与SEQIDNO.1中从核苷酸第69一1766位的核苷酸序列杂交的核苷酸序列。还包括与SEQIDNO.1中从核苷酸第69一1766位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。还包括能编码具有与天然的丹参3-羟基-3-甲基戊二酰辅酶A还原酶相同功能的蛋白的SEQIDNO.1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5'和/或3,端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。本发明中术语"丹参3-羟基-3-甲基戊二酰辅酶A还原酶蛋白或多肽"指具有丹参3-羟基-3-甲基戊二酰辅酶A还原酶活性的SEQIDNO.2序列的多肽。该术语还包括具有与天然丹参3-轻基-3-甲基戊二酰辅酶A还原酶相同功能的SEQIDNO.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括丹参3-羟基-3-甲基戊二酰辅酶A还原酶的活性片段和活性衍生物,还包括能够可操作地连于信号肽、启动子或者核糖体结合位点序列所组成的衍生物。本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨条件下能与丹参3-羟基-3-甲基戊二酰辅酶A还原酶DNA杂交的DNA所编码的蛋白、以及利用丹参3-羟基-3-甲基戊二酰辅酶A还原酶多肽的血清获得的多肽或蛋白。本发明中丹参3-羟基-3-甲基戊二酰辅酶A还原酶保守性变异多肽指与SEQIDNO.2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽可根据表1进行替换而产生。表1.保守性变异多肽中的取代残基<table>tableseeoriginaldocumentpage6</column></row><table><table>tableseeoriginaldocumentpage7</column></row><table>本发明还包括丹参3-羟基-3-甲基戊二酰辅酶A还原酶或多肽的类似物。这些类似物与天然3-羟基-3-甲基戊二酰辅酶A还原酶多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氮基酸(如(3、Y-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。所述修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或迸一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶多肽时,可以将丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的核苷酸序列可操作地连于表达调控序列,从而形成丹参3-羟基-3-甲基戊二酰辅酶A还原酶表达载体。所述"可操作地连于"指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,"可操作地连于"意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。本发明中宿主细胞为原核细胞或者真核细胞。常用的原核宿主细胞包括大肠杆菌;常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。本发明还可用Northern印迹法技术分析丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因产物的表达,即分析丹参3-羟基-3-甲基戊二酰辅酶A还原酶的RNA转录物在细胞中的存在和数量。此外,本发明中可用作探针的核酸分子通常具有丹参3-羟基-3-甲基戊二酰辅酶A还原酶核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码丹参3-羟基-3-甲基戊二酰辅酶A还原酶的核酸分子。本发明涉及检测样品中是否存在丹参3-羟基-3-甲基戊二酰辅酶A还原酶核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于丹参3-羟基-3-甲基戊二酰辅酶A还原酶核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。此外,根据本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选丹参3-羟基-3-甲基戊二酰辅酶A还原酶源基因或同源蛋白。为了得到与丹参3-羟基-3-甲基戊二酰辅酶A还原酶相关的丹参cDNAs的点阵,可以用DNA探针筛选丹参cDNA文库,这些探针是在低严谨条件下,用"P对丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自丹参的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,PaloAlto,Cal.。这种筛选方法可以识别与丹参3-羟基-3-甲基戊二酰辅酶A还原酶的基因家族的核苷酸序列。本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公幵的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可通过化学合成将突变引入本发明蛋白序列中。除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-PhasePeptideSynthesis,WHFreemanCo.,SanFrancisco;Merrifield丄(1963)丄AmChem.Soc85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用AppliedBiosystems的431A型肽合成仪(FosterCity,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。利用本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶,通过各种常规筛选方法,可筛选出与丹参3-羟基-3-甲基戊二酰辅酶A还原酶发生相互作用的物质,或者受体、抑制剂或拮剂等。本发明所提供的3-羟基-3-甲基戊二酰辅酶A还原酶基因是首次从丹参中克隆制备的,填补了从我国药物植物丹参中分离克隆出3-羟基-3-甲基戊二酰辅酶A还原酶基因的空白。利用本发明可以通过基因工程技术来提高丹参等植物中萜类活性成分丹参酮的含量,转基因结果显示,丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因对促进丹参酮含量的提高有明显作用。丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因可通过转基因技术用于提高丹参酮含量的研究和产业化,尤其可用于中药材丹参的品质改良,能缓解丹参酮药源严重匮乏问题,对提高丹参酮产量具有较好的促进作用,具有很好的应用前景。具体实施方式下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲述的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围内。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambraok等分子克隆实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。实施例1丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的克隆1.组织分离(isolation)丹参植株来源于河南,采取幼嫩根后立即置于液氮中冷冻保存。2.RNA的分离(RNAisolation)取部分组织用研钵研碎,加入盛有裂解液的1.5mLEP管,充分振荡后,再移入玻璃匀桨器内。匀浆后移至1.5mLEP管中,抽提总RNA(TRIzolReagents,G旧COBRL,USA)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。3.基因的全长克隆(CloningofFull-lengthcDNA〉根据杜仲、烟草及其它已克隆得到的3-羟基-3-甲基戊二酰辅酶A还原酶氨基酸保守序列,设计简并引物,利用同源性基因克隆原理,采用Smart-RACE方法(Clonetech试剂盒)进行cDNA全长克隆,分三个阶段进行(1)3'-RACEPCR(UPM+F2)得到SmHMGRF2'(775bp),回收,连接到T-Easy载体上,用SP6或T7作为通用引物,釆用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsingroup,USA)中的BLAST禾BFASTA软件搜索已有的数据库(Genebank+EMBL),结果表明其核酸序列及编码蛋白与已知HMGR基因(如穿心连HMGR基因等)的同源性很高,故初歩认为它是一个HMGR基因。(2)5'-RACE根据3'RACE结果,设计反向特异引物R2,经PCR(UPM+R2)得到SmHMGRR2'(1580bp)(过程同(1))。回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序。(3)将5'RACE测序结果与3'RACE测序结果比序并进行拼接,得到全长片段序列信息,并设计一对特异引物SmHMGRKF1(5'-ATGGATATCCGCCGGAGGCCA-3')(SEQIDN0.3)禾卩SmHMGRKR1(5'-TCAGGAGCCAATCTTCGTGATG-3')(SEQIDN0.4)进行PCR扩增SmHMGR编码区得到SmHMGR编码区(1698bp)(过程同步骤(1))BLAST的结果证明从丹参中新得到的基因确为一个3-羟基-3-甲基戊二酰辅酶A还原酶基因。研究表明3-羟基-3-甲基戊二酰辅酶A还原酶基因对于萜类物质如丹参酮等的代谢合成具有重要影响,故推测新克隆的基因具有相似的功能。通过组合使用上述3种方法,获得了候选的丹参SmHMGR蛋白的全长编码序歹U。在拼接得到全长(至少包含完整的开放读框)的基础上,以SmHMGRF1(5'-CCCCTTCATTCTTTCTCTCTCTC-3')为正向弓l物,SmHMGRR1(5'-GAAGCAGAAGAAGATTGCATTAC-3')为反向引物,以总RNA为模板,进行RT-PCR扩增,PCR条件为94°C5分钟,随之以94°C1分钟、58°C1分钟和72°C2分半钟进行35个循环,最后以72。C延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为2091bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQIDNO.1所示的序列。实施例2丹参HMGR基因的序列信息与同源性分析本发明的丹参3-羟基-3-甲基戊二酰辅酶A还原酶全长cDNA的长度为1258bp,详细序列见SEQIDN0.1,其中开放读框位于65-1126位核苷酸。根据全长cDNA推导出丹参3-羟基-3-甲基戊二酰辅酶A还原酶的氨基酸序列,共565个氨基酸残基,分子量60.5KD,pl为7.1,详细序列见SEQIDNO.2。将丹参3-羟基-3-甲基戊二酰辅酶A还原酶的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundantGenBank+EMBL+DDBJ+PDB和Non-redundantGenBankCDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与穿心莲〃/WGf基因(GenBankAccessionNo.AY254389.2)具有80%的同源性(见表2);在氨基酸水平上,它与穿心莲HMGR(GenBankAccessionNo.AAP14352.2)的第1-562位氨基酸残基有85%的相同性和91%的相似性(见表3)。由上可见,丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因与穿心莲3-羟基-3-甲基戊二酰辅酶A还原酶基因无论从核酸还是蛋白水平上都存在较高的同源性。故可以认为丹参3-羟基-3-甲基戊二酰辅酶A还原酶在提高丹参中丹参酮类二萜成分含量上具有促进作用。表2.本发明的丹参SmWMG尺与穿心莲(Am/raflvap//spa/j/'cii/afa)ApWWGR的核苷酸序列的同源比较(GAP)表Query138GTGGATCACCAACCCTCCTC-CCCTAAAGCCTCTGATGCGCTCCCGCTCCCGCTCTACCT196Sbjct139GTGGATCGCCGACCCTCATCTCCC-AAAGCCTCCGACGCCCTCCCCCTCCCACTCTACCT197QuerySbjctQu6rySbjctQuerySbjctQuerySbjctQuery197198257258317318376377434CACCMCGGCATTTTCTTCACGCTCTTCTTCTCCGTCGCCTACTTCCTCCTTCACCGCTG256CACCMTGGCATTTTCTTCACCCTCTTCTTCTCCGTCGCCTACTTCCTCCTCCACCGCTG257GCGCGATAAGATCCGCAATTCGACGCCGCTCCACATCCTCACGCTCTCCGAGCTCGCCGG316GCGGGACAAGATCCGCAACTCCACCCCCCTCCACGTCCTCACGCTCTCCGMCTCGCCGC317MTTC-TCTGCCTCATCGCCTCGTTTATCTACCTGCTAGGGTTTTTCGGCATCGATTTCG375CA-TCGTCTGCCTCATCGCCTCCTTCATCTACCTCCTCGGCTTCTTCGGCATCGATTTCG376TGCAGTCGTTCATCTCGAAGCCGGAGAG-CGACGAGGACCACCAGCGGTTT-ATCCTCCA433TCCAGTCGTTTATATCCAAGCCCGA-CGCCGACGACGACCCCCAGC-GTTTCATTCTCCA434CGAAGATCGGAA—GATTCACTGCGGC-TTGCCGCCGCCGGCGCCGGTGGTGGCCMGGCG491Sbjct435CGAGGATCGAAATG-TTCTCTGCTCCATT-CCACCGCCTTC-CC——CT-CCCAAGCCG486Query492AAG-GCGGCCGTGGAGCT-GCCGCAGGACGATGAGGAAGTCGTTGACCGCGTCGTTTCCG549Sbjct487AAGATC-CCCCTCAACCTCTCCG-ACGACGATGACGAACTCGTCGACCGCGTTGTCTCCG544Query550GGGAAATCCCGTCGTATTCTCTGGAATCGAGGCTCGGGGACTGCCTTAGGGCGGCGMGA609Sbjct545GCGAMTCCCCTCCTACTCTCTTGAATCGAAGCTTGGGGACTGCCTTAGGGCCGCGAGGA604Query610TACGCCGTGAGGCGGTGCAGCGGCTGACGGGGAGAG-GCGTCGACGGGCTGCCTCTGGAG668Sbjct605TACGCCGGGCGGCCGTTCAGCACCTGACTGGGAG-GTCCTTGGAGGGGCTGCCTTTGGAG663Query669GGGTTCGATTACGACTCGATTTTGGGGCAATGCTGCGAGATGCCGGTAGGGTATGTGCAG728Sbjct664GCGTTCGATTACGATTCCATTTTAGGGCAATGCTGCGAGATGCCGGTCGGGTATGTGCAG723Query729ATTCCGGTGGGGATTGCAGGGCCGCTGCTGCTGAATGGGTGCGAGTACTCGGTGCCGATG788Sbjct724ATTCCGGTGGGGATTGCGGGGCCTTTGCTTCTCAACGGATGCGAATACTCCGTTCCCATG783Query789GCGACGACAGAAGGGTGCCTCGTTGCTAGCACGAACAGAGGCTGCAAGGCAATCTATGCT848Sbjct784GCGACGACGGAAGGATGCTTGGTCGCCAGCACCAACCGTGGTTGCAAGGCCATCCACGCC843Query849TCCGGAGGTGCAACGTGCGTGTTGCTACGAGACGCGA-TGACTAGAGCTCCTGTTGTGAG907Sbjct844TCCGGCGGCGCCACCTGCGTCCTCCTTCGTGATG-GAATGACCAGAGCTCCCGTCGTTAG902Query908GTT-CTCGTCGGCGAAGAGGGCGACAGAGTTGAAGTTCTTCCTCGAAGATCCTC-TCAAT965Sbjct903GTTTCCC-TCCGCCAAGAGGGCTTCCGAATTGAAATTCTTCATCGAGGATCC—CATCAAT960QuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjct966TTCGATACGCTGTCGGTCGTTTTCAATMGTCGAGTAGATTTGCTAGACTCCAAAATGTT1025961TTCGAGACTCTCTCTGTTGTTTTCAACAGGTCAAGCAGATTTGCAAGGCTTCAGAGTATT10201026CAATGTGCAATTGCTGGGAAGAATCTATACATMGATTTAGTTGCAGCACTGGCGACGCC10851021AAATCCGCCATTGCTGGGAAGAATCTGTACCTTAGATTTACATGCAGCACAGGTGATGCC10801086ATGGGAATGAACATGGTTTCAAAAGGGGTTC嵐ATGTTTTGGACTTCCTTCAGAATGAT11451081ATGGGGATGAACATGGTTTCCAAAGGCGTGC嵐ACGTTTTAGAATTCCTGCAGAACGAT11401146TTCCCAGACATGGATGTCATTGGCATTTCTGGAAATTACTGTTCCGACAAGAAACCAT-C12041141TTTCCGGATATGGACGTAATTGGAATATCGGGMATTACTGTTCTGATAAGAAACC-TGC11991205TGCAGTCAATTGGATCGAAGGGCGTGGAAAATCAGTTGTATGTGAGGCGGTCATCACCG-12631200CGCAGTCAATTGGATTGAAGGGCGAGGCAAATCTGTCGTCTGTGAGGCTACCATTTCCGG12591264CTGATGTGGTGTCAAAGGTACTGMAA-CAACCGTACCCT-CTCTTGTTGAGCTTMCAT1321260C-GATGTGGTGTCCAAGGT-CTTMAAACCACGGTTTCGGGC-CTGGTTGAGCTCAACAT13161322GCTCMGAACCTCACAGGCTCTGCTATTGCTGGTGCTCTTGGTGGATTCAATGCGCATGC1381317GCTCAAGAACCTCACTCGCTCGGCTATGGCCGGTGCTCTCGGTGGCTTCAATGCGCACGC1376382TGCAMCATCGTCTCTGCAATATTTATCGCCACTGGGCAGGATCCAGCTCMAACATTGA1441377TGCAMCATAGTCTCGGCGATCTTTATTGCCACAGGGCAGGATCCCGCGCAGMCATTGA1436442MGTTCCCACTGCATTACTATGATGGAGGCCATTAATGATGGCAAGGATCTTCATATTTC1501437AAGCTCTCACTGCATTACCATGATGGAGGCGGTCAATGACGGAAAGGATATCCACATCTC1496502AGTGACAATGCCATCCATTGAGGTTGGCACTGTCGGAGGAGGAACTCMCTGGCATCACA1561497TGTGACTATGCCGTCCATAGAGGTTGGTACGGTTGGGGGTGGAACTCAATTGGCGTCGCA1556562ATCTGCTTGCCTCAACCTGCTTGGCGTMAGGGTGCAAAC嵐GAGTCTCCTGGATCAM1621557ATCTGCTTGCCTGAACCTGCTCGGCGTAAAGGGCGCGAACAAAGAGTCTCCGGGAGCGAA1616622TGCGCGGCTCCT-GGCCACCATTGTCGCTGGTGCTGTCTTGGCAGGG-GAGCTCTCTCTA1679.617TGCGCAGCTCCTAGGTTTGG-TGGTTGCCGGCGCTGTCTTGGC-GGGAGAGCTGTCGCTA1674680ATGTCTGCCATTTCAGCTGGTCAGCTCGTTAAGAGCCACATGAAATACAA1729675ATGTCTGCCATTTCAGCGGGACAGCTCGTGAAGAGTCACATGAAATACAA1724其中Query表示丹参6)zz/yM^的核酸序列;Subject表示穿心莲^^M^的核酸序列(GenBankAccessionNo.AY254389.2)。结果在1729个核苷酸的比对中两者有80%的相似性。表3.本发明的丹参SmHMGR与穿心莲ApHMGR氨基酸序列的同源比较(FASTA)表Query3IRRRPARPPPPPSASTSTSSAVDHQPSSPKASDALPLPLYLTNGIFFTLFFSVAYFLLHR62+RRRP+PPSVD+PSSPKASDALPLPLYLTNGIFFTLFFSVAYFLLHRSbjct4VKRRPTKPAP------SDKVVVDRRPSSPKASDALPLPLYLTNGIFFTLFFSVAYFLLHR57Query63WRDKIRNSTPLHILTLSELAGILCLIASFIYLLGFFGIDFVQSFISKPESDEDHQRFILH122WRDKIRNSTPLH+LTLSELAI+CLIASFIYLLGFFGIDFVQSFISKP++D+DQRFILHSbjct58TODKIRNSTPLHVLTLSELAAIVCLIASFIYLLGFFGIDFVQSFISKPDADDDPQRFILH117Query123EDRKIHCGLPPPAPVVAKAKAAVELPQDDEEVVDRVVSGEIPSYSLESRLGDCLRMKIR182EDR+C+PPP+PKK+LDD+E+VDRVVSGEIPSYSLES+LGDCLRM+IRSbjct118EDRNVLCSIPPPSP—PKPKIPLNLSDDDDELVDRVVSGEIPSYSLESKLGDCLRMRIR175Query183REAVQRLTGRGVDGLPLEGFDYDSILGQCCEMPVGYVQIPVGIAGPLLLNGCEYSVPMAT242RAVQLTGR++GLPLEFDYDSILGQCCEMPVGYVQIPVGIAGPLLLNGCEYSVPMATSbjct176RAAVQHLTGRSLEGLPLEAFDYDSILGQCCEMPVGYVQIPVGIAGPLLLNGCEYSVPMAT235Query243TEGCLVASTNRGCKAIYASGGATCVLLRDAMTRAPVVRFSSAKRATELKFFLEDPLNFDT302TEGCLVASTNRGCKAI+ASGGATCVLLRDMTRAPVVRFSAKRA+ELKFF+EDP+NF+TSbjct236TEGCLVASTNRGCKAIHASGGATCVLLRDGMTRAPVVRFPSAKRASELKFFIEDPINFET295Query303LSVVFNKSSRFARLQNVQCAIAGKNLYIRFSCSTGDAMGMNMVSKGVQNVLDFLQNDFPD362LSVVFN+SSRFARLQ+++AIAGKNLY+RF+CSTGDAMGM歸SKGVQNVL+FLQNDFPDSbjct296LSVVFNRSSRFARLQSIKSAIAGKNLYLRFTCSTGDAMGMNMVSKGVQNVLEFLQNDFPD355Query363MDVIGISGNYCSDKKPSAVNWIEGRGKSVVCEAVITADVVSKVLKTTVPSLVELNMLKNL422MDVIGISGNYCSDKKP+AVNWIEGRGKSVVCEA1+DVVSKVLKTTVLVELNMLKNLSbjct356MDVIGISGNYCSDKKPAAVNWIEGRGKSVVCEATISGDVVSKVLKTTVSGLVELNMLKNL415Query423TGSAIAGALGGFNAHAANIVSAIFIATGQDPAQNIESSHCITMMEAINDGKDLHISVTMP482TSA+AGALGGF麵AANIVSAIFIAT卿PAQNIESSHCITMMEA+NDGKD+HISVTMPSbjct416TRSAMAGALGGFNAHAANIVSAIFIATGQDPAQNIESSHCITMMEAVNDGKDIHISVTMP475Query483SIEVGTVGGGTQLASQSACLNLLGVKGANKESPGSNARLLATIVAGAVLAGELSLMSAIS542SIEVGTVGGGTQLASQSACLNLLGVKGANKESPG+NA+LL+VAGAVLAGELSLMSAISSbjct476SIEVGTVGGGTQLASQSACLNLLGVKGANKESPGANAQLLGLVVAGAVLAGELSLMSAIS535Query543AGQLVKSHMKYNRSSRDITK562AGQLVKS腿YNRS++KSbjct536AGQLVKSHMKYNRSQKNFAK555其中Query表示丹参SmHMGR的氨基酸序列;Subject表示穿心莲ApHMGR的氨基酸序列(GenBankAccessionNo.AAP14352.2);相同的氨基酸在两个序列之间用氨基酸单字符标出。结果在562个氨基酸的比对中,两者分别有85%的相同性和91%的相似性。实施例3丹参3-羟基-3-甲基戊二酰辅酶A还原酶或多肽在大肠杆菌中进行原核表达及提纯在该实施例中,将全长的丹参SmHMGR编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。1、原核表达载体的构建以及转化大肠杆菌根据丹参SmHMGR的核苷酸序列,设计扩增出蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将丹参SmHMGR基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCI2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-SmHMGR表达载体的工程菌BL21-pET32a(+)-SmHMGR。2、表达Trx-SmHMGR重组蛋白的工程菌的分离鉴定挑取单菌落的BL21-pET32a(+)-SmHMGR工程菌于3mL含100ng/mL氨苄青霉素的LB培养基中振摇培养过夜,按1:100的浓度吸取培养液于新的LB培养基(含100凶/mL氨苄青霉素)中培养约3小时,至ODeoo达0.5后,加入IPTG至终浓度1mmol/L继续于37'C分别培养0,1,2,3小时。取培养时间不同的1mL菌液离心,在细菌沉淀物中加入裂解液(2xSDS上样缓冲液50)aL,蒸馏水45pL,二巯基乙醇5pL),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达Trx-SmHMGR融合蛋白的工程菌。3、SmHMGR蛋白的提取纯化及酶活性测定按上述方法诱导表达Trx-SmHMGR融合表达蛋白的工程菌BL21-pET32a(+)-SmHMGR,经离心沉淀收集菌体,并根据厂家(Novagen)的说明书以BugBuster试齐ij禾nBenzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mMCAPS,pH11.0,0.3%N-lauroylsarcosine)来溶解,再用透析缓冲液(200mMTris-HCI,pH8.5)来透析。然后用组氨酸结合(His*Bind)树脂进行亲和层析,并经洗脱缓冲液(1Mimidazole,500mMNaCI,20mMTris-HCIpH7.9)洗脱来收集Trx-SmHMGR融合蛋白。融合蛋白经肠激酶2(TC酶切16小时后即可分离获的SmHMGR的表达蛋白。此表达蛋白分子量为60.5KD,pi为7.1。按Bonfill等(PlantPhysiologyandBiochemistry,2003,41:91-96)的方法对表达纯化的3-羟基-3-甲基戊二酰辅酶A还原酶蛋白进行酶活力的测定,研究其对甲羟戊酸(MVA)生成的影响。结果表明,表达的蛋白的确具有催化3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸(MVA)的酶活性。实施例4丹参3-羟基-3-甲基戊二酰辅酶A还原酶或多肽在丹参中进行真核细胞表达及转基因发根中丹参酮含量测定含目的基因(丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因)的表达载体的构建根据丹参3-羟基-3-甲基戊二酰辅酶A还原酶的全长序列(SEQIDNO.1),设计扩增出完整编码阅读框的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因cDNA克隆到双元表达载体(如pBI121),在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌中,遗传转化资源植物丹参。利用发根农杆菌介导的丹参的遗传转化,所需材料和操作步骤为1)发根农杆菌A4。使用前自冰箱取出,传代2次,传代用固体培养基为YEB培养基。菌种在使用前接种于YEB液体培养基中,28'C培养过夜。2)取生长8周左右的丹参无菌嫩叶片。3)经过夜培养的发根农杆菌A4菌液,用转化液稀释为100个细菌/mL。取无菌丹参叶片,用无菌的解剖刀划以"+"字形伤口,放入上述转化中,60rpm/min振荡培养8h取出,用无菌水冲洗3次,放入含250-500mg/L卡那霉素和不同浓度的B5培养基中,每2周转移到新鲜培养基中1次,待长出毛状根后分离毛状根,转移至含250-500mg/L卡那霉素无激素的B5培养基中培养,转移4-5次直至无细菌为止,然后再转移至不含卡那霉素的无激素B5培养基中培养。4)把在固体培养基中的毛状根的继代培养物,接种于装有100mL无激素B5,培养基的500mL三角瓶中,培养温度、光照、转速等培养条件与愈伤组织液体悬浮培养条件相同,培养25天,将毛状根从培养基上取出放入冷冻干燥机中进行干燥,然后称重,贮存于-7(TC备用。5)含丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的转基因发根的丹参酮含量测定按Ge等(PlantScience,2005)的方法对表达丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的转基因发根进行丹参酮含量测定。结果表明,在表达丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因的转基因发根中丹参酮含量比非转基因对照组提高1.4倍(P〈0.05)。因此转基因结果证明,丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因对促进丹参酮含量的提高有明显作用,丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因可用于利用转基因技术来提高丹参酮含量的研究和产业化中,具有很好的应用前景。核苷酸序列表<110>上海师范大学<120>丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因及其编码的蛋白质和应用<160>4<170>Patentlnversion3.3<210>1<211>2115<212>DNA<213〉丹参CSW"s巡/7〃釘力/.M)<220><221>CDS<222>(69)..(1766)<400>1ccccttcattctttctctctctcttcactcctctccgcgccgccgccgccgccgtcgccg60ccctggttatggatatecgceggaggccagcccgacctcctcctccgccc110MetAsplieArgArgArgProAlaArgProProProProPro1510tecgcctecacctecacatectecgcagtggatcaccaaccctectec158SerAlaSerThrSerThrSerSerAlaValAspHisGinProSerSer15202530cctaaagcctctgatgcgetcccgetcccgetctacetcaccscggc206ProLysAlaSerAspAlaLeuProLeuProLeuTyrLeuThrAsnGly354045attttcttcacgetcUcttctecgtcgccUc"cetccUcaccgc254liePhePheThrUuPhePheSerValAlaTyrPheLeuLeuHisArg505560tggcgcgataagatecgcaattcgacgccgetccacateetcacgetc302TrpArgAspLyslieArgAsnSerThrProLeuHislieLeuThrLeu657075tecgagetcgccggaattetctgcetcategcctcgtttatetacctg350SerGluLeuAlaGlylieLeuCysLeulieAlaSerPheHeTyrLeu808590etagggtttttcggcategatttcgtgcagtcgttcatetcgaagccg398LeuGlyPhePheGlylieAspPheValGinSerPhelieSerLysPro95100105110gagagegacgaggaccaccageggtttateetccacgaagateggaag446GluSerAspGluAspHisGinArgPhelieLeuHisGluAspArgLys115120125attcactgcggcttgccgccgccggcgccggtggtggccaaggcgaag494lieHisCysGlyLeuProProProAlaProValValAlaLysAlaLys130135140gcggccgtggagctgccgcaggacgatgaggaagtcgttgaccgcgtc542AlaAlaValGluLeuProGinAspAspGluGluValValAspArgVal145150155gtttecggggaaateccgtcgtattctctggaatcgaggetcggggac590ValSerGlyGlulieProSerTyrSerLeuGluSerArgLeuGlyAsp160165170tgccttagggcggcgaagaUcgccgtgaggcggtgcageggctgacg638CysLeuArgAlaAlaLyslieArgArgGluAlaValGinArgLeuThr175180185190gggagaggcgtcgacgggctgcctctggaggggttcgatUcgactcg686GlyArgGlyValAspGlyLeuProLeuGluGlyPheAspTyrAspSer195200205attttggggcaatgctgcgagatgccggtagggtatgtgcag"tccg734lieLeuGlyGinCysCysGluMetProValGlyTyrValGinliePro210215220gtggggattgcagggccgctgctgctgaatgggtgcgagtactcggtg782ValGlylieAlaGlyProLeuLeuLeuAsnGlyCysGluTyrSerVal225230235ccgatggcgacgacagaagggtgcetcgttgetageacgaacagaggc830ProMetAlaThrThrGluGlyCysLeuValAlaSerThrAsnArgGly240245250tgcaaggcaatetatgettecggaggtgcaacgtgcgtgttgetacga878CysLysAlalieTyrAlaSerGlyGlyAlaThrCysValLeuLeuArg255260265270gacgcgatgactagagetcctgttgtgeiggttctcgtcggcgaagagg926AspAlaMetThrArgAlaProValValArgPheSerSerAlaLysArg275280285gcgseagsgttgaagttcttcetcgaagatcctetcaatttcgatacg974AlaThrGluLeuLysPhePheLeuGluAspProLeuAsnPheAspThr290295300ctgtcggtcgttttcaataagtcgagtagatttgetagaetccaaaat1022LeuSerValValPheAsnLysSerSerArgPheAlaArgLeuGluAsn305310315gttcaatgtgcaattgetgggaagaatetatacataagatttagttgc1070ValGinCysAlalieAlaGlyLysAsnLeuTyrlieArgPheSerCys320325330ageactggcgacgccatgggaatgaacatggttteaaaaggggttcaa1118SerThrGlyAspAlaMetGlyMetAsnMetValSerLysGlyValGin335340345350aatgttttggacttccttcagaatgatttcccagacatggatgtcatt1166AsnValLeuAspPheLeuGinAsnAspPheProAspMetAspVallie355360365ggcatttctggaaattactgttecgacaagaaaccatctgcagtcaat1214GlylieSerGlyAsnTyrCysSerAspLysLysProSerAlaValAsn370375380tggategaagggcgtggaaaateagttgtatgtgaggcggtcateacc1262TrplieGluGlyArgGlyLysSerValValCysGluAlaVallieThr385390395getgatgtggtgteaaaggtactgaaaacaaccgtaccctctcttgtt1310AlaAspValValSerLysValLeuLysThrThrValProSerLeuVal400405410gagcttaacatgetcaagaacetcacaggctctgetattgetggtget1358GluLeuAsnMetLeuLysAsnLeuThrGlySerAlalieAlaGlyAla415420425430cttggtggattcaatgcgcatgetgcaaacategtctctgcaatattt1406LeuGlyGlyPheAsnAlaHisAlaAlaAsnlieValSerAlaliePhe435440445ategccactgggcaggatccsgetcaaaacattgaaagtteccactgc1454lieAlaThrGlyGinAspProAlaGinAsnlieGluSerSerHisCys450455460attactatgatggaggccattaatgatggcaaggatcttcatatttea1502lieThrMetMetGluAlalieAsnAspGlyLysAspLeuHislieSer465470475gtgacaatgccatecattgaggttggcactgtcggaggaggaactcaa1550ValThrMetProSerlieGluValGlyThrValGlyGlyGlyThrGin480485490ctggcateacaatctgettgcetcaacctgcttggcgtaaagggtgCB1598LeuAlaSerGinSerAlaCysLeuAsnLeuLeuGlyValLysGlyAla495500505510aacaaagagtctcctgg3teaaatgcgeggetcctggccacc"tgtc1646AsnLysGluSerProGlySerAsnAlaArgLeuLeuAlaThrlieVal515520525getggtgetgtcttggcaggggagetctctcUatgtctgcca"tea1694AlaGlyAlaValLeuAlaGlyGluI>euSerLeuMetSerAlalieSer530535540getggtcagetcgttaagagecacatgaaatacaaccgateaageagg1742AlaGlyGinUuValLysSerHisMetLysTyrAsnArgSerSerArg545550555gacateacgaagattggctectgaaactggttggtgtcaagaattggaaatgea1796AsplieThrLyslieGlySer560565ggacaagaggggtgggggaagattacagtcatgaegggeeaggagaagctggccttgcgg1856tgcaacattatggaatggatttgacttgcccaacaggggctgggtttataUgtgaaaga1916tatggagUctcctccatgtgtttgtattgcttcUttcctttctcctcctcctccccgc1976ccccctcttcgtgttttttctUgtgaatcgaagttttgctgttggctgtasicggaggcc2036agtttgcctcgtgaagatcggUtatatgtttgtaatgcaatcttcttctgcttcttttc2096aaaaaaaaaaaaaaaaaaa2115<210>2<211>565<212>PRT<213>丹参(5WWa迈/"/orrA/za)<400>2MetAsplieArgArgArgProAlaArgProProProProProSerAla151015SerThrSerThrSerSerAlaValAspHisGinProSerSerProLys202530AlaSerAspAlaLeuProLeuProLeuTyrLeuThrAsnGlyliePhe354045PheThrLeuPhePheSerValAlaTyrPheLeuLeuHisArgTrpArgAsp65Thr50LysValAlaTyrPheLeuLeu5560lieArgAsnSerThrProLeuHislieLeuThrLeuSerSer70lie75Glu80LeuAlaGlylieLeuCysLeulieAlaSerPhelieTyrLeuLeuGly859095PhePheGlylieAspPheValGinSerPhelieSerLysProGluSer100105110AspGluAspHisGinArgPhelieLeuHisGluAspArgLyslieHisAsp115lie120Arg125CysGlyUuProProProAlaProValValAlaLysAlaLysAlaAla130135140ValGluLeuProGinAspAspGluGluValValAspArgValValSer145150155160GlyGlulieProSerTyrSerLeuGluSerArgLeuGlyAspCysLeu165170175ArgAlaAlaLyslieArgArgGluAlaValGinArgLeuThrGlyArgLys180Ala185Thr190GlyValAspGlyLeuProLeuGluGlyPheAspTyrAspSerlieLeu195200205GlyGinCysCysGluMetProValGlyTyrValGinlieProValGlyGin210Pro215Gin220lieAlaGlyProLeuLeuLeuAsnGlyCysGluTyrSerValPro22523023523Met240AlaThrThrGluGlyCysLeuValAlaSerThrAsnArgGlyCysLys245250255AlalieTyrAlaSerGlyGlyAlaThrCysValLeuLeuArgAspAlaArg270ArgAlaThrAlaSerGlyGlyAlaThr260265MetThrArgAlaProValValArgPheSerSerAlaLys275280285GluLeuLysPhePheLeuGluAspProLeuAsnPheAspThrLeuSer290295300ValPheAsnLysSerSerArgPheAlaArgLeuGinAsnValVal305Ser310Arg315Gin320CysAlalieAlaGlyLysAsnLeuTyrlieArgPheSerCysSerThr325330335GlyAspAlaMetGlyMetAsnMetValSerLysGlyValGinAsnVal340345350LeuAspPheLeuGinAsnAspPheProAspMetAspVallieGlyliePhe355Phe360Val365SerGlyAsnTyrCysSerAsp!>ysLysProSerAlaValAsnTrplie370375380GlyArgGlyLysSerValValCysGluAlaVallieThrAlaGluGlyArgGlyLysSerValValCysGluAla385390395ValValSerLysValLeuLysThrThrValProSerLeuValVal405Val410Glu415Asp400LeuAsnMetLeuLysAsnLeuThrGlySerAlalieAlaGlyAlaLeuGly420425430GlyPheAsnAlaHisAlaAlaAsnlieValSerAlaliePhelieAla435440445ThrGlyGinAspProAlaGinAsnlieGluSerSerHisCyslieThr450455460<formula>formulaseeoriginaldocumentpage25</formula>权利要求1.一种丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因,其特征在于,是以下核苷酸序列之一(1)具有SEQIDNo.1所示的核苷酸序列;(2)SEQIDNo.1所示的核苷酸序列添加、取代、插入或缺失一个或多个核苷酸的同源序列或者其等位基因及其衍生的核苷酸序列。2.—种丹参3-羟基-3-甲基戊二酰辅酶A还原酶,其特征在于,是以下氨基酸序列之一(1)具有SEQIDNo.2所示的氨基酸序列;(2)SEQIDNo.2添加、取代、插入或缺失一个或多个氨基酸的同源序列。3.—种重组载体,其特征在于含有权利要求1所述的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因全序列或部分片段。4.一种宿主细胞,其特征在于所述宿主细胞含有权利要求1所述的丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因全序列或部分片段。5.根据权利要求4所述的宿主细胞,其特征在于所述宿主细胞为大肠杆菌细胞、农杆菌细胞、酵母细胞、烟草细胞、丹参细胞、丹参发根细胞。6.丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因应用于制备转基因丹参植株。7.丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因应用于制备转基因丹参发根系。全文摘要本发明公开了一种丹参3-羟基-3-甲基戊二酰辅酶A还原酶基因及其编码的蛋白质与用途,填补了从我国传统名贵中药材丹参中分离克隆出3-羟基-3-甲基戊二酰辅酶A还原酶基因的空白。本发明所提供的3-羟基-3-甲基戊二酰辅酶A还原酶基因具有SEQIDNo.1所示的核苷酸序列或者添加、取代、插入或缺失一个或多个核苷酸的同源序列或其等位基因及其衍生的核苷酸序列。所述基因编码的蛋白质具有SEQIDNo.2所示的氨基酸序列或者添加、取代、插入或缺失一个或多个氨基酸的同源序列。本发明提供的3-羟基-3-甲基戊二酰辅酶A还原酶基因可以通过基因工程技术提高丹参中萜类活性成分丹参酮的含量,可用于利用转基因技术来提高丹参酮含量的研究和产业化中,有助于丹参药材的品质改良,具有很好的应用前景。文档编号C12N15/53GK101250544SQ20081003572公开日2008年8月27日申请日期2008年4月8日优先权日2008年4月8日发明者伟周,周根余,攀廖,开国银,董彦君申请人:上海师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1