丹参1-脱氧木酮糖-5-磷酸合成酶Ⅱ基因及其编码的蛋白质和应用的制作方法

文档序号：537718阅读：371来源：国知局

专利名称：丹参1-脱氧木酮糖-5-磷酸合成酶Ⅱ基因及其编码的蛋白质和应用的制作方法
技术领域：
本发明属于生物技术领域，具体说，是涉及在丹参中表达的l-脱氧木酮糖-5-磷酸合成酶 II基因及其编码的蛋白质和应用。
背景技术：
丹参(Sa/Waw说/wrfe'zaBunge)是我国的一种传统中药材。现代药理研究表明:丹参对心血管系统和血液系统的作用十分显著。以丹参为主的多种复方制剂如复方丹参注射液、复方丹参片、复方丹参胶囊和复方丹参滴丸(1997年向美国FDA以治疗药身份申报的品种)等已被广泛用于临床治疗心血管疾病、肾病、肝病及抗感染等。但是，由于丹参生长周期较长 (2年以上)，在传统的栽培模式下，面临着品质严重退化、生产成本相对过高等诸多弊端；离体条件下产生的丹参组培苗，其药用活性成分的含量还远达不到商业化开发利用的要求。所以，利用现代基因工程手段将丹参药用活性成分生物合成途径中的关键酶基因导入到丹参中，获得转基因的发根、细胞系或再生植株，并进行大规模的培养，是提高丹参中丹参酮的含量和解决丹参药源问题的最佳途径之一。
l-脱氧木酮糖-5-磷酸合成酶II ( Deoxyoxylulose-5-phosphate synthase, DXS )是MEP途径中的一个关键性的限速酶，能以丙酮酸和3-磷酸甘油醛为前体，在焦磷酸硫胺素存在的情况下，生成5-磷酸脱氧木酮糖(l-deoxy-D-xylulose 5-phosphate) (DXP)，随后在DXP还原异构酶(DXP reductoisomerase)(DXR )的作用下通过分子内重排和还原反应生成2C-甲基4-磷酸 -40-赤藓(2(:-11^1^1-0-617111^01-4卞1103口113&, MEP)。 MEP再经过磷酸化和环化作用生成2-甲基赤藓糖醇2， 4环化焦磷酸，再经过一系列衍变生成IPP，从而为丹参酮的合成提供前体。由于提高l-脱氧木酮糖-5-磷酸合成酶II的活性或者含量，可以直接提高丹参中丹参酮的含量，因此，这一步是利用基因工程技术来提高丹参酮合成的重要切入点。但至今尚未有从药物植物丹参中分离克隆出l-脱氧木酮糖-5-磷酸合成酶II基因的文献报道。

发明内容
本发明所要解决的技术问题是提供一种丹参l-脱氧木酮糖-5-磷酸合成酶II基因及其编码的蛋白质和应用，以填补从我国药物植物丹参中分离克隆出l-脱氧木酮糖-5-磷酸合成酶II基因的空白。
本发明所提供的丹参l-脱氧木酮糖-5-磷酸合成酶II基因，是具有SEQIDNo.l所示的核苦酸序列或者添加、取代、插入或缺失一个或多个核苷酸的同源序列或其等位基因及其衍生的核苷酸序列。
本发明所提供的丹参l-脱氧木酮糖-5-磷酸合成酶II基因编码的蛋白质，是具有SEQ ID No.2所示的氨基酸序列或者添加、取代、插入或缺失一个或多个氨基酸的同源序列。
含有本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II基因全序列或部分片段的质粒和植物表达载体均属于本发明的保护范围。
一种宿主细胞，该细胞含有本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II基因或质粒或植物表达载体的基因序列。
所述宿主细胞为大肠杆菌细胞、农杆菌细胞、酵母细胞、烟草细胞、丹参发根细胞、丹参细胞或其它植物细胞，优选大肠杆菌细胞或农杆菌细胞或丹参发根细胞。
本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II基因的应用，包括用所述的植物表达载体转化丹参细胞或者用所述的农杆菌与丹参细胞共培养或者用所述的丹参发根细胞培育雄性不育植株或者用所述的l-脱氧木酮糖-5-磷酸合成酶II基因序列提供一种转基因丹参。
本发明技术方案中涉及的概念具体内容如下
本发明所说的丹参l-脱氧木酮糖-5-磷酸合成酶II基因的DNA分子包括编码具有丹参 l-脱氧木酮糖-5-磷酸合成酶II活性的多肽的核苷酸序列，而且所述的核苷酸序列与SEQ ID NO. 1中从核苷酸第100~2274位的核苷酸序列有至少70%的同源性；或者所述的核苷酸序列能在40 ~ 55 °C条件下与SEQ ID NO. 1中从核苷酸第100 ~ 2274的核苷酸序列杂交。较佳地，所述的序列编码具有SEQIDN0.2所示的氨基酸序列的多肽。更佳地，所述的序列具有SEQ ID NO. 1中从核苷酸第100 ~ 2274位的核苦酸序列。
本发明分离出的丹参l-脱氧木酮糖-5-磷酸合成酶II多肽包括具有SEQ IDNO. 2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段，或其活性衍生物。较佳地，该多肽是具有SEQIDN0.2序列的多肽。
本发明中的DNA分子包含所述的DNA分子中8 ~ 100个连续核苷酸。
在本发明中，"分离的"、"纯化的"DNA是指该DNA或片段已从天然状态下位于其两侧的序列中分离出来，或指该DNA或片段已经与天然状态下伴随核酸的组分分开，而且已经与在细胞中伴随其的蛋白质分开。
本发明中术语"丹参1-脱氧木酮糖-5-磷酸合成酶11 (或多肽)基因"是指编码具有丹参 l-脱氧木酮糖-5-磷酸合成酶II活性的多肽的核苷酸序列，如SEQIDNO. 1中第100~2274位核苷酸序列及其简并序列。该简并序列是指位于SEQ ID NO. 1序列的编码框第100~2274位核苷酸中，有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性，所以与SEQ ID NO. 1中第100-2274位核苷酸序列同源性低至约70°/。的简并序列也能编码出SEQIDN0.2所述的序列。还包括能在中度严谨条件下，更佳的在高度严谨条件下与SEQ ID NO. 1中从核苷酸第100 2274位的核苷酸序列杂交的核苷酸序列。还包括与SEQ ID NO. 1中从核苷酸第100 2274位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核*酸序列。还包括能编码具有与天然的丹参 l-脱氧木酮糖-5-磷酸合成酶II相同功能的蛋白的SEQ ID NO. 1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个，较佳地l-60个，更佳地1~ 20个，最佳地1 ~ IO个)核苦酸的缺失、插入和/或取代，以及在5'和/或3'端添加数个(通常为 60个以内，较佳地为30个以内，更佳地为IO个以内，最佳地为5个以内)核苷酸。
本发明中术语"丹参l-脱氧木酮糖-5-磷酸合成酶II蛋白或多肽"是指具有丹参l-脱氧木酮糖-5-磷酸合成酶II活性的SEQ ID NO. 2序列的多肽。该术语还包括具有与天然丹参1-脱氧木酮糖-5-磷酸合成酶II相同功能的SEQ ID N0.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1~50个，较佳地1 30个，更佳地1 20个，最佳地1 ~ 10个) 氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加一个或数个(通常为20个以内，较佳地为IO个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括丹参l-脱氧木酮糖-5-磷酸合成酶II的活性片段和活性衍生物，还包括能够可搡作地连于信号肽、启动子或者核糖体结合位点序列所组成的衍生物。
本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨条件下能与丹参1-脱氧木酮糖-5-磷酸合成酶IIDNA杂交的DNA所编码的蛋白、以及利用丹参l-脱氧木酮糖-5-磷酸合成酶II多肽的血清获得的多肽或蛋白。
本发明中丹参l-脱氧木酮糖-5-磷酸合成酶II保守性变异多肽是指与SEQ ID NO. 2的氨基酸序列相比，有至多10个，较佳地至多8个，更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1.保守性变异多肽中的取代残基
最初的残基代表性的取代优选的取代
Ala (A)Val; Leu; HeValArg(R)Lys; Gin; AsnLys
Asn (N)Gin; His; Lys; ArgGin
Asp (D)GluGlu
Cys (C)SerSer
Gln(Q)AsnAsn
Glu (E)AspAsp
Gly(G)Pro;AlaAla
His (H)Asn; Gin; Lys; ArgArg
He (I)Leu; Val; Met; Ala; PheLeu
Leu (L)lie; Val; Met; Ala; Phelie
Lys (K)Arg; Gin; AsnArg
Met (M)Leu; Phe; lieLeu
Phe(F)Leu; Val; lie; Ala; TyrLeu
Pro (P)AlaAla
Ser (S)ThrThr
Thr(T)SerSer
Trp(W)Tyr; PheTyr
Tyr(Y)Trp; Phe; Thr; SerPhe
Val (V)lie; Leu; Met; Phe; AlaLeu
本发明还包括丹参l-脱氧木酮糖-5-磷酸合成酶II或多肽的类似物。这些类似物与天然l-脱氧木酮糖-5-磷酸合成酶II多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸(如P 、 Y-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。所述修饰(通常不改变一级结构)形式包括-.体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化，如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露
于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸，磷酸丝氨酸，磷酸苏氨酸)的序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。
6在本发明中，可选用本领域已知的各种载体，如巿售的载体，包括质粒，粘粒等。在生产本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II多肽时，可以将丹参l-脱氧木酮糖-5-磷酸合成酶II基因的核苷酸序列可操作地连于表达调控序列，从而形成丹参l-脱氧木酮糖-5-磷酸合成酶II表达载体。所述"可操作地连于"指这样一种状况，即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如，如果信号肽DNA作为前体表达并参与多肽的分泌，那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录，那么它是可操作地连于编码序列；如果核糖体结合位点被置于能使其翻译的位置时，那么它是可搡作地连于编码序列。一般，"可搡作地连于"意味着相邻，而对于分泌前导序列则意味着在阅读框中相邻。
本发明中宿主细胞为原核细胞或者真核细胞。常用的原核宿主细胞包括大肠杆菌；常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。
本发明还可用Northern印迹法技术分析丹参l-脱氧木酮糖-5-磷酸合成酶II基因产物的表达，即分析丹参l-脱氧木酮糖-5-磷酸合成酶II的RNA转录物在细胞中的存在和数量。
此外，本发明中可用作探针的核酸分子通常具有丹参l-脱氧木酮糖-5-磷酸合成酶II核苷酸编码序列的8-100个连续核苷酸，较佳地具有15-50个连续核苦酸。该探针可用于检测样品中是否存在编码丹参l-脱氧木酮糖-5-磷酸合成酶II的核酸分子。
本发明涉及检测样品中是否存在丹参l-脱氧木酮糖-5-磷酸合成酶II核苷酸序列的方法，它包括用上述的探针与样品进行杂交，然后检测探针是否发生了结合。较佳地，该样品是PCR 扩增后的产物，其中PCR扩增引物对应于丹参l-脱氧木酮糖-5-磷酸合成酶II核苷酸编码序列，并可位于该编码序列的两侧或中间。引物长度一般为15~50个核苷酸。此外，根据本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II核苷酸序列和氨基酸序列，可以在核酸同源性或表达蛋白质的同源性基础上，筛选丹参l-脱氧木酮糖-5-磷酸合成酶II源基因或同源蛋白。
为了得到与丹参l-脱氧木酮糖-5-磷酸合成酶II相关的丹参cDNAs的点阵，可以用DNA 探针筛选丹参cDNA文库，这些探针是在低严谨条件下，用32P对丹参l-脱氧木酮糖-5-磷酸合成酶II基因的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自丹参的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外，许多这样的cDNA文库也可以购买到，例如购自Clontech, Stratagene, Palo Alto, Cal.。这种筛选方法可以识别与丹参l-脱氧木酮糖-5-磷酸合成酶II的基因家族的核苷酸序列。
本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II核苷酸全长序列或其片段通常可以用PCR 扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据本发明所公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用巿售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外，还可通过化学合成将突变引入本发明蛋白序列中。除了用重组法产生之外，本发明蛋白的片段还可用固相技术，通过直接合成肽而加以生产(Stewart等人，(1969) Solid-Phase Peptide Synthesis, WH Freeman Co., San Francisco; Merrifield J. (1963) J. Am Chem. Soc 85: 2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如，可以用Applied Biosystems的431A型肽合成仪(Foster City, CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段，然后用化学方法加以连接以产生全长的分子。利用本发明的丹参1-脱氧木酮糖-5-磷酸合成酶11，通过各种常规筛选方法，可筛选出与丹参l-脱氧木酮糖-5-磷酸合成酶II发生相互作用的物质，或者受体、抑制剂或拮剂等。
本发明提供的l-脱氧木酮糖-5-磷酸合成酶II基因是首次从丹参中克隆制备的，可以通过基因工程技术来提高丹参等植物中丹参酮的含量，转基因结果显示，丹参l-脱氧木酮糖-5-磷酸合成酶il基因对促进丹参酮含量的提高有明显作用。
具体实施例方式
下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。
下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Sambrook等分子克隆实验室手册(New York: Cold Spring Harbor Laboratory Press, 1989)中所述的条件，或按照制造厂商所建议的条件。
实施例1(丹参1-脱氧木酮糖-5-磷酸合成酶11基因的克隆)
1. 组织分离(isolation)
丹参植株来源于四川，采取幼嫩根后立即置于液氮中冷冻保存。
2. RNA的分离(RNA isolation)
取部分组织用研钵研碎，加入盛有裂解液的1.5mL EP管，充分振荡后，再移入玻璃句浆器内。勾浆后移至1.5mLEP管中，抽提总RNA(TRIzolReagents, GIBCOBRL, USA)。用甲醛变性胶电泳鉴定总RNA质量，然后在分光光度计上测定RNA含量。
3. 基因的全长克隆(Cloning of Full-length cDNA)
根据金鱼草，薄荷等DXS基因氨基酸保守序列，设计简并引物，利用同源性基因克隆
8原理，采用Smart-RACE方法(Clonetech试剂盒)进行cDNA全长克隆，分三个阶段进行
(1) 5'-RACE
PCR (UPM+R2)得到DXS2R2'(554bp),回收，连接到T-Easy载体上，用SP6或T7作为通用引物，釆用终止物荧光标记(Big-Dye, Perkin-Elmer, USA)的方法，在ABI377测序仪 (Perkin-Elmer, USA)上进行测序。测序结果用GCG软件包(Wisconsin group, USA)中的BLAST 和FASTA软件搜索已有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知1-脱氧木酮糖-5-磷酸合成酶II(如薄荷l-脱氧木酮糖-5-磷酸合成酶II等)的同源性很高，故初步认为它是一个1-脱氧木酮糖-5-磷酸合成酶II基因。
(2) 3'RACE
根据5'RACE结果，设计正向特异引物F2，经PCR(UPM+F2)得到DXS2F2' (2098bp)(过程同(l))。回收，连接到T-Easy载体上，用SP6或T7作为通用引物，采用终止物荧光标记 (Big-Dye, Perkin-Elmer, USA)的方法，在ABI377测序仪(Perkin-Elmer, USA)上进行测序。
(3)将5'RACE测序结果与3'RACE测序结果比序并进行拼接，得到全长片段序列信息，并设计一对特异引物进行PCR扩增l-脱氧木酮糖-5-磷酸合成酶II编码区 (DXS2KF1+DXS2KR1)得到DXS2编码区(2175bp)(过程同步骤(l))。
BLAST的结果证明从丹参中新得到的基因确为l-脱氧木酮糖-5-磷酸合成酶II基因。
通过组合使用上述3种方法，获得了候选的丹参DXS2蛋白的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上，进一步设计引物 DXS2F1:5'-AGCACACACAACTTGAAACAACT陽3'(SEQ ID N0.3)为正向引物，寡核苷酸 DXS2R1: 5'-GGGACAAATAAATTTATTTAATA-3'(SEQ ID N0.4)为反向引物，以总RNA为模板，进行RT-PCR扩增，Fl/R2的PCR条件为94°C 5分钟，随之以94°C 1分钟、60°C l分钟和72°C 3分钟进行35个循环，最后以72匸延伸10分钟。电泳检测PCR扩增产物，获得扩增片段长度为2522bp。然后按常规方法以PCR扩增产物进行克隆、测序，获得SEQIDNO. l所示的序列。
实施例2 (丹参1-脱氧木酮糖-5-磷酸合成酶11的序列信息与同源性分析) 本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II全长cDNA的长度为2522bp，详细序列见 SEQ ID NO.l,其中开放读框位于100-2274位核苷酸。根据全长cDNA推导出1-脱氧木酮糖-5-磷酸合成酶II的氨基酸序列，共724个氨基酸残基，分子量78.2KD, pl为6.44,详细序列见SEQIDNO. 2。将丹参l-脱氧木酮糖-5-磷酸合成酶II的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank +EMBL+DDBJ+PDB和Non-redundant GenBank CDS translations +PDB+ SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索，结果发现它与薄荷DXS2基因(GenBank AccessionNo.AF019383)具有83 %的同源性(见表2);在氨基酸水平上，它与薄荷DXS2(GenBank AccessionNo.AAC33513 )的第1 ~ 724位氨基酸残基有88%的相同性和93%的相似性(见表3)。由上可见，丹参l-脱氧木酮糖-5-磷酸合成酶II与薄荷l-脱氧木酮糖-5-磷酸合成酶II无论从核酸还是蛋白水平上都存在较高的同源性。故可认为丹参l-脱氧木酮糖-5-磷酸合成酶II在提高资源植物中丹参酮的含量上具有促进作用。表2.本发明的丹参DXS2与薄荷(Menthapiperita) DXS2的核苷酸序列的同源比较(GAP)Query 96 AGAGATGGCGTCGTCTTGTGGAGTTATCAACAGCAGTTTCTTGCCATTGCTCCATTCTGA 155
Sbjct 81 AGAGATGGCATCTTCCTGTGGAGTTATCAAGAGCAGTTTCTTGCCATCGCTCCATTCTGA 140
Query 156 GMTTCATCMGCC-TCTTATCTCGCACTACTGCTACTCTTCCCC-C磁MAGCATAAG 213
Sbjct 141 GGATTC-T--A-CCTTCTTATCACGTGCTCCTACTTCTCTTCCCCTC-AAMATCATAAG 195
Query 214 TTCTCCGTGGTAGCAGCTCTTCAACAGGATMCACCMCGACGTGGCTGCC—AATGGAGA 272
Sbjct 196 TTAAATGTGGTAGCAGCTCTCCAACAAGATAGTTCGMCGACGTCG-TTCCTAGCGGAGA 254Query 273GAGTCTGACG-AGGCAGAMACAAGAGCTCTCMTTTCACCGGAGACMGCCTCCMCTC 331
Sbjct 255 CAGGCTGA-GCCGGCCGMATCAAGAGCACTGAGTTTCiVCCGGAGAGAAGCCTCCCATTC 313
Query 332 CMTATTGGACACCATCAACTATCCAAATCACATGMAMCCTCTCGGTCGAGGMCT-G 390
Sbjct 314 CTATACTGGACACCATCAACTACCCTAATCACATGAAAAATCTTTCCGTCGAGGAACTCG 373
Query 391 GAGGGA—TTGGCTGATGAATTGAGGGAAGAGATAGTGTACACGGTGTCGAAAACCGGCGG 449
Sbjct 374 CA—AACCTAGCTGATGMCTGAGGGAAGAGATAGTGTACACGGTGTCGAAAACCGGCGG 431
Query 450 CCAT-TTMGCTCAAGCTTAGGTGTATCGGAGCTCACGGTCGCA-TTGCATCATGTGTTC 507
Sbjct 432 CCATCTTA-GCTCGAGCCTAGGCGTGTCGGAGCTCACCGTCGCACTT-CATCACGTTTTC 489
Query 508 AACACACCTGAGGATAAGATAATTTGGGACGTTGGCCATCAGGCTTATCCGCACG磁TC 567
Sbjct 490 AACACGCCCGATGACAMATCATCTGGGACGTCGGCCACCAGGCTTACCCACACAAAATC 549Query 568CTGACGGGGAGGAG-GTCCAGAATGCACACGATTCGGCAGAC-TTTCGGACTAGCAGGGT 625Sbjct 550 TTGACCGGGAGAAGAG-CGAGMTGCACACMTTAGGCAGACATn'-GGATTAGCAGGTT 607 Query 626TCCCTAA-ACGAGACGMAGCGCCCACGACGCGTTCGGAGCCGGCCACAGCTCCACTAGT 684
Sbjct 608 TCCCTAAGA-GAGATCAAAGTGCTCACGATGCCTTCGGCGCCGGCCATAGTTCTACCAGT 666 Query 685ATCTCTGCTGGTCTAGGCATGGCGGTGGGGAGAGACTTATTACACAAGAACAACCATGTG 744
Sbjct 667 ATTTCTGCTGGTTTAGGGATGGCGGTGGCGAGAGATTTACTGCAGAAGAACAACCACGTC 726 Query 745ATATCAGTGATCGGAGACGGCGCCATGACAGCAGGGCAGGCGTACGAGGCCCTCAACAAT 804
Sbjct 727 ATATCGGTGATCGGCGACGGCGCCATGACAGCTGGACAAGCGTACGAGGCCTTAAACAAC 786 Query 805GCAGGATTCCTTGATTCCAATCTCATCATCGTGTTGMTGACAACAAGCAGGTCTCGCTG 864
Sbjct 787 GCCGGATTCCTCGATTCGMTCTCATMTCGTTTTAMCGACAACAAGCAGGTGTCTCTA 846 Query 865CCCACGGCCACCATTGACGGCCCTGCTCCGCCCGTGGGAGCCCTCAGCAAAGCCCTCACG 924
Sbjct 847 CCCACGGCCACCGTCGACGGCCCTGCGCCGCCGGTCGGAGCTCTGAGCAMGCCCTGAC- 905 Query 925C—GTCTTCMGCCAGCAGAAMTTCCGGCMCTCCGCGMGCAGCAMGGGCATGACTA 982
Sbjct 906 CMG-CTGCMGCCAGCAGAMATTCCGGCAGCTCCGCGMGCAGCAAAGAGTATGACTA 964 Query 983GGCAGATGGGAG-AGCAGGCCCATGAAATCGCATCCAAGGTTGACACC-TACATGMGGG 1040
Sbjct 965 AGCAGATGGGAGCACC-GGCACATGAAATAGCTTCGMG-TTGACACMTACGTGMAGG 1022 Query 1041 GATGATGGGGMGCCCGGCGCGTCCCTCTTCGAGGAGCTCGGGATTTACTACATCGGCCC 1100
Sbjct 1023 GATGATGGGGAAACCAGGCGCTTCACTTTTCGAAGMCTGGGGATTTATTACATCGGACC 1082
Query 1101 CGTTGACGGCCACMCGTTGAAGATCCGGTCTACATTTTCAAGAAGGTTMAGAAATGCC 1160
ii mhiiii immiiiHi ii ii mmimi mil iimm
Sbjct 1083 AGTCGACGGCCATAACGTTGMGATCTTGTTTATATTTTCAAGAAAGTTAAGGAAATGCC 1142
Query 1161 TGCGCCTGGGCCTGTCCTTATCCACATCATCACCGAGAAGGGCAAAGGCTACTCTCCC-G 1219Sbjct 1143 TGCGCCTGGGCCTGTTCTTATTCATATCATCACCGAMAAGGCAMGGCTACCC-CCCTG 1201 Query 1220 CTGAAGTTGCTGCCGACAAGATGCATGGTGTCGTCAAGTTTGATCCTACAACCGGCAAAC 1279
Sbjct 1202 CAGAMTTGCTGCCGACAAAATGCATGGGGTGGTGAAGTTTGATGCGMAACTGGGAAAC 1261 Query 1280 AGCTCAAGTCCAA—AACCMTACTAAATCATACACTCAATACTTCGCCGAGTCTCTCGTG 1338
Sbjct 1262 AGATGAAGACGAAGAAC-MGACGMGTCATACACCCAGTACTTCGCCGAGTCTCTGGTG 1320 Query 1339 GCCGMGCAGAGCACGACGACAGGATCGTCGCCATCCACGCCGCCATGGGGGGCGGCAC- 1397
Sbjct 1321 GCGGAGGCGGAGCACGACGACMGATCGTGGCGATCCACGCCGCCATGGGGGGCGGCACC 1380 Query 1398 GGGCCTCMC—TACTTCCAGAAGC—GCTTCCCCGACCGCTGCTTCGACGTGGGGATCGCC 1455
Sbjct 1381 GGGC-TCMCAT-CTTCCAGAAGCAG-TTCCCGGACCGGTGCTTCGACGTCGGGATCGCG 1437 Query 1456 GAGCAGCACGCCGTCACTTTCGCGGCGGGGCTCGCCACGGAGGGGCTCMGCCCTTCTGC 1515
Sbjct 1438 GAGCAGCACGCGGTGACGTTCGCCGCCGGTATGGCGGCGGAGGGGCTGAAGCCTTTCTGC 1497 Query 1516 ACGATCTACTCCTCGTTCCTGCAGAGGGGGTACGATCAGGTGGTCCACGACGTGGACCTT 1575
Sbjct 1498 GCCATCTACTCCTCCTTCCTCCAGAGGGGCTACGACCAGGTGGTCCACGACGTCGACCTC 1557 Query 1576 CAGAAGCTCCCCGTGAGGTTCATGATGGACCGGGCTGGCGTCGTGGGCGCCGACGGCCCC 1635
Sbjct 1558 CAGMGCTCCCGGTCCGGTTCATGATGGATCGGGCAGGAGTCGTCGGCGCCGACGGCCCC 1617 Query 1636 ACCCACTGCGGCGCCTTCGACACCACCTACATGGCCTGCCTGCCCAACATGTTCGTCATG 1695
Sbjct 1618 ACCCACTGCGGCGCCTTCGACACCACCTACATGGCCTGCCTCCCCAACATGGTGGTCATG 1677 Query 1696 GC-CTCTTCCGAC-AAGCTCGATCTCATGCACATGATTGCCACCGCTGCCGCCATTGACG 1753
Sbjct 1678 GCTCCCT-CCGACGAAGCG-GAGCTCATGAACATGATCGCCACCGCCGCCATCATCGACG 1735 Query 1754 ACCG-CCTTAGCTGCGTTATATACCC-AGAGGGAACG-CGTCG-CG-CGCCTCTGCCGCC 1808
Sbjct 1736 ACCGACCT-AGCTGCGTCCGGTACCCTAGAGGGAACGGCATCGGCGTCGC-TCTTCCGTC 1793Query 1809 TMCMCAAAGGAACTCCTTTGGAGATTGGGAAGGGMGGATTTTAAAAGAGGGGAGTAG 1868
Sbjct 1794 GAACMCAAAGGAACTCCATTAGAGATTGGTAAGGGAAGAATCTTGAAGGAGGGGAGCAA 1853 Query 1869 AGTTGCC/VTTCTAGGG-TTCGGAACTATAGTGCAGAACTGTTTGGCGGCGGCGCAGCTTC 1927
Sbjct 1854 AGTTGCGATTCT-GGGATTCGGAACCATAGTGCAGAACTGCATGGCGGCGGCGAATCTTC 1912 Query 1928 TTC-AGGMCACGGCATCTCCGTGACCGTAGCTGATGCGAGATTCTGCAAGCCTCTGGAT 1986
Sbjct 1913 T-CGMCMCACGGAATCTCAGTAACAGTAGCCGATGCAAGATTCTGCAAGCCACTCGAT 1971 Query 1987 GGAGATCTGATCAAGAAGCTGGTGCAGGAGCATGAAGTTCTCATCACTGTTGAAGAGGGA 2046
Sbjct 1972 GGGGATTTCATAMGAAACTGGTGCAGGAGCATGAAGTACTCATCACTGTTGAAGMGGA 2031 Query 2047 TCTATTGGTGGATTCAGCGCCCATATTTCTCATTTCTTATCCCTCAACGGACT-GCTCGA 2105
Sbjct 2032 TCCATCGGTGGATTCAGTGCTCACATTTCTCATTTCTTGTCCCTCAATGG-CTTGCTCGA 2090 Query 2106 CGGGMCCTTAAGTGGAGGCCAATGGTGCTCCCCGACAGATACATTGATCATGGAGCACA 2165
Sbjct 2091 TGGAMCCTCAAGTGGAGGCCMTGGTTCTTCCAGATAGGTACATTGATCATGGAGCACA 2150 Query 2166 GACTGATCAMTTGAAGAAGCTGGGCTGAGCCCCAAGCACATCGCAGGGACTGTTGTGTC 2225
Sbjct 2151 GAGTGATCAMTAGAAGAAGCAGGGCTGAGTCCTAAGCATATTGCAGGGACTGTTGTTTC 2210 Query 2226 ACTT-ATTGGTGGGGGMAAGACAGTCTTCATCTCATCAACMCTTGTAATCTTACTTT 2283
Sbjct 2211 A-TTGATTGGAGGAGGMAGGACAGTCTTCATTTGATTMTMTTTGTAATATTATTTT 2268
其中Query表示丹参DXS2的核酸序列；Subject表示薄荷DXS2的核酸序列(GenBank AccessionNo.AFO 19383 )。比较结果显示在2522个核苷酸的比对中两者有83。/。的相似性。表3.本发明的丹参l-脱氧木酮糖-5-磷酸合成酶II与薄荷l-脱氧木酮糖-5-磷酸合成酶II氨基酸
序列的同源比较(FASTA) Query 1 MASSCGVINSSFLPLLHSENSSSLLSRTTATLPPKKHKFSVVMLQQDNTNDVAANGESL 60
MASSCGVI SSFLP LHSE+S+ LSR+LP K HK +VVMLQQD++NDV +G+ L Sbjct 1 MASSCGVIKSSFLPSLHSEDST-FLSRAPTSLPLKNHKLNVVMLQQDSSNDWPSGDRL 59
13Query 61TRQKTRALNFTGDKPPTPILDTINYPNHMKNLSVEELEGLADELREEIVYTVSKTGGHLS 120
+R K+RAL+FTG+KPP PILDTINYPNHMKNLSVEEL LADELREEIVYTVSKTGGHLS
Sbjct 60SRPKSRALSFTGEKPPIPILDTINYPNHMKNLSVEELANLADELREEIVYTVSKTGGHLS 119
Query 121 SSLGVSELTVAL丽FNTPEDKIIWDVGHQAYraEILTGRRSRMHTIRQTFGLAGFPKRD 180
SSLGVSELTVALHHVFNTP+DKIIWDVGHQAYra+ILTGRR+RMHTIRQTFGLAGFPKRD
Sbjct 120 SSLGVSELTVALHHVFNTPDDKIIWDVGHQAYPHKILTGRRARMHTIRQTFGLAGFPKRD 179
Query 181 ESAHMFGAGHSSTSISAGLGMAVGRDLLHKNNHVISVIGDGAMTAGQAYEALNNAGFLD 240
ESAHDAFGAGHSSTSISAGLGMAV RDLL KNNHVISVIGDGAMTAGQAYEALNNAGFLD
Sbjct 180 ESAHDAFGAGHSSTSISAGLGMAVARDLLQKNNHVISVIGDGAMTAGQAYEALNNAGFLD 239
Query 241 SNLIIVLNDNKQVSLPTATIDGPAPPVGALSKALTRLQASRKFRQLREMKGMTRQMGEQ 300
SNLIIVLNDNKQVSLPTAT+DGPAPPVGALSKALT+LQASRKFRQLREMK MT+QMG
Sbjct 240 SNLIIVL腦KQVSLPTATVDGPAPPVGALSKALTKLQASRK卿LRE認SMTKQMGAP 299
Query 301 AHEIASKVDTYMKGMMGKPGASLFEELGIYYIGPVDGHNVEDPVYIFKKVKEMPAPGPVL 360
AHEIASK+ Y+KGMMGKPGASLFEELGIYYIGPVDGHNVED VYIFKKVKEMPAPGPVL
Sbjct 300 AHEIASKLTQYVKGMMGKPGASLFEELGIYYIGPVDGHNVEDLVYIFKKVKEMPAPGPVL 359
Query 361 IHIITEKGKGYSPAEVAADKMHGVVKFDPTTGKQLKSKTNTKSYTQYFAESLVAEAEHDD 420
皿ITEKGKGY PAE+AADKMHGVVKFD TGKQ+K+K TKSYTQYFAESLVAEAEHDD
Sbjct 360 IHIITEKGKGYPPAEIMDKMHGVVKFDAKTGKQMKTKNKTKSYTQYFAESLVAEAEHDD 419
Query 421 RIVA皿AMGGGTGLNYFQKRFPDRCFDVGIAEQHAVTFMGLATEGLKPFCTIYSSFLQ 480
+IVAIHAAMGGGTGLN FQK+FPDRCFDVGIAEQHAVTFAAG+A EGLKPFC IYSSFLQ
Sbjct 420 KIVAIHAAMGGGTGLNIFQKQFPDRCFDVGIAEQHAVTFAAGMAAEGLKPFCAIYSSFLQ 479
Query 481 RGYDQ兩DVDLQKLPVRF,RAGVVGADGPTHCGAFDTTYMCLPNMFVMASSDKLDL 540
RGYDQVVH扁LQKLPVR丽DRAGVVGADGPTHCGAFDTT靈CLPNM VMA SD+ +L
Sbjct 480 RGY歸V丽DLQKLPVR歷DRAGVVGADGPTHCGAFDTTYMACLPNMV丽PSDEAEL 539
Query 541 MHMIATAMIDDRLSCVIYPEGTR-麼LPPNNKGTPLEIGKGRILKEGSRVAILGFGTI 599
M+MIATAA IDDR SCV YP G LP NNKGTPLEIGKGRILKEGS+VAILGFGTI
Sbjct 540 MNMIATAAIIDDRPSCVRYPRGNGIGVALPSNNKGTPLEIGKGRILKEGSKVAILGFGTI 599
Query 600 VQNCLMAQLLQEHGISVTVADARFCKPLDGDLIKKLVQEHEVLITVEEGSIGGFSAHIS 659
VQNC+MA LL++HGISVTVADARFCKPLDGDLIKKLVQEHEVLITVEEGSIGGFSAHIS
Sbjct 600 VQNCMMANLLEQHGISVTVADARFCKPLDGDLIKKLVQEHEVLITVEEGSIGGFSAHIS 659
Query 660 HFLSLNGLLDGNLKWRPMVLPDRYIDHGAQTDQIEEAGLSPKHIAGTVVSLIGGGKDSLH 719HFLSLNGLLDGNLKWRPMVLPDRYIDHGAQ+DQIEEAGLSPKIIIAGTVVSLIGGGKDSLH Sbjct 660 HFLSLNGLLDGNLKWRPMVLPDRYIDHGAQSDQIEEAGLSPKHIAGTVVSLIGGGKDSLH 719 Query 720 LINNL 724
LI丽L
Sbjct 720 L丄NNL 724
其中Query表示丹参DXS2的氨基酸序列；Subject表示薄荷DXS2的氨基酸序列 (GenBankAccessionNo.AAC33513 );相同的氨基酸在两个序列之间用氨基酸单字符标出。比较结果显示在724个氨基酸的比对中，两者分别有88%的相同性和93%的相似性。
实施例3 (丹参l-脱氧木酮糖-5-磷酸合成酶II或多肽在大肠杆菌中进行原核表达及提
纯)
在该实施例中，将全长的丹参i-脱氧木酮糖-5-磷酸合成酶n基因编码序列或片段构建入商品化的蛋白质融合表达载体之中，以表达和提纯重组蛋白。
1、原核表达载体的构建以及转化大肠杆菌
根据丹参DXS2的核苷酸序列，设计扩增出蛋白编码区的引物，并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定)，以便构建表达载体。以实施例1中获得的扩增产物为模板，经PCR扩增后，将丹参DXS2基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-DXS2表达载体的工程菌BL21-pET32a(+)-DXS2。
2、表达Trx-DXS2重组蛋白的工程菌的分离鉴定
挑取单菌落的BL21- pET32a(+)-DXS2工程菌于3mL含lOOpg/mL氨节青霉素的LB培养基中振摇培养过夜，按1: 100的浓度吸取培养液于新的LB培养基(含100昭/mL氨节青霉素) 中培养约3小时，至OD6o。达0.5后，加入IPTG至终浓度lmmol/L继续于37°C分别培养0, 1, 2, 3小时。取培养时间不同的lmL菌液离心，在细菌沉淀物中加入裂解液(2xSDS上样缓冲液50jxL,蒸馏水45)aL, 二巯基乙醇5^L),混悬细菌沉淀，沸水洛中煮5分钟，10000rpm 离心1分钟，上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG 诱导时间增加而增加的菌株即为表达Trx-DXS2融合蛋白的工程菌。 3、 Trx-DXS2融合蛋白的提取纯化
按上述方法诱导表达Trx-DXS2融合表达蛋白的工程菌BL21-pET32a(+)-DXS2，经离心沉淀收集菌体，并根据厂家(Novagen)的说明书以BugBuster试剂和Benzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mMCAPS, pH 11.0, 0.3。/。N-lauroylsarcosine)来溶解，再用透析缓冲液(200mMTris-HCl， pH 8.5 )来透析。然后用组氨酸结合(His*Bind)树脂进行亲和层析，并经洗脱缓冲液(1M imidazole, 500mMNaCl， 20mM Tris-HCl pH 7.9 )洗脱来收集 Trx- DXS2融合蛋白。融合蛋白经肠激酶2(TC酶切16小时后即可分离获得DXS2的表达蛋白。所获得的表达蛋白分子量为78.2KD， pl为6.4。
实施例4 (丹参l-脱氧木酮糖-5-磷酸合成酶II或多肽在丹参中进行真核细胞表达及转基因发根中丹参酮含量测定)
含目的基因(丹参l-脱氧木酮糖-5-磷酸合成酶II )的表达载体的构建，根据丹参l-脱氧木酮糖-5-磷酸合成酶II的全长序列(SEQ ID NO. 1),设计扩增出完整编码阅读框的引物，并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定)，以便构建表达载体。以实施例1中获得的扩增产物为模板，经PCR扩增后，将丹参l-脱氧木酮糖-5-磷酸合成酶II cDNA反向克隆到双元表达载体(如pBI121 )，将其转入农杆菌中，遗传转化资源植物丹参。利用发根农杆菌Ri质粒介导的丹参的遗传转化过程为
1) 将发根农杆菌C58C1在使用前自冰箱取出，传代2次，传代所用固体培养基为YEB培养基；菌种在使用前接种于YEB液体培养基中，于28'C培养过夜。
2) 取生长8周左右的丹参无菌嫩叶片。
3) 经过夜培养的菌液，用转化液稀释为100个细菌/mL。取无菌丹参叶片，用无菌的解剖刀划以"+"字形伤口，放入上述转化中，于60rpm/min振荡培养8h,取出用无菌水冲洗3 次，放入含250-500mg/L卡那霉素和不同浓度6-BA(0.5mg/L-3mg/L)的B5培养基中，每2 周转移到新鲜培养基中l次，待长出毛状根后分离毛状根，转移至含250-500mg/L卡那霉素无激素的B5培养基中培养，转移4-5次直至无细菌为止，然后再转移至不含卡那霉素的无激素B5培养基中培养。
4) 将在固体培养基中的毛状根的继代培养物，接种于装有100mL无激素B5培养基的 500mL三角瓶中，培养温度、光照、转速等培养条件与愈伤组织液体悬浮培养条件相同，培养20天，将毛状根从培养基上取出放入冷冻干燥机中进行干燥，然后称重，贮存于-7(TC备用。
5) 含丹参l-脱氧木酮糖-5-磷酸合成酶II的转基因发根的丹参酮含量测定
按Ge等(Plant Science, 2005)的方法对表达丹参1-脱氧木酮糖-5-磷酸合成酶11的转基因发根进行丹参酮含量测定。测定结果表明在表达丹参1-脱氧木酮糖-5-磷酸合成酶11的转基因发根中丹参酮含量同非转基因对照组的相比，提高1.9倍(P<0.05)。因此转基因结果证明丹参1-脱氧木酮糖-5-磷酸合成酶11对促进丹参酮含量的提高有明显作用，可应用于丹参的品质改良。
16核苷酸序列表
<110>上海师范大学
<120〉丹参l-脱氧木酮糖-5-磷酸合成酶II基因及其编码的蛋白质和应用 <160> 4
<170> Patentln version 3. 3
<210> 1
<211> 2522
<212> DM
<213> 丹参(Salvia miltiorrhiza ) <220>
<221> CDS
<222> (100).. (2274)
<400> 1
3gcacacaca acttgaaaca actctctagc ctctgtctct ctctcaaaca ttccctgcct 60
gcttcacttc cccttgggcc gagagagaga tacacagag atg gcg tcg tct tgt 114
Met Ala Ser Ser Cys
gga gtt ate aac age agt ttc ttg cca ttg etc cat tct gag aat tea 162 Gly Val lie Asn Ser Ser Phe Leu Pro Leu Leu His Ser Glu Asn Ser
10 15 20
tea age etc tta tct cgc act act get act ctt ccc cca aaa aag cat 210 Ser Ser Leu Leu Ser Arg Thr Thr Ala Thr Leu Pro Pro Lys Lys His
25 30 35
aag ttc tec gtg gta gca get ctt caa cag gat aac acc aac gac gtg 258 Lys Phe Ser Val Val Ala Ala Leu Gin Gin Asp Asn Thr Asn Asp Val
40 45 50
get gcc aat gga gag agt ctg acg agg cag aaa aca aga get etc a" 306
17Ala Ala Asn Gly Glu Ser
55 ttc acc Phe Thr 70
cca aat Pro Asn
gga gac aag Gly Asp Lys
cac His
atg Met
g" gaa Asp Glu
cat tta His Leu
cat gtg His Val 135 cag get Gin Ala 150
acg att Thr lie
age gcc Ser Ala
get ggt Ala Gly
cat gtg His Val
ttg Leu
age Ser 120 ttc Phe
agg Arg 105 tea Ser
aac Asn
aaa Lys 90 gaa Glu
age Ser
aca Thr
tat ccg cac Tyr Pro His
egg Arg
cac His
eta Leu 200 ata lie
cag Gin
gac Asp 185 ggc Gly
tea Ser
cct
Pro
75
aac
Asn
Leu Thr Arg Gin Lys 60
cca act cca ata ttg Pro Thr Pro lie Leu 80
Thr Arg Ala Leu Asn 65
gac acc "c aac Asp Thr lie Asn
etc Leu
gag ata Glu lie
tta ggt Leu Gly
act Thr 170 gcg Ala
atg Met
gtg Val
cct Pro
gaa Glu 155 ttc Phe
ttc Phe
gcg Ala
gag Glu 140 ate lie
gga Gly
gga Gly
gtg Val
tcg Ser
gtg Val
gta Val 125 gat Asp
gtc Val
tac Tyr 110 tcg Ser
aag Lys
gag
Glu
95
acg
Thr
gag Glu
ata lie
ate gga lie Gly
eta Leu
gcc Ala
ggg Gly 205 g￡ic Asp
gca Ala
ggc Gly 190 aga Arg
ggc Gly
ggg Gly 175 cac His
gac Asp
gcc Ala
gaa Glu
ctg Leu
gtg tcg Val Ser
etc acg Leu Thr
ctg acg ggg Leu Thr Gly
att lie
agg Arg 160 ttc Phe
age Ser
tta Leu
gag gga Glu Gly
tgg Trp 145
agg Arg
cct Pro
tec Ser
tta Leu
aaa Lys
gtc Val 130 gac Asp
acc Thr 115 gca Ala
gtt Val
ttg Leu 100 ggc Gly
tec aga Ser Arg
aaa cga Lys Arg
atg aca Met Thr
act Thr
cac His 210 gca Ala
tat Tyr 85 get Ala
ggc Gly
ttg cat Leu His
ggc cat Gly His
agt Ser 195 aag Lys
ggg Gly
atg Met
gac Asp 180 ate lie
cac His 165 gaa Glu
tct Ser
aac aac Asn Asn
cag gcg Gin Ala
354
402
450
498
546
594
642
690
738
786<formula>formula see original document page 19</formula>aca acc ggc aaa cag etc aag tec aaa acc aat act aaa tea tac act 1314
Thr Thr Gly Lys Gin Leu Lys Ser Lys Thr Asn Thr Lys Ser Tyr Thr
390 395 働 405
caa tac ttc gcc gag tct etc gtg gcc gaa gca gag cac gac gac agg 1362
Gin Tyr Phe Ala Glu Ser Leu Val Ala Glu Ala Glu His Asp Asp Arg
410 415 420
ate gtc gcc ate cac gcc gcc atg ggg ggc ggc acg ggc etc aac tac 1410 lie Val Ala lie His Ala Ala Met Gly Gly Gly Thr Gly Leu Asn Tyr
425 430 435
ttc cag aag cgc ttc ccc gac cgc tgc ttc gac gtg ggg ate gcc gag 1458 Phe Gin Lys Arg Phe Pro Asp Arg Cys Phe Asp Val Gly lie Ala Glu
440 445 450
cag cac gcc gtc act ttc gcg gcg ggg etc gcc acg gag ggg etc aag 1506 Gin His Ala Val Thr Phe Ala Ala Gly Leu Ala Thr Glu Gly Leu Lys
455 楊 465
ccc ttc tgc acg ate tac tec teg ttc ctg cag agg ggg tac gat cag 1554 Pro Phe Cys Thr lie Tyr Ser Ser Phe Leu Gin Arg Gly Tyr Asp Gin 470 475 480 485
gtg gtc cac gac gtg gac ctt cag aag etc ccc gtg agg ttc atg atg 1602 Val Val His Asp Val Asp Leu Gin Lys Leu Pro Val Arg Phe Met Met
490 495 500
gac egg get ggc gtc gtg ggc gcc gac ggc ccc acc cac tgc ggc gcc 1650 Asp Arg Ala Gly Val Val Gly Ala Asp Gly Pro Thr His Cys Gly Ala
505 510 515
ttc gac acc acc tac atg gcc tgc ctg ccc aac atg ttc gtc atg gcc 1698 Phe Asp Thr Thr Tyr Met Ala Cys Leu Pro Asn Met Phe Val Met Ala
520 525 530
tct tec gac aag etc gat etc atg cac atg att gcc acc get gcc gcc 1746 Ser Ser Asp Lys Leu Asp Leu Met His Met lie Ala Thr Ala Ala Ala 535 540 545att gac gac cgc ctt age tgc gtt ata tac cca gag gga acg cgt cgc 1794
lie Asp Asp Arg Leu Ser Cys Val lie Tyr Pro Glu Gly Thr Arg Arg
550 555 560 565
gcg cct ctg ccg cct aac aac aaa gga act cct ttg gag att ggg aag 1842
Ala Pro Leu Pro Pro Asn Asn Lys Gly Thr Pro Leu Glu lie Gly Lys
570 575 580
gga agg att tta aaa gag ggg agt aga gtt gcc att eta ggg ttc gga 1890 Gly Arg lie Leu Lys Glu Gly Ser Arg Val Ala lie Leu Gly Phe Gly
585 590 595
act ata gtg cag aac tgt ttg gcg gcg gcg cag ctt ctt cag gaa cac 1938 Thr lie Val Gin Asn Cys Leu Ala Ala Ala Gin Leu Leu Gin Glu His
600 605 610
ggc ate tec gtg acc gta get gat gcg aga ttc tgc aag cct ctg gat 1986 Gly lie Ser Val Thr Val Ala Asp Ala Arg Phe Cys Lys Pro Leu Asp
615 620 625
gga gat ctg ate aag aag ctg gtg cag gag cat gaa gtt etc ate act 2034 Gly Asp Leu lie Lys Lys Leu Val Gin Glu His Glu Val Leu lie Thr 630 635 640 645
gtt gaa gag gga tct att ggt gga ttc age gcc cat att tct cat ttc 2082 Val Glu Glu Gly Ser lie Gly Gly Phe Ser Ala His lie Ser His Phe
650 655 660
tta tec etc aac gga ctg etc gac ggg aac ctt aag tgg agg cca atg 2130 Leu Ser Leu Asn Gly Leu Leu Asp Gly Asn Leu Lys Trp Arg Pro Met
665 670 675
gtg etc ccc gac aga tac att gat cat gga gca cag act gat caa att 2178 Val Leu Pro Asp Arg Tyr lie Asp His Gly Ala Gin Thr Asp Gin lie
680 685 690
gaa gaa get ggg ctg age ccc aag cac ate gca ggg act gtt gtg tea 2226 Glu Glu Ala Gly Leu Ser Pro Lys His lie Ala Gly Thr Val Val Ser
695 700 705
ctt att ggt ggg gga aaa gac agt ctt cat etc ate aac aac ttg taa 2274Leu lie Gly Gly Gly Lys Asp Ser Leu His Leu lie Asn Asn Leu
710 715 720
tcttacUtc atccagcaaa gccagaagcg gaagcagtag cagttcatct cctcagagat 2334
taatgtttta tatgatgtaa tgaaatgtaa atatggggaa agattgcgac tggaagactc 2394
caacccacca atgtggggga gttgttctaa ataatccttc acacggcagc cttatgtttt 2454
gtacacacaa ataatcactt catactttta ttaaataaat ttatttgtcc caaaaaaaaa 2514
aaaaaaaa 2522
<210> 2
<211> 724
<212> PRT
<213> 丹参(Salvia mi ltiorrhiza )
<400〉 2
Met Ala Ser Ser Cys Gly Val lie Asn Ser Ser Phe Leu Pro Leu Leu
15 10 15
His Ser Glu Asn Ser Ser Ser Leu Leu Ser Arg Thr Thr Ala Thr Leu
20 25 30
Pro Pro Lys Lys His Lys Phe Ser Val Val Ala Ala Leu Gin Gin Asp
35 40 45
Asn Thr Asn Asp Val Ala Ala Asn Gly Glu Ser Leu Thr Arg Gin Lys
50 55 60
Thr Arg Ala Leu Asn Phe Thr Gly Asp Lys Pro Pro Thr Pro lie Leu 65 70 75 80
Asp Thr lie Asn Tyr Pro Asn His Met Lys Asn Leu Ser Val Glu Glu
85 90 95
Leu Glu Gly Leu Ala Asp Glu Uu Arg Glu Glu lie Val Tyr Thr Val
100 105 110
Ser Lys Thr Gly Gly His Leu Ser Ser Ser Leu Gly Val Ser Glu Leu
115 120 125
Thr Val Ala Leu His His Val Phe Asn Thr Pro Glu Asp Lys lie lie130
Trp Asp Val Gly His 145
Arg Ser
Arg Pro Lys Arg
Met
Gin 150 Thr
135 Ala
lie Arg Gin
His 165
Asp Glu Ser Ala His 180
lie Ser Ala Gly
Tyr Pro His Arg
Thr 170 Ala
Ser Thr Ser 195
Lys Asn Asn His
Asp 185
Gly Met Ala Val
140
Glu lie Leu Thr Gly Arg 155 160 Phe Gly Leu Ala Gly Phe 175
Phe Gly Ala Gly His Ser
Leu His 210
Thr Ala Gly Gin Ala 225
Ser Asn Leu lie
Leu 200
Val lie Ser Val lie 215
Glu Ala Leu Asn
Gly 190
Arg Asp Leu
Gly 205
Asp Gly Ala Met
Tyr 230
Val Leu Asn Asp
Gly 220
Ala Gly Phe
lie 245
Asp Gly Pro Ala
Asn 235
Lys Gin Val Ser
Thr Ala Thr lie 260
Arg Leu Gin Ala
Ala Leu Thr 275
Ala Ala Lys Gly Met Thr 290
Ala Ser Lys Val Asp 305
Ala Ser Leu Phe
Pro 265 Arg
Asn 250
Pro Val Gly Ala
Leu Asp 240 Leu Pro 255
Ser Lys
Arg 295 Tyr
Ser 280
Gin Met Gly Glu
Thr 310
Glu Leu Gly lie
Lys Phe Arg Gly
Met Lys Gly
Glu 325
Gly His Asn Val Glu Asp Pro Val 340
Pro Gly Pro Val
Tyr 330 lie
Met 315 Tyr
Gin 300 Met
Leu 270
Gin Leu Arg Glu 285
Ala His Glu lie
Gly Gly
Phe Lys Lys
Lys
lie Gly Pro
Met Pro Ala 355
Lys Gly Tyr Ser Pro Ala 370
Ty 345
lie His lie lie
Glu 375
Leu 360
Val Ala Ala Asp
Lys 380
Thr 365 Met
Val 350 Glu
His
Pro Gly 320 Val Asp 335
Lys Glu Lys Gly Gly Val<formula>formula see original document page 24</formula>625 630 635 640
Glu Val Leu lie Thr Val Glu Glu Gly Ser lie Gly Gly Phe Ser Ala
645 650 655
His lie Ser His Phe Leu Ser Leu Asn Gly Leu Leu Asp Gly Asn Leu
660 665 670
Lys Trp Arg Pro Met Val Leu Pro Asp Arg Tyr lie Asp His Gly Ala
675 680 685
Gin Thr Asp Gin lie Glu Glu Ala Gly Leu Ser Pro Lys His lie Ala
690 695 700
Gly Thr Val Val Ser Leu lie Gly Gly Gly Lys Asp Ser Leu His Leu 705 710 715 720
lie Asn Asn Leu
<210> 3 <211> 23 <212> DM
<213>丹参(Salvia miltiorrhiza ) <400> 3
AGCACACACAACTTGAAACAACT
<210> 4 <211> 23 <212> DM
<213>丹参(5WWa /z /"/arr力/za ) <400> 4
GGGACAAATAAATTTATTTAATA
权利要求
1. 一种丹参1-脱氧木酮糖-5-磷酸合成酶II基因，其特征在于，所述基因具有SEQ ID No.1所示的核苷酸序列或者添加、取代、插入或缺失一个或多个核苷酸的同源序列或其等位基因及其衍生的核苷酸序列。
2. —种权利要求1所述的丹参l-脱氧木酮糖-5-磷酸合成酶II基因编码的蛋白质，其特征在于，所述蛋白质具有SEQ IDNa2所示的氨基酸序列或者添加、取代、插入或缺失一个或多个氨基酸的同源序列。
3. —种质粒，其特征在于，所述质粒含有权利要求l所述基因的全序列或部分片段。
4. 一种植物表达载体，其特征在于，所述植物表达载体含有权利要求l所述基因的全序列或部分片段。
5. —种宿主细胞，其特征在于，所述宿主细胞含有权利要求1或3或4所述的基因序列。
6. 根据权利要求5所述的宿主细胞，其特征在于，所述宿主细胞为大肠杆菌细胞、农杆菌细胞、酵母细胞、烟草细胞、丹参发根细胞或丹参细胞。
7. —种权利要求1所述的丹参l-脱氧木酮糖-5-磷酸合成酶II基因的应用，其特征在于，用权利要求4所述的植物表达载体转化丹参细胞。
8. —种权利要求l所述的丹参l-脱氧木酮糖-5-磷酸合成酶II基因的应用，其特征在于，用权利要求6所述的农杆菌细胞与丹参细胞共培养或者用所述的丹参发根细胞培育雄性不育植株。
9. 一种权利要求l所述的丹参l-脱氧木酮糖-5-磷酸合成酶II基因的应用，其特征在于，用权利要求1所述的l-脱氧木酮糖-5-磷酸合成酶II基因序列提供一种转基因丹参。
全文摘要
本发明公开了一种丹参1-脱氧木酮糖-5-磷酸合成酶II基因及其编码的蛋白质和应用，填补了从我国传统中药材丹参中分离克隆出1-脱氧木酮糖-5-磷酸合成酶II基因的空白。本发明所提供的1-脱氧木酮糖-5-磷酸合成酶II基因具有SEQ ID No.1所示的核苷酸序列或者添加、取代、插入或缺失一个或多个核苷酸的同源序列或其等位基因及其衍生的核苷酸序列，其编码的蛋白质具有SEQ ID No.2所示的氨基酸序列或者添加、取代、插入或缺失一个或多个氨基酸的同源序列。本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II基因对于通过基因过量表达技术来提高丹参中丹参酮的含量具有显著作用。
文档编号C12N15/52GK101475947SQ20091004544
公开日2009年7月8日申请日期2009年1月16日优先权日2009年1月16日
发明者攀廖, 开国银, 林张, 敬王, 辉许申请人:上海师范大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：开国银;王敬;廖攀;张林;许辉
技术所有人：上海师范大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。