曲霉属胆色素原合酶和编码该酶的核酸的制作方法

文档序号:442324阅读:248来源:国知局
专利名称:曲霉属胆色素原合酶和编码该酶的核酸的制作方法
技术领域
本发明涉及曲霉属胆色素原合酶和包含编码胆色素原合酶的核酸序列的分离核酸片段。本发明也涉及核酸构建体、载体和包含该核酸序列的宿主细胞以及产生该胆色素原合酶的方法。
相关技术描述血红素(一种原卟啉IX和铁的螯合物)用作为血红素蛋白的辅基。原卟啉IX由为四个甲基、两个乙烯基和两个丙酸基团所取代的卟啉环组成,该卟啉环获得一个铁原子以形成血红素。由甘氨酸和琥珀酰-CoA生物合成血红素包括八个酶促步骤。该途径中的第二种酶是胆色素原合酶(也称为乙酰丙氨酸脱水酶),该胆色素原合酶催化两个5-乙酰丙氨酸分子的缩合而形成胆色素原。胆色素原合酶在粗糙脉孢菌和酿酒酵母的血红素生物合成途径中是限速酶。
从脱辅基蛋白质到血红素蛋白的转化取决于血红素生物合成途径所提供的血红素的可用性。脱辅基蛋白质形式的血红素蛋白与血红素结合产生活性血红素蛋白。活性血红素蛋白获得一种构象,该构象使血红素蛋白比受蛋白水解作用的脱辅基蛋白质更稳定。如果微生物产生的血红素量远小于产生的脱辅基蛋白质量,那么脱辅基蛋白质将积累并经过蛋白水解降解降低活性血红素蛋白的产率。
为了克服这一问题,Jensen显示把血红素或者含血红素材料添加至发酵培养基,可导致米曲霉的过氧化物酶产率的大量增加(WO93/19195)。当血红素添加至发酵培养基时,可导致血红素蛋白产率的很大提高,但大规模实行起来却不合适,而且很昂贵、很困难。
得自酿酒酵母的胆色素原合酶基因的克隆与表达已经公开(Labbe-Bois和Labbe,1990,In,Dailey,H.A.,编辑,血红素和叶绿素的生物合成,McGraw-Hill,Inc.,纽约,258页)。
本发明的目的是提供新的胆色素原合酶和编码该酶的基因。
发明概要本发明涉及得自曲霉属的基本上纯化的胆色素原合酶和包含编码曲霉属胆色素原合酶的核酸序列的分离核酸片段。本发明还提供了核酸构建体、载体和包含本发明的核酸片段的重组宿主细胞以及产生胆色素原合酶的方法。
附图简要描述

图1显示质粒pAJ005-1的限制性酶切图。
图2显示米曲霉胆色素原合酶基因的核苷酸与推定的氨基酸序列(分别见SEQ ID NO1和2)。有下划线的是CAAT盒,方框里的是TATA盒。用点线标明的是推定的内含子,用虚线标明的是推定的锌指结构域。文库探针用黑色实线标明,圈起来的是活性赖氨酸。
图3显示得自枯草芽孢杆菌、大肠杆菌、人、豌豆、大鼠、菠菜、酵母和米曲霉的胆色素原合酶的推定氨基酸序列(分别见SEQ ID NO22、20、18、21、19、23、17和2)的对比。
图4显示pAJ023的限制性酶切图。
图5显示质粒pJVi9的构建。
图6显示质粒pJeRS6的限制性酶切图。
图7显示质粒pJRoC50的限制性酶切图。
发明的详细描述如上所述,本发明涉及得自曲霉菌株的胆色素原合酶,例如得自包括但不限于以下曲霉的菌株的胆色素原合酶臭曲霉、日本曲霉、构巢曲霉、黑曲霉和米曲霉。公众很容易从一些培养物保藏中心获取这些物种的菌株,如美国典型培养物保藏中心(ATCC)、联邦德国微生物保藏中心(DSM)、荷兰真菌菌种保藏中心(CBS)、国际微生物研究所(IMI)、农业研究机构专利培养物保藏中心、北方地区研究中心(NRRL)以及日本大阪发酵研究所(IFO)。
在一优选的实施方案中,本发明涉及得自曲霉的胆色素原合酶。在一更优选的实施方案中,本发明涉及得自米曲霉的胆色素原合酶。在一最优选的实施方案中,本发明涉及得自米曲霉IFO4177或者其突变体菌株的胆色素原合酶,例如具有SEQ ID NO2中描述的氨基酸序列的胆色素原合酶。
本发明也涉及为在高度严格条件下(即在45℃条件下,在5X SSPE、0.3%SDS、200μg/ml的剪切和变性鲑精DNA以及50%甲酰胺中进行预杂交和杂交)能够与探针杂交的核酸序列所编码的胆色素原合酶,所说的探针在相同条件下与SEQ ID NO1描述的核酸序列杂交。该基因或基于它的寡核苷酸可以在Southern杂交中用作为探针来分离任一曲霉属物种的同源基因。特别是,这样的探针可用于按照标准Southern印迹过程与所感兴趣物种的基因组或cDNA杂交,以便鉴定并分离其中相应的胆色素原合酶基因。简并的PCR引物(寡核苷酸)与基因组DNA或cDNA片段可一起用来扩增胆色素原合酶特异性基因片段。
得自不同于那些本文具体举例说明的来源的胆色素原合酶基因的鉴定和分离,可通过利用本例子所描述的方法,用公众可获得的曲霉菌株来完成。
对于本发明来说,术语″得自″意指胆色素原合酶由特定来源(例如曲霉菌株)或者由得自该来源的编码胆色素原合酶的基因已插入其中的细胞产生。
本发明也包含胆色素原合酶变体,其与SEQ ID NO2所描述的氨基酸序列有至少大约50%、优选大约55%、更优选大约60%、甚至更优选大约65%,以及甚至优选大约70%、更优选大约75%、甚至更优选大约80%、最优选大约85%、甚至最优选大约90%、最最优选大约95%的同源性,并且其定性地保持这里所描述的胆色素原合酶活性。本发明也涉及胆色素原合酶变体,该变体的氨基酸序列与SEQ ID NO2所描述的氨基酸序列有三个氨基酸(优选地有两个氨基酸、更优选地有一个氨基酸)不同。每一种差异可能是氨基酸的插入或者缺失或者不同氨基酸对氨基酸残基的取代。以上定义的分类范围内的有用变体包括,例如那些在其中已进行了保守氨基酸取代的变体,该取代作用并不严重影响蛋白质的活性。保守替换意味着相同种类的氨基酸可能被同类的另一氨基酸取代。例如非极性脂肪族残基Ala、Val、Leu和Ile可能进行相互取代,碱性残基Lys和Arg,或者酸性残基Asp和Glu也可能进行相互取代。同样地,Ser和Thr进行相互地保守替换,Asn和Gln也一样。
利用本领域已知的各种技术可确定本发明的胆色素原合酶的物理化学性质,这些技术包括但不限于SDS-PAGE、等电聚焦以及交叉反应免疫鉴定检验方法。本发明的胆色素原合酶可利用本领域已知的方法分析。
本发明的胆色素原合酶可由本领域已知的各种方法纯化,这些方法包括但不限于层析法(例如离子交换法、亲和法、疏水法、层析聚焦法以及大小排阻法)、电泳法(例如制备性等电点聚焦)、差别溶解法(例如硫酸铵沉淀)或者抽提法(参见,例如蛋白质纯化,编者J.-C.Janson和LarsRyden,VCH出版社,纽约,1989)。如本文所定义的,″基本上纯化的″胆色素原合酶是指本质上无其它非胆色素原合酶蛋白质的胆色素原合酶,例如由SDS-PAGE所确定的纯度为至少大约20%,优选为大约40%,更优选为大约60%,甚至更优选为大约80%,最优选为大约90%,甚至最优选为至少大约95%。
本发明也涉及包含编码本发明的胆色素原合酶的核酸序列的核酸片段和包含本发明核酸片段的核酸构建体。
在一优选的实施方案中,核酸序列编码得自曲霉的胆色素原合酶。在一更优选的实施方案中,核酸序列编码得自米曲霉的胆色素原合酶。在最为优选的实施方案中,核酸序列编码得自米曲霉IFO4177的胆色素原合酶,例如SEQ ID NO1所描述的核酸序列。本发明也涉及编码胆色素原合酶的核酸序列,该胆色素原合酶具有SEQ ID NO2所描述的氨基酸序列,这种序列以其遗传密码的简并而区别于SEQ ID NO1中描述的氨基酸序列。本发明的核酸序列既包含本文中所描述的基因组序列及对应的cDNA与RNA序列,也包含本文所使用的术语“核酸序列”(其在本文中将理解为包含包括合成DNA在内的所有这类变体)。
本发明也涉及包含本发明核酸片段的核酸构建体。一般将“核酸构建体”理解为意指一个单链或者双链的核酸分子,该核酸分子从天然存在的基因中分离或者经修饰而含有核酸的片段,这种核酸片段以实际上并不存在的方式组合和并列。在一优选的实施方案中,将该核酸构建体与能够指导胆色素原合酶在合适表达宿主中表达的调节区可操作地连接。
本发明也提供了包含本发明核酸构建体的重组载体。在一较优选的实施方案中,将核酸序列可操作地连接于启动子序列上。在另一较优选的实施方案中,本发明的载体还包含转录终止信号和/或选择性标记。
本发明的重组载体有益于以活性形式表达曲霉属胆色素原合酶基因。有用的载体包含一元件(使载体能够稳定整合进入宿主细胞基因组或者使载体能够独立于宿主细胞基因组在宿主细胞中进行自我复制)以及优选的是包含一或多个表型标记(使转化的宿主细胞易于选择)。载体也可以包括控制序列(如启动子)、核糖体结合位点、翻译起始信号以及选择性地包括可选择性标记或各种激活物或阻抑序列。为了使所表达的蛋白质能够分泌,可将编码信号序列的核酸插入该基因的编码序列之前。对于控制序列指导下的表达,以一定方法使将要按照本发明使用的胆色素原合酶基因可操作地连接于控制序列上,通过这一方法可在与控制序列相容的条件下完成对编码序列的表达。
携带本发明的核酸构建体的载体可以是便于经受重组DNA过程的任何载体。对载体的选择典型地取决于载体将要引入其中的宿主细胞。载体可以是能够进行自我复制的载体(即作为染色体外实体存在的载体,其复制独立于染色体复制),例如质粒、染色体外元件、微型染色体或者人工染色体。可选择地,载体可以是这样一种载体,当将它引入宿主细胞时,其被整合进入宿主细胞基因组并与其已整合进入的染色体一道复制。载体系统可以是单个载体或质粒,或者是两个或多个载体或质粒(共同包含将要整合进入基因组的整个DNA)。
在载体中,DNA序列应该可操作地连接于合适的启动子序列上。启动子可以是任何在所选择的宿主细胞中显示转录活性的DNA序列,并且其可以得自编码宿主细胞的同源或者异源蛋白质的基因。用于指导本发明核酸构建体转录的合适启动子的例子(尤其是在细菌宿主中)是大肠杆菌乳糖操纵子的启动子、天蓝色链霉菌琼脂糖酶基因dagA启动子、地衣芽孢杆菌α-淀粉酶基因(amyL)启动子、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)的启动子、解淀粉芽孢杆菌α-淀粉酶(amyQ)启动子、枯草芽孢杆菌xylA和xylB基因启动子、原核β-内酰胺酶启动子(Villa-Kamaroff等,1978,美国国家科学院院报753727-3731)或者tac启动子(DeBoer等,1983,美国国家科学院院报8021-25)。另外一些启动子描述在以下文献中“来自重组细菌的有用蛋白质”,美国科学,1980,24274-94;和Sambrook等,分子克隆,实验室手册,第二版,冷泉港,纽约,1989。在酵母宿主中,有用启动子是eno-l启动子。对于在真菌宿主中的转录,有用启动子的例子是得自编码以下蛋白质的基因的启动子米曲霉TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或者泡盛曲霉葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶或者构巢曲霉乙酰胺酶。优选的启动子是TAKA淀粉酶、NA2-tpi以及glaA启动子。
本发明的载体也可以包含合适的转录终止子和在真核细胞中与编码本发明胆色素原合酶的DNA序列可操作地连接的聚腺苷酸化序列。终止子和聚腺苷酸化序列与启动子具有相同的来源。载体还可包含能够使载体在所讨论的宿主细胞中进行复制的DNA序列。这种序列的例子有质粒pUC19、pACYC177、pUB110、pE194、pAMB1以及pIJ702的复制起点。
优选的本发明载体含有一个或多个便于选择转化细胞的选择性标记。选择性标记是一种基因,其产物具有杀生物剂抗性或病毒抗性、对重金属的抗性和从原养型变为营养缺陷型及其类似情况。选择性标记可选自但不限于由以下物质组成的组中amdS、pyrG、argB、niaD、sC、trpC、bar和hygB。优选用于曲霉细胞中的是构巢曲霉或者米曲霉的amdS和pyrG标记以及吸水链霉菌的bar标记。此外,可通过共转化作用完成选择,例如正如在WO91/17243中所描述的一样(其中选择性标记包含在一单个载体中)。
本发明的优选载体也包含信号肽编码区,其编码与血红素生物合成酶的氨基末端连接的氨基酸序列,从而使胆色素原合酶得以定位于特定的细胞区室。信号肽编码区可以天然地存在于编码胆色素原合酶的第一核酸序列中或者得自外源。第一核酸序列的编码序列的5’端可以固有地包含信号肽编码区,其在翻译读框中自然地与编码定位的胆色素原合酶的编码区的片段连接。此外,编码序列的5’端可包含编码信号肽编码区的核酸,该信号肽编码区对于编码定位的胆色素原合酶的编码序列的部分来说是属于外源的。信号肽编码区可得自粗糙脉孢菌ATP酶基因(Viebrock等,1982,EMBO杂志1565-571)或者酿酒酵母细胞色素C过氧化物酶基因(Kaput等,1982,生物化学杂志25715054-15058)。然而,能够使5-乙酰丙氨酸合酶定位于选择的丝状真菌宿主中的任何信号肽编码区都可用于本发明。
为了避免破坏细胞来获得所表达的胆色素原合酶的必要性,以及最大限度地减少细胞内的所表达的胆色素原合酶的可能降解的量,优选的是胆色素原合酶基因的表达产生细胞外分泌的产物。就这一目的而言,本发明的胆色素原合酶可因此包含使所表达的蛋白质得以分泌到培养基中的前区。如果需要,这一前区可以天然存在于本发明的胆色素原合酶中或者为不同的前区或信号序列所取代(方便地由编码各自前区的DNA序列的取代来完成)。例如,前区可得自葡糖淀粉酶或曲霉物种的淀粉酶基因、芽孢杆菌物种的淀粉酶基因、Rhizomucor miehei的脂肪酶或蛋白酶基因、酿酒酵母的α-因子基因或小牛前凝乳酶原基因。更优选的是米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、芽孢杆菌NCIB11837的产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶或者地衣芽孢杆菌枯草杆菌蛋白酶的前区。真菌宿主的有效信号序列是米曲霉TAKA淀粉酶信号、Rhizomucor miehei天冬氨酸蛋白酶信号或者Rhizomucor miehei脂肪酶信号。
对于本领域的普通技术人员来说,用于连接本发明的核酸构建体、启动子、终止子和其它元件的方法以及把这些元件插入包含必要复制信息的合适载体中的方法都是已知的(例如,参见Sambrook等,见上)。
本发明也涉及包含本发明的核酸构建体或者表达载体的宿主细胞,这些核酸构建体或者表达载体有益地用于本发明胆色素原合酶的重组产生过程。细胞可经本发明的核酸构建体转化,该核酸构建体方便地整合进入宿主染色体中。一般视该整合作用为优点,因为该序列更可能稳定地存在于细胞中。例如通过同源或异源重组,按照常规方法可完成构建体进入宿主染色体的整合。或者细胞可由如下描述的表达载体(与不同类型宿主细胞关连的)转化。
宿主细胞和载体的选择在很大程度上取决于胆色素原合酶和它的来源。宿主细胞可从原核细胞中选择,如细菌细胞。合适的细菌例子是格兰氏阳性细菌、诸如枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱性芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、巨大芽孢杆菌、苏云金芽孢杆菌、浅青紫链霉菌、鼠灰链霉菌或者格兰氏阴性细菌(如大肠杆菌)。通过例如原生质体转化或者通过以本领域已知的方式利用感受态细胞,可以实现细菌的转化。
宿主细胞优选如哺乳动物细胞、昆虫细胞、植物细胞的真核细胞,或者优选包括酵母和丝状真菌的真菌细胞。例如,有用的哺乳动物细胞包括CHO或者COS细胞。酵母宿主细胞可选自酵母属或裂殖酵母属的物种,例如酿酒酵母。有用的丝状真菌可选自曲霉属的物种,例如米曲霉或黑曲霉。此外,镰刀菌属物种的菌株(如尖镰孢或禾谷镰孢)可以用作为宿主细胞。真菌细胞可由包括利用本领域已知方式的原生质体形成、原生质体转化和细胞壁再生在内的方法来转化。曲霉宿主细胞的转化的合适方法已在EP238023中进行了描述。镰刀菌属物种转化的合适方法由Malardier等,1989,基因78147-156描述或者描述在共同悬而未决的美国系列号08/269,449中。
在一特别优选的实施方案中,胆色素原合酶基因的表达在真菌宿主细胞(如曲霉)中完成。将胆色素原合酶基因连接到优选包含米曲霉TAKA淀粉酶启动子或者黑曲霉中性淀粉酶NA2启动子和amdS或pyrG作为选择性标记的质粒中。此外,选择性标记可以在一单个质粒上并用于共转化中。按照Yelton等,1984,美国国家科学院院报811470-1474中所描述的方法,质粒用来转化如米曲霉或者黑曲霉的曲霉属物种宿主细胞。
本发明也涉及产生本发明的胆色素原合酶的方法,该方法包括(a)在营养培养基中培养曲霉菌株以产生胆色素原合酶,以及(b)回收胆色素原合酶。
本发明也涉及重组产生本发明的胆色素原合酶的方法,该方法包括(a)培养包含核酸构建体的宿主细胞,该核酸构建体包含在有助于酶生成的条件下编码胆色素原合酶的核酸序列,以及(b)回收胆色素原合酶。如果表达系统分泌胆色素原合酶进入发酵培养基中,那么可直接从培养基中回收该酶。如果没有分泌重组胆色素原合酶,则从细胞溶胞产物中回收胆色素原合酶。
可利用本领域已知的任何培养细胞方法实现对本发明胆色素原合酶的表达或者分离。例如,可将培养过程理解为包含摇瓶培养、在实验室或者工业发酵罐中在合适培养基中和在一定条件(使该胆色素原合酶得以表达和分离)下完成的小或大规模发酵(包括连续的、成批的、分批补料的或固态的发酵)。利用本领域已知的方法在合适的营养培养基(包含碳和氮源及无机盐)中进行培养(参见,例如Bennett,J.W.和LaSure,L.编辑,真菌中的多基因操纵,科学院出版社,加拿大,1991)。合适的培养基可由商家提供或者按照公开的组成(例如在美国典型培养物保藏中心的目录中)制备。
由包括但不限于离心、过滤、喷雾干燥、蒸发或者沉淀的常规方法,可从发酵培养基中回收用上述方法产生的胆色素原合酶。然后由例如离子交换层析、凝胶过滤层析、亲和性层析或者类似方法的各种层析方法可以进一步纯化所回收的蛋白质。
本发明也涉及利用胆色素原合酶的方法。
通过在宿主细胞中超表达编码胆色素原合酶的核酸序列,本发明的胆色素原合酶可用来增加由宿主细胞产生的血红素蛋白的产率,其中的胆色素原合酶在宿主细胞中血红素产生过程中是一限速步骤。该方法包括(a)引入到宿主细胞中,该宿主细胞能够产生血红素蛋白、一或多个编码胆色素原合酶的核酸序列拷贝,其中的核酸序列可操作地连接到能够指导胆色素原合酶表达的调节区上;
(b)在适合于产生血红素蛋白和胆色素原合酶的营养培养基中培养细胞;以及(c)从上述细胞的营养培养基中回收血红素蛋白。
下列例子进一步描述本发明,但这些例子并不构成限制本发明的范围。
实施例实施例1米曲霉菌株A1560基因组DNA提取在32℃和250rpm条件下使米曲霉菌株A1560(IFO 4177)在25ml的0.5%酵母提取液-2%葡萄糖(YEG)培养基中生长24小时。然后由通过Miracloth(Calbiochem,La Jolla,加拿大)的过滤收集菌丝体,并用25ml的10mM Tris-1 mM EDTA(TE)缓冲液洗涤一次。从菌丝体中排出过量缓冲液,随后将菌丝体冻结于液氮中。在电动咖啡研磨机上将冻结的菌丝体研磨成精细粉末,并将粉末加入在一次性塑料离心管中的20ml TE缓冲液和5ml的20%w/v十二烷基硫酸钠(SDS)中。和缓地倒转混合物几次以确保混合均匀,用相同体积的苯酚∶氯仿∶异戊醇(25∶24∶1 v/v/v)混合液提取两次。加入乙酸钠(3M溶液)至终浓度为0.3 M,其后加入2.5倍体积的用冰预冷的乙醇来沉淀核酸。然后通过在15,000xg下离心该管30分钟使核酸成粒状沉淀。在重悬浮于0.5ml的TE缓冲液中之前,使粒状沉淀风干30分钟。加入无DNA酶的核糖核酸酶A至浓度为100μg/ml并在37℃条件下温育混合物30分钟。然后加入浓度为200μg/ml的蛋白酶K并在37℃条件下再温育混合物一小时。最后,在如前述的用乙酸钠和乙醇沉淀DNA之前,用苯酚∶氯仿∶异戊醇(25∶24∶1 v/v/v)提取混合物两次。使DNA粒状沉淀在真空下干燥、重悬浮于TE缓冲液中、并在4℃条件下保存直到进一步利用。
实施例2通过PCR的基因组hemB探针的产生基于侧接米曲霉126bp hemB片段的氨基酸序列(Jesper Vind,1994,博士论文,丹麦,哥本哈根,哥本哈根大学)以及酵母和人hemB克隆的同源区(Myers等,1987,生物化学杂志26216822-16829;Wetmur等,1986,美国国家科学院院报837703-7707),设计简并PCR引物。寡核苷酸引物利用应用生物系统394型DNA/RNA合成仪合成。将有义5′-GT(AGCT)GC(AGCT)CC(AGCT)(AT)(CG)(AGCT)GA(CT)ATGATGGA-3′(SEQ ID NO3)和反义5′-GC(AG)TC(AGCT)CG/T(AG)AA(AGCT)CC(AG)TA-3′(SEQ ID NO4)引物用于利用pJVi 60(Vind,1994,见上)作为模板来PCR扩增hemB片段。PCR反应物(50μl)由10mM Tris-HCl pH8.3,50mM KCl,1.5mM MgCl2,0.01%w/v明胶,各200μM的dATP、dCTP、dGTP和dTTP,500ng的pJVi 60以及50 pmol的上述各PCR引物组成。上述反应物在95℃下温育3分钟并冷却至80℃。然后加入5个单位的Taq聚合酶。在设定为35个循环的Perkin-Elmer 9600热循环仪中温育该反应物,其中每一循环为95℃下30秒、45℃下1分钟及72℃下1分钟。在最后一循环后接着在72℃条件下温育反应物5分钟。预计的126bphemB PCR产物克隆进入pCRII载体,从而产生质粒pAJ005-1(图1)。
实施例3米曲霉菌株A1560 DNA文库和胆色素原合酶(hemB)克隆的鉴定利用作为宿主(用于平板培养和纯化重组噬菌体)的大肠杆菌Y1090ZL细胞和用于切除个体pZL1-hemA克隆的大肠杆菌DH10Bzip,按照厂商的指导利用噬菌体克隆载体λZipLox(生命技术,Gaithersburg,MD)来构建米曲霉菌株A1560基因组DNA文库。用Tsp509I部分地消化以如实施例1中描述的方法制备的全部细胞DNA,并用50mM Tris-50 mM硼酸盐-1mM乙二胺四乙酸二钠(TBE)缓冲液在1%琼脂糖凝胶上对其进行大小分级分离。切除在4-7kb大小范围内迁移的DNA片段,并利用Prep-a-Gene试剂(BioRad实验室,Hercules,加拿大)将其从凝胶上洗脱。将洗脱的DNA片段与EcoRI切割的并脱磷酸的λZipLox载体臂连接,利用商业包装提取物(Stratagene,La Jolla,加拿大)把连接混合物包装起来。在大肠杆菌Y1090ZL细胞中平板培养和扩增包装的DNA文库。未扩增的基因组文库包含1×106pfu/ml。
将得自大约8×104噬斑的噬菌体DNA转移以复制环状Nytran Plus膜(Schleicher&Schuell,Keene,NH),并用32P标记的PCR产物进行探测,该PCR产物按照Mertz和Rashtchian(1994,分析生物化学221160-165)的方法通过扩增pAJ005-1的hemB片段(参见例2)而得到。扩增反应物(50μl)包含下列组分10mM Tris-HCl pH8.3,50mMKCl,1.5mM MgCl2,0.01%(w/v)明胶,各0.04mM的dATP、dCTP、dGTP及dTTP,5μl的32P-dCTP(3000 Ci/mmole,3.3μM;Amersham,Arlington Heigths,IL)以及各50pmole的有义引物5’-GTGGCTCCGAGTGATAT-3’(SEQ ID NO5)和反义引物5’-GCATCGCGAAAAGGACCG-3’(SEQ ID NO6)。将反应物加热到95℃并保持3分钟,随后加入5个单位的Taq聚合酶。然后在设定为30个循环的Perkin-Elmer热循环仪中温育该反应物,其中每一循环为95℃下1分钟,55℃下1分钟以及72℃下1分钟。使反应溶液通过葡聚糖凝胶G50柱(Pharmacia,Alameda,加拿大)以除去未掺入的核苷酸,随后使其变性并将其加入到杂交缓冲液中。在杂交缓冲液中加入变性探针(106cpm/ml),并用预杂交膜温育一夜。在5X SSC,50mM磷酸钠pH7,5X Denhardt溶液,0.1%(w/v)SDS,5mM EDTA pH8,10μg/mL变性鲑精DNA以及50%甲酰胺中,在42℃条件下进行预杂交和杂交。在42℃的0.1X SSC,0.1%SDS溶液中将膜洗涤四次(共15分钟)。第二次筛选给出阳性信号的主要噬斑,并按照厂商的指导对其进行纯化。按照厂商的指导(Bethesda研究实验室,Inc.,Bethesda,MD)从作为pZL衍生物的λZipLox载体中切除产生阳性信号的10个基因组克隆,以及按照Hattori及Sakaki的方法(1986,分析生物化学152232-237)测序。指定pZL衍生物为pAJ007-1直至pAJ007-10。大肠杆菌DH5αpAJ007-6克隆包含基于限制酶切图的3.7kb的基因组片段,并且对它进行了进一步分析。
实施例4胆色素原合酶(hemB)基因的表征按照实施例2所描述的方法对实施例2所描述的大肠杆菌DH5αpAJ007-6进行了DNA测序。
克隆的米曲霉A1560 hemB基因的核苷酸序列显示出如图2(SEQ IDNO1)所示的1308核苷酸的开放读框,该开放读框编码如图2(SEQ IDNO2)所示的具有40kDa预计分子量的374氨基酸多肽。上述核苷酸序列包含一个由剪接位点共有序列侧连的48bp推定内含子,并包含由有关文献(Unkles,1992,丝状真菌的应用分子遗传学,第2章,J.R.Kinghorn和G.Turner,编辑,Blackie Academic and ProfessionalPublications)所预计的内部共有序列。3’剪接位点(TAG)定位于Met下游的254 bp处,5’剪接位点(GTCCGC)定位于3’剪接位点上游的46bp处,内部共有序列(TCTAAC)定位于5’剪接位点下游的30bp处。5’非翻译区在-377和-233位包含两个CAAT基元,其可在转录调节中起重要的作用(Gurr等,1987,见上)。另外,在3’非翻译区(-117、-208、-650)发现几个推定的TATA样盒。正如所料,hemB在N未端似乎并不包含前导序列,这是由于它在除植物以外的其它有机体中属于胞质所致(Bottemley和Muller-Eberhard,1988,血液学报告25282-302)。
图3中显示的是米曲霉hemB基因(SEQ ID NO2)与其它hemB基因的氨基酸序列对比。来自酵母(SEQ ID NO17;Myers等,1987,见上)、人(SEQ ID NO18;Wetmur等,1986,见上)、大鼠(SEQ IDNO19;Bishop等,1989,核酸研究1410115)和大肠杆菌(SEQ IDNO20;Li等,2989,基因75177-184)的推定hemB氨基酸序列分别有63%、55%、55%和40%完全等同于米曲霉hemB氨基酸序列。来自豌豆(SEQ ID NO21;Bsese等,1991,生物化学的杂志26617060-17066)、枯草芽孢杆菌(SEQ ID NO22;Hansson等,1991,细菌学杂志1732590-2599)和菠菜(SEQ ID NO23;Scharmburg和Schneider-Poetsch,1991,EMBL数据文库)的推定hemB氨基酸序列具有较小的相似度(分别为40%、39%和33%的等同性)。然而,由于豌豆和菠菜hemB氨基酸序列含有N端叶绿体信号序列,如果将它们作为成熟多肽进行对比,那么它们与米曲霉hemB序列的相似性将明显增加。基于这些序列对比,米曲霉hemB的活性赖氨酸位点定位在299氨基酸处(Jaffe,1995,生物能和生物膜杂志27169-179),并且如Berg(1986,自然319264-265)所预测的保守锌指样结构域定位于氨基酸166-180处。有人认为锌指通过结合Zn2+而在活性部位阻止巯基的氧化(Jaffe,1995,见上)。有人提出在植物hemB中的对应结构域结合Mg2+而非Zn2+(Bsese等,1991,见上)。令人感兴趣的是,hemB指结构域的第一个残基是Thr(在位置166),其对于植物金属结合域中的这一位置来说是保守的。然而,hemB锌指结构域中的其余位置都是保守的。
实施例5pAJ023的构建通过PCR扩增米曲霉hemB编码区并将其亚克隆到米曲霉表达载体pBANE6中来构建质粒pAJ023(图4)。设计扩增产物以包含5’SwaI和3’PacI限制位点,从而有利于其克隆到pBANe6中。扩增反应物(50μl)包含下列组分10mM Tris-HCl pH 8.3,50mM KCl,1.5 mM,MgCl2,0.01%(w/v)明胶,各200μM的dATP、dCTP、dGTP和dTTP,200ng的pAJ007-6 DNA以及如下所示的各50pmol的PCR引物PBG10(有义)5’-GCATATTTAAATGATGTCCTTTTCTAATCTCGT-3’(SEQ ID NO7)PBGI1A(反义)5’-ATATTAATTAATCCATCTAGCTAAATCATT-3’(SEQ ID NO8)PBG10和PBG11A的划线区分别包含克隆限制序列SwaI与PacI。在95℃下温育反应物3分钟并冷却至80℃。加入五个单位的PWO(BM)聚合酶。在设定为30个循环的Perkin-Elmer 9600热循环仪中温育反应物,其中每一循环为95℃下30秒、57℃下1分钟以及72℃下1分钟。在最后一循环后,接着在72℃下温育反应物5分钟。凝胶纯化最后的PCR产物,用SwaI和PacI消化其,并将其连接到用SwaI和PacI消化的载体pBANE6中以产生pAJ023。
实施例6米曲霉菌株JRoC50.3.18A的构建以如下方法构建包含质粒pJRoC50的米曲霉菌株JRoC50.3.18A。利用基于长根鬼伞过氧化物酶(Baunsgaard等,1993,欧洲生物化学杂志213605-611)的氨基酸序列构建的、如下所示(Saiki等,1988,科学239487-491)的特异性寡核苷酸引物,由PCR制备灰盖鬼伞IFO8371过氧化物酶cDNA片段1.5’-GCGCGAATTCGTNGGNATNGGNATNAA(CT)CA(CT)GG-3’(SEQ ID NO9)2.3’-TACAGNTT(GA)AC(GA)GGNGGCCTAGGCG-5’(SEQ ID NO10)3.5′-GCGAATTCACNCCNCA(GA)GTNTT(CT)GA(CT)AC-3’(SEQID NO11)4.3′-GGNAA(GA)GGNCCNCT(CT)AA(GA)CCTAGGCG-5’(SEQ IDNO12)5.5′-GCGCGAATTCTGGCA(GA)TCNAC-3′(SEQ ID NO13)6.5′-GCGCGAATTCTGGCA(GA)AGNATG-3′(SEQ ID NO14)7.3′-CGNTACCGNTT(CT)TACAGCCTAGG-5′(SE Q ID NO15)利用Gene Amp Kit与仪器(Perkin Elmer Cetus,Norwalk,CT),按照厂商的指导完成PCR,例外情况是在28℃下进行反应的前三个循环以便获得与第一条链cDNA(由得自灰盖鬼伞菌株IFO 8371的mRNA制备)的更好杂交,随后在65℃下进行的30个PCR循环。
引物的结合情况如下1和2、3和4、5和7、6和7、1和4以及3和7。用5’端EcoRI位点和3’端BamHI位点伸展PCR片段。在1%琼脂糖-TBE凝胶上分析反应物,在所有的反应中均发现所需大小的DNA带。为了检验对应于过氧化物酶特异性序列的DNA带,对凝胶进行Southern印迹,并使之与包含如下序列(位于引物3和4之间)的寡核苷酸探针杂交5’-GT(CT)TC(GA)AT(GA)TAGAA(CT)TG-3’(SEQ ID NO16)发现探针与大约130bp、420 bp、540 bp以及240bp的带杂交,由此确认观察到的DNA带对应于过氧化物酶序列。
用EcoRI和BamHI消化得自各种PCR反应的DNA,并将其克隆到质粒pUC19(新英格兰生物实验室,Beverly,MA)中。利用上述的寡核苷酸探针(SEQ ID NO16)通过杂交来鉴定包含正确PCR片段的菌落。通过限制性酶切图和如Sanger等(1977,美国国家科学院院报745463-5467)所描述的部分DNA序列分析来分析得自阳性菌落的DNA。来自克隆体(通过利用引物1和4获得的)之一的430bp片段用于筛选如下所述的灰盖鬼伞cDNA文库。
从匀化的灰盖鬼伞菌株IFO 8371菌丝体中提取整个RNA,并按照Boel等(1984,EMBO杂志31097-1102)和Chirgwin等(1979,生物化学185294-5299)所描述的方法在过氧化物酶活性最大时收集该RNA。在Aviv和Leder(1972,美国国家科学院院报691408-1412)所描述的在低聚(dT)-纤维素上,通过两个循环的亲和层析获得包含Poly(A)的RNA。按照厂商的指导利用cDNA合成试剂盒(Invitrogen,San Diego,加拿大)来合成cDNA。将来源于灰盖鬼伞cDNA文库的大约50,000个大肠杆菌重组体转移到Whatman 540滤纸上。如Gerger等所描述的(1979,核酸研究72115-2135)一样,裂解和固定上述菌落。在0.2 X SSC-0.1%SDS中使滤膜与用32p-标记的430bp过氧化物酶特异性探针杂交。在65℃下进行滤膜的杂交和洗涤,其后用增感屏使之放射自显影24小时。放射自显影之后,在不断升高的温度下洗涤滤膜,而后用增感屏使之放射自显影24小时。按照这一方法,可鉴定超过50个阳性菌落。利用标准方法(Birnboim和D0ly,1979,核酸研究71513-1523)把小量制备质粒DNA与杂交菌落分离,并利用Sanger的双脱氧方法(Sanger等,1977,美国国家科学院院报745463-5467)确定cDNA插入片段的DNA序列。选择上述菌落之一,并指定该载体为pCiP。通过利用BamHI/XhoI的切割来从该载体上切除过氧化物酶cDNA片段,并由琼脂糖凝胶电泳纯化其,电洗脱之并准备用于连接反应。cDNA片段连接到BamHI/XhoI消化的pHD414上从而产生pJVi9,其中的cDNA处于米曲霉的TAKA启动子和如图5中所示的黑曲霉的AMGTM(NovoNordiskA/S,Bagsvard,丹麦)终止子的转录控制之下。
从质粒pJVi9上切除编码灰盖鬼伞过氧化物酶的cDNA作为BamHI/XhoI片段,并将其克隆到质粒pJeRS6(图6)中从而产生质粒pJRoC50(图7),质粒pJRoC50包含作为选择性标记的pyrG、TAKA启动子及amdS终止子。
利用5μg的纯化质粒pJRoC50(如下所述)通过如下修改,制备米曲霉菌株HowB425转化体。省略琼脂覆盖,并将原生质体直接平板接种在基本培养基平板上。在每ml 2×107原生质体的浓度下用原生质体进行转化。将100μl原生质体与5μgDNA在冰上放置30分钟。加入1ml的SPTC(40%PEG 4000,0.8M山梨醇,0.05M Tris pH8.0,0.05MCaCl2),并在34℃下培养原生质体20分钟。将转化物直接接种在包含基本培养基的平板上。每升基本培养基(pH6.5)由6g NaNO3、0.52g KCl、1.52g KH2PO4、1ml痕量金属、1g葡萄糖、500mg MgSO4-7H2O、342.3g蔗糖以及20g纯净琼脂组成。每升痕量金属溶液(1000X)由22gZnSO4-7H2O、11g H3BO3、5g MnCl2-4H2O、5g FeSO4-7H2O、1.6g CoC12-5H2O、1.6g(NH4)6Mo7O24以及50g Na4EDTA组成。在34℃下温育平板5-7天。将转化体转移到相同培养基的平板上并在37℃下培养3-5天。
利用下列酶分析方法测定66个转化体的过氧化物酶活性将180μl底物缓冲液{20ml 0.1M磷酸钾-0.01 Tween-80 pH7.0,250μl2,2’-连氮-双-(3-乙基苯并噻唑啉-6-磺酸酯)(ABTS)溶液(22mg/ml)以及2μl的30%过氧化氢}加至20μl的以1∶900比例稀释的培养物上清液中,随后迅速利用Molecular Devices Thermomax Microplate Reader(Molecular Devices,Sunnyvale,加拿大)在25℃下测定其在405nm处的吸光度。在伴随混合的2分钟时间内每10秒记录一次测定结果,并用SOFT max程序(Molecular Devices,Sunnyvale,加拿大)计算Vmax值。利用标准曲线(以已知量的灰盖鬼伞过氧化物酶绘制的)作为标准来估算每ml中的过氧化物酶单位(POXU)。一个POXU的定义为30℃下每分钟催化1.0μmole的0.88mM H2O2、1.67mM ABTS、0.1M磷酸盐pH7.0转化的酶量。在与上述相同的条件下利用相同的平板,通过划线孢子和挑取分离的菌落来孢子纯化表达最高水平的四个转化体。
在摇瓶中进行最终的评价,其中每一转化体的大约5×106个孢子接种到25ml的MY25培养基上,该培养基包含1%酵母提取物、2.5%麦芽糖、0.2%尿素和1X MY盐pH6.5。每升1X MY盐由2g MgSO4-7H2O、2g K2PO4、10g KH2PO4、2g柠檬酸、0.5ml痕量金属溶液、1ml10%CaCl2-2H2O组成。每升痕量金属溶液由13.9g FeSO4-7H2O、8.5g MnSO4-H2O、14.28g ZnSO4-7H2O、1.63g CuSO4、0.24gNiCl2-6H2O以及3.0g柠檬酸组成。加入氯高铁血红素(得自在50mMNaOH中制备的10mg/ml新鲜贮存物)至终浓度为0.01mg/ml。在34℃和200rpm条件下温育摇瓶7-8天。指定最好的过氧化物酶产生者为JRoC50.3.18A。
实施例7利用pAJ023的米曲霉JRoC50.3.18A的转化为了确定米曲霉hemB基因的超表达是否增加过氧化物酶的产量,用pAJ023转化米曲霉菌株JRoC50.3.18A。作为对照,pBANe6也用于转化米曲霉JRoc 50.3.18A。
在每ml 2×107原生质体的浓度下用原生质体进行转化。在冰上将100μl原生质体与10μg DNA、200μl 60%PEG 4000-10mM HEPES-10mM CaCl2溶液一起温育30分钟。加入1ml的SPTC(40%PEG 4000、0.8 M山梨醇、0.05M Tris pH8.0、0.05M CaCl2),并在34℃下温育原生质体20分钟。在接种到用于amdS转化的COVE转化平板(每升0.52g KCl、0.52g MgSO4-7H2O、1.52g KH2PO4、1ml如实施例6所描述的痕量金属溶液、342.3g蔗糖、25g纯净琼脂、10ml 1M乙酰胺以及10ml的3M CsCl)上之前,将0.25ml转化物的等分试样加至15ml COVE琼脂覆盖物(与COVE培养基+0.7%低熔点琼脂相同)上。在室温下温育平板5-7天。将转化体转移到相同培养基的平板上,在37℃温育3-5天。在相同条件下利用相同的平板通过划线孢子和挑取分离的菌落来纯化上述转化体。
实施例8hemB初级转化体产生的过氧化物酶产量使总共20种米曲霉hemB转化体和42种对照转化体(有米曲霉表达载体而无米曲霉hemB的JRoC 50.3.18A的转化体)在24个孔平板上生长,并如实施例6中所述的一样分析其过氧化物酶产量。
过氧化物酶分析的结果显示产生较高水平的过氧化物酶活性的转化体相对于对照转化体,在数量上无任何增加。
微生物保藏下列菌株按照布达佩斯条约保藏在美国农业研究机构专利培养物保藏中心(NRRL),北方研究实验室,1815大学街,Peoria,Illinois61604,美国。
菌株 登记号保藏日期大肠杆菌DH5α(pAJ007-6) NRRL B-21564 1996年4月22日在一定条件下存放菌株,该条件要确保在此专利申请的悬而未决期间对于由按照37C.F.R.§1.14和35 U.S.C.§122授权的专利与商标委员所确定的人员来说可获得培养物的使用权。保藏物表示每一种存放菌株的基本上纯化的培养物。保藏物可按照提交主题申请或其子申请的国家的专利法要求而得到。然而,应该理解保存物的可使用权并不包括许可侵犯政府授予的专利权而实施主题发明。
这里所描述的和所要求的本发明,并不限于这里所公开的具体实施方案范围,由于这些实施方案旨在说明本发明的几个方面。任何等同的实施方案都意欲包含在本发明范围之内。的确,除这里所描述和示例的修改方案之外,有关本发明的其他各种修改方案从以上描述看对本领域技术人员来说都是很明显的。这些修改方案也意欲包含在附属的权利要求范围之内。
这里引用各种参考文献,它们的公开内容均与本文一并参考。
序列表(1)一般信息(i)申请人(A)名称Novo Nordisk生物技术公司(B)街道1445 Drew路(C)城市Davis,加利福尼亚(D)国家美利坚合众国(E)邮编(ZIP)95616-4880(F)电话(916)757-8100(G)传真(916)758-0317(ii)发明名称曲霉属胆色素原合酶和编码该酶的核酸(iii)序列数23(iv)通讯地址(A)收信人北美的Novo Nordisk,Inc.
(B)街道405 Lexington路(C)城市纽约(D)州纽约(E)国家美国(F)邮编10174(v)计算机可读形式(A)媒介类型软盘(B)计算机可兼容的IBM(C)操作系统DOS(D)软件FastSEQ Windows 2.0版本(vii)在先的申请数据(A)申请号60/019,529(B)申请日10-JUN-1996(C)分类(viii)律师/代理人信息
(A)姓名Lambiris,Elias J.
(B)登记号33,728(C)证书号4809.204-WO(ix)电讯信息(A)电话212-867-0123(B)传真212-878-9655(2)SEQ ID NO1的信息(i)序列特征(A)长度1807对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO1CTGGACCAAT GGTAACCCTC CGTAATTGCC TTACAGATTT AGCCCAGGGG GGTTATGGTA 60TCCTTGGGTA TTGAGGCCTG GAAATTTTTT TAGCCACCAG TTTACAGCCA GTTTCCGTTT 120GTAAATATTT CACATCCCCC GACCCTGTCC CAATACAATA ATTTTTTCGC TATATATAAC 180GCCCCTAGCG TTGTTTTATG ATCCTTAAAT CCTTACTTGT ACCTGAAAAT TGCAACAAAT 240GTACTGACCT GGATCGCTGG CCATTTATAT CATTGCCCTG CGAAGTCGTA TTCTGCCAGT 300GGCACAGGCG CTATTCTCTT TTCTTCCCTC CACCGCGTTT CTATCTTCCA TAGCACCCCA 360CTTGCTTGCC GCTCCTGTCA TTATGTCCTT TTCTAATCTC GTCTCTGACC TCGCCTTCAG 420AGATTCTCAT GATGACCGAA GTTCTCAGAT ATCTCAGGTA CAATCGCAAG CCACTGCACG 480ATCGTATACA AGCACAGCTG CCACAAGCGT CAGCATATCT GGCGACATCT CAAGCCAGCT 540TCATTCCGGT TACAGCCATC CACTGAGCCG ATCATGGCAG GCTGAAAGAC AGTTGACTAA 600AGTCCGCATT TTCTTTTGTA TTTACTGAGC TGCTCTAACC CCGAGATAGG AAATGCTTAT 660TTATCCTCTC TTCATCACCG ATAATCCCGA TGAGGAGACT CCTATCCCGT CTCTCCCTGG 720ACAGTATCGT CGAGGATTAA ACCGTCTAGT TCCTTTCATC AAACCACTTG CCCACAAGGG 780GCTACGCTCA GTCATCCTGT TTGGCGTCCC ACTACACCCC TCTGCGAAGG ATGCACTAGG 840TACCGCTGCA GACGATCCAT CTGGACCGGT AATTCAAGCT ATTCGCTTGC TTAGGTCGCG 900GTTTCCTCAA CTTTATATCG TGACAGATGT GTGCCTTTGC GAGTATACTT CGCATGGCCA 960CTGTGGGATA CTGCGAGAAG ATGGGACTCT TGATAATACA CAGTCTGTGG ATCGGATTTC1020GGATGTTGCT CTGGCTTATG CTGCCGCCGG AGCCCATTGT GTCGCTCCGT CTGATATGAA1080TGATGGGCGA GTGCGTGCTA TAAAACTGAA GCTTATTGAA GCCGGGATGG CCCACCGTGT1140CCTACTGATG TCCTACAGCG CCAAATTTAG CGGTTGTTTG TACGGCCCTT TCCGTGATGC1200AGCGGGGTCC TGCCCATCAT TCGGGGATCG CAGATGCTAC CAGTTACCAC CCGGAGGCCG1260TGGACTTGCT CGGCGCGCTA TACAGAGAGA TATAGGCGAA GGGGCAGACA TCATAATGGT1320AAAGCCGGCG AGCAGCTACC TGGACATTAT CAGAGACGCA AAAGAAATTG CCAAAGACAT1380TCCCATTGCT GCTTACCAGG TCAGCGGTGA GTATGCTATG ATACATGCTG GTGCCAAGGC1440GGGCGTATTT GACTTGAAAT CCATGGCCTT TGAAAGTACT GAAGGGATTA TAAGGGCTGG1500TGCTGGGATT ATAGTAAGCT ATTTCGTGCC TGATTTTCTA GATTGGCTTT CGAAATGATT1560TAGCTAGATG GAGCGTGATG AAAGCATCCA CCAGATAAAT AGCAGTGACG ATCGCGTTTG1620AATCATACCT ATTGGAGTAG AAGTCTCGGT ATCTCGTTGG GGATTCTCTA GGTTGCTTAT1680TTAACGTAAT GCCACGCCAT GTGTTATATA TTGCCTAAAT ACTTTTATAA AAGATACACC1740AAGCTGATGG TGCCAAGTGA CCACTTCTAA TAAATACAAT TATACCAATT CCTCCGAAAT1800ATGCGGG 1807
(2)SEQ ID NO2的信息(i)序列特征(A)长度375个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(v)片段类型内部(xi)序列描述SEQ ID NO2Met Ser Phe Ser Asn Leu Val Ser Asp Leu Ala Phe Arg Asp Ser His1 5 10 15Asp Asp Arg Ser Ser Gln Ile Ser Gln Val Gln Ser Gln Ala Thr Ala20 25 30Arg Ser Tyr Thr Ser Thr Ala Ala Thr Ser Val Ser Ile Ser Gly Asp35 40 45Ile Ser Ser Gln Leu His Ser Gly Tyr Ser His Pro Leu Ser Arg Ser50 55 60Trp Gln Ala Glu Arg Gln Leu Thr Lys Glu Met Leu Ile Tyr Pro Leu65 70 75 80Phe Ile Thr Asp Asn Pro Asp Glu Glu Thr Pro Ile Pro Ser Leu Pro85 90 95Gly Gln Tyr Arg Arg Gly Leu Asn Arg Leu Val Pro Phe Ile Lys Pro100 105 110Leu Ala His Lys Gly Leu Arg Ser Val Ile Leu Phe Gly Val Pro Leu115 120 125His Pro Ser Ala Lys Asp Ala Leu Gly Thr Ala Ala Asp Asp Pro Ser130 135 140Gly Pro Val Ile Gln Ala Ile Arg Leu Leu Arg Ser Arg Phe Pro Gln145 150 155 160Leu Tyr Ile Val Thr Asp Val Cys Leu Cys Glu Tyr Thr Ser His Gly165 170 175His Cys Gly Ile Leu Arg Glu Asp Gly Thr Leu Asp Asn Thr Gln Ser180 185 190Val Asp Arg Ile Ser Asp Val Ala Leu Ala Tyr Ala Ala Ala Gly Ala195 200 205His Cys Val Ala Pro Ser Asp Met Asn Asp Gly Arg Val Arg Ala Ile210 215 220Lys Leu Lys Leu Ile Glu Ala Gly Met Ala His Arg Val Leu Leu Met225 230 235 240Ser Tyr Ser Ala Lys Phe Ser Gly Cys Leu Tyr Gly Pro Phe Arg Asp245 250 255Ala Ala Gly Ser Cys Pro Ser Phe Gly Asp Arg Arg Cys Tyr Gln Leu260 265 270Pro Pro Gly Gly Arg Gly Leu Ala Arg Arg Ala Ile Gln Arg Asp Ile275 280 285Gly Glu Gly Ala Asp Ile Ile Met Val Lys Pro Ala Ser Ser Tyr Leu290 295 300Asp Ile Ile Arg Asp Ala Lys Glu Ile Ala Lys Asp Ile Pro Ile Ala305 310 315 320Ala Tyr Gln Val Ser Gly Glu Tyr Ala Met Ile His Ala Gly Ala Lys325 330 335Ala Gly Val Phe Asp Leu Lys Ser Met Ala Phe Glu Ser Thr Glu Gly340 345 350
Ile Ile Arg Ala Gly Ala Gly Ile Ile Val Ser Tyr Phe Val Pro Asp355 360 365Phe Leu Asp Trp Leu Ser Lys370 375(2)SEQ ID NO3的信息(i)序列特征(A)长度23对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO3GTNGCNCCNW SNGAYATGAT GGA 23(2)SEQ ID NO4的信息(i)序列特征(A)长度18对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO4GCRTCNCGTR AANCCRTA 18(2)SEQ ID NO5的信息(i)序列特征(A)长度17对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO5GTGGCTCCGA GTGATAT17(2)SEQ ID NO6的信息(i)序列特征
(A)长度18对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO6GCATCGCGAA AAGGACCG18(2)SEQ ID NO7的信息(i)序列特征(A)长度33对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO7GCATATTTAA ATGATGTCCT TTTCTAATCT CGT33(2)SEQ ID NO8的信息(i)序列特征(A)长度30对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO8ATATTAATTA ATCCATCTAG CTAAATCATT30(2)SEQ ID NO9的信息(i)序列特征(A)长度33对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO9
GCGCGAATTC GTNGGNATNG GNATNAAYCA YGG33(2)SEQ ID NO10的信息(i)序列特征(A)长度25对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO10GCGGATCCGG NGGRCARTTN GACAT 25(2)SEQ ID NO11的信息(i)序列特征(A)长度28对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO11GCGAATTCAC NCCNCARGTN TTYGAYAC28(2)SEQ ID NO12的信息(i)序列特征(A)长度26对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO12GCGGATCCRA AYTCNCCNGG RAANGG 26(2)SEQ ID NO13的信息(i)序列特征(A)长度21对碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO13GCGCGAATTC TGGCARTCNA C 21(2)SEQ ID NO14的信息(i)序列特征(A)长度22对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO14GCGCGAATTC TGGCARAGNA TG 22(2)SEQ ID NO15的信息(i)序列特征(A)长度23对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO15GGATCCGACA TYTTNGCCAT NGC 23(2)SEQ ID NO16的信息(i)序列特征(A)长度17对碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型cDNA(xi)序列描述SEQ ID NO16GTYTCRATRT AGAAYTG 17
(2)SEQ ID NO17的信息(i)序列特征(A)长度342个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO17Met His Thr Ala Glu Phe Leu Glu Thr Glu Pro Thr Glu Ile Ser Ser1 5 10 15Val Leu Ala Gly Gly Tyr Asn His Pro Leu Leu Arg Gln Trp Gln Ser20 25 30Glu Arg Gln Leu Thr Lys Asn Met Leu Ile Phe Pro Leu Phe Ile Ser35 40 45Asp Asn Pro Asp Asp Phe Thr Glu Ile Asp Ser Leu Pro Asn Ile Asn50 55 60Arg Ile Gly Val Asn Arg Leu Lys Asp Tyr Leu Lys Pro Leu Val Ala65 70 75 80Lys Gly Leu Arg Ser Val Ile Leu Phe Gly Val Pro Leu Ile Pro Gly85 90 95Thr Lys Asp Pro Val Gly Thr Ala Ala Asp Asp Pro Ala Gly Pro Val100 105 110Ile Gln Gly Ile Lys Phe Ile Arg Glu Tyr Phe Pro Glu Leu Tyr Ile115 120 125Ile Cys Asp Val Cys Leu Cys Glu Tyr Thr Ser His Gly His Cys Gly130 135 140Val Leu Tyr Asp Asp Gly Thr Ile Asn Arg Glu Arg Ser Val Ser Arg145 150 155 160Leu Ala Ala Val Ala Val Asn Tyr Ala Lys Ala Gly Ala His Cys Val165 170 175Ala Pro Ser Asp Met Ile Asp Gly Arg Ile Arg Asp Ile Lys Arg Gly180 185 190Leu Ile Asn Ala Asn Leu Ala His Lys Thr Phe Val Leu Ser Tyr Ala195 200 205Ala Lys Phe Ser G1y Asn Leu Tyr Gly Pro Phe Arg Asp Ala Ala Cys210 215 220Ser Ala Pro Ser Asn Gly Asp Arg Lys Cys Tyr Gln Leu Pro Pro Ala225 230 235 240Gly Arg Gly Leu Ala Arg Arg Ala Leu Glu Arg Asp Met Ser Glu Gly245 250 255Ala Asp Gly Ile Ile Val Lys Pro Ser Thr Phe Tyr Leu Asp Ile Met260 265 270Arg Asp Ala Ser Glu Ile Cys Lys Asp Leu Pro Ile Cys Ala Tyr His275 280 285Val Ser Asp Glu Tyr Ala Met Leu His Ala Ala Ala Glu Lys Gly Val290 295 300Val Asp Leu Lys Thr Ile Ala Phe Glu Ser His Gln Gly Phe Leu Arg305 310 315 320Ala Gly Ala Arg Leu Ile Ile Thr Tyr Leu Ala Pro Glu Phe Leu Asp325 330 335Trp Leu Asp Glu Glu Asn340
(2)SEQ ID NO18的信息(i)序列特征(A)长度330个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO18Met Gln Pro Gln Ser Val Leu His Ser Gly Tyr Phe His Pro Leu Leu1 5 10 15Arg Ala Trp Gln Thr Ala Thr Thr Thr Leu Asn Ala Ser Asn Leu Ile20 25 30Tyr Pro Ile Phe Val Thr Asp Val Pro Asp Asp Ile Gln Pro Ile Thr35 40 45Ser Leu Pro Gly Val Ala Arg Tyr Gly Val Lys Arg Leu Glu Glu Met50 55 60Leu Arg Pro Leu Val Glu Glu Gly Leu Arg Cys Val Leu Ile Phe Gly65 70 75 80Val Pro Ser Arg Val Pro Lys Asp Glu Arg Gly Ser Ala Ala Asp Ser85 90 95Glu Glu Ser Pro Ala Ile Glu Ala Ile His Leu Leu Arg Lys Thr Phe100 105 110Pro Asn Leu Leu Val Ala Cys Asp Val Cys Leu Cys Pro Tyr Thr Ser115 120 125His Gly His Cys Gly Leu Leu Ser Glu Asn Gly Ala Phe Arg Ala Glu130 135 140Glu Ser Arg Gln Arg Leu Ala Glu Val Ala Leu Ala Tyr Ala Lys Ala145 150 155 160Gly Cys Gln Val Val Ala Pro Ser Asp Met Met Asp Gly Arg Val Glu165 170 175Ala Ile Lys Glu Ala Leu Met Ala His Gly Leu Gly Asn Arg Val Ser180 185 190Val Met Ser Tyr Ser Ala Lys Phe Ala Ser Cys Phe Tyr Gly Pro Phe195 200 205Arg Asp Ala Ala Lys Ser Ser Pro Ala Phe Gly Asp Arg Arg Cys Tyr210 215 220Gln Leu Pro Pro Gly Ala Arg Gly Leu Ala Leu Arg Ala Val Asp Arg225 230 235 240Asp Val Arg Glu Gly Ala Asp Met Leu Met Val Lys Pro Gly Met Pro245 250 255Tyr Leu Asp Ile Val Arg Glu Val Lys Asp Lys His Pro Asp Leu Pro260 265 270Leu Ala Val Tyr His Val Ser Gly Glu Phe Ala Met Leu Trp His Gly275 280 285Ala Gln Ala Gly Ala Phe Asp Leu Lys Ala Ala Val Leu Glu Ala Met290 295 300Thr Ala Phe Arg Arg Ala Gly Ala Asp Ile Ile Ile Thr Tyr Tyr Thr305 310 315 320Pro Gln Leu Leu Gln Trp Leu Lys Glu Glu325 330
(2)SEQ ID NO19的信息(i)序列特征(A)长度330个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO19Met His His Gln Ser Val Leu His Ser Gly Tyr Phe His Pro Leu Leu1 5 10 15Arg Ala Trp Gln Thr Thr Pro Ser Thr Val Ser Ala Thr Asn Leu Ile20 25 30Tyr Pro Ile Phe Val Thr Asp Val Pro Asp Asp Val Gln Pro Ile Ala35 40 45Ser Leu Pro Gly Val Ala Arg Tyr Gly Val Asn Gln Leu Glu Glu Met50 55 60Leu Arg Pro Leu Val Glu Ala Gly Leu Arg Cys Val Leu Ile Phe Gly65 70 75 80Val Pro Ser Arg Val Pro Lys Asp Glu Gln Gly Ser Ala Ala Asp Ser85 90 95Glu Asp Ser Pro Thr Ile Glu Ala Val Arg Leu Leu Arg Lys Thr Phe100 105 110Pro Thr Leu Leu Val Ala Cys Asp Val Cys Leu Cys Pro Tyr Thr Ser115 120 125His Gly His Cys Gly Leu Leu Ser Glu Asn Gly Ala Phe Leu Ala Glu130 135 140Glu Ser Arg Gln Arg Leu Ala Glu Val Ala Leu Ala Tyr Ala Lys Ala145 150 155 160Gly Cys Gln Val Val Ala Pro Ser Asp Met Met Asp Gly Arg Val Glu165 170 175Ala Ile Lys Ala Ala Leu Leu Lys His Gly Leu Gly Asn Arg Val Ser180 185 190Val Met Ser Tyr Ser Ala Lys Phe Ala Ser Cys Phe Tyr Gly Pro Phe195 200 205Arg Asp Ala Ala Gln Ser Ser Pro Ala Phe Gly Asp Arg Arg Cys Tyr210 215 220Gln Leu Pro Pro Gly Ala Arg Gly Leu Ala Leu Arg Ala Val Ala Arg225 230 235 240Asp Ile Gln Glu Gly Ala Asp Ile Leu Met Val Lys Pro Gly Leu Pro245 250 255Tyr Leu Asp Met Val Gln Glu Val Lys Asp Lys His Pro Glu Leu Pro260 265 270Leu Ala Val Tyr Gln Val Ser Gly Glu Phe Ala Met Leu Trp His Gly275 280 285Ala Lys Ala Gly Ala Phe Asp Leu Arg Thr Ala Val Leu Glu Ser Met290 295 300Thr Ala Phe Arg Arg Ala Gly A la Asp Ile Ile Ile Thr Tyr Phe Ala305 310 315 320Pro Gln Leu Leu Lys Trp Leu Lys Glu Glu325 330
(2)SEQ ID NO20的信息(i)序列特征(A)长度323个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO20Thr Asp Leu Ile Gln Arg Pro Arg Arg Leu Arg Lys Ser Pro Ala Leu1 5 10 15Pro Arg Met Phe Glu Glu Thr Thr Leu Ser Leu Asn Asp Leu Val Leu20 25 30Pro Ile Phe Val Glu Glu Glu Ile Asp Asp Tyr Lys Ala Val Glu Ala35 40 45Met Pro Gly Val Met Arg Ile Pro Glu Lys His Leu Ala Arg Glu Ile50 55 60Glu Arg Ile Ala Asn Ala Gly Ile Arg Ser Val Met Thr Phe Gly Ile65 70 75 80Ser His His Thr Asp Glu Thr Gly Glu Arg Ala Trp Arg Glu Asp Gly85 90 95Leu Val Ala Arg Met Ser Arg Ile Cys Lys Gln Thr Val Pro Glu Met100 105 110Ile Val Met Ser Asp Thr Cys Phe Cys Glu Tyr Thr Ser His Gly His115 120 125Cys Gly Val Leu Cys Glu His Gly Val Asp Asn Asp Ala Thr Leu Glu130 135 140Asn Leu Gly Lys Gln Ala Val Val Ala Ala Ala Ala Gly Ala Asp Phe145 150 155 160Ile Ala Pro Ser Ala Ala Met Asp Gly Gln Val Gln Ala Ile Arg Gln165 170 175Ala Leu Asp Ala Ala Gly Phe Lys Asp Thr Ala Ile Met Ser Tyr Ser180 185 190Thr Lys Phe Ala Ser Ser Phe Tyr Gly Pro Phe Arg Glu Ala Ala Gly195 200 205Ser Ala Leu Lys Gly Asp Arg Lys Ser Tyr Gln Met Asn Pro Met Asn210 215 220Arg Ala Glu Gly Ile Ala Glu Tyr Leu Leu Asp Glu Ala Gln Gly Ala225 230 235 240Asp Cys Leu Met Val Lys Pro Ala Gly Ala Tyr Leu Asp Ile Val Arg245 250 255Glu Leu Arg Glu Arg Thr Glu Leu Pro Ile Gly Ala Tyr Gln Val Ser260 265 270Gly Glu Tyr Ala Met Ile Lys Phe Ala Ala Leu Ala Gly Ala Ile Asp275 280 285Glu Glu Lys Val Val Leu Glu Ser Leu Gly Ser Ile Lys Arg Ala Gly290 295 300Ala Asp Leu Ile Phe Ser Tyr Phe Ala Leu Asp Leu Ala Glu Lys Lys305 310 315 320Ile Leu Arg(2)SEQ ID NO21的信息(i)序列特征
(A)长度398个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO21His Thr Phe Val Asp Leu Lys Ser Pro Phe Thr Leu Ser Asn Tyr Leu1 5 10 15Ser Phe Ser Ser Ser Lys Arg Arg Gln Pro Pro Ser Leu Phe Thr Val20 25 30Arg Ala Ser Asp Ser Asp Phe Glu Ala Ala Val Val Ala Gly Lys Val35 40 45Pro Glu Ala Pro Pro Val Pro Pro Thr Pro Ala Ser Pro Ala Gly Thr50 55 60Pro Val Val Pro Ser Leu Pro Ile Gln Arg Arg Pro Arg Arg Asn Arg65 70 75 80Arg Ser Pro Ala Leu Arg Ser Ala Phe Gln Glu Thr Thr Leu Ser Pro85 90 95Ala Asn Phe Val Tyr Pro Leu Phe Ile His Glu Gly Glu Glu Asp Thr100 105 110Pro Ile Gly Ala Met Pro Gly Cys Tyr Arg Leu Gly Trp Arg His Gly115 120 125Leu Leu Glu Glu Val Ala Lys Ala Arg Asp Val Gly Val Asn Ser Val130 135 140Val Leu Phe Pro Lys Ile Pro Asp Ala Leu Lys Thr Pro Thr Gly Asp145 150 155 160Glu Ala Tyr Asn Glu Asp Gly Leu Val Pro Arg Ser Ile Arg Leu Leu165 170 175Lys Asp Lys Tyr Pro Asp Leu Ile Ile Tyr Thr Asp Val Ala Leu Asp180 185 190Pro Tyr Ser Ser Asp Gly His Asp Gly Ile Val Arg Glu Asp Gly Val195 200 205Ile Met Asn Asp Glu Thr Val His Gln Leu Cys Lys Gln Ala Val Ala210 215 220Gln Ala Arg Ala Gly Ala Asp Val Val Ser Pro Ser Asp Met Met Asp225 230 235 240Gly Arg Val Gly Ala Met Arg Val Ala Leu Asp Ala Glu Gly Phe Gln245 250 255His Val Ser Ile Met Ser Tyr Thr Ala Lys Tyr Ala Ser Ser Phe Tyr260 265 270Gly Pro Phe Arg Glu Ala Leu Asp Ser Asn Pro Arg Phe Gly Asp Lys275 280 285Lys Thr Tyr Gln Met Asn Pro Ala Asn Tyr Arg Glu Ala Leu Thr Glu290 295 300Met Arg Glu Asp Glu Ser Glu Gly Ala Asp Ile Leu Leu Val Lys Pro305 310 315 320Gly Leu Pro Tyr Leu Asp Ile Ile Arg Leu Leu Arg Asp Asn Ser Pro325 330 335Leu Pro Ile Ala Ala Tyr Gln Val Ser Gly Glu Tyr Ser Met Ile Lys340 345 350Ala Gly Gly Ala Leu Lys Met Ile Asp Glu Glu Lys Val Met Met Glu355 360 365Ser Leu Leu Cys Leu Arg Arg Ala Gly Ala Asp Ile Ile Leu Thr Tyr370 375 380Phe Ala Leu Gln Ala Ala Arg Thr Leu Cys Gly Glu Lys Arg385 390 395
(2)SEQ ID NO22的信息(i)序列特征(A)长度323个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO22Met Ser Gln Ser Phe Asn Arg His Arg Arg Leu Arg Thr Ser Lys Ala1 5 10 15Met Arg Glu Met Val Lys Glu Thr Arg Leu His Pro Ser Asp Phe Ile20 25 30Tyr Pro Ile Phe Val Val Glu Gly Leu Glu Gly Lys Lys Ala Val Pro35 40 45Ser Met Pro Asp Val His His Val Ser Leu Asp Leu Leu Lys Asp Glu50 55 60Val Ala Glu Leu Val Lys Leu Gly Ile Gln Ser Val Ile Val Phe Gly65 70 75 80Ile Pro Glu Glu Lys Asp Asp Cys Gly Thr Gln Ala Tyr His Asp His85 90 95Gly Ile Val Gln Lys Ala Ile Thr Glu Ile Lys Glu His Phe Pro Glu100 105 110Met Val Val Val Ala Asp Thr Cys Leu Cys Glu Tyr Thr Asp His Gly115 120 125His Cys Gly Leu Val Lys Asp Gly Val Ile Leu Asn Asp Glu Ser Leu130 135 140Glu Leu Leu Ala Gln Thr Ala Val Ser Gln Ala Lys Ala Gly Ala Asp145 150 155 160Ile Ile Ala Pro Ser Asn Met Met Asp Gly Phe Val Thr Val Ile Arg165 170 175Glu Ala Leu Asp Lys Glu Gly Phe Val Asn Ile Pro Ile Met Ser Tyr180 185 190Ala Val Lys Tyr Ser Ser Glu Phe Tyr Gly Pro Phe Arg Asp Ala Ala195 200 205Asn Ser Thr Pro Gln Phe Gly Asp Arg Lys Thr Tyr Gln Met Asp Pro210 215 220Ala Asn Arg Met Glu Ala Leu Arg Glu Ala Gln Ser Asp Val Glu Glu225 230 235 240Gly Ala Asp Phe Leu Ile Val Lys Pro Ser Leu Ser Tyr Met Asp Ile245 250 255Met Arg Asp Val Lys Asn Glu Phe Thr Leu Pro Leu Val Ala Tyr Val260 265 270Ser Gly Glu Tyr Ser Met Val Lys Ala Ala Ala Gln Asn Gly Trp Ile275 280 285Lys Glu Lys Glu Ile Val Leu Glu Ile Leu Thr Ser Met Lys Arg Ala290 295 300Gly Ala Asp Leu Ile Ile Thr Tyr His Ala Lys Asp Ala Ala Lys Trp305 310 315 320Leu Ala Glu(2)SEQ ID NO23的信息(i)序列特征
(A)长度424个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型无(xi)序列描述SEQ ID NO23Met Met Ala Ser Thr Phe Asn Ile Pro Cys Asn Ala Gly Thr Ile Lys1 5 10 15Asn Phe Asn Asn Ser Gln Arg Asn Leu Gly Phe Ser Ser Asn Leu Gly20 25 30Ile Asn Phe Ala Lys Thr Arg Phe Ser Asn Cys Gly Asp Ser Gly Arg35 40 45Ile Pro Ser Gln Leu Val Val Arg Ala Ser Glu Arg Arg Asp Asn Leu50 55 60Thr Gln Gln Lys Thr Gly Leu Ser Ile Glu Glu Cys Glu Ala Ala Val65 70 75 80Val Ala Gly Asn Ala Pro Ser Ala Pro Pro Val Pro Pro Thr Pro Lys85 90 95Ala Pro Ser Gly Thr Pro Ser Val Ser Pro Leu Ser Leu Gly Arg Arg100 105 110Pro Arg Arg Asn Arg Thr Ser Pro Val Phe Arg Ala Ala Phe Gln Glu115 120 125Thr Thr Leu Ser Pro Ala Asn Val Val Tyr Pro Leu Phe Ile His Glu130 135 140Gly Glu Glu Asp Thr Pro Ile Gly Ala Met Pro Gly Cys Tyr Arg Leu145 150 155 160Gly Trp Arg His Gly Leu Val Glu Glu Val Ala Lys Ala Arg Asp Val165 170 175Val Val Asn Ser Ile Val Val Phe Pro Lys Pro Asp Ala Leu Lys Ser180 185 190Pro Thr Gly Asp Glu Ala Tyr Asn Glu Asn Gly Leu Val Pro Arg Thr195 200 205Ile Arg Met Leu Lys Asp Lys Phe Pro Asp Leu Ile Ile Tyr Thr Asp210 215 220Val Ala Leu Asp Pro Tyr Tyr Tyr Asp Gly His Asp Gly Ile Val Thr225 230 235 240Gln His Gly Val Ile Met Asn Asp Glu Thr Val His Gln Leu Cys Lys245 250 255Gln Ala Val Ala Gln Ala Arg Ala Gly Ala Asp Val Val Ser Pro Ser260 265 270Asp Met Met Asp Gly Arg Val Gly Ala Ile Arg Ala Ala Leu Asp Ala275 280 285Glu Gly Tyr Ser Asn Val Ser Ile Met Ser Tyr Thr Ala Lys Tyr Ala290 295 300Ser Ser Phe Tyr Pro Arg Phe Gly Asp Lys Lys Thr Tyr Gln Met Asn305 310 315 320Pro Ala Asn Tyr Arg Glu Ala Leu Ile Glu Thr Gln Glu Asp Glu Ser325 330 335Glu Gly Ala Asp Ile Leu Leu Val Lys Pro Gly Leu Pro Tyr Leu Asp340 345 350Ile Ile Arg Leu Leu Arg Asp Asn Ser Asp Leu Pro Ile Ala Ala Tyr355 360 365Gln Val Ser Gly Glu Tyr Ser Met Ile Lys Ala Gly Gly Val Leu Lys370 375 380Met Ile Asp Glu Glu Lys Val Met Leu Glu Ser Leu Leu Cys Leu Arg385 390 395 400Arg Ala Gly Ala Asp Ile Ile Leu Thr Tyr Phe Ala Leu Gln Ala Ala405 410 415Arg Cys Leu Cys Gly Glu Lys Arg420
权利要求
1.一种基本上纯化的胆色素原合酶,该酶(a)得自一种曲霉菌株;(b)具有一个氨基酸序列,该氨基酸序列与SEQ ID NO2所描述的氨基酸序列有至少50%同源性;或者(c)为一个核酸序列所编码,该核酸序列能够在高度严格条件下与一种探针进行杂交,该探针在所说的条件下与SEQ ID NO1所描述的核酸序列杂交。
2.按照权利要求1的胆色素原合酶,该胆色素原合酶得自一种米曲霉菌株。
3.按照权利要求2的胆色素原合酶,该胆色素原合酶得自米曲霉IFO4177或其突变体菌株。
4.按照权利要求1的胆色素原合酶,该胆色素原合酶具有与SEQ IDNO2所描述的氨基酸序列有至少50%、优选为至少60%、更优选为至少70%、更优选为至少80%、以及最优选为至少90%的同源性的一个氨基酸序列。
5.按照权利要求4的胆色素原合酶,该酶具有SEQ ID NO2所描述的氨基酸序列。
6.按照权利要求1的胆色素原合酶,该酶为一个核酸序列所编码,该核酸序列能够在高度严格条件下与一种探针进行杂交,该探针在所说的条件下与SEQ ID NO1所描述的核酸序列杂交。
7.一种分离的核酸片段,该核酸片段包含编码权利要求1的胆色素原合酶的核酸序列。
8.按照权利要求7的核酸片段,其中的核酸序列编码得自米曲霉的胆色素原合酶。
9.按照权利要求8的核酸片段,其中的核酸序列编码得自米曲霉IFO4177的胆色素原合酶。
10.按照权利要求9的核酸片段,其中的核酸序列描述在SEQ IDNO1中。
11.按照权利要求7的核酸片段,该核酸片段包含编码胆色素原合酶的核酸序列,该胆色素原合酶具有与SEQ ID NO2所描述的氨基酸序列有至少50%、优选为至少60%、更优选为至少70%、更优选为至少80%、以及最优选为至少90%的同源性的一个氨基酸序列。
12.按照权利要求7的核酸片段,该核酸片段能够在高度严格条件下与一种探针进行杂交,该探针在所说的条件下与SEQ ID NO1所描述的核酸序列杂交。
13.一种包含权利要求7的核酸片段的核酸构建体,该核酸片段可操作地连接到能够指导上述胆色素原合酶在合适的表达宿主中表达的调节区上。
14.一种包含权利要求13的核酸构建体的重组载体。
15.按照权利要求14的载体,其中的核酸序列可操作地连接到一个启动子序列上。
16.按照权利要求15的载体,该载体还包含一个转录终止信号。
17.按照权利要求15的载体,该载体还包含一个选择性标记。
18.一种包含权利要求13的核酸构建体的重组宿主细胞。
19.按照权利要求18的宿主细胞,其中的核酸构建体包含在一个载体上。
20.按照权利要求18的宿主细胞,其中的宿主细胞是细菌细胞。
21.按照权利要求18的宿主细胞,其中的宿主细胞是真菌细胞。
22.按照权利要求21的宿主细胞,其中的真菌细胞是丝状真菌细胞。
23.按照权利要求22的宿主细胞,其中的丝状真菌细胞是顶孢霉属、曲霉属、镰刀菌属、腐质霉属、毁丝霉属、毛霉属、脉孢菌属、青霉菌属、梭孢壳属、Tolypocladium或者木霉属物种的细胞。
24.按照权利要求21的宿主细胞,其中的真菌细胞是酵母细胞。
25.按照权利要求24的宿主细胞,其中的酵母细胞是酵母属或者裂殖酵母属的菌株。
26.按照权利要求18的宿主细胞,其中的核酸构建体被整合到宿主细胞基因组中。
27.一种产生权利要求1的胆色素原合酶的方法,该方法包括(a)培养曲霉属菌株以产生胆色素原合酶;以及(b)回收胆色素原合酶。
28.一种产生权利要求1的胆色素原合酶的方法,该方法包括(a)培养包含核酸构建体的宿主细胞,该核酸构建体包含在有助于胆色素原合酶表达的条件下编码胆色素原合酶的核酸序列;以及(b)回收胆色素原合酶。
全文摘要
本发明涉及曲霉属胆色素原合酶和包含核酸序列的分离核酸片段,所说的核酸序列编码该胆色素原合酶,也编码核酸构建体、载体和包含该核酸序列的重组宿主细胞。本发明也涉及到产生胆色素原合酶的方法。
文档编号C12N9/10GK101024841SQ200610093680
公开日2007年8月29日 申请日期1997年6月9日 优先权日1996年6月10日
发明者A·琼斯, J·R·查瑞 申请人:诺沃奇梅兹有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1