具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸的制造方法与工艺

文档序号:11056907阅读:392来源:国知局
具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸涉及序列表本申请含有计算机可读形式的序列表,所述计算机可读形式通过提述并入本文。涉及生物材料的保藏本申请包含对于生物材料保藏的引用,所述保藏通过提述并入本文。对于其完整信息,参见说明书最后一段。发明背景发明领域本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法,和本发明的葡糖淀粉酶用于淀粉转化以产生发酵产物如乙醇,和糖浆如葡萄糖的用途。本发明还涉及包含本发明的葡糖淀粉酶的组合物。相关领域描述葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,EC3.2.1.3)是催化从淀粉或相关的寡糖和多糖分子的非还原端释放D-葡萄糖的酶。葡糖淀粉酶由几种丝状真菌和酵母产生,其中来自曲霉属(Aspergillus)的那些在商业上最为重要。商业上,使用葡糖淀粉酶将已经由α-淀粉酶部分水解的淀粉材料转化为葡萄糖。然后可使用发酵生物将葡萄糖直接或间接地转化为发酵产物。商业性发酵产物的实例包括醇(例如乙醇,甲醇,丁醇,1,3-丙二醇),有机酸(例如柠檬酸,乙酸,衣康酸,乳酸,葡糖酸,葡糖酸盐,乳酸,琥珀酸,2,5-二酮-D-葡糖酸);酮(例如丙酮);氨基酸(例如谷氨酸);气体(例如H2和CO2),和更复杂的化合物,包括例如抗生素(例如青霉素和四环素);酶;维生素(例如核黄素,B12,β-胡萝卜素);激素,和其他难以合成产生的化合物。发酵工艺亦常用于可饮用醇类(例如啤酒和葡萄酒)工业。终产物亦可为糖浆。例如,终产物可为葡萄糖,但亦可例如由葡萄糖异构酶转化为果糖或由几乎等量的葡萄糖和果糖构成的混合物。该混合物,或进一步富集果糖的混合物,是整个世界商业化的最常用的高果糖玉米糖浆(HFCS)。本发明的一个目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸,其在发酵产物生产工艺(如乙醇生产工艺,包括由未糊化的生(或未烹制)淀粉的一步乙醇发酵工艺)中提供高产率/得率(yield)。Uniprot:B0CVJ1公开了来自双色蜡蘑(Laccariabicolor)的多肽且WO2006/069289描述了来自瓣环栓菌(Trametescingulata)的葡糖淀粉酶。发明概述已鉴定并表征了由真菌血红密孔菌(Pycnoporussanguineus)产生并具有葡糖淀粉酶活性的多肽。相应地,本发明在第一个方面涉及具有葡糖淀粉酶活性的分离的多肽,选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽具有优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;(b)多肽,其包含氨基酸序列,所述氨基酸序列与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸22至476所示的催化域具有优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;(c)多肽,其由多核苷酸编码,所述多核苷酸在优选至少中-高严格条件下,并且最优选在高严格条件下与以下杂交:(i)SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列;(ii)包含于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(d)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列具有优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;和(e)SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽的包含一个或多个(几个)氨基酸的取代、缺失和/或插入变体。本发明在第二个方面涉及分离的多核苷酸,其包含编码第一个方面的多肽的核苷酸序列。在进一步的方面,本发明涉及包含第二个方面的多核苷酸的核酸构建体,重组表达载体,重组宿主细胞,转基因植物、植物部分或植物细胞。在又进一步的方面,本发明涉及产生所述多肽的方法,所述多肽的用途,和包含α-淀粉酶和所述多肽的组合物。定义葡糖淀粉酶:术语葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,3.2.1.3)定义为催化从淀粉或相关的寡糖和多糖分子的非还原端释放D-葡萄糖的酶。就本发明而言,葡糖淀粉酶活性根据下文“材料和方法”部分描述的步骤确定。本发明的多肽具有SEQIDNO:2的成熟多肽或其同源序列,或者SEQIDNO:4的成熟多肽或其同源序列,或者SEQIDNO:6的成熟多肽或其同源序列的葡糖淀粉酶活性的至少20%,优选至少40%,优选至少45%,更优选至少50%,优选至少55%,更优选至少60%,优选至少65%,更优选至少70%,优选至少75%,更优选至少80%,优选至少85%,甚至更优选至少90%,最优选至少95%,和甚至最优选至少100%。分离的多肽:术语“分离的多肽”用于本文中指从来源分离的多肽。优选地,所述多肽如通过SDS-PAGE测定的,为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如,这能够通过以下实现:通过公知的重组方法或由经典纯化方法制备多肽。成熟多肽:术语“成熟多肽”意指为以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,基于预测SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸1至18是信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),所述成熟多肽是SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸19至573。优选地,所述成熟多肽是SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸19至573。由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸22至476定义的序列是催化域,而由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸479至573定义的序列是淀粉结合域。成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。优选地,所述成熟多肽编码序列是由SEQIDNO:1的位置55至159,229至505,573至877,932至1207,1269至1731,1800至1895,1962至2104,SEQIDNO:3或SEQIDNO:5的位置55至159,229至504,571至876,942至1217,1276至1738,1806至1901,1960至2102定义的核苷酸。同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。就本发明而言,两个氨基酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277)(优选3.0.0版或更高版本)的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的可选参数为缺口开启罚分(gapopenpenalty)10,缺口延伸罚分(gapextensionpenalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性(longestidentity)”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下:(同样的残基×100)/(比对长度-比对中缺口的总数)就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上文)(优选3.0.0版或更高版本)的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的可选参数为缺口开启罚分10,缺口延伸罚分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下:(同样的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)同源序列:术语“同源序列”在本文中定义为分别与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码部分,或者与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽具有至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,和甚至最优选至少95%,如至少96%,至少97%,至少98%,或甚至至少99%同一性程度的核苷酸序列/多肽序列。多肽片段:术语“多肽片段”在本文中定义为从SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽;其中所述片段具有葡糖淀粉酶活性。优选地,片段含有SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列的至少500个氨基酸残基,更优选至少450个氨基酸残基,和最优选至少400个氨基酸残基。具体片段是由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的的氨基酸22至476定义的序列,其包含本发明的多肽的催化域。亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列或其同源序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列;其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选地,亚序列含有SEQIDNO:1的成熟多肽编码序列、SEQIDNO:3的成熟多肽编码序列或SEQIDNO:5的成熟多肽编码序列或其同源序列的至少1500个核苷酸,更优选至少1400个核苷酸,和最优选至少1200个核苷酸。等位变体(allelicvariant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。分离的多核苷酸:术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。优选地,多核苷酸如通过琼脂糖电泳测定的,为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即,所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。cDNA:术语“cDNA”在本文中定义为可通过逆转录从自真核细胞获得的成熟的、剪接的mRNA分子制备的DNA分子。cDNA缺乏通常存在于相应的基因组DNA中的内含子序列。该起始的、初级的RNA转录物是mRNA的前体,其经历一系列步骤,最后作为成熟的、剪接的mRNA出现。这些步骤包括通过称作剪接的过程去除内含子序列。因此,来源于mRNA的cDNA不含任何内含子序列。核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(nototherwiseexist)自然界中的方式修饰以含有核酸的区段,或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence):术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。修饰:术语“修饰”在本文的意思是,对分别由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列组成的多肽的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的置换。变体:当用于本文,术语“变体”意指具有葡糖淀粉酶活性的多肽,其在一个或多个(几个)位置包含改变,即一个或多个(几个)氨基酸残基的取代、插入和/或缺失。取代意指用不同的氨基酸取代占据某位置的氨基酸;缺失意指去除占据某位置的氨基酸;而插入意指邻接占据某位置的氨基酸添加1-3个氨基酸。发明详述具有葡糖淀粉酶活性的多肽在第一个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽(在下文中称为“同源多肽”),所述多肽包含氨基酸序列,所述氨基酸序列与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽具有优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%的同一性程度。优选地,所述同源多肽具有氨基酸序列,所述氨基酸序列与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。本发明的多肽优选包含SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列或其等位变体,或其具有葡糖淀粉酶活性的片段。在另一个优选的方面,所述多肽包含SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其等位变体,或其具有葡糖淀粉酶活性的片段。在另一个优选的方面,所述多肽由SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列或其等位变体,或其具有葡糖淀粉酶活性的片段组成。在第二个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其由多核苷酸编码,所述多核苷酸在优选非常低严格条件,更优选低严格条件,更优选中等严格条件,更优选中等-高严格条件,甚至更优选高严格条件,和最优选优选非常高严格条件下与以下杂交:(i)SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列;(ii)包含于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的cDNA序列,(iii)(i)或(ii)的亚序列;或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸,或优选至少200个连续的核苷酸。而且,所述亚序列可编码具有葡糖淀粉酶活性的多肽片段。优选地,所述互补链是SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列的全长互补链。SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的核苷酸序列,或其亚序列,以及SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列,或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针的长度可为至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。可使用甚至更长的探针,例如长度为优选至少600个核苷酸,更优选至少700个核苷酸,甚至更优选至少800个核苷酸,或最优选至少900个氨基酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用33P、32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至并且固定于硝化纤维素(nitrocellulose)或其它合适的载体材料。为了鉴定与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5,或其亚序列同源的克隆或DNA,将所述载体材料优选用于Sounthern印迹中。就本发明而言,杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列;包含于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的cDNA序列;其全长互补链;或它们的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。优选地,核酸探针是SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列。在另一个优选的方面,核酸探针是编码SEQIDNO:2的多肽的多核苷酸序列,或其亚序列。在另一个优选的方面,核酸探针是SEQIDNO:1。在另一个优选的方面,核酸探针是大肠杆菌菌株DSM23221中的质粒中包含的多核苷酸序列,其中其多核苷酸序列编码具有葡糖淀粉酶活性的多肽。在另一个优选的方面,核酸探针是大肠杆菌菌株DSM23221中的质粒中包含的成熟多肽编码区。在另一个优选的方面,核酸探针是SEQIDNO:3的成熟多肽编码序列。在另一个优选的方面,核酸探针是编码SEQIDNO:4的多肽的多核苷酸序列,或其亚序列。在另一个优选的方面,核酸探针是SEQIDNO:3。在另一个优选的方面,核酸探针是SEQIDNO:5的成熟多肽编码序列。在另一个优选的方面,核酸探针是编码SEQIDNO:6的多肽的多核苷酸序列,或其亚序列。在另一个优选的方面,核酸探针是SEQIDNO:5。对于长度至少100个核苷酸的长探针,非常低至非常高的严格条件定义为在42℃,在5XSSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,以及对于非常低和低严格性为25%的甲酰胺,对于中等和中-高严格性为35%的甲酰胺,或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选在45℃(非常低严格性),更优选在50℃(低严格性),更优选在55℃(中等严格性),更优选在60℃(中等-高严格性),甚至更优选在65℃(高严格性),并且最优选在70℃(非常高严格性)将载体材料最终洗涤三次,每次15分钟。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使用根据Bolton和McCarthy的计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)计算的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodiumpyrophosphate),1mM磷酸二氢钠(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6×SSC加0.1%SDS中洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。在第三个方面,本发明涉及由多核苷酸编码的具有葡糖淀粉酶活性的分离的多肽,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的成熟多肽编码序列具有至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,最优选至少95%,和甚至最优选至少96%,97%,98%,或99%的同一性程度,并编码活性多肽。参见下文多核苷酸部分。本发明还涉及SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的成熟多肽或其同源序列的包含取代、缺失和/或插入一个或多个(几个)氨基酸的人工变体。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;小缺失,通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且例如由H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了用20个标准氨基酸,也可用非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽中的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。或者,氨基酸变化可为这样的性质,其使得所述多肽的物理化学性质改变。例如,氨基酸变化可改善多肽的热稳定性,改善其底物特异性,改变最适pH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的葡糖淀粉酶活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而确定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来确定。参见例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利No.5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。成熟多肽,如SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸19至573,或者催化域,如SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸22至476的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。具有葡糖淀粉酶活性的多肽的来源本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。优选地,获得自给定来源的多肽是胞外分泌的。本发明的具有葡糖淀粉酶活性的多肽亦可为具有葡糖淀粉酶活性的细菌多肽,酵母多肽,或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、密瑚菌属(Artomyces)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、Chaetomidium、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、粘褶菌属(Gloeophyllum)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、密孔菌属(Pycnoporus)、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。在一个更优选的方面,所述多肽是具有葡糖淀粉酶活性的密孔菌属菌种多肽。具体而言所述密孔菌属菌种是血红密孔菌。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的身份(identity)。这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够通过使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们符合读框(inframe),并且使融合多肽的表达在相同启动子和终止子的控制下。融合多肽还可以包括切割位点。一旦分泌了融合蛋白,就切割所述位点,从融合蛋白质释放具有葡糖淀粉酶活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过GenenaseI切割(Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,DrugDiscoveryWorld4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。多核苷酸本发明还涉及分离的多核苷酸,其包含编码本发明具有葡糖淀粉酶活性的多肽的核苷酸序列或由所述核苷酸序列组成。优选地,所述核苷酸序列包含SEQIDNO:1或由SEQIDNO:1组成。在另一个更优选的方面,所述核苷酸序列包含大肠杆菌DSM23221中包含的质粒中包含的序列或由所述序列组成。在另一个优选的方面,所述核苷酸序列包含SEQIDNO:1的成熟多肽编码序列或由SEQIDNO:1的成熟多肽编码序列组成。在另一个更优选的方面,所述核苷酸序列包含大肠杆菌DSM23221中包含的质粒中包含的成熟多肽编码序列或由所述成熟多肽编码序列组成。本发明还涵盖编码下述多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽或由SEQIDNO:2的氨基酸序列或其成熟多肽组成,所述核苷酸序列由于遗传密码的简并性与SEQIDNO:1或其成熟多肽编码序列有差异。本发明还涉及SEQIDNO:1的亚序列,其编码SEQIDNO:2的具有葡糖淀粉酶活性的片段。本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQIDNO:1的成熟多肽编码序列中包含至少一个突变或由在SEQIDNO:1的成熟多肽编码序列中具有至少一个突变的序列组成,其中所述突变核苷酸序列编码SEQIDNO:2的成熟多肽。优选地,所述核苷酸序列包含SEQIDNO:3或由SEQIDNO:3组成。在另一个优选的方面,所述核苷酸序列包含SEQIDNO:3的成熟多肽编码序列或由SEQIDNO:3的成熟多肽编码序列组成。本发明还涵盖编码下述多肽的核苷酸序列,所述多肽包含SEQIDNO:4的氨基酸序列或其成熟多肽或由SEQIDNO:4的氨基酸序列或其成熟多肽组成,所述核苷酸序列由于遗传密码的简并性与SEQIDNO:3或其成熟多肽编码序列有差异。本发明还涉及SEQIDNO:3的亚序列,其编码SEQIDNO:4的具有葡糖淀粉酶活性的片段。本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQIDNO:3的成熟多肽编码序列中包含至少一个突变或由在SEQIDNO:3的成熟多肽编码序列中具有至少一个突变的...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1