一种新的谷氨酰胺酶及其基因和生产方法

文档序号:560439阅读:789来源:国知局
专利名称:一种新的谷氨酰胺酶及其基因和生产方法
技术领域
本发明涉及一种新的谷氨酰胺酶和编码这种酶的基因。本发明的谷氨酰胺酶可用作食品加工中的酶从而将谷氨酰胺转化为谷氨酸,以使食物表现出更强的“鲜味”(“umami”)味道。
背景技术
为了生产含有蛋白水解产物的酱油、日本豆酱(miso)和其他天然的调味品,曲霉(一种属于曲霉属的丝状真菌)得到应用。例如,酱油的生产经过制曲和发酵两个步骤。在制曲的过程中,曲霉产生的酶催化分解了大部分的原料。在这个过程中,为了使酱油具有更强的“鲜味”味道,增加各种调料的谷氨酸含量是重要的。
谷氨酸可以通过两种途径制得。第一种途径是在蛋白酶和肽酶的作用下,蛋白质释放谷氨酸。第二种途径是在谷氨酰胺酶(酰胺水解酶)的作用下,催化谷氨酰胺水解产生谷氨酸。
在酱油的生产过程中,与原料中谷氨酸的含量相比,谷氨酸的释放率不太高,认为这是由于曲霉的谷氨酰胺酶的活性不足造成的。因此,人们尝试通过融合固体曲霉中高蛋白酶活力的菌株和高谷氨酰胺酶活力的菌株以培养具有高蛋白酶活力和谷氨酰胺酶活力的菌株(Ushijima,S.等,农业生物化学(Agric.Biol.Chem.),51(4),1051(1987),日本专利公开(KOKOKU)No.Hei 3-73271/1992)。
对于谷氨酰胺酶,源自各种细菌和动物的谷氨酰胺酶已被深入研究(Wakayama,M.等,发酵生物工程杂志(J.Ferment.Bioeng.),82,No.6,592-597(1996),Chung-Bok,Mi,等生物化学杂志(Biochem.J.),324,193-200(1997),Duran,S.等,生物化学遗传学(Biochem.Genet.),34,453-465(1996))。另一方面,虽然有关谷氨酰胺酶的研究进展缓慢,但是在一种米曲霉(Aspergillusoryzae)的菌株中,已提取并鉴定了胞内和胞外的谷氨酰胺酶(Yano,T.等发酵技术杂志(J.,Ferment.Technol.),66卷,No.2,137-143(1988))。这些谷氨酰胺酶的分子量约是113,000,且基本上具有类似的特性。
另外,纯化米曲霉HG菌株的谷氨酰胺酶的N一末端氨基酸序列已得到测定,(Fukuoka工业技术中心,生物学与食品研究所,1996年研究小结(199)Fukuoka Industrial Technology Center,Instituteof Biology and Food Research Summary of 1996(199))并且源于米曲霉谷氨酰胺酶的部分N-末端氨基酸序列(Food ReseachInstitute,Aichi Prefectural Government,Japan,Annual Reportof 1995(Research Report)pp.3-4,(1996))已得到测定。
同时,由于曲霉具有良好的分泌胞外蛋白的能力,因而作为重组蛋白且尤其是一些酶制备的宿主(菌)其已引起了广泛的关注。
发明详述如上所述,曲霉已作为一种原料用于基因重组技术,并且其分泌的谷氨酰胺酶也得到了一定的研究。然而,曲霉并没有得到充分的研究,并且对其更进一步的研究是必要的。此外,还没有任何编码曲霉谷氨酰胺酶的基因得到分离。
就上述情况而言,本发明已经加以完成,且本发明的目的是提供编码曲霉谷氨酰胺酶的基因。
本发明的发明者已经成功地从米曲霉中纯化了谷氨酰胺酶,测定了其部分氨基酸序列,并根据已获得的信息分离出编码该谷氨酰胺酶的DNA,因而,本发明得以完成。而且,他们还成功地从构巢曲霉(Aspergillus nidulans)中分离编码谷氨酰胺酶的DNA。
本发明提供以下的组分(1)一种如下述(A)到(D)任意一项中所定义的蛋白质(A)一种具有序列表SEQ ID NO:2中的1-670位的氨基酸序列的蛋白质;(B)一种具有序列表SEQ ID NO:22中的1-669位的氨基酸序列的蛋白质;(C)一种具有序列表SEQ ID NO:2中的1-670位的氨基酸序列的蛋白质,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;(D)一种具有序列表SEQ ID NO:22中的1-669位的氨基酸序列的蛋白质,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;
(2)编码如下(A)到(D)任意一项中所定义蛋白质的DNA(A)一种具有序列表SEQ ID NO:2中的1-670位的氨基酸序列的蛋白质;(B)一种具有序列表SEQ ID NO:22中的1-669位的氨基酸序列的蛋白质;(C)一种具有序列表SEQ ID NO:2中的1-670位的氨基酸序列的蛋白质,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;(D)一种具有序列表SEQ ID NO:22中的1-669位的氨基酸序列的蛋白质,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;(3)为下面(a)到(d)项中任意一项中所定DNA的上述(2)的DNA(a)一种DNA分子,该DNA分子包含序列表SEQ ID NO:1中的1174-1370、1446-1741、1800-2242、2297-2880、2932-3134、3181-3324、3380-3515、3562-3628位的核苷酸按上述顺序所组成的序列;(b)一种DNA分子,该DNA分子包含序列表中SEQ ID NO:21的1807-2000、2061-2353、2412-2854、2915-3498、3554-3756、3806-3949、3996-4131、4180-4246位的核苷酸按上述顺序所组成的序列;(c)一种在严格条件下能与(a)中DNA分子杂交的DNA分子,该DNA分子编码一种具有催化谷氨酰胺水解成谷氨酸和氨活性的蛋白质;(d)一种在严格条件下能与(b)中DNA分子杂交的DNA分子,该DNA分子编码一种具有催化谷氨酰胺水解成谷氨酸和氨活性的蛋白质;(4)(2)的DNA分子,该DNA分子具有SEQ ID NO:1或SEQ IDNO:17中的核苷酸序列;(5)(3)的DNA分子,该DNA分子具有SEQ ID NO:21或SEQ IDNO:25中的核苷酸序列;(6)一种重组载体,该栽体包括插入到该栽体内的(2)的DNA;(7)一种微生物转化子,该转化子导入(2)的DNA分子且该DNA分子可被表达并产生谷氨酰胺酶;(8)权利要求7的转化子,该转化子来源于丝状真菌或杆菌属(Escherichia)的细菌;(9)一种制备谷氨酰胺酶的方法,该方法包括在培养基中培养(7)的转化体从而在培养物中制备谷氨酰胺酶。
本说明书中使用的“谷氨酰胺酶活性”是指催化L-型谷氨酰胺水解成L-型谷氨酸和氨的活性,且这种活性可包括催化D-型谷氨酰胺水解成D-型谷氨酸和氨的活性。这种活性也可包括催化L-型谷氨酰胺水解成L-型谷氨酸和氨和催化D-型谷氨酰胺水解成D-型谷氨酸和氨的活性以及催化L-γ-谷氨酰复合物的谷氨酰基转移或水解的活性。本说明书的两个实施方案公开为本发明的的谷氨酰胺酶。一个、两个或者是其等价的实施方案偶尔可称为本发明的谷氨酰胺酶。同样,编码本发明谷氨酰胺酶的基因偶尔可称为谷氨酰胺酶基因。
本发明的谷氨酰胺酶与在曲霉中提取的谷氨酰胺酶存在酶学特性方面是有差异的,因此可认为其是一种新的谷氨酰胺酶。
本发明将详述如下(1)本发明的谷氨酰胺酶通过纯化,可从例如,米曲霉RIB40(ATCC 42149)的培养物中获取本发明的谷氨酰胺酶。具体步骤如下。
用麸皮培养米曲霉RIB40(ATCC 42149),并将制得的麸曲浸泡在缓冲液中,以获取酶的粗提液。酶的粗提液经过冷冻和融化,去除不溶部分,得到上清液。上清液用硫酸铵分级分离从而获取可沉淀于85%饱和硫酸铵溶液,而不能在55%饱和硫酸铵中沉淀的部分。去除组分中的硫酸铵后,产物再通过离子交换层析、疏水层析和凝胶过滤层析进一步进行分离,以获得纯化的谷氨酰胺酶。至于用于层析的树脂,例如用于阴离子交换层析的DEAE-TOYOPEARL(Tosoh),用于疏水层析的苯基琼脂糖凝胶(Phenyl Sepharose)(Pharmacia),用于凝胶过滤层析的Superdex(Pharmacia)。这些纯化步骤可以重复执行。
在纯化谷氨酰胺酶的每一步骤中,根据谷氨酰胺酶的活性,选取所需谷氨酰胺酶的部分。谷氨酰胺酶的活性可以通过改进的Hartman方法进行测定(Hartman,S.C..,生物学化学杂志(J.Biol.Chem.),243,853-863(1968),氧肟酸(hydroxamate)方法)。
从麸曲米曲霉RIB40(ATTC 42149)中获得的谷氨酰胺酶和已知谷氨酰胺酶的酶学特征一起在表1中列出,已知的谷氨酰胺酶为从米曲霉(Yano,T.等,发酵技术杂志(J.Ferment.Technol.),66卷(Vol.66),No.2,137-143(1988))和枯草芽孢杆菌(Shimazu,H.等,J.Brew.Soc.Japan,86,No.6,441-446)获得的谷氨酰胺酶。
表1本发明和已知谷氨酰胺酶的酶学特性本发明的谷氨酰胺酶 构巢曲酶中获得的谷 枯草芽孢杆菌中获得氨酰胺酶Yano,T. 的谷氨酰胺酶等 Shimazu,H.等分子量 82,0901)113,0002)55,000最适pH pH9 pH9 pH6pH稳定性 pH7 pH9 pH5-8最适温度 37-45℃ 45℃50℃温度稳定性 0-45℃ 0-37℃ 0-45℃耐盐性3)NaCl浓度为5%时, NaCl浓度为10%时, NaCl浓度为5%时,具有50%活性具有50%活性具有100%活性NaCl浓度为18%时, NaCl浓度为18%时, NaCl浓度为25%时,具有20%活性具有10%活性具有85%或更高活性底物特异性4)L-Gh(100%) L-Gln(100%)L-Gln(100%)D-Gln(106%)D-Gln(2%) D-Gln(67%)L-Asn(97%) L-Asn(0%) L-Asn(0%)D-Asn(104%)D-Asn(0%) D-Asn(0%)反应特异性 γ-Glu-p-NA γ-Glu-p-NA γ-Glu-p-NA(未测试)转移率5)(10%) (0%) (0%)水解率6)(16%) (131%) (0%)米氏常数1.24×10-3M 9.6×10-5M 6.4×10-4M1)用MALDI-TOFMS测定2)用凝胶过滤测定3)以NaCl不存在时的活性定义为100%时的相对值。
4)以L-谷氨酸(L-Gln)活性为100%时的相对活性值。
5)L-γ-谷氨酰基对硝基酰基苯胺+GlyGluL→L-γ-谷氨酰基-GlyGlu+对硝基酰基苯胺。
6)L-γ-谷氨酰基-对硝基酰基苯胺+H2O→L-谷氨酸+对硝基酰基苯胺根据上表中明显的酶学特性差异,特别是底物特异性差异,可以判断本发明的谷氨酰胺酶会是一种新的谷氨酰胺酶,并且不同于来源于米曲霉中的已知谷氨酰胺酶。
本发明的谷氨酰胺酶可以从上述米曲霉的培养物中纯化获得,其也可以在下述的合适的宿主中表达米曲霉谷氨酰胺酶基因而得到制备。
如下所述,预计从米曲霉中提取的谷氨酰胺酶具有根据谷氨酰胺酶基因的核苷酸序列的SEQ ID NO:2中1-670位氨基酸所组成的氨基酸序列。根据氨基酸序列计算的分子量大约为76,000,根据与MALDI-TOFMS测定的分子量值相比,本发明的谷氨酰胺酶预期为一种糖蛋白。
本发明另一种实施方案中的谷氨酰胺酶是从构巢曲霉中获得的。用上述相同的方法,通过纯化构巢曲霉的培养物可以获得构巢曲霉的谷氨酰胺酶,或者在合适的宿主中表达构巢曲霉的谷氨酰胺酶基因,也可制得谷氨酰胺酶。根据谷氨酰胺酶基因的核苷酸序列,推测构巢曲霉的谷氨酰胺酶具有SEQ ID NO:22中1-669位氨基酸所组成的氨基酸序列。
对于本发明的谷氨酰胺酶,只要其具有催化谷氨酰胺水解成谷氨酸和氨的活性,前述的氨基酸序列可具有一个或多个氨基酸替代、缺失、插入、添加或位。
作为本发明的谷氨酰胺酶的一种实施方案,本发明也提供一种具有序列表SEQ ID NO:22中氨基酸序列的构巢曲霉的谷氨酰胺酶。利用上述相同的方法,通过纯化构巢曲霉的培养物,或者在合适的宿主中表达构巢曲霉的谷氨酰胺酶的基因,可以制备谷氨酰胺酶。<2>本发明的DNA本发明的DNA可以从例如,米曲霉RIB40(ATGG42149)的基因组中获得,如下所述。
首先测定纯化谷氨酰胺酶的部分氨基酸序列,根据取得的氨基酸序列信息,合成PCR(多聚酶链式反应)的寡核苷酸引物,以米曲霉RIB40(ATCC42149)真菌细胞中制备的基因组DNA为模板,进行PCR。将要在下述的本发明实施例中测定的部分氨基酸序列示于SEQ IDNOS:3-10中所示。在这些序列中,SEQ ID NO:3是谷氨酰胺酶的N-末端氨基酸序列,其他序列是谷氨酰胺酶的内部氨基酸序列。根据谷氨酰胺酶的基因推测,预期SEQ ID NO:5和8氨基酸序列不会在谷氨酰胺酶中出现。根据谷氨酰胺酶基因推测,SEQ ID NO:7中氨基酸序列的第3个丙氨酸和第9个苏氨酸分别被苏氨酸和丝氨酸替代,且认为这可能是肽测序仪误读造成的。
基因组DNA可以通过Gomi(Gomi,K.等,遗传应用微生学杂志(J.GEN.Appl.Microbiol).,35,225(1989))方法制备。
利用具有列表中SEQ ID NO:11和SEQ ID NO:12中的寡核苷酸为引物,通过前面提到的PCR,可以制备约230bp的DNA片段。
以PCR扩增的DNA片段为DNA探针,以λ噬菌体为载体,进行米曲霉RIB40(ATCC42149)基因组DNA文库的噬菌斑杂交,从而获得阳性克隆。
在上面获得克隆片段中,4.8kb(XhoⅠ片段)片段中的大约4kb的核苷酸序列被测定且结果如序列表中SEQ ID NO:1中所示。在SEQ IDNO:1中,由1234-1284位置核苷酸序列编码的氨基酸序列相当于SEQID NO:3中所示谷氨酰胺酶蛋白质的N-末端1-17号氨基酸序列。SEQID NO:4、6、7、9和10中所示的氨基酸序列分别相当于SEQ ID NO:1中2618-2647、2762-2803、2804-2848、2957-2986和2576-2605位置核苷酸序列编码的氨基酸序列。
从上面的叙述中可以清楚的看出具有SEQ ID NO:1中核苷酸序列的DNA是谷氨酰胺酶的基因。
比较SEQ ID NO:1中的核苷酸序列和后面将要提到的谷氨酰胺酶cDNA核苷酸序列,发现SEQ ID NO:1中的核苷酸序列含有8个外显子(核苷酸位置为1174或1135-1370,1446-1741,1800-2242,2297-2880,2932-3134,3181-3324,3380-3515和3562-3628),且这些外显子编码一个含有690个氨基酸残基的氨基酸序列。这个氨基酸序列如SEQ ID NOS:1和2中所示。比较该氨基酸序列和SEQ ID NOS:3中所示的谷氨酰胺酶蛋白N-末端氨基酸序列,估计-20到-1位置氨基酸序列是一段信号肽,1-670位置氨基酸序列是SEQ ID NO:2中的成熟蛋白。尽管估计1174-1176位置核苷酸ATG可能是起始密码子,但也不排除1135-1138位置核苷酸ATG为起始密码子的可能性。
上面的叙述强烈表明具有SEQ ID NO:1核苷酸序列的DNA含有启动子和一段编码谷氨酰胺酶的区域(包含信号肽)。
只要它能够编码本发明的谷氨酰胺酶,本发明的DNA也可是这样的SEQ ID NO:1中的核苷酸序列,即去除了其中内含子核苷酸序列的DNA,即包括1174-1370,1446-1741,1800-2242,2297-2880,2932-3134,3181-3324,3380-3515和3562-3628位核苷酸以该顺序所组成的DNA。这样的DNA可以作为如前面提到的谷氨酰胺酶的cDNA而获得。
谷氨酰胺酶的cDNA可以从cDNA文库中获得。即利用具有SEQ IDNO:1核苷酸序列或其部分序列的核苷酸(例如,前面提到的大约230bp的探针)的DNA进行杂交而从米曲霉的poly(A)RNA中获得cDNA文库中获取。
谷氨酰胺酶的cDNA以可以通过PCR和3’-RACE获得,其中PCR以具有SEQ ID NOS:13和14核苷酸序列为引物,3’-RACE利用具有SEQID NOS:15和16核苷酸序列为引物。从谷氨酰胺酶高产的米曲霉菌株中获得的cDNA核苷酸序列实例示于序列表SEQ ID NO:17中。根据核苷酸序列推测的氨基酸序列如SEQ ID NOS:17和18中所示。比较该cDNA和实施例2中获得的基因组编码区核苷酸序列,除了cDNA54位(SEQ ID NO:17)的核苷酸“C”是基因组基因(SEQ ID NO:1)的“G”(1227位核苷酸),其余的序列均相同。cDNA和基因组基因的核苷酸序列不同可能是因为菌株之间基因序列差异所造成的。
本发明的DNA可以是任何一种编码谷氨酰胺酶的DNA。另外它包括具有SEQ ID NO:1或SEQ ID NO:17核苷酸序列的DNA,其中5’端非必需部分核苷酸已经被去掉。根据应用目的,它可以是一段只编码成熟蛋白的DNA。本发明的DNA包括编码区一个或多个密码子为等价密码子所替换但仍编码相同氨基酸的DNA。进一步而言,本发明的DNA可以是一个编码具有一个或多个氨基酸位点替代、缺失、插入、添加、倒位修饰后所获谷氨酰胺酶的DNA,只要谷氨酰胺酶的活性没有降低。术语“多个”所代表的氨基酸数目可根据立体结构中氨基酸位置或种类而变动,但其通常可为2-300个,优选为2-170个,更优选为2-50个,最优选地为2-10个。
如下所述,SEQ ID NO:2中所示的米曲霉的谷氨酰胺酶氨基酸序列和SEQ ID NO:22中所示的构巢曲霉的谷氨酰胺酶氨基酸序列约有73%的同源性,两者的成熟蛋白约有170个不同的氨基酸残基。
通过修饰谷氨酰胺酶基因的核苷酸序列,可以获得编码与上述谷氨酰胺酶基本相同蛋白的DNA。例如,通过定点诱变,可以在特异位点上进行氨基酸的替代、缺失、插入或添加。通过常规的诱变处理,也可以获得上述修饰的DNA。诱变处理的方法包括用羟胺或类似物体外处理编码谷氨酰胺酶的DNA,以及用紫外灯照射杆菌属的细菌,或者用诱变剂如常规的诱变剂N-甲基-N’-硝基-N-亚硝基胍(NTG)和亚硝酸处理细菌。
上述替代、缺失、插入、添加和倒位包括菌株间差异和自然发生的突变(所造成的变化)。
编码与谷氨酰胺酶基本相同的蛋白的DNA可以如上述通过在合适的细胞中表达具有突变DNA,并检测表达产物的谷氨酰胺酶活性的方法进行筛选。编码与谷氨酰胺酶基本相同的蛋白的DNA也可以通过分离DNA的方法获得,被分离的DNA在严格条件下,可以与具有序列表中SEQ ID NO:1中1174-1370,1446-1741,1800-2242,2297-2880,2932-3134,3181-3324,3380-3515和3562-3628位核苷酸所组成的任一序列的DNA或者与具有核苷酸序列表中SEQ ID NO:17中1-2070位核苷酸所组成的DNA序列,并编码一种具有谷氨酰胺酶活性的蛋白杂交。这里所用的术语“严格条件”是指一种可以形成所谓的特异杂交体而非特异性杂交体不能形成的条件。虽然这种条件在数量上很难明确定义,但这种条件的例子包括一种具有较高同源性,例如65%或更高的同源性DNA才能杂交,而DNAs的同源性低于65%则不能杂交的条件;和一种条件,其中杂交在相当于常规Southern杂交的冲洗步骤盐浓度下进行,即1×SSC,0.1%SDS,优选地是0.1×SSC,0.1%SDS。在严格条件下可以杂交的基因也可包括那些含有终止密码子,以中断编码序列的基因和那些在活性中心或类似部位发生突变而失去活性的基因,但它们可以通过连接到商业上可得到活性表达载体上和下面提到的测定谷氨酰胺酶活性的方法而轻易去除。
本发明的DNA也可以从曲霉属其他种类如构巢曲霉微生物的染色体DNA或cDNA中获得,尤其是可以从构巢曲霉的染色体DNA文库中获得,例如在构巢曲霉A26菌株中通过杂交获取DNA。根据上述米曲霉谷氨酰胺酶基因的核苷酸序列合成PCR寡核苷酸引物,并以构巢曲霉如构巢曲霉A26菌株细胞中制备的基因组为模板进行PCR,制备杂交探针。作为PCR引物,具有SEQ ID NOS:19和20中核苷酸序列的寡核苷酸可在本发明中提及。
按照上面的方式,在下述实施例中获得的构巢曲霉A26的谷氨酰胺酶基因核苷酸序列和氨基酸序列如SEQ ID NO:21中所示。氨基酸序列也在SEQ ID NO:22中列出。对整段基因而言,构巢曲霉和米曲霉谷氨酰胺酶基因的同源性大约是58%,编码区的同源性大约为68%,编码氨基酸序列的同源性大约为73%。
谷氨酰胺酶的cDNA也可以例如,用具有SEQ ID NOS:23和24核苷酸序列寡核苷酸进行PCR,而从构巢曲霉的poly(A)RNA中制得的cDNA文库中获取。从构巢曲霉中获得的一种cDNA核苷酸序列实例如序列表SEQ ID NO:25中所示。根据这个核苷酸序列推断的氨基酸序列如SEQ ID NOS:25和26中所示。
本发明的DNA包括一种DNA分子,它编码的蛋白的氨基酸序列如序列表SEQ ID NO:22中所示,其中一个或多个氨基酸被替代、缺失、插入、添加或倒位,并且仍具有催化谷氨酰胺水解成谷氨酸和氨的活性。本发明的DNA还包括一种DNA,它编码一个含有序列表SEQ ID NO:21中1807-2000,2061-2353,2412-2854,2915-3498,3554-3756,3806-3949,3996-4131和4180-4246位核苷酸序列组成的DNA,还包括一种DNA分子,在严格条件下,它可以和上述DNA分子杂交,并可以编码具有催化谷氨酰胺水解成谷氨酸和氨活性的蛋白。
用下述的实施例获得了上述本发明的DNA。然而因为DNA的核苷酸序列已被阐明,故从米曲霉RIB40(ATCC42149)、构巢曲霉A26或其他米曲霉和构巢曲霉菌株中获得的基因组DNA中可容易地通过PGR、杂交或其他类似手段克隆到本发明的DNA。<3>本发明DNA的应用本发明的DNA可以用来培育例如曲霉的丝状真菌,或者用来制备谷氨酰胺酶。例如,通过向丝状真菌胞内导入本发明的DNA,优选地是引入它的多拷贝,可以增强谷氨酰胺酶的活性。谷氨酰胺酶可以通过在合适宿主中表达本发明DNA的而制得。上述获得的例如曲霉的丝状真菌和谷氨酰胺酶可以应用到酱油、日本豆酱和其他含有蛋白水解产物调味品的生产中。
可引入本发明的DNA的丝状真菌包括曲霉属的米曲霉、黑渠霉(Aspergillus niger)和构巢曲霉,链孢霉属的粗糙脉孢菌(Neurospora crassa),Rhizomucor属的Rhizomucor miehei和其他类似的丝状真菌。
用于将本发明的DNA导入到上述丝状真菌中的载体如上述的载体并无特殊限制,可以使用通常用来培育丝状真菌和其他类似物的载体。在这些载体中,米曲霉的载体有pUNG(Lee,B.R.等,应用微生物学.生物技术(Appl.Microbiol.Biotechnol.),44,425-431(1995))、pMARG(Tsuchiya,K.等,应用微生物学.生物技术(Appl.Micorbiol.Biotechnol.),40,327-332(1993))、pUSC(Gomi,K等,农业生物学.化学(Agric.Biol.Chem.)51,2549-2555(1987))和其他类似载体。pUNG含有一个米曲霉niaD300互补的niaD-(硝酸盐同化作用能力缺失)标记(Minetoki,.等,当前遗传学(Curr.Genet.)30,432-438(1996)),pMARG含有一个米曲霉M2-3互补的argB-(精氨酸营养缺陷性)标记(Gomi,K.等,农业生物学.化学(Agric.Biol.Chem.),51(9),2549-2555(1987)),且pUSC含有一个米曲霉NS4互补的sC-(ATP硫酸化酶缺失型)标记(Yamada,O.等,生物科学.生物技术.生物化学(Biosci.Biotech.Biochem.),61(8),1367-1369(1997))。
在这些载体中,pUNG和pMARG含有葡萄糖淀粉酶基因(glaA)和α-淀粉酶基因(amyB的终止子)的启动子,以一致阅读框的方式,在上述启动子的下游区插入本发明的DNA,该DNA可得到表达而制备谷氨酰胺酶。当以pUSC为载体时,因为pUSC没有启动子,可以通过共同导入一个质粒如插入本发明DNA的pUC19和pUSC到丝状真菌中而实现本发明基因的表达。由于SEQ ID NO:1中的核苷酸序列可能含有一个前述的启动子,因而认为即使本发明的DNA与前述载体一起插入上述载体中,它仍可表达产生谷氨酰胺酶。
本文下面提到的载体、启动子和标志可根据不同的丝状真菌而加以应用,表2中的启动子以相关基因编码的酶名称表示。
表2文献 启动子 标记丝状真菌宿主国际专利申请 中性 黑曲霉α-淀粉酶日本专利公开 argB黑曲霉(KOHYO) argB构巢曲霉No.Hei4-503450/1992 trpC构巢曲霉amdS构巢曲霉pyr4粗糙脉孢菌DHFR粗糙脉孢菌未审查的日本专利公开 高峰淀粉酶 米曲霉(KOKAI)天冬氨酸蛋白酶 RhizomucormieheiNo.sho62-272988/1987 脂酶 Rhizomucormiehei葡萄糖淀粉酶 黑曲霉脂酶淀粉酶葡萄糖淀粉酶纤维素酶蛋白酶糖酵解途径酶未审查的日本专利公开 高峰淀粉酶 曲霉属No.Hei7-51067/1995未审查的日本专利公开 提及新的启动子序列 米曲霉No.Hei7-115976/1995未审查的日本专利公开 提及新的启动子序列 黑曲霉No.Hei7-59571/1995日本生物科学、生物技术 α-淀粉酶 米曲霉及农业化学杂志71卷,10 (amyB)期(1997)1018-1023页 葡萄糖淀粉酶 米曲霉(glaA)葡糖苷酶 米曲霉(adgA)除了其他已知方法,丝状真菌的转化可以用本文前面提到的方法完成。具体以米曲霉的转化为例,在下面具体描述。
将真菌细胞(分生孢子)接种到DPY培养基上(2%的葡萄糖,1%的蛋白胨,0.5%的酵母提取物,pH5.0),并在30℃条件下,剧烈振荡培养24小时。培养基用Myracloth、消毒纱布或其他类似物过滤,收集真菌细胞。细胞用无菌水冲洗,并充分去除水分。然后将细胞转移到试管中,并加入酶液(1.0%Yatalase(Takara Shuzo),或者0.5%Novozyme(Novo Nordisk),0.5%纤维素酶(例如,Onozuka纤维素酶,Yakult),0.6M的硫酸铵,50mM的苹果酸,pH5.5),并在30℃条件下,温和振荡3小时。用显微镜观察原生质体化程度。如果原生质体化程度较好,将原生质体化的细胞放在冰上保存。
用Myracloth过滤上述酶促反应混合液,以去除真菌细胞的残留物。向含有原生质的滤液中加入等体积的缓冲液A(1.2M的山梨糖醇,50mM的氯化钙,35mM氯化钠,10mMTris-HCl,pH7.5),置于冰上。混合液在0℃条件下以每分钟2500转离心8分钟,缓慢停止,沉淀用缓冲液A冲洗,并悬浮于等体积的缓冲液A中。
将不多于20μl(5-10μg)的DNA溶液加入到100-200μl的原生质悬液中,置于冰上20-30分钟。然后向混合液中加入250μl的缓冲液B(聚乙二醇6000,50mM氯化钙,10mMTris-HCl,pH7.5),温和混合,再加入250μl的缓冲液B温和混合,最后加入850μl的缓冲液B温和混合,混合液于室温下放置20分钟,然后将10ml的缓冲液A加入到混合液中,倒置试管以混匀管内混合液,并将其置于0℃条件下以每分钟2000转离心8分钟,然后将沉淀悬浮于500μl的缓冲液A中。
将上述合适数量的悬浮液加入到5ml预热并已分成数部分的顶层琼脂上,且该培养基涂在下层培养基上(含有1.2M山梨糖醇的选择性培养基,根据不同标记制成),在30℃条件下培养。成熟的真菌细胞转移至选择性培养基上,以证明它们是转化体。重组DNA从真菌细胞中获得。为了进一步证实本发明的DNA已经被引入到重组DNA中,可以采用限制性内切酶分析、Southern分析或其他类似的手段。
将上述获得的转化体在适合启动子启动的条件下培养,以使谷氨酰胺酶的基因表达,获得谷氨酰胺酶。
通过培养导入本发明基因并具有增强的与蛋白反应的谷氨酰胺酶活性的转化子,可以提供更高谷氨酸钠含量和更强的“鲜味”味道的蛋白水解产物。可以与培养物反应的蛋白实例包括例如大豆、小麦、面筋或其他类似物的蛋白质,或者是脱脂大豆的蛋白质,以及在食品加工过程中,如膨化、溶解过程中的各种蛋白中的任何一种,或者是从各种原料中分离出来的蛋白质。
就转化体培养物与蛋白反应的条件而言,例如在蛋白酶存在的前提下,具有0.2-50%的原料与转化子培养物混合,在5-60℃条件下,可以反应4个小时到10天。
反应完成后,未反应的不溶蛋白质、真菌细胞等可通过常规的分离方法分离,例如离心或过滤分离。如果有必要,反应混合物还可经真空浓缩、反相渗透或其他类似手段进行浓缩。通过冷冻干燥、负压干燥和喷雾干燥等干燥过程,可以将浓缩产物制成粉末或者颗粒。这样,无需外加谷氨酸钠,便可获得含有较多谷氨酸钠和表现出很强的“umami”味道的蛋白水解产物。
优选实施方案详述通过下面事例的描述,具体解释本发明。实施例1从米曲霉中纯化谷氨酰胺酶在麸皮中培养米曲霉RIB40(ATCC 42149)菌株,并从培养物中纯化谷氨酰胺酶。在纯化过程中,谷氨酰胺酶的活性用改进的Hartman方法(Hartman,S.C.,生物学.化学杂志(J.Biol.Chem.),243,853-863(1968),氧肟酸方法)测定.即向125μl含有200mMTris-HCl(pH7.0)、100mM羟胺盐酸、50mML-谷氨酰胺和10mM还原谷胱苷肽的溶液中加入25μl的酶液,于37℃下反应1小时。然后向反应混合液中加入125μl溶液,该溶液由等体积3N盐酸、12%三氯乙酸溶液和5%FeCl3·6H2O溶液(溶解于0.1N盐酸中)所组成,并在525nm测定光吸收值。至于活性,在37℃下每分钟形成1μmolL-谷氨酸γ-单氧肟酸的酶活定义为一个单位。(1)培养将麦麸(Nisshin Flour Milling,600g)、磷酸钾(12g)和蒸馏水(600ml)混合均匀,再将其以160g每皿的量加入到六套直径为15cm培养皿内,并在120℃下消毒20分钟,从而制备培养基。
向形成足够多的孢子的米曲霉RIB40(ATCC 42149)的斜面培养物,倒入无菌水(5ml),并加以搅拌以制备孢子悬液,再将该悬液接种到上述培养基中。已接种孢子的培养基充分均匀,并置于30℃下培养14天。在培养开始,就将培养基搅拌24小时而进行发酵。(2)酶的提取将依照上述方法制备的麸曲浸入三倍体积的20mM磷酸钾(pH7.4),1mM PMSF(苯甲基磺酰氟),0.1mM EPNP(1,2-环氧-3-对硝基苯基丙烷)和1mM EDTA溶液内,并静置于4℃下16小时,用薄纱布过滤后,再进行离心分离(4℃,7500rpm,30分钟),然后收集上清液并将其用作酶的粗提液。(3)硫酸铵沉淀法分级分离将酶的粗提液置于-80℃下低温冷冻后,于4℃下逐渐融化,再用过滤法除去其中不可溶的组分。向上述过程所获上清液中加入硫酸铵(1010g/2880ml)以制备55%的饱和硫酸铵溶液。将上述硫酸铵溶液置于4℃下搅拌4小时后,再离心(4℃,7500rpm,30分钟)以去除沉淀。接着,向上述过程所获上清液中加入硫酸铵(703g/3180ml)以制备85%饱和硫酸铵溶液。将上述硫酸铵溶液置于4℃下搅拌16小时后,再通过离心(4℃,7500rpm,30分钟)收集沉淀,并将其溶解在100ml,20mM磷酸钠缓冲液(pH7.4)中。然后,用孔径为0.45μm的滤膜过滤上述溶液。(4)脱盐从步骤(3)所获100ml滤液中,吸取5ml并将其加入到已事先用20mM磷酸钾(pH7.4)和100mM NaCl溶液平衡过的脱盐柱内(HitrapDesalting,Pharmacia,5ml×5),再用上述同样的缓冲液进行洗脱。100ml滤液经过20次上述步骤即可完成脱盐过程。经脱盐处理后,活性组分的体积达300ml,再通过超滤法进行浓缩与脱盐处理后,其体积可减少至50ml。(5)离子交换层析将上述过程所获样品液加入到填充有250ml DEAE-TOYOPEARL 650M(Tosoh)并已用20mM磷酸钾缓冲液(pH7.4)平衡过的层析柱内,再用4倍于柱体积的上述缓冲液进行洗脱。接着,用8倍于柱体积且具有逐渐增加NaCl线性浓度梯度(0~0.5M)的上述缓冲液对层析柱进行洗脱。通过超滤法浓缩与脱盐处理在洗脱液(340ml)中收集到的活性部分至12ml。(6)疏水层析然后,通过利用了HiLoad 26/10 Phenyl Sepharose HighPerformance(Pharmacia)的FPLC系统(Pharmacia),进行吸附层析分级分离。对已通过DEAE-TOYOPEARL分离的具有活性的蛋白组分,本层析过程进行两次。将6ml含有1M硫酸铵的DEAE-TOYOPEARL活性组分吸附到已用50mM磷酸钠缓冲液(pH7.4)和1M硫酸铵溶液平衡过的吸附柱内,再用4倍于柱体床积的上述缓冲液进行洗脱。接着,用16倍于柱床体积且具有硫酸铵线性浓度梯度(1~0M)的上述缓冲液对层析柱进行洗脱。通过超滤与离心浓缩法(Centriprep 10,AMICON)浓缩与脱盐处理300ml获自洗脱液的活性部分至10ml。(7)凝胶过滤层析通过利用了HiLoad 26/10 Superdex 200pg(Pharmacia)的FPLC系统,对上述样品进行凝胶过滤层析而加以分级分离。对已通过DEAE-TOYOPEARL分离的具有活性的蛋白组分,本层析过程进行五次。将2ml上述所获活性部分加入到预先用40mM磷酸钠(pH7.4)和150mMNaCl溶液平衡过的凝胶过滤层析柱内,再用上述缓冲液进行洗脱并收集活性组分。本凝胶过滤层析过程重复两次。(8)纯化结果经上述各纯化方法依次处理后,共获500μg纯化的谷氨酰胺酶。利用MALDITOFMS(Matrix assisted laser desorptionionization-time of flight mass spectrometer)测定了纯化的酶的分子量为8290。表3概括地列出了各纯化步骤中全蛋白含量、谷氨酰胺酶活性、比活力、产量以及纯度(依据1种所述的粗提液的纯度)的情况。
表3纯化步骤谷氨酰胺酶 全蛋白含 比活力产量纯度活性(单位) 量(mg)(单位/mg) (%)(倍数)粗提液 44.82528 0.018 100 1冷冻-融化 51 2230 0.023 114 1.28硫酸铵沉淀 16.2665 0.024 36 1.33DEAE- 7.2 186 0.039 16 2.2TOYOPEARL苯基琼脂糖 4.3 78.7 0.055 9.6 3.1第一次 0.8 1.1 0.73 1.6 39.4凝胶过滤第二次 0.4 0.5 0.88 1 48.9凝胶过滤(9)谷氨酰胺酶的部分氨基酸序列的确定将97μg纯化的位于500mMTris-HCl(pH8.1),6M胍和2mM EDTA中的谷氨酰胺酶再加入DTT(263μg)经氮取代后,静置于50℃下3小时。此还原反应于室温下避光过夜进行。然后,向混合物中再加入碘乙酸(2900μg),并于室温下反应30分钟,再经Sephadex G-25柱进行脱盐处理。接着,用浓度离心机VC-960(TAITEC)对已脱盐的样品进行浓缩处理,再向浓缩后的部分溶液中加入50mM碳酸氢铵(pH8.5)和1μg赖氨酰内肽酶(SIGMA),并于37℃下限制性降解13小时。降解过程完成后,利用反向HPLC(Vydac Capillary C18,Vydac)分离降解过程所获肽段,并将分离的肽段逐一加入到多肽序列测定仪PPSQ-10内(Shimazu Corporation)进行测序,以确定谷氨酰胺酶分子内部的部分氨基酸的序列。另取部分未经赖氨酰内肽酶处理的多肽,并将其加入到多肽序列测定仪中以确定其N-末端的氨基酸序列。经测定的氨基酸序列如下所示N-末端ASTFSPARPPALPLAVK(SEQ ID NO:3)NO.52:Y(G/P)(N/V)(T/P)YAM(R/S)DI(SEQ ID NO:4)NO.55:VQY(T/G)EYDXY(SEQ ID NO:5)NO.59:DNDYLSQHYPILNK(SEQ ID NO:6)
NO.67:WTAYLVEDTIYPANQ(SEQ ID NO:7)NO.62.5:VLLQSAIEGH(SEQ ID NO:8)N0.63:GIIGIQAMAV(SEQ ID NO:9)NO.62:XILKFXYXXQ(SEQ ID NO:10)在上述序列中,“X”表示一种不确定的氨基酸,“/”表示相应的氨基酸是“/”前面或后面所示的氨基酸。实施例2米曲霉的谷氨酰胺酶基因的克隆通过噬菌斑杂交,可从米曲霉基因组文库中分离谷氨酰胺酶基因。
(1)利用PCR制备探针依据下面提及的Gomi的方法(Gomi,K.等,J.Gen.Appl.Microbiol.,35,225(1989)),从米曲霉RIB40的细胞中制备基因组DNA.
将两只斜面培养试管中所获米曲霉RIB的芽子悬浮于0.85%NaCl溶液中,再接种到1L YPD培养基上(2%葡萄糖,1%蛋白胨,0.5%酵母提取液,pH5.0),并于30℃下培养24小时。用液氮迅速冷冻经薄纱布过滤所获真菌细胞,并置于匀浆器(18000rpm,15分钟)同时以液氮冷却或研钵内破碎细胞。向上述过程所获产物中加入100ml、50mMEDTA,0.5%SDS溶液,pH8.0,并加入终浓度为0.1mg/ml的蛋白酶K,再于50℃下培养4小时。对上述溶液依次进行酚处理、酚/氯仿处理和氯仿处理,且每次处理均重复一次。在利用有机溶剂所进行的上述处理过程通过缓慢地混合溶液与有机溶剂,然后,再分离出水层而进行。
向上述已去除蛋白的溶液中,加入1/10体积的3M乙酸钠缓冲液(pH5.2)和2.5倍体积的乙醇,并置于-20℃下过夜,再于0℃下10000rpm离心20分钟。洗涤得到的沉淀,再仔细地将其溶解在TE缓冲液中。接着,向上述溶液中加入RNA酶A(10μg/ml),并于30℃下温育30分钟以降解RNA。然后,向上述溶液中加入1/2体积的酚,并静置于37℃下10分钟,再加入1/2体积的氯仿,于0℃下10,000rpm离心20分钟以分离出水层。将分离出的水层与乙醚二乙酯相混合,并于0℃下10,000rpm离心5分钟,弃去乙醚二乙酯层以去除残留于溶液中的酚。向余下的水层中加入3M乙酸钠溶液(500μl)和乙醇(5ml),于-80℃下冷冻1小时后,再10000rpm离心20分钟,从而得到沉淀。洗涤沉淀,并将其溶解于混有少量氯仿的TE缓冲液(5ml)中,冷冻保存。
经过这样一种PCR,该反应以依据上述方法所获基因组DNA为模板,并以具有下列序列以及依据部分氨基酸序列(No.52和NO.67)所合成的寡核苷酸为引物,获得谷氨酰胺酶基因的部分序列,并且此可用作杂交探针。通过参照构巢曲霉(Andrew,T.Lloyd等,分子遗传。遗传学(Mol.Gen.Genet.),230,288-294(1991))的密码子频度,即可设计出这些引物的序列。(5'端引物)TAC CCC AAC ACC TAT GCT ATG CGC GAT ATC(SEQ ID NO:11)(3'端引物)TTG GTT CGC CGG ATA AAT AGT ATC TTC GAC CAA GTA(SEQ ID NO:12)该PCR包括95℃热变性9分钟和下面的循环,包括94℃下反应1分钟、53℃下反应1分钟和72℃下反应1.5分钟,且该循环重复35次。上述PCR可提供约230bp的谷氨酰胺酶基因片段。
(2)米曲霉基因组文库的筛选将上述PCR所获基因片段用作探针,对米曲霉基因组文库进行筛选。
用BamHⅠ将米曲霉基因组酶切成10kb左右的片段,再将这些片段插入到λ噬菌体(λDASH II,STRATAGENE)的BamHⅠ位点上。将上述重组DNA进行体外包装从而构建λ噬菌体文库。
利用上述λ噬菌体文库,在每个直径为15cm的平板内形成了约5,000个噬菌斑。共制备10个形成了噬菌斑的平板,再将每个平板印迹至两张尼龙膜(Hybond-N+Amersham)上。即,将第一张尼龙膜附在平板上3分钟,或将第二张尼龙膜附在平板上5分钟,再将其附在浸有变性液(1.5M NaCl,0.5M NaOH)的滤纸上7分钟。然后,将膜附在浸有中和液(1.5M NaCl,0.5M Tris-HCl(pH7.4))的滤纸上3分钟,再将这些膜附在另一些浸有同样缓冲液的滤纸上中和3分钟,接着,置于2×SSC中3分钟,于空气中晾干。晾干后,将这些滤膜置于浸有0.4m NaOH的滤纸上20分钟,于5×SSC中振荡1分钟并空气中晾干。
将上述尼龙膜分别浸于预杂交缓冲液中(50%甲酰胺,5×Denhardt’s溶液,5×SSPE,0.5%SDS),并静置于42℃下2小时。利用随机标记试剂盒,对PCR所获探针进行[32P-γ]-CTP标记。将已标记的探针置于100℃下处理3分钟,随即转移到冰块上以使DNA双链变性,再将其加入到预杂交缓冲液中,并使该杂交反应在42℃下过夜进行。
杂交后,按下列步骤洗膜65℃下,用2×SSC,0.1%SDS溶液漂洗两次,每次15分钟;65℃下,用1×SSC,0.1%SDS溶液漂洗两次,每次15分钟;在65℃下,用0.1×SSC,0.1%SDS溶液漂洗两次,每次15分钟。漂洗后,将膜紧贴于成像板上(FUJIX),并用图象分析仪BAS 2000(FUJIX)进行检测。结果,在约50000个噬菌斑内,检测到21个阳性信号。
收集这21个阳性噬菌斑,并对其进行第二次筛选。经过第二次筛选,在直径为10cm的平板内,形成了约50个噬菌斑,且本次筛选是以与第一次筛选相同的方式进行的。在第二次筛选中,共检测到四类阳性噬菌斑。依照第二次筛选方式,再进行第三次筛选,最终可获得这四类阳性克隆。
对这四类阳性克隆的测序显示所有克隆均包含有同一序列。SEQ IDNO:1中列出了源自其中一种克隆的XhoⅠ片段的核苷酸序列以及由该核苷酸序列所编码的氨基酸序列。SEQ ID NO:2中仅列出了氨基酸序列。
以上述XhoⅠ片段插入到质粒pBluescript中而获得的质粒转化的大肠杆菌DH 5α菌株得到私人编号AJ13495,并于1998年9月9日保藏于通商产业省工业技术院生命工学和人体技术研究所(日本茨城县筑波市东1丁目1番3号,邮政编码305-8566),保藏号为FERMBP-6490。实施例3米曲霉的谷氨酰胺酶cDNA的克隆在30℃下,将一种高产谷氨酰胺酶的米曲霉菌株置于50ml DYP培养基中培养48小时。经薄纱布过滤后,收集1g真菌细胞。立即用液氮冷冻收集到的细胞,并在研钵中破碎细胞,再依据胍-氯化铯超速离心法(分子克隆,第2版,冷泉港出版社(1989)),可从所收集的细胞内提取到0.2mg总RNA。利用mRNA纯化试剂盒(Pharmacia),从总RNA中提取总mRNA,再利用cDNA PCR文库试剂盒(Takara Shuzo)合成cDNA。通过该试剂盒,可在所获cDNA的5'端和3'端分别连接上CA盒衍接子序列和寡dT-RA序列。
用上述cDNA作为模板且用依据谷氨酰胺酶基因组的核苷酸序列而合成拥有下列序列的寡核苷酸用作引物,通过PCR和3'-RACE,扩增谷氨酰胺酶cDNA。(5'端引物)GAT CAT GAT GCA TTT CCT CTC GTT CTG TC(SEQ ID NO:13)(3'端引物)GCA AAG TCA TCC GTA GAG ATC TGG TTC G(SEQ ID NO:14)(3'-PACE的5'端引物)GGC GAA CCA GAT CTC TAC GGA TGA CTT TGC(SEQ ID NO:15)(3'-RACE的3'端引物)CTG ATC TAG ACC TGC AGG CTC(SEQ ID NO:16)本PCR包括95℃下热变性9分钟和一种循环,该循环包括94℃下反应1分钟、55℃下反应1分钟和72℃下反应1分钟,且该循环重复30次。将SEQ ID NO:13和14用作引物的PCR可提供1500bp左右的DNA片段,而利用SEQ ID NO:15和16作为引物的3′-RACE可提供780bp左右的DNA片段。
SEQ ID NO:17中列出了这些DNA片段的核苷酸序列。SEQ ID NO:17和18中列出了由该DNA片段所推导出的氨基酸序列。实施例4谷氨酰胺酶cDNA在大肠杆菌中的表达在谷氨酰胺酶cDNA的上游连接Lac启动子、T7启动子或Trp启动子,并将该cDNA插入到pBluescript(Stratagene)的多克隆位点上。以常规的方式,用所获重组质粒转化大肠杆菌DH5α,并在含有50μg/ml氨苄青霉素的琼脂培养基上筛选所获转化子。在37℃下,将经过筛选出的转化子置于LB培养基(1%胰蛋白胨,0.5%酵母提取物,1%NaCl)中培养过夜。然后,再将1ml上述培养基转移到50ml LB培养基中,并于37℃下培养。3小时后,当培养基的OD值达到0.6时,向其中加入终浓度为1mM IPTG(异丙基-β-D-硫代半乳糖苷)以诱导Lac启动子,并在37℃下继续培养4小时。培养过程结束后,收集细胞并将其悬浮在缓冲液中,再用超声波处理以获蛋白包含体。将这些蛋白包含体溶解在变性液中(8M尿素,10mM DTT,50mM NaCl,50mMTris-HCl(pH8.0)),并用离心的方法去除其中不溶性组分。通过逐渐降低溶有蛋白的溶液中的尿素浓度,可完成溶液中的蛋白重新折叠。
用上述谷氨酰胺酶cDNA片段插入到pBluescript中获取的重组质粒转化的大肠杆菌DH5α菌株得到私人编号AJ13496,并于1998年9月9日保藏于通商产业省工业技术院生命工学和人体技术研究所(日本茨城县筑波市东1丁目1番3号,邮政编码305-8566),并得到保藏号FERM BP-6491。实施例5构巢曲霉的谷氨酰胺酶基因的克隆(1)利用PCR制备探针根据实施例1和实施例2测定的米曲霉谷氨酰胺酶基因的核苷酸序列,可合成用于PCR的寡核苷酸引物,并用从构巢曲霉A26细胞中制备的基因组DNA用作模板进行PCR。依据实例2中Gomi的方法(Gomi,K.等,J.Gen.Appl.Microbiol.,35,225(1989)),以相同的方式制备基因组DNA。
合成具备序列列表SEQ ID NO:1中位置1952-1979和2839-2868的核苷酸序列的寡核苷酸用作上述PCR的引物。(5'端引物)GAC GAC CAA GAT GGT CTG AGC TAC CAG T(1952-1979)(SEQ ID NO:19)(3'端引物)GCA AAG TCA TCC GTA GAG ATC TGG TTC GCC(2839-2868)(SEQ IDNO:20)本PCR包括95℃下热变性3分钟和一种循环,该循环包括94℃下反应1分钟、37℃下反应1分钟和72℃下反应1分钟,且该循环重复30次。该PCR提供约900bp谷氨酰胺酶基因的片段。
(2)构巢曲霉基因组文库的筛选将上述PCR所获基因片段用作探针进行构巢曲霉基因组文库的筛选。
构巢曲霉的基因组文库购自真菌菌株保藏中心(Fungal StrainCenter)(Kansas City,USA)。利用该文库,在直径为10cm的平板内制备琼脂培养基,然后在培养基上铺上Hybond-N+尼龙膜(Amersham)。将细胞接种到尼龙膜上从而在每张膜上都形成了约50个菌落。共制备30个形成菌落的平板,再逐一收集培养基上的尼龙膜。将尼龙膜分别附在浸有变性液(1.5M NaCl,0.5M NaOH)的滤纸上7分钟。然后,将膜附在浸有中和液(1.5M NaCl,0.5M Tris-HCl(pH7.4))的滤纸上3分钟,再将这些膜附在另一些浸有同样缓冲液的滤纸上中和3分钟,之后置于2×SSC中3分钟,于空气中晾干。晾干之后,将膜附在浸有0.4M NaOH的滤纸上20分钟,再置于5×SSC中振荡1分钟,于空气中晾干。
将上述尼龙膜分别浸于预杂交缓冲液中(50%甲酰胺,5×Denhardt’s溶液,5×SSPE,0.5%SDS),并静置于65℃下2小时。利用随机标记试剂盒(BOEHRINGER MANNHEIM),对PCR所获探针进行[32P-γ]-CTP标记。将已标记的探针置于100℃下处理3分钟,随即转移到冰块上以使DNA双链得到变性,再将其加入到预杂交缓冲液中,并使该杂交反应在65℃下过夜。
杂交后,按下列步骤洗膜65℃下,用2×SSC,0.1%SDS溶液漂洗两次,每次15分钟;65℃下,用1×SSC,0.1%SDS溶液漂洗两次,每次15分钟;65℃下,用0.1×SSC,0.1%SDS溶液漂洗两次,每次15分钟。漂洗后,将膜紧贴于成像板(FUJIX)上,并用图象分析仪BAS 2000(FUJIX)进行检测。结果,在约1500个噬菌斑内,检测到4个阳性信号。
这四类克隆的核苷酸序列显示所有克隆均包含有同一序列。SEQ IDNO:21中列出了源自其中一种克隆的HindⅢ-EcoRⅤ片段的核苷酸序列以及由该序列所编码的氨基酸序列。SEQ ID NO:22中仅列出了该氨基酸序列。
用上述HindⅢ-EcoRⅤ片段插入到pBluescript中而获得的重组质粒转化的大肠杆菌DH5α菌株已获私有号AJ13509,并于1998年9月22日存放于通商产业省工业技术院发酵研究所(现在即通商产业省工业技术院生命工学和人体技术研究所),并得到保藏号NO.FERMBP-6520。实施例6构巢曲霉谷氨酰胺酶cDNA的克隆在37℃下,将构巢曲霉A26置于50mlYG培养基(0.5%酵母提取物,2.5%葡萄糖,0.1%微量元素※)中振荡培养21小时。再用滤纸收集细胞,并将其置于含基本培养基(0.6%NaNO3,0.152%KH2PO4,0.052%KCl,0.052%MgSO4·7H2O,1%葡萄糖,0.1%微量元素※,2×10-5生物素,1.5%琼脂)的平板内,于37℃下培养24小时(微量元素※:0.1%FeSO4·7H2O,0.88%ZnSO4·7H2O,0.04%CuSO4·5H2O,0.015%MnSO4·4H2O,0.01%Na2B4O7·10H2O,0.005%(NH4)6Mo7O24·4H2O)。
从平板培养基中收集细胞,用液氮冷冻,并在研钵中破碎细胞。利用RNeasy Plant Mini kit(QIAGEN)从破碎的细胞内提取总RNA,再用mRNA纯化试剂盒(Aimersham Pharmacia Biotech)从总RNA中提取mRNA。接着,用cDNA合成试剂盒与cDNA PCR文库试剂盒(Takara),从该mRNA中制备cDNA文库。
用上述cDNA文库作为模板以及根据构巢曲霉基因组DNA序列而设计的下列寡核苷酸分别用作引物,通过PCR克隆谷氨酰胺酶cDNA。(5'端引物)GCT TCA TAA TTC TCC TGT TGT TGA GTC(SEQ ID NO:23)反义引物(3'端引物)GGC TAT AAC TGA TGC TAT ATA CTA CCA CAC(SEQ ID NO:24)本PCR包括94℃下热变性5分钟和30次循环[94℃下反应30秒、55℃下反应30秒和72℃下反应2分钟]。结果,可观察到约2300bp的扩增片段,进而可获得谷氨酰胺酶全长cDNA。SEQ ID NO:25中列出了此DNA片段的核苷酸序列。SEQ ID NO:26中列出了由该DNA片段所推导出的氨基酸序列。
用上述构巢曲霉的谷氨酰胺酶cDNA片段插入到简pGEM T Easy栽体的TA克隆位点而获得的重组质粒转化的大肠杆菌DH5α菌株已得到私人编号AJ13575,并于1999年3月11日保藏于通商产业省工业技术院生命工学和人体技术研究所(日本茨城县筑波市东1丁目1番3号,邮政编码305-8566),保藏号为FERM BP-6679。实施例7谷氨酰胺酶的生产将包含启动子序列的谷氨酰胺酶基因连接到带有标记基因sC的载体上而得到用于转化的载体。再利用10μg该质粒DNA进行转化。
将分生孢子接种到DPY培养基上,并置于30℃下剧烈振荡培养24小时。用无菌纱布进行过滤,收集细胞,并用无菌水进行洗涤,充分去除水分。将这些细胞转移到试管内,在加入酶液(20ml,1.0%Yatalase,Takara Shuzo),置于30℃下轻轻摇动3小时。通过显微镜观察原生质体化的程度,并将其保存于冰块上。
用Myracloth过滤上述酶反应混合液以去除细胞残余物,再向含有原生质体的滤液中加入等体积的缓冲液A(1.2M山梨糖醇,50mMCaCl2,35mM NaCl,10mM Tris-HCl,pH7.5),并置于冰块上。上述混合液在0℃下1,500rpm离心5分钟,缓慢终止离心,用上述缓冲液洗涤两次,将其悬浮于1ml缓冲液A中。
向100μl上述原生质体悬液中加入DNA溶液(10μl,10μg),并静置于冰块上30分钟。将250μl缓冲液B(60%PEG(聚乙二醇)6000,50mM CaCl2,10mM Tris-HCl,pH7.5)加入到上述混合液中,并轻轻混匀。接着,再分别加入250μl和850μl缓冲液B并轻轻混匀,将混合物于室温静置20分钟。然后,向上述混合液中加入10ml缓冲液A,再将试管倒置并于0℃下1500rpm离心5分钟。将沉淀悬浮于500μl缓冲液A中。
将上述悬液加入到5mL已事先分成数部分并预热的顶层琼脂培养基上,且该培养基覆盖在一层M培养基上(1.2M山梨糖醇,0.2%氯化铵,0.1%硫酸铵,0.05%氯化钾,0.05%氯化钠,0.1%磷酸二氢钠,0.05%硫酸镁,0.002%硫酸亚铁,2%葡萄糖,pH5.5),再置于30℃下培养。然后,将培养出细胞的一个菌株转移到M培养基上。确定菌株为转化体。再从这些细胞中制备重组DNA,经Southern分析,确定其中至少存在本发明的DNA的两个拷贝。
用麦麸培养上述转化子,并测定其提取液的谷氨酰胺酶活性。为了制备该培养基,将麦麸(Nisshin Flour Milling,160g)、磷酸钾(3.2g)和蒸馏水(160ml)充分混合,再将其加入到直径为15cm的培养皿内,并在120℃下消毒20分钟。
向充分形成孢子的转化子的斜面培养物中,倒入10ml无菌水,并加以搅拌以制备孢子悬液。再将该悬液接种到上述培养基中。已接种孢子的培养基充分混合,并在30℃下培养14天。在培养的整个过程中,培养基均需置于摇床内不停地摇动。
将依照上述方法制备的麸曲浸于三倍体积的20mM磷酸钾(pH7.4),1mM PMSF(苯甲基磺酰氟),0.1mM EPNP(1,2-环氧-3-对苯硝基丙烷)和1mM EDTA溶液内,并静置于4℃下16小时,用薄纱布过滤后,再进行离心分离(4℃,15分钟,10,000rpm),从而提供上清液用作酶的粗提液。
测定该粗酶提取物的谷氨酰胺酶活性以类似的方法,从这样一种转化体中提取酶的粗提液,该转化体由仅含有标记基因的载体DNA转化而得用作对照菌株,并测定其谷氨酰胺酶的活性。
表4谷氨酰胺酶活性(每kojimg)转化子 1.43U/mg对照菌株 0.38U/mg结果,在导入本发明的基因的菌株中,观察到明显的活性的增加。并且,该实验也证明了导入的谷氨酰胺酶得到了表达与制备。
工业应用性本发明提供了一种新颖的,编码谷氨酰胺酶的基因,该基因来源于曲霉。上述基因可用于曲霉的培育,谷氨酰胺酶的制备和例如酱油等调味品的生产。
序列表<110>Ajinomoto Co., Inc.<120>一种新的谷氨酰胺酶,其基因和生产方法<130>B-481AYOP849<141>1999-05-12<150>JP10-134080<151>1998-05-15<150>JP10-258974<151>1998-09-11<150>JP10-292443<151>1998-10-14<150>JP11-89157<151>1999-03-30<160>26<170>Patentln Ver. 2.0<210>1<211>4013<212>DNA<213>米曲霉<220><221>CDS<222>join(1174..1370,1446..1741,1800..2242,2297..2880,2932..3134,3181..3324,3380..3515,3562..3628)<220><221>内含子<222>(1371)..(1445)<220><221>内含子<222>(1742)..(1799)<220><221>内含子<222>(2243)..(2296)<220><221>内含子<222>(2881)..(2931)<220><221>内含子<222>(3135)..(3180)<220><221>内含子<222>(3325)..(3379)<220><221>内含子<222>(3516)..(3561)f<220><221>信号肽<222>(1174)..(1233)<220><221>成熟肽<222>(1234..1370,1446..1741,1800..2242,2297..2880,2932..3134,3181..3324,3380..3515,3562..3628)<400>1ctcgagagac tccttgccac ctgatactat cacaattgtc ggtcacacgc gactggctac 60tactacttcg taggcaccgt agtatacccc agtctcttta ggatggcaat accttgttgt 120atagatgttg tagtcatgta ggattccctg gagattccct gatcggacgg caagagtgac 180cccacttcca agtattgact ccatctcagc tcgatgtatc actttcctgt ttagggcacg 240ggagcatcac tgacggctct ctgcctcagg ccatgattgt ttcttttgtc aattcgactt 300ctccaaatcg agctgcagat ctgtcgaccc catcccagtt gatgcagtag ctcggctacc 360ggaagagatt tattcttagt cccttgttgg gattgggatt caccctcgct tctgtttctc 420accgtattta tatcgcgcaa tgagattgat ccggatataa aatgtctgtg atgcactctt 480tctcacgcac cgaggtaatc aatatcatat gctttcccct catatcactg ccgaaaagac 540taactcggtc taccccatag tcaccagcca ctagcgcttc ttgggcctct ccttgtttgc 600tcagtggatc taaagccaag actatcatgg ttagtgtcgg gttgtcttca ttagatcgtc 660tgcagcccca gagtgtatcg gcttaggact ggtcgagccc gacgcggcta aggataaggt 720acatactccc actctatcga cccttgcttg ttaatctccg atcttgtctc ctgtccaatt 780gtcgggcttc tcctggaatt ccaggtttct ttcacctgtc gggcagccgg atcgaggccg 840catgaattgc tcccccacag agactgacag gtcaggcgat attgggggag tcacaatcat 900gcgcgccccc attccgcatt ccgtttctcg accctcatgc agcgtgctaa acttccatag 960tccctcctga attgtctgcc ctgccctccg gtatgcgggc tggaccaact atataagtgt 1020gcctaacatt ccttcagcat tcttcaggcc cacattctcg ggggcacgtt ttttggcgga 1080tctcgatcct actctttcat tctttgaaga aacctggaat tattacgtgt ataaatgaag 1140gatgtaccct gtgtgaatcc ctcaatacgg atc atg atg cat ttc ctc tcg ttc 1194Met Met His Phe Leu Ser Phe-20 -15tgt ctg tcg gtg gcc tcc ctg gtg tct tac gcg gga gct gcg tca aca 1242Cys Leu Ser Val Ala Ser Leu Val Ser Tyr Ala Gly Ala Ala Ser Thr-10 -5 1ttc tcc cct gcg agg cca ccc gcc ctg ccc ttg gct gtc aaa tcg ccg 1290Phe Ser Pro Ala Arg Pro Pro Ala Leu Pro Leu Ala Val Lys ser Pro5 10 15tac ttg agc aca tgg ctc tct gcg ggc aca gat ggc ggt aat gga ggg 1338Tyr Leu Ser Thr Trp Leu Ser Ala Gly Thc Asp Gly Gly Asn Gly Gly20 25 30 35tac ctg gcc ggc caa tgg cct acc ttc tgg tt gtgagtagtc 1380Tyr Leu Ala Gly Gln Trp Pro Thr Phe Trp Phe40 45ccgagctgta gaaatgaaga catccatctt gatgtacatt ggctaaacca cgtccctcgt 1440ggcag c ggc cag gtg acc ggc tgg gcg ggt cag atc cgg gtc gat aat 1488Gly Gln Val Thr Gly Trp Ala Gly Gln Ila Arg Val Asp Asn50 55 60tcg acc tac aca tgg atg ggg gcg atc cct aac acc cct acg gtg aac 1536ser Thr Tyr Thr Trp Met Gly Ala Ile Pro Asn Thr Pro Thr Val Asn65 70 75cag aca tcc ttc gag tac acc tcg acg tcg agc gtg ttc acg atg cgt 1584Gln Thr Ser Phe Glu Tyr Thr Ser Thr Ser Ser Val Phe Thr Met Arg80 85 90gtt ggg gat atg gtg gaa atg aaa gtg aaa ttc ctg tcc cct atc aca 1632Val Gly Asp Met Val Glu Met Lys Val Lys Phe Leu Ser Pro Ile Thr95 100 105cca gat gat ctc cgg aga cag tcg ctt gtg ttt tcc tat ctg gac gta 1680Pro Asp Asp Leu Arg Arg Gln ser Leu Val Phe Ser Tyr Leu Asp Val110 115 120gat gtc gaa tcg atc gac ggc aaa gcg cat gac ata cag gtg tac gca 1728Asp Val Glu Ser Ile Asp Gly Lys Ala His Asp Ile Gln Val Tyr Ala125130 135 140gac att tca gca g gtaagcaaga cgacaaccca cctggaacag tgcaaatatc 1781Asp Ile Ser Alacatctaaccg ggtcttag aa tgg gcg tcc ggg gac cga aac gcc att gcg1831Glu Trp Ala Ser Gly Asp Arg Asn Ala Ile Ala145 150 155cag tgg gac tat ggt gtc aca gat gat ggc gtt gcc tat cac aag gtt 1879Gln Trp Asp Tyr Gly Val Thr Asp Asp Gly Val Ala Tyr His Lys Val160 165 170tac cgc caa acg cag ctg ctg ttt tcc gaa aac act gag cag gcc gaa 1927Tyr Arg Gln Thr Gln Leu Leu Phe Ser Glu Asn Thr Glu Gln Ala Glu175 180 185tgg ggc gag tgg tac tgg gcc aca gac gac caa gat ggt ctg agc tac 1975Trp Gly Glu Trp Tyr Trp Ala Thr Asp Asp Gln Asp Gly Leu Ser Tyr190 195 200cag tcc gga ccg gat gtt gar gtg cga ggg gca ttc gca aag aac gga 2023Gln Ser Gly Pro Asp Val Asp Val Arg Gly Ala Phe Ala Lys Asn Gly205 210 215aag ttg gcg aat tcg gat gat aaa aat tat cgt gca atc tcg acc aat 2071Lys Leu Ala Asn Ser Asp Asp Lys Asn Tyr Arg Ala Ile Ser Thr Asn220 225 230 235tgg ccc gtg ttt gcc ttc tcc cgc gat ctt ggc tcg gtg aag acg tct 2119Trp Pro Val Phe Ala Phe Ser Arg Asp Leu Gly Ser Val Lys Thr Ser240 245 250gct ggc acg tta ttc tcc att ggc ctt gcg cag gac agt gcc ata cag 2167Ala Gly Thr Leu Phe Ser Ile Gly Leu Ala Gln Asp Ser Ala Ile Gln255 260 265tac agt ggg aaa cct gaa ggg aca act gtg atg cct tca ctc tgg aag 2215Tyr Ser Gly Lys Pro Glu Gly Thr Thr Val Met Pro Ser Leu Trp Lys270 275 280agc tac ttc agc act gcg act gct gcg gtaagtggcc cactgctgtt 2262Ser Tyr Phe Ser Thr Ala Thr Ala Ala285 290tcggacctag aacataatct gaccatctat gtag ctt gag ttc ttc cat cat 2314Leu Glu Phe Phe His His295gat tat gct gct gca gct gca cta tcg aag gat ctc gat gac cgg ata 2362Asp Tyr Ala Ala Ala Ala Ala Leu Ser Lys Asp Leu Asp Asp Arg Ile300 305 310tcc aag gat tcc att gat gcc gct ggc cag gac tac ctg aca atc acc 2410Ser Lys Asp Ser Ile Asp Ala Ala Gly Gln Asp Tyr Leu Thr Ile Thr315 320 325 330tcc ctc acg gtc cgt caa gtc ttt gct gcc gtg caa ttg acc ggc acg 2458Ser Leu Thr Val Arg Gln Val Phe Ala Ala Val Gln Leu Thr Gly Thr335 340 345ccc gag gac ccc tac atc ttc atg aag gag atc tcg tcc aat ggc aac 2506Pro Glu Asp Pro Tyr Ile Phe Met Lys Glu Ile Ser Ser Asn Gly Asn350 355 360atg aac act gtg gac gtc atc ttc ccc gct cac ccg atc ttt ttg tac 2554Met Asn Thr Val Asp Val Ile Phe Pro Ala His Pro Ile Phe Leu Tyr365 370 375acc aat ccc gag ctc ctc aaa ctg att ctg aag cca atc tat gag att 2602Thr Asn Pro Glu Leu Leu Lys Leu Ile Leu Lys Pro Ile Tyr Glu Ile380 385 390caa gag aac gga aag tat ccc aac aca tac gcc atg cac gat att gga 2650Gln Glu Asn Gly Lys Tyr Pro Asn Thr Tyr Ala Met His Asp Ile Gly395 400 405 410acc cac tac ccg aac gcc acg ggc cat cct aag ggc gac gac gag aaa 2698Thr His Tyr Pro Asn Ala Thr Gly His Pro Lys Gly Asp Asp Glu Lys415 420 425atg cca ctc gag gag tgt gga aac atg gtt atc atg gcc ctt gcc tac 2746Met Pro Leu Glu Glu Cys Gly Asn Met Val Ile Met Ala Leu Ala Tyr430 435 440gcc cag aag gcc aag gac aac gac tat ctt tca cag cac tat ccc atc 2794Ala Gln Lys Ala Lys Asp Asn Asp Tyr Leu Ser Gln His Tyr Pro Ile445 450 455ctc aac aaa tgg aca aca tac ctc gtc gag gat tct att tac ccg gcg 2842Leu Asn Lys Trp Thr Thr Tyr Leu Val Glu Asp Ser Ile Tyr Pro Ala460 465 470aac cag atc tct acg gat gac ttt gct ggc tcg cta gc gtaagtgata2890Asn Gln Ile Ser Thr Asp Asp Phe Ala Gly Ser Leu Ala475 480 485tacatacacg acacaggcgg tgatactaat agtatgtaca g a aac cag acc aac 2944Asn Gln Thr Asn490ctg gca ttg aag gga atc att gga atc cag gca atg gct gtg atc agc 2992Leu Ala Leu Lys Gly Ile Ile Gly Ile Gln Ala Met Ala Val Ile Ser495 500 505aat acg aca gga cac ccg gac gat gcc tcc aac cac tcc agc att gcc 3040Asn Thr Thr Gly His Pro Asp Asp Ala Ser Asn His Ser Ser Ile Ala510 515 520aag gac tac atc gcg agg tgg cag aca cta ggc gta gct cac gat gcc 3088Lys Asp Tyr Ile Ala Arg Trp Gln Thr Leu Gly Val Ala His Asp Ala525 530 535aat cct ccg cat aca acg ctg tcg tac gga gcg aac gag act cat g3134Asn Pro Pro His Thr Thr Leu Ser Tyr Gly Ala Asn Glu Thr His540545 550gtcagttagc cgctccgggt gcacttataa tactgacttt ctccag gg ctt ctg 3188Gly Leu Leu555tac aat ctg tat gcg gat cgt gaa ttg ggc ttg aac ttg gtt cct cag 3236Tyr Asn Leu Tyr Ala Asp Arg Glu Leu Gly Leu Asn Leu Val Pro Gln560 565 570tcg gtc tat gac atg caa aac acc ttc tat ccg acg gtg aag gag aag 3284Ser Val Tyr Asp Met Gln Asn Thr Phe Tyr Pro Thr Val Lys G1u Lys575 580 585tat gga gtg ccg ctc gat act cga cac gtg tac act aag g3324Tyr Gly Val Pro Leu Asp Thr Arg His Val Tyr Thr Lys590 595 600gtaagctcga tatgttcttt ctaatgtttg acattgaata ttgacttgtc cccag cg 3381Alagat tgg gag ctt ttc aca gct gcg gtt gcg tcg gag agt gtc cga gac 3429Asp Trp Glu Leu Phe Thr Ala Ala Val Ala Ser Glu Ser Val Arg Asp605 610 615atg ttc cac cag gcg ctc gcg acg tgg atc aac gag aca ccg acc aac 3477Met Phe His Gln Ala Leu Ala Thr Trp Ile Asn Glu Thr Pro Thr Asn620 625 630 635cgt gcc ttt acg gat ctc tat gat acc caa act gga aa gtaagtgttt3525Arg Ala Phe Thr Asp Leu Tyr Asp Thr Gln Thr Gly Asn640 645gccaaggggc tgcttgggcc ttgctgacca atatag t tat ccg gcg ggc att3577Tyr Pro Ala Gly Ile650acg ttc att gcg cgg ccc gtc atg ggt ggt gcc ttt gcg ttg tta att 3625Thr Phe Ile Ala Arg Pro Val Met Gly Gly Ala Phe Ala Leu Leu Ile655 660 665ctc tagagtcgtt tcattgtata ttgattttat tcgcttctgg gcgcgagtgg 3678Leu670agacacttgc ttactttgtt tccaatttta ttattaccgt ggctatggga ccagattgac 3738cgttgttaat agcgtacctc atacatagca tttttattct gcaaatagtg ttgttgtatt 3798tgggtctcca ataataatgc gttcgtagac gatgctccaa aggaactatc tggtctgcaa 3858gctgcttata tcaagcatat ataaagatct acgtatccag tcgtgcttat ccaagtggct 3918ctggccgtct accgcagatc gtaagtggac tcgaccgagc catcccacgc atcaaaagcg 3978cgaataagat ctacaaagtc agcaatcata ctcct4013<210>2<211>690<212>蛋白质<213>米曲霉<400>2Met Met His Phe Leu Ser Phe Cys Leu Ser Val Ala Ser Leu Val Ser-20 -15 -10 -5Tyr Ala Gly Ala Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala Leu1 5 10Pro Leu Ala Val Lys Ser Pro Tyr Leu Ser Thr Trp Leu Ser Ala Gly15 20 25Thr Asp Gly Gly Asn Gly Gly Tyr Leu Ala Gly Gln Trp Pro Thr Phe30 35 40Trp Phe Gly Gln Val Thr Gly Trp Ala Gly Gln Ile Arg Val Asp Asn45 50 55 60Ser Thr Tyr Thr Trp Met Gly Ala Ile Pro Asn Thr Pro Thr Val Asn65 70 75Gln Thr Ser Phe Glu Tyr Thr Ser Thr Ser Ser Val Phe Thr Met Arg80 85 90Val Gly Asp Met Val Glu Met Lys Val Lys Phe Leu Ser Pro Ile Thr95 100 105Pro Asp Asp Leu Arg Arg Gln Ser Leu Val Phe Ser Tyr Leu Asp Val110 115 120Asp Val Glu Ser Ile Asp Gly Lys Ala His Asp Ile Gln Val Tyr Ala125 130 135 140Asp Ile Ser Ala Glu Trp Ala Ser Gly Asp Arg Asn Ala Ile Ala Gln145 150 155Trp Asp Tyr Gly Val Thr Asp Asp Gly Val Ala Tyr His Lys Val Tyr160 165 170Arg Gln Thr Gln Leu Leu Phe Ser Glu Asn Thr Glu Gln Ala Glu Trp175 180 185Gly Glu Trp Tyr Trp Ala Thr Asp Asp Gln Asp Gly Leu Ser Tyr Gln190 195 200Ser Gly Pro Asp Val Asp Val Arg Gly Ala Phe Ala Lys Asn Gly Lys205 210 215 220Leu Ala Asn Ser Asp Asp Lys Asn Tyr Arg Ala Ile Ser Thr Asn Trp225 230 235Pro Val Phe Ala Phe Ser Arg Asp Leu Gly Ser Val Lys Thr Ser Ala240 245 250Gly Thr Leu Phe Ser Ile Gly Leu Ala Gln Asp Ser Ala Ile Gln Tyr255 260 265Ser Gly Lys Pro Glu Gly Thr Thr Val Met Pro Ser Leu Trp Lys Ser270 275 280Tyr Phe Ser Thr Ala Thr Ala Ala Leu Glu Phe Phe His His Asp Tyr285 290 295 300Ala Ala Ala Ala Ala Leu Ser Lys Asp Leu Asp Asp Arg Ile Ser Lys305 3l0 315Asp Ser Ile Asp Ala Ala Gly Gln Asp Tyr Leu Thr Ile Thr Ser Leu320 325 330Thr Val Arg Gln Val Phe Ala Ala Val Gln Leu Thr Gly Thr Pro Glu335 340 345Asp Pro Tyr Ile Phe Met Lys Glu Ile Ser Ser Asn Gly Asn Met Asn350 355 360Thr Val Asp Val Ile Phe Pro Ala His Pro Ile Phe Leu Tyr Thr Asn365 370 375 380Pro Glu Leu Leu Lys Leu Ile Leu Lys Pro Ile Tyr Glu Ile Gln Glu385 390 395Asn Gly Lys Tyr Pro Asn Thr Tyr Ala Met His Asp Ile Gly Thr His400 405 410Tyr Pro Asn Ala Thr Gly His Pro Lys Gly Asp Asp Glu Lys Met Pro415 420 425Leu Glu Glu Cys Gly Asn Met Val Ile Met Ala Leu Ala Tyr Ala Gln430 435 440Lys Ala Lys Asp Asn Asp Tyr Leu Ser Gln His Tyr Pro Ile Leu Asn445 450 455 460Lys Trp Thr Thr Tyr Leu Val Glu Asp Ser Ile Tyr Pro Ala Asn Gln465 470 475Ile Ser Thr Asp Asp Phe Ala Gly Ser Leu Ala Asn Gln Thr Asn Leu480 485 490Ala Leu Lys Gly Ile Ile Gly Ile Gln Ala Met Ala Val Ile Ser Asn495 500 505Thr Thr Gly His Pro Asp Asp Ala Ser Asn His Ser Ser Ile Ala Lys510 515 520Asp Tyr Ile Ala Arg Trp Gln Thr Leu Gly Val Ala His Asp Ala Asn525 530 535 540Pro Pro His Thr Thr Leu Ser Tyr Gly Ala Asn Glu Thr His Gly Leu545 550 555Leu Tyr Asn Leu Tyr Ala Asp Arg Glu Leu Gly Leu Asn Leu Val Pro560 565 570Gln Ser Val Tyr Asp Met Gln Asn Thr Phe Tyr Pro Thr Val Lys Glu575 580 585Lys Tyr Gly Val Pro Leu Asp Thr Arg His Val Tyr Thr Lys Ala Asp590 595 600Trp Glu Leu Phe Thr Ala Ala Val Ala Ser Glu Ser Val Arg Asp Met605 610 615 620Phe His Gln Ala Leu Ala Thr Trp Ile Asn Glu Thr Pro Thr Asn Arg625 630 635Ala Phe Thr Asp Leu Tyr Asp Thr Gln Thr Gly Asn Tyr Pro Ala Gly640 645 650Ile Thr Phe Ile Ala Arg Pro Val Met Gly Gly Ala Phe Ala Leu Leu655 660 665Ile Leu670<210>3<211>17<212>蛋白质<213>米曲霉<400>3Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala Leu Pro Leu Ala Val1 5 10 15Lys<210>4<211>10<212>蛋白质<213>米曲霉<220><221>misc_特征<222>(2)<223>Xaa=Gly或Pro<220><221>misc_特征<222>(3)<223>Xaa=Asn或Val<220><221>misc_特征<222>(4)<223>Xaa=Thr或Pro<220><221>misc_特征<222>(8)<223>Xaa=Arg或Ser<400>4Tyr Xaa Xaa Xaa Tyr Ala Met Xaa Asp Ile1 5 10<210>5<211>9<212>蛋白质<213>米曲霉<220><221>misc_特征<222>(4)<223>Xaa=Thr或Gly<220><221>misc_特征<222>(8)<223>Xaa为不确定氨基酸<400>5Val Gln Tyr Xaa Glu Tyr Asp Xaa Tyr1 5<210>6<211>14<212>蛋白质<213>米曲霉<400>6Asp Asn Asp Tyr Leu Ser Gln His Tyr Pro Ile Leu Asn Lys1 5 10<210>7<211>15<212>蛋白质<213>米曲霉<400>7Trp Thr Ala Tyr Leu Val Glu Asp Thr Ile Tyr Pro Ala Asn Gln1 5 10 15<210>8<211>10<212>蛋白质<213>米曲霉<400>8Val Leu Leu Gln Ser Ala Ile Glu Gly His1 5 10<210>9<211>10<212>蛋白质<213>米曲霉<400>9Gly Ile Ile Gly lle Gln Ala Met Ala Val1 5 10<210>10<211>10<212>蛋白质<213>米曲霉<220><221>misc_特征<222>(1,6,8,9)<223>Xaa不确定<400>10Xaa Ile Leu Lys Phe Xaa.Tyr Xaa Xaa Gln1 5 10<210>11<211>30<212>DNA<213>人工序列<220><223>人工序列描述引物<400>11taccccaaca cctatgctat gcgcgatatc 30<210>12<211>36<212>DNA<213>人工序列<220><223>人工序列描述引物<400>12ttggttcgcc ggataaatag tatcttcgac caagta 36<210>13<211>29<212>DNA<213>人工序列<220><223>人工序列描述引物<400>13gatcatgatg catttcctct cgttctgtc29<210>14<211>28<212>DNA<213>人工序列<220><223>人工序列描述引物<400>14gcaaagtcat ccgtagagat ctggttcg 28<210>15<211>30<212>DNA<213>人工序列<220><223>人工序列描述引物<400>15ggcgaaccag atctctacgg atgactttgc30<210>16<211>21<212>DNA<213>人工序列<220><223> 人工序列描述引物<400>16ctgatctaga cctgcaggct c21<210>17<211>2269<212>DNA<213>米曲霉<220><221>CDS<222>(1)..(2070)<220><221>信号肽<222>(1)..(60)<220><221>成熟肽<222>(61)..(2070)<400>17atg atg cat ttc ctc tcg ttc tgt ctg tcg gtg gcc tcc ctg gtg tct 48Met Met His Phe Leu Ser Phe Cys Leu Ser Val Ala Ser Leu Val Ser-20 -15 -10 -5tac gcc gga gct gcg tca aca ttc tcc cct gcg agg cca ccc gcc ctg 96Tyr Ala Gly Ala Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala Leu-1 1 5 10ccc ttg gct gtc aaa tcg ccg tac ttg agc aca tgg ctc tct gcg ggc 144Pro Leu Ala Val Lys Ser Pro Tyr Leu Ser Thr Trp Leu Ser Ala Gly15 20 25aca gat ggc ggt aat gga ggg tac ctg gcc ggc caa tgg cct acc ttc 192Thr Asp Gly Gly Asn Gly Gly Tyr Leu Ala Gly Gln Trp Pro Thr Phe30 35 40tgg ttc ggc cag gtg acc ggc tgg gcg ggt cag atc cgg gtc gat aat 240Trp Phe Gly Gln Val Thr Gly Trp Ala Gly Gln Ile Arg Val Asp Asn45 50 55 60tcg acc tac aca tgg atg ggg gcg atc cct aac acc cct acg gtg aac 288Ser Thr Tyr Thr Trp Met Gly Ala Ile Pro Asn Thr Pro Thr Val Asn65 70 75cag aca tcc ttc gag tac acc tcg acg tcg agc gtg ttc acg atg cgt 336Gln Thr Ser Phe Glu Tyr Thr Ser Thr Ser Ser Val Phe Thr Met Arg80 85 90gtt ggg gat atg gtg gaa atg aaa gtg aaa ttc ctg tcc cct atc aca 384Val Gly Asp Met Val Glu Met Lys Val Lys Phe Leu Ser Pro Ile Thr95 100 105cca gat gat ctc cgg aga cag tcg ctt gtg ttt tcc tat ctg gac gta 432Pro Asp Asp Leu Arg Arg Gln Ser Leu Val Phe Ser Tyr Leu Asp Val110 115 120gat gtc gaa tcg atc gac ggc aaa gcg cat gac ata cag gtg tac gca 480Asp Val Glu Ser Ile Asp Gly Lys Ala His Asp Ile Gln Val Tyr Ala125 130 135 140gac att tca gca gaa tgg gcg tcc ggg gac cga aac gcc att gcg cag 528Asp Ile Ser Ala Glu Trp Ala Ser Gly Asp Arg Asn Ala Ile Ala Gln145 150 155tgg gac tat ggt gtc aca gat gat ggc gtt gcc tat cac aag gtt tac 576Trp Asp Tyr Gly Val Thr Asp Asp Gly Val Ala Tyr His Lys Val Tyr160 165 170cgc caa acg cag ctg ctg ttt tcc gaa aac act gag cag gcc gaa tgg 624Arg Gln Thr Gln Leu Leu Phe Ser Glu Asn Thr Glu Gln Ala Glu Trp175 180 185ggc gag tgg tac tgg gcc aca gac gac caa gat ggt ctg agc tac cag 672Gly Glu Trp Tyr Trp Ala Thr Asp Asp Gln Asp Gly Leu Ser Tyr Gln190 195 200tcc gga ccg gat gtt gat gtg cga ggg gca ttc gca aag aac gga aag 720Ser Gly Pro Asp Val Asp Val Arg Gly Ala Phe Ala Lys Asn Gly Lys205 210 215 220ttg gcg aat tcg gat gat aaa aat tat cgt gca atc tcg acc aat tgg 768Leu Ala Asn Ser Asp Asp Lys Asn Tyr Arg Ala Ile Ser Thr Asn Trp225 230 235ccc gtg ttt gcc ttc tcc cgc gat ctt ggc tcg gtg aag acg tct gct 816Pro Val Phe Ala Phe Ser Arg Asp Leu Gly Ser Val Lys Thr Ser Ala240 245 250ggc acg tta ttc tcc att ggc ctt gcg cag gac agt gcc ata cag tac 864Gly Thr Leu Phe Ser Ile Gly Leu Ala Gln Asp Ser Ala Ile Gln Tyr255 260 265agt ggg aaa cct gaa ggg aca act gtg atg cct tca ctc tgg aag agc 912Ser Gly Lys Pro Glu Gly Thr Thr Val Met Pro Ser Leu Trp Lys Ser270 275 280tac ttc agc act gcg act gct gcg ctt gag ttc ttc cat cat gat tat 960Tyr Phe Ser Thr Ala Thr Ala Ala Leu Glu Phe Phe His His Asp Tyr285 290 295 300gct gct gca gct gca cta tcg aag gat ctc gat gac cgg ata tcc aag 1008Ala Ala Ala Ala Ala Leu Ser Lys Asp Leu Asp Asp Arg Ile Ser Lys305 310 315gat tcc att gat gcc gct ggc cag gac tac ctg aca atc acc tcc ctc 1056Asp Ser Ile Asp Ala Ala Gly Gln Asp Tyr Leu Thr Ile Thr Ser Leu320 325 330acg gtc cgt caa gtc ttt gct gcc gtg caa ttg acc ggc acg ccc gag 1104Thr Val Arg Gln Val Phe Ala Ala Val Gln Leu Thr Gly Thr Pro Glu335 340 345gac ccc tac atc ttc atg aag gag atc tcg tcc aat ggc aac atg aac 1152Asp Pro Tyr Ile Phe Met Lys Glu Ile Ser Ser Asn Gly Asn Met Asn350 355 360act gtg gac gtc atc ttc ccc gct cac ccg atc ttt ttg tac acc aat 1200Thr Val Asp Val Ile Phe Pro Ala His Pro Ile Phe Leu Tyr Thr Asn365 370 375 380ccc gag ctc ctc aaa ctg att ctg aag cca atc tat gag att caa gag 1248Pro Glu Leu Leu Lys Leu Ile Leu Lys Pro Ile Tyr Glu Ile Gln Glu385 390 395aac gga aag tat ccc aac aca tac gcc atg cac gat att gga acc cac 1296Asn Gly Lys Tyr Pro Asn Thr Tyr Ala Met His Asp Ile Gly Thr His400 405 410tac ccg aac gcc acg ggc cat cct aag ggc gac gac gag aaa atg cca 1344Tyr Pro Asn Ala Thr Gly His Pro Lys Gly Asp Asp Glu Lys Met Pro415 420 425ctc gag gag tgt gga aac atg gtt atc atg gcc ctt gcc tac gcc cag 1392Leu Glu Glu Cys Gly Asn Met Val Ile Met Ala Leu Ala Tyr Ala Gln430 435 440aag gcc aag gac aac gac tat ctt tca cag cac tat ccc atc ctc aac 1440Lys Ala Lys Asp Asn Asp Tyr Leu Sec Gln His Tyr Pro Ile Leu Asn445 450 455 460aaa tgg aca aca tac ctc gtc gag gat tct att tac ccg gcg aac cag 1488Lys Trp Thr Thr Tyr Leu Val Glu Asp Ser Ile Tyr Pro Ala Asn Gln465 470 475atc tct acg gat gac ttt gct ggc tcg cta gca aac cag acc aac ctg 1536Ile Ser Thr Asp Asp Phe Ala Gly Ser Leu Ala Asn Gln Thr Asn Leu480 485 490gca ttg aag gga atc att gga atc cag gca atg gct gtg atc agc aat 1584Ala Leu Lys Gly Ile Ile Gly Ile Gln Ala Met Ala Val Ile Ser Asn495 500 505acg aca gga cac ccg gac gat gcc tcc aac cac tcc agc att gcc aag 1632Thr Thr Gly His Pro Asp Asp Ala Ser Asn His Ser Ser Ile Ala Lys510 515 520gac tac atc gcg agg tgg cag aca cta ggc gta gct cac gat gcc aat 1680Asp Tyr Ile Ala Arg Trp Gln Thr Leu Gly Val Ala His Asp Ala Asn525 530 535 540cct ccg cat aca acg ctg tcg tac gga gcg aac gag act cat ggg ctt 1728Pro Pro His Thr Thr Leu Ser Tyr Gly Ala Asn Glu Thr His Gly Leu545 550 555ctg tac aat ctg tat gcg gat cgt gaa ttg ggc ttg aac ttg gtt cct 1776Leu Tyr Asn Leu Tyr Ala Asp Arg Glu Leu Gly Leu Asn Leu Val Pro560 565 570cag tcg gtc tat gac atg caa aac acc ttc tat ccg acg gtg aag gag 1824Gln Ser Val Tyr Asp Met Gln Asn Thr Phe Tyr Pro Thr Val Lys Glu575 580 585aag tat gga gtg ccg ctc gat act cga cac gtg tac act aag gcg gat 1872Lys Tyr Gly Val Pro Leu Asp Thr Arg His Val Tyr Thr Lys Ala Asp590 595 600tgg gag ctt ttc aca gct gcg gtt gcg tcg gag agt gtc cga gac atg 1920Trp Glu Leu Phe Thr Ala Ala Val Ala Ser Glu Ser Val Arg Asp Met605 610 615 620ttc cac cag gcg ctc gcg acg tgg atc aac gag aca ccg acc aac cgt 1968Phe His Gln Ala Leu Ala Thr Trp Ile Asn Glu Thr Pro Thr Asn Arg625 630 635gcc ttt acg gat ctc tat gat acc caa act gga aat tat ccg gcg ggc 2016Ala Phe Thr Asp Leu Tyr Asp Thr Gln Thr Gly Asn Tyr Pro Ala Gly640 645 650att acg ttc att gcg cgg ccc gtc atg ggt ggt gcc ttt gcg ttg tta 2064Ile Thr Phe Ile Ala Arg Pro Val Met Gly Gly Ala Phe Ala Leu Leu655 660 665att ctc tagagtcgtt tcattgtata ttgattttat tcgcttctgg gcgcgagtgg2120Ile Leu670agacacttgc ttactttgtt tccaatttta ttattaccgt ggctatggga ccagattgac 2180cgttgttaat agcgtacctc atacatagca tttttattct gcaaaaaaaa aaaaaaaaaa 2240aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 2269<210>18<211>690<212>蛋白质<213>米白霉<400>18Met Met His Phe Leu Ser Phe Cys Leu Ser Val Ala Ser Leu Val Ser-20 -15 -10 -5Tyr Ala Gly Ala Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala Leu-1 1 5 10Pro Leu Ala Val Lys Ser Pro Tyr Leu Ser Thr Trp Leu Ser Ala Gly15 20 25Thr Asp Gly Gly Asn Gly Gly Tyr Leu Ala Gly Gln Trp Pro Thr Phe30 35 40Trp Phe Gly Gln Val Thr Gly Trp Ala Gly Gln Ile Arg Val Asp Asn45 50 55 60Ser Thr Tyr Thr Trp Met Gly Ala Ile Pro Asn Thr Pro Thr Val Asn65 70 75Gln Thr Ser Phe Glu Tyr Thr Ser Thr Ser Ser Val Phe Thr Met Arg80 85 90Val Gly Asp Met Val Glu Met Lys Val Lys Phe Leu Ser Pro Ile Thr95 100 105Pro Asp Asp Leu Arg Arg Gln Ser Leu Val Phe Ser Tyr Leu Asp Val110 115 120Asp Val Glu Ser Ile Asp Gly Lys Ala His Asp Ile Gln Val Tyr Ala125130 135 140Asp Ile Ser Ala Glu Trp Ala Ser Gly Asp Arg Asn Ala Ile Ala Gln145 150 155Trp Asp Tyr Gly Val Thr Asp Asp Gly Val Ala Tyr His Lys Val Tyr160 165 170Arg Gln Thr Gln Leu Leu Phe Ser Glu Asn Thr Glu Gln Ala Glu Trp175 180 185Gly Glu Trp Tyr Trp Ala Thr Asp Asp Gln Asp Gly Leu Ser Tyr Gln190 195 200Ser Gly Pro Asp Val Asp Val Arg Gly Ala Phe Ala Lys Asn Gly Lys205 210 215 220Leu Ala Asn Ser Asp Asp Lys Asn Tyr Arg Ala Ile Ser Thr Asn Trp225 230 235Pro Val Phe Ala Phe Ser Arg Asp Leu Gly Ser Val Lys Thr Ser Ala240 245 250Gly Thr Leu Phe Ser Ile Gly Leu Ala Gln Asp Ser Ala Ile Gln Tyr255 260 265Ser Gly Lys Pro Glu Gly Thr Thr Val Met Pro Ser Leu Trp Lys Ser270 275 280Tyr Phe Ser Thr Ala Thr Ala Ala Leu Glu Phe Phe His His Asp Tyr285 290 295 300Ala Ala Ala Ala Ala Leu Ser Lys Asp Leu Asp Asp Arg Ile Ser Lys305 310 315Asp Ser Ile Asp Ala Ala Gly Gln Asp Tyr Leu Thr Ile Thr Ser Leu320 325 330Thr Val Arg Gln Val Phe Ala Ala Val Gln Leu Thr Gly Thr Pro Glu335 340 345Asp Pro Tyr Ile Phe Met Lys Glu Ile Ser Ser Asn Gly Asn Met Asn350 355 360Thr Val Asp Val Ile Phe Pro Ala His Pro Ile Phe Leu Tyr Thr Asn365 370 375 380Pro Glu Leu Leu Lys Leu Ile Leu Lys Pro Ile Tyr Glu Ile Gln Glu385 390 395Asn Gly Lys Tyr Pro Asn Thr Tyr Ala Met His Asp Ile Gly Thr His400 405 410Tyr Pro Asn Ala Thr Gly His Pro Lys Gly Asp Asp Glu Lys Met Pro415 420 425Leu Glu Glu Cys Gly Asn Met Val Ile Met Ala Leu Ala Tyr Ala Gln430 435 440Lys Ala Lys Asp Asn Asp Tyr Leu Ser Gln His Tyr Pro Ile Leu Asn445 450 455 460Lys Trp Thr Thr Tyr Leu Val Glu Asp Ser Ile Tyr Pro Ala Asn Gln465 470 475Ile Ser Thr Asp Asp Phe Ala Gly Ser Leu Ala Asn Gln Thr Asn Leu480 485 490Ala Leu Lys Gly Ile Ile Gly Ile Gln Ala Met Ala Val Ile Ser Asn495 500 505Thr Thr Gly His Pro Asp Asp Ala Ser Asn His Ser Ser Ile Ala Lys510 515 520Asp Tyr Ile Ala Arg Trp Gln Thr Leu Gly Val Ala His Asp Ala Asn525 530 535 540Pro Pro His Thr Thr Leu Ser Tyr Gly Ala Asn Glu Thr His Gly Leu545 550 555Leu Tyr Asn Leu Tyr Ala Asp Arg Glu Leu Gly Leu Asn Leu Val Pro560 565 570Gln Ser Val Tyr Asp Met Gln Asn Thr Phe Tyr Pro Thr Val Lys Glu575 580 585Lys Tyr Gly Val Pro Leu Asp Thr Arg His Val Tyr Thr Lys Ala Asp590 595 600Trp Glu Leu Phe Thr Ala Ala Val Ala Ser Glu Ser Val Arg Asp Met605 610 615 620Phe His Gln Ala Leu Ala Thr Trp Ile Asn Glu Thr Pro Thr Asn Arg625 630 635Ala Phe Thr Asp Leu Tyr Asp Thr Gln Thr Gly Asn Tyr Pro Ala Gly640 645 650Ile Thr Phe Ile Ala Arg Pro Val Met Gly Gly Ala Phe Ala Leu Leu655 660 665Ile Leu670<210>19<211>27<212>DNA<213>人工序列<220><223>人工序列描述引物<400>19gacgaccaag atggtctgag ctaccagt 27<210>20<211>30<212>DNA<213>人工序列<220><223>人工序列描述引物<400>20gcaaagtcat ccgtagagat ctggttcgcc 30<210>21<211>6191<212>DNA<213>构巢曲霉<220><221>CDS<222>join(1807..2000,2061..2353,2412..2854,2915..3498,3554..3756,3806..3949,3996..4131,4180..4246)<220><221>内含子<222>(2001)..(2060)<220><221>内含子<222>(2354)..(2411)<220><221>内含子<222>(2855)..(2914)<220><221>内含子<222>(3499)..(3553)<220><221>内含子<222>(3757)..(3805)<220><221>内含子<222>(3950)..(3995)<220><221>内含子<222>(4132)..(4179)<220><221>信号肽<222>(1807)..(1863)<220><221>成熟肽<222>join(1864..2000,2061..2353,2412..2854,2915..3498,3554..2756,3806..3949,3996..4131,4180..4246)<400>21gatatccaat gtctagggcg tacggcattc tgaaatgatc cgtgtactgc acgaatactc 60catactacgt accacaagat tgaacaccct attatcaaac ttcgagagtc tgctgggcgt 120ataactgctg ggtggcgaac cgcgaaatta ttatacctta ggaggctccg gtctcaacgt 180gtaagcacta acgaaccctg gtccgctatg ctgtgcaagt atcagcacct cagcttgcag 240cgttcgccta cttaatccgt aacccgagga ccggaccggc aagactcgat tgtcccatgt 300gctctgtacc tgcgtggatg gcactcccag catctgctgt gccaaacgaa gcggatcgct 360ccaagcctgt tcgtccgaca acattcgcct tcacggcgag gccgaaacgg atctctgtgt 420gtccatagcc atttcagcct tctgtttatg cgttatatgt gctgaggata tacgccgagc 480cgcagggggg caagtagtgg gttaatgacg ggacctccgc atttctcttt gaatctggct 540gttagcgtgt cacttggctc gggttgggct gggtcatgca cggatctgca tcaagtcagt 600ctcttgtgat gtacgctgat ccggtgatgt acatatgagg ggtagaagat actcggggca 660gacactgact ttgtatggtg ggaacgatgt cacacaatgc aggcacagac atccagccaa 720cacctttgta cagagtatgc aaacaatgag ttggccagtc ggttgccagg attctcgttg 780cagcgcagga cagccaagag aagaaccaga gagatgaggg caatatctaa tccagtctct 840tgcatggtcc tctcccgcgt cattccgtac tggaatgtga ggggccgtat gtggaaatat 900tgcttgggat gacaaagggc gtgaagagtg aagggtttct tcaagtgctg gacggaagag 960tagggaggac tttgagcatg gcactttcct cttagggtac tctccagtcc cacgttttcg 1020cctcgctcct cgctctccaa ctcctctatt ttcccacaaa acacttctct ccttcgtatg 1080ctcctgctct gaatcagctt ggaaccctct cataaccctc cggggggggg gcccgcgttc 1140gttgataacc catgctacca tggcaaatga ccttactgac ggcgtaacag atctacttcg 1200cttggtcgaa cttcatgctt atttctaagc ttggttacta taggctcccg cgccgttttg 1260ggttgatcct ccctggtcag tcgtatttca aaccgttctg cagagtagcg gtggagcata 1320caagaaatac tcatgattga ttcttatagg agcggatctc ctctgtggag tatacaccca 1380atttcaaacc cctgttccct tcgctcgatt ggctattttc tttcgttttc catgtgtata 1440gtggcgacgg catgcgctgg tgcagataga atgatcggtc agacgacatt attcgagaaa 1500gttatgccta tgcatgtgca gatgcttctg cctcgattcg aaagagtcta gacagggctt 1560tccacatgct ggcaccaaga gtccactcct agaattctat aaagaaacct tcatccgcct 1620ggaatgcaag atatatccac tgtacagccg tgcctagcat tccgctgccc attcccaagg 1680cccacattgc tgctcgatta tttgtcactc cttgaaattg cttcataatt ctcctgttgt 1740tgagtctttt aaacggggcc tattagaagg gggttgcacg gctgaggatc acctacccag 1800atcaat atg cgt act ttt cta cta ggc atc ctg tgc gca ccc ctg gct 1848Met Arg Thr Phe Leu Leu Gly Ile Leu Cys Ala Pro Leu Ala-19 -15 -10atc ctt aca gga gcc gca tcg act ttt tct cca gca cgc cct ccg gct1896Ile Leu Thr Gly Ala Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala-5 1 5 10ctt cct cta gcg gtc aaa tct ccg tac ttg agt act tgg ctg ccg gcg1944Leu Pro Leu Ala Val Lys Ser Pro Tyr Leu Ser Thr Trp Leu Pro Ala15 20 25ggg aaa gac ggc ggc aat gga ggc tac ctt gca ggg gaa tgg cca gcg1992Gly Lys Asp Gly Gly Asn Gly Gly Tyr Leu Ala Gly Glu Trp Pro Ala30 35 40ttc tgg ga gtgagtgcta tgaacctggc ataacaatta cagagagctg2040Phe Trp Glu45aaaaagaatc attgttatag a ggc caa ata aca gga tgg gct ggc ctt att2091Gly Gln Ile Thr Gly Trp Ala Gly Leu Ile50 55cgt gtg gat ggc cag gtc tat aca tgg atg ggc ctt cca ggc tca gcc2139Arg Val Asp Gly Gln Val Tyr Thr Trp Met Gly Leu Pro Gly Ser Ala60 65 70act gtg aac cag act gcg tat gag tac act tca acg aag agc att ttc2187Thr Val Asn Gln Thr Ala Tyr Glu Tyr Thr Ser Thr Lys Ser Ile Phe75 80 85acc atg cat att ggt gat atg gta gag atg aag ata acc ttc ctt tca2235Thr Met His Ile Gly Asp Met Val Glu Met Lys Ile Thr Phe Leu Ser90 95 100cca att aca ccg aat gat ctt cga cgg cag tcc cta gtg ttt tcg tat2283Pro Ile Thr Pro Asn Asp Leu Arg Arg Gln Ser Leu Val phe Ser Tyr105 110 115 120ctt gac gtg agt gtc acc tca ctc gac ggc cag tcc cac agt gta cag 2331Leu Asp Val Ser Val Thr Ser Leu Asp Gly Gln Ser His Ser Val Gln125 130 135gtg tac gct gac ata tca gct g gtgagtttac ctggacatac ttcagccaag2383Val Tyr Ala Asp Ile Ser Ala140tgaaaaacca ttattgattg ttccctag aa ttt gcg tct ggc gac cgt tcc 2434Glu Phe Ala Ser Gly Asp Arg Ser145 150gcc ata gca caa tgg aac tat ggt gtt acc agt gac ggc gta gcc tat 2482Ala Ile Ala Gln Trp Asn Tyr Gly Val Thr Ser Asp Gly Val Ala Tyr155 160 165cat aag atc tat cgc cag acg ccg ctc cta ttc tct gag cat aga gac2530His Lys Ile Tyr Arg Gln Thr Pro Leu Leu Phe Ser Glu His Arg Asp170 175 180caa gct gaa tgg ggt gat tgg tac tgg gca act gac aat gta gca gga2578Gln Ala Glu Trp Gly Asp Trp Tyr Trp Ala Thr Asp Asn Val Ala Gly185 190 195ctc act tac cag gct ggt cca gat gtt gat gtc cgg gaa gct ttt gcg2626Leu Thr Tyr Gln Ala Gly Pro Asp Val Asp Val Arg Glu Ala Phe Ala200 205 210 215cgc aat gga aag cta acc aat aac aac gac gtc aac tac aga gct atc2674Arg Asn Gly Lys Leu Thr Asn Asn Asn Asp Val Asn Tyr Arg Ala Ile220 225 230tcc aac aac tgg ccg gtg ttt ggt ttt gcc cat gac ctt ggg tct atc2722Ser Asn Asn Trp Pro Val Phe Gly Phe Ala His Asp Leu Gly Ser Ile235 240 245agc tct tct act aag gtg ctt ttc tca ata ggg cta acc cag cga gag2770Ser Ser Ser Thr Lys Val Leu Phe Ser Ile Gly Leu Thr Gln Arg Glu250 255 260gca atc cag tat agc ggg aac tct tcc acc ctt tct cct ttg cct gct2818Ala Ile Gln Tyr Ser Gly Asn Ser Ser Thr Leu Ser Pro Leu Pro Ala265 270 275ctg tgg acg agc tat ttc agc act gcc ttg gat gcc gtgagtgctc 2864Leu Trp Thr Ser Tyr Phe Ser Thr Ala Leu Asp Ala280 285 290cccgtgtaga agctagacac cctgggactt actcaaaaac cctattttag ctt gac 2920Leu Aspttc ttc cac cat gat tat cag aag tca aac tct ctt tct tca gat ctt2968Phe Phe His His Asp Tyr Gln Lys Ser Asn Ser Leu Ser Ser Asp Leu295 300 305gat cgg cga att gca caa gat tcc gtt gcc gct gcc ggt cac gac tac3016Asp Arg Arg Ile Ala Gln Asp Ser Val Ala Ala Ala Gly His Asp Tyr310 315 320 325ctt acc att aca tcc ctc agc att cgt caa gct ttc gct gca acc cag 3064Leu Thr Ile Thr Ser Leu Ser Ile Arg Gln Ala Phe Ala Ala Thr Gln330 335 340ctg tgt ggg cca gca aat gat ccg tat ctc ttt atg aaa gaa atc tcc 3112Leu Cys Gly Pro Ala Asn Asp Pro Tyr Leu Phe Met Lys Glu Ile Ser345 350 355tcc aac ggc aac atg aac acg gta gat gtg atc ttc cct gct cat ccc 3160Ser Asn Gly Asn Met Asn Thr Val Asp Val Ile Phe Pro Ala His Pro360 365 370gtc ttc tta tac aca aac cca gca ctg ctt aaa tat ctc ctg cgc cca 3208Val Phe Leu Tyr Thr Asn Pro Ala Leu Leu Lys Tyr Leu Leu Arg Pro375 380 385cat ttg gag atc cag gag tct gga aat tac ccc aac tcc tat gct atg 3256His Leu Glu Ile Gln Glu Ser Gly Asn Tyr Pro Asn Ser Tyr Ala Met390 395 400 405cat gat atc ggt gct cat tac cct aac gct aca ggc cat ccg gat ggc 3304His Asp Ile Gly Ala His Tyr Pro Asn Ala Thr Gly His Pro Asp Gly410 415 420aat gac gag cca atg ccg ttg gag gag tgc ggt aat atg gtg atc atg 3352Asn Asp Glu Pro Met Pro Leu Glu Glu Cys Gly Asn Met Val Ile Met425 430 435gct cta gca tat gcg cag aag gcc ggg gac aca gcg tac ctg gaa agc 3400Ala Leu Ala Tyr Ala Gln Lys Ala Gly Asp Thr Ala Tyr Leu Glu Ser440 445 450cac tac aca ata ctg aga cgt tgg acg gac tac ttg atc gaa gat tct 3448His Tyr Thr Ile Leu Arg Arg Trp Thr Asp Tyr Leu Ile Glu Asp Ser455 460 465ctt tat ccg gcg aac caa ata tcg aca gat gat ttc gca ggt cca ttg gc 3498Leu Tyr Pro Ala Asn Gln Ile Ser Thr Asp Asp Phe Ala Gly Pro Leu Ala470 475 480 485gtacgtccct actggcgtat aggtgcttct caaaccaaac taatggcgtc tctag a 3554aat caa acc aac ctc gcc ctg aag gga atc atc ggt atc gag gcc atg3602Asn Gln Thr Asn Leu Ala Leu Lys Gly Ile Ile Gly Ile Glu Ala Met490 495 500tct gtc atc gct agc ctg aca gga gac tct gat gat aag atg aat ctc3650Ser Val Ile Ala Ser Leu Thr Gly Asp Ser Asp Asp Lys Met Asn Leu505 510 515acc aat tac gcc cac gat tac atc gaa aaa tgg ctg att ttg gga att3698Thr Asn Tyr Ala His Asp Tyr Ile Glu Lys Trp Leu Ile Leu Gly Ile520 525 530gca cgt aac aca acg tat ccg cat aca aca ttg tcg tac gga tca aac3746Ala Arg Asn Thr Thr Tyr Pro His Thr Thr Leu Ser Tyr Gly Ser Asn535 540 545 550gag tct cat g gtttgtgtac tcctcactgt gatgcttggc caatactgat 3796Glu Ser Histgttccaag ga ctc ctg tac aac ctt tac gca gat cgc gag cta ggc 3843Gly Leu Leu Tyr Asn Leu Tyr Ala Asp Arg Glu Leu Gly555 560 565ttg aac ctg gtc ccg caa tct gtg tat gac atg cag agc aac ttc tac 3891Leu Asn Leu Val Pro Gln Ser Val Tyr Asp Met Gln Ser Asn Phe Tyr570 575 580ccg aca atc aag ggt caa tac gga gtg cca ctg gat acc cgc cat caa 3939Pro Thr Ile Lys Gly Gln Tyr Gly Val Pro Leu Asp Thr Arg His Gln585 590 595tac acg aaa g gtatgtggcc atctactcgt cgcggctgta taattgacgg 3989Tyr Thr Lys600tctcag gt gat tgg gag ctc ttc acg gcg gca gtc gca tca gta agc 4036Gly Asp Trp Glu Leu Phe Thr Ala Ala Val Ala Ser Val Ser605 610 615aca cga gac atg ttc atc aaa cta ctt gcc cag tgg ata aac gag acg 4084Thr Arg Asp Met Phe Ile Lys Leu Leu Ala Gln Trp Ile Asn Glu Thr620 625 630cca acg aac cgt cca ctt acg gat ctc tat gac act gta acc gga ga4131Pro Thr Asn Arg Pro Leu Thr Asp Leu Tyr Asp Thr Val Thr Gly Asp635 640 645gtaagtgtac ctacctaaac ctaggagacg ctttgctgat tcactcag c tac cca4186Tyr Proccg gta gtt ttc atc gct cga cct gtc atg ggc gcg gca ttc act ttg 4234Pro Val Val Phe Ile Ala Arg Pro Val Met Gly Ala Ala Phe Thr Leu650 655 660 665ttg ctt ctc gac tgaaattctt tccaggtaca tacatgcttt atcaggacaa 4286Leu Leu Leu Aspaagagcggct aggcggtcca ttcccagtat ttgtgttaga tgtgatatat atggtcgtgt 4346ttaagttgtg taatattgtg tggtagtata tagcatcagt tatagccttt ttcaatccct 4406ctgggtagct gaaagtgatg tactatgaat gcagatctgt agagcttgca ttgatactag 4466tcaacatatt catagtgtta cataggcaag acgacgagaa ccaatgcagt cttttgcttc 4526tgcatttctt ccgttaaacc gaatttatac cgtcatcaga ttatcgcgtc agttgtctag 4586tactaacctt gtacctcaaa ggtctgaggt ttgttgttcc gcagcgtccc atgcatcaaa 4646ggcccggatc agatctgtga tacttagcta cccagctcgt gcaacgatga agaagaccta 4706ccataataca gcatcatcgc ctcgaggtga gcatcaatgc caactctttc atccacagtg 4766tggatattca acgcacggcc ctcgcgcgcg ggactccagc ggtaaatgtt tggcgatagg 4826ttccagtaaa gcctggtatc cgtgttgccg gtggtgatgt ccccaccaac aacgacagtt 4886ttgcctttca gacttggaac agactcgaag accgagcggg cgacaccggc aaaccgtgcc 4946caaacgggac ttgtatcgat atcagtaggg ctaacggggg ctggctcgag aggagaattt 5006agggtcgaga gcgtgagatg accactgctt gccacttcac tgctgatctc gtccttgttg 5066gtatccaaga atctggacca ggtcaaattg aacttctcta caatgggctc tatgatcttc 5126tccgctcggt cttggagcat cttcggggtt tggtgcaatg cgatgcgata attcacgaca 5186gcggtgatct tttccggaag cgcgttgctc tttatgcctc cattgaatat atccgctgcc 5246tgggacgact ggagagtgaa tcgaacgctt tctccacgag acctagcaat tgcttcggcc 5306gttgctgcct gatcatccga gtcaagcgca gaagcaagcc agtcctccac atattcagga 5366gaatggcgga cctggcactc aaacactcgg cgagaagggt gattagaccc taaaatgggc 5426gtgaaaatgt caagctcagt attctctagc ttgtaaataa tttccgacat tatgccgacc 5486ccggtatgtc tgggcggaac ggaactatgg ccaccaggga cagcgagggt aaggacgatc 5546gtgacggcgc ctttctcgcc aacatccggg agcgcgtaaa tcacactctc gtcctcaaat 5606tcctctccag cggaagataa cgatgagcga agggtggtga taccgccacc tccttcgtca 5666aggatgaatt ctactccatc tttcccatat ctttcctcca gaaccggagc gattcgcgca 5726gcaccaatat acccttgtgc ctcctcgtcg aatccaaacg ccaggacaat cggtcgagat 5786ggcgtccagt tctgagatag gagatcctcg gctacagaga gaagaccgat aaggccgttt 5846ttgcagtcgc tgcttcctcg tccccagaga aactcgccat caaaataccc tgagaaggga 5906ggatgcgtcc agtctgaggc atcgttaata gggaccacat cttgatgagc cgtaaagaga 5966aggggctttc tcttttctac agtttccgag ggaggttcaa gtgttattat aagattgaag 6026cggttgacgt gctcgatctt ggctttggag tagctgtctc aggttagttt tgggaagaga 6086gatcctgagc tgggaaggat acgcgggtga cgcgagggtc attgaagtaa ggaggaaaag 6146ggtaggtgag ctcacacaag aggaaagagc ccagcaagaa gctta 6191<210>22<211>688<212>蛋白质<213>构巢曲霉<400>22Met Arg Thr Phe Leu Leu Gly Ile Leu Cys Ala Pro Leu Ala Ile Leu-19 -15 -10 -5Thr Gly Ala Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala Leu Pro1 5 10Leu Ala Val Lys Ser Pro Tyr Leu Ser Thr Trp Leu Pro Ala Gly Lys15 20 25Asp Gly Gly Asn Gly Gly Tyr Leu Ala Gly Glu Trp Pro Ala Phe Trp30 35 40 45Glu Gly Gln Ile Thr Gly Trp Ala Gly Leu Ile Arg Val Asp Gly Gln50 55 60Val Tyr Thr Trp Met Gly Leu Pro Gly Ser Ala Thr Val Asn Gln Thr65 70 75Ala Tyr Glu Tyr Thr Ser Thr Lys Ser Ile Phe Thr Met His Ile Gly80 85 90Asp Met Val Glu Met Lys Ile Thr Phe Leu Ser Pro Ile Thr Pro Asn95 100 105Asp Leu Arg Arg Gln Ser Leu Val Phe Ser Tyr Leu Asp Val Ser Val110 115 120 125Thr Ser Leu Asp Gly Gln Ser His Ser Val Gln Val Tyr Ala Asp Ile130 135 140Ser Ala Glu Phe Ala Ser Gly Asp Arg Ser Ala Ile Ala Gln Trp Asn145 150 155Tyr Gly Val Thr Ser Asp Gly Val Ala Tyr His Lys Ile Tyr Arg Gln160 165 170Thr Pro Leu Leu Phe Ser Glu His Arg Asp Gln Ala Glu Trp Gly Asp175 180 185Trp Tyr Trp Ala Thr Asp Asn Val Ala Gly Leu Thr Tyr Gln Ala Gly190 195 200 205Pro Asp Val Asp Val Arg Glu Ala Phe Ala Arg Asn Gly Lys Leu Thr210 215 220Asn Asn Asn Asp Val Asn Tyr Arg Ala Ile Ser Asn Asn Trp Pro Val225 230 235Phe Gly Phe Ala His Asp Leu Gly Ser Ile Ser Ser Ser Thr Lys Val240 245 250Leu Phe Ser Ile Gly Leu Thr Gln Arg Glu Ala Ile Gln Tyr Ser Gly255 260 265Asn Ser Ser Thr Leu Ser Pro Leu Pro Ala Leu Trp Thr Ser Tyr Phe270 275 280 285Ser Thr Ala Leu Asp Ala Leu Asp Phe Phe His His Asp Tyr Gln Lys290 295 300Ser Asn Ser Leu Ser Ser Asp Leu Asp Arg Arg Ile Ala Gln Asp Ser305 310 315Val Ala Ala Ala Gly His Asp Tyr Leu Thr Ile Thr Ser Leu Ser Ile320 325 330Arg Gln Ala Phe Ala Ala Thr Gln Leu Cys Gly Pro Ala Asn Asp Pro335 340 345Tyr Leu Phe Met Lys Glu Ile Ser Ser Asn Gly Asn Met Asn Thr Val350 355 360 365Asp Val Ile Phe Pro Ala His Pro Val Phe Leu Tyr Thr Asn Pro Ala370 375 380Leu Leu Lys Tyr Leu Leu Arg Pro His Leu Glu Ile Gln Glu Ser Gly385 390 395Asn Tyr Pro Asn Ser Tyr Ala Met His Asp Ile Gly Ala His Tyr Pro400 405 410Asn Ala Thr Gly His Pro Asp Gly Asn Asp Glu Pro Met Pro Leu Glu415 420 425Glu Cys Gly Asn Met Val Ile Met Ala Leu Ala Tyr Ala Gln Lys Ala430 435 440 445Gly Asp Thr Ala Tyr Leu Glu Ser His Tyr Thr Ile Leu Arg Arg Trp450 455 460Thr Asp Tyr Leu Ile Glu Asp Ser Leu Tyr Pro Ala Asn Gln Ile Ser465 470 475Thr Asp Asp Phe Ala Gly Pro Leu Ala Asn Gln Thr Asn Leu Ala Leu480 485 490Lys Gly Ile Ile Gly Ile Glu Ala Met Ser Val Ile Ala Ser Leu Thr495 500 505Gly Asp Ser Asp Asp Lys Met Asn Leu Thr Asn Tyr Ala His Asp Tyr510 515 520 525Ile Glu Lys Trp Leu Ile Leu Gly Ile Ala Arg Asn Thr Thr Tyr Pro530 535 540His Thr Thr Leu Ser Tyr Gly Ser Asn Glu Ser His Gly Leu Leu Tyr545 550 555Asn Leu Tyr Ala Asp Arg Glu Leu Gly Leu Asn Leu Val Pro Gln Ser560 565 570Val Tyr Asp Met Gln Ser Asn Phe Tyr Pro Thr Ile Lys Gly Gln Tyr575 580 585Gly Val Pro Leu Asp Thr Arg His Gln Tyr Thr Lys Gly Asp Trp Glu590 595 600 605Leu Phe Thr Ala Ala Val Ala Ser Val Ser Thr Arg Asp Met Phe Ile610 615 620Lys Leu Leu Ala Gln Trp Ile Asn Glu Thr Pro Thr Asn Arg Pro Leu625 630 635Thr Asp Leu Tyr Asp Thr Val Thr Gly Asp Tyr Pro Pro Val Val Phe640 645 650Ile Ala Arg Pro Val Met Gly Ala Ala Phe Thr Leu Leu Leu Leu Asp655 660 665<210>23<211>27<212>DNA<213>人工序列<220><223>人工序列描述引物<400>23gcttcataat tctcctgttg ttgagtc 27<210>24<211>30<212>DNA<213>人工序列<220><223>人工序列描述引物<400>24ggctataact gatgctatat actaccacac 30<210>25<211>2298<212>DNA<213>构巢曲霉<220><221>CDS<222>(88)..(2151)<220><221>成熟肽<222>(145)..(2151)<400>25gcttcataat tctcctgttg ttgagtcttt taaacggggc ctattagaag ggggttgcac 60ggctgaggat cacctaccca gatcaat atg cgt act ttt cta cta ggc atc ctg 114Met Arg Thr Phe Leu Leu Gly Ile Leu-15tgc gca ccc ctg gct atc ctt aca gga gcc gca tcg act ttt tct cca 162Cys Ala Pro Leu Ala Ile Leu Thr Gly Ala Ala Ser Thr Phe Ser Pro-10 -5 -1 1 5gca cgc cct ccg gct ctt cct cta gcg gtc aaa tct ccg tac ttg agt 210Ala Arg Pro Pro Ala Leu Pro Leu Ala Val Lys Ser Pro Tyr Leu Ser10 15 20act tgg ctg ccg gcg ggg aaa gac ggc ggc aat gga ggc tac ctt gca 258Thr Trp Leu Pro Ala Gly Lys Asp Gly Gly Asn Gly Gly Tyr Leu Ala25 30 35ggg gaa tgg cca gcg ttc tgg gaa ggc caa ata aca gga tgg gct ggc 306Gly Glu Trp Pro Ala Phe Trp Glu Gly Gln Ile Thr Gly Trp Ala Gly40 45 50ctt att cgt gtg gat ggc cag gtc tat aca tgg atg ggc ctt cca ggc 354Leu Ile Arg Val Asp Gly Gln Val Tyr Thr Trp Met Gly Leu Pro Gly55 60 65 70tca gcc act gtg aac cag act gcg tat gag tac act tca acg aag agc 402Ser Ala Thr Val Asn Gln Thr Ala Tyr Glu Tyr Thc Ser Thr Lys Ser75 80 85att ttc acc atg cat att ggt gat atg gta gag atg aag ata acc ttc 450Ile Phe Thr Met His Ile Gly Asp Met Val Glu Met Lys Ile Thr Phe90 95 100ctt tca cca att aca ccg aat gat ctt cga cgg cag tcc cta gtg ttt 498Leu Ser Pro Ile Thr Pro Asn Asp Leu Arg Arg Gln Ser Leu Val Phe105 110 115tcg tat ctt gac gtg agt gtc acc tca ctc gac ggc cag tcc cac agt 546Ser Tyr Leu Asp Val Ser Val Thr Ser Leu Asp Gly Gln Ser His Ser120 125 130gta cag gtg tac gct gac ata tca gct gaa ttt gcg tct ggc gac cgt 594Val Gln Val Tyr Ala Asp Ile Ser Ala Glu Phe Ala Ser Gly Asp Arg135 140 145 150tcc gcc ata gca caa tgg aac tat ggt gtt acc agt gac ggc gta gcc 642Ser Ala Ile Ala Gln Trp Asn Tyr Gly Val Thr Ser Asp Gly Val Ala155 160 165tat cat aag atc tat cgc cag acg ccg ctc cta ttc tct gag cat aga 690Tyr His Lys Ile Tyr Arg Gln Thr Pro Leu Leu Phe Ser Glu His Arg170 175 180gac caa gct gaa tgg ggt gat tgg tac tgg gca act gac aat gta gca 738Asp G1n Ala Glu Trp Gly Asp Trp Tyr Trp Ala Thr Asp Asn Val Ala185 190 195gga ctc act tac cag gct ggt cca gat gtt gat gtc cgg gaa gct ttt 786Gly Leu Thr Tyr Gln Ala Gly Pro Asp Val Asp Val Arg Glu Ala Phe200 205 210gcg cgc aat gga aag cta acc aat aac aac gac gtc aac tac aga gct 834Ala Arg Asn Gly Lys Leu Thr Asn Asn Asn Asp Val Asn Tyr Arg Ala215 220 225 230atc tcc aac aac tgg ccg gtg ttt ggt ttt gcc cat gac ctt ggg tct 882Ile Ser Asn Asn Trp Pro Val Phe Gly Phe Ala His Asp Leu Gly Ser235 240 245atc agc tct tct act aag gtg ctt ttc tca ata ggg cta acc cag cga 930Ile Ser Ser Ser Thr Lys Val Leu Phe Ser Ile Gly Leu Thr Gln Arg250 255 260gag gca atc cag tat agc ggg aac tct tcc acc ctt tct cct ttg cct 978Glu Ala Ile Gln Tyr Ser Gly Asn Ser Ser Thr Leu Ser Pro Leu Pro265 270 275gct ctg tgg acg agc tat ttc agc act gcc ttg gat gcc ctt gac ttc 1026Ala Leu Trp Thr Ser Tyr Phe Ser Thr Ala Leu Asp Ala Leu Asp Phe280 285 290ttc cac cat gat tat cag aag tca aac tct ctt tct tca gat ctt gat 1074Phe His His Asp Tyr Gln Lys Ser Asn Ser Leu Ser Ser Asp Leu Asp295 300 305 310cgg cga att gca caa gat tcc gtt gcc gct gcc ggt cac gac tac ctt 1122Arg Arg Ile Ala Gln Asp Ser Val Ala Ala Ala Gly His Asp Tyr Leu315 320 325acc att aca tcc ctc agc att cgt caa gct ttc gct gca acc cag ctg 1170Thr Ile Thr Ser Leu Ser Ile Arg Gln Ala Phe Ala Ala Thr Gln Leu330 335 340tgt ggg cca gca aat gat ccg tat ctc ttt atg aaa gaa atc tcc tcc 1218Cys Gly Pro Ala Asn Asp Pro Tyr Leu Phe Met Lys Glu Ile Ser Ser345 350 355aac ggc aac atg aac acg gta gat gtg atc ttc cct gct cat ccc gtc 1266Asn Gly Asn Met Asn Thr Val Asp Val Ile Phe Pro Ala His Pro Val360 365 370ttc tta tac aca aac cca gca ctg ctt aaa tat ctc ctg cgc cca cat 1314Phe Leu Tyr Thr Asn Pro Ala Leu Leu Lys Tyr Leu Leu Arg Pro His375 380 385 390ttg gag atc cag gag tct gga aat tac ccc aac tcc tat gct atg cat 1362Leu Glu Ile Gln Glu Ser Gly Asn Tyr Pro Asn Ser Tyr Ala Met His395 400 405gat atc ggt gct cat tac cct aac gct aca ggc cat ccg gat ggc aat 1410Asp Ile Gly Ala His Tyr Pro Asn Ala Thr Gly His Pro Asp Gly Asn410 415 420gac gag cca atg ccg ttg gag gag tgc ggt aat atg gtg atc atg gct 1458Asp Glu Pro Met Pro Leu Glu Glu Cys Gly Asn Met Val Ile Met Ala425 430 435cta gca tat gcg cag aag gcc ggg gac aca gcg tac ctg gaa agc cac 1506Leu Ala Tyr Ala Gln Lys Ala Gly Asp Thr Ala Tyr Leu Glu Ser His440 445 450tac aca ata ctg aga cgt tgg acg gac tac ttg atc gaa gat tct ctt 1554Tyr Thr Ile Leu Arg Arg Trp Thr Asp Tyr Leu Ile Glu Asp Ser Leu455 460 465 470tat ccg gcg aac caa ata tcg aca gat gat ttc gca ggt cca ttg gca 1602Tyr Pro Ala Asn Gln Ile Ser Thr Asp Asp Phe Ala Gly Pro Leu Ala475 480 485aat caa acc aac ctc gcc ctg aag gga atc atc ggt atc gag gcc atg 1650Asn Gln Thr Asn Leu Ala Leu Lys Gly Ile Ile Gly Ile Glu Ala Met490 495 500tct gtc atc gct agc ctg aca gga gac tct gat gat aag atg aat ctc 1698Ser Val Ile Ala Ser Leu Thr Gly Asp Ser Asp Asp Lys Met Asn Leu505 510 515acc aat tac gcc cac gat tac atc gaa aaa tgg ctg att ttg gga att 1746Thr Asn Tyr Ala His Asp Tyr Ile Glu Lys Trp Leu Ile Leu Gly Ile520 525 530gca cgt aac aca acg tat ccg cat aca aca ttg tcg tac gga tca aac 1794Ala Arg Asn Thr Thr Tyr Pro His Thr Thr Leu Ser Tyr Gly Ser Asn535 540 545 550gag tct cat gga ctc ctg tac aac ctt tac gca gat cgc gag cta ggc 1842Glu Ser His Gly Leu Leu Tyr Asn Leu Tyr Ala Asp Arg Glu Leu Gly555 560 565ttg aac ctg gtc ccg caa tct gtg tat gac atg cag agc aac ttc tac 1890Leu Asn Leu Val Pro Gln Ser Val Tyr Asp Met Gln Ser Asn Phe Tyr570 575 580ccg aca atc aag ggt caa tac gga gtg cca ctg gat acc cgc cat caa 1938Pro Thr Ile Lys Gly Gln Tyr Gly Val Pro Leu Asp Thr Arg His Gln585 590 595tac acg aaa ggt gat tgg gag ctc ttc acg gcg gca gtc gca tca gta 1986Tyr Thr Lys Gly Asp Trp Glu Leu Phe Thr Ala Ala Val Ala Ser Val600 605 610agc aca cga gac atg ttc atc aaa cta ctt gcc cag tgg ata aac gag 2034Ser Thr Arg Asp Met Phe Ile Lys Leu Leu Ala Gln Trp Ile Asn Glu615 620 625 630acg cca acg aac cgt cca ctt acg gat ctc tat gac act gta acc gga 2082Thr Pro Thr Asn Arg Pro Leu Thr Asp Leu Tyr Asp Thr Val Thr Gly635 640 645gac tac cca ccg gta gtt ttc atc gct cga cct gtc atg ggc gcg gca 2130Asp Tyr Pro Pro Val Val Phe Ile Ala Arg Pro Val Met Gly Ala Ala650 655 660ttc act ttg ttg ctt ctc gac tgaaattctt tccaggtaca tacatgcttt 2181Phe Thr Leu Leu Leu Leu Asp665atcaggacaa aagagcggct aggcggtcca ttcccagtat ttgtgttaga tgtgatatat 2241atggtcgtgt ttaagttgtg taatattgtg tggtagtata tagcatcagt tatagcc2298<210>26<211>688<212>蛋白质<213>构巢曲霉<400>26Met Arg Thr Phe Leu Leu Gly Ile Leu Cys Ala Pro Leu Ala Ile Leu-15 -10 -5Thr Gly Ala Ala Ser Thr Phe Ser Pro Ala Arg Pro Pro Ala Leu Pro-1 1 5 10Leu Ala Val Lys Ser Pro Tyr Leu Set Thr Trp Leu Pro Ala Gly Lys15 20 25Asp Gly Gly Asn Gly Gly Tyr Leu Ala Gly Glu Trp Pro Ala Phe Trp30 35 40 45Glu Gly Gln Ile Thr Gly Trp Ala Gly Leu Ile Arg Val Asp Gly Gln50 55 60Val Tyr Thr Trp Met Gly Leu Pro Gly Ser Ala Thr Val Asn Gln Thr65 70 75Ala Tyr Glu Tyr Thr Ser Thr Lys Ser Ile Phe Thr Met His Ile Gly80 85 90Asp Met Val Glu Met Lys Ile Thr Phe Leu Ser Pro Ile Thr Pro Asn95 100 105Asp Leu Arg Arg Gln Ser Leu Val Phe Ser Tyr Leu Asp Val Ser Val110115 120 125Thr Ser Leu Asp Gly Gln Ser His Ser Val Gln Val Tyr Ala Asp Ile130 135 140Ser Ala Glu Phe Ala Ser Gly Asp Arg Ser Ala Ile Ala Gln Trp Asn145 150 155Tyr Gly Val Thr Ser Asp Gly Val Ala Tyr His Lys Ile Tyr Arg Gln160 165 170Thr Pro Leu Leu Phe Ser Glu His Arg Asp Gln Ala Glu Trp Gly Asp175 180 185Trp Tyr Trp Ala Thr Asp Asn Val Ala Gly Leu Thr Tyr Gln Ala Gly190 195 200 205Pro Asp Val Asp Val Arg Glu Ala Phe Ala Arg Asn Gly Lys Leu Thr210 215 220Asn Asn Asn Asp Val Asn Tyr Arg Ala Ile Ser Asn Asn Trp Pro Val225 230 235Phe Gly Phe Ala His Asp Leu Gly Ser Ile Ser Ser Ser Thr Lys Val240 245 250Leu Phe Ser Ile Gly Leu Thr Gln Arg Glu Ala Ile Gln Tyr Ser Gly255 260 265Asn Ser Ser Thr Leu Ser Pro Leu Pro Ala Leu Trp Thr Ser Tyr Phe270 275 280 285Ser Thr Ala Leu Asp Ala Leu Asp Phe Phe His His Asp Tyr Gln Lys290 295 300Ser Asn Ser Leu Ser Ser Asp Leu Asp Arg Arg Ile Ala Gln Asp Ser305 310 315Val Ala Ala Ala Gly His Asp Tyr Leu Thr Ile Thr Ser Leu Ser Ile320 325 330Arg Gln Ala Phe Ala Ala Thr Gln Leu Cys Gly Pro Ala Asn Asp Pro335 340 345Tyr Leu Phe Met Lys Glu Ile Ser Ser Asn Gly Asn Met Asn Thr Val350 355 360 365Asp Val Ile Phe Pro Ala His Pro Val Phe Leu Tyr Thr Asn Pro Ala370 375 380Leu Leu Lys Tyr Leu Leu Arg Pro His Leu Glu Ile Gln Glu Ser Gly385 390 395Asn Tyr Pro Asn Ser Tyr Ala Met His Asp Ile Gly Ala His Tyr Pro400 405 410Asn Ala Thr Gly His Pro Asp Gly Asn Asp Glu Pro Met Pro Leu Glu415 420 425Glu Cys Gly Asn Met Val Ile Met Ala Leu Ala Tyr Ala Gln Lys Ala430 435 440 445Gly Asp Thr Ala Tyr Leu Glu Ser His Tyr Thr Ile Leu Arg Arg Trp450 455 460Thr Asp Tyr Leu Ile Glu Asp Ser Leu Tyr Pro Ala Asn Gln Ile Ser465 470 475Thr Asp Asp Phe Ala Gly Pro Leu Ala Asn Gln Thr Asn Leu Ala Leu480 485 490Lys Gly Ile Ile Gly Ile Glu Ala Met Ser Val Ile Ala Ser Leu Thr495 500 505Gly Asp Ser Asp Asp Lys Met Asn Leu Thr Asn Tyr Ala His Asp Tyr510 515 520 525Ile Glu Lys Trp Leu Ile Leu Gly Ile Ala Arg Asn Thr Thr Tyr Pro530 535 540His Thr Thr Leu Ser Tyr Gly Ser Asn Glu Ser His Gly Leu Leu Tyr545 550 555Asn Leu Tyr Ala Asp Arg Glu Leu Gly Leu Asn Leu Val Pro Gln Ser560 565 570Val Tyr Asp Met Gln Ser Asn Phe Tyr Pro Thr Ile Lys Gly Gln Tyr575 580 585Gly Val Pro Leu Asp Thr Arg His Gln Tyr Thr Lys Gly Asp Trp Glu590 595 600 605Leu Phe Thr Ala Ala Val Ala Ser Val Ser Thr Arg Asp Met Phe Ile610 615 620Lys Leu Leu Ala Gln Trp Ile Asn Glu Thr Pro Thr Asn Arg Pro Leu625 630 635Thr Asp Leu Tyr Asp Thr Val Thr Gly Asp Tyr Pro Pro Val Val Phe640 645 650Ile Ala Arg Pro Val Met Gly Ala Ala Phe Thr Leu Leu Leu Leu Asp655 660 66权利要求
1.一种下述(A)到(D)中任意一项所定义的蛋白质(A)一种具有序列表中SEQ ID NO:2的1-670位的氨基酸序列的蛋白质;(B)一种具有序列表中SEQ ID NO:22的1-669位的氨基酸序列的蛋白质;(C)一种蛋白质,该蛋白具有序列表中SEQ ID NO:2的1-670位的氨基酸所组成的序列,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;(D)一种蛋白质,该蛋白具有序列表中SEQ ID NO:22的1-669位的氨基酸所组成的序列,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;
2.编码如下(A)到(D)中任意一项所定义蛋白质的DNA(A)一种具有序列表中SEQ ID NO:2的1-670位的氨基酸序列的蛋白质;(B)一种具有序列表中SEQ ID NO:22的1-669位的氨基酸序列的蛋白质;(C)一种蛋白质,该蛋白具有序列表中SEQ ID NO:2的1-670位的氨基酸所组成的序列,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;(D)一种蛋白质,该蛋白具有序列表中SEQ ID NO:22的1-669位的氨基酸所组成的序列,其中的一个或多数氨基酸经过替代、缺失、插入、添加或倒位,并具有催化谷氨酰胺水解成谷氨酸和氨的活性;
3.权利要求2的DNA,其中DNA如下述(a)到(d)中任意一项所定义(a)一种DNA,该DNA包含序列表中SEQ ID NO:1的1174-1370、1446-1741、1800-2242、2297-2880、2932-3134、3181-3324、3380-3515、3562-3628位的核苷酸按上述顺序所组成的序列;(b)一种DNA,该DNA包含序列表中SEQ ID NO:21的1807-2000、2061-2353、2412-2854、2915-3498、3554-3756、3806-3949、3996-4131、4180-4246位的核苷酸按上述顺序所组成的序列;(c)一种在严格条件下能与(a)中DNA杂交的DNA,该DNA编码一种催化谷氨酰胺水解成谷氨酸和氨的蛋白质;(d)一种在严格条件下能与(b)中DNA杂交的DNA,该DNA编码一种催化谷氨酰胺水解成谷氨酸和氨的蛋白质;
4.权利要求2的DNA,该DNA具有SEQ ID NO:1或SEQ ID NO:17中的核苷酸序列。
5.权利要求3的DNA,该DNA具有SEQ ID NO:21或SEQ ID NO:25中的核苷酸序列。
6.一种重组载体,该载体包括插入到该载体内的权利要求2的DNA。
7.一种微生物转化体,该转化体导入权利要求2的DNA且该DNA可被表达并产生谷氨酰胺酶。
8.权利要求7的转化体,该转化体来源于丝状真菌或大肠杆菌属的细菌。
9.一种生产谷氨酰胺酶的方法,该方法包括在培养基中培养权利要求7的转化体从而在该培养物中生产谷氨酰胺酶。
全文摘要
从米曲霉中纯化谷氨酰胺酶,测定其部分氨基酸序列。再通过PCR获得谷氨酰胺酶基因的部分序列。该PCR是基于已获得的信息与包含谷氨酰胺酶基因的DNA片段,再利用该部分序列作为探针杂交而成,上述谷氨酰胺酶基因来源于米曲霉基因组文库与cDNA文库和构巢曲霉基因组文库和cDNA文库。
文档编号C12N15/55GK1309702SQ99808661
公开日2001年8月22日 申请日期1999年5月12日 优先权日1998年5月15日
发明者鲤渕恭子, 长崎浩明, 汤浅安理, 片冈二郎, 北本胜彦 申请人:味之素株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1