用于产生l-赖氨酸的方法

文档序号:419456阅读:499来源:国知局
专利名称:用于产生l-赖氨酸的方法
技术领域
本发明涉及通过培养微生物产生L-赖氨酸的方法,所述的微生物是通过借助基于基因工程的技术修饰用于发酵生产氨基酸的棒状杆菌等获得的。
背景技术
作为饲料添加剂的赖氨酸通常通过利用属于棒状杆菌的L-赖氨酸-产生突变菌株用发酵法产生。现在已知各种L-赖氨酸-产生菌是从属于棒状杆菌的野生型菌株开始经人工突变产生的那些。
就棒状杆菌而言,公开了载体质粒,这种质粒是在细菌细胞中可自主复制的,并具有药物抗性标记基因(参见美国专利4,514,502),并公开了用于把基因引入细菌细胞的方法(例如日本专利申请公开2207791)。也公开了通过利用以上所述的技术培养L-苏氨酸-或L-异亮氨酸-产生菌的可能性(参见美国专利4,452,890和4,442,208)。培养L-赖氨酸-产生菌的技术是已知的,在其中参与L-赖氨酸生物合成的基因掺入到载体质粒中,以便在细菌细胞中扩增该基因(例如,日本专利申请公开56-160997)。
L-赖氨酸生物合成的已知基因包括,例如,二氢吡啶二甲酸还原酶基因(日本专利申请公开7-75578)和天冬氨酸转氨酶基因(日本专利申请公开6-102028)(其中参与L-赖氨酸生物合成的基因被克隆),以及磷酸烯醇丙酮酸羧酶基因(日本专利申请公开60-87788),二氢吡啶二甲酸合酶基因(日本专利出版物6-55149)和二氨基庚二酸脱羧酶基因(日本专利申请公开60-62994)(其中扩增基因影响L-赖氨酸产量)。
就参与L-赖氨酸生物合成的酶而言,在以野生型使用时,经历反馈抑制的酶的情况是已知的。在这种情况下,L-赖氨酸产量通过这样一种方法得到提高,即引入具有脱敏反馈抑制之突变的基因。具体地说,已知这样的基因包括天冬氨酸激酶基因(国际出版物WO 94/25605)。
如上所述,借助L-赖氨酸生物合成系统的基因扩增或突变基因的引入获得了成功的结果。例如,具有突变天冬氨酸激酶基因(脱敏了由赖氨酸和苏氨酸引起的固有抑制)的棒状杆菌产生大量的L-赖氨酸(大约25g/L)。然而,这种细菌与不具有突变天冬氨酸激酶基因的细菌比较生长速度降低。也报道了通过除了引入突变天冬氨酸激酶基因之外进一步引入二氢吡啶二甲酸合酶基因可提高L-赖氨酸产量(应用的和环境的微生物学,57(6),1746-1752(1991))。然而,这种细菌生长速度进一步降低。
就二氢吡啶二甲酸还原酶基因而言,已有人指出,二氢吡啶二甲酸还原酶的活性在引入了该基因的棒状杆菌中增加,然而,没有报道对L-赖氨酸产量的影响(日本专利申请公开775578)。
目前,对棒状杆菌,没有出现任何人已成功地通过组合L-赖氨酸生物合成的多种基因明显改善L-赖氨酸产量而不抑制生长的情况。也没有报道通过增强L-赖氨酸生物合成基因改善生长的情况。

发明内容
本发明的目的是通过使用编码以下酶的各种遗传物质DNA序列改善棒状杆菌L-赖氨酸产量天冬氨酸激酶(如果必要,在下文中称为″AK″,前提是编码AK蛋白质的基因在下文中称为″lysC″),二氢吡啶二甲酸还原酶(如果必要,在下文中称为″DDPR″,前提是编码DDPR蛋白质的基因在下文中称为为″dapB″),二氢吡啶二甲酸合酶(如果必要,在下文中简化为″DDPS″,前提是编码DDPS蛋白质的基因在下文中称为″dapA″),二氨基庚二酸脱羧酶(如果必要,在下文中称为″DDC″,前提是编码DDC蛋白质的基因在下文中称为″lysA″),和天冬氨酸转氨酶(如果必要,在下文中称为″AAT″,前提是编码AAT蛋白质的基因在下文中称为″aspC″),这些酶在棒状杆菌细胞中是L-赖氨酸生物合成的重要酶。
本发明的原理基于这样一种事实L-赖氨酸产量可以通过增强突变lysC(如果必要,在下文中简称为″突变lysC″)、dapA、dapB、lysA和aspC组合得到提高,所述lysC编码突变AK(如果必要,在下文中简称为″突变AK″),其中由赖氨酸和苏氨酸产生的固有抑制被脱敏。
即,本发明提供了在棒状杆菌细胞中可自主复制的重组DNA,该DNA包含编码天冬氨酸激酶(其中实质上脱敏了L-苏氨酸L-赖氨酸的反馈抑制)的DNA序列,编码二氢吡啶二甲酸还原酶的DNA序列,编码二氢吡啶二甲酸合酶的DNA序列,编码二氨基庚二酸脱羧酶的DNA序列和编码天冬氨酸转氨酶的DNA序列。
在另一方面,本发明提供了一种具有天冬氨酸激酶的棒状杆菌(其中L-苏氨酸和L-赖氨酸的反馈抑制实质上被脱敏),该棒状杆菌包含编码二氢吡啶二甲酸还原酶的增强DNA序列、编码二氢吡啶甲酸还原酶的增强DNA序列、编码二氢吡啶甲酸合酶的增强DNA序列、编码二氨基庚二酸脱羧酶的增强DNA序列、编码天冬氨酸转氨酶的增强DNA序列。
在另一方面,本发明提供了一种用于产生L-赖氨酸的方法,该方法包括以下步骤在适当的培养基中培养以上所述的任一棒状杆菌使得在所说的细菌的培养物中产生并积累L-赖氨酸,并从培养物收集L-赖氨酸。
本发明也提供了编码包含SEQ ID NO3l所示氨基酸序列之蛋白质的DNA序列。所述DNA的实例是包含SEQ ID NO30所示的879-2178位核苷酸的核苷酸序列的DNA。
本发明还提供了载体pVK7,其是在大肠杆菌和乳发酵短杆菌细胞中可自主复制的,包含一个多克隆位点和lacZ’。
在本发明中所称的棒状杆菌是在Bergey’s细菌学手册(第8版p.599(1974))中限定的一组微生物,其是无孢子-形成能力的需氧革兰氏-阳性-非抗酸棒杆状菌。棒状杆菌包括属于棒杆菌属的细菌,属于短杆菌短的细菌(迄今为止分类为短杆菌属但现在与棒杆菌属细菌合并在一起)和与属于棒杆菌的细菌密切相关的短杆菌属的细菌。
按照本发明,棒状杆菌的L-赖氨酸产量可以得到提高。


图1说明包含突变lysC的质粒p399AK9B和p399AKYB的构建方法。
图2说明包含dapB和Brevi.-ori质粒pDPRB的构建方法。
图3说明包含dapA和Brevi.-ori质粒pDPSB的构建方法。
图4说明的包含lysA的质粒p299LYSA的构建方法。
图5说明包含lysA和Brevi.-ori的质粒pLYSAB的构建方法。
图6说明包含lysC,dapB和Brevi.-ori的质粒pCRCAB的构建方法。
图7说明包含突变lysC和dapB的质粒pCB的构建方法。
图8说明包含dapAl dapB和Brevi.-or的质粒pAB的构建方法。
图9说明包含突变lysC,dapA,dapB和Brevi.-ori的质粒pCAB的构建方法。
图10说明包含突变lysC,dapA,dapB,lysA和Brevi.-ori的质粒PCABL的构建方法。
图11说明棒状杆菌新克隆载体pVKG和pVK7的构建方法。
图12说明包含aspC的质粒pOm的构建方法。
图13说明ATCC 13869染色体DNA片段上的两个ORF。
图14说明pORF1的构建方法。
1 制备用于本发明的L-赖氨酸生物合成的基因用于本发明的L-赖氨酸生物合成的基因分别通过以下方法获得从DNA供体细菌染色体DNA用质粒载体或类似物构建染色体DNA文库,选择具有所需基因的菌株,和从所选择的菌株回收已插入了所述基因的重组DNA。对用于本发明的L-赖氨酸生物合成的基因的DNA供体没有特别的限制,只要L-赖氨酸生物合成的所需基因表达酶蛋白质(其在棒状杆菌细胞中起作用)。然而,DNA供体优选地是棒状杆菌。
来源于棒状杆菌的lysC,dapA,dapB和lysA的所有基因具有已知的序列。因此,可以通过按照聚合酶链反应方法(PCR;see White,T.J.等,TrendsGenet.,5,185(1989))进行扩增来获得它们。
用于本发明的L-赖氨酸生物合成的各种基因可以按照以下例举的方法获得(1)突变lysC的制备包含突变lysC的DNA片段可以从突变菌株制备,在所述菌株中由L-苏氨酸和L-赖氨酸产生的AK活性的协同反馈抑制实质上被脱敏(国际出版物WO 94/25605)。这样一种突变菌株可以通过例如用诱变剂如紫外光和N-甲基-N-硝基-N-亚硝基胍(NTG)对来源于棒状杆菌野生型菌株的一组细胞进行常规突变处理获得。AK活性可以通过用由Miyajima,R.等在生物化学杂志(1968),63(2),139-148中描述的方法测量。最优选的这样的突变菌株由L-赖氨酸-产生菌AJ 3445(FERM 1944)代表,其来源于突变处理乳发酵短杆菌ATCC 13869野生型菌株(现在其改变的名称是Corynebac terium alutamicum)。
另外,突变lysC也可由包含野生型lysC的质粒DNA体外突变处理获得。另一方面,突变脱敏L-赖氨酸和L-苏氨酸产生的对AK活性的协同反馈抑制的信息是十分清楚的(国际出版物WO 94/25605)。因此,在该信息的基础上按照定点突变方法也可以制备突变lysC。
可以按照例如Saito和Miura(H.Saito和K.Miura,生物化学生物物理学报,72,619(1963))的方法通过制备染色体DNA或按照聚合酶链反应方法(PCR;参见White,T.J.等Trends Genet.,5,185(1989))扩增lysC从棒状杆菌分离包含lysC的片段。
以单链DNA例证性地说明DNA引物,所说单链DNA是具有SEQ ID NO1和2所示的核苷酸序列的23链节和21链节的,以便扩增例如基于谷氨酸棒杆菌已知序列(参见分子微生物学(1991),5(5),1197-1204;Mel.Gen.Genet.(1990),224,317-324)的编码lysC的约1,643bp的区域。可以通过采用AppliedBiosystems生产的DNA合成仪380B型和采用phosphoamidite法(参见Tetrahedron Letters(1981),22,1859)按照常规方法合成DNA。可以通过用由Takara Shuzo生产的DNA热循环器PJ2000型按照供给者指定的方法和尾端DNA聚合酶进行PCR。
优选的是将经PCR扩增的lysC与在大肠杆菌和/和/或棒状杆菌细胞中可自主复制的载体DNA连接制备重组DNA,把重组DNA引入预先的大肠杆菌细胞中。这一过程使随后的操作容易进行。在大肠杆菌细胞中可自主复制的载体优选地是质粒载体,其是在宿主的细胞中优选的可自主复制的,包括例如,pUC19、pUC18、pBR322、pHSG299、pHSG399、pHSG398和RSF1010。
当具有使得质粒可以在棒状杆菌中自主复制的能力的DNA片段插入到这些载体中时,它们可以用作在大肠杆菌和棒状杆菌中可自主复制的穿梭载体。
这样穿梭载体包括以下载体。含有各载体的微生物和其在国际保藏单位中的保藏号(在括号)显示如下pHC4 大肠杆菌AJ12617(FERM BP-3532)pAJ655 大肠杆菌AJ11882(FERM BP-136)谷氨酸棒杆菌SR8201(ATCC39135)pAJ1844大肠杆菌AJ11883(FERM BP-137)
谷氨酸棒杆菌SR8202(ATCC39136)PAJ611大肠杆菌AJ11884(FERM BP-138)pAJ3148 谷氨酸棒杆菌SR8203(ATCC39137)pAJ440枯草芽孢杆菌AJ11901(FERM BP-140)这些载体可从其后的保藏的微生物获得。采用溶菌酶和SDS裂解在对数的生长期所收集的细胞,接着在30,000×g下从裂解物分离以获得上清液。将聚乙二醇添加到上清液中,借助氯化铯-溴化乙锭均衡密度梯度离心进行分级分离和纯化。
可以通过按照以下方法将质粒引入来转化大肠杆菌,所述方法例如D.M.Morrison(酶学方法,68,326(1979))的方法或其中用氯化钙处理受体细胞以增加DNA渗透性的方法(Mandel,M.和Higa,A.,分子生物学杂志,53,159(1970))。
当按照以上所述的方法从AK野型菌株分离lysC时,获得野生型lysC,而从AK突变菌株分离lysC时,获得突变lysC。
包含野生型lysC的DNA片段的核苷酸序列的例子在序列表中SEQ ID NO3中显示。野生型AK蛋白质的α亚单位的氨基酸序列是从核苷酸序列推定的,其与DNA序列一起在序列表SEQ ID NO4中显示。单独的氨基酸序列在SEQ ID NO5中显示。野生型AK蛋白质的β亚单位的氨基酸序列是从DNA的核苷酸序列推定的,其与DNA序列一起在序列表SEQ ID NO6中显示。单独的氨基酸序列在SEQ ID NO7中显示。在各亚单位中,GTG用作起始密码子,相应的氨基酸由甲硫氨酸代表。然而,这种代表涉及到甲硫氨酸、缬氨酸或甲酰甲硫氨酸。
对用于本发明的突变lysC没有特别的限制,只要其编码AK(其中由L-苏氨酸和L-赖氨酸产生的协同反馈抑制被脱敏)。然而,突变lysC的一个例证性例子包括这样的突变,其中与279位(从N-末端开始计算)丙氨酸残基相应的氨基酸残基改变成为非丙氨酸和非非野生型AK氨基酸序列中的β亚单位中的酸性氨基酸的氨基酸残基,与30位(从N-末端开始计数)丙氨酸残基相应的氨基酸残基改变成为非丙氨酸和非野生型AK氨基酸序列中的β亚单位中的酸性氨基酸的氨基酸残基。野生型AK的氨基酸序列具体来说包括作为α亚单位的在序列表中SEQ ID NO5所示的氨基酸序列,作为β亚单位的在序列表中SEQ ID NO7所示的氨基酸序列。
称为非丙氨酸和非酸性氨基酸的那些氨基酸残基优选的包括苏氨酸、精氨酸、半胱氨酸、苯丙氨酸、脯氨酸、丝氨酸、酪氨酸和缬氨酸残基。
对相应于所要替代的氨基酸残基的密码子没有特别的限制,只要它编码所说的氨基酸残基。可以预计,依据细菌物种和细菌菌株的不同,野生型AK的氨基酸序列可以稍微不同。具有基于在一个或多个位置上取代,缺失或插入一个或多个氨基酸残基而不影响以上所述活性的突变的AK也可以用于本发明中。具有自发突变的编码AK的DNA可以通过分离这样一种DNA获得,该DNA在严格条件与例如具有SEQ ID NO3所示的一部分核苷酸序列的DNA杂交。本文所说的″严格条件″意指形成特异性杂交而不形成非特异性杂交的条件。用数值难于清楚表达所述条件。然而,例举性的条件是这样一种条件,在该条件下,具有高同源性的核酸(例如具有不低于90%同源性的DNA)相互杂交或者是这样一种条件,其温度是从熔点温度Tm到(Tm-30)℃,优选地是从Tm到(Tm-20)℃,盐浓度相当于1x SSC,优选地相当于0.1x SSC。
基于例如,取代、缺失或插入一个或多个氨基酸残基进行过人工突变的其它AK也可以使用,只要对AK活性实质上没有影响和对L-赖氨酸和L-苏氨酸的协同反馈抑制的脱敏没有影响。可以通过例如定点突变修饰核苷酸序列,产生特定位点的缺失或插入,由此来获得编码具有人工突变的AK的DNA。也可以通过已知诱变处理方法获得具有突变的lysC。诱变处理包括用羟胺或类似物体外处理包含lysC的DNA,用诱变如紫外光或诱变剂(其是用于常规人工诱变的,如N-甲基-N-硝基-N-亚硝基胍(NTG)或硝酸)处理具有包含lysC之DNA的微生物的。诱变处理后,可以通过选择编码或产生AK(其具有AK活性,其氨基酸序列从经历诱变处理的DNA或者经历诱变处理的微生物突变)的DNA或微生物测定引入了突变或者发生了突变的位点。对所引入突变的位点没有特定的限制,只要对AK活性实质上没有影响和对反馈抑制的脱敏没有影响。所引入的突变的数目随在蛋白质的立体结构中的氨基酸的位置和种类变化,并且没有特定的限制,只要对AK活性实质上没有影响和对反馈抑制的脱敏没有影响。该数目通常是1至20,优选地是1至10。
本领域技术人员易于测定具有以上所述的突变的相应于氨基酸序列中特定丙氨酸的残基的氨基酸残基。
通过将突变lysC质粒p399AK9B引入乳发酵短杆菌野生型菌株AJ12036菌株(FERM BP-734)获得的AJ12691菌株已于1992年4月10日以保藏号FERMP-12918保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本),基于布达佩斯条约于1995年2月10日转变成国际保藏,以保藏号FERM BP-4999保藏。
(2)dapB的制备可以借助PCR从棒状杆菌的染色体制备包含dapB的DNA片段。对DNA供体没有特别的限制,然而,由乳发酵短杆菌ATCC 13869菌株所例证。
对乳发酵短杆菌编码DDPR的DNA序列是已知的(生物技术杂志,175(9),2743-2749(1993)),基于该序列可以制备PCR的DNA引物。这样的DNA引物由分别具有序列表SEQ ID NO8和9中所示的核苷酸序列的23-链节DNA所具体例证。可以以与以上所述的有关lysC的那些相同的方式进行DNA的合成、PCR和包含获得的dapB的质粒的制备。
包含dapB之DNA片段的核苷酸序列和由所述核苷酸序列编码的推断的氨基酸序列在SEQ ID NO10中显示。单独的氨基酸序列在SEQ ID NO11中显示。除编码这种氨基酸序列的DNA片段之外,如果对DDPR活性实质上没有影响,本发明可以等同地使用编码实质上与SEQ ID NO11所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一个或多个氨基酸之突变的氨基酸序列)的DNA片段。可以用与编码具有突变(只要对AK活性实质上没有影响和对L-赖氨酸和L-苏氨酸的协同反馈抑制的脱敏没有影响)的AK的DNA的那些相同的方式获得具有自发和人工突变的dapB。
基于布达佩斯条约,通过将包含以下实施例中所获得的dapB的质粒pCRDAPB引入到大肠杆菌JM109菌株中获得的转化菌株AJ13107已从1995年5月26日以保藏号FERM BP-5114国际保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
(3)dapA的制备可以借助PCR从棒状杆菌的染色体制备包含dapA的DNA片段。对DNA供体没有特别的限制,然而,由乳发酵短杆菌ATCC 13869菌株所例证。
对乳发酵短杆菌编码DDPS的DNA序列是已知的(参见核酸研究,18(21),6421,(1990);EMBL保藏号X53993),基于该序列可以制备PCR的DNA引物。这样的DNA引物由分别具有序列表SEQ ID NO12和13中所示的核苷酸序列的23-链节DNA所具体例证。可以以与以上所述的有关lysC的那些相同的方式进行DNA的合成、PCR和包含获得的dapA的质粒的制备。
包含dapA和从核苷酸序列推断的氨基酸序列之DNA片段的核苷酸序列在SEQID NO14中显示。单独的氨基酸序列在SEQ ID NO15中显示。除编码这种氨基酸序列的DNA片段之外,如果对DDPS活性实质上没有影响,本发明可以等同地使用编码实质上与SEQ ID NO15所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一个或多个氨基酸之突变的氨基酸序列)的DNA片段。可以用与编码具有突变(只要对AK活性实质上没有影响和对L-赖氨酸和L-苏氨酸的协同反馈抑制的脱敏没有影响)的AK的DNA的那些相同的方式获得具有自发和人工突变的dapA。
基于布达佩斯条约,通过将包含以下实施例中所获得的dapA的质粒pCRDAPA引入到大肠杆菌JM109菌株中获得的转化菌株AJ13106已从1995年5月26日以保藏号FERM BP-5113国际保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
(4)lysA的制备可以借助PCR从棒状杆菌的染色体制备包含lysA的DNA片段。对DNA供体没有特别的限制,然而,由乳发酵短杆菌ATCC 13869菌株所例证。
在棒状杆菌中,lysA与argS一道形成操纵子(精氨酰-tRNA合酶基因),lysA存在于argS下游。lysA的表达由存在于argS上游的启动子调节(参见生物技术杂志,Nov.,7356-7362(1993))。谷氨酸棒杆菌的这些基因的DNA序列是已知的(参见分子微生物学,4(11),1819-1830(1990);分子和普通遗传学,212,112-119(1988)),基于该序列可以制备PCR的DNA引物。这样的DNA引物由分别具有序列表SEQ ID NO16(相应于在分子微生物学4(11),1819-1830(1990)中描述的核苷酸序列中的11至33位核苷酸)和SEQ ID NO17(相应于在分子和普通遗传学,212,112-119(1988)中描述的核苷酸序列中的1370至1392位核苷酸)中所示的核苷酸序列的23-链节DNA所具体例证。可以以与以上所述的有关lysC的那些相同的方式进行DNA的合成、PCR和包含获得的lysA的质粒的制备。
在以下描述的实施例中,包含启动子、argS和lysA的DNA片段用来增强lysA。然而,argS对本发明不是必要的。其允许使用在其中lysA就连接在启动子下游的DNA片段。
包含argS和lysA以及由核苷酸序列编码的推断的氨基酸序列的DNA片段的核苷酸序列在SEQ ID NO18中例证。由argS编码的氨基酸序列的实例在SEQ ID NO19中显示,由lysA编码的氨基酸序列的实例在SEQ ID NO20中显示。除编码这些氨基酸序列的DNA片段之外,如果对DDC活性实质上没有影响,本发明可以等同地使用编码实质上与SEQ ID NO20所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一个或多个氨基酸之突变的氨基酸序列)的DNA片段。可以用与编码具有突变(只要对AK活性实质上没有影响和对L-赖氨酸和L-苏氨酸的协同反馈抑制的脱敏没有影响)的AK的DNA的那些相同的方式获得具有自发和人工突变的lysA。
(5)aspC的制备通过采用互补于AAT-缺失菌株的营养缺陷性质为指示,可以从微生物(如棒状杆菌和属于埃希氏杆菌属的细菌)染色体制备的基因文库制备包含aspC的DNA片段。对棒状杆菌的DNA供体没有特别的限制,然而,以乳发酵短杆菌ATCC13869菌株例证。对属于埃希氏杆菌属的细菌的DNA供体没有特别的限制,然而,以大肠杆菌JM109菌株例证。
具体地说,用于棒状杆菌的aspC制备的方法是已知的(日本专利出版物6-102028),可以根据这种方法制备aspC。
对大肠杆菌,编码AAT的DNA序列是已知的(Kuramitsu,S.等,生物化学杂志,97(4),1259-1262(1985)),基于该序列可以制备PCR的DNA引物。这样的DNA引物由分别具有序列表SEQ ID NO21和22中所示的核苷酸序列的20-链节DNA所具体例证。可以以与以上所述的有关lysC的那些相同的方式进行DNA的合成、PCR和包含获得的aspC的质粒的制备。
包含aspC和以及从核苷酸序列推断的氨基酸序列的DNA片段的核苷酸序列在SEQ ID NO23中说明。单独的氨基酸序列在SEQ ID NO24中显示。另一包含aspC和以及从核苷酸序列推断的氨基酸序列的DNA片段的核苷酸序列在SEQ ID NO30中说明。单独的氨基酸序列在SEQ ID NO31中显示。除编码这些氨基酸序列的DNA片段之外,如果对AAT活性实质上没有影响,本发明可以等同地使用编码实质上与SEQ ID NO24或31所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一个或多个氨基酸之突变的氨基酸序列)的DNA片段。可以用与编码具有突变(只要对AK活性实质上没有影响和对L-赖氨酸和L-苏氨酸的协同反馈抑制的脱敏没有影响)的AK的DNA的那些相同的方式获得具有自发和人工突变的aspC。
按照本发明以下所述的实施例9的方法已首先获得了来源于乳发酵短杆菌的具有SEQ ID NO30所示的核苷酸序列的aspC。这样,本发明提供了编码包含SEQ ID NO31所示的氨基酸序列的蛋白质的DNA。所述DNA的例子包括含有SEQ ID NO30所示的核苷酸序列中的879至2174位核苷酸DNA。
2本发明的重组DNA和棒状杆菌本发明的棒状杆菌含有天冬氨酸激酶(突变AK),在其中由L-赖氨酸和L-苏氨酸产生的反馈抑制实质上被脱敏,其中所说的编码二氢吡啶二甲酸还原酶的DNA序列,编码二氢吡啶二甲酸合酶的DNA序列,编码天冬氨酸转氨酶的DNA序列和编码二氨基庚二酸脱羧酶的DNA序列被增强。
术语″增强″本文指这一事实通过例如,增加基因的拷贝数,用强启动子,使用编码具有高比活性的酶的基因或者组合这些方法,由所说DNA编码的酶的胞内活性得到提高。
含有突变AK的棒状杆菌可以是作为突变的结果产生突变天冬氨酸激酶的那些或通过引入突变lysC转化的那些。
用以引入以上所述的DNA棒状杆菌的例子包括,例如,下列赖氨酸-产生野生型菌株Corynebacterium acetoacidophilum ATCC 13870;Corynebacterium acetocrlutamicum ATCC 15806;美棒杆菌ATCC 15991;谷氨酸棒杆菌ATCC 13032;(Brevibacterium divaricatum)ATCC 14020;(乳发酵短杆菌)ATCC 13869;
(Corynebacterium lilium)ATCC 15990;(Brevibacterium flavum)ATCC 14067;Corynebacterium melassecola ATCC 17965;Brevibacterium saccharolvticum ATCC 14066;Brevibacterium immariophilum ATCC 14068;Brevibacterium roseum ATCC 13825;Brevibacterium thioaenitalis ATCC 19240;Microbacterium ammoniaphilum ATCC 15354;Corynebacterium thermoaminoaenes AJ12340(FERM BP-1539)除了以上所述的细菌菌株外,其他可用的宿主包括,例如,来源于以上所述菌株的具有L-赖氨酸-产生能力的突变菌株。这样的的人工突变菌株包括如下菌株(2-氨乙基)-半胱氨酸(在下文中简称为″AEC″)抗性突变菌株,如乳发酵短杆菌AJ11082(NRRL B-1147),日本专利出版物56-1914、56-1915、57-14157、57-14158、57-30474、58-10075、59-4993、61-35840、62-24074、62-36673、5-11958、7-112437和7-112438);突变菌株,其生长需要氨基酸(如L-高丝氨酸)的突变菌株(日本专利出版物48-28078和56-6499);显示出对AEC的抗性并需要氨基酸如L-亮氨酸、L-高丝氨酸、L-脯氨酸、L-丝氨酸、L-精氨酸、L-丙氨酸和L-缬氨酸的突变菌株(美国专利3,708,395和3,825,472);显示出对DL-α-氨基ε-己内酰胺、α-氨基-月桂内酰胺、天冬氨酸-类似物、磺胺类药、醌型和N-月桂酰亮氨酸抗性的L-赖氨酸-产生突变菌株;显示出对oxyaloacetate脱羧酶抑制剂或呼吸系统酶抗性的L-赖氨酸-产生突变菌株(日本专利申请公开50-53588、50-31093、52-102498、53-9394、53-86089、55-9783、55-9759、56-32995和56-39778,以及日本专利出版物53-43591和53-1833);需要肌醇或醋酸的L-赖氨酸-产生突变菌株(日本专利申请55-9784和56-8692);对氟丙酮酸或不低于34℃的温度表现出敏感性的L-赖氨酸-产生突变菌株(日本专利申请公开55-9783和53-86090);属于短杆菌属或棒杆菌属的表现出对乙二醇抗性并产生L-赖氨酸的产生突变菌株(美国专利4,411,997)。
在一个特定的实施方案中,为了如上所述在宿主中增强L-赖氨酸生物合成基因,通过采用质粒载体、转座子或噬菌体载体或类似物将所述基因引入到宿主中。一旦引入,就预期会有某种程度的增强,即使使用低拷贝型载体。然而,优选地是采用多拷贝型载体。这样载体包括,例如以上所述的质粒载体,pAJ655、pAJ1844、pAJ611、pAJ3148和pAJ440。此外,在以下文献中描述了来源于棒状杆菌的转座子国际出版物WO02/02627和WO93/18151,欧洲专利出版物445385,日本专利申请公开6-46867;Vertes,A.A.等,分子微生物学,11,739-746(1994),;Bonamy,C.,等,分子微生物学,14,571-581(1994);Vertes,A.A.等,Mel.Gen.Genet.,245,397-405(1994);Jagar,W.等,FEMS微生物学通讯,126,1-6(1995),日本专利申请公开7-107976;日本专利申请公开7-327680等。
在本发明中,不可缺少的是突变lysC必需被增强。允许使用在染色体DNA上的lysC的突变的那些或者其中突变lysC掺入到染色体DNA中从那些。另外,突变lysC可以通过用质粒载体引入。另一方面,为了有效地产生L-赖氨酸,优选地是增强dapA、dapB、lysA和aspC。
通过分别采用不同的载体,可以成功地将lysC、dapA、dapB、lysA和aspC各基因引入宿主中。另外,可以用单一载体将二、三、四或五种基因一起引入。当使用不同的载体时,基因可以以任何秩序引入,然而,优选地使用这样一些载体,它们具有在宿主细胞中的稳定参与和隐藏机制,并且能够相互共存。
特别是,用于把aspC引入棒状杆菌的载体优选地是载体pVK7。载体pVK7是本发明提供的棒状杆菌的克隆载体,其是在大肠杆菌和乳发酵短杆菌的细胞中可自主复制的,包含一个多克隆位点和lacZ’。载体pVK7可以按照以下实施例8所描述的方法构建。
通过例如向宿主棒状杆菌引入在棒状杆菌细胞中可自主复制的包含突变lysC和dapB、dapA、lysA和aspC的重组DNA,获得含有突变AK并包含增强的dapB、dapA、lysA和aspC的棒状杆菌。
可以通过例如把以上所述的参与L-赖氨酸生物合成的各基因插入到载体(如质粒载体,转座子或噬菌体载体)中获得上述重组DNA。
在其中质粒用作载体情况下,按照电脉冲方法(Sugimoto等,日本专利申请公开2207791)可以将重组DNA引入宿主。用转座子的基因扩增可以通过引入质粒进行,该质粒把转座子携带至宿主细胞,并诱导转座子转座。
在用于本发明的棒状杆菌中,除了以上提到的基因外,参与L-赖氨酸生物合成的基因(如编码磷酸烯醇丙酮酸羧酶的DNA序列和编码二氨基庚二酸脱氢酶的DNA序列)也可以增强。
3 用于产生L-赖氨酸的方法通过在合适的培养基中培养棒状杆菌(包含如上所述的L-赖氨酸生物合成的增强的基因),使得L-赖氨酸在细菌培养物中产生和积累,并从培养物收集L-赖氨酸,由此可以有效地产生L-赖氨酸。
所用的培养基的例举性例子是包含碳源、氮源、无机离子和可有可无的其它有机组分的普通培养基。
作为碳源,可以用食糖,如葡萄糖、果糖、蔗糖、糖蜜和淀粉水解物;和有机酸,如富马酸、柠檬酸和琥珀酸。
作为氮源,可以用无机铵盐,如硫酸铵、氯化铵和磷酸铵;有机氮,如大豆水解物;氨气和氨水。
作为有机微量营养源,以合适的量包含所需物质(如维生素B1和L-高丝氨酸或酵母提取物等)是合乎需要的。此外,如果需要,少量添加磷酸钾、硫酸镁、铁离子、锰离子等。
培养优选地在需氧条件下进行大约30至90小时。在培养期间培养温度优选地控制在25℃到37℃,pH优选地控制在5至8。无机或有机,酸性或碱性物质或氨气等可以用于调节pH。可以用普通的离子交换树脂法、沉淀法和其它已知方法结合起来从培养物收集赖氨酸。
具体实施例方式
实施例以下参照实施例更详细地解释本发明。
实施例1从乳发酵短杆菌制备野生型lysC基因和突变lysC基因1 制备野生型和突变lysC和制备含有它们的质粒将乳发酵短杆菌ATCC 13869菌株和通过突变处理从ATCC 13869菌株获得的L-赖氨酸-产生突变菌株AJ3445(FERM P-1944)用作染色体DNA供体。AJ3445菌株已经历突变,使lysC改变得实质上脱敏了由赖氨酸和苏氨酸产生的协同抑制(生物化学杂志,68,701-710(1970))。
用PCR法(聚合酶链反应;参见White,T.J.等,Trends Genet.,5,185(1989))从染色体DNA扩增包含lysC的DNA片段,就用于扩增的DNA引物而言,为了扩增编码lysC的1,643bp的区,基于谷氨酸棒杆菌已知的序列(参见分子微生物学(1991),5(5),1197-1204;和Mel.Gen.Genet.(1990),224,317-324)合成23链节和21链节(具有SEQ ID NO1和2所示的核苷酸序列)的单链DNA序列。经Applied Biosystems生产的DNA合成仪380B型用普通方法和用phosphoamidite法(参见Tetrahedron Letters(1981),22,1859)合成DNA。
通过用Takara Shuzo生产的DNA热循环仪PJ2000型按照供给者指定的方法和用尾端DNA聚合酶经PCR扩增所说的基因。由琼脂糖凝胶电泳确认1,643kb的扩增的基因片段。之后,用普通的方法纯化从凝胶上切下的片段,用限制酶NruI(由Takara Shuzo生产)和EcoRI(由Takara Shuzo生产)消化该片段。
将pHSG399(参见,S.等,基因(1987),61 63-74)用作基因片段的克隆载体。用限制酶SmaI(由Takara Shuzo生产)和EcoRI消化pHSG399,将其与扩增的lysC片段连接。按照指定的方法用DNA连接试剂盒(由Takara Shuzo生产)连接DNA。由此制备质粒,其中从乳发酵短杆菌染色体扩增的lysC片段分别与pHSG399连接。包含ATCC 13869(野生型菌株)lysC的质粒命名为p399AKY,包含AJ3463(L-赖氨酸-产生菌)lysC的质粒命名为p399AK9将具有使细菌在属于棒杆菌属的细菌中可自主复制能力的DNA片段(在下文中称为“Brevi.-ori”)分别引入到p399AKY和p399AK9中,以制备携带有lysC的在属于棒杆菌属的细菌中可自主复制的质粒。从包含Brevi.-ori并且在大肠杆菌和属于棒杆菌属的细菌两种细胞中可自主复制的质粒载体pHK4制备Brevi.-ori。pHK4通过以下方法构建pHK4用KpnI(由Takara Shuzo生产)和BamHI(由Takara Shuzo生产)消化pHC4,提取Brevi.-ori片段,与pHSG298(也已由KpnI和BamHI消化)连接(参见日本专利申请公开5-7491)。pHK4使宿主具有卡那霉素抗性。含有pHK4的大肠杆菌称命名为大肠杆菌AJ13136,该菌株已于1995年8月1日以保藏号FERM BP-5186保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
用限制酶KpnI和BamHI消化pHK4,使切开的末端平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化BamHI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经BamHI消化从pHK4切下。用BamHI消化这一质粒,将所产生的Brevi.-ori DNA片段与p399AKY和p399AK9(也已分别用BamHI消化)连接,以制备各自含有在属于棒杆菌属的细菌中可自主复制的lysC基因的质粒。
包含源于p399AKY的野生型lysC基因的质粒命名为p399AKYB,包含源于p399AK9的突变lysC基因的质粒命名为p399AK9B。p399AK9B和p399AKYB的构建方法在图1中显示。通过把突变lysC质粒p399AK9B引入乳发酵短杆菌野生型菌株所获得的菌株AJ12691(AJ12036菌株,FERM 734)已于1992年4月10日以保藏号FERM P-12918保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本),基于布达佩斯条约于1995年2月10日转变成国际保藏,以保藏号FERM BP-4999保藏。
2 测定乳发酵短杆菌野生型lysC和突变lysC的核苷酸序列从各自的转化体制备包含野生型lysC的质粒p399AKY和包含突变lysC的质粒p399AK9,以测定野生型与突变lysC的核苷酸序列。核苷酸序列测定按照Sanger等(例如F.Sanger等,美国科学院学报,74,5463(1977))的方法进行。
由p399AKY编码的野生型lysC的核苷酸序列在序列表SEQ ID NO3中显示。另一方面,由p399AK9编码的突变lysC的核苷酸序列仅具有一个核苷酸突变,这样与野生型lysC比较,在SEQ ID NO3中的1051位G改变成A。已知谷氨酸棒杆菌的lysC有两个在同一DNA链上的同一读框中编码的亚单位(α,β)(参见,Kalinowski,J.等,分子微生物学(1991)5(5),1197-1204)。从同源性判断,假定此处测序的基因也具有两个在同一DNA链上的同一读框中编码的亚单位(α,β)。
从DNA的核苷酸序列推断的野生型AK蛋白质α-亚单位的氨基酸序列与DNA序列一起在SEQ ID NO4中显示。单独的氨基酸序列在SEQ ID NO5中显示。从DNA的核苷酸序列推断的野生型AK蛋白质β-亚单位的氨基酸序列与DNA序列一起在SEQ ID NO6中显示。单独的氨基酸序列在SEQ ID NO7中显示。在每一亚单位中,GTG用作起始密码子,相应的氨基酸由甲硫氨酸代表。然而,这种代表指甲硫氨酸、缬氨酸或甲酰甲硫氨酸。
另一方面,在突变lysC序列上的突变指出现氨基酸残基取代,以便在野生型AK蛋白质氨基酸序列中α-亚单位的279位丙氨酸残基改变成为苏氨酸残基,β-亚单位的30位丙氨酸残基改变成为苏氨酸残基(SEQ ID NO5、7)。
实施例2从短杆菌属制备dapB1 制备dapB和构建含有dapB的质粒乳发酵短杆菌野生型菌株ATCC 13869用作染色体DNA供体。按照普通方法从ATCC 13869菌株制备染色体DNA。按照PCR从染色体DNA扩增包含dapB的DNA片段。就用于扩增的DNA引物而言,为了扩增编码DDPR的2.0kb的区,基于乳发酵短杆菌已知的序列(参见细菌学杂志,175(9),2743-2749(1993))分别合成23链节(分别具有序列表中SEQ ID NO8和9所示的核苷酸序列)的DNA,DNA合成和PGR以与实施例1所描述的相同的方式进行。将pCR-Script(由Invitrogen生产)用作扩增2,001bp的基因片段的克隆载体,将其与扩增的dapB片段连接。由此构建质粒,其中从乳发酵短杆菌染色体扩增的2,001bp dapB片段与pCR-Script连接。具有源于ATCC 13869的dapB的如上所述获得的质粒命名为pCRDAPB。基于布达佩斯条约,通过把pCRDAPB引入大肠杆菌JM109菌株获得的转化菌株AJ13107已从1995年5月26日以保藏号FERM BP-5114国际保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
通过以EcoRV和SphI消化pCRDAPB提取包含DDPR结构基因的1,101bp片段。将这一片段与pHSG399(已由HincII和SghI消化)以制备质粒。该制备的质粒命名为p399DPR。
将Brevi.-ori引入到制备的p399DPR中以构建在棒状杆菌中可自主复制的携带dapB的质粒。用限制酶KpnI(由Takara Shuzo生产)消化pHK4,使切开的末端平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化BamHI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经BamHI消化从pHK4切下。用BamHI消化这一质粒,将所产生的Brevi.-ori DNA片段与p399DPR(也已用BamHI消化)连接,以制备含有在棒状杆菌中可自主复制的dapB基因的质粒。所制备的质粒命名为pDPRB。pDPRB的构建方法在图2中显示。
2 测定乳发酵短杆菌dapB的核苷酸序列从含有p399DPR的AJ13107菌株制备质粒DNA,以与实施例1中描述的相同的方式测定其核苷酸序列。
所测定的核苷酸序列和从该核苷酸序列推断的氨基酸序列在SEQ ID NO10中显示,单独的氨基酸序列在SEQ ID NO11中显示。
实施例3从短杆菌属制备dapA1 制备dapA和构建含有dapA的质粒乳发酵短杆菌野生型菌株ATCC 13869用作染色体DNA供体。按照普通方法从ATCC 13869菌株制备染色体DNA。按照PCR从染色体DNA扩增包含dapA的DNA片段。就用于扩增的DNA引物而言,为了扩增编码DDPS的1.5kb的区,基于谷氨酸棒杆菌已知的序列(核酸研究,18(21),6421(1990);EMBL保藏号X53993)合成23链节的分别具有序列表中SEQ ID NO12和13所示的核苷酸序列的DNA,DNA合成和PCR以与实施例1所描述的相同的方式进行。将pCR-1000(由Invitrogen生产,参见生物技术,9,657-663(1991))用作扩增1,411bp的基因片段的克隆载体,将其与扩增的dapA片段连接。DNA的连接按照指定的方法用DNA连接试剂盒进行。由此构建质粒,其中从乳发酵短杆菌染色体扩增的1,411bp dapA片段与pCR-1000连接。具有源于ATCC13869的dapA的如上所述获得的质粒命名为pCRDAPA。基于布达佩斯条约,通过把pCRDAPA引入大肠杆菌JM109菌株获得的转化菌株AJ13106已从1995年5月26日以保藏号FERM BP-5113国际保藏在国际贸易和工业部工业科学和技术机构的国立生命科学和人体技术研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
将Brevi.-ori引入到制备的pCRDAPA中以构建在棒状杆菌中可自主复制的携带dapA的质粒。用限制酶KpnI和BamHI(由Takara Shuzo生产)消化pHK4,使切开的末端平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化SmaI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经SmaI消化从pHK4切下。用SmaI消化这一质粒,将所产生的Brevi.-ori DNA片段与pCRDAPA(也已用SmaI消化)连接,以制备含有在棒状杆菌中可自主复制的dapA基因的质粒。所制备的质粒命名为pDPSB。pDPSB(Kmr)的构建方法在图3中显示。
2 测定乳发酵短杆菌dapA的核苷酸序列从含有pCRDAPA的AJ13107菌株制备质粒DNA,以与实施例1中描述的相同的方式测定其核苷酸序列。所测定的核苷酸序列和从该核苷酸序列推断的氨基酸序列在SEQ ID NO14中显示,单独的氨基酸序列在SEQ ID NO15中显示。
实施例4从短杆菌属制备lysA1 制备lysA和构建含有lysA的质粒乳发酵短杆菌野生型菌株ATCC 13869用作染色体DNA供体。按照普通方法从ATCC 13869菌株制备染色体DNA。按照PCR从染色体DNA扩增包含argS、lysA和操纵子的启动子的DNA片段。就用于扩增的DNA引物而言,为了扩增编码精氨酰-tRNA合酶和DDC的3.6kb的区,基于谷氨酸棒杆菌已知的序列(参见分子微生物学,4(11),1819-1830(1990);分子和普通遗传学,212,112-119(1988)),使用23链节(分别具有序列表中SEQ ID NO16和17所示的核苷酸序列)的合成DNA,DNA合成和PCR以与实施例1所描述的相同的方式进行。将pHSG399用作扩增3,579bp的基因片段的克隆载体,用限制酶SmaI(由TakaraShuzo生产)消化pHSG399,该质粒与包含扩增的lysA的DNA片段连接。具有源于ATCC13869的lysA的如上所述获得的质粒命名为p399LYSA。
通过以KpnI(由Takara Shuzo生产)和BamHI(由Takara Shuzo生产)消化p399LYSA提取包含lysA的DNA片段。将这一片段与pHSG299(已由KpnI和BamHI消化)。构建p399LYSA的方法在图4中显示。
将Brevi.-ori引入到制备的p399LYSA中以构建在棒状杆菌中可自主复制的携带lysA的质粒。用限制酶KpnI和BamHI消化pHK4,使切开的末端平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化KpnI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经KpnI消化从pHK4切下。用KpnI消化这一质粒,将所产生的Brevi.-ori DNA片段与p299LYSA(也已用KpnI消化)连接,以制备含有在棒状杆菌中可自主复制的lysA基因的质粒。所制备的质粒命名为pLYSAB。pLYSAB的构建方法在图5中显示。
2 测定乳发酵短杆菌lysA的核苷酸序列制备质粒p299LYSA的DNA,以与实施例1中描述的相同的方式测定其核苷酸序列。所测定的核苷酸序列和从该核苷酸序列推断的氨基酸序列在SEQ ID NO18中显示,有关核苷酸序列,由lysA编码的氨基酸序列和由argS编码的氨基酸序列分别在SEQ ID NO19和20中显示。
实施例5从大肠杆菌制备aspC和构建含有aspC的质粒大肠杆菌JM109菌株用作染色体DNA的供体。按照普通方法从大肠杆菌JM109菌株制备染色体DNA。按照PCR从染色体DNA扩增包含aspC的DNA片段。就用于扩增DNA引物而言,基于大肠杆菌已知的序列(参见Kuramitsu,S等,生物化学杂志,94(4),1259-1262(1985)),使用20链节(分别具有序列表中SEQ ID NO21和22所示的核苷酸序列)的合成DNA,DNA合成和PCR以与实施例1所描述的相同的方式进行。将1,331bp的扩增片段克隆进TA克隆载体pCR1000。所构建的质粒命名为pCRASPC。
包含aspC的扩增DNA的核苷酸序列和从该核苷酸序列推断的氨基酸序列在SEQ ID NO23中显示。单独的氨基酸序列在SEQ ID NO24中显示。
比较实施例1构建包含组合的突变lysC和dapA的质粒从包含dapA的质粒pCRDAPA和包含突变lysC和Brevi.-ori的质粒p399AK9B构建包含突变lysC、dapA和棒状杆菌复制源的质粒。以SalI完全消化p399AK9B,然后平端化,并与EcoRI接头连接,以构建其中SalI位点修饰成EcoRI位点的质粒。所获得的质粒命名为p399AK9BSE。通过以EcoRI部分消化p399AK9BSE作为一个片段切下突变lysC和Brevi.-ori。将这一片段与已用EcoRI消化的pCRDAPA连接。所获得的质粒命名为pCRCAB。这一质粒在大肠杆菌和棒状杆菌中可自主复制,其使宿主具有对卡那霉素的抗性,该质粒包含组合的突变lysC和dapA。pCRCAB的构建方法在图6中显示。
比较实施例2构建包含组合的突变lysC和dapB的质粒从具有突变lysC的质粒p399AK9和具有dapB的质粒p399DPR构建包含突变lysC和dapB的质粒。通过以EcoRV和SphI消化p399DPR提取包含DDPR结构基因的1,101bp的片段。将这一片段与已用SalI消化,然后平端化,并进一步由SphI消化的p399AK9连接,以构建包含组合的突变lysC和dapB的质粒。这一质粒命名为p399AKDDPR。
其次,将Brevi.-ori引入所获得的p399AKDDPR。以限制酶KpnI(由TakaraShuzo生产)消化包含Brevi.-ori的质粒pHK4,使切下的边缘平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化BamHI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经BamHI消化从pHK4切下。用BamHI消化这一质粒,将所产生的Brevi.-ori DNA片段与p399AKDDPR(也已用BamHI消化)连接,以构建在棒状杆菌中可自主复制的含有突变lysC和dapB的质粒。构建的质粒命名为pCB。pCB的构建方法在图7中显示。
比较实施例3构建包含组合的dapA和dapB的质粒用KpnI和EcoRI消化包含dapA的质粒pCRDAPA,以提取包含dapA的DNA片段,将其与已用KpnI和EcoRI消化的载体质粒pHSG399连接。所获得的质粒命名为p399DPS。
另一方面,以SacII和EcoRI消化包含dapB的质粒pCRDAPB,以提取包含编码DDPR区的2.0kb的DNA片段,将其与已用SacII和EcoRI消化的p399DPS连接,以构建包含组合的dapA和dapB的质粒。所获得的质粒命名为p399AB。
其次,将Brevi.-ori引入p399AB。以限制酶BamHI(由Takara Shuzo生产)消化包含Brevi.-ori的质粒pHK4,使切下的边缘平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化KpnI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经KpnI消化从pHK4切下。用KpnI消化这一质粒,将所产生的Brevi.-ori DNA片段与p399AB(也已用KpnI消化)连接,以构建在棒状杆菌中可自主复制的含有突变dapA和dapB的质粒。构建的质粒命名为pAB。pAB的构建方法在图8中显示。
实施例6构建包含组合的突变lysC、dapA和dapB的质粒以EcoRI和SphI消化p399DPS,平端化,其后提取dapA基因片段。将这一片段与已用SalI消化并平端化的p399AK9连接。以构建其中突变lysC和dapA共存的质粒p399CA。
用EcoRI消化包含dapB的质粒pCRDAPB,平端化,接着用SacI消化,以抽提包含dapB的2.0kb的DNA片段。用SpeI消化包含dapA和突变lysC的质粒p399CA,平端化,之后用SacI消化,并与抽提的dapB片段连接,以便获得包含突变lysC、dapA和dapB的质粒。这一质粒命名为p399CAB。
其次,将Brevi.-ori引入p399CAB。以限制酶BamHI(由Takara Shuzo生产)消化包含Brevi.-ori的质粒pHK4,使切下的边缘平端化。按照指定的方法用平端化试剂盒(由Takara Shuzo生产)进行平端的形成。形成平端后,连接上磷酸化KpnI接头(由Takara Shuzo生产)进行修饰,使相应于Brevi.-ori部分的DNA片段可以仅经KpnI消化从pHK4切下。用KpnI消化这一质粒,将所产生的Brevi.-ori DNA片段与p399CAB(也已用KpnI消化)连接,以构建在棒状杆菌中可自主复制的含有突变lysA、dapA和dapB的质粒。构建的质粒命名为pCAB。pCAB的构建方法在图9中显示。
实施例7构建包含组合的突变lysC、dapA、dapB和lysA的质粒用KpnI和BamHI消化包含lysA的质粒p299LYSA,平端化,然后提取lysA基因片段。将这一片段与已用HpaI(由Takara Shuzo生产)消化并平端化的质粒pCAB连接,以构建包含组合的突变lysC、dapA、dapB和lysA的并且在棒状杆菌中可自主复制的质粒。构建的质粒命名为pCABL。pCABL的构建方法在图10中显示。值得注意的是,在pCABL中lysA基因片段以包含dapB基因的DNA片段插入到HpaI位点中,然而,HpaI位点位于dapB基因(SEQ ID NO10中611至616位核苷酸)启动子上游,dapB基因不被分离。
实施例8构建包含aspC的质粒作为用于把aspC引入棒状杆菌的载体,使用新构建的棒状杆菌的克隆载体pVK7。如以下描述通过将大肠杆菌的载体pHSG299(Kmr;Takeshita,S.等,基因,61,63-74(1987))与乳发酵短杆菌的隐蔽性质粒pAM330构建pVK7。从乳发酵短杆菌ATCC 13869菌株制备pAM330。以形成一个切割位点的限制酶AvaII(由Takara Shuzo生产)消化pHSG299,用T4 DNA聚合酶平端化,并与已用HindIII(由Takara Shuzo生产)消化和用T4 DNA聚合酶平端化的pAM330连接。根据在pHSG299中所插入的pAM330的方向,两个获得的质粒命名为pVK6和pVK7,pVK7用于下列实验中。pVK7是在大肠杆菌和乳发酵短杆菌两者中可自主复制的,并且具有来源于pHSG299和lacZ’的多克隆位点。pVKG和pVK7的构建方法在图11中显示。
将aspC与构建的穿梭载体pVK7连接。以限制酶EcoRI(由Takara Shuzo生产)消化pCRASPC,并与已用EcoRI消化的pVK7连接。用DNA连接试剂盒(由Takara Shuzo生产)进行DNA的连接。在其中aspC片段与pVK7连接的哪些中,其中所述片段以与pVK7所具有的lac启动子的转录方向相同的方向插入的一个命名为pOm。pOm的构建方法在图12中显示。
实施例9从短杆菌属制备aspC1 制备源于乳发酵短杆菌的aspC属于棒杆菌属的天冬氨酸营养缺陷菌株缺乏aspC活性(AAT活性),是天冬氨酸营养缺陷的(I.Shiio和K.Ujikawa,生物化学杂志,84,647(1978)),通过引入基因文库(国际出版物WO 95/23224)转化该菌株,所述文库是经将乳发酵短杆菌野生型ATCC 13869菌株的染色体DNA的各种片段与在属于棒杆菌属的细菌细胞中起作用的载体连接制备的。收集所获得的转化体,以蒸馏水洗涤两次。将几千个转化体中的几十个平板接种到最小培养基(不含有非氨氮源的培养基10(I.Shiio和K.Ujikawa,生物化学杂志,84,647(1978)))琼脂平板上,以获得恢复天冬氨酸营养缺陷和在平板上显示出极好的生长的转化体。从获得的恢复天冬氨酸营养缺陷的菌株回收质粒DNA,所获得的质粒命名为pAC。当乳发酵短杆菌野生型ATCC 13869菌株用pAC转化时,转化体的aspC活性增加(第1表)。按照已知方法(参见Sizer,I.W.和Jenkins,W.T.,酶学方法,vol.5,677-679(1962))进行活性测定。
从这些结果可以证实,在质粒DNA上,ATCC 13869菌株染色体DNA的大约2.5kb片段包含乳发酵短杆菌的aspC。
表1菌株/质粒 aspC活性(相对值)ATCC13869 1.0ATCC13869/pCABL 8.92 分析来源于乳发酵短杆菌的aspC根据Sangar等的双脱氧方法(美国科学院学报,74,5463(1977))测定2.5kb DNA片段的核苷酸序列,测定的核苷酸序列在SEQ ID NO25中显示。用GENETYX-MAC版本7.3个程序(软件Kaihatsu KK)分析核苷酸序列。ORF(开放读框)研究显示如图13中所示的两个以相反方向重叠的ORF。432个氨基酸或426个氨基酸的ORF(其在SEQ ID NO25所示的核苷酸序列中在作为起始密码子的579至881或897至899位核苷酸的ATG和作为终止密码子的2175至2177位核苷酸的TAG之间以正方向被编码)命名为ORF1。393个氨基酸的ORF(其在SEQ ID NO25所示的核苷酸序列中在作为起始密码子的互补于2163至2165核苷酸的CAC的GTG和作为终止密码子的2163至2165位核苷酸的CAC之间以反方向被编码)命名为ORF2。
3 测定编码aspC的ORF经PCR从pAC扩增不包含全长ORF2和编码全长ORF1的DNA片段,以证实在两个ORF中ORF是否编码AAT蛋白质。就用于扩增的DNA引物而言,基于SEQ ID NO25所示的序列分别使用具有SEQ ID NO26和27所示的核苷酸序列的23-链节合成DNA。DNA合成和PCR以与实施例1中描述的相同的方式进行。将在SEQ ID NO25中所示的核苷酸序列中的126至2,187位核苷酸的2,062bp扩增片段克隆进TA克隆载体pCR2.1(由Invitrogen产生)。所构建的质粒命名为pCRORF1。
按相同的方式,扩增和克隆SEQ ID NO25中所示的核苷酸序列中的975至2,517位核苷酸的1,543bp基因片段,其仅编码全长ORF2。构建的质粒命名为pCRORF2。
为了将克隆DNA片段引入到属于棒杆菌属的细菌细胞中,将所述DNA片段与实施例8中所描述的穿梭载体连接。以限制酶EcoRI(由Takara Shuzo生产)消化pCRORF1,与已用限制酶EcoRI消化的pVK7连接。用DNA连接试剂盒(由Takara Shuzo生产)进行DNA的连接。构建的质粒命名为pORF1。pORF1的构建方法在图14中显示。
按相同的方式,从pCRORF2和pVK7构建pORF2。
以与实施例9中相同的方式将制备的pORF1和pORF2引入乳发酵短杆菌野生型ATCC 13869菌株细胞中。测定ATCC 13869和质粒-引入菌株ATCC13869/pORF1和ATCC 13869/pORF2的aspC活性。活性测定以与实施例1中描述的相同的方式进行。如表2所示,仅ATCC 13869/pORF1观察到aspC活性增加,表明aspC由ORF1编码。
由以上提到的实验测定的乳发酵短杆菌aspC的核苷酸序列和由该核苷酸序列编码的推断的氨基酸序列在SEQ ID NO30中显示。单独的氨基酸序列在SEQ ID NO31中显示。在GENEBANK上的同源性检索显示与来源于其它有机体的已知氨基酸序列(包括AAT蛋白质)无同源性。
表2菌株/质粒 aspC活性(相对值)ATCC13869 1.0ATCC13869/pORF1 10.1ATCC13869/pORF2 1.2实施例10将包含L-赖氨酸生物合成基因的质粒引入到乳发酵短杆菌L-赖氨酸-产生菌中将在实施例7中构建的pCABL(Cmr)引入乳发酵短杆菌L-赖氨酸-产生菌AJ11082(NRRL B-11470)中。AJ11082菌株具有AEC抗性。按照电脉冲方法引入质粒(Sugimoto等,日本专利申请公开2-207791),基于质粒具有的药物抗性标记选择转化体,当包含氯霉素抗性基因的质粒被引入时,在包含5μg/ml氯霉素完全培养基上选择转化体,当包含卡那霉素抗性基因的质粒被引入时,在包含25μg/ml卡那霉素完全培养基上选择转化体。
用具有大肠杆菌aspC的质粒pOm(Kmr)或具有乳发酵短杆菌aspC的pORF1(Kmr)转化如上所获得的转化体AJ11082/pCABL。因为在乳发酵短杆菌细胞中pCABL用pHM1519为复制起点,用Cm抗性基因为标记,在乳发酵短杆菌细胞中,pOm用pAM330为复制起点,用Km抗性基因为标记,所以两种质粒都稳定地包含在乳发酵短杆菌细胞中这样,获得了菌株AJ11082/pCABL/pOm和AJ11082/pCABL/pORF1,其中质粒包含参与L-赖氨酸生物合成的基因和含有aspC。
以与以上所述相同的方式,将p399AK9B(Cmr)、pDPSB(Kmr)、pDPRB(Cmr)、pLYSAB(Cmr)、pOm、pCRCAB(Kmr)、pAB(Cmr)、pCB(Cmr)和pCAB(Cmr)引入AJ11082菌株中,以获得其中lysC、dapA、dapB、lysA或aspC单独被增强或者这些基因的两种或多种同时被增强的转化体。
实施例11测定转化体活性测定转化体AJ11082/pCABL、AJ11082/pCABL/pOm和AJ11082/pCABL/pORF1的aspC活性。以与实施例9的3中描述的相同的方法进行活性测定。如表3所示,观察到在pOm载体上的lac启动子也在乳发酵短杆菌中起作用,AJ11082/pCABL/pOm的aspC活性增加约三倍,观察到AJ11082/pCABL/pORF1的aspC活性进一步增加约九倍。
表3菌株/质粒 aspC活性(相对值)AJ11082 1.0AJ11082/pOm 3.2AJ11082/pORF1 10.1AJ11082/pCABL 0.9AJ11082/pCABL/pOm 2.9AJ11082/pCABL/pORF1 11.5实施例12L-赖氨酸的产生在L-赖氨酸-产生培养基中培养实施例10中所获得的各种转化体,以估价L-赖氨酸产量。L-赖氨酸-产生培养基具有下列组成。
除了碳酸钙外,溶解下列组分(在1升中),用KOH调节pH为8.0。于115℃灭菌15分钟,将已经以干燥状态在热气流中分别灭菌过的碳酸钙(50g)加入其中。
葡萄糖 100g(NH4)2SO455gKH2PO41gMgSO4·7H2O 1g生物素 500μg硫胺 2000μgFeSO4.7H2O 0.01gMnSO4·7H2O 0.01g烟酰胺 5mg蛋白质水解物(Mamenou)30ml碳酸钙 50g将各种类型的转化体和亲本菌株接种到具有以上组成的培养基中,以进行在31.5℃下的往复振荡培养。在培养40或72小时和生长72小时(OD562)后产生的L-赖氨酸的量在表4中显示。在表中,lysC*代表突变lysC。通过在10倍稀释后在562nm测量OD定量测定生长。
表4在40或72小时培养后积累的L-赖氨酸细菌菌株/质粒 引入的基因 产生的L-赖氨酸量(g/l)生长40h后72h后 (OD562/101)AJ1108222.0 29.80.450AJ11082/p399AK9B lysC*16.8 34.50.398AJ11082/pDPSB dapA 18.7 33.80.410AJ11082/pDPRB dapB 19.9 29.90.445AJ11082/pLYSABlysA 19.8 32.50.356AJ11082/pOm aspC(E)[注1] 21.8 30.90.457AJ11082/pOm aspC(B)[注2] 21.5 31.20.450AJ11082/pCRCABlysC*,dapB 19.7 36.50.360AJ11082/pAB dapA,dapB 19.0 34.80.390AJ11082/pCB lysC*,dapB 23.3 35.00.440AJ11082/pCAB lysC*,dapA,dapB23.0 45.00.425AJ11082/pCABL lysC*,dapA,dapB,lysA 26.2 46.50.379AJ11082/pCABL/pOm lysC*,dapA,dapB,lysA,aspC(E) 26.7 47.60.415AJ11082/pCABL/pORF1 lysC*,dapA,dapB,lysA,aspC(B) 27.1 48.80.410注1大肠杆菌的aspC注2乳发酵短杆菌的aspC
如上所示,当突变lysC,dapA,dapB,lysA或aspC单独增强时,培养72小时后产生的L-赖氨酸的量大于或等于由亲本菌株产生的量,然而,培养40小时后产生的L-赖氨酸的量低于由亲本菌株产生的量。即,在短的培养时间内,L-赖氨酸-产生速度降低。同样地,当突变lysC和dapA或者dapA和dapB一起增强时,培养72小时后产生的L-赖氨酸的量大于由亲本菌株产生的量,然而,培养40小时后产生的L-赖氨酸的量小于由亲本菌株产生的量。这样,L-赖氨酸-产生速度降低。
相反,在其中dapB与突变lysC一道增强的菌株,其中三种突变lysC、dapA和dapB增强的菌株,以及其中四种突变lysC、dapA、dapB和lysA增强的菌株的情况下,在短的和长的培养时间内所积累的L-赖氨酸的量都得到提高。
在其中五种突变lysC、dapA,dapB,lysA和aspC增强的大肠杆菌菌株,以及其中五种突变lysC、dapA,dapB,lysA和aspC增强的乳发酵短杆菌菌株的情况下,在任何培养时间内L-赖氨酸的产量都得到提高。后者提高的程度高于前者。
序列表(1)一般信息(i)申请人AJINOMOTO有限公司(ii)发明名称用于产生L-赖氨酸的方法(iii)序列数31个(iv)通讯地址(A)收信人(B)街道(C)城市(E)国家(F)ZIP(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件Patentln Release#,版本#1.30(vi)当前申请的数据(A)申请号(B)申请日(C)分类号(vii)在先申请的数据(A)申请号JP8-325659(B)申请日1996年12月5日(viii)律师/代理人信息(A)姓名(B)登记号(ix)电信信息(A)电话(B)传真
(2)SEQ ID NO1的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=″合成的DNA″(iv)反义否(xi)序列描述SEQ ID NO1TCGAAGTA GCACCTGTCA CTT 23(2)SEQ ID NO2的信息(i)序列特征(A)长度21个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO2ACGGAATTCA ATCTTACGGC C21(2)SEQ ID NO3的信息(i)序列特征(A)长度1643个碱基(B)类型核酸(C)链型双链
(D)拓扑结构线性(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(xi)序列描述SEQ ID NO3TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT 120GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG 180GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT 240GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC 300ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT 360GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG 420CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT 480GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC 540GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC 600AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG 660TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT 720GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT 780AATGCACAGA AGCTGGAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC 840TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC 900GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT 960CCTGTGGAAG AAGCAGTCCT TACCGGTGTC GCAACCGACA AGTCCGAAGC CAAAGTAACC1020GTTCTGGGTA TTTCCGATAA GCCAGGCGAG GCTGCCAAGG TTTTCCGTGC GTTGGCTGAT1080GCAGAAATCA ACATTGACAT GGTTCTGCAG AACGTCTCCT CTGTGGAAGA CGGCACCACC1140GACATCACGT TCACCTGCCC TCGCGCTGAC GGACGCCGTG CGATGGAGAT CTTGAAGAAG1200CTTCAGGTTC AGGGCAACTG GACCAATGTG CTTTACGACG ACCAGGTCGG CAAAGTCTCC1260CTCGTGGGTG CTGGCATGAA GTCTCACCCA GGTGTTACCG CAGAGTTCAT GGAAGCTCTG1320CGCGATGTCA ACGTGAACAT CGAATTGATT TCCACCTCTG AGATCCGCAT TTCCGTGCTG1380ATCCGTGAAG ATGATCTGGA TGCTGCTGCA CGTGCATTGC ATGAGCAGTT CCAGCTGGGC1440GGCGAAGACG AAGCCGTCGT TTATGCAGGC ACCGGACGCT AAAGTTTTAA AGGAGTAGTT1500TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG GTTATGCGCA1560CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT TCCCCGCGTT1620CCGCAGGCCG TAAGATTGAA TTC1643(2)SEQ ID NO4的信息(i)序列特征(A)长度1643个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869
(ix)特征(A)名称/关键词CDS(B)位置217..1482(xi)序列描述SEQ ID NO4TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT 120GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG 180GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAG GTG GCC CTG GTC GTA CAG 234Met Ala Leu Val Val Gln1 5AAA TAT GGC GGT TCC TCG CTT GAG AGT GCG GAA CGC ATT AGA AAC GTC 282Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala Glu Arg Ile Arg Asn Val
10 15 20GCT GAA CGG ATC GTT GCC ACC AAG AAG GCT GGA AAT GAT GTC GTG GTT330Ala Glu Arg Ile Val Ala Thr Lys Lys Ala Gly Asn Asp Val Val Val25 30 35GTC TGC TCC GCA ATG GGA GAC ACC ACG GAT GAA CTT CTA GAA CTT GCA378Val Cys Ser Ala Met Gly Asp Thr Thr Asp Glu Leu Leu Glu Leu Ala40 45 50GCG GCA GTG AAT CCC GTT CCG CCA GCT CGT GAA ATG GAT ATG CTC CTG426Ala Ala Val Asn Pro Val Pro Pro Ala Arg Glu Met Asp Met Leu Leu55 60 65 70ACT GCT GGT GAG CGT ATT TCT AAC GCT CTC GTC GCC ATG GCT ATT GAG474Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu Val Ala Met Ala Ile Glu75 80 85TCC CTT GGC GCA GAA GCT CAA TCT TTC ACT GGC TCT CAG GCT GGT GTG522Ser Leu Gly Ala Glu Ala Gln Ser Phe Thr Gly Ser Gln Ala Gly Val90 95 100CTC ACC ACC GAG CGC CAC GGA AAC GCA CGC ATT GTT GAC GTC ACA CCG570Leu Thr Thr Glu Arg His Gly Asn Ala Arg Ile Val Asp Val Thr Pro105 110 115GGT CGT GTG CGT GAA GCA CTC GAT GAG GGC AAG ATC TGC ATT GTT GCT618Gly Arg Val Arg Glu Ala Leu Asp Glu Gly Lys Ile Cys Ile Val Ala120 125 130GGT TTT CAG GGT GTT AAT AAA GAA ACC CGC GAT GTC ACC ACG TTG GGT666Gly Phe Gln Gly Val Asn Lys Glu Thr Arg Asp Val Thr Thr Leu Gly135 140 145 150CGT GGT GGT TCT GAC ACC ACT GCA GTT GCG TTG GCA GCT GCT TTG AAC714Arg Gly Gly Ser Asp Thr Thr Ala Val Ala Leu Ala Ala Ala Leu Asn155 160 165GCT GAT GTG TGT GAG ATT TAC TCG GAC GTT GAC GGT GTG TAT ACC GCT762Ala Asp Val Cys Glu Ile Tyr Ser Asp Val Asp Gly Val Tyr Thr Ala170 175 180GAC CCG CGC ATC GTT CCT AAT GCA CAG AAG CTG GAA AAG CTC AGC TTC810Asp Pro Arg Ile Val Pro Asn Ala Gln Lys Leu Glu Lys Leu Ser Phe185 190 195GAA GAA ATG CTG GAA CTT GCT GCT GTT GGC TCC AAG ATT TTG GTG CTG858Glu Glu Met Leu Glu Leu Ala Ala Val Gly Ser Lys Ile Leu Val Leu200 205 210CGC AGT GTT GAA TAC GCT CGT GCA TTC AAT GTG CCA CTT CGC GTA CGC906Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn Val Pro Leu Arg Val Arg215 220 225 230TCG TCT TAT AGT AAT GAT CCC GGC ACT TTG ATT GCC GGC TCT ATG GAG954Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu Ile Ala Gly Ser Met Glu235 240 245GAT ATT CCT GTG GAA GAA GCA GTC CTT ACC GGT GTC GCA ACC GAC AAG 1002Asp Ile Pro Val Glu Glu Ala Val Leu Thr Gly Val Ala Thr Asp Lys250 255 260TCC GAA GCC AAA GTA ACC GTT CTG GGT ATT TCC GAT AAG CCA GGC GAG 1050Ser Glu Ala Lys Val Thr Val Leu Gly Ile Ser Asp Lys Pro Gly Glu265 270 275GCT GCC AAG GTT TTC CGT GCG TTG GCT GAT GCA GAA ATC AAC ATT GAC 1098Ala Ala Lys Val Phe Arg Ala Leu Ala Asp Ala Glu Ile Asn Ile Asp280 285 290ATG GTT CTG CAG AAC GTC TCC TCT GTG GAA GAC GGC ACC ACC GAC ATC 1146Met Val Leu Gln Asn Val Ser Ser Val Glu Asp Gly Thr Thr Asp Ile295 300 305 310ACG TTC ACC TGC CCT CGC GCT GAC GGA CGC CGT GCG ATG GAG ATC TTG 1194Thr Phe Thr Cys Pro Arg Ala Asp Gly Arg Arg Ala Met Glu Ile Leu315 320 325
AAG AAG CTT CAG GTT CAG GGC AAC TGG ACC AAT GTG CTT TAC GAC GAC 1242Lys Lys Leu Gln Val Gln Gly Asn Trp Thr Asn Val Leu Tyr Asp Asp330 335 340CAG GTC GGC AAA GTC TCC CTC GTG GGT GCT GGC ATG AAG TCT CAC CCA 1290Gln Val Gly Lys Val Ser Leu Val Gly Ala Gly Met Lys Ser His Pro345 350 355GGT GTT ACC GCA GAG TTC ATG GAA GCT CTG CGC GAT GTC AAC GTG AAC 1338Gly Val Thr Ala Glu Phe Met Glu Ala Leu Arg Asp Val Asn Val Asn360 365 370ATC GAA TTG ATT TCC ACC TCT GAG ATC CGC ATT TCC GTG CTG ATC CGT 1386Ile Glu Leu Ile Ser Thr Ser Glu Ile Arg Ile Ser Val Leu Ile Arg375 380 385 390GAA GAT GAT CTG GAT GCT GCT GCA CGT GCA TTG CAT GAG CAG TTC CAG 1434Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala Leu His Glu Gln Phe Gln395 400 405CTG GGC GGC GAA GAC GAA GCC GTC GTT TAT GCA GGC ACC GGA CGC TAA 1482Leu Gly Gly Glu Asp Glu Ala Val Val Tyr Ala Gly Thr Gly Arg410 415 420AGTTTTAAAG GAGTAGTTTT ACAATGACCA CCATCGCAGT TGTTGGTGCA ACCGGCCAGG1542TCGGCCAGGT TATGCGCACC CTTTTGGAAG AGCGCAATTT CCCAGCTGAC ACTGTTCGTT1602TCTTTGCTTC CCCGCGTTCC GCAGGCCGTA AGATTGAATT C1643(2)SEQ ID NO5的信息(i)序列特征(A)长度421个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO5Met Ala Leu Val Val Gln Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala1 5 10 15Glu Arg Ile Arg Asn Val Ala Glu Arg Ile Val Ala Thr Lys Lys Ala20 25 30Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp35 40 45Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg50 55 60Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu65 70 75 80Val Ala Met Ala Ile Glu Ser Leu Gly Ala Glu Ala Gln Ser Phe Thr85 90 95Gly Ser Gln Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg100 105 110Ile Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly115 120 125Lys Ile Cys Ile Val Ala Gly Phe Gln Gly Val Asn Lys Glu Thr Arg130 135 140Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala145 150 155160Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu Ile Tyr Ser Asp Val165 170 175Asp Gly Val Tyr Thr Ala Asp Pro Arg Ile Val Pro Asn Ala Gln Lys180 185 190Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly195 200 205
Ser Lys Ile Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn210 215 220Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu225 230 235 240Ile Ala Gly Ser Met Glu Asp Ile Pro Val Glu Glu Ala Val Leu Thr245 250 255Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly Ile260 265 270Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp275 280 285Ala Glu Ile Asn Ile Asp Met Val Leu Gln Asn Val Ser Ser Val Glu290 295 300Asp Gly Thr Thr Asp Ile Thr Phe Thr Cys Pro Arg Ala Asp Gly Arg305 310 315 320Arg Ala Met Glu Ile Leu Lys Lys Leu Gln Val Gln Gly Asn Trp Thr325 330 335Asn Val Leu Tyr Asp Asp Gln Val Gly Lys Val Ser Leu Val Gly Ala340 345 350Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu355 360 365Arg Asp Val Asn Val Asn Ile Glu Leu Ile Ser Thr Ser Glu Ile Arg370 375 380Ile Ser Val Leu Ile Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala385 390 395 400Leu His Glu Gln Phe Gln Leu Gly Gly Glu Asp Glu Ala Val Val Tyr405 410 415Ala Gly Thr Gly Arg420(2)SEQ ID NO6的信息(i)序列特征(A)长度1643个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(ix)特征(A)名称/关键词CDS(B)位置964..1482(xi)序列描述SEQ ID NO6
TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT 120GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG 180GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT 240GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC 300ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT 360GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG 420CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT 480GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC 540GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC 600AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG 660TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT 720GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT 780AATGCACAGA AGCTGGAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC 840TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC 900GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT 960CCT GTG GAA GAA GCA GTC CTT ACC GGT GTC GCA ACC GAC AAG TCC GAA 1008Met Glu Glu Ala Val Leu Thr Gly Val Ala Thr Asp Lys Ser Glu1 5 10 15GCC AAA GTA ACC GTT CTG GGT ATT TCC GAT AAG CCA GGC GAG GCT GCC 1056Ala Lys Val Thr Val Leu Gly Ile Ser Asp Lys Pro Gly Glu Ala Ala20 25 30AAG GTT TTC CGT GCG TTG GCT GAT GCA GAA ATC AAC ATT GAC ATG GTT 1104Lys Val Phe Arg Ala Leu Ala Asp Ala Glu Ile Asn Ile Asp Met Val35 40 45CTG CAG AAC GTC TCC TCT GTG GAA GAC GGC ACC ACC GAC ATC ACG TTC 1152Leu Gln Asn Val Ser Ser Val Glu Asp Gly Thr Thr Asp Ile Thr Phe50 55 60ACC TGC CCT CGC GCT GAC GGA CGC CGT GCG ATG GAG ATC TTG AAG AAG 1200Thr Cys Pro Arg Ala Asp Gly Arg Arg Ala Met Glu Ile Leu Lys Lys65 70 75CTT CAG GTT CAG GGC AAC TGG ACC AAT GTG CTT TAC GAC GAC CAG GTC 1248Leu Gln Val Gln Gly Asn Trp Thr Asn Val Leu Tyr Asp Asp Gln Val80 85 90 95GGC AAA GTC TCC CTC GTG GGT GCT GGC ATG AAG TCT CAC CCA GGT GTT 1296Gly Lys Val Ser Leu Val Gly Ala Gly Met Lys Ser His Pro Gly Val100 105 110ACC GCA GAG TTC ATG GAA GCT CTG CGC GAT GTC AAC GTG AAC ATC GAA 1344Thr Ala Glu Phe Met Glu Ala Leu Arg Asp Val Asn Val Asn Ile Glu115 120 125TTG ATT TCC ACC TCT GAG ATC CGC ATT TCC GTG CTG ATC CGT GAA GAT 1392Leu Ile Ser Thr Ser Glu Ile Arg Ile Ser Val Leu Ile Arg Glu Asp130 135 140GAT CTG GAT GCT GCT GCA CGT GCA TTG CAT GAG CAG TTC CAG CTG GGC 1440Asp Leu Asp Ala Ala Ala Arg Ala Leu His Glu Gln Phe Gln Leu Gly145 150 155GGC GAA GAC GAA GCC GTC GTT TAT GCA GGC ACC GGA CGC TAAAGTTTTAA 1490Gly Glu Asp Glu Ala Val Val Tyr Ala Gly Thr Gly Arg160 165 170AGGAGTAGTT TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG1550GTTATGCGCA CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT1610TCCCCGCGTT CCGCAGGCCG TAAGATTGAA TTC 1643(2)SEQ ID NO7的信息(i)序列特征(A)长度172个氨基酸
(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO7Met Glu Glu Ala Val Leu Thr Gly Val Ala Thr Asp Lys Ser Glu Ala1 5 10 15Lys Val Thr Val Leu Gly Ile Ser Asp Lys Pro Gly Glu Ala Ala Lys20 25 30Val Phe Arg Ala Leu Ala Asp Ala Glu Ile Asn Ile Asp Met Val Leu35 40 45Gln Asn Val Ser Ser Val Glu Asp Gly Thr Thr Asp Ile Thr Phe Thr50 55 60Cys Pro Arg Ala Asp Gly Arg Arg Ala Met Glu Ile Leu Lys Lys Leu65 70 75 80Gln Val Gln Gly Asn Trp Thr Asn Val Leu Tyr Asp Asp Gln Val Gly85 90 95Lys Val Ser Leu Val Gly Ala Gly Met Lys Ser His Pro Gly Val Thr100 105 110Ala Glu Phe Met Glu Ala Leu Arg Asp Val Asn Val Asn Ile Glu Leu115 120 125Ile Ser Thr Ser Glu Ile Arg Ile Ser Val Leu Ile Arg Glu Asp Asp130 135 140Leu Asp Ala Ala Ala Arg Ala Leu His Glu Gln Phe Gln Leu Gly Gly145 150 155 160Glu Asp Glu Ala Val Val Tyr Ala Gly Thr Gly Arg165 170(2)SEQ ID NO8的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义否(xi)序列描述SEQ ID NO8GGATCCCCAA TCGATACCTG GAA23(2)SEQ ID NO9的信息(i)序列特征(A)长度23个碱基(B)类型核酸
(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO9CGGTTCATCG CCAAGTTTTT CTT(2)SEQ ID NO10的信息(i)序列特征(A)长度2001个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性(iii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(ix)特征(A)名称/关键词CDS(B)位置730..1473(xi)序列描述SEQ ID NO10GGATCCCCAA TCGATACCTG GAACGACAAC CTGATCAGGA TATCCAATGC CTTGAATATT 60GACGTTGAGG AAGGAATCAC CAGCCATCTC AACTGGAAGA CCTGACGCCT GCTGAATTGG 120ATCAGTGGCC CAATCGACCC ACCAACCAGG TTGGCTATTA CCGGCGATAT CAAAAACAAC 180TCGCGTGAAC GTTTCGTGCT CGGCAACGCG GATGCCAGCG ATCGACATAT CGGAGTCACC 240AACTTGAGCC TGCTGCTTCT GATCCATCGA CGGGGAACCC AACGGCGGCA AAGCAGTGGG 300GGAAGGGGAG TTGGTGGACT CTGAATCAGT GGGCTCTGAA GTGGTAGGCG ACGGGGCAGC 360ATCTGAAGGC GTGCGAGTTG TGGTGACCGG GTTAGCGGTT TCAGTTTCTG TCACAACTGG 420AGCAGGACTA GCAGAGGTTG TAGGCGTTGA GCCGCTTCCA TCACAAGCAC TTAAAAGTAA 480AGAGGCGGAA ACCACAAGCG CCAAGGAACT ACCTGCGGAA CGGGCGGTGA AGGGCAACTT 540AAGTCTCATA TTTCAAACAT AGTTCCACCT GTGTGATTAA TCTCCAGAAC GGAACAAACT 600GATGAACAAT CGTTAACAAC ACAGACCAAA ACGGTCAGTT AGGTATGGAT ATCAGCACCT 660TCTGAATGGG TACGTCTAGA CTGGTGGGCG TTTGAAAAAC TCTTCGCCCC ACGAAAATGA 720AGGAGCATA ATG GGA ATC AAG GTT GGC GTT CTC GGA GCC AAA GGC CGT 768Met Gly Ile Lys Val Gly Val Leu Gly Ala Lys Gly Arg1 5 10
GTT GGT CAA ACT TT GTG GCA GCA GTC AAT GAG TCC GAC G GTG GAG 816Val Gly Gln Thr Ile Val Ala Ala Val Asn Glu Ser Asp Asp Leu Glu15 20 25CTT GTT GCA GAG ATC GGC GTC GAC GAT GAT TTG AGC CTT CTG GTA GAC 864Leu Val Ala Glu Ile Gly Val Asp Asp Asp Leu Ser Leu Leu Val Asp30 35 40 45AAC GGC GCT GAA GTT GTC GTT GAC TTC ACC ACT CCT AAC GCT GTG ATG 912Asn Gly Ala Glu Val Val Val Asp Phe Thr Thr Pro Asn Ala Val Met50 55 60GGC AAC CTG GAG TTC TGC ATC AAC AAC GGC ATT TCT GCG GTT GTT GGA 960Gly Asn Leu Glu Phe Cys Ile Asn Asn Gly Ile Ser Ala Val Val Gly65 70 75ACC ACG GGC TTC GAT GAT GCT CGT TTG GAG CAG GTT CGC GCC TGG CTT 1008Thr Thr Gly Phe Asp Asp Ala Arg Leu Glu Gln Val Arg Ala Trp Leu80 85 90GAA GGA AAA GAC AAT GTC GGT GTT CTG ATC GCA CCT AAC TTT GCT ATG 1056Glu Gly Lys Asp Asn Val Gly Val Leu Ile Ala Pro Asn Phe Ala Ile95 100 105TCT GCG GTG TTG ACC ATG GTC TTT TCC AAG CAG GCT GCC CGC TTC TTC 1104Ser Ala Val Leu Thr Met Val Phe Ser Lys Gln Ala Ala Arg Phe Phe110 115 120 125GAA TCA GCT GAA GTT ATT GAG CTG CAC CAC CCC AAC AAG CTG GAT GCA 1152Glu Ser Ala Glu Val Ile Glu Leu His His Pro Asn Lys Leu Asp Ala130 135 140CCT TCA GGC ACC GCG ATC CAC ACT GCT CAG GGC ATT GCT GCG GCA CGC 1200Pro Ser Gly Thr Ala Ile His Thr Ala Gln Gly Ile Ala Ala Ala Arg145150 155AAA GAA GCA GGC ATG GAC GCA CAG CCA GAT GCG ACC GAG CAG GCA CTT 1248Lys Glu Ala Gly Met Asp Ala Gln Pro Asp Ala Thr Glu Gln Ala Leu160 165 170GAG GGT TCC CGT GGC GCA AGC GTA GAT GGA ATC CCA GTT CAC GCA GTC 1296Glu Gly Ser Arg Gly Ala Ser Val Asp Gly Ile Pro Val His Ala Val175 180 185CGC ATG TCC GGC ATG GTT GCT CAC GAG CAA GTT ATC TTT GGC ACC CAG 1344Arg Met Ser Gly Met Val Ala His Glu Gln Val Ile Phe Gly Thr Gln190 195 200 205GGT CAG ACC TTG ACC ATC AAG CAG GAC TCC TAT GAT CGC AAC TCA TTT 1392Gly Gln Thr Leu Thr Ile Lys Gln Asp Ser Tyr Asp Arg Asn Ser Phe210 215 220GCA CCA GGT GTC TTG GTG GGT GTG CGC AAC ATT GCA CAG CAC CCA GGC 1440Ala Pro Gly Val Leu Val Gly Val Arg Asn Ile Ala Gln His Pro Gly225 230 235CTA GTC GTA GGA CTT GAG CAT TAC CTA GGC CTG TAAAGGCTCA TTTCAGCAGC1493Leu Val Val Gly Leu Glu His Tyr Leu Gly Leu240 245GGGTGGAATT TTTTAAAAGG AGCGTTTAAA GGCTGTGGCC GAACAAGTTA AATTGAGCGT1553GGAGTTGATA GCGTGCAGTT CTTTTACTCC ACCCGCTGAT GTTGAGTGGT CAACTGATGT1613TGAGGGCGCG GAAGCACTCG TCGAGTTTGC GGGTCGTGCC TGCTACGAAA CTTTTGATAA1673GCCGAACCCT CGAACTGCTT CCAATGCTGC GTATCTGCGC CACATCATGG AAGTGGGGCA1733CACTGCTTTG CTTGAGCATG CCAATGCCAC GATGTATATC CGAGGCATTT CTCGGTCCGC1793GACCCATGAA TTGGTCCGAC ACCGCCATTT TTCCTTCTCT CAACTGTCTC AGCGTTTCGT1853GCACAGCGGA GAATCGGAAG TAGTGGTGCC CACTCTCATC GATGAAGATC CGCAGTTGCG1913TGAACTTTTC ATGCACGCCA TGGATGAGTC TCGGTTCGCT TTCAATGAGC TGCTTAATGC1973GCTGGAAGAA AAACTTGGCG ATGAACCG 2001(2)SEQ ID NO11的信息(i)序列特征(A)长度248个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质
(xi)序列描述SEQ ID NO11Met Gly Ile Lys Val Gly Val Leu Gly Ala Lys Gly Arg Val Gly Gln1 5 10 15Thr Ile Val Ala Ala Val Asn Glu Ser Asp Asp Leu Glu Leu Val Ala20 25 30Glu Ile Gly Val Asp Asp Asp Leu Ser Leu Leu Val Asp Asn Gly Ala35 40 45Glu Val Val Val Asp Phe Thr Thr Pro Asn Ala Val Met Gly Asn Leu50 55 60Glu Phe Cys Ile Asn Asn Gly Ile Ser Ala Val Val Gly Thr Thr Gly65 70 75 80Phe Asp Asp Ala Arg Leu Glu Gln Val Arg Ala Trp Leu Glu Gly Lys85 90 95Asp Asn Val Gly Val Leu Ile Ala Pro Asn Phe Ala Ile Ser Ala Val100 105 110Leu Thr Met Val Phe Ser Lys Gln Ala Ala Arg Phe Phe Glu Ser Ala115 120 125Glu Val Ile Glu Leu His His Pro Asn Lys Leu Asp Ala Pro Ser Gly130 135 140Thr Ala Ile His Thr Ala Gln Gly Ile Ala Ala Ala Arg Lys Glu Ala145 150 155 160Gly Met Asp Ala Gln Pro Asp Ala Thr Glu Gln Ala Leu Glu Gly Ser165 170 175Arg Gly Ala Ser Val Asp Gly Ile Pro Val His Ala Val Arg Met Ser180 185 190Gly Met Val Ala His Glu Gln Val Ile Phe Gly Thr Gln Gly Gln Thr195 200 205Leu Thr Ile Lys Gln Asp Ser Tyr Asp Arg Asn Ser Phe Ala Pro Gly210 215 220Val Leu Val Gly Val Arg Asn Ile Ala Gln His Pro Gly Leu Val Val225 230 235 240Gly Leu Glu His Tyr Leu Gly Leu245(2)SEQ ID NO12的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义否(xi)序列描述SEQ ID NO12CTCGACGGAT CGCAATGGC AAC 23(2)SEQ ID NO13的信息(i)序列特征
(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO13GGATCCTTGA GCACCTTGCG CAG23(2)SEQ ID NO14的信息(i)序列特征(A)长度1411个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(ix)特征(A)名称/关键词CDS(B)位置311..1213(xi)序列描述SEQ ID NO14CTCTCGATAT CGAGAGAGAA GCAGCGCCAC GGTTTTTCGG TGATTTTGAG ATTGAAACTT 60TGGCAGACGG ATCGCAAATG GCAACAAGCC CGTATGTCAT GGACTTTTAA CGCAAAGCTC 120ACACCCACGA GCTAAAAATT CATATAGTTA AGACAACATT TTTGGCTGTA AAAGACAGCC 180GTAAAAACCT CTTGCTCATG TCAATTGTTC TTATCGGAAT GTGGCTTGGG CGATTGTTAT 240GCAAAAGTTG TTAGGTTTTT TGCGGGGTTG TTTAACCCCC AAATGAGGGA AGAAGGTAAC 300CTTGAACTCT ATG AGC ACA GGT TTA ACA GCT AAG ACC GGA GTA GAG CAC349
Met Ser Thr Gly Leu Thr Ala Lys Thr Gly Val Glu His1 5 10TTC GGC ACC GTT GGA GTA GCA ATG GTT ACT CCA TTC ACG GAA TCC GGA 397Phe Gly Thr Val Gly Val Ala Met Val Thr Pro Phe Thr Glu Ser Gly15 20 25GAC ATC GAT ATC GCT GCT GGC CGC GAA GTC GCG GCT TAT TTG GTT GAT 445Asp Ile Asp Ile Ala Ala Gly Arg Glu Val Ala Ala Tyr Leu Val Asp30 35 40 45AAG GGC TTG GAT TCT TTG GTT CTC GCG GGC ACC ACT GGT GAA TCC CCA 493Lys Gly Leu Asp Ser Leu Val Leu Ala Gly Thr Thr Gly Glu Ser Pro50 55 60ACG ACA ACC GCC GCT GAA AAA CTA GAA CTG CTC AAG GCC GTT CGT GAG 541Thr Thr Thr Ala Ala Glu Lys Leu Glu Leu Leu Lys Ala Val Arg Glu65 70 75GAA GTT GGG GAT CGG GCG AAC GTC ATC GCC GGT GTC GGA ACC AAC AAC 589Glu Val Gly Asp Arg Ala Asn Val Ile Ala Gly Val Gly Thr Asn Asn80 85 90ACG CGG ACA TCT GTG GAA CTT GCG GAA GCT GCT GCT TCT GCT GGC GCA 637Thr Arg Thr Ser Val Glu Leu Ala Glu Ala Ala Ala Ser Ala Gly Ala95 100 105GAC GGC CTT TTA GTT GTA ACT CCT TAT TAC TCC AAG CCG AGC CAA GAG 685Asp Gly Leu Leu Val Val Thr Pro Tyr Tyr Ser Lys Pro Ser Gln Glu110 115 120 125GGA TTG CTG GCG CAC TTC GGT GCA ATT GCT GCA GCA ACA GAG GTT CCA 733Gly Leu Leu Ala His Phe Gly Ala Ile Ala Ala Ala Thr Glu Val Pro130 135 140ATT TGT CTC TAT GAC ATT CCT GGT CGG TCA GGT ATT CCA ATT GAG TCT 781Ile Cys Leu Tyr Asp Ile Pro Gly Arg Ser Gly Ile Pro Ile Glu Ser145 150 155GAT ACC ATG AGA CGC CTG AGT GAA TTA CCT ACG ATT TTG GCG GTC AAG 829Asp Thr Met Arg Arg Leu Ser Glu Leu Pro Thr Ile Leu Ala Val Lys160 165 170GAC GCC AAG GGT GAC CTC GTT GCA GCC ACG TCA TTG ATC AAA GAA ACG 877Asp Ala Lys Gly Asp Leu Val Ala Ala Thr Ser Leu Ile Lys Glu Thr175 180 185GGA CTT GCC TGG TAT TCA GGC GAT GAC CCA CTA AAC CTT GTT TGG CTT 925Gly Leu Ala Trp Tyr Ser Gly Asp Asp Pro Leu Asn Leu Val Trp Leu190 195 200 205GCT TTG GGC GGA TCA GGT TTC ATT TCC GTA ATT GGA CAT GCA GCC CCC 973Ala Leu Gly Gly Ser Gly Phe Ile Ser Val Ile Gly His Ala Ala Pro210 215 220ACA GCA TTA CGT GAG TTG TAC ACA AGC TTC GAG GAA GGC GAC CTC GTC 1021Thr Ala Leu Arg Glu Leu Tyr Thr Ser Phe Glu Glu Gly Asp Leu Val225 230 235CGT GCG CGG GAA ATC AAC GCC AAA CTA TCA CCG CTG GTA GCT GCC CAA 1069Arg Ala Arg Glu Ile Asn Ala Lys Leu Ser Pro Leu Val Ala Ala Gln240 245 250GGT CGC TTG GGT GGA GTC AGC TTG GCA AAA GCT GCT CTG CGT CTG CAG 1117Gly Arg Leu Gly Gly Val Ser Leu Ala Lys Ala Ala Leu Arg Leu Gln255 260 265GGC ATC AAC GTA GGA GAT CCT CGA CTT CCA ATT ATG GCT CCA AAT GAG 1165Gly Ile Asn Val Gly Asp Pro Arg Leu Pro Ile Met Ala Pro Asn Glu270 275 280 285CAG GAA CTT GAG GCT CTC CGA GAA GAC ATG AAA AAA GCT GGA GTT CTA 1213Gln Glu Leu Glu Ala Leu Arg Glu Asp Met Lys Lys Ala Gly Val Leu290 295 300
TAAATATGAA TGATTCCCGA AATCGCGGCC GGAAGGTTAC CCGCAAGGCG GCCCACCAGA 1273AGCTGGTCAG GAAAACCATC TGGATACCCC TGTCTTTCAG GCACCAGATG CTTCCTCTAA 1333CCAGAGCGCT GTAAAAGCTG AGACCGCCGG AAACGACAAT CGGGATGCTG CGCAAGGTGC 1393TCAAGGATCC CAACATTC1411(2)SEQ ID NO15的信息(i)序列特征(A)长度301个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO15Met Ser Thr Gly Leu Thr Ala Lys Thr Gly Val Glu His Phe Gly Thr1 5 10 15Val Gly Val Ala Met Val Thr Pro Phe Thr Glu Ser Gly Asp Ile Asp20 25 30Ile Ala Ala Gly Arg Glu Val Ala Ala Tyr Leu Val Asp Lys Gly Leu35 40 45Asp Ser Leu Val Leu Ala Gly Thr Thr Gly Glu Ser Pro Thr Thr Thr50 55 60Ala Ala Glu Lys Leu Glu Leu Leu Lys Ala Val Arg Glu Glu Val Gly65 70 75 80Asp Arg Ala Asn Val Ile Ala Gly Val Gly Thr Asn Asn Thr Arg Thr85 90 95Ser Val Glu Leu Ala Glu Ala Ala Ala Ser Ala Gly Ala Asp Gly Leu100 105 110Leu Val Val Thr Pro Tyr Tyr Ser Lys Pro Ser Gln Glu Gly Leu Leu115 120 125Ala His Phe Gly Ala Ile Ala Ala Ala Thr Glu Val Pro Ile Cys Leu130 135 140Tyr Asp Ile Pro Gly Arg Ser Gly Ile Pro Ile Glu Ser Asp Thr Met145 150 155 160Arg Arg Leu Ser Glu Leu Pro Thr Ile Leu Ala Val Lys Asp Ala Lys165 170 175Gly Asp Leu Val Ala Ala Thr Ser Leu Ile Lys Glu Thr Gly Leu Ala180 185 190Trp Tyr Ser Gly Asp Asp Pro Leu Asn Leu Val Trp Leu Ala Leu Gly195 200 205Gly Ser Gly Phe Ile Ser Val Ile Gly His Ala Ala Pro Thr Ala Leu210 215 220Arg Glu Leu Tyr Thr Ser Phe Glu Glu Gly Asp Leu Val Arg Ala Arg225 230 235 240Glu Ile Asn Ala Lys Leu Ser Pro Leu Val Ala Ala Gln Gly Arg Leu245 250 255Gly Gly Val Ser Leu Ala Lys Ala Ala Leu Arg Leu Gln Gly Ile Asn260 265 270Val Gly Asp Pro Arg Leu Pro Ile Met Ala Pro Asn Glu Gln Glu Leu275 280 285Glu Ala Leu Arg Glu Asp Met Lys Lys Ala Gly Val Leu290 295 300
(2)SEQ ID NO的信息16(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义否(xi)序列描述SEQ ID NO16GTGGAGCCGA CCATTCCGCG AGG 23(2)SEQ ID NO17的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO17CCAAACCGC CCTCCACGGC GAA 23(2)SEQ ID NO18的信息(i)序列特征(A)长度3579个碱基(B)类型核酸
(C)链型双链(D)拓扑结构线性(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(ix)特征(A)名称/关键词CDS(B)位置533..2182(ix)特征(A)名称/关键词CDS(B)位置2188..3522(xi)序列描述SEQ ID NO18GTGGAGCCGA CCATTCCGCG AGGCTGCACT GCAACGAGGT CGTAGTTTTG GTACATGGCT 60TCTGGCCAGT TCATGGATTG GCTGCCGAAG AAGCTATAGG CATCGCACCA GGGCCACGGA120GTTACGGAAG ATGGTGCCGT GCTTTTCGCC TTGGGCAGGG ACCTTGACAA AGCCCACGCT180GATATCGCCA AGTGAGGGAT CAGAATAGTG CATGGGCACG TCGATGCTGC CACATTGAGC240GGAGGCAATA TCTACCTGAG GTGGGCATTC TTCCCAGCGG ATGTTTTCTT GCGCTGCTGC300
AGTGGGCATT GATACCAAAA AGGGGCTAAG CGCAGTCGAG GCGGCAAGAA CTGCTACTAC 360CCTTTTTATT GTCGAACGGG GCATTACGGC TCCAAGGACG TTTGTTTTCT GGGTCAGTTA 420CCCCAAAAAG CATATACAGA GACCAATGAT TTTTCATTAA AAAGGCAGGG ATTTGTTATA 480AGTATGGGTC GTATTCTGTG CGACGGGTGT ACCTCGGCTA GAATTTCTCC CC ATG 535Met1ACA CCA GCT GAT CTC GCA ACA TTG ATT AAA GAG ACC GCG GTA GAG GTT583Thr Pro Ala Asp Leu Ala Thr Leu Ile Lys Glu Thr Ala Val Glu Val5 10 15TTG ACC TCC CGC GAG CTC GAT ACT TCT GTT CTT CCG GAG CAG GTA GTT631Leu Thr Ser Arg Glu Leu Asp Thr Ser Val Leu Pro Glu Gln Val Val20 25 30GTG GAG CGT CCG CGT AAC CCA GAG CAC GGC GAT TAC GCC ACC AAC ATT679Val Glu Arg Pro Arg Asn Pro Glu His Gly Asp Tyr Ala Thr Asn Ile35 40 45GCA TTG CAG GTG GCT AAA AAG GTC GGT CAG AAC CCT CGG GAT TTG GCT727Ala Leu Gln Val Ala Lys Lys Val Gly Gln Asn Pro Arg Asp Leu Ala50 55 60 65ACC TGG CTG GCA GAG GCA TTG GCT GCA GAT GAC GCC ATT GAT TCT GCT775Thr Trp Leu Ala Glu Ala Leu Ala Ala Asp Asp Ala Ile Asp Ser Ala70 75 80GAA ATT GCT GGC CCA GGC TTT TTG AAC ATT CGC CTT GCT GCA GCA GCA823Glu Ile Ala Gly Pro Gly Phe Leu Asn Ile Arg Leu Ala Ala Ala Ala85 90 95CAG GGT GAA ATT GTG GCC AAG ATT CTG GCA CAG GGC GAG ACT TTC GGA871Gln Gly Glu Ile Val Ala Lys Ile Leu Ala Gln Gly Glu Thr Phe Gly100 105 110AAC TCC GAT CAC CTT TCC CAC TTG GAC GTG AAC CTC GAG TTC GTT TCT919Asn Ser Asp His Leu Ser His Leu Asp Val Asn Leu Glu Phe Val Ser115 120 125GCA AAC CCA ACC GGA CCT ATT CAC CTT GGC GGA ACC CGC TGG GCT GCC967Ala Asn Pro Thr Gly Pro Ile His Leu Gly Gly Thr Arg Trp Ala Ala130 135 140 145GTG GGT GAC TCT TTG GGT CGT GTG CTG GAG GCT TCC GGC GCG AAA GTG 1015Val Gly Asp Ser Leu Gly Arg Val Leu Glu Ala Ser Gly Ala Lys Val150 155 160ACC CGC GAA TAC TAC TTC AAC GAT CAC GGT CGC CAG ATC GAT CGT TTC 1063Thr Arg Glu Tyr Tyr Phe Asn Asp His Gly Arg Gln Ile Asp Arg Phe165 170 175GCT TTG TCC CTT CTT GCA GCG GCG AAG GGC GAG CCA ACG CCA GAA GAC 1111Ala Leu Ser Leu Leu Ala Ala Ala Lys Gly Glu Pro Thr Pro Glu Asp180 185 190GGT TAT GGC GGC GAA TAC ATT AAG GAA ATT GCG GAG GCA ATC GTC GAA 1159Gly Tyr Gly Gly Glu Tyr Ile Lys Glu Ile Ala Glu Ala Ile Val Glu195 200 205AAG CAT CCT GAA GCG TTG GCT TTG GAG CCT GCC GCA ACC CAG GAG CTT 1207Lys His Pro Glu Ala Leu Ala Leu Glu Pro Ala Ala Thr Gln Glu Leu210 215 220 225TTC CGC GCT GAA GGC GTG GAG ATG ATG TTC GAG CAC ATC AAA TCT TCC 1255Phe Arg Ala Glu Gly Val Glu Met Met Phe Glu His Ile Lys Ser Ser230 235 240CTG CAT GAG TTC GGC ACC GAT TTC GAT GTC TAC TAC CAC GAG AAC TCC 1303Leu His Glu Phe Gly Thr Asp Phe Asp Val Tyr Tyr His Glu Asn Ser245 250 255CTG TTC GAG TCC GGT GCG GTG GAC AAG GCC GTG CAG GTG CTG AAG GAC 1351Leu Phe Glu Ser Gly Ala Val Asp Lys Ala Val Gln Val Leu Lys Asp260 265 270AAC GGC AAC CTG TAC GAA AAC GAG GGC GCT TGG TGG CTG CGT TCC ACC 1399
Asn Gly Asn Leu Tyr Glu Asn Glu Gly Ala Trp Trp Leu Arg Ser Thr275 280 285GAA TTC GGC GAT GAC AAA GAC CGC GTG GTG ATC AAG TCT GAC GGC GAC 1447Glu Phe Gly Asp Asp Lys Asp Arg Val Val Ile Lys Ser Asp Gly Asp290 295 300 305GCA GCC TAC ATC GCT GGC GAT ATC GCG TAC GTG GCT GAT AAG TTC TCC 1495Ala Ala Tyr Ile Ala Gly Asp Ile Ala Tyr Val Ala Asp Lys Phe Ser310 315 320CGC GGA CAC AAC CTA AAC ATC TAC ATG TTG GGT GCT GAC CAC CAT GGT 1543Arg Gly His Asn Leu Asn Ile Tyr Met Leu Gly Ala Asp His His Gly325 330 335TAC ATC GCG CGC CTG AAG GCA GCG GCG GCG GCA CTT GGC TAC AAG CCA 1591Tyr Ile Ala Arg Leu Lys Ala Ala Ala Ala Ala Leu Gly Tyr Lys Pro340 345 350GAA GGC GTT GAA GTC CTG ATT GGC CAG ATG GTG AAC CTG CTT CGC GAC 1639Glu Gly Val Glu Val Leu Ile Gly Gln Met Val Asn Leu Leu Arg Asp355 360 365GGC AAG GCA GTG CGT ATG TCC AAG CGT GCA GGC ACC GTG GTC ACC CTA 1687Gly Lys Ala Val Arg Met Ser Lys Arg Ala Gly Thr Val Val Thr Leu370 375 380 385GAT GAC CTC GTT GAA GCA ATC GGC ATC GAT GCG GCG CGT TAC TCC CTG 1735Asp Asp Leu Val Glu Ala Ile Gly Ile Asp Ala Ala Arg Tyr Ser Leu390 395 400ATC CGT TCC TCC GTG GAT TCT TCC CTG GAT ATC GAT CTC GGC CTG TGG 1783Ile Arg Ser Ser Val Asp Ser Ser Leu Asp Ile Asp Leu Gly Leu Trp405 410 415GAA TCC CAG TCC TCC GAC AAC CCT GTG TAC TAC GTG CAG TAC GGA CAC 1831Glu Ser Gln Ser Ser Asp Asn Pro Val Tyr Tyr Val Gln Tyr Gly His420 425 430GCT CGT CTG TGC TCC ATC GCG CGC AAG GCA GAG ACC TTG GGT GTC ACC 1879Ala Arg Leu Cys Ser Ile Ala Arg Lys Ala Glu Thr Leu Gly Val Thr435 440 445GAG GAA GGC GCA GAC CTA TCT CTA CTG ACC CAC GAC CGC GAA GGC GAT 1927Glu Glu Gly Ala Asp Leu Ser Leu Leu Thr His Asp Arg Glu Gly Asp450 455 460 465CTC ATC CGC ACA CTC GGA GAG TTC CCA GCA GTG GTG AAG GCT GCC GCT 1975Leu Ile Arg Thr Leu Gly Glu Phe Pro Ala Val Val Lys Ala Ala Ala470 475 480GAC CTA CGT GAA CCA CAC CGC ATT GCC CGC TAT GCT GAG GAA TTA GCT 2023Asp Leu Arg Glu Pro His Arg Ile Ala Arg Tyr Ala Glu Glu Leu Ala485 490 495GGA ACT TTC CAC CGC TTC TAC GAT TCC TGC CAC ATC CTT CCA AAG GTT 2071Gly Thr Phe His Arg Phe Tyr Asp Ser Cys His Ile Leu Pro Lys Val500 505 510GAT GAG GAT ACG GCA CCA ATC CAC ACA GCA CGT CTG GCA CTT GCA GCA 2119Asp Glu Asp Thr Ala Pro Ile His Thr Ala Arg Leu Ala Leu Ala Ala515 520 525GCA ACC CGC CAG ACC CTC GCT AAC GCC CTG CAC CTG GTT GGC GTT TCC 2167Ala Thr Arg Gln Thr Leu Ala Asn Ala Leu His Leu Val Gly Val Ser530 535 540 545GCA CCG GAG AAG ATG TAACA ATG GCT ACA GTT GAA AAT TTC AAT GAA 2214Ala Pro Glu Lys Met Met Ala Thr Val Glu Asn Phe Asn Glu550 1 5CTT CCC GCA CAC GTA TGG CCA CGC AAT GCC GTG CGC CAA GAA GAC GGC 2262Leu Pro Ala His Val Trp Pro Arg Asn Ala Val Arg Gln Glu Asp Gly10 15 20 25GTT GTC ACC GTC GCT GGT GTG CCT CTG CCT GAC CTC GCT GAA GAA TAC 2310Val Val Thr Val Ala Gly Val Pro Leu Pro Asp Leu Ala Glu Glu Tyr
30 35 40GGA ACC CCA CTG TTC GTA GTC GAC GAG GAC GAT TTC CGT TCC CGC TGT 2358Gly Thr Pro Leu Phe Val Val Asp Glu Asp Asp Phe Arg Ser Arg Cys45 50 55CGC GAC ATG GCT ACC GCA TTC GGT GGA CCA GGC AAT GTG CAC TAC GCA 2406Arg Asp Met Ala Thr Ala Phe Gly Gly Pro Gly Asn Val His Tyr Ala60 65 70TCT AAA GCG TTC CTG ACC AAG ACC ATT GCA CGT TGG GTT GAT GAA GAG 2454Ser Lys Ala Phe Leu Thr Lys Thr Ile Ala Arg Trp Val Asp Glu Glu75 80 85GGG CTG GCA CTG GAC ATT GCA TCC ATC AAC GAA CTG GGC ATT GCC CTG 2502Gly Leu Ala Leu Asp Ile Ala Ser Ile Asn Glu Leu Gly Ile Ala Leu90 95 100 105GCC GCT GGT TTC CCC GCC AGC CGT ATC ACC GCG CAC GGC AAC AAC AAA 2550Ala Ala Gly Phe Pro Ala Ser Arg Ile Thr Ala His Gly Asn Asn Lys110 115 120GGC GTA GAG TTC CTG CGC GCG TTG GTT CAA AAC GGT GTG GGA CAC GTG 2598Gly Val Glu Phe Leu Arg Ala Leu Val Gln Asn Gly Val Gly His Val125 130 135GTG CTG GAC TCC GCA CAG GAA CTA GAA CTG TTG GAT TAC GTT GCC GCT 2646Val Leu Asp Ser Ala Gln Glu Leu Glu Leu Leu Asp Tyr Val Ala Ala140 145 150GGT GAA GGC AAG ATT CAG GAC GTG TTG ATC CGC GTA AAG CCA GGC ATC 2694Gly Glu Gly Lys Ile Gln Asp Val Leu Ile Arg Val Lys Pro Gly Ile155 160 165GAA GCA CAC ACC CAC GAG TTC ATC GCC ACT AGC CAC GAA GAC CAG AAG 2742Glu Ala His Thr His Glu Phe Ile Ala Thr Ser His Glu Asp Gln Lys170 175 180 185TTC GGA TTC TCC CTG GCA TCC GGT TCC GCA TTC GAA GCA GCA AAA GCC 2790Phe Gly Phe Ser Leu Ala Ser Gly Ser Ala Phe Glu Ala Ala Lys Ala190 195 200GCC AAC AAC GCA GAA AAC CTG AAC CTG GTT GGC CTG CAC TGC CAC GTT 2838Ala Asn Asn Ala Glu Asn Leu Asn Leu Val Gly Leu His Cys His Val205 210 215GGT TCC CAG GTG TTC GAC GCC GAA GGC TTC AAG CTG GCA GCA GAA CGC 2886Gly Ser Gln Val Phe Asp Ala Glu Gly Phe Lys Leu Ala Ala Glu Arg220 225 230GTG TTG GGC CTG TAC TCA CAG ATC CAC AGC GAA CTG GGC GTT GCC CTT 2934Val Leu Gly Leu Tyr Ser Gln Ile His Ser Glu Leu Gly Val Ala Leu235 240 245CCT GAA CTG GAT CTC GGT GGC GGA TAC GGC ATT GCC TAT ACC GCA GCT 2982Pro Glu Leu Asp Leu Gly Gly Gly Tyr Gly Ile Ala Tyr Thr Ala Ala250 255 260 265GAA GAA CCA CTC AAC GTC GCA GAA GTT GCC TCC GAC CTG CTC ACC GCA 3030Glu Glu Pro Leu Asn Val Ala Glu Val Ala Ser Asp Leu Leu Thr Ala270 275 280GTC GGA AAA ATG GCA GCG GAA CTA GGC ATC GAC GCA CCA ACC GTG CTT 3078Val Gly Lys Met Ala Ala Glu Leu Gly Ile Asp Ala Pro Thr Val Leu285 290 295GTT GAG CCC GGC CGC GCT ATC GCA GGC CCC TCC ACC GTG ACC ATC TAC 3126Val Glu Pro Gly Arg Ala Ile Ala Gly Pro Ser Thr Val Thr Ile Tyr300 305 310GAA GTC GGC ACC ACC AAA GAC GTC CAC GTA GAC GAC GAC AAA ACC CGC 3174Glu Val Gly Thr Thr Lys Asp Val His Val Asp Asp Asp Lys Thr Arg315 320 325CGT TAC ATC GCC GTG GAC GGA GGC ATG TCC GAC AAC ATC CGC CCA GCA 3222Arg Tyr Ile Ala Val Asp Gly Gly Met Ser Asp Asn Ile Arg Pro Ala330 335 340 345
CTC TAC GGC TCC GAA TAC GAC GCC CGC GTA GTA TCC CGC TTC GCC GAA 3270Leu Tyr Gly Ser Glu Tyr Asp Ala Arg Val Val Ser Arg Phe Ala Glu350 355 360GGA GAC CCA GTA AGC ACC CGC ATC GTG GGC TCC CAC TGC GAA TCC GGC 3318Gly Asp Pro Val Ser Thr Arg Ile Val Gly Ser His Cys Glu Ser Gly365 370 375GAT ATC CTG ATC AAC GAT GAA ATC TAC CCA TCT GAC ATC ACC AGC GGC 3366Asp Ile Leu Ile Asn Asp Glu Ile Tyr Pro Ser Asp Ile Thr Ser Gly380 385 390GAC TTC CTT GCA CTC GCA GCC ACC GGC GCA TAC TGC TAC GCC ATG AGC 3414Asp Phe Leu Ala Leu Ala Ala Thr Gly Ala Tyr Cys Tyr Ala Met Ser395 400 405TCC CGC TAC AAC GCC TTC ACA CGG CCC GCC GTC GTG TCC GTC CGC GCT 3462Ser Arg Tyr Asn Ala Phe Thr Arg Pro Ala Val Val Ser Val Arg Ala410 415 420 425GGC AGC TCC CGC CTC ATG CTG CGC CGC GAA ACG CTC GAC GAC ATC CTC 3510Gly Ser Ser Arg Leu Met Leu Arg Arg Glu Thr Leu Asp Asp Ile Leu430 435 440TCA CTA GAG GCA TAACGCTTTT CGACGCCTGA CCCCGCCCTT CACCTTCGCC 3562Ser Leu Glu Ala445GTGGAGGGCG GTTTTGG 3579(2)SEQ ID NO19的信息(i)序列特征(A)长度550个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO19Met Thr Pro Ala Asp Leu Ala Thr Leu Ile Lys Glu Thr Ala Val Glu1 5 10 15Val Leu Thr Ser Arg Glu Leu Asp Thr Ser Val Leu Pro Glu Gln Val20 25 30Val Val Glu Arg Pro Arg Asn Pro Glu His Gly Asp Tyr Ala Thr Asn35 40 45Ile Ala Leu Gln Val Ala Lys Lys Val Gly Gln Asn Pro Arg Asp Leu50 55 60Ala Thr Trp Leu Ala Glu Ala Leu Ala Ala Asp Asp Ala Ile Asp Ser65 70 75 80Ala Glu Ile Ala Gly Pro Gly Phe Leu Asn Ile Arg Leu Ala Ala Ala85 90 95Ala Gln Gly Glu Ile Val Ala Lys Ile Leu Ala Gln Gly Glu Thr Phe100 105 110Gly Asn Ser Asp His Leu Ser His Leu Asp Val Asn Leu Glu Phe Val115 120 125Ser Ala Asn Pro Thr Gly Pro Ile His Leu Gly Gly Thr Arg Trp Ala130 135 140Ala Val Gly Asp Ser Leu Gly Arg Val Leu Glu Ala Ser Gly Ala Lys145 150 155 160Val Thr Arg Glu Tyr Tyr Phe Asn Asp His Gly Arg Gln Ile Asp Arg165 170 175Phe Ala Leu Ser Leu Leu Ala Ala Ala Lys Gly Glu Pro Thr Pro Glu
180 185 190Asp Gly Tyr Gly Gly Glu Tyr Ile Lys Glu Ile Ala Glu Ala Ile Val195 200 205Glu Lys His Pro Glu Ala Leu Ala Leu Glu Pro Ala Ala Thr Gln Glu210 215 220Leu Phe Arg Ala Glu Gly Val Glu Met Met Phe Glu His Ile Lys Ser225 230 235 240Ser Leu His Glu Phe Gly Thr Asp Phe Asp Val Tyr Tyr His Glu Asn245 250 255Ser Leu Phe Glu Ser Gly Ala Val Asp Lys Ala Val Gln Val Leu Lys260 265 270Asp Asn Gly Asn Leu Tyr Glu Asn Glu Gly Ala Trp Trp Leu Arg Ser275 280 285Thr Glu Phe Gly Asp Asp Lys Asp Arg Val Val Ile Lys Ser Asp Gly290 295 300Asp Ala Ala Tyr Ile Ala Gly Asp Ile Ala Tyr Val Ala Asp Lys Phe305 310 315 320Ser Arg Gly His Asn Leu Asn Ile Tyr Met Leu Gly Ala Asp His His325 330 335Gly Tyr Ile Ala Arg Leu Lys Ala Ala Ala Ala Ala Leu Gly Tyr Lys340 345 350Pro Glu Gly Val Glu Val Leu Ile Gly Gln Met Val Asn Leu Leu Arg355 360 365Asp Gly Lys Ala Val Arg Met Ser Lys Arg Ala Gly Thr Val Val Thr370 375 380Leu Asp Asp Leu Val Glu Ala Ile Gly Ile Asp Ala Ala Arg Tyr Ser385 390 395 400Leu Ile Arg Ser Ser Val Asp Ser Ser Leu Asp Ile Asp Leu Gly Leu405 410 415Trp Glu Ser Gln Ser Ser Asp Asn Pro Val Tyr Tyr Val Gln Tyr Gly420 425 430His Ala Arg Leu Cys Ser Ile Ala Arg Lys Ala Glu Thr Leu Gly Val435 440 445Thr Glu Glu Gly Ala Asp Leu Ser Leu Leu Thr His Asp Arg Glu Gly450 455 460Asp Leu Ile Arg Thr Leu Gly Glu Phe Pro Ala Val Val Lys Ala Ala465 470 475 480Ala Asp Leu Arg Glu Pro His Arg Ile Ala Arg Tyr Ala Glu Glu Leu485 490 495Ala Gly Thr Phe His Arg Phe Tyr Asp Ser Cys His Ile Leu Pro Lys500 505 510Val Asp Glu Asp Thr Ala Pro Ile His Thr Ala Arg Leu Ala Leu Ala515 520 525Ala Ala Thr Arg Gln Thr Leu Ala Asn Ala Leu His Leu Val Gly Val530 535 540Ser Ala Pro Glu Lys Met545 550(2)SEQ ID NO20的信息(i)序列特征(A)长度445个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO20
Met Ala Thr Val Glu Asn Phe Asn Glu Leu Pro Ala His Val Trp Pro1 5 10 15Arg Asn Ala Val Arg Gln Glu Asp Gly Val Val Thr Val Ala Gly Val20 25 30Pro Leu Pro Asp Leu Ala Glu Glu Tyr Gly Thr Pro Leu Phe Val Val35 40 45Asp Glu Asp Asp Phe Arg Ser Arg Cys Arg Asp Met Ala Thr Ala Phe50 55 60Gly Gly Pro Gly Asn Val His Tyr Ala Ser Lys Ala Phe Leu Thr Lys65 70 75 80Thr Ile Ala Arg Trp Val Asp Glu Glu Gly Leu Ala Leu Asp Ile Ala85 90 95Ser Ile Asn Glu Leu Gly Ile Ala Leu Ala Ala Gly Phe Pro Ala Ser100 105 110Arg Ile Thr Ala His Gly Asn Asn Lys Gly Val Glu Phe Leu Arg Ala115 120 125Leu Val Gln Asn Gly Val Gly His Val Val Leu Asp Ser Ala Gln Glu130 135 140Leu Glu Leu Leu Asp Tyr Val Ala Ala Gly Glu Gly Lys Ile Gln Asp145 150 155 160Val Leu Ile Arg Val Lys Pro Gly Ile Glu Ala His Thr His Glu Phe165 170 175Ile Ala Thr Ser His Glu Asp Gln Lys Phe Gly Phe Ser Leu Ala Ser180 185 190Gly Ser Ala Phe Glu Ala Ala Lys Ala Ala Asn Asn Ala Glu Asn Leu195 200 205Asn Leu Val Gly Leu His Cys His Val Gly Ser Gln Val Phe Asp Ala210 215 220Glu Gly Phe Lys Leu Ala Ala Glu Arg Val Leu Gly Leu Tyr Ser Gln225 230 235 240Ile His Ser Glu Leu Gly Val Ala Leu Pro Glu Leu Asp Leu Gly Gly245 250 255Gly Tyr Gly Ile Ala Tyr Thr Ala Ala Glu Glu Pro Leu Asn Val Ala260 265 270Glu Val Ala Ser Asp Leu Leu Thr Ala Val Gly Lys Met Ala Ala Glu275 280 285Leu Gly Ile Asp Ala Pro Thr Val Leu Val Glu Pro Gly Arg Ala Ile290 295 300Ala Gly Pro Ser Thr Val Thr Ile Tyr Glu Val Gly Thr Thr Lys Asp305 310 315 320Val His Val Asp Asp Asp Lys Thr Arg Arg Tyr Ile Ala Val Asp Gly325 330 335Gly Met Ser Asp Asn Ile Arg Pro Ala Leu Tyr Gly Ser Glu Tyr Asp340 345 350Ala Arg Val Val Ser Arg Phe Ala Glu Gly Asp Pro Val Ser Thr Arg355 360 365Ile Val Gly Ser His Cys Glu Ser Gly Asp Ile Leu Ile Asn Asp Glu370 375 380Ile Tyr Pro Ser Asp Ile Thr Ser Gly Asp Phe Leu Ala Leu Ala Ala385 390 395 400Thr Gly Ala Tyr Cys Tyr Ala Met Ser Ser Arg Tyr Asn Ala Phe Thr405 410 415Arg Pro Ala Val Val Ser Val Arg Ala Gly Ser Ser Arg Leu Met Leu420 425 430Arg Arg Glu Thr Leu Asp Asp Ile Leu Ser Leu Glu Ala435 440 445
(2)SEQ ID NO21的信息(i)序列特征(A)长度20个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO21AACCTCGTCA TGTTTGAGAA20(2)SEQ ID NO22的信息(i)序列特征(A)长度20个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO22CCGGCCTACA AAATCGTGCA20(2)SEQ ID NO23的信息(i)序列特征(A)长度1331个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性
(ii)分子类型基因组DNA(vi)原始来源(A)有机体大肠杆菌(B)菌株JM109(ix)特征(A)名称/关键词CDS(B)位置10..1197(xi)序列描述SEQ ID NO23AACCTCGTC ATG TTT GAG AAC ATT ACC GCC GCT CCT GCC GAC CCG ATT 48Met Phe Glu Asn Ile Thr Ala Ala Pro Ala Asp Pro Ile1 5 10CTG GGC CTG GCC GAT CTG TTT CGT GCC GAT GAA CGT CCC GGC AAA ATT 96Leu Gly Leu Ala Asp Leu Phe Arg Ala Asp Glu Arg Pro Gly Lys Ile15 20 25AAC CTC GGG ATT GGT GTC TAT AAA GAT GAG ACG GGC AAA ACC CCG GTA 144Asn Leu Gly Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val30 35 40 45CTG ACC AGC GTG AAA AAG GCT GAA CAG TAT CTG CTC GAA AAT GAA ACC 192Leu Thr Ser Val Lys Lys Ala Glu Gln Tyr Leu Leu Glu Asn Glu Thr50 55 60ACC AAA AAT TAC CTC GGC ATT GAC GGC ATC CCT GAA TTT GGT CGC TGC 240Thr Lys Asn Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys65 70 75ACT CAG GAA CTG CTG TTT GGT AAA GGT AGC GCC CTG ATC AAT GAC AAA 288Thr Gln Glu Leu Leu Phe Gly Lys Gly Ser Ala Leu Ile Asn Asp Lys80 85 90CGT GCT CGC ACG GCA CAG ACT CCG GGG GGC ACT GGC GCA CTA CGC GTG 336Arg Ala Arg Thr Ala Gln Thr Pro Gly Gly Thr Gly Ala Leu Arg Val95 100 105GCT GCC GAT TTC CTG GCA AAA AAT ACC AGC GTT AAG CGT GTG TGG GTG 384Ala Ala Asp Phe Leu Ala Lys Asn Thr Ser Val Lys Arg Val Trp Val110 115 120 125AGC AAC CCA AGC TGG CCG AAC CAT AAG AGC GTC TTT AAC TCT GCA GGT 432Ser Asn Pro Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Ala Gly130 135 140CTG GAA GTT GGT GAA TAC GCT TAT TAT GAT GCG GAA AAT CAC ACT CTT 480Leu Glu Val Arg Glu Tyr Ala Tyr Tyr Asp Ala Glu Asn His Thr Leu145 150 155GAC TTC GAT GCA CTG ATT AAC AGC CTG AAT GAA GCT CAG GCT GGC GAC 528Asp Phe Asp Ala Leu Ile Asn Ser Leu Asn Glu Ala Gln Ala Gly Asp160 165 170GTA GTG CTG TTC CAT GGC TGC TGC CAT AAC CCA ACC GGT ATC GAC CCT 576Val Val Leu Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro175 180 185ACG CTG GAA CAA TGG CAA ACA CTG GCA CAA CTC TCG GTT GAG AAA GGC 624Thr Leu Glu Gln Trp Gln Thr Leu Ala Gln Leu Ser Val Glu Lys Gly190 195 200 205TGG TTA CCG CTG TTT GAC TTC GCT TAC CAG GGT TTT GCC CGT GGT CTG 672Trp Leu Pro Leu Phe Asp Phe Ala Tyr Gln Gly Phe Ala Arg Gly Leu210 215 220
GAA GAA GAT GCT GAA GGA CTG CGC GCT TTC GCG GCT ATG CAT AAA GAG 720Glu Glu Asp Ala Glu Gly Leu Arg Ala Phe Ala Ala Met His Lys Glu225 230 235CTG ATT GTT GCC AGT TCC TAC TCT AAA AAC TTT GGC CTG TAC AAC GAG 768Leu Ile Val Ala Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu240 245 250CGT GTT GGC GCT TGT ACT CTG GTT GCT GCC GAC AGT GAA ACC GTT GAT 816Arg Val Gly Ala Cys Thr Leu Val Ala Ala Asp Ser Glu Thr Val Asp255 260 265CGC GCA TTC AGC CAA ATG AAA GCG GCG ATT CGC GCT AAC TAC TCT AAC 864Arg Ala Phe Ser Gln Met Lys Ala Ala Ile Arg Ala Asn Tyr Ser Asn270 275 280 285CCA CCA GCA CAC GGC GCT TCT GTT GTT GCC ACC ATC CTG AGC AAC GAT 912Pro Pro Ala His Gly Ala Ser Val Val Ala Thr Ile Leu Ser Asn Asp290 295 300GCG TTA CGT GCG ATT TGG GAA CAA GAG CTG ACT GAT ATG CGC CAG CGT 960Ala Leu Arg Ala Ile Trp Glu Gln Glu Leu Thr Asp Met Arg Gln Arg305 310 315ATT CAG CGT ATG CGT CAG TTG TTC GTC AAT ACG CTG CAG GAA AAA GGC 1008Ile Gln Arg Met Arg Gln Leu Phe Val Asn Thr Leu Gln Glu Lys Gly320 325 330GCA AAC CGC GAC TTC AGC TTT ATC ATC AAA CAG AAC GGC ATG TTC TCC 1056Ala Asn Arg Asp Phe Ser Phe Ile Ile Lys Gln Asn Gly Met Phe Ser335 340 345TTC AGT GGC CTG ACA AAA GAA CAA GTG CTG CGT CTG CGC GAA GAG TTT 1104Phe Ser Gly Leu Thr Lys Glu Gln Val Leu Arg Leu Arg Glu Glu Phe350 355 360 365GGC GTA TAT GCG GTT GCT TCT GGT CGC GTA AAT GTG GCC GGG ATG ACA 1152Gly Val Tyr Ala Val Ala Ser Gly Arg Val Asn Val Ala Gly Met Thr370 375 380CCA GAT AAC ATG GCT CCG CTG TGC GAA GCG ATT GTG GCA GTG CTG 1197Pro Asp Asn Met Ala Pro Leu Cys Glu Ala Ile Val Ala Val Leu385 390 395TAAGCATTAA AAACAATGAA CGCGCTGAAA AGCGGGCTGA GACTGATGAC AAACGCAACA 1257TTGCCTGATG GCTACGCTTA TCAGGCCTAC GCGTCCCCTG CAATATTTTG AATTTGCACG 1317ATTTTGTAGG CCGG 1331(2)SEQ ID NO24的信息(i)序列特征(A)长度396个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO24Met Phe Glu Asn Ile Thr Ala Ala Pro Ala Asp Pro Ile Leu Gly Leu1 5 10 15
Ala Asp Leu Phe Arg Ala Asp Glu Arg Pro Gly Lys Ile Asn Leu Gly20 25 30Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val Leu Thr Ser35 40 45Val Lys Lys Ala Glu Gln Tyr Leu Leu Glu Asn Glu Thr Thr Lys Asn50 55 60Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys Thr Gln Glu65 70 75 80Leu Leu Phe Gly Lys Gly Ser Ala Leu Ile Asn Asp Lys Arg Ala Arg85 90 95Thr Ala Gln Thr Pro Gly Gly Thr Gly Ala Leu Arg Val Ala Ala Asp100 105 110Phe Leu Ala Lys Asn Thr Ser Val Lys Arg Val Trp Val Ser Asn Pro115 120 125Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Ala Gly Leu Glu Val130 135 140Arg Glu Tyr Ala Tyr Tyr Asp Ala Glu Asn His Thr Leu Asp Phe Asp145 150 155 160Ala Leu Ile Asn Ser Leu Asn Glu Ala Gln Ala Gly Asp Val Val Leu165 170 175Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro Thr Leu Glu180 185 190Gln Trp Gln Thr Leu Ala Gln Leu Ser Val Glu Lys Gly Trp Leu Pro195 200 205Leu Phe Asp Phe Ala Tyr Gln Gly Phe Ala Arg Gly Leu Glu Glu Asp210 215 220Ala Glu Gly Leu Arg Ala Phe Ala Ala Met His Lys Glu Leu Ile Val225 230 235 240Ala Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly245 250 255Ala Cys Thr Leu Val Ala Ala Asp Ser Glu Thr Val Asp Arg Ala Phe260 265 270Ser Gln Met Lys Ala Ala Ile Arg Ala Asn Tyr Ser Asn Pro Pro Ala275 280 285His Gly Ala Ser Val Val Ala Thr Ile Leu Ser Asn Asp Ala Leu Arg290 295 300Ala Ile Trp Glu Gln Glu Leu Thr Asp Met Arg Gln Arg Ile Gln Arg305 310 315 320Met Arg Gln Leu Phe Val Asn Thr Leu Gln Glu Lys Gly Ala Asn Arg325 330 335Asp Phe Ser Phe Ile Ile Lys Gln Asn Gly Met Phe Ser Phe Ser Gly340 345 350Leu Thr Lys Glu Gln Val Leu Arg Leu Arg Glu Glu Phe Gly Val Tyr355 360 365Ala Val Ala Ser Gly Arg Val Asn Val Ala Gly Met Thr Pro Asp Asn370 375 380Met Ala Pro Leu Cys Glu Ala Ile Val Ala Val Leu385 390 395(2)SEQ ID NO25的信息(i)序列特征(A)长度2517个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性
(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(xi)序列描述SEQ ID NO25GATCAGCTTC GGGTGTTGAA GGGGCCGAAT AAGGAACTCG CGCAGTTGGG TCGTAGTTTG 60TTTAAACGAC TTGGTGATGT GTTGGCGTAT TTCGATGTTG GTGTCTCCAA CGGTCCGGTC 120GAAGCGATCA ACGGACGGTT GGAGCATTTG CGTGGGATTG CTCTAGGTTT CCGTAATTTG 180AACCACTACA TTCTGCGGTG CCTTATCCAT TCAGGGCAGT TGGTCCATAA GATCAATGCA 240CTCTAAAACA GGAAGAGCCC CTTTACAAGC GGCAAGACCA AACTGGGTGA CCGAAAATCT 300TCAGGCCAAT CAGTTTTGGT CATATGGGAT GGTTTTTAGA CCTCGAAACC ATCCCATATG 360ACCGAAGCCC GCGAAACTCT GTGTTCGTTG GTCGCCTGGT TCGGTCTCAA TGCCTTGCCG 420AAACCACAAC GCCCCGAAAC CCAAAACTCC CCAATACATG AAAAAACCAG CTTCCCACCG 480AAGTGAGAAG CTGGTTTAGT TTGCGGAGGA TAGGGGATTT GAACCCCTGA GGGATTGCTC 540CCAACCCGCG TTCCAGGCGA GCGACATAGG CCGCTAGTCG AATCCTCCAG CTAGAACGGC 600TGCAACGCAT GGCTGCTTTG TTCTGGGGAT TAGATTACAC AAAAGTCGTT TAGAAACTCA 660AATCCGCTCG CAGTTGGCGT TTTCTGGGGC GGTTCAGCTA GAGTTATGCG AAGGATCCCG 720TGCGGCGTTT ATCTTGTGAA CTCCCCCAGG GCAGGAATGC AGCAAGGGTC AGCGAGCTCT 780GACGGGTGCG CGGGGTCCCC TAAAACGTCT AGAGTAGTGG CTTGAGGTCA CTGCTCTTTT 840TTTGTGCCCT TTTTTTGGTC CGTCTATTTT GCCACCACAT GCGGAGGTAC GCAGTTATGA 900GTTCAGTTTC GCTGCAGGAT TTTGATGCAG AGCGAATTGG TCTGTTCCAC GAGGACATTA 960AACGCAAGTT TGATGAGCTC AAGTCAAAAA ATCTGAAGCT GGATCTTACT CGCGGTAAGC 1020CTTCGTCGGA GCAGTTGGAT TTCGCTGATG AGCTGTTGGC GTTGCCTGGT AAGGGCGATT l080TCAAGGCTGC GGATGGTACT GATGTCCGTA ACTATGGCGG GCTGGATGGC ATTGTTGATA 1140TTCGTCAGAT TTGGGCGGAT TTGCTGGGTG TTCCTGTGGA GCAGGTGCTG GCGGGGGATG 1200CTTCGAGCTT GAACATCATG TTTGATGTGA TCAGCTGGTC GTACATTTTT GGTAACAATG 1260ATTCGGTTCA GCCTTGGTCG AAGGAAGAAA CTGTTAAGTG GATTTGTCCT GTTCCGGGAT 1320ATGATCGGCA TTTCTCCATC ACGGAGCGTT TCGGCTTTGA GATGATTTCT GTGCCAATGA 1380ATGAAGACGG CCCTGATATG GATGCTGTTG AGGAATTGGT CAAGGATCCG CAGGTTAAGG 1440GCATGTGGGT TGTGCCGGTA TTTTCTAACC CGACTGGTTT CACGGTGTCG GAGGACGTCG 1500CAAAGCGTCT GAGCACGATG GAAACTGCGG CGCCGGACTT CCGCGTGGTG TGGGATAACG 1560CTTACGCCGT TCATACTCTG ACCGATGAGT TCCCTGAGGT CATCGACATC GTTGGGCTTG 1620GTGAGGCGGC GGGTAACCCG AACCGTTTCT GGGCGTTCAC TTCTACTTCG AAGATCACTC 1680TCGCGGGTGC GGGCGTGTCC TTCTTCATGA CTTCTGCGGA GAACCGTAAG TGGTACTCCG 1740GTCATGCGGG TATCCGTGGC ATTGGCCCTA ACAAGGTCAA TCAGTTGGCT CATGCGCGTT 1800ACTTTGGCGA TGCTGAGGGA GTGCGCGCGG TGATGCGTAA GCATGCTGCG TCGTTGGCTC 1860CGAAGTTCAA CAAGGTTCTG GAGATCCTGG ATTCTCGCCT TGCTGAGTAC GGTGTCGCGC 1920AGTGGACTGT CCCTGCGGGC GGTTACTTCA TTTCCCTTGA TGTGGTTCCT GGTACGGCAT 1980CTCGTGTGGC TGAGTTGGCT AAGGAAGCCG GCATTGCGTT GACGGGTGCG GGTTCTTCTT 2040ACCCGCTGCG TCAGGATCCG GAGAACAAGA ACCTCCGTTT GGCGCCTTCT CTGCCTCCTG 2100TTGAGGAACT TGAGGTTGCC ATGGATGGCG TGGCTACGTG TGTTTTGCTG GCAGCTGCGG 2160AGCACTACGC TAGCTAGAGT GAATACCGCG GAAACTGCAC ATTGGATTAA CCGTTTGCTG 2220CCGGGTCAGC CGGAGTTTCA CCAGGTTGGC GCGTTTAAAG TGGCGGGTTA CACGCTTGAT 2280GATGAGTCAA TTGCGTGTTC TGTCAATTTC GGGCGCGTCA ACACGGGCCT GGTCACCGAG 2340ACAGGCGCGG AAACCGTCGA TGTGCGAAGT GAGATTTTGA GCCTGGCCAG GGCCGACGTG 2400TCCGTGCCTG GGCGCGCCGT CGGCGCTGCT GCAACAATGC TTCTCGACGC CTCCCTCTCC 2460TTCAAATCCG CCACCGATTC CAGTGTCACT CCCATGCATG CCCAACCGGG ACAGATC2517
(2)SEQ ID NO26的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义否(xi)序列描述SEQ ID NO26GATCAACGGA CGGTTGGAGC ATT 23(2)SEQ ID NO27的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述dese=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO27GGTATTCACT CTAGCTAGCG TAG 23(2)SEQ ID NO28的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性
(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义否(xi)序列描述SEQ ID NO28GAGCTCAAGT CAAAAAATCT GAA 23(2)SEQ ID NO29的信息(i)序列特征(A)长度23个碱基(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述desc=″合成的DNA″(iv)反义是(xi)序列描述SEQ ID NO29GATCTGTCCC GGTTGGGCAT GCA 23(2)SEQ ID NO30的信息(i)序列特征(A)长度2517个碱基(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型基因组DNA(vi)原始来源(A)有机体乳发酵短杆菌(B)菌株ATCC 13869(ix)特征(A)名称/关键词CDS
(B)位置879..2174(xi)序列描述SEQ ID NO30GATCAGCTTC GGGTGTTGAA GGGGCCGAAT AAGGAACTCG CGCAGTTGGG TCGTAGTTTG 60TTTAAACGAC TTGGTGATGT GTTGGCGTAT TTCGATGTTG GTGTCTCCAA CGGTCCGGTC 120GAAGCGATCA ACGGACGGTT GGAGCATTTG CGTGGGATTG CTCTAGGTTT CCGTAATTTG 180AACCACTACA TTCTGCGGTG CCTTATCCAT TCAGGGCAGT TGGTCCATAA GATCAATGCA 240CTCTAAAACA GGAAGAGCCC CTTTACAAGC GGCAAGACCA AACTGGGTGA CCGAAAATCT 300TCAGGCCAAT CAGTTTTGGT CATATGGGAT GGTTTTTAGA CCTCGAAACC ATCCCATATG 360ACCGAAGCCC GCGAAACTCT GTGTTCGTTG GTCGCCTGGT TCGGTCTCAA TGCCTTGCCG 420AAACCACAAC GCCCCGAAAC CCAAAACTCC CCAATACATG AAAAAACCAG CTTCCCACCG 480AAGTGAGAAG CTGGTTTAGT TTGCGGAGGA TAGGGGATTT GAACCCCTGA GGGATTGCTC 540CCAACCCGCG TTCCAGGCGA GCGACATAGG CCGCTAGTCG AATCCTCCAG CTAGAACGGC 600TGCAACGCAT GGCTGCTTTG TTCTGGGGAT TAGATTACAC AAAAGTCGTT TAGAAACTCA 660AATCCGCTCG CAGTTGGCGT TTTCTGGGGC GGTTCAGCTA GAGTTATGCG AAGGATCCCG 720TGCGGCGTTT ATCTTGTGAA CTCCCGCAGG GCAGGAATGC AGCAAGGGTC AGCGAGCTCT 780GACGGGTGCG CGGGGTCCCC TAAAACGTCT AGAGTAGTGG CTTGAGGTCA CTGCTCTTTT 840TTTGTGCCCT TTTTTTGGTC CGTCTATTTT GCCACCAC ATG CGG AGG TAC GCA 893Met Arg Arg Tyr Ala1 5GTT ATG AGT TCA GTT TCG CTG CAG GAT TTT GAT GCA GAG CGA ATT GGT 941Val Met Ser Ser Val Ser Leu Gln Asp Phe Asp Ala Glu Arg Ile Gly10 15 20CTG TTC CAC GAG GAC ATT AAA CGC AAG TTT GAT GAG CTC AAG TCA AAA 989Leu Phe His Glu Asp Ile Lys Arg Lys Phe Asp Glu Leu Lys Ser Lys25 30 35AAT CTG AAG CTG GAT CTT ACT CGC GGT AAG CCT TCG TCG GAG CAG TTG 1037Asn Leu Lys Leu Asp Leu Thr Arg Gly Lys Pro Ser Ser Glu Gln Leu40 45 50GAT TTC GCT GAT GAG CTG TTG GCG TTG CCT GGT AAG GGC GAT TTC AAG 1085Asp Phe Ala Asp Glu Leu Leu Ala Leu Pro Gly Lys Gly Asp Phe Lys55 60 65GCT GCG GAT GGT ACT GAT GTC CGT AAC TAT GGC GGG CTG GAT GGC ATT 1133Ala Ala Asp Gly Thr Asp Val Arg Asn Tyr Gly Gly Leu Asp Gly Ile70 75 80 85GTT GAT ATT CGT CAG ATT TGG GCG GAT TTG CTG GGT GTT CCT GTG GAG 1181Val Asp Ile Arg Gln Ile Trp Ala Asp Leu Leu Gly Val Pro Val Glu90 95 100CAG GTG CTG GCG GGG GAT GCT TCG AGC TTG AAC ATC ATG TTT GAT GTG 1229Gln Val Leu Ala Gly Asp Ala Ser Ser Leu Asn Ile Met Phe Asp Val105 110 115ATC AGC TGG TCG TAG ATT TTT GGT AAC AAT GAT TCG GTT CAG CCT TGG 1277Ile Ser Trp Ser Tyr Ile Phe Gly Asn Asn Asp Ser Val Gln Pro Trp120 125 130TCG AAG GAA GAA ACT GTT AAG TGG ATT TGT CCT GTT CCG GGA TAT GAT 1325Ser Lys Glu Glu Thr Val Lys Trp Ile Cys Pro Val Pro Gly Tyr Asp135 140 145CGC CAT TTC TCC ATC ACG GAG CGT TTC GGC TTT GAG ATG ATT TCT GTG 1373Arg His Phe Ser Ile Thr Glu Arg Phe Gly Phe Glu Met Ile Ser Val150 155 160 165CCA ATG AAT GAA GAC GGC CCT GAT ATG GAT GCT GTT GAG GAA TTG GTC 1421Pro Met Asn Glu Asp Gly Pro Asp Met Asp Ala Val Glu Glu Leu Val170 175 180
AAG GAT CCG CAG GTT AAG GGC ATG TGG GTT GTG CCG GTA TTT TCT AAC 1469Lys Asp Pro Gln Val Lys Gly Met Trp Val Val Pro Val Phe Ser Asn185 190 195CCG ACT GGT TTC ACG GTG TCG GAG GAC GTC GCA AAG CGT CTG AGC ACG 1517Pro Thr Gly Phe Thr Val Ser Glu Asp Val Ala Lys Arg Leu Ser Thr200 205 210ATG GAA ACT GCG GCG CCG GAC TTC CGC GTG GTG TGG GAT AAC GCT TAC 1565Met Glu Thr Ala Ala Pro Asp Phe Arg Val Val Trp Asp Asn Ala Tyr215 220 225GCC GTT CAT ACT CTG ACC GAT GAG TTC CCT GAG GTC ATC GAC ATC GTT 1613Ala Val His Thr Leu Thr Asp Glu Phe Pro Glu Val Ile Asp Ile Val230 235 240 245GGG CTT GGT GAG GCG GCG GGT AAC CCG AAC CGT TTC TGG GCG TTC ACT 1661Gly Leu Gly Glu Ala Ala Gly Asn Pro Asn Arg Phe Trp Ala Phe Thr250 255 260TCT ACT TCG AAG ATC ACT CTC GCG GGT GCG GGC GTG TCC TTC TTC ATG 1709Ser Thr Ser Lys Ile Thr Leu Ala Gly Ala Gly Val Ser Phe Phe Met265 270 275ACT TCT GCG GAG AAC CGT AAG TGG TAC TCC GGT CAT GCG GGT ATC CGT 1757Thr Ser Ala Glu Asn Arg Lys Trp Tyr Ser Gly His Ala Gly Ile Arg280 285 290GGC ATT GGC CCT AAC AAG GTC AAT CAG TTG GCT CAT GCG CGT TAC TTT 1805Gly Ile Gly Pro Asn Lys Val Asn Gln Leu Ala His Ala Arg Tyr Phe295 300 305GGC GAT GCT GAG GGA GTG CGC GCG GTG ATG CGT AAG CAT GCT GCG TCG 1853Gly Asp Ala Glu Gly Val Arg Ala Val Met Arg Lys His Ala Ala Ser310 315 320 325TTG GCT CCG AAG TTC AAC AAG GTT CTG GAG ATC CTG GAT TCT CGC CTT 1901Leu Ala Pro Lys Phe Asn Lys Val Leu Glu Ile Leu Asp Ser Arg Leu330 335 340GCT GAG TAC GGT GTC GCG CAG TGG ACT GTC CCT GCG GGC GGT TAC TTC 1949Ala Glu Tyr Gly Val Ala Gln Trp Thr Val Pro Ala Gly Gly Tyr Phe345 350 355ATT TCC CTT GAT GTG GTT CCT GGT ACG GCA TCT CGT GTG GCT GAG TTG 1997Ile Ser Leu Asp Val Val Pro Gly Thr Ala Ser Arg Val Ala Glu Leu360 365 370GCT AAG GAA GCC GGC ATT GCG TTG ACG GGT GCG GGT TCT TCT TAC CCG 2045Ala Lys Glu Ala Gly Ile Ala Leu Thr Gly Ala Gly Ser Ser Tyr Pro375 380 385CTG CGT CAG GAT CCG GAG AAC AAG AAC CTC CGT TTG GCG CCT TCT CTG 2093Leu Arg Gln Asp Pro Glu Asn Lys Asn Leu Arg Leu Ala Pro Ser Leu390 395 400 405CCT CCT GTT GAG GAA CTT GAG GTT GCC ATG GAT GGC GTG GCT ACG TGT 2141Pro Pro Val Glu Glu Leu Glu Val Ala Met Asp Gly Val Ala Thr Cys410 415 420GTT TTG CTG GCA GCT GCG GAG CAC TAC GCT AGC TAGAGTGAAT ACCGCGGAAA2194Val Leu Leu Ala Ala Ala Glu His Tyr Ala Ser425 430CTGCACATTG GATTAACCGT TTGCTGCCGG GTCAGCCGGA GTTTCACCAG GTTGGCGCGT2254TTAAAGTGGC GGGTTACACG CTTGATGATG AGTCAATTGC GTGTTCTGTC AATTTCGGGC2314GCGTCAACAC GGGCCTGGTC ACCGAGACAG GCGCGGAAAC CGTCGATGTG CGAAGTGAGA2374TTTTGAGCCT GGCCAGGGCC GACGTGTCCG TGCCTGGGCG CGCCGTCGGC GCTGCTGCAA2434CAATGCTTCT CGACGCCTCC CTCTCCTTCA AATCCGCCAC CGATTCCAGT GTCACTCCCA2494TGCATGCCCA ACCGGGACAG ATC2517
(2)SEQ ID NO31的信息(i)序列特征(A)长度432个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO31Met Arg Arg Tyr Ala Val Met Ser Ser Val Ser Leu Gln Asp Phe Asp1 5 10 15Ala Glu Arg Ile Gly Leu Phe His Glu Asp Ile Lys Arg Lys Phe Asp20 25 30Glu Leu Lys Ser Lys Asn Leu Lys Leu Asp Leu Thr Arg Gly Lys Pro35 40 45Ser Ser Glu Gln Leu Asp Phe Ala Asp Glu Leu Leu Ala Leu Pro Gly50 55 60Lys Gly Asp Phe Lys Ala Ala Asp Gly Thr Asp Val Arg Asn Tyr Gly65 70 75 80Gly Leu Asp Gly Ile Val Asp Ile Arg Gln Ile Trp Ala Asp Leu Leu85 90 95Gly Val Pro Val Glu Gln Val Leu Ala Gly Asp Ala Ser Ser Leu Asn100 105 110Ile Met Phe Asp Val Ile Ser Trp Ser Tyr Ile Phe Gly Asn Asn Asp
115 120 125Ser Val Gln Pro Trp Ser Lys Glu Glu Thr Val Lys Trp Ile Cys Pro130 135 140Val Pro Gly Tyr Asp Arg His Phe Ser Ile Thr Glu Arg Phe Gly Phe145 150 155 160Glu Met Ile Ser Val Pro Met Asn Glu Asp Gly Pro Asp Met Asp Ala165 170 175Val Glu Glu Leu Val Lys Asp Pro Gln Val Lys Gly Met Trp Val Val180 185 190Pro Val Phe Ser Asn Pro Thr Gly Phe Thr Val Ser Glu Asp Val Ala195 200 205Lys Arg Leu Ser Thr Met Glu Thr Ala Ala Pro Asp Phe Arg Val Val210 215 220Trp Asp Asn Ala Tyr Ala Val His Thr Leu Thr Asp Glu Phe Pro Glu225 230 235 240Val Ile Asp Ile Val Gly Leu Gly Glu Ala Ala Gly Asn Pro Asn Arg245 250 255Phe Trp Ala Phe Thr Ser Thr Ser Lys Ile Thr Leu Ala Gly Ala Gly260 265 270Val Ser Phe Phe Met Thr Ser Ala Glu Asn Arg Lys Trp Tyr Ser Gly275 280 285His Ala Gly Ile Arg Gly Ile Gly Pro Asn Lys Val Asn Gln Leu Ala290 295 300His Ala Arg Tyr Phe Gly Asp Ala Glu Gly Val Arg Ala Val Met Arg305 310 315 320Lys His Ala Ala Ser Leu Ala Pro Lys Phe Asn Lys Val Leu Glu Ile325 330 335Leu Asp Ser Arg Leu Ala Glu Tyr Gly Val Ala Gln Trp Thr Val Pro340 345 350Ala Gly Gly Tyr Phe Ile Ser Leu Asp Val Val Pro Gly Thr Ala Ser355 360 365Arg Val Ala Glu Leu Ala Lys Glu Ala Gly Ile Ala Leu Thr Gly Ala370 375 380Gly Ser Ser Tyr Pro Leu Arg Gln Asp Pro Glu Asn Lys Asn Leu Arg385 390 395 400Leu Ala Pro Ser Leu Pro Pro Val Glu Glu Leu Glu Val Ala Met Asp405 410 415Gly Val Ala Thr Cys Val Leu Leu Ala Ala Ala Glu His Tyr Ala Ser420 425 430
权利要求
1.一种编码包含SEQ ID NO31所示的氨基酸序列之蛋白质的DNA。
2.按照权利要求1的DNA,该DNA包含SEQ ID NO30所示的核苷酸序列中的879至2174位核苷酸的核苷酸序列。
3.载体pVK7,该载体在大肠杆菌和乳发酵短杆菌细胞中是可自主复制的,并且包含一个多克隆位点和lacZ’。
全文摘要
一种具有天冬氨酸激酶的棒状杆菌(其中L-苏氨酸和L-赖氨酸的反馈抑制实质上被脱敏),其包含编码二氢吡啶二甲酸还原酶的增强DNA序列、编码二氢吡啶甲酸还原酶的增强DNA序列、编码二氢吡啶甲酸合酶的增强DNA序列、编码二氨基庚二酸脱羧酶的增强DNA序列、编码天冬氨酸转氨酶的增强DNA序列;一种用于产生L-赖氨酸的方法,该方法包括以下步骤在适当的培养基中培养棒状杆菌使得在所说的细菌的培养物中产生并积累L-赖氨酸,并从培养物收集L-赖氨酸;以及一种可用于产生棒状杆菌的重组DNA。
文档编号C12P13/08GK1524956SQ0313313
公开日2004年9月1日 申请日期1997年12月5日 优先权日1996年12月5日
发明者荒木政行, 杉本雅一, 吉原康彦, 中松亘, 一, 彦 申请人:味之素株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1