在重组宿主细胞中制备透明质酸的方法

文档序号:413022阅读:555来源:国知局
专利名称:在重组宿主细胞中制备透明质酸的方法
技术领域
本发明涉及在重组宿主细胞中制备透明质酸的方法。
背景技术
人体内最丰富的杂多糖(heteropolysaccharide)是葡糖胺聚糖(glycosaminoglycan)。葡糖胺聚糖是无分枝糖类聚合物,含有重复二糖单位(仅硫酸角质素在糖的核心区中为分枝的)。所述二糖单位一般包括作为第一个糖单位的两种修饰糖-N-乙酰半乳糖胺(GaINAc)或N-乙酰葡萄糖胺(GlcNAc)中的一种。第二个单位通常是糖醛酸,如葡萄糖醛酸(GlcUA)或艾杜糖醛酸。
葡糖胺聚糖是带负电荷的分子,且在溶液中具有能够带来高粘度的扩展构象。葡糖胺聚糖主要位于细胞表面上或细胞外基质中。葡糖胺聚糖在溶液中还具有低压缩性,这使得其可作为理想的生理润滑液,例如,关节。葡糖胺聚糖的刚性提供了细胞的结构完整性并提供了能使细胞发生迁移的细胞间通道。具有最重要的生理学价值的葡糖胺聚糖是透明质酸(hyaluronan)、硫酸软骨素、肝素、硫酸乙酰肝素、硫酸皮肤素和硫酸角质素。多数葡糖胺聚糖通过特异性寡糖结构与蛋白多糖核心蛋白共价结合。除游离糖链与蛋白多糖构成非共价复合物外,透明质酸与特定蛋白多糖构成大聚集物。
已经确定了透明质酸在体内的多种作用(参见LaurentT.C.and FraserJ.R.E.,1992,FASEB J.62397-2404;and Toole B.P.,1991,“Proteoglycans andhyaluronan in morphogenesis and differentiation.”InCell Biology of theExtracellular Matrix,305-341页,Hay E.D.,ed.,Plenum,New York)。透明质酸存在于透明软骨、关节液和皮肤组织的真皮以及表皮中。透明质酸还被推测在多种生理功能,如粘附,发育,细胞运动性,癌症,血管发生和创伤愈合中发挥作用。根据透明质酸的独特物理和生物学特性,可将其用于眼和关节外科中,并且正在研究其在其它医学应用中的价值。透明质酸制品已被用于矫形学,风湿病学和皮肤病学中。
公鸡冠是透明质酸的重要商业来源。微生物是可选择的来源。美国专利No.4,801,539中公开了制备透明质酸的发酵法,其中包括兽瘟链球菌菌株,所报道的产率约为3.6g透明质酸/升。欧洲专利No.EP0694616公开了采用改良的兽瘟链球菌菌株的发酵方法,所报道的产率约为3.5g透明质酸/升。
通过发酵而用于制备透明质酸的微生物是病原性细菌菌株,其中最主要的细菌属于某些链球菌属菌种。A型和C型链球菌用由透明质酸组成的非病原性荚膜将其自身围绕,所述透明质酸在组成上与在结缔组织和关节中发现的透明质酸相同。出血败血性巴斯德菌(Pasteurella multocida)(另一种病原性荚膜菌)也用透明质酸围绕其自身细胞。
已有报道描述了来自脊椎动物、细菌病原体和海藻病毒的透明质酸合酶(DeAngelis,P.L.,1999,Cell.Mol.Life SCI,56670-682)。WO 99/23227公开了来自似马链球菌的I型透明质酸合酶。WO 99/51265和WO 00/27437公开了来自出血败血性巴斯德菌的II型透明质酸合酶(Group II hyaluronatesynthase)。Ferretti等公开了酿脓链球菌的透明质酸合酶操纵子,该操纵子包含分别编码透明质酸合酶、UDP葡萄糖脱氢酶和UDP-葡萄糖焦磷酸化酶的三个基因,hasA、hasB和hasC(Proc.Natl.Acad.Sci.USA.98,4658-4663,2001)。WO 99/51265公开了含有似马链球菌透明质酸合酶编码区的核酸片段。
杆菌已被很好地建立为用于制备天然和重组蛋白的宿主细胞系统。本发明的一个目的是提供在重组芽孢杆菌属宿主细胞中制备透明质酸的方法。
发明简述本发明涉及制备透明质酸(hyaluronic acid)的方法,包括(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
在优选的实施方案中,所述核酸构建体还包含一个或多个基因,所述基因编码透明质酸前体糖生物合成中的酶或芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体,该构建体含有一个或多个基因,所述基因编码前体糖生物合成中的酶。
在另一优选的实施方案中,一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
本发明还涉及包含核酸构建体的芽孢杆菌属宿主细胞,所述核酸构建体含有透明质酸合酶编码序列,该编码序列可操作性连接于与透明质酸合酶编码序列和所述核酸构建体异源的启动子序列。
本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列,所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。
本发明还涉及分离的编码UDP-葡萄糖6-脱氢酶的核酸序列,其选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO41有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQID NO40有至少约75%、约80%、约85%、约90%,或约95%同一性的核酸序列;(c)在中或高严紧条件下与(i)SEQ ID NO40的核酸序列,(ii)SEQ ID NO40中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a),(b)或(c)的亚序列,其中亚序列编码一种具有UDP-葡萄糖6-脱氢酶活性的多肽片段。
本发明还涉及分离的编码UDP葡萄糖焦磷酸化酶的核酸序列,其选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO43有至少90%、约95%,或约97%的同一性;(b)与SEQ ID NO42有至少约90%、约95%,或约97%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO42的核酸序列,(ii)SEQ ID NO42中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a),(b)或(c)的亚序列,其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
本发明还涉及分离的编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列,其选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO45有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQ ID NO44有至少约75%、约80%、约85%、约90%,或约95%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO44的核酸序列,(ii)SEQ ID NO44中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)(b),或(c)的亚序列,其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
附图简述

图1显示透明质酸的化学结构。
图2显示透明质酸合成的生物合成途径。
图3显示pCR2.1-sehasA的限制性图谱。
图4显示pCR2.1-tuaD的限制性图谱。
图5显示pCR2.1-gtaB的限制性图谱。
图6显示pCR2.1-gcaD的限制性图谱。
图7显示PHA1的限制性图谱。
图8显示pHA2的限制性图谱。
图9显示pHA3的限制性图谱。
图10显示pHA4的限制性图谱。
图11显示pHA5的限制性图谱。
图12显示pHA6的限制性图谱。
图13显示pHA7的限制性图谱。
图14显示pMRT106的限制性图谱。
图15显示pHA8的限制性图谱。
图16显示pHA9的限制性图谱。
图17显示pHA10的限制性图谱。
图18显示pRB157的限制性图谱。
图19显示pMRT084的限制性图谱。
图20显示pMRT086的限制性图谱。
图21显示pCJ791的限制性图谱。
图22显示pMRT032的限制性图谱。
图23显示pNNB194neo的限制性图谱。
图24显示pNNB194neo-oriT的限制性图谱。
图25显示pShV3的限制性图谱。
图26显示pShV2.1-amyEΔB的限制性图谱。
图27显示pShV3A的限制性图谱。
图28显示PMRT036的限制性图谱。
图29显示pMRT037的限制性图谱。
图30显示pMRT041的限制性图谱。
图31显示PMRT064.1的限制性图谱。
图32显示pMRT068的限制性图谱。
图33显示pMRT069的限制性图谱。
图34显示pMRT071的限制性图谱。
图35显示PMRT074的限制性图谱。
图36显示pMRT120的限制性图谱。
图37显示pMRT122的限制性图谱。
图38显示pCR2.1-pel5’的限制性图谱。
图39显示pCR2.1-pel3’的限制性图谱。
图40显示pRB161的限制性图谱。
图41显示pRB162的限制性图谱。
图42显示pRB156的限制性图谱。
图43显示pRB164的限制性图谱。
图44显示多种透明质酸制备枯草芽孢杆菌菌株以大约2g蔗糖/L0-小时的分批补料,37℃发酵的总结。
图45显示获自以大约2g蔗糖/L0-小时分批补料,37℃发酵的多种透明质酸制备枯草芽孢杆菌菌株的峰量透明质酸的平均分子量(MDa)的总结。
发明详述本发明涉及制备透明质酸的方法,包括(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
本发明的方法改进了从病原性,荚膜细菌中制备透明质酸的方法。在荚膜细菌中,大量的透明质酸是从荚膜中制备的。在从所述来源中制备和纯化透明质酸时,首先需要从荚膜中除去透明质酸,如通过使用表面活性剂或去垢剂,如SDS。由于为了释放大部分透明质酸而必须加入表面活性剂且随后必须从最终纯化中除去表面活性剂,故此使得透明质酸的商业生产步骤非常复杂。
本发明可以从非荚膜宿主细胞中制备大量游离透明质酸。在显微镜下观察不到与重组杆菌菌株相关的可视荚膜,而通常用于透明质酸制备中的病原性细菌株包括透明质酸荚膜,该荚膜的直径至少是细胞自身的两倍。
由于将重组芽孢杆菌属细胞的透明质酸直接表达于培养基中,故可使用简单的方法从培养基中分离透明质酸。首先,从培养基中物理除去芽孢杆菌属细胞和细胞碎片,如有需要,可首先稀释所述培养基从而降低培养基的粘性。本领域技术人员已知多种可用于从培养基中除去细胞的方法,如离心或微量过滤。如有需要,可过滤保留的上清,如通过超滤,从而浓缩并从透明质酸中除去小分子污染物。除去细胞和细胞碎片后,采用已知方法对培养基中的透明质酸实施简单的沉淀。盐、乙醇或盐和乙醇组合可用于从滤出液中沉淀透明质酸。一经沉淀,透明质酸易于通过物理方法从溶液中分离出来。或者,可采用本领域已知的蒸发干燥技术,如喷雾干燥从滤出液中干燥或分离透明质酸。
因此本发明的方法改进了现有技术中通过发酵而用于商业上制备透明质酸的方法,且无须在从培养细胞中纯化的透明质酸时使用表面活性剂。
透明质酸本文将“透明质酸”定义为非磺化葡糖胺聚糖(unsulphatedglycolsaminoglycan),其包含通过交替beta-1,4和beta-1,3糖苷键连接在一起的N-乙酰葡糖胺(GlcNAc)和葡萄糖醛酸(GlcUA)的重复二糖单位(图1)。已知,透明质酸(Hyaluronic aicd)为透明质酸(hyaluronan),透明质酸盐(酯)或HA。此处使用的术语透明质酸(hyaluronan)和透明质酸(Hyaluronic acid)可以互换。
在一个优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约10,000-约10,000,000 Da。在更优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约25,000-约5,000,000 Da。在最优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约50,000-至约3,000,000 Da。
采用本发明的芽孢杆菌属宿主细胞制备的透明质酸的水平可根据改良咔唑法(Bitter和Muir,1962,Anal Biochem.4330-334)测定。此外,可使用现有技术中如Ueno等,1988,Chem.Pharm.Bull.36,4971-4975;Wyatt,1993,ANAL.Chim.Acta 2721-40;和Wyatt Technologies,1999,“LightScattering University DAWN Course Manual”和“DAWN EOS Manual”WyattTechnology Corporation,Santa Barbara,California所描述的标准方法测定透明质酸的平均分子量。
可使用本领域已知的多种方法如,在美国专利No.5,616,568、5,652,347和5,874,417中所描述的交联方法,对采用本发明的方法获得的透明质酸进行修饰。此外,可使用本领域已知的方法改变透明质酸的分子量。
宿主细胞在本发明的方法中,芽孢杆菌属宿主细胞可以是适用于重组制备透明质酸的任何芽孢杆菌属细胞。芽孢杆菌属宿主细胞可以是野生型芽孢杆菌属细胞或其突变体。适用于实施本发明的芽孢杆菌属细胞包括(但不限于)Bacillus agaraderhens、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens)、短芽胞杆菌(Bacillus brevis)、环状芽胞杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽胞杆菌(Bacillus coagulans,)、坚硬芽胞杆菌(Bacillus firmus)、灿烂芽胞杆菌(Bacillus lautus)、迟缓芽胞杆菌(Bacillus lentus)、地衣形芽胞杆菌(Bacilluslicheniformis)、巨大芽胞杆菌(Bacillus megaterium)、短小芽胞杆菌(Bacilluspumilus)、嗜热脂肪芽胞杆菌(Bacillus Stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏芸金芽胞杆菌(Bacillus thuringiensis)细胞。WO98/22598中公开了特别适用于重组表达的枯草芽孢杆菌细胞突变体。非荚膜芽孢杆菌属细胞特别适用于本发明。
在一个优选的实施方案中,芽孢杆菌属宿主细胞是解淀粉芽胞杆菌、克劳氏芽孢杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、嗜热脂肪芽胞杆菌或枯草芽孢杆菌细胞。在更优选的实施方案中,芽孢杆菌属细胞是解淀粉芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是克劳氏芽孢杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是迟缓芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是地衣形芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是枯草芽孢杆菌细胞。在最优选的实施方案中,芽孢杆菌属宿主细胞是枯草芽孢杆菌A164Δ5(参见美国专利No.5,891,701)或枯草芽孢杆菌168Δ4。
用本发明的核酸构建体转化芽孢杆菌属宿主细胞可通过如下方法实施,例如,原生质体转化(参见例如Chang和Cohen,1979,Molecular GeneralGenetics 168111-115)、使用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81823-829,或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56209-221)、电穿孔法(参见例如Shigekawa和Dower,1988,Biotechniques 6742-751)或接合(参见例如KOEHLER和Thorne,1987,Journal of Bacteriology 1695271-5278)。
核酸构建体本文中将“核酸构建体”定义为一种单链或双链核酸分子,其分离自天然存在的基因或经修饰后含有以自然界不存在的方式联合和并置的核酸片段。当核酸构建体包含编码序列表达所需的所有控制序列时,术语核酸构建体可与术语表达盒同义。本文将术语“编码序列”定义为当将其置于下述控制序列的控制下时,能够转录为mRNA并翻译为目的酶的序列。编码序列的界限通常由mRNA5’末端紧接着位于开放阅读框上游的核糖体结合位点和mRNA 3’末端紧接着位于开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)DNA、cDNA和重组核酸序列。
用于分离或克隆编码多肽的核酸序列的方法是本领域众所周知的,例如包括从基因组DNA中分离、从cDNA制备或其组合。从所述基因组DNA克隆本发明的核酸序列例如可通过表达文库的抗体筛选以检测具有共同结构特点的克隆化DNA片段或众所周知的聚合酶链反应(PCR)而得以实施。参见,例如Innis等,1990,PCR ProtocolsA Guide to Methods andApplication,Academic Press,New York。可以使用其它核酸扩增方法如连接酶链反应,连接激活转录和基于核酸序列的扩增。克隆方法可能涉及对包括编码所述多肽的核酸序列的目的核酸片段进行切除和分离、所述片段插入载体分子中以及重组载体向芽孢杆菌属细胞中的掺入,在所述芽孢杆菌属细胞中所述核酸序列的克隆将被复制。所述核酸序列可以是基因组的、cDNA、RNA、半-合成、合成来源的或其任意组合。
可以用多种方式操作编码酶的分离的核酸序列以提供所述酶的表达。在将核酸序列插入到构建体或载体中之前对其操作是优选或必需的,这取决于表达载体或芽孢杆菌属宿主细胞。用克隆方法修饰核酸序列的技术是本领域众所周知的。还应认识到,核酸序列还可以通过使用本领域众所周知的方法在宿主细胞中于体内操作。
透明质酸生物合成中涉及多种酶。这些酶包括透明质酸合酶、UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶、UDP-N-乙酰葡糖胺焦磷酸化酶、6-磷酸葡萄糖异构酶、己糖激酶、磷酸葡糖变位酶、酰胺转移酶、变位酶和乙酰基转移酶。透明质酸合酶是透明质酸制备过程中的关键酶。
本文将“透明质酸合酶”定义为通过加入GlcUA和GlcNAc糖前体而催化透明质酸链延长的合酶。链球菌透明质酸合酶、脊椎动物透明质酸合酶和病毒透明质酸合酶氨基酸序列不同于来自巴斯德菌的透明质酸合酶,并已经将其分为I型和II型透明质酸合酶,I型透明质酸合酶包括链球菌透明质酸合酶(DeAngelis,1999)。为了用于在芽孢杆菌属宿主细胞中制备透明质酸,真核生物源性的透明质酸合酶,如哺乳动物透明质酸合酶,为次优选的。
透明质酸合酶编码序列可以是任何能够在芽孢杆菌属宿主细胞中表达的核酸序列,所述核酸序列可以是任何来源的。优选的透明质酸合酶基因包括I型或II型的任一种,如来自似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种的I型透明质酸合酶基因,或出血败血性巴斯德菌的II型透明质酸合酶基因。
在一个优选的实施方案中,透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO2、SEQ ID NO93或SEQ ID NO103有至少约70%、约75%、约80%、约85%、约90%,或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO1、SEQ IDNO92或SEQ ID NO102杂交的核酸序列;和(c)(a)或(b)的互补链。
在更优选的实施方案中,透明质酸合酶编码序列一种多肽,所述多肽含有SEQ ID NO2、SEQ ID NO93或SEQ ID NO103的氨基酸序列或其具有透明质酸合酶活性的片段。
在另一优选的实施方案中,透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO95有至少约70%、约75%、约80%、约85%、约90%,或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO94杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,透明质酸合酶编码序列一种多肽,所述多肽含有SEQ ID NO95的氨基酸序列或其具有透明质酸合酶活性的片段。
本发明的方法还包括构建体,透明质酸的前体糖(precursor sugars)经由所述构建体而供给宿主细胞,或供给培养基,或由芽孢杆菌属宿主细胞中的内源性基因、或非内源性基因、或内源性和非内源性基因的组合所编码。前体糖可以是D-葡萄糖醛酸或N-乙酰葡糖胺。
在本发明的方法中,核酸构建体还可包含一个或多个基因,所述基因编码透明质酸前体糖生物合成中的酶。或者,芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体,该构建体含有一个或多个基因,所述基因编码前体糖生物合成中的酶。通过使用含有编码指导透明质酸前体糖合成途径步骤的一个基因或多个基因的一种核酸序列或多种核酸序列的构建体提高了透明质酸的生产。“指导透明质酸前体糖合成途径中的步骤”指基因的表达蛋白具有N-乙酰葡糖胺或D-葡萄糖醛酸或是N-乙酰葡糖胺或D-葡萄糖醛酸前体的糖形式的活性(图2)。
在优选的用于供应前体糖的方法中,通过培养含有重组构建体的宿主细胞,所述重组构建体含有可操作性连接于编码指导透明质酸前体糖合成途径中步骤的基因的核酸序列的异源性启动子区,提供用于在含有透明质酸合酶的宿主细胞中提高透明质酸生产的构建体。在优选的方法中,所述宿主细胞还包含含有可操作性连接于透明质酸合酶的启动子区的重组构建体,其可以使用与N-乙酰葡糖胺的生物合成中所涉及的合酶的核酸序列相同或不同的启动子区。在另一优选的实施方案中,所述宿主细胞可包含含有可操作性连接于编码透明质酸前体糖的生物合成中所涉及的第二个基因的不同核酸序列的启动子区的重组构建体。
因此,本发明还涉及通过使用编码指导透明质酸前体糖的生物合成中步骤的基因的核酸序列的构建体而提高透明质酸生产的构建体。前体糖的核酸序列可由与编码透明质酸合酶相同或不同的启动子表达。
制备透明质酸的前体糖的生物合成中涉及的基因包括UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
在含有透明质酸合酶的细胞中,可表达两个或多个hasB,hasC和hasD,或其同系物,如分别是枯草芽孢杆菌tuaD,gtaB,和gcaD,以及hasE的任一个或其组合以增加透明质酸合酶可用的前体糖的量。Bacillus基因组已经公开在Kunst等,Nature 390,249-256,“The complete genome sequence of theGram-positive bacterium Bacillus Subtilis”(20 November 1997)中。在某些情况下,如当宿主细胞不含天然透明质酸合酶活性时,所述构建体可包含hasA基因。
所述编码生物合成酶的核酸序列可以是宿主细胞天然含有的,而在其他情况下也可以使用异源序列。如果表达两个或多个基因, 其可以是与天然操纵子中的另一个基因(如包含hasA,hasB,hasC和hasD的似马链球菌HAS操纵子的基因)相关的基因。在其他情况下,可能需要使用某些前体基因序列的组合,而没有所包括操纵子的每个元件。在其他情况下,还可以优选使用宿主细胞天然的某些基因和其他外源性基因。选择将基于给定宿主细胞中的糖的可用量,细胞供应生产过剩而不会妨碍宿主细胞其它功能的能力,和所述细胞是否能调节其与外源性基因不同的天然基因的表达。
例如,根据细胞的代谢需要和生长条件以及可用的前体糖的量,其可能需要通过表达编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列,如hasD基因、芽孢杆菌属的gcaD基因及其同系物而提高N-乙酰葡糖胺的生产。或者,前体糖可以是D-葡萄糖醛酸。在一个所述实施方案中,所述核酸序列编码UDP-葡萄糖6-脱氢酶。所述核酸序列包括芽孢杆菌属的tuaD基因、链球菌属的hasB基因及其同系物。所述核酸序列还可编码UDP-葡萄糖焦磷酸化酶,如芽孢杆菌属中的gtaB基因、链球菌属的the hasC基因及其同系物。
在本发明的方法中,UDP-葡萄糖6-脱氢酶基因可以是hasB基因或tuaD基因或其同系物。
在一个优选的实施方案中,hasB基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO41、SEQ ID NO97或SEQ ID NO105至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO40、SEQ ID NO96或SEQ ID NO104杂交的核酸序列;和(c)(a)或(b)的互补链。
在更优选的实施方案中,the hasB基因所编码的多肽含有SEQ ID NO41、SEQ ID NO97或SEQ ID NO105的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。
在另一优选的实施方案中,tuaD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO12至少约70%,约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO11杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,tuaD基因所编码的多肽含有SEQ IDNO12的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。
在本发明的方法中,UDP葡萄糖焦磷酸化酶基因可以是hasC基因或gtaB基因或其同系物。
在一个优选的实施方案中,hasC基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO43、SEQ ID NO99或SEQ ID NO107至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO42或SEQ ID NO98或SEQ ID NO106杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasC基因所编码的多肽含有SEQ IDNO43或SEQ ID NO99,或SEQ ID NO107的氨基酸序列或其具有UDP葡萄糖焦磷酸化酶活性的片段。
在另一优选的实施方案中,gtaB基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO22至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO21杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,gtaB基因所编码的多肽含有SEQ IDNO22的氨基酸序列或其具有UDP-葡萄糖焦磷酸化酶活性的片段。
在本发明的方法中,UDP-N-乙酰葡糖胺焦磷酸化酶基因可以是hasD或gcaD基因或其同系物。
在一个优选的实施方案中,hasD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO45至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ IDNO44杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasD基因所编码的多肽含有SEQ IDNO45的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。
在另一优选的实施方案中,gcaD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO30至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO29杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,gcaD基因所编码的多肽含有SEQ IDNO30的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。
在本发明的方法中,6-磷酸葡萄糖异构酶基因可以是hasE或其同系物。
在一个优选的实施方案中,hasE基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO101至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO100杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasE基因所编码的多肽含有SEQ IDNO101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段。
在本发明的方法中,透明质酸合酶基因和一个或多个编码前体糖的基因受控于相同的启动子。或者,一个或多个编码前体糖的基因受控于相同的启动子而用不同的启动子指导透明质酸合酶基因。另一种选择是透明质酸合酶基因和每个前体糖的基因均受控于不同的启动子。在一个优选的实施方案中,透明质酸合酶基因和一个或多个前体糖的基因受控于相同的启动子。
本发明还涉及包含编码透明质酸合酶操纵子的分离的核酸序列的核酸构建体,所述操纵子包含透明质酸合酶基因和UDP-葡萄糖6-脱氢酶基因,和可选地选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。SEQ ID NO108中显示编码似马链球菌的多数透明质酸合酶操纵子的核酸序列。该序列包含分别与枯草芽孢杆菌tuaD基因(SEQ ID NO11)和gtaB基因(SEQ ID NO21)相似的hasB(SEQ ID NO40)和hasC(SEQ ID nO42),以及在酿脓链球菌时,gcaD基因(SEQ ID NO29)的已经被命名为hasD(SEQ ID NO44)的同系物。枯草芽孢杆菌gcaD编码N-乙酰葡糖胺(两种透明质酸糖的一种)合成中的UDP-N-乙酰葡糖胺焦磷酸化酶。gcaD的似马链球菌同系物,hasD,由似马链球菌排列在透明质酸合酶操纵子上。该核酸序列还包含部分hasA基因(SEQ ID NO1的后1156bp)。
在某些情况下,宿主细胞将包含含有可操作性连接于编码指导透明质酸前体糖合成途径中的步骤的基因的核酸序列的异源性启动子区的重组构建体,其可对应于从重组构建体表达透明质酸合酶。所述透明质酸合酶可经由与编码前体生物合成途径中涉及的酶的核酸序列相同或不同的启动子区而表达。在另一优选的实施方案中,宿主细胞可包含含有可操作性连接于编码透明质酸前体糖合成中涉及的第二个基因的不同核酸序列的启动子区的重组构建体。
编码前体糖的合成中所涉及的酶的核酸序列可用相同或不同的启动子如编码透明质酸合酶的核酸序列实施表达。在前一意义中,构建“人工操纵子”,其能模拟含有每个hasA,hasB,hasC和hasD,或其同系物的似马链球菌的操纵子,或者,可使用似马链球菌操纵子中存在的全长补体的序列。所述“人工操纵子”还可包含6-磷酸葡萄糖异构酶基因(hasE)以及一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。在人工操纵子中,至少一个元件与其它元件是异源的,如启动子区与编码序列异源。
在一个优选的实施方案中,核酸构建体包含hasA,tuaD和gtaB。在另一优选的实施方案中,核酸构建体包含hasA,tuaD,gtaB和gcaD。在另一优选的实施方案中,核酸构建体包含hasA和tuaD。在另一优选的实施方案中,核酸构建体包含hasA。在另一优选的实施方案中,核酸构建体包含hasA,tuaD,gtaB,GCAD和hasE。在另一优选的实施方案中,核酸构建体包含HASA,HASB,HASC和hasD。在另一优选的实施方案中,核酸构建体包含hasA,HASB,hasC,HASD和hasE。基于上述优选的实施方案,所述基因可用其同系物取代。
在本发明的方法中,核酸构建体包含可操作性连接于透明质酸合酶编码序列异源的启动子序列的透明质酸合酶编码序列。所述启动子序列可以是,例如,单启动子或串联启动子(tandem promoter)。
本文将“启动子”定义为一段参与RNA聚合酶结合以启动基因转录的核酸序列。本文将“串联启动子”定义为两个或多个启动子序列,其中每个启动子序列均与编码序列可操作性连接和并介导该编码序列转录成mRNA。本文将“可操作性连接”定义为一种构型,其中一段控制序列例如启动子序列位于相对编码序列恰当的位置,从而使该控制序列指导由该编码序列编码的多肽的产生。如前所述,本文将“编码序列”定义为当置于适宜的控制序列的控制下时可转录为mRNA并翻译为多肽的核酸序列。编码序列的界限通常由恰位于mRNA的5’末端开放阅读框上游的核糖体结合位点和恰位于mRNA的3’末端开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)基因组DNA、cDNA、半合成、合成来源和重组核酸序列。
在一个优选的实施方案中,启动子序列可以获自细菌来源。在更优选的实施方案中,启动子序列可以获自革兰氏阳性细菌如芽孢杆菌属,例如,Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、或苏芸金芽胞杆菌或链霉菌属,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌,例如,大肠杆菌或假单胞杆菌(Pseudomonas sp)。
用于在本发明的方法中指导核酸序列转录的适宜启动子的实例是获自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisin Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedingsof the National Academy of Sciences USA 753727-3731)的启动子。其它实例为spol细菌噬菌体启动子和tac启动子(DeBoer等,1983,Proceedingsof the National Academy of Sciences USA 8021-25)。其它启动子描述于“Useful proteins from recombinant bacteria”in Scientific American,1980,24274-94;和in Sambrook,Fritsch,和Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York。
启动子还可以是“共有序列(consensus)”启动子,该启动子含有“-35”区的TTGACA和“-10”区的TATAAT。“共有序列”启动子可以获自任何在芽孢杆菌属宿主细胞中有功能的启动子。“共有序列”启动子的构建可通过定点诱变来完成,从而产生与枯草芽孢杆菌营养期“sigma A-型”启动子“-10”区和“-35”区已确认共有序列更一致的启动子(Voskuil等,1995,MolecularMicrobiology 17271-279)。
在一个优选的实施方案中,所述“共有序列”启动子是获自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisinCarlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因spol细菌噬菌体启动子。在更优选的实施方案中,“共有序列”启动子获自解淀粉芽胞杆菌α-淀粉酶基因(amyQ)。
Widner等,在美国专利No.6,255,076和5,955,310中公开了用于在芽孢杆菌属细胞中表达的,包括短共有序列amyQ启动子(也称为scBAN)的串联启动子和构建体以及方法。文中还公开了将cryIIIA稳定序列以及使用了该序列的构建体用于提高芽孢杆菌属中的生产。
串联启动子中每个启动子序列可以是能在所选芽孢杆菌属细胞中表现出转录活性的任意核酸序列,包括突变的、截短的和杂合的启动子,并可获自芽孢杆菌属细胞的同源或异源性细胞内和细胞外多肽的编码基因。相对于多肽编码序列和芽孢杆菌属细胞,每一启动子序列可以是天然的和外源的。启动子序列可以是相同的启动子序列或不同的启动子序列。
串联启动子的两个或多个启动子序列可同时启动核酸序列的转录。此外,串联启动子的一个或多个启动子序列可在芽孢杆菌属细胞生长的不同阶段启动核酸序列的转录。
在一个优选的实施方案中,串联启动子至少包含解淀粉芽胞杆菌α-淀粉酶基因的amyQ启动子。在另一优选的实施方案中,串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一优选的实施方案中,串联启动子至少包含地衣形芽胞杆菌α-淀粉酶基因的amyL启动子。在另一优选的实施方案中,串联启动子至少包含cryIIIA启动子或其部分(Agaisse和LERECLUS,1994,Molecular Microbiology 1397-107)。
在更优选的实施方案中,串联启动子至少包含amyL启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含amyQ启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的amyL启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的amyQ启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的cryIIIA启动子。
本文将“mRNA加工/稳定序列”定义为位于一个或多个启动予序列下游和编码序列上游的一段序列,该一个或多个启动予序列中的每一个都与该序列可操作连接,使每一个启动子合成的mRNA均可加工产生在转录本5’端具有稳定予序列的mRNA转录本。mRNA转录本5’端存在这种稳定子序列可增加其半衰期(Agaisse和LERECLUS,1994,同上文,Hue等,1995,Journal of Bacteriology 1773465-3471)。mRNA加工/稳定序列与细菌16S核糖体RNA的3’末端互补。在一个优选实施方案中,mRNA加工/稳定序列产生在转录本5’端具有稳定序列的基本单一大小的转录本。优选与细菌16S核糖体RNA的3’末端互补的mRNA加工/稳定序列。参见,美国专利No.6,255,076和5,955,310。
在一个更优选实施方案中选实施方案中,mRNA加工/稳定序列是WO94/25612和Agaisse和Lereclus(1994,同上文)所公开的苏芸金芽孢杆菌cryIIIA mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。在另一个更优选实施方案中,mRNA加工/稳定序列是Hue等(1995,同上文)所公开的枯草芽孢杆菌SP82的mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。
当本发明的方法使用cryIIIA启动子和其mRNA加工/稳定序列时,可采用含有WO 94/25612和Agaisse和Lereclus(1994,同上文)所公开的序列或其保持启动子和mRNA加工/稳定功能的部分的DNA片段。而且,可使用本领域众所周知的方法制备仅含有含有cryIIIA启动子或cryIIIA启动子mRNA加工/稳定序列,以构建串联启动子和mRNA加工/稳定序列的各种组合。在该实施方案中,cryIIIA启动子及其cryIIIA启动子mRNA加工/稳定序列优选位于构成串联启动子的其它启动子序列下游和目标基因编码序列序列的上游。
然后,可进一步操作编码透明质酸生产中所涉及的所需酶的分离的核酸序列以提高核酸序列的表达。应该理解,表达所述多肽生产中所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。使用克隆方法修饰核酸序列的技术是本领域众所周知的。
含有编码所述酶的核酸序列的核酸构建体可以可操作性连接于能够在适于控制序列的条件下于芽孢杆菌属细胞中指导编码序列表达的一个或多个控制序列。
本文将术语“控制序列”定义为包括表达核酸序列的编码序列所必需或有利于其表达的所有组分。每个控制序列可以是编码所述酶的核酸序列的天然或外源的。除上述启动子序列外,所述控制序列(但不限于)前导序列、信号肽序列和转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。所述控制序列可带有用于导入特异性限制位点的接头,以便于将控制序列与编码多肽之核酸序列的编码区相连。
控制序列还可以是适宜的转录终止序列,即可被芽孢杆菌属细胞识别以终止转录的序列。将终止子序列与编码所述酶或操作子最后酶的核酸序列的3’端可可操作性相连。在所选芽孢杆菌属细胞中有功能的任何终止子都可用于本发明。
控制序列还可以是适宜的前导序列,即mRNA上对芽孢杆菌属细胞的翻译很重要的非翻译区。前导序列被可可操作性连接于编码所述酶的核酸序列的5’端。然和在所选芽孢杆菌属细胞中有功能的前导序列都可用于本发明。
控制序列还可以是信号肽编码区,其编码于多肽的氨基端相连的氨基酸序列,并且指导该编码的多肽进入细胞分泌途径。信号肽编码区可以是多肽天然的或可获自异源。核酸序列的编码序列的5’末端可天然包括信号肽编码区,该区天然和编码分泌性多肽的编码区的片段在翻译阅读框内连接在一起。或者,编码序列的5’末端可以包含相对于编码分泌性多肽的该编码序列部分外源的信号肽编码区。在编码序列没有天然地包含信号肽编码区的情况下,需要外源信号肽编码区。或者,可以简单地用外源信号肽编码区取代天然信号肽编码区以便相对于与编码序列相关的天然信号肽编码区而言来提高多肽的分泌。信号肽编码区可以获自芽孢杆菌属的淀粉酶或蛋白酶基因。但是,指导表达的多肽进入所选芽孢杆菌属细胞分泌途径的任何信号肽编码区均可以用于本发明。
用于芽孢杆菌属细胞的有效的信号肽编码区获自芽孢杆菌NCIB 11837产麦芽糖淀粉酶基因、嗜热脂肪芽胞杆菌α-淀粉酶基因、地衣形芽胞杆菌枯草杆菌蛋白酶基因、地衣形芽胞杆菌β-内酰胺酶基因、嗜热脂肪芽胞杆菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌prsA基因的信号肽编码区。Simonen和Palva,1993,Microbiological Reviews 57109-137中描述了其它信号肽。
控制序列还可以是编码位于多肽氨基末端之氨基酸序列的前肽编码区。所得的多肽已知为酶原或多肽原(或在某些情况下为酶原)。多肽原通常是物活性的并可从所述多肽原通过催还或自我催化裂解而转变为成熟的活性多肽。前肽编码区可以获自枯草芽孢杆菌碱性蛋白酶(aprE)和枯草芽孢杆菌中性蛋白酶(nprT)的基因。
当信号肽和前肽区都存在于多肽的氨基端时,前肽区与多肽的氨基端紧邻,而信号肽区和前肽区的氨基端紧邻。
还优选加入能调节与细胞生长相关的多肽表达的调控序列。调控系统的实例包括应答化学或物理刺激(包括在有调控化合物存在的情况下)而导致基因表达的开启或关闭的那些系统。原核生物系统中的调节系统包括lac、tac和trp操纵子系统。
表达载体在本发明的方法中,含有核酸序列、启动子和转录以及翻译终止信号的重组表达载体可用于重组制备透明质酸生产中所涉及的酶。可将上述各种核酸和调控序列连接在一起以生产包括一个或多个方便的限制位点的重组表达载体,所述位点能允许编码多肽或酶的核酸序列在所述位点插入或置换。或者,所述核酸序列可通过将该核酸序列和含有该核酸序列的核酸构建体插入适当表达载体来表达。在创建表达载体的过程中,可使编码序列在表达载体中与适当调控序列可操作性相连以便表达。
重组表达载体可以是任何载体,其可方便地进行重组DNA操作并且能使核酸序列表达。载体的选择将主要决定于载体与引入了该载体的芽孢杆菌属细胞之间的相容性。载体可以是线性和闭合环状质粒。载体可以是自主复制载体,即以染色体外实体形式存在的载体,其复制独立于染色体的复制,例如质粒,染色体外元件,小染色体(minichromosome)或人工染色体。载体可含有任何确保自我复制的手段。或者,载体可以是引入芽孢杆菌属细胞后,整合到基因组中并与其整合的染色体一起复制的那种载体。载体系统可使用单个载体或质粒、或其一起含有待引入芽孢杆菌属细胞基因组中的全长DNA的两个或多个载体或质粒、或转座子。
本发明的载体优选含有使所述载体可以稳定整合到芽孢杆菌属宿主细胞基因组中或者可在细胞中不依赖于细胞的基因组而自我复制的元件。
为了整合到宿主细胞基因组中,所述载体可依赖于编码多肽的核酸序列或载体上任何其它元件来通过同源或非同源重组而稳定整合到基因组中。或者,载体可能含有其它核酸序列,这些序列可指导通过同源重组整合进入芽孢杆菌属细胞基因组。其它核酸序列能够在染色体的精确位置使载体整合到宿主细胞基因组中。为了提高在精确位置整合的可能性,整合元件应优选含有足够量的与相应靶序列高度同源的核酸,例如100-1,500碱基对、优选400-1,500碱基对和最优选800-1,500碱基对,以便提供同源重组的可能性。整合元件可以是与芽孢杆菌属细胞基因组中的靶序列同源的任何序列。此外,整合元件还可以使非编码的或编码的核酸序列。另一方面,通过非同源重组可将载体整合到宿主细胞的基因组中。
为了进行自主复制,所述裁休还可含有能够使裁体在所研究的芽孢杆菌属细胞中自主复制的复制起始点。细菌复制起始点的实例是使载体可以在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起始点。复制起始点可以是带有突变的复制起始点,所述突变可以使其在宿主细胞中发挥温度敏感性的作用(参见例如Ehrlich,1978,Proceedings of theNational Academy of Sciences USA 751433)本发明的载体优选含有一个或多个选择性标记,其能容易地选择出转化细胞。一个选择性标记是一种基因,其产物能提供对杀生物剂或病毒的抗性、对重金属的抗性、原养型至营养缺陷型的转变等。细菌选择性标记的实例是来源于枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予了抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。此外,可通过共转化实施选择,例如WO 91/09129中所描述的,其中选择性标记位于独立的载体上。
可将一个以上拷贝的核酸序列插入到宿主细胞中以提高基因产物的产率。通过将至少一个以上其它拷贝的序列整合到宿主细抱基因组中或者通过包括可扩增选择性标记基因与所述核酸序列,其中通过在存在适宜选择性标记的条件下培养含扩增拷贝的选择性标记基因,由此增加了核酸序列的拷贝数的细胞可筛选所述细胞,这样可以使核酸序列拷贝数增加。WO94/14968中描述了用于获得基因组DNA序列扩增的方便的方法。
用于连接上述元件以构建重组表达载体的方法是本领域技术人员众所周知的(参见例如Sambrook等,1989,同上文)。
制备在本发明的方法中,采用本领域的已知方法于适宜制备透明质酸的营养培养基中培养芽孢杆菌属宿主细胞。例如,可将该细胞在实验室或工业发酵罐中,用适宜的培养基,在允许透明质酸合成中所涉及的酶表达和/或透明质酸分离的条件下,采用摇瓶培养、小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法进行培养。使用本领域已知的方法,在含有碳和氮源以及无机盐的适宜营养培养基中进行培养。适宜的培养基可以从供应商处得到或可根据已经公布(例如,在美国典型培养物保藏中心的目录中)的组成来制备。分泌的透明质酸可直接从培养基中回收。
分离的可采用本领域的已知方法分离得到的透明质酸。可采用本领域的已知方法回收得到的多肽。例如,可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收透明质酸。然后可采用本领域的已知的多种方法进一步纯化分离的透明质酸,所述方法包括(但不限于)层析法(例如,离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳方法(例如,准备型等电焦距),差异溶解(differentialsolubility)(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见例如ProteinPurification,J.-C.Janson和Lars Ryden编,VCH出版公司,New York,1989)。
在本发明的方法中,芽孢杆菌属宿主细胞制备大于约4g、优选大于约6g,更优选大于约8g,甚至更优选大于约10g,及最优选大于约12g透明质酸/每升。
缺失/破坏基因缺失或置换技术可用于完全除去可选择的标记基因或其它不需要的基因。在所述方法中,可通过使用已经构建为紧接地包含侧接于可选择的标记基因的5’和3′区的质粒的同源重组完成可选择的标记基因的缺失。可在能够使得质粒构建入细胞的许可温度下将紧接的5’和3′区联合第二可选择的标记引入至芽孢杆菌属细胞中的温度敏感性质粒,例如pE194上。然后将细胞移至非许可温度下来筛选含有整合至染色体一个同源侧翼区上的质粒的细胞。通过筛选第二可选择的标记完成质粒整合的筛选。整合后,通过将细胞移至许可温度中不经选择而传若干代来刺激在第二同源侧翼区上重组事件。将所述细胞铺板以获得单一克隆,然后检测克隆中两个可选标记的缺失(参见例如Perego,1993,INA.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillus subtilis and Other Gram-Positive Bacteria,Chapter 42,American Society of Microbiology,Washington,D.C.,1993)。
还可以通过在突变细胞中导入包含缺陷基因5′和3′区,而缺少可选择的标记基因的核酸片段,然后在反选择培养基上选择的同源重组方法除去可选择的标记基因。通过同源重组,用缺少可选择的标记基因的核酸片段取代含有可选择的标记基因的缺陷基因。还可以采用本领域其它已知方法。
美国专利No.5,891,701公开了缺失包括spollAC、aprE、NPRE和amyE的若干基因的方法。
还可以通过上述方法如用cypX(登记号BG 12580)和/或yvmC(登记号BG14121)合成红色素除去其它不需要的生物化合物。
在一个优选的实施方案中,所述芽孢杆菌属宿主细胞不用任何异源性或外源性可选标记进行标记。在另一优选的实施方案中,所述芽孢杆菌属宿主细胞不能生成任何由cypX和yvmC合成的红色素。
编码具有UDP-葡萄糖6-脱氢酶活性、UDP葡萄糖焦磷酸化酶活性或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列本文中将术语“UDP-葡萄糖6-脱氢酶活性”定义为能在存在2NAD+和水时催化UDP-葡萄糖转化为UDP-二磷酸葡萄糖醛酸酯和2NADH的UDP葡萄糖NAD+6-氧化还原酶活性。为本发明的目的,可根据Jaenicke和Rudolph,1986,Biochemistry 257283-7287所述方法确定UDP-葡萄糖6-脱氢酶活性。将一单位UDP-葡萄糖6-脱氢酶活性定义为于25℃,pH 7时每分钟制备1.0μ摩尔的UDP-葡萄糖醛酸。
本文将术语“UDP葡萄糖焦磷酸化酶活性”定义为能在存在UTP时催化葡糖-1-磷酸转化为氯喹和UDP-葡萄糖的UTPCL-D-葡萄糖-1-磷酸尿甙基转化酶活性。为本发明的目的,可根据Kamogawa等,1965,J.Biochem.(Tokyo)57758-765或Hansen等,1966,Method Enzymol.8248-253所述方法确定UDP葡萄糖焦磷酸化酶活性。将一单位UDP葡萄糖焦磷酸化酶活性的定义为于25℃,pH 7时每分钟制备1.0p摩尔的UDP-葡萄糖。
本文将术语“UDP-N-乙酰葡糖胺焦磷酸化酶活性”定义为能在存在UTP时催化N-乙酰-alpha-D-葡糖胺-1-磷酸转化为氯喹和UDP-N-乙酰-alpha-D-glucoamine的UTPN-乙酰-alpha-D-glucoamine-1-磷酸尿苷酰转移酶活性。为本发明的目的,可根据Mangin-Lecreuix等,1994,J.Bacteriology1765788-5795所述方法确定UDP-N-乙酰葡糖胺焦磷酸化酶活性。将一单位UDP-N-乙酰葡糖胺焦磷酸化酶活性定义为于25℃,pH 7时每分钟制备1.0μ摩尔的UDP-N-乙酰-alpha-D-glucoamine。
本文中所使用的术语“分离的核酸序列”指一种基本上不含其它核酸序列的核酸序列,例如通过琼脂糖电泳测定纯度为至少约20%、优选至少约40%、更优选至少约60%、甚至更优选至少约80%、最优选至少约90%。例如,分离的核酸序列可通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆过程来获得。所述克隆过程可包括切割和分离含编码该多肽的核酸序列的目的核酸片段,将该片段插入到一种载体分子中,并将该重组载体引入到一种宿主细胞中,在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述核酸序列可以是基因组DNA、cDNA、半合成、合成来源的或其任意组合。
在第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO41有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%,以及甚至最优选至少约97%的同一性,所述多肽具有UDP-葡萄糖6-脱氢酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ IDNO41中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
在另一第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO43有至少约90%、优选至少约95%,更优选至少约97%的同一性,所述多肽具有UDP葡萄糖焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ IDNO43中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
在另一第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO45有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%,以及甚至最优选至少约97%的同一性,所述多肽具有UDP-N-乙酰葡糖胺焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ ID NO45中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
为了本发明的目的,使用Clustal法(Higgins,1989,CABIOS 5151-153)使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数缺口罚分10,缺口长度罚分0.1,和分数矩阵(scorematrix)blosum62mt2来确定两个氨基酸序列间的同一性程度。
优选地,本发明的核酸序列所编码的多肽含有SEQ ID NO41、SEQ IDNO43或SEQ ID NO45的氨基酸序列或其等位变体或其分别具有UDP-glucose6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。在更优选的实施方案中,本发明的核酸序列所编码的多肽包含SEQ ID NO41、SEQ ID NO43或SEQ ID NO45的氨基酸序列。在另一优选的实施方案中,本发明的核酸序列多编码的多肽包含SEQ ID NO41,SEQ ID NO43,或SEQ ID NO45的氨基酸序列或其等位变体或其片段,其中多肽片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。在另一优选的实施方案中,本发明的核酸序列所编码的多肽含有SEQ ID NO41、SEQ ID NO43或SEQ IDNO45的氨基酸序列。
本发明还包括编码多肽的核酸序列,所述多肽含有SEQ ID NO41、SEQ ID NO43或SEQ ID NO45的氨基酸序列,其由于遗传密码的简并性而与SEQ ID NO40,SEQ ID NO42,或SEQ ID NO44不同。本发明还涉及分别编码SEQ ID NO41、SEQ ID NO43或SEQ ID NO45的片段的SEQ ID NO40、SEQ ID NO42或SEQ ID NO44亚序列,所述片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。
SEQ ID NO40的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO40所包含的和酸序列。优选地,亚序列包含1020核苷酸、更优选至少1080核苷酸、和最优选至少1140核苷酸。SEQ ID NO41的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含340氨基酸残基、更优选至少360氨基酸残基、和最优选至少380氨基酸残基。
SEQ ID NO42的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO42所包含的和酸序列。优选地,亚序列至少包含765核苷酸、更优选至少810核苷酸、和最优选至少855核苷酸。SEQ ID NO43的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含255氨基酸残基、更优选至少270氨基酸残基、和最优选至少285氨基酸残基。
SEQ ID NO44的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO44所包含的和酸序列。优选地,亚序列至少包含1110核苷酸、更优选至少1200核苷酸、和最优选至少1290核苷酸。SEQID NO45的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含370氨基酸残基、更优选至少400氨基酸残基、和最优选至少430氨基酸残基。
一个等位基因变体指占据相同染色体位点的一个基因的两个或多个可选形式中的任何一个。等位基因变异通过突变自然产生,并可以导致群体内表型的多态性。基因突变可以是沉默突变(即,在所编码的多肽中没有改变)或可以编码氨基酸序列发生改变的多肽。多肽的等位变体为由基因的等位变体所编码的多肽。
在第二个实施方案中,本发明涉及与SEQ ID NO40有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%、和甚至最优选至少约97%同一性的分离的核酸序列。
在另一第二个实施方案中,本发明涉及与SEQ ID NO42有至少约90%、优选至少约95%、和更优选至少约97%同一性的分离的核酸序列。
在另一第二个实施方案中,本发明涉及与SEQ ID NO44有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%、和甚至最优选至少约97%同一性的分离的核酸序列。
为了本发明的目的,使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数缺口罚分15,缺口长度罚分6.6,和分数矩阵swgapdnamt来确定两个核酸序列间的同一性程度。
在第三个实施方案中,本发明涉及编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列,该核酸序列在非常低的严紧条件下、优选低严紧条件下,更优选中严紧条件下、更优选中-高严紧条件下,更优选高严紧条件下以及最优选非常高严紧条件下与(i)SEQ ID NO40、SEQ ID NO42或SEQ IDNO44的核酸序列,(ii)包含在SEQ ID NO40、SEQ ID NO42或SEQ IDNO44中的cDNA序列,或(iii)(i)或(ii)的互补链杂交(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO40、SEQ ID NO42或SEQ ID NO44的亚序列可以是至少100个核苷酸或优选至少200个核苷酸。此外,各亚序列可编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
SEQ ID NO40、SEQ ID NO42或SEQ ID NO44的核酸序列,或其亚序列,以及SEQ ID NO41、SEQ ID NO43或SEQ ID NO45氨基酸序列,或其片段,均可用于设计核酸探针从而根据本领域众所周知的方法分别鉴别和克隆来自不同属或种的菌株的编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。特别地,所述探针可用于在标准Southern印迹步骤后,与目的属或种的基因组或cDNA杂交,从而鉴别和分离其中的相应基因。所述探针可相当地短于全长序列,但长度上至少为15、优选至少为25,而更优选至少为35个核苷酸。也可以使用较长的探针。可以使用DNA和RNA探针。将所述探针进行典型地标记(例如,用32P、3H、35S、生物素或抗生物素蛋白)而用于检测相应基因。所述探针包含于本发明中。
因此,可从所述其它生物体中制备的基因组DNA或cDNA文库中筛选与上述探针杂交且编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。可采用琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自所述其它生物体的所述基因组或其它DNA。可将来自文库或分离的DNA的DNA转至并固定在硝酸纤维或其它适宜的载体材料上。为了鉴别与SEQ ID NO40、SEQ ID NO42或SEQ ID NO44,或其亚序列同源的克隆或DNA,将所述载体材料用于Southern印迹。为本发明的目的,杂交显示出核酸序列与和SEQ ID NO40、SEQ ID NO42或SEQ ID NO44所示核酸序列、其互补链或其亚序列相应的标记的核酸探针在非常低至非常高严紧条件下杂交。采用X光片检测与核酸探针在这些条件下杂交的分子。
在一个优选的实施方案中,核酸探针是编码SEQ ID NO41、SEQ IDNO43或SEQ ID NO45或其亚序列的多肽的核酸序列。在另一优选的实施方案中,核酸探针是SEQ ID NO40、SEQ ID NO42或SEQ ID NO44。在另一优选的实施方案中,核酸探针是包含在质粒pMRT106中的核酸序列,所述质粒包含于大肠杆菌NRRLB-30536中,其中核酸序列编码具有UDP-葡萄糖6-脱氢酶,UDP-葡萄糖焦磷酸化酶,和UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽。
对长度至少100个核苷酸的长探针而言,将非常低至非常高严紧条件定义为在42℃ 5×SSPE、0.3%SDS,200μg/ml剪切并变性的鲑精DNA,以及对于非常低和低严紧度来说25%甲酰胺,对于中和中-高严紧度来说35%甲酰胺,或对于高和非常高严紧度来说50%甲酰胺中,根据标准Southern印迹分析进行预杂交和杂交。
对长度至少100个核苷酸的长探针而言,最终用2×SSC、0.2%SDS优选在至少45℃(非常低严紧度)、更优选在至少50℃(低严紧度)、更优选在至少55℃(中严紧度)、更优选在至少60℃(中-高严紧度)、甚至更优选在至少65℃(高严紧度)以及最优选在至少70℃(非常高严紧度)将载体材料洗涤3次,每次15分钟。
对长度为约15个核苷酸至约70个核苷酸的短探针而言,将严紧条件定义为相对于按照Bolton和McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA481390)计算的理论Tm低5℃~10℃的温度下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸氢二钠、0.1mM ATP,和0.2mg酵母RNA/ml中,根据标准Southern印迹分析进行预杂交,杂交,和杂交后洗涤。
对长度为约15个核苷酸至约70个核苷酸的短探针而言,将载体材料在低于理论Tm 5℃~10℃的温度下,在6×SSC+0.1%SDS中洗涤一次,15分钟,然后用6×SSC洗涤2次,每次15分钟。
在第四个实施方案中,本发明涉及分离的核酸序列,其编码含有包含一个或多个氨基酸的取代、缺失和/或插入的SEQ ID NO41、SEQ ID NO43或SEQ ID NO45的氨基酸序列的多肽的变体。
变体多肽的氨基酸序列可通过插入或缺失一个或多个氨基酸残基和/或用不同的氨基酸残基取代一个或多个氨基酸残基而与SEQ ID NO41、SEQID NO43或SEQ ID NO45的氨基酸序列有所不同。优选,氨基酸改变是微小性质的改变,即不会显著影响所述蛋白质折叠和/或活性的保守性氨基酸取代;小缺失,通常缺失1-约30个氨基酸;小的氨基-或羧基-末端延伸,如氨基-末端甲硫氨酸残基;最多约20-25个残基的小接头肽或有利于通过改变净电荷或另一功能,例如聚-组氨酸序列、抗原表位或结合结构域而纯化的小的延伸。
保守性取代的实例包括下组内的取代,碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酸和天东氨酸),疏水氨基酸(亮氨酸,异亮氨酸和缬氨酸),芳香族氨基酸(苯丙氨酸,色氨酸和酪氨酸),和小分子氨基酸(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的,如,H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York中所述。最常发生的互换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及其相反互换。
修饰本发明的核酸序列对于合成于所述多肽基本相似的多肽是必需的。“基本相似”于所述多肽是指所述多肽的非天然形式。这些多肽经基因工程改造而在一定程度上不同于从其天然来源分离的多肽,例如,在比活性、热稳定性、最佳pH等方面有所不同的变体。可根据SEQ ID NO40、SEQ IDNO42或SEQ ID NO44的多肽编码部分指示的核酸序列,如其亚序列,和/或通过导入核苷酸取代来构建变体序列,所述核苷酸取代不产生由所述核酸序列编码的多肽的另一氨基酸,但对应于用于生产所述酶的宿主生物所偏好的密码子使用特点,或通过导入可产生不同氨基酸序列的核苷酸取代来构建所述变体序列。有关核苷酸取代的一般描述参见例如Ford等,1991, Protein Expression和Purification 295-107。
对本领域技术人员显而易见的是,可以在对于所述分子的功能非常重要的区域外进行所述取代,这样仍得到活性多肽。根据本领域已知的方法,如定点诱变或丙氨酸所描诱变(参见例如Cunningham和Wells,1989,Science2441081-1085)可鉴定对于本发明分离的核酸序列所编码的多肽的活性至关重要的氨基酸残基,因此优选不经过取代即可完成所述鉴定。在后一种技术中,在分子的每个正电荷残基处诱导突变,然后检测所得突变分子的酶活性以鉴定对于分子活性至关重要的氨基酸残基。底物-酶作用位点还可通过对核磁共振、晶体照相术或光亲和标记等技术所测定的三维结构的分析来确定(参见例如de Vos等,1992,Science 255306-312;Smith等,1992,Journal of Molecular Biology 224899-904;Wlodaver等,1992,FEBSLetters 30959-64)。
由本发明分离的核酸序列编码的多肽具有至少20%、优选至少40%、更优选至少60%、甚至更优选至少80%、甚至更优选至少90%以及最优选至少100%的SEQ ID NO41的多肽的UDP-葡萄糖6-脱氢酶的活性、SEQIDNO43的多肽的UDP葡萄糖焦磷酸化酶活性或SEQ ID NO45的多肽的UDP-N-乙酰葡糖胺焦磷酸化酶活性。
本发明的核酸序列可获自任何属的微生物。为达到本发明的目的,此处与给定来源一起使用的术语“获自”是指由核酸序列编码的多肽是由该核酸序列的来源或已插入了所述来源的核酸序列的细胞所生产的。在一个优选的实施方案中,由本发明的核酸序列多肽为细胞外分泌。
核酸序列可获自细菌来源。例如,这些多肽可以获自革兰氏阳性细菌如杆菌菌株,例如,Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、,短芽胞杆菌、,短芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌或苏芸金芽胞杆菌或链霉菌属,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌,例如,大肠杆菌或假单胞杆菌(Pseudomonas sp)。
在一个优选的实施方案中,核酸序列可获自链球菌属或巴斯德菌属菌株。
在更优选的实施方案中,核酸序列获自似马链球菌,酿脓链球菌,乳房链球菌或马链球菌兽瘟亚种或出血败血性巴斯德菌菌株。
在最优选的实施方案中,核酸序列获自似马链球菌,例如,SEQ ID NO40、SEQ ID NO42或SEQ ID NO44中所示核酸序列。在另一最优选的实施方案中,核酸探针是包含在质粒pMRT106中的序列,所述质粒包含于大肠杆菌NRRL B-30536中。在更加最优选的实施方案中,核酸序列是SEQ IDNO40、SEQ ID NO42或SEQ ID NO44。
这些种的菌株很容易从各种收集中心,如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSM)、真菌菌株保藏中心(CBS)和农业研究服务专利培养物保藏中心(Agricultural Research ServicePatent Culture Collection)北方地区研究中心(NRRL)。
此外,使用上述探针可从其它来源,包括分离自自然界(例如,土壤、堆肥、水等)的微生物中鉴定和获得所述核酸序列。从自然环境中分离微生物的方法是本领域众所周知的。通过类似地筛选另一微生物的基因组或cDNA文库可得到所述核酸序列。一旦用所述探针检测到了编码多肽的核酸序列后,可采用本领域普通技术人员已知的技术(参见例如Sambrook等,1989,同上文)分离或克隆所述序列。
本发明还涉及含有SEQ ID NO40、SEQ ID NO42和SEQ ID NO44的多肽编码序列中至少一个突变的突变核酸序列,其中突变核酸序列编码分别包含SEQ ID NO42、SEQ ID NO43和SEQ ID NO45的多肽。
用于分离和克隆编码多肽的核酸序列的方法是本领域已知的,所述方法包括从基因组DNA中分离,从cDNA中制备,或其联合。获自所述基因组DNA的本发明的核酸序列的克隆可通过,例如,使用众所周知的聚合酶链反应(PCR)或表达文库的抗体筛选从而检测具有共有结构特点的克隆的DNA片段的方法实施。参见例如Innis等,1990,PCRA GUIDE TOMETHODS and Application,Academic Press,New York。可使用其它核酸扩增方法如连接酶链反应(LCR),连接活化转录(ligated activated transcription(LAT))和基于核酸序列的扩增(NASBA)。核酸序列还可从链球菌菌株,或另一或相关的生物体中克隆并由此,例如,可以是核酸序列的多肽编码区的等位或种属变体。
本发明还涉及包含可操作性连接于一个或多个控制序列的本发明的核酸序列的核酸构建体,所述控制序列在与所述控制序列相适应的条件下在适宜的宿主细胞中指导编码序列的表达。
本发明还涉及包含本发明核酸序列,启动子以及转录和翻译终止信号的重组表达载体。
本发明还涉及包含本发明的核酸序列重组宿主细胞,其可有益地用于多肽的重组制备中。
本发明还涉及制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养宿主细胞;和(b)回收多肽。
在本发明的制备方法中,采用本领域的已知方法将细胞培养于适宜制备多肽的营养培养基中。例如,可采用摇瓶培养和在适宜的培养基中和在适宜多肽表达和/或分离的条件下在实验室或工业发酵罐中实施的小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法培养细胞。在包含碳源和氮源以及无机盐的适宜营养培养基中,采用本领域已知方法实施培养。适宜的培养基可获自商业供应商或可根据已经公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌至营养培养基中,则可直接从培养基中回收多肽。如果多肽未分泌,则可从细胞裂解物将其回收。
可采用特异性针对多肽的本领域的已知方法检测多肽。这些检测方法可包括使用特异性抗体,生成酶产物,或酶底物的消失。
例如,酶检测法可用于确定本说明所述的多肽的活性。
可采用本领域的已知方法回收得到的多肽。例如,可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收多肽。
可采用本领域的已知的多种方法纯化多肽,所述方法包括(但不限于)层析法(例如,离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳方法(例如,准备型等电焦距),差异溶解(differential solubility)(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见例如Protein Purification,J.-C.Janson和Lars Ryden编,VCH出版公司,New York,1989)。
本发明还涉及由上述核酸序列编码的,具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的分离的多肽。
下述实施例用于进一步描述本发明,而不应将其理解为对本发明范围的限制。
实施例引物和寡核苷酸全部引物和寡核苷酸均通过购买获得(MWG Biotech INC.,High Point,NC)。
实施例1似马链球菌hasA基因和枯草芽孢杆菌tuaD、gtaB和gcaD基因的PCR扩增和克隆。
从质粒pKKseD(Weigel,1997,Journal of Biological Chemistry 27232539-32546)中经PCR扩增出似马链球菌透明质酸合酶基因(hasA,登记号AF023876,SEQ ID NOs1[DNA序列]和2[推导的氨基酸序列]),所使用的引物1和2为引物15’-GAGCTCTATAAAAATGAGGAGGGAACCGAATGAGAACATTAAAAAACCT-3’(SEQ ID NO3)引物25’-GTTAACGAATTCAGCTATGTAGGTACCTTATAATAATTTTTTACGTGT-3’(SEQ ID NO4)
在50μl反应中一式三份实施PCR扩增,所述反应含有如下成分1ngpKKseD DNA,引物1和2各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II(Applied Biosystems,INC.,Foster City,CA)和2.5单位AmpliTaq GoldTMDNA聚合酶(Applied Biosystems,INC.,Foster City,CA)。在RoboCycler 40 thermacycler(Stratagene,INC.,La Jolla,CA)中实施反应,反应条件95℃9分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟3个循环;95℃1分钟,55℃1分钟,72℃1分钟27个循环;72℃5分钟1个循环。采用0.8%琼脂糖凝胶以及44 mM Tris碱,44mM硼酸,0.5mM EDTA缓冲液(0.5×TBE)使PCR产物显影。所要片段为约1200bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1200bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌感受态细胞。在加入了100μg氨卡青霉素/ml的2×酵母-胰胨(YT)琼脂板上生长16小时后,于37℃下选择转化株。使用QIAGEN自动仪(QIAGEN,Valencia,CA),按照厂商说明纯化来自这些转化株的质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200bp PCR片段的质粒命名为pCR2.1-sehasA(图3)。
引物35’-GTTGACGATGGAAGTGCTGA-3’(SEQ ID NO5)引物45’-ATCCGTTACAGGTAATATCC-3’(SEQ ID NO6)引物55′-TCCTTTTGTAGCCCTATGGA-3′(SEQ ID NO7)引物65′-TCAGCACTTCCATCGTCAAC-3′(SEQ ID NO8)引物75′-GGATATTACCTGTAACGGAT-3′(SEQ ID NO9)引物85′-TCCATAGGGCTACAAAAGGA-3′(SEQ ID NO10)从枯草芽孢杆菌168(BGSC 1A1,Bacillus Genetic Stock Center,Columbus,OH)中经PCR扩增出枯草芽孢杆菌UDP-葡萄糖-6-脱氢酶基因(tuaD,登记号BG12691,SEQ ID No11[DNA序列]和12[推导的氨基酸序列]),所使用的引物9和10为引物95’-GGTACCGACACTGCGACCATTATAAA-3’(SEQ ID NO13)引物105′-GTTAACGAATTCCAGCTATGTATCTAGACAGCTTCAACCAAGTAACACT-3′(SEQ ID NO14)在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分50ng枯草芽孢杆菌168染色体DNA,引物9和10各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTMDNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1400 bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1400bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200 bp PCR片段的质粒命名为pCR2.1-tuaD(图4)。
引物115’-AGCATCTTAACGGCTACAAA-3’(SEQ ID NO15)引物125′-TGTGAGCGAGTCGGCGCAGA-3′(SEQ ID NO16)引物1 35’-GGGCGCCCATGTAAAAGCAT-3’(SEQ ID NO17)引物145’-TTTGTAGCCGTTAAGATGCT-3’(SEQ ID NO18)引物15
5′-TCTGCGCCGACTCGCTCACA-3′(SEQ ID NO19)引物165′-ATGCTTTTACATGGGCGCCC-3′(SEQ ID NO20)从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UTP-葡萄糖-1-磷酸尿苷酰基转移酶基因(gtaB,登记号BG10402,SEQ ID No21[DNA序列]和22[推导的氨基酸序列]),所使用的引物17和18为引物175’-TCTAGATTTTTCGATCATAAGGAAGGT-3’(SEQ ID NO23)引物185′-GTTAACGAATTCCAGCTATGTAGGATCCAATGTCCAATAGCCTTTTTGT-3’(SEQ ID NO24)在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分50ng枯草芽孢杆菌168染色体DNA,引物17和18各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTMDNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约900bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将900bpPCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌OneShotTM感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gtaB(图5)。
引物195’-AAAAAGGCTTCTAACCTGGC-3’(SEQ ID NO25)引物205’-AAACCGCCTAAAGGCACAGC-3’(SEQ ID NO26)
引物215’-GCCAGGTTAGAAGCCTTTTT-3’(SEQ ID NO27)引物225′-GCTGTGCCTTTAGGCGGTTT-3′(SEQ ID NO28)从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UDP-N-乙酰葡糖胺焦磷酸化酶基因(gcaD,登记号BG10113,SEQ ID No29[DNA序列]和30[推导的氨基酸序列]),所使用的引物23和24为引物235’-GGATCCTTTCTATGGATAAAAGGGAT-3’(SEQ ID NO31)引物245’-GTTAACAGGATTATTTTTTATGAATATTTTT-3’(SEQ ID NO32)在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分50ng枯草芽孢杆菌168染色体DNA,引物23和24各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTMDNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1500bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1500bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌OneShotTM感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gcaD(图6)。
引物255’-CAGAGACGATGGAACAGATG-3’(SEQ ID NO33)引物265’-GGAGTTAATGATAGAGTTGC-3’(SEQ ID NO34)引物27
5’-GAAGATCGGGAATTTTGTAG-3’(SEQ ID NO35)引物285′-CATCTGTTCCATCGTCTCTG-3′(SEQ ID NO36)引物295’-GCAACTCTATCATTAACTCC-3’(SEQ ID NO37)引物305’-CTACAAAATTCCCGATCTTC-3’(SEQ ID NO38)实施例2hasA/tuaD/gtaB操纵子的构建质粒pDG268Δneo-cryIIIA stab/Sav(美国专利No.5,955,310)和pCR2.1-tuaD(实施例1,图4)用KpnI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)凝胶纯化来自pDG268Δneo-cryIIIAstab/Sav的较大的载体片段(约7700bp)和来自pCR2.1-tuaD的较小的tuaD片段(约1500bp)。用T4 DNA连接酶(RocheApplied Science;Indianapolis,IN)按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过KpnI+HpaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上进行分析。存在约1500bp的KpnI/HpaI tuaD片段即可鉴定为正确的质粒并将其命名为pHA1(图7)。
质粒pHA1和pCR2.1-gtaB(实施例1,图5)用XbaI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9200bp)和来自pCR2.1-gtaB的较小的gtaB片段(约900bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约900bp的XbaI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA2(图8)。
质粒pHA2和pCR2.1-sehasA(实施例1,图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA3(图9)。
实施例3构建hasA/tuaD/gtaB/gcaD操纵子质粒pHA2(实施例2,图8)和pCR2.1-gcaD(实施例1,图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10,000bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1,400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1400bp的BamHI/HpaI gcaD片段即可鉴定为正确的质粒并将其命名为pHA4(图10)。
质粒pHA4和pCR2.1-sehasA(实施例1,图3)用SacI和KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA4的较大的载体片段(约11,000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1,300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA5(图11)。
实施例4构建hasA/tuaD/gcaD操纵子质粒pHA1(实施例2,图7)和pCR2.1-gcaD(实施例1,图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9,200bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用BamHI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1400 bp的BamHI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA6(图12)。
质粒pHA6和pCR2.1-sehasA(实施例1,图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA6的较大的载体片段(约10,200bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1300bp SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA7(图13)。
实施例5构建枯草芽孢杆菌RB161质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA3(实施例2,图9)用SacI酶切消化。按上述方法纯化酶切消化过的质粒,最后用NotI酶切消化。按上述方法凝胶纯化约3800bp的最小的质粒片段。采用Rapid DNA克隆试剂盒(Roche Applied Science;Indianapolis,IN)按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。枯草芽孢杆菌168Δ4来自枯草芽孢杆菌菌株168(BGSC 1A1,Bacillus Genetic Stock Center,Columbus,OH)并已经在spollAC,APRE,NPRE和amyE基因中进行了缺失。这四个基因的确实基本上按照关于枯草芽孢杆菌A164Δ5所述的方法实施,所述方法详细描述于美国专利No.5,891,701中。
在添加了5μg氯霉素/ml的Tryptose blood agar base(TBAB)琼脂板于34℃生长16小时筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。再将分离菌株置于小琼脂板(minimalplate)上以观察其是否在生成透明质酸。生成透明质酸的分离菌株在最小琼脂板上具有“湿”表型。使用该平板筛选,在37℃下分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱(QIAGEN,Valencia,CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用下列基于hasA、tuaD和gtaB基因序列的合成寡核苷酸对这些转化体实施PCR扩增,以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。
扩增反应(25μl)含有如下成分50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTMDNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件95℃9分钟1个循环;95℃ 1分钟,50℃ 1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因,引物3和16用于证实存在tuaD基因,引物3和22用于证实存在gtaB基因。将枯草芽孢杆菌168Δ4hasA/tuaD/gtaB整合体命名为枯草芽孢杆菌RB158。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB158中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5(缺失spollAC,aprE,nprE,amyE和srfC基因;参见美国专利No.5,891,701)。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌RB161。
实施例6构建枯草芽孢杆菌RB163质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA7(实施例4,图13)用SacI酶切消化。按上述方法纯化酶切消化过的质粒,最后用NotI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。采用Rapid DNA克隆试剂盒按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱(QIAGEN,Valencia,CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用引物3、8、16、22和引物30(实施例1)对这些转化体实施PCR扩增,以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。扩增反应(25μl)含有如下成分50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTMDNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件95℃9分钟1个循环;95℃1分钟,55℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因,引物3和16用于证实存在tuaD基因,引物3和22用于证实存在gtaB基因,引物3和30用于证实存在gcaD基因。将枯草芽孢杆菌168Δ4 hasA/tuaD/gcaB整合体命名为枯草芽孢杆菌RB160。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB160中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gcaD整合体并将其命名为枯草芽孢杆菌RB163。
实施例7构建枯草芽孢杆菌TH-1采用下述步骤从似马链球菌中获得透明质酸合酶(has)操纵子。所述has操纵子含有hasA、hasB、hasC和hasD基因。用HindIII酶切消化约20μg的似马链球菌D181(Kumari和Weigel,1997,Joumal of BiologicalChemistry 27232539-32546)的染色体DNA和在0.8%琼脂糖-0.5×TBE凝胶分辨。从胶上切下3-6kb范围内的DNA并用QIAquick DNA凝胶提取试剂盒按厂商说明进行纯化。然后将回收的DNA插入片段与下述载体DNA连接。
用HindIII酶切消化质粒pUC18(2μg)并用虾碱性磷酸酶按厂商说明(Roche Applied Science;Indianapolis,IN)将5′突出末端(protruding end)去磷酸化。采用Rapid DNA克隆试剂盒按厂商说明连接去磷酸的载体和DNA插入片段。将连接体用于转化大肠杆菌XL10 GOLD Kan感受态细胞(Stratagene,INC.,La Jolla,CA)。将细胞铺于Luria肉汤平板(100μg/ml氨苄青霉素)上并于37℃下培养过夜。用寡核苷酸952-55-1探测含有大约500克隆/板的5块平板,所述寡核苷酸如下述,其是与接近似马链球菌D181hasA基因3’末端的编码链相同的54bp序列(关于ATG翻译起始密码子的A残基的1098-1151位核苷酸)。
引物315′-GTGTCGGAACATTCATTACATGCTTAAGCACCCGCTGTCCTTCTTGTTATCTCC-3′(SEQ ID NO39)用DIG寡核苷酸3′-端标记试剂盒按厂商说明(Roche Applied Science;Indianapolis,IN)对所述寡核苷酸探针实施DIG-标记。按“THE DIG SYSTEMUSER′S GUIDE FOR FILTER HYBRIDIZATION”(Boehringer MannheimGmbH)中所述实施克隆杂交和化学发光检测。
鉴定出与探针杂交的7个克隆。采用QIAGEN自动仪器(QIAGEN,Valencia,CA)并按厂商说明纯化来自这些转化体中一个的质粒DNA并用HindIII酶切消化,然后在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。DNA插入片段显示出约5kb的大小。将这一质粒命名为pMRT106(图14)。
使用EZ∷TNTM<TET-1>插入试剂盒按厂商说明(Epicenter Technologies,Madison,WI)确定克隆片段的DNA序列。测序显示了克隆的插入片段包含似马链球菌hasA基因的后1156bp,其后是称为hasB、hasC和hasD的三个其它基因;推测全部四个基因包含在单操纵子中并因此共转录。似马链球菌hasB基因包含在所述片段的1411-2613位核苷酸(SEQ ID No40[DNA序列]和41[推导的氨基酸序列])中,似马链球菌hasC基因包含在所述片段的2666-3565位核苷酸中(SEQ ID No42[DNA序列]和43[推导的氨基酸序列]),以及似马链球菌hasD基因包含在所述片段的3735-5114位核苷酸(SEQ ID No44[DNA序列]和45[推导的氨基酸序列])中。
由似马链球菌hasB和hasC基因编码的多肽显示其与那些分别由来自酿脓链球菌has操纵子序列(Ferretti等,2001,Proc.Natl.Acad.Sci.美国A。98(8),4658-4663)的hasB和hasC基因编码的多肽有同一性。使用Clustal法(Higgins,1989,CABIOS 5151-153)使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数pairwisealignment,缺口罚分10,缺口长度罚分0.1,和分数矩阵blosum62mt2来确定同一性程度。
氨基酸序列比较显示出似马链球菌HAsB蛋白与来自乳房链球菌的HasB蛋白(SEQ ID NO105)有70%的同一性;似马链球菌HasC蛋白与来自乳房链球菌的HasC蛋白(SEQ ID NO99)有91%的同一性;和似马链球菌HasD蛋白与酿脓链球菌(登记号#Q8P286)的GlmU蛋白(推定的UDP-N-乙酰葡糖胺焦磷酸化酶)有73%的同一性。似马链球菌hasD基因编码的多肽显示出与由枯草芽孢杆菌的gcaD基因所编码的UDP-N-乙酰葡糖胺焦磷酸化酶有50.7%的同一性。
质粒pHA5(实施例3,图11)用HpaI和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约11,000bp)。质粒pMRT106用HindIII酶切消化,用Klenow片段填补粘性末端,用BamHI酶切消化DNA。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化较小的插入片段(约1000bp,似马链球菌hasD基因的后2/3)。
用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI+NotI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上进行分析。存在约1,100bp的BamHI/NotI hasD片段即可鉴定为正确的质粒并将其命名为pHA8(图15)。用HindIII酶切消化这一质粒并用T4 DNA连接酶将其连接,将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过HindIII酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约9,700bp的单条带即可鉴定为正确的质粒并将其命名为pHA9(图16)。
质粒pHA9用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约2,500bp的较小片段。质粒pDG268MCSΔNEO/scBAN/Sav(美国专利No.5,955,310)用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约6,800bp的较大载体片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SalI加HindIII酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约1600bp的SalI/HindIII片段即可鉴定为正确的质粒并将其命名为pHA10(图17)。
质粒pHA10用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约8100bp)。质粒pMRT106用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约4,100bp的较大插入片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物用于转化枯草芽孢杆菌168Δ4。于37℃在加入5μg氯霉素/ml的TBAB琼脂板上筛选转化体。将约100个转化体点在添加了氯霉素(5μg/ml)的TBAB和添加了新霉素(10μg/ml)的TBAB上以计数氯霉素抗性、新霉素敏感性克隆;该表型可用于指示双交换至amyE基因座中。鉴定少量所述克隆,所述克隆均表现出“湿”表型,该表型指示透明质酸的生成。选择一个并将其命名为枯草芽孢杆菌168Δ4∷scBAN/se hasA/hasB/hasC/hasD。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌168Δ4∷scBAN/sehasA/hasB/hasC/hasD中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌TH-1。
实施例8构建枯草芽孢杆菌RB184来自似马链球菌(实施例1)的hasA基因和tuaD基因(枯草芽孢杆菌hasB的同系物)(实施例1)在短“共有序列”amyQ(scBAN)启动子(美国专利No.5,955,310)控制下进行克隆。
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6,800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA5(实施例3,图11)用HpaI酶切消化。然后按上述方法纯化酶切消化过的质粒,最后用XbaI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。然后通过首先在85℃下,30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl,1μl 1U/μl的T4 DNA聚合酶(Roche Applied Science;Indianapolis,IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。然后按上述方法凝胶纯化约11,000bp的最大质粒片段并采用Rapid DNA克隆试剂盒按厂商说明再连接。将连接混合物转化至大肠杆菌SURE感受态细胞。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约11kb片段带即可鉴定为正确的质粒并将其命名为pRB157(图18)。
质粒pRB157用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约2,632bp的最小的质粒片段。然后将回收的DNA插入片段与上述载体DNA连接。
在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。采用引物3、8和16(实施例1)针对这些转化体实施PCR扩增以证实hasA和tuaD存在枯草芽孢杆菌转化体操纵子中以及所述hasA和tuaD的完整性。扩增反应(25ul)含有如下成分50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTMDNA聚合酶。在RoboCycler 40thermacycler中实施反应,反应条件95℃9分钟1个循环;95℃1分钟,55℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因而引物3和16用于证实存在tuaD基因。将枯草芽孢杆菌168Δ4hasA/tuaD整合体命名为枯草芽孢杆菌RB183。
枯草芽孢杆菌RB183的基因组DNA也用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD整合体并将其命名为枯草芽孢杆菌RB184。
实施例9构建枯草芽孢杆菌RB187将枯草芽孢杆菌RB161制备为感受态然后用cat缺失的质粒pRB115(Widner等,2000,Journal of Industrial Microbiology&Biotechnology 25204-212)转化。在非许可温度45℃下,采用红霉素(5μg/ml)筛选法实施对直接整合入染色体的筛选。在该温度下,复制的起点是无活性的。只有将质粒整合入细菌染色体上的cat基因,细胞才能保持红霉素抗性。将这些所谓的“整合体(integrant)”保持在45℃以确保在该温度下的生长和筛选。为了允许质粒的缺失或“looping out”(其将导致染色体多数cat基因的缺失),将整合体在Luria-Bertani(LB)培养基中于34℃的许可温度下不经筛选培养很多代。在该温度下,复制的PE194起点是活性的并启动质粒从基因组中的切除(Molecular Biological Methods for Bacillus,edited by C.R.Harwoodand S.M.Cutting,1990,John WILEY and Sons Ltd。)。
然后将细胞铺于非选择性LB琼脂板上并按下列标准鉴定包含cat基因中的缺失和基于PE194的复制子缺失的克隆(1)氯霉素敏感性显示存在cat缺失;(2)红霉素敏感性显示不存在由载体PRB115编码的红霉素抗性基因;和(3)PCR证实在所研究菌株中存在cat的缺失。使用引物32和33实施PCR以证实cat基因在amyE基因座的缺失引物325′-GCGGCCGCGGTACCTGTGTTACACCTGTT-3′(SEQ ID NO46)引物335’-GTCAAGCTTAATTCTCATGTTTGACAGCTTATCATCGG-3’(SEQ ID NO47)采用 REDextract-N-AmpTMPlant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)按如下步骤从潜在缺失株中分离染色体DNA将单芽孢杆菌克隆接种于100μl提取溶液(Sigma Chemical Company,St.Louis,MO)中,于95℃培养10分钟,然后用等体积稀释溶液(Sigma ChemicalCompany,St.Louis,MO)稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR。使用0.8%琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB187。
实施例10构建枯草芽孢杆菌RB192通过缺失氯霉素抗性基因(cat基因)使枯草芽孢杆菌RB184未被标记。可采用实施例9中所述方法实施。将得到的菌株命名为枯草芽孢杆菌RB192。
实施例11构建枯草芽孢杆菌RB194通过缺失枯草芽孢杆菌RB187染色体的cypX区(实施例9)构建枯草芽孢杆菌RB194。所述cypX区包括cypX基因(其编码类细胞色素P450的与发酵期间红色素合成相关的酶)。为了缺失染色体的该区域,构建质粒pMRT086。
采用引物34和35通过PCR从枯草芽孢杆菌BRG-1中扩增出作为单片段的含有cypX-yvmC和yvmB-yvmA操纵子的染色体区。枯草芽孢杆菌BRG1基本上是枯草芽孢杆菌淀粉酶生成株的化学诱变分离株,所述枯草芽孢杆菌淀粉酶生成株基于实施例5中所述的枯草芽孢杆菌A164Δ5遗传背景。该区的序列与枯草芽孢杆菌168型菌株的已经公开的序列相同。
引物345′-CATGGGAGAGACCTTTGG-3′(SEQ ID NO48)引物35
5′-GTCGGTCTTCCATTTGC-3′(SEQ ID NO49)扩增反应(50μl)含有如下成分200ng枯草芽孢杆菌BRG-1染色体DNA,引物34和35各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有1.5mM MgCl2的Expand High Fidelity缓冲液(Roche Applied Science;INDIANAPOLIS,IN)和2.6单位Expand High Fidelity PCR System enzymemix(Roche Applied Science;Indianapolis,IN)。采用QIAGEN tip-20柱按厂商说明获得枯草芽孢杆菌BRG-1染色体DNA。在RoboCycler 40thermacycler(Stratagene,Inc,La Jolla,CA)中实施扩增反应,反应条件95℃3分钟1个循环;95℃1分钟,58℃1分钟,68℃4分钟10个循环;95℃1分钟,58℃1分钟,68℃4分钟+20秒20个循环,然后72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶电泳上分析反应产物。
采用TA-TOPO克隆试剂盒将含有cypX-yvmC和yvmB-yvmA操纵子的所得片段克隆至pCR2.1并按厂商说明(Invitrogen,INC.,Carlsbad,CA)将其转化至大肠杆菌ONESHOTTM细胞。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物和引物36-51实施DNA测序进行鉴定。
将得到的质粒命名为pMRT084(图19)。
引物365′-CGACCACTGTATCTTGG-3′(SEQ ID NO50)引物375’-GAGATGCCAAACAGTGC-3’(SEQ ID NO51)引物385′-CATGTCCATCGTGACG-3′(SEQ ID NO52)引物395′-CAGGAGCATTTGATACG-3′(SEQ ID NO53)引物405′-CCTTCAGATGTGATCC-3′(SEQ ID NO54)引物415’-GTGTTGACGTCAACTGC-3’(SEQ ID NO55)引物425′-GTTCAGCCTTTCCTCTCG-3′(SEQ ID NO56)引物435′-GCTACCTTCTTTCTTAGG-3′(SEQ ID NO57)引物445’-CGTCAATATGATCTGTGC-3’(SEQ ID NO58)引物455′-GGAAAGAAGGTCTGTGC-3′(SEQ ID NO59)引物465′-CAGCTATCAGCTGACAG-3′(SEQ ID NO60)引物475′-GCTCAGCTATGACATATTCC-3′(SEQ ID NO61)引物485′-GATCGTCTTGATTACCG-3′(SEQ ID NO62)
引物495′-AGCTTTATCGGTGACG-3′(SEQ ID NO63)引物505′-TGAGCACGATTGCAGG-3′(SEQ ID NO64)引物515′-CATTGCGGAGACATTGC-3′(SEQ ID NO65)用BsgI酶切消化质粒pMRT084以缺失大部分cypX-yvmC和yvmB-yvmA操纵子,在每端留下约500碱基。用T4 DNA聚合酶处理酶切消化的BsgIDNA。用SmaI酶切消化质粒pECC1(YOUNGMAN等,1984,质粒121-9)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pMRT084的约5,100载体片段和来自pECC1的约1,600bp片段,将其连接在一起,并按厂商说明用于转化大肠杆菌XL1Blue细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2XYT平板上筛选氨卡青霉素-抗性转化体。通过用引物52和53的PCR扩增DNA测序鉴定携带含有缺失的大多数cypX-yvmC和yvmB-yvmA操纵子的正确质粒的转化体。在含有如下成分1ng质粒DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有1.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler(Stratagene,Inc,La Jolla,CA)中实施扩增反应,反应条件95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将这一构建体命名为pMRT086(图20)。
引物525’-TAGACAATTGGAAGAGAAAAGAGATA-3’(SEQ ID NO66)引物535’-CCGTCGCTATTGTAACCAGT-3’(SEQ ID NO67)用ScaI线性化质粒pMRT086并在存在0.2μg氯霉素/ml的情况下将其转化至枯草芽孢杆菌RB128感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时后筛选转化体。转化体使用QIAGEN tip-20柱按厂商说明从若干转化体中制备染色体DNA。通过采用引物36和52、36和53、37和52以及37和53实施针对cypX-yvmC和yvmB-yvmA操纵子缺失的PCR来筛选氯霉素抗性克隆。在含有如下成分50ng质粒DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将得到枯草芽孢杆菌RB128 cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌MaTa17。
用来自枯草芽孢杆菌MaTa17基因组DNA转化枯草芽孢杆菌RB187(实施例9)的感受态细胞。采用QIAGENtip-20柱按厂商说明从该株中获得基因组DNA。
在添加了5μg氯霉素/ml的TBAB平板上并于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。含有5μg氯霉素/ml的TBAB平板上在37℃下对原始转化体实施单克隆分离。将得到的cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌RB194。
实施例12构建枯草芽孢杆菌RB197枯草芽孢杆菌RB197与枯草芽孢杆菌RB194非常相似,唯一的区别在于RB197包含cypX区中较小的缺失在该株中仅缺失部分cypX基因以生成cypX缺失表型。为实现该目的,按下述方法构建质粒pMRT122。
通过用EcoRI/HindIII酶切消化质粒pSJ2739(WO 96/23073)构建质粒pCJ791(图21)并连接至含有来自枯草芽孢杆菌的缺失形式的WPRA基因(细胞壁丝氨酸蛋白酶)的片段。采用下述引物54和55从获自枯草芽孢杆菌DN1885(Diderichsen等,1990,Journal ofBacteriology 1724315-4321)的染色体DNA中扩增WPRA的5′区,并采用下述引物56和57扩增WPRA的3′区。在含有如下成分1ng枯草芽孢杆菌DN1885染色体DNA,引物39和40各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。
用BglII酶切消化随后连接的方法将5’和3’WPRA PCR片段连接,和采用引物54和57对连接混合物片段实施PCR扩增。在含有如下成分1ng连接的片段,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将得到的PCR片段作为EcoRI/HindIII片段克隆至pSJ2739中,结果得到质粒pCJ791(图21)。在添加了1μg红霉素/ml和25μg卡那霉素/ml的TBAB-琼脂糖平板上并于28℃下培养24-48小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用引物54至57按上述条件实施PCR扩增进行鉴定。
引物545’-GGAATTCCAAAGCTGCAGCGGCCGGCGCG-3’(SEQ ID NO68)引物555’-GAAGATCTC GTATACTTGGCTTCTGCAGCTGC-3’(SEQ ID NO69)引物565’-GAAGATCTGGTCAACAAGCTGGAAAGCACTC-3’(SEQ ID NO70)引物575’-CCCAAGCTTCGTGACGTACAGCACCGTTCCGGC-3’(SEQ ID NO71)采用下述引物对58/59和60/61通过SOE将来自质粒pDN1981(美国专利No.5,698,415)的amyL上游序列和5′编码区融合在一起。按下述方法将所得片段克隆至载体pCR2.1以生成质粒pMRT032。在含有如下成分1ng的pDN1981DNA,适宜的引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件95℃9分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟3个循环; 95℃1分钟,55℃1分钟,72℃ 1分钟27个循环,72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段分别为约530和466bp。采用引物对59/60生成最终的SOE片段并采用TA-TOPO克隆试剂盒将其克隆至pCR2.1载体。在添加了100μg/ml氨卡青霉素的2XYT-琼脂糖平板上并于37℃下培养16小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物实施DNA测序进行鉴定。将含有amyL上游序列/5′编码序列融合片段的质粒命名为pMRT032(图22)。
引物585′-CCTTAAGGGCCGAATATTTATACGGAGCTCCCTGAAACAACAAAAACGGC-3′(SEQ ID NO72)引物595′-GGTGTTCTCTAGAGCGGCCGCGGTTGCGGTCAGC-3′(SEQ ID NO73)引物605’-GTCCTTCTTGGTACCTGGAAGCAGAGC-3’(SEQ ID NO74)引物615’-GTATAAATATTCGGCCCTTAAGGCCAGTACCATTTTCCC-3’(SEQID NO75)用NsiI和NotI酶切消化质粒pNNB194(pSK+/pE194;美国专利No.5,958,728),并用Pstl和NotI酶切消化质粒pBEST501(ITAYA等1989Nucleic Acids Research 174410)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194的5,193bp载体片段和来自pBEST501的含有neo基因的1,306bp片段。将分离的片段连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了100μg氨卡青霉素/ml的2X YT平板上筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒(QIAGEN INC.,Valencia,CA)从一个所述转化株中分离质粒DNA,并用NsiI和NotI酶切消化以鉴定所述质粒。将这一质粒命名为PNNB194neo(图23)。
用SacI/NotI酶切消化质粒pNNB194neo并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用Ec1136II酶切消化质粒pPL2419(美国专利No.5,958,728)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194neo的6,478bp载体片段和来自pPL2419的含有oriT的562bp片段。将纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用NsiI、SacI和Bscl酶切消化以鉴定所述质粒。将这一质粒命名为pNNB194neo-oriT(图24)。
用BamHI酶切消化质粒pNNB194neo-oriT并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化酶切消化过的质粒。用T4 DNA连接酶处理纯化的质粒并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用BamHI和ScaI酶切消化以证实BamHI位点的断裂。将得到的质粒命名为pShV3(图25)。
用Sfil和NotI酶切消化质粒pShV2.1-amyEΔ(美国专利No.5,958.728),采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化8696 bp载体片段。为了pShV2.1-amyEΔ的Sfil和NotI位点间插入BamHI位点,按下述步骤构建合成联接子通过将其各50uM混合,煮沸该混合物并缓慢冷却所述混合物,退火引物62和63。
引物625’-GGGCCGGATCCGC-3’(SEQ ID NO76)引物633’-ATTCCCGGCCTAGGCGCCGG-5’(SEQ ID NO77)将纯化的pShV2.1-amyEΔ载体和退火的寡核苷酸连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了30μg氯霉素/ml的LB平板上于37℃下筛选氯霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用BamHI酶切消化以证实BamHI位点的插入。将这一质粒命名为pShV2.1-amyEΔB(图26)。
用SalI/HindIII酶切消化质粒pShV3和pShV2.1-amyEΔB。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pShV3的7033 bp载体片段和来自pShV2.1-amyEΔ的含有amyEΔ的1031bp片段。将凝胶纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用SalI和HindIII酶切消化以鉴定所述质粒。将这一质粒命名为pShV3A(图27)。
用KpnI/XbaI酶切消化质粒pMRT032,在存在dNTP的情况下用Klenow片段DNA聚合酶填补,并采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离约1000bp的片段。将该片段克隆至用EcoRV酶切消化的质粒pShV3a,并按厂商说明转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选氨卡青霉素-抗性转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI/SphI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT036(图28)。
用EcoRI/HindIII酶切消化质粒pMRT036,在存在dNTP的情况下用Klenow片段DNA聚合酶填补,连接并转化至大肠杆菌XL1Blue细胞按厂商说明。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacIIXBAI、PSTL和NdeI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT037(图29)。
采用QIAquick DNA纯化试剂盒按厂商说明在2%琼脂糖-0.5×TBE凝胶上从质粒pDG268Δneo-cryIIIAstaB/Sav(美国专利No.5,955,310)中以Sfil/SacI片段将scBAN/cryIIIA稳定片段分离,将其与用Sfil/SacI酶切消化的质粒pMRT037连接,并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用PSTL的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT041(图30)。
用EcoRI/HindIII酶切消化质粒pMRT041和pCJ791。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT041的约1300bp片段和来自pCJ791的约4500bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI和EcoRI/HindIII的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT064.1(图31)。
使用下述引物对64和65和引物对66和67引物并采用SOE缺失质粒pMRT064.1中2666位上的SacI位点。在含有如下成分1ng的pMRT064.1DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件95℃10分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟25个循环;72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段分别为约400和800bp。采用引物64和67扩增用于克隆返回至pMRT064.1的最终片段。采用TA-TOPO克隆试剂盒将该片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物和引物65,67和68的DNA测序鉴定含有正确质粒转化体。将这一质粒命名为pMRT068(图32),并按厂商说明进一步转化至大肠杆菌DM1细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
引物645’-GGAAATTATCGTGATCAAC-3’(SEQ ID NO78)引物655′-GCACGAGCACTGATAAATATG-3′(SEQ ID NO79)引物665′-CATATTTATCAGTGCTCGTGC-3′(SEQ ID NO80)引物675′-TCGTAGACCTCATATGC-3′(SEQ ID NO81)引物685′-GTCGTTAAACCGTGTGC-3′(SEQ ID NO82)使用引物69和70并采用上述PCR条件实施PCR扩增来缺失质粒pMRT064.1中5463和6025位上的Sac位点。采用TA-TOPO克隆试剂盒(Invitrogen,INC.,Carlsbad,CA)将得到的片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物的DNA测序鉴定含有正确质粒转化体。将这一构建体命名为pMRT069(图33)。
引物695′-CTAGAGGATCCCCGGGTACCGTGCTCTGCCTTTTAGTCC-3′(SEQ IDNO83)引物705’-GTACATCGAATTCGTGCTCATTATTAATCTGTTCAGC-3’(SEQ ID NO84)用BclI/AccI酶切消化质粒pMRT068和pMRT064.1。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT068的约1300bp片段和来自pMRT064.1的约3800bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI和EcoRI/AvaI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将所得构建体命名为pMRT071(图34)。
用AvaI/EcoRI酶切消化质粒pMRT071和pMRT069。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT069的578bp片段和来自pMRT071的4510bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT074(图35)。
按厂商说明,用SacII/NdeI酶切消化实施例11中所述的质粒pMRT084,用T4 DNA聚合酶处理,连接并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨苄青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用Dral的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的质粒命名为pMRT120(图36)。
用HindIII酶切消化质粒pMRT074,用KLENOW片段DNA聚合酶处理并用EcoRI酶切消化。用EcoRI/ECL136II酶切消化质粒pMRT120。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT120的约600bp片段和来自pMRT074的约4300bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SSPL的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT122(图37)。
将质粒pMRT122转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体,所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。采用QIAGENtip-20柱按厂商说明从该菌株中分离基因组DNA并用于转化枯草芽孢杆菌RB187(实施例9)。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于45℃下培养16小时后筛选转化体。在该温度下,PE194复制子不能复制。只有在细菌染色体中保持所述质粒才能使细胞保持红霉素抗性。
借助结果得到染色体上cypX基因部分缺失的同源重组,通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下,复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods forBacillus,edited by C.R.Harwood and S.M.Cutting,1990,John WILEY andSons Ltd.)。
在生长传代若干代后,将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆和透明质酸的生成(1)当铺于最小琼脂板上时,“湿”细胞斑显示透明质酸的生成(2)红霉素敏感性显示缺失基于pE194的质粒,和(3)通过使用上述引物34和45实施PCR确定在所需菌株中存在800bp cypX的缺失。
采用REDextract-N-AmpTMPlant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)按如下步骤从潜在的cypX缺失株中分离染色体DNA将单芽孢杆菌克隆接种于100μl提取溶液中,于95℃培养10分钟,然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR从潜在cypX缺失体中分离染色体DNA。使用0.8%琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB197。
实施例13构建枯草芽孢杆菌RB200按照实施例9中所述用于枯草芽孢杆菌RB187的相同方法缺失枯草芽孢杆菌RB192的cypX基因。将得到的菌株命名为枯草芽孢杆菌RB200.
实施例14构建枯草芽孢杆菌RB202按下述方法构建枯草芽孢杆菌A164Δ5ΔcypX将质粒pMRT122(实施例12)转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体,所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。借助结果得到染色体上cypX基因部分缺失的同源重组,通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下,复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods for Bacillus,edited by C.R.Harwood and S.M.Cutting,1990,John WILEY and Sons Ltd.)。在生长传代若干代后,将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆(1)红霉素敏感性显示缺失基于pE194的质粒,和(2)通过使用上述引物34和35实施PCR确定在所需菌株中存在800bp cypX的缺失。将鉴定的菌株命名为枯草芽孢杆菌A164Δ5ΔcypX。
将枯草芽孢杆菌A164Δ5cypX制成感受态并使用采用QIAGEN tip-20柱按厂商说明分离的枯草芽孢杆菌TH1基因组DNA(实施例7)转化。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。按其“湿”表型鉴定枯草芽孢杆菌A164Δ5ΔcypX hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌RB201。采用实施例9所述相同的方法从枯草芽孢杆菌RB201中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌RB202。
实施例15构建枯草芽孢杆菌MF002(fuaD/gtaB)质粒pHA3(实施例2,图9)用Asp718酶切消化。然后通过首先85℃,30分钟灭活限制性酶平端化酶切消化过的质粒。通过加入10mM dNTP各0.5μl,1μl 1U/μl T4聚合酶并于11℃孵育10分钟实施平端化。最后通过将反应于75℃孵育10分钟灭活聚合酶。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约2522bp的最小的质粒片段。然后将回收的DNA插入片段(tuaD/gtaB)与下述载体DNA连接。
质粒pDG268MCSΔneo/scBAN/Say(美国专利No.5,955,310)用Ecl136II酶切消化。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。
采用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接体转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离出氯霉素抗性和新霉素敏感性转化体。
采用REDextract-N-AmpTMPlant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离染色体DNA,步骤如下将单芽孢杆菌克隆接种于100μl提取溶液中,于95℃培养10分钟,然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-Amp PCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR。
采用下述合成寡核苷酸对这些转化体实施PCR扩增以确定枯草芽孢杆菌转化体操纵子的hasA,gtaB,和tuaD基因的缺失/存在及完整性。引物3和8用于证实存在hasA基因,引物71和引物15用于证实存在tuaD基因,引物20和71用于证实存在gtaB基因。在0.8%琼脂糖-0.5×TBE凝胶中显影PCR反应产物。将鉴定的菌株,枯草芽孢杆菌168Δ4 hasA/tuaD/gtaB整合体,命名为枯草芽孢杆菌RB176。
引物715’-AACTATTGCCGATGATAAGC-3’(结合上游tuaD)(SEQ IDNO85)采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌RB176转化体中分离基因组DNA。将枯草芽孢杆菌RB176基因组DNA用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并在37℃下培养以筛选转化体。
将枯草芽孢杆菌A164Δ5tuaD/gtaB整合体命名为枯草芽孢杆菌RB177。
采用实施例9中所述方法在枯草芽孢杆菌RB177菌株中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌MF002。
实施例16构建pel整合质粒pRB162用SacI和AatII双酶切消化质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6193bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
采用PCR从枯草芽孢杆菌168(BGSC 1A1,Bacillus Genetic StockCenter,Columbus,OH)中扩增枯草芽孢杆菌果胶酶基因的5’和3’片段(pel,登记号BG10840,SEQ ID NO86[DNA序列]和87[推导的氨基酸序列]),所使用的引物为针对5’pel片段的引物72(引入5′Spel限制性酶切消化位点)和73(引入3′SalI限制性酶切消化位点)和针对3′pel片段的引物74(引入5′SacI/BamHI限制性酶切消化位点)和75(引入3’NotI/AatII限制性酶切消化位点)引物725’-ACTAGTAATGATGGCTGGGGCGCGTA-3’(SEQ ID NO88)引物735′-GTCGACATGTTGTCGTATTGTGAGTT-3′(SEQ ID NO89)引物745’-GAGCTCTACAACGCTTATGGATCCGCGGCCGCGGCGGCACACACATCTGGAT-3’(SEQ ID NO90)引物755′-GACGTCAGCCCGTTTGCAGCCGATGC-3′(SEQ ID NO91)在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分50ng的枯草芽孢杆菌168染色体DNA,针对5’pel片段的引物对72/73或针对3’pel片段的引物对74/75各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件95℃9分钟1个循环;95℃1分钟,95℃1分钟,52℃1分钟,72℃1分钟3个循环;52℃1分钟,72℃1分钟3个循环;95℃1分钟,55℃1分钟,72℃1分钟27个循环,72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段为约对于5′pel片段的530bp和对于3’pel片段的530bp。
按厂商说明用TA-TOPO克隆试剂盒将530bp 5’pel和530bp 3’pelPCR片段克隆至pCR2.1并转化至大肠杆菌ONESHOTTM感受态细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并在37℃下培养以筛选转化体。采用QIAGEN自动仪器按厂商说明纯化来自这些转化体的质粒DNA并采用DNA测序确定插入片段的DNA序列,所述DNA测序中使用的上述引物针对5’pel的引物72和73和针对3’pel的引物74和75。将包含530bp和530bp PCR片段的质粒分别命名为pCR2.1-pel 5’和pCR2.1-pel 3’(分别示于图38和39)。
用SacI和AatII双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约530 bp的最小的质粒片段。
然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN)和DNA插入片段(3’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SAcI和Aatll酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约530bp的SacI/Aatll 3′pel片段即可鉴定为正确的质粒并将其命名为pRB161(图40)。
用Spel和SalI双酶切消化质粒pRB161。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5346bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
用Spel和SalI双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约530bp的最小的质粒片段。
然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN/pel 3’)和DNA插入片段(5’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上于37℃下筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过Spel和SalI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约530bp的Spel和SalI 3′pel片段即可鉴定为正确的质粒并将其命名为pRB162(图41)。
实施例17构建pRB156用HpaI酶切消化质粒pHA7(实施例4,图13)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用Asp718酶切消化。然后通过首先在85℃下,30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl,1μl 1U/μl的T4 DNA聚合酶(Roche AppliedScience;Indianapolis,IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约8600bp的最大的质粒片段。然后采用快速DNA克隆试剂盒并按厂商说明将回收的DNA插入片段(pDG268Δneo-cryIIIA stab/sehasA)再连接。
将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约8,755bp的片段即可鉴定为正确的质粒并将其命名为pRB156(图42)。
实施例18构建枯草芽孢杆菌MF009将受控于scBAN启动子的hasA基因导入枯草芽孢杆菌MF002的果胶酸裂合酶基因(pel)座中从而产生枯草芽孢杆菌MF009。
用SacI酶切消化质粒pRB156。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约1,377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB162(实施例16,图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SacI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5850bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在pel基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在pel基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。采用该平板筛选,分离出氯霉素抗性和新霉素敏感性转化体。
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的TBAB琼脂板上并于37℃下培养以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA和tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF009。
实施例19构建枯草芽孢杆菌MF010用NotI酶切消化质粒pDG268MCSΔneo/BAN/Sav(美国专利No.5,955,310)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约185bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB162(实施例16,图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5747bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
使用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。将连接混合物转化至大肠杆菌XLI Blue感受态细胞。在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。通过能提供约7,156bp片段的质粒的线性化即可鉴定为正确的质粒并将其命名为pRB164(图43)。
用SacI酶切消化质粒pRB156(实施例17,图42)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约1377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB164。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SacI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5922bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞中。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在amyE基因座处双交换(cross-over)的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。采用该平板筛选,分离出氯霉素抗性和新霉素敏感性转化体。
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的最小琼脂板上并于37℃下培养16小时以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5 BAN/HASA和scBAN/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF010.
实施例20发酵在多种生长条件下评估表1中所列枯草芽孢杆菌菌株的制备透明质酸的能力。
表1枯草芽孢杆菌菌株启动子/基因互补体catΔcypXΔRB161 scBAN/hasA/tuaD/gtaB nonoRB163 scBAN/hasA/tuaD/gcaD nonoTH-1scBANhasA/hasB/hasC/hasD nonoRB184 scBAN/hasA/tuaD no noRB187 scBAN/hasA/tuaD/gtaB yesnoRB192 scBAN/hasA/tuaD yes noRB194 scBAN/hasA/tuaD/gtaB yesyesRB197 scBAN/hasA/tuaD/gtaB yesyesRB200 scBAN/hasA/tuaD yes yesRB202 scBAN/hasA/hasB/hasC/hasD/ yesyesMF009 scBAN/tuaD/gtaBnonoscBAN/hasAMF010scBAN/tuaD/gtaBnonoBAN/hasA
在标准小发酵罐中发酵枯草芽孢杆菌菌株,所使用的培养基包含每升中6.5g的KH2PO4,4.5g Na2HPO4,3.0g(NH4)2SO4,2.0g Na3-柠檬酸-2H2O,3.0MgSO4·7H2O,6.0ml Mikrosoy-2,0.15mg生物素(1ml 0.15mg/ml乙醇),15.0g蔗糖,1.0ml SB 2066,2.0ml P2000,0.5g CaCl2·2H2O。高压灭菌前,培养基的pH为6.3-6.4(未调整)。在高压灭菌后加入CaCl2·2H2O。
所使用的接种培养基为B-3,即无琼脂的Agar-3或“S/S-1”培养基。
Agar-3培养基含有每升中4.0g营养肉汤,7.5g水解蛋白,3.0g酵母提取物,1.0g葡萄糖和2%琼脂。pH为调整;高压灭菌前,pH约为6.8;高压灭菌后,pH约为7.7。
蔗糖/大豆接种瓶培养基(S/S-1)包含每升中65g蔗糖,35g大豆粉,2g Na3-柠檬酸-2H2O,4g KH2PO4,5g Na2HPO4和6ml微量元素。用NaOH将培养基的pH调整为约7;将培养基加入瓶中后,加入0.2%植物油以抑制发泡。微量元素包括每升中100g柠檬酸-H2O,20g FeSO4·7H2O,5gMnSO4·H20,2g CuSO4·5H2O和2g ZnCl2。
在接种前用氨水将pH调整为6.8-7.0并用和随后用氨水和磷酸将pH控制在pH7.0±0.2。将温度保持在37℃。采用两个叶轮直径为6cm的6叶涡轮叶轮在初始体积为1.5升的3升罐中以最大值1300RPM进行搅拌。以最大值1.5VVM通风。
使用纯蔗糖溶液给料。在溶解氧(D.O.)仍持续降低时(即在蔗糖耗尽前),于接种后约4小时开始给料。给料速率在7个小时期间从0至约6g蔗糖/L0-小时线性改变。在某些发酵中也使用较低的给料速率(从0至约2g蔗糖/L0-小时线性改变)。
约10小时后粘度已经非常显著,而24小时后粘度非常高,使得D.O.降至最低点。终粘度达到3,220cP。20小时后,细胞群形成接近最大值(12-15g/升)。采用如下方法除去细胞用3份水稀释1份培养液,充分混合并以30,000×g离心以形成细胞上清和能进行漂洗和干燥的细胞片状沉淀。
根据透明质酸结合蛋白(蛋白和试剂盒购自Seikagaku America,Falmouth,MA),采用ELISA方法测定透明质酸浓度。
将枯草芽孢杆菌RB161和RB163在分批和分批补料发酵中培养。在分批补料步骤中,枯草芽孢杆菌菌株RB163和RB161的补料率有所不同。采用ELISA方法再次测定透明质酸浓度。结果示于表2中。
表2

对同一菌株以2g/L蔗糖L0-小时分批补料的和以6g/L蔗糖/L0-小时分批补料的培养测定的比较结果显示出较快的蔗糖补料速率不能显著地改善滴度。
图44中总结了在相同条件下(以约2g蔗糖/L0-小时,37℃分批补料)芽孢杆菌属菌株的结果。图44中给出了来自在同一条件下的多重运行的数据的标准差。没有数值的数据来自单运行。使用改良咔唑法(Bitter and Muir,1962,Anal BIOCHEM.4330-334)确定透明质酸浓度。
图45中总结了在相同条件下(以约2g蔗糖/LO-小时,37℃分批补料)获自重组枯草芽孢杆菌菌株发酵的峰量透明质酸的平均分子量(MDa)。采用GPC MALLS测定法确定分子量。采用如下步骤从GPC MALLS测定实验中采集数据。GPC-MALLS(配合多角度激光散射的凝胶渗透或大小排阻色谱法)已广泛用于表征高分子量(MW)聚合物。通过基于洗脱液和树脂间不同分子量的分子的差异区分的GPC法实施聚合物的分离。通过基于不同MW分子的差异散射范围/角度的MALLS法测定各聚合物的平均分子量。Ueno等,1988,CHEM.PHARM.BULL.36,4971-4975;Wyatt,1993,Anal.Chim.Acta 2721-40;和Wyatt Technologies,1999,“Light ScatteringUniversity DAWN Course Manual”和“DAWN EOS Manual”Wyatt TechnologyCorporation,Santa Barbara,California中描述了GPC-MALLS的原理和适用于透明质酸的方法步骤。将Agilent 1100等度HPLC,Tosoh Biosep G6000PWXL柱用于GPC,将Wyatt Down EOS用于MALLS。将Agilent G1362A折光率检测器联于MALLS下游以确定洗脱浓度。将具有已知分子量的多种商品化透明质酸制品作为标准物。
生物材料的保藏根据布达佩斯条约,下列生物材料已保藏在农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北方地区研究中心(Northern Regional Research Center),大学街1815号(1815University Street),Peoria,伊利诺斯州(Illinois,),61604,并给予下列保藏号保藏物保藏号 保藏日大肠杆菌XL10 Gold kan(pMRT106)NRRLB-305362001年12月12日该菌株已经在如下状态下进行了保藏,在该专利申请的待审期内,保证根据37 C.F.R.§1.14和35 U.S.C.§122授权的专利和商标委员会所确定的人员能够获得该培养物。该保藏物代表了保藏菌株的基本上纯的培养物。在提交了该申请的副本或其后续申请的国家中,可以按照该国专利法的要求提供该保藏物。但是,应当明白保藏物的可获得性并不构成对以侵犯由政府行为授予的专利权来实施本发明的许可。
在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内,因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上,除了那些在此所示并描述的修改外,本领域的技术人员很容易根据前面的描述对本发明作各种修改。这些修改也在所附权利要求的范围内。若有抵触,以本说明书(包括定义)为准。
本文中引用了各种参考文献,其公开内容全文引入作为参考。

关于微生物保藏的说明(细则13之二)

PCT/RO/134表(1992年7月)
序列表<110> 艾伦.斯洛马(Sloma,Alan)里金.贝尔(Behr,Regine)威廉.威德纳(Widner,William)玛丽亚.唐(Tang,Maria)戴维.斯滕伯格(Sternberg,David)斯蒂芬.布朗(Brown,Stephen)<120> 在重组宿主细胞中制备透明质酸的方法<130> 10241.204-WO<150> US 60/342,644<151> 2001-12-21<160> 108<170> PatentIn version 3.1<210> 1<211> 1251<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<220>
<221> CDS<222> (1)..(1251)<223>
<400> 1atg aga aca tta aaa aac ctc ata act gtt gtg gcc ttt agt att ttt 48Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe1 5 10 15tgg gta ctg ttg att tac gtc aat gtt tat ctc ttt ggt gct aaa gga 96Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly20 25 30agc ttg tca att tat ggc ttt ttg ctg ata gct tac cta tta gtc aaa144Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys35 40 45atg tcc tta tcc ttt ttt tac aag cca ttt aag gga agg gct ggg caa192Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln50 55 60tat aag gtt gca gcc att att ccc tct tat aac gaa gat gct gag tca240Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser65 70 75 80ttg cta gag acc tta aaa agt gtt cag cag caa acc tat ccc cta gca288Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala85 90 95gaa att tat gtt gtt gac gat gga agt gct gat gag aca ggt att aag336Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys100 105 110
cgc att gaa gac tat gtg cgt gac act ggt gac cta tca agc aat gtc 384Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val115 120 125att gtt cac cgg tca gaa aaa aat caa gga aag cgt cat gca cag gcc 432Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala130 135 140tgg gcc ttt gaa aga tca gac gct gat gtc ttt ttg acc gtt gac tca 480Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser145 150 155 160gat act tat atc tac cct gat gct tta gag gag ttg tta aaa acc ttt 528Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe165 170 175aat gac cca act gtt ttt gct gcg acg ggt cac ctt aat gtc aga aat 576Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn180 185 190aga caa acc aat ctc tta aca cgc ttg aca gat att cgc tat gat aat 624Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn195 200 205gct ttt ggc gtt gaa cga gct gcc caa tcc gtt aca ggt aat att ctc 672Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu210 215 220gtt tgc tca ggc ccg ctt agc gtt tac aga cgc gag gtg gtt gtt cct 720Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro225 230 235 240aac ata gat aga tac atc aac cag acc ttc ctg ggt att cct gta agt 768Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser245 250 255atc ggt gat gac agg tgc ttg acc aac tat gca act gat tta gga aag 816Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys260 265 270act gtt tat caa tcc act gct aaa tgt att aca gat gtt cct gac aag 864Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys275 280 285atg tct act tac ttg aag cag caa aac cgc tgg aac aag tcc ttc ttt 912Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe290 295 300aga gag tcc att att tct gtt aag aaa atc atg aac aat cct ttt gta 960Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val305 310 315 320gcc cta tgg acc ata ctt gag gtg tct atg ttt atg atg ctt gtt tat1008Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr325 330 335tct gtg gtg gat ttc ttt gta gac aat gtc aga gaa ttt gat tgg ctc1056
Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu340 345 350agg gtt ttg gcc ttt ctg gtg att atc ttc att gtt gct ctt tgt cgt1104Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg355 360 365aat att cac tat atg ctt aag cac ccg ctg tcc ttc ttg tta tct ccg1152Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro370 375 380ttt tat ggg gta ctg cat ttg ttt gtc cta cag ccc ttg aaa ttg tat1200Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr385 390 395 400tct ctt ttt act att aga aat gct gac tgg gga aca cgt aaa aaa tta1248Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu405 410 415tta1251Leu<210> 2<211> 417<212> PRT<213> 似马链球菌(Streptococcus equisimilis)<400> 2Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe1 5 10 15Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly20 25 30Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys35 40 45Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln50 55 60Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser65 70 75 80Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala85 90 95Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys100 105 110Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val115 120 125Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala130 135 140
Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser145 150 155 160Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe165 170 175Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn180 185 190Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn195 200 205Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu210 215 220Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro225 230 235 240Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser245 250 255Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys260 265 270Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys275 280 285Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe290 295 300Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val305 310 315 320Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr325 330 335Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu340 345 350Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu CysArg355 360 365Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro370 375 380Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr385 390 395 400Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu405 410 415Leu<210> 3<211> 49<212> DNA<213> 似马链球菌(Streptococcus equisimilis)
<400> 3gagctctata aaaatgagga gggaaccgaa tgagaacatt aaaaaacct49<210> 4<211> 48<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 4gttaacgaat tcagctatgt aggtacctta taataatttt ttacgtgt 48<210> 5<211> 20<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 5gttgacgatg gaagtgctga20<210> 6<211> 20<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 6atccgttaca ggtaatatcc20<210> 7<211> 20<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 7tccttttgta gccctatgga20<210> 8<211> 20<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 8tcagcacttc catcgtcaac20<210> 9<211> 20<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 9ggatattacc tgtaacggat20
<210> 10<211> 20<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 10tccatagggc tacaaaagga20<210> 11<211> 1383<212> DNA<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))<220>
<221> CDS<222> (1)..(1383)<223>
<400> 11gtg aaa aaa ata gct gtc att gga aca ggt tat gta gga ctc gta tca 48Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser1 5 10 15ggc act tgc ttt gcg gag atc ggc aat aaa gtt gtt tgc tgt gat atc 96Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile20 25 30gat gaa tca aaa atc aga agc ctg aaa aat ggg gta atc cca atc tat144Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr35 40 45gaa cca ggg ctt gca gac tta gtt gaa aaa aat gtg ctg gat cag cgc192Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg50 55 60ctg acc ttt acg aac gat atc ccg tct gcc att cgg gcc tca gat att240Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile65 70 75 80att tat att gca gtc gga acg cct atg tcc aaa aca ggt gaa gct gat288Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp85 90 95tta acg tac gtc aaa gcg gcg gcg aaa aca atc ggt gag cat ctt aac336Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn100 105 110ggc tac aaa gtg atc gta aat aaa agc aca gtc ccg gtt gga aca ggg384Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly115 120 125aaa ctg gtg caa tct atc gtt caa aaa gcc tca aag ggg aga tac tca432Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser130 135 140
ttt gat gtt gta tct aac cct gaa ttc ctt cgg gaa ggg tca gcg att 480Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile145 150 155 160cat gac acg atg aat atg gag cgt gcc gtg att ggt tca aca agt cat 528His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His165 170 175aaa gcc gct gcc atc att gag gaa ctt cat cag cca ttc cat gct cct 576Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro180 185 190gtc att aaa aca aac cta gaa agt gca gaa atg att aaa tac gcc gcg 624Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala195 200 205aat gca ttt ctg gcg aca aag att tcc ttt atc aac gat atc gca aac 672Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn210 215 220att tgt gag cga gtc ggc gca gac gtt tca aaa gtt gct gat ggt gtt 720Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val225 230 235 240ggt ctt gac agc cgt atc ggc aga aag ttc ctt aaa gct ggt att gga 768Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly245 250 255ttc ggc ggt tca tgt ttt cca aag gat aca acc gcg ctg ctt caa atc 816Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile260 265 270gca aaa tcg gca ggc tat cca ttc aag ctc atc gaa gct gtc att gaa 864Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu275 280 285acg aac gaa aag cag cgt gtt cat att gta gat aaa ctt ttg act gtt 912Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val290 295 300atg gga agc gtc aaa ggg aga acc att tca gtc ctg gga tta gcc ttc 960Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe305 310 315 320aaa ccg aat acg aac gat gtg aga tcc gct cca gcg ctt gat att atc1008Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile325 330 335cca atg ctg cag cag ctg ggc gcc cat gta aaa gca tac gat ccg att1056Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile340 345 350gct att cct gaa gct tca gcg atc ctt ggc gaa cag gtc gag tat tac1104Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr355 360 365aca gat gtg tat gct gcg atg gaa gac act gat gca tgc ctg att tta1152Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu
370 375 380acg gat tgg ccg gaa gtg aaa gaa atg gag ctt gta aaa gtg aaa acc1200Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr385 390 395 400ctc tta aaa cag cca gtc atc att gac ggc aga aat tta ttt tca ctt1248Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu405 410 415gaa gag atg cag gca gcc gga tac att tat cac tct atc ggc cgt ccc1296Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro420 425 430gct gtt cgg gga acg gaa ccc tct gac aag tat ttt ccg ggc ttg ccg1344Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro435 440 445ctt gaa gaa ttg gct aaa gac ttg gga agc gtc aat tta1383Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu450 455 460<210> 12<211> 461<212> PRT<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))<400> 12Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser1 5 10 15Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile20 25 30Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr35 40 45Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg50 55 60Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile65 70 75 80Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp85 90 95Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn100 105 110
Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly115 120 125Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser130 135 140Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile145 150 155 160His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His165 170 175Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro180 185 190Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala195 200 205Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn210 215 220Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val225 230 235 240Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly245 250 255Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile260 265 270Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu275 280 285Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val290 295 300Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe305 310 315 320Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile325 330 335Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile
340 345 350Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr355 360 365Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu370 375 380Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr385 390 395 400Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu405 4l0 4l5Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro420 425 430Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro435 440 445Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu450 455 460<210> 13<211> 26<212> DNA<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))<400> 13ggtaccgaca ctgcgaccat tataaa 26<210> 14<211> 49<212> DNA<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))<400> 14gttaacgaat tccagctatg tatctagaca gcttcaacca agtaacact49<210> 15<211> 20<212> DNA<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))<400> 15agcatcttaa cggctacaaa20
<210> 16<211> 20<212> DNA<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))<400> 16tgtgagcgag tcggcgcaga20<210> 17<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 17gggcgcccat gtaaaagcat20<210> 18<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 18tttgtagccg ttaagatgct20<210> 19<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 19tctgcgccga ctcgctcaca20<210> 20<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 20atgcttttac atgggcgccc20<210> 21<211> 876<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<220>
<221> CDS<222> (1)..(876)<223>
<400> 21atg aaa aaa gta cgt aaa gcc ata att cca gca gca ggc tta gga aca 48Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15cgt ttt ctt ccg gct acg aaa gca atg ccg aaa gaa atg ctt cct atc 96Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile20 25 30gtt gat aaa cct acc att caa tac ata att gaa gaa gct gtt gaa gcc144Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala35 40 45ggt att gaa gat att att atc gta aca gga aaa agc aag cgt gcg att192Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile50 55 60gag gat cat ttt gat tac tct cct gag ctt gaa aga aac cta gaa gaa240Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu65 70 75 80aaa gga aaa act gag ctg ctt gaa aaa gtg aaa aag gct tct aac ctg288Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu85 90 95gct gac att cac tat atc cgc caa aaa gaa cct aaa ggt ctc gga cat336Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His100 105 110gct gtc tgg tgc gca cgc aac ttt atc ggc gat gag ccg ttt gcg gta384Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val115 120 125ctg ctt ggt gac gat att gtt cag gct gaa act cca ggg ttg cgc caa432Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln130 135 140tta atg gat gaa tat gaa aaa aca ctt tct tct att atc ggt gtt cag480Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln145 150 155 160cag gtg ccc gaa gaa gaa aca cac cgc tac ggc att att gac ccg ctg528Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu165 170 175aca agt gaa ggc cgc cgt tat cag gtg aaa aac ttc gtt gaa aaa ccg576Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro180 185 190cct aaa ggc aca gca cct tct aat ctt gcc atc tta ggc cgt tac gta624Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val195 200 205ttc acg cct gag atc ttc atg tat tta gaa gag cag cag gtt ggc gcc672Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala210 215 220ggc gga gaa att cag ctc aca gac gcc att caa aag ctg aat gaa att720Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile225 230 235 240
caa aga gtg ttt gct tac gat ttt gaa ggc aag cgt tat gat gtt ggt768Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly245 250 255gaa aag ctc ggc ttt atc aca aca act ctt gaa ttt gcg atg cag gat816Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp260 265 270aaa gag ctt cgc gat cag ctc gtt cca ttt atg gaa ggt tta cta aac864Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn275 280 285aaa gaa gaa atc876Lys Glu Glu Ile290<210> 22<211> 292<212> PRT<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 22Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr1 5 10 15Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile20 25 30Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala35 40 45Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile50 55 60Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu65 70 75 80Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu85 90 95Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His100 105 110Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val115 120 125Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln130 135 140
Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln145 150 155 160Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu165 170 175Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro180 185 190Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val195 200 205Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala210 215 220Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile225 230 235 240Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly245 250 255Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp260 265 270Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn275 280 285Lys Glu Glu Ile290<210> 23<211> 27<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 23tctagatttt tcgatcataa ggaaggt27<210> 24<211> 49<212> DNA<213> 枯草芽孢杆菌(Bacillus subtiils)<400> 24gttaacgaat tccagctatg taggatccaa tgtccaatag cctttttgt49
<210> 25<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 25aaaaaggctt ctaacctggc20<210> 26<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 26aaaccgccta aaggcacagc20<210> 27<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 27gccaggttag aagccttttt20<210> 28<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 28gctgtgcctt taggcggttt20<210> 29<211> 1368<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<220>
<221> CDS<222> (1)..(1368)<223>
<400> 29atg gat aag cgg ttt gca gtt gtt tta gcg gct gga caa gga acg aga 48Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg1 5 10 15atg aaa tcg aag ctt tat aaa gtc ctt cat cca gtt tgc ggt aag cct 96Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro20 25 30atg gta gag cac gtc gtg gac gaa gcc tta aaa tta tct tta tca aag144
Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys35 40 45ctt gtc acg att gtc gga cat ggt gcg gaa gaa gtg aaa aag cag ctt192Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu50 55 60ggt gat aaa agc gag tac gcg ctt caa gca aaa cag ctt ggc act gct240Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala65 70 75 80cat gct gta aaa cag gca cag cca ttt ctt gct gac gaa aaa ggc gtc288His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val85 90 95aca att gtc att tgc gga gat acg ccg ctt ttg aca gca gag acg atg336Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met100 105 110gaa cag atg ctg aaa gaa cat aca caa aga gaa gcg aaa gct acg att384Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile115 120 125tta act gcg gtt gca gaa gat cca act gga tac ggc cgc att att cgc432Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg130 135 140agc gaa aac gga gcg gtt caa aaa ata gtt gag cat aag gac gcc tct480Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser145 150 155 160gaa gaa gaa cgt ctt gta act gag atc aac acc ggt acg tat tgt ttt528Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe165 170 175gac aat gaa gcg cta ttt cgg gct att gat cag gtg tct aat gat aat576Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn180 185 190gca caa ggc gag tat tat ttg ccg gat gtc ata gag att ctt aaa aat624Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn195 200 205gaa ggc gaa act gtt gcc gct tac cag act ggt aat ttc caa gaa acg672Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr210 215 220ctc gga gtt aat gat aga gtt gct ctt tct cag gca gaa caa ttt atg720Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met225 230 235 240aaa gag cgc att aat aaa cgg cat atg caa aat ggc gtg acg ttg att768Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile245 250 255gac ccg atg aat acg tat att tct cct gac gct gtt atc gga agc gat816Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp260 265 270
act gtg att tac cct gga act gtg att aaa ggt gag gtg caa atc gga 864Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly275 280 285gaa gat acg att att ggc cct cat acg gag att atg aat agt gcc att 912Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile290 295 300ggc agc cgt acg gtt att aaa caa tcg gta gtc aat cac agt aaa gtg 960Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val305 310 315 320ggg aat gat gta aac ata gga cct ttt gct cac atc aga cct gat tct1008Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser325 330 335gtc atc ggg aat gaa gtg aag atc ggg aat ttt gta gaa att aaa aag1056Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys340 345 350act caa ttc gga gac cga agc aag gca tct cat cta agc tat gtc ggc1104Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly355 360 365gat gct gag gta ggc act gat gta aac ctg ggc tgc ggt tca att act1152Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr370 375 380gtc aat tat gat gga aag aat aag tat ttg aca aaa att gaa gat ggc1200Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly385 390 395 400gcg ttt atc ggc tgc aat tcc aac ttg gtt gcc cct gtc aca gtc gga1248Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly405 410 415gaa ggc gct tat gtg gcg gca ggt tca act gtt acg gaa gat gta cct1296Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro420 425 430gga aaa gca ctt gct att gcc aga gcg aga caa gta aat aaa gac gat1344Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp435 440 445tat gtg aaa aat att cat aaa aaa1368Tyr Val Lys Asn Ile His Lys Lys450 455<210> 30<211> 456<212> PRT<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 30Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg
1 5 10 15Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro20 25 30Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys35 40 45Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu50 55 60Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala65 70 75 80His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val85 90 95Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met100 105 11 0Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile115 120 125Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg130 135 140Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser145 150 155 160Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe165 170 175Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn180 185 190Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn195 200 205Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr210 215 220Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met225 230 235 240
Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile245 250 255Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp260 265 270Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly275 280 285Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile290 295 300Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val305 310 315 320Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser325 330 335Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys340 345 350Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly355 360 365Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr370 375 380Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly385 390 395 400Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly405 410 415Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro420 425 430Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp435 440 445Tyr Val Lys Asn Ile His Lys Lys450 455
<210> 31<211> 26<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 31ggatcctttc tatggataaa agggat 26<210> 32<211> 31<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 32gttaacagga ttatttttta tgaatatttt t 31<210> 33<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 33cagagacgat ggaacagatg20<210> 34<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 34ggagttaatg atagagttgc20<210> 35<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 35gaagatcggg aattttgtag20<210> 36<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 36catctgttcc atcgtctctg20<210> 37<211> 20<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 37gcaactctat cattaactcc20<210> 38<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 38ctacaaaatt cccgatcttc20<210> 39<211> 54<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 39gtgtcggaac attcattaca tgcttaagca cccgctgtcc ttcttgttat ctcc 54<210> 40<211> 1203<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<220>
<221> CDS<222> (1)..(1203)<223>
<400> 40gtg aaa att tct gta gca ggc tca gga tat gtc ggc cta tcc ttg agt 48Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser1 5 10 15att tta ctg gca caa cat aat gac gtc act gtt gtt gat att att gat 96Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp20 25 30gaa aag gtg aga ttg atc aat caa ggc ata tct cca atc aag gat gct144Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala35 40 45gat att gag gag tat tta aaa aat gcg ccg cta aat ctc aca gcg acc192Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr50 55 60ctt gat ggc gca agc gct tat agc aat gca gac ctt att atc att gct240Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala65 70 75 80act ccg aca aat tat gac agc gaa cgc aac tac ttt gac aca agg cat288Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His85 90 95
gtt gaa gag gtc att gag cag gtc cta gac cta aat gcg tca gca acc336Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr100 105 110att att atc aaa tca acc ata cca cta ggc ttt atc aag cat gtt agg384Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg115 120 125gaa aaa tac cag aca gat cgt att att ttt agc cca gaa ttt tta aga432Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg130 135 140gaa tca aaa gcc tta tac gat aac ctt tac cca agt cgg atc att gtt480Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val145 150 155 160tct tat gaa aag gac gac tca cca agg gtt att cag gct gct aaa gcc528Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala165 170 175ttt gct ggt ctt tta aag gaa gga gcc aaa agc aag gat act ccg gtc576Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val180 185 190tta ttt atg ggc tca cag gag gct gag gcg gtc aag cta ttt gcg aat624Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn195 200 205acc ttt ttg gct atg cgg gtg tct tac ttt aat gaa tta gac acc tat672Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr210 215 220tcc gaa agc aag ggt cta gat gct cag cgc gtg att gaa gga gtc tgt720Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys225 230 235 240cat gat cag cgc att ggt aac cat tac aat aac cct tcc ttt gga tat768His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr245 250 255ggc ggc tat tgc ctg cca aag gac agc aaa cag ctg ttg gca aat tat816Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr260 265 270aga ggc att ccc cag tcc ttg atg tca gcg att gtt gag tcc aac aag864Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys275 280 285ata cga aaa tcc tat tta gct gaa caa ata tta gac aga gcc tct agt912Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser290 295 300caa aag cag gct ggt gta cca tta acg att ggc ttt tac cgc ttg att960Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile305 310 315 320atg aaa agc aac tct gat aat ttc cga gaa agc gcc att aaa gat att 1008
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile325 330 335att gat atc atc aac gac tat ggg gtt aat att gtc att tac gaa ccc1056Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro340 345 350atg ctt ggc gag gat att ggc tac agg gtt gtc aag gac tta gag cag1104Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln355 360 365ttc aaa aac gag tct aca atc att gtg tca aat cgc ttt gag gac gac1152Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp370 375 380cta gga gat gtc att gat aag gtt tat acg aga gat gtc ttt gga aga1200Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg385 390 395 400gac1203Asp<210> 41<211> 401<212> PRT<213> 似马链球菌(Streptococcus equisimilis)<400> 41Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser1 5 10 15Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp20 25 30Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala35 40 45Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr50 55 60Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala65 70 75 80Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His85 90 95Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr100 105 110
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg115 120 125Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg130 135 140Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val145 150 155 160Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala165 170 175Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val180 185 190Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn195 200 205Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr210 215 220Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys225 230 235 240His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr245 250 255Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr260 265 270Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys275 280 285Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser290 295 300Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile305 310 315 320Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile325 330 335
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro340 345 350Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln355 360 365Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp370 375 380Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg385 390 395 400Asp<210> 42<211> 900<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<220>
<221> CDS<222> (1)..(900)<223>
<400> 42atg aca aag gtc aga aaa gcc att atc cca gcc gcc ggc cta ggc act 48Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr1 5 10 15cgc ttc cta ccc gcc acc aag gca ctg gcc aag gaa atg ctc cca atc 96Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile20 25 30gtc gat aag cca acc att caa ttc atc gtc gag gaa gct cta aag gcc144Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala35 40 45ggt atc gag gag att ctt gtc gtc acc ggc aag gcc aaa cgc tct att192Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile50 55 60gaa gac cac ttt gac tcc aac ttc gag ctc gaa tac aat ctc caa gcc240Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala65 70 75 80aag ggc aaa acc gag ctg ctc aag ctc gtt gat gag acc act gcc atc288Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile85 90 95aac ctg cac ttc att cgt cag agc cac cct aga gga cta ggg gac gct336Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala100 105 110
gtc ctc cag gcc aag gcc ttt gtg ggc aat gag ccc ttt gtg gtc atg384Val Leu Gln Ala Lys Ala Phe Val Gly Ash Glu Pro Phe Val Val Met115 120 125ctg ggg gat gac ctc atg gat att acc aat cct agt gcc aag ccc ttg432Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu130 135 140gcc aag cag ctc att gag gat tat gat tgc aca cac gcc tca acg att480Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile145 150 155 160gca gtg atg agg gtg ccg cat gag gag gtt tcc aat tat ggc gtg att528Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile165 170 175gca ccg caa ggg aag gct gtt aag ggc ttg tat agt gtg gag acc ttt576Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe180 185 190gtt gag aag cca agt cca gat gag gca ccg agt gac tta gcg att att624Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile195 200 205ggt cga tat ttg ttg acg cct gag att ttt gcc ata ttg gag aat cag672Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln210 215 220gcg cct ggg gct ggc aat gag gta cag cta gcc gat gcg att gac aag720Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys225 230 235 240ctc aac aag act cag cgg gtt ttt gcg agg gag ttt aag gga gag cgg768Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg245 250 255tat gat gtt ggg gac aag ttt ggc ttt atg aag acc tca ctt gac tat816Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr260 265 270gct ctc aag cac cct cag gtc aag gac gac ctc act gac tac att ata864Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile275 280 285aag ctc agt aag caa ctg aac aag gac gtt aaa aaa900Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys290 295 300<210> 43<211> 300<212> PRT<213> 似马链球菌(Streptococcus equisimiils)<400> 43Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile20 25 30Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala35 40 45Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile50 55 60Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala65 70 75 80Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile85 90 95Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala100 105 110Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met115 120 125Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu130 135 140Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile145 150 155 160Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile165 170 175Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe180 185 190Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile195 200 205Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln210 215 220Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys225 230 235 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg245 250 255Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr260 265 270Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile275 280 285Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys290 295 300<210> 44<211> 1380<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<220>
<221> CDS<222> (1)..(1380)<223>
<400> 44atg aaa aac tac gcc att atc cta gca gct gga aag gga acc cgc atg 48Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met1 5 10 15aat tca ggg ctt tcc aag gtg ctg cac aag gta tca ggc cta agc atg 96Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met20 25 30ctg gag cat gtc ctc aag agc gtc tca gcc cta gct cct caa aag caa144Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln35 40 45ctc aca gtg atc ggt cat cag gca gag caa gta cgt gcc gtc cta ggt192Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly50 55 60gat caa tta ctg aca gtg gtg caa gag gag cag cta gga aca ggc cat240Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His65 70 75 80gca gtc atg atg gca gaa gag gag cta tct ggc tta gaa ggg cag acc288Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr85 90 95cta gtg att gca ggt gac acc ccc ttg atc aga gga gaa agc ctc aag336Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys100 105 110gct ctg cta gac tat cat atc aga gaa aag aat gtg gca acc att ctc384Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu
115 120 125aca gcc aat gcc aag gat ccc ttt ggc tac ggc cga atc att cgc aat 432Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn130 135 140gca gca gga gag gtg gtc aac atc gtt gaa caa aag gac gct aat gag 480Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu145 150 155 160gca gag caa gag gtc aag gag atc aac aca ggg acc tat atc ttt gac 528Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp165 170 175aat aag cgc ctc ttt gag gct cta aag cat ctc acg act gat aat gcc 576Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala180 185 190caa ggg gaa tat tac cta acc gat gtg atc agt att ttc aag gcc agc 624Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser195 200 205caa gaa aag gtt gga gct tac ctg ctg aag gat ttt gat gaa agc cta 672Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu210 215 220ggg gtt aat gat cgc cta gct cta gcc cag gct gag gtg atc atg cag 720Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln225 230 235 240gag cgg atc aac aag cag cac atg ctt aat ggg gtg acc ctg caa aac 768Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn245 250 255cct gca gct acc tat atc gaa agc agt gta gag att gcg ccg gac gtc 816Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val260 265 270ttg att gaa gct aat gtg acc cta aag gga cag act aga att ggc agc 864Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser275 280 285aga agt gtt ata acc aat ggg agc tat atc ctt gat tca agg ctt ggt 912Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly290 295 300gag ggc gta gtg gtg agc cag tca gtg att gag ggc tca gtc cta gca 960Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala305 310 3l5 320gat ggt gtg aca gta ggg ccc tat gca cac att cgc ccg gac tct cag1008Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln325 330 335ctc gat gag tgt gtt cat att ggg aac ttt gta gag gtt aag ggg tct1056Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser340 345 350
cat cta ggg gcc aat acc aag gca ggg cat ttg act tat ctg ggg aat1104His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn355 360 365gcc gag att ggc tca gag gtt aat att ggt gca gga agc att acg gtt1152Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val370 375 380aat tat gat ggt caa cgg aaa tac cag aca gtg att ggc gat cac gct1200Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala385 390 395 400ttt att ggg agt cat tcg act ttg ata gct ccg gta gag gtt ggg gag1248Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu405 410 415aat gct tta aca gca gca ggg tct acg ata gcc cag tcg gtg cca gca1296Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala420 425 430gac agt gtg gct ata ggg cgt agc cgt cag gtg gtg aag gaa ggc tat1344Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr435 440 445gcc aag agg cta cca cat cac ccg gat cag ccc cag1380Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln450 455 460<210> 45<211> 460<212> PRT<213> 似马链球菌(Streptococcus equisimilis)<400> 45Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met1 5 10 15Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met20 25 30Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln35 40 45Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly50 55 60Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His65 70 75 80Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr85 90 95
Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys100 105 110Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu115 120 125Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn130 135 140Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu145 150 155 160Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp165 170 175Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala180 185 190Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser195 200 205Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu210 215 220Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln225 230 235 240Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn245 250 255Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val260 265 270Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser275 280 285Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly290 295 300Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala305 310 315 320
Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln325 330 335Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser340 345 350His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn355 360 365Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val370 375 380Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala385 390 395 400Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu405 410 415Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala420 425 430Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr435 440 445Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln450 455 460<210> 46<211> 29<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 46gcggccgcgg tacctgtgtt acacctgtt 29<210> 47<211> 38<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 47gtcaagctta attctcatgt ttgacagctt atcatcgg38<210> 48<211> 18<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 48catgggagag acctttgg 18<210> 49<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 49gtcggtcttc catttgc 17<210> 50<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 50cgaccactgt atcttgg 17<210> 51<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 51gagatgccaa acagtgc 17<210> 52<211> 16<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 52catgtccatc gtgacg16<210> 53<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 53caggagcatt tgatacg 17<210> 54<211> 16<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 54ccttcagatg tgatcc16
<210> 55<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 55gtgttgacgt caactgc 17<210> 56<211> 18<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 56gttcagcctt tcctctcg 18<210> 57<211> 18<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 57gctaccttct ttcttagg 18<210> 58<211> 18<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 58cgtcaatatg atctgtgc 18<210> 59<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 59ggaaagaagg tctgtgc 17<210> 60<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 60cagctatcag ctgacag 17<210> 61
<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 61gctcagctat gacatattcc20<210> 62<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 62gatcgtcttg attaccg 17<210> 63<211> 16<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 63agctttatcg gtgacg16<210> 64<211> 16<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 64tgagcacgat tgcagg16<210> 65<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 65cattgcggag acattgc 17<210> 66<211> 26<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 66tagacaattg gaagagaaaa gagata 26<210> 67<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 67ccgtcgctat tgtaaccagt20<210> 68<211> 29<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 68ggaattccaa agctgcagcg gccggcgcg 29<210> 69<211> 32<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 69gaagatctcg tatacttggc ttctgcagct gc 32<210> 70<211> 31<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 70gaagatctgg tcaacaagct ggaaagcact c 31<210> 71<211> 33<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 71cccaagcttc gtgacgtaca gcaccgttcc ggc 33<210> 72<211> 50<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 72ccttaagggc cgaatattta tacggagctc cctgaaacaa caaaaacggc 50<210> 73<211> 34<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 73ggtgttctct agagcggccg cggttgcggt cagc34
<210> 74<211> 27<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 74gtccttcttg gtacctggaa gcagagc27<210> 75<211> 39<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 75gtataaatat tcggccctta aggccagtac cattttccc 39<210> 76<211> 13<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 76gggccggatc cgc 13<210> 77<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 77attcccggcc taggcgccgg20<210> 78<211> 19<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 78ggaaattatc gtgatcaac 19<210> 79<211> 21<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 79gcacgagcac tgataaatat g 21<210> 80<211> 21<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 80catatttatc agtgctcgtg c 21<210> 81<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 81tcgtagacct catatgc 17<210> 82<211> 17<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 82gtcgttaaac cgtgtgc 17<210> 83<211> 39<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 83ctagaggatc cccgggtacc gtgctctgcc ttttagtcc 39<210> 84<211> 37<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 84gtacatcgaa ttcgtgctca ttattaatct gttcagc 37<210> 85<211> 20<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 85aactattgcc gatgataagc20<210> 86<211> 1260<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<220>
<221> CDS
<222> (1)..(1260)<223>
<400> 86atg aaa aaa gtg atg tta gct acg gct ttg ttt tta gga ttg act cca 48Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro1 5 10 15gct ggc gcg aac gca gct gat tta ggc cac cag acg ttg gga tcc aat 96Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn20 25 30gat ggc tgg ggc gcg tac tcg acc ggc acg aca ggc gga tca aaa gca144Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala35 40 45tcc tcc tca aat gtg tat acc gtc agc aac aga aac cag ctt gtc tcg192Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser50 55 60gca tta ggg aag gaa acg aac aca acg cca aaa atc att tat atc aag240Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys65 70 75 80gga acg att gac atg aac gtg gat gac aat ctg aag ccg ctt ggc cta288Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu85 90 95aat gac tat aaa gat ccg gag tat gat ttg gac aaa tat ttg aaa gcc336Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Alal00 105 110tat gat cct agc aca tgg ggc aaa aaa gag ccg tcg gga aca caa gaa384Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu115 120 125gaa gcg aga gca cgc tct cag aaa aac caa aaa gca cgg gtc atg gtg432Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val130 135 140gat atc cct gca aac acg acg atc gtc ggt tca ggg act aac gct aaa480Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys145 150 155 160gtc gtg gga gga aac ttc caa atc aag agt gat aac gtc att att cgc528Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg165 170 175aac att gaa ttc cag gat gcc tat gac tat ttt ccg caa tgg gat ccg576Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro180 185 190act gac gga agc tca ggg aac tgg aac tca caa tac gac aac atc acg624Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr195 200 205ata aac ggc ggc aca cac atc tgg att gat cac tgt aca ttt aat gac672Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp
210 215 220ggt tcg cgt ccg gac agc aca tca ccg aaa tat tat gga aga aaa tat 720Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr225 230 235 240cag cac cat gac ggc caa acg gat gct tcc aac ggt gct aac tat atc 768Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile245 250 255acg atg tcc tac aac tat tat cac gat cat gat aaa agc tcc att ttc 816Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe260 265 270gga tca agt gac agc aaa acc tcc gat gac ggc aaa tta aaa att acg 864Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr275 280 285ctg cat cat aac cgc tat aaa aat att gtc cag cgc gcg ccg aga gtc 912Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val290 295 300cgc ttc ggg caa gtg cac gta tac aac aac tat tat gaa gga agc aca 960Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr305 310 315 320agc tct tca agt tat cct ttt agc tat gca tgg gga atc gga aag tca1008Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser325 330 335tct aaa atc tat gcc caa aac aat gtc att gac gta ccg gga ctg tca1056Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser340 345 350gct gct aaa acg atc agc gta ttc agc ggg gga acg gct tta tat gac1104Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp355 360 365tcc ggc acg ttg ctg aac ggc aca cag atc aac gca tcg gct gca aac1152Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn370 375 380ggg ctg agc tct tct gtc ggc tgg acg ccg tct ctg cat gga tcg att1200Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile385 390 395 400gat gct tct gct aat gtg aaa tca aat gtt ata aat caa gcg ggt gcg1248Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala405 410 415ggt aaa tta aat1260Gly Lys Leu Asn420<210> 87<211> 420<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 87Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro1 5 10 15Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn20 25 30Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala35 40 45Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser50 55 60Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys65 70 75 80Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu85 90 95Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala100 105 110Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu115 120 125Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val130 135 140Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys145 150 155 160Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg165 170 175Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro180 185 190Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr195 200 205Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp210 215 220
Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr225 230 235 240Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile245 250 255Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe260 265 270Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr275 280 285Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val290 295 300Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr305 310 315 320Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser325 330 335Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser340 345 350Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp355 360 365Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn370 375 380Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile385 390 395 400Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala405 410 415Gly Lys Leu Asn420<210> 88<211> 26<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 88actagtaatg atggctgggg cgcgta 26<210> 89<211> 26<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 89gtcgacatgt tgtcgtattg tgagtt 26<210> 90<211> 52<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 90gagctctaca acgcttatgg atccgcggcc gcggcggcac acacatctgg at 52<210> 91<211> 26<212> DNA<213> 枯草芽孢杆菌(Bacillus subtilis)<400> 91gacgtcagcc cgtttgcagc cgatgc 26<210> 92<211> 1257<212> DNA<213> 酿脓链球菌(Streptococcus pyogenes)<220>
<221> CDS<222> (1)..(1257)<223>
<400> 92gtg cct att ttt aaa aaa act tta att gtt tta tcc ttt att ttt ttg 48Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu1 5 10 15ata tct atc ttg att tat cta aat atg tat cta ttt gga aca tca act 96Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr20 25 30gta gga att tat gga gta ata tta ata acc tat cta gtt att aaa ctt144Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu35 40 45gga tta tct ttc ctt tat gag cca ttt aaa gga aag cca cat gac tat192Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr50 55 60
aaa gtt gct gct gta att cct tct tat aat gaa gat gcc gag tca tta240Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu65 70 75 80tta gaa act ctt aaa agt gtg tta gca cag acc tat ccg tta tca gaa288Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu85 90 95att tat att gtt gat gat ggg agt tca aac aca gat gca ata caa tta336Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu100 105 110att gaa gag tat gta aat aga gaa gtg gat att tgt cga aac gtt atc384Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile115 120 125gtt cac cgt tcc ctt gtc aat aaa gga aaa cgc cat gct caa gcg tgg432Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp130 135 140gca ttt gaa aga tct gac gct gac gtt ttt tta acc gta gat tca gat480Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp145 150 155 160act tat atc tat cca aat gcc tta gaa gaa ctc cta aaa agc ttc aat528Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn165 170 175gat gag aca gtt tat gct gca aca gga cat ttg aat gct aga aac aga576Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg180 185 190caa act aat cta tta acg cga ctt aca gat atc cgt tac gat aat gcc624Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala195 200 205ttt ggg gtg gag cgt gct gct caa tca tta aca ggt aat att tta gtt672Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val210 215 220tgc tca gga cca ttg agt att tat cga cgt gaa gtg att att cct aac720Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn225 230 235 240tta gag cgc tat aaa aat caa aca ttc cta ggt tta cct gtt agc att768Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile245 250 255ggg gat gat cga tgt tta aca aat tat gct att gat tta gga cgc act816Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr260 265 270gtc tac caa tca aca gct aga tgt gat act gat gta cct ttc caa tta864Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu275 280 285aaa agt tat tta aag caa caa aat cga tgg aat aaa tct ttt ttt aaa912
Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys290 295 300gaa tct att att tct gtt aaa aaa att ctt tct aat ccc atc gtt gcc 960Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala305 310 315 320tta tgg act att ttc gaa gtc gtt atg ttt atg atg ttg att gtc gca1008Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala325 330 335att ggg aat ctt ttg ttt aat caa gct att caa tta gac ctt att aaa1056Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys340 345 350ctt ttt gcc ttt tta tcc atc atc ttt atc gtt gct tta tgt cgt aat1104Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn355 360 365gtt cat tat atg atc aaa cat cct gct agt ttt ttg tta tct cct ctg1152Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu370 375 380tat gga ata tta cac ttg ttt gtc tta cag ccc cta aaa ctt tat tct1200Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser385 390 395 400tta tgc acc att aaa aat acg gaa tgg gga aca cgt aaa aag gtc act1248Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr405 410 415att ttt aaa1257Ile Phe Lys<210> 93<211> 419<212> PRT<213> 酿脓链球菌(Streptococcus pyogenes)<400> 93Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu1 5 10 15Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr20 25 30Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu35 40 45Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr50 55 60
Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu65 70 75 80Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu85 90 95Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu100 105 110Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile115 120 125Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp130 135 140Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp145 150 155 160Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn165 170 175Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg180 185 190Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala195 200 205Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val210 215 220Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn225 230 235 240Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile245 250 255Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr260 265 270Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu275 280 285Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys
290 295 300Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala305 310 315 320Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala325 330 335Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys340 345 350Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn355 360 365Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu370 375 380Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser385 390 395 400Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr405 410 415Ile Phe Lys<210> 94<211> 2916<212> DNA<213> 出血败血性巴斯德菌(Paseurella multocida)<220>
<221> CDS<222> (1)..(2916)<223>
<400> 94atg aat aca tta tca caa gca ata aaa gca tat aac agc aat gac tat 48Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr1 5 10 15caa tta gca ctc aaa tta ttt gaa aag tcg gcg gaa atc tat gga cgg 96Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg20 25 30asa att gtt gaa ttt caa att acc aaa tgc caa gaa aaa ctc tca gca144Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala35 40 45
cat cct tct gtt aat tca gca cat ctt tct gta aat aaa gaa gaa aaa192His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys50 55 60gtc aat gtt tgc gat agt ccg tta gat att gca aca caa ctg tta ctt240Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu65 70 75 80tcc aac gta aaa aaa tta gta ctt tct gac tcg gaa aaa aac acg tta288Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu85 90 95aaa aat aaa tgg aaa ttg ctc act gag aag aaa tct gaa aat gcg gag336Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu100 105 110gta aga gcg gtc gcc ctt gta cca aaa gat ttt ccc aaa gat ctg gtt384Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val115 120 125tta gcg cct tta cct gat cat gtt aat gat ttt aca tgg tac aaa aag432Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys130 135 140cga aag aaa aga ctt ggc ata aaa cct gaa cat caa cat gtt ggt ctt480Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu145 150 155 160tct att atc gtt aca aca ttc aat cga cca gca att tta tcg att aca528Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr165 170 175tta gcc tgt tta gta aac caa aaa aca cat tac ccg ttt gaa gtt atc576Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile180 185 190gtg aca gat gat ggt agt cag gaa gat cta tca ccg atc att cgc caa624Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln195 200 205tat gaa aat aaa ttg gat att cgc tac gtc aga caa aaa gat aac ggt672Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly210 215 220ttt caa gcc agt gcc gct cgg aat atg gga tta cgc tta gca aaa tat720Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr225 230 235 240gac ttt att ggc tta ctc gac tgt gat atg gcg cca aat cca tta tgg768Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp245 250 255gtt cat tct tat gtt gca gag cta tta gaa gat gat gat tta aca atc816Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile260 265 270att ggt cca aga aaa tac atc gat aca caa cat att gac cca aaa gac864
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp275 280 285ttc tta aat aac gcg agt ttg ctt gaa tca tta cca gaa gtg aaa acc 912Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr290 295 300aat aat agt gtt gcc gca aaa ggg gaa gga aca gtt tct ctg gat tgg 960Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp305 310 315 320cgc tta gaa caa ttc gaa aaa aca gaa aat ctc cgc tta tcc gat tcg1008Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser325 330 335cct ttc cgt ttt ttt gcg gcg ggt aat gtt gct ttc gct aaa aaa tgg1056Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp340 345 350cta aat aaa tcc ggt ttc ttt gat gag gaa ttt aat cac tgg ggt gga1104Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly355 360 365gaa gat gtg gaa ttt gga tat cgc tta ttc cgt tac ggt agt ttc ttt1152Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe370 375 380aaa act att gat ggc att atg gcc tac cat caa gag cca cca ggt aaa1200Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys385 390 395 400gaa aat gaa acc gat cgt gaa gcg gga aaa aat att acg ctc gat att1248Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile405 410 415atg aga gaa aag gtc cct tat atc tat aga aaa ctt tta cca ata gaa1296Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu420 425 430gat tcg cat atc aat aga gta cct tta gtt tca att tat atc cca gct1344Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala435 440 445tat aac tgt gca aac tat att caa cgt tgc gta gat agt gca ctg aat1392Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn450 455 460cag act gtt gtt gat ctc gag gtt tgt att tgt aac gat ggt tca aca1440Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr465 470 475 480gat aat acc tta gaa gtg atc aat aag ctt tat ggt aat aat cct agg1488Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg485 490 495gta cgc atc atg tct aaa cca aat ggc gga ata gcc tca gca tca aat1536Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn500 505 510
gca gcc gtt tct ttt gct aaa ggt tat tac att ggg cag tta gat tca1584Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser515 520 525gat gat tat ctt gag cct gat gca gtt gaa ctg tgt tta aaa gaa ttt1632Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe530 535 540tta aaa gat aaa acg cta gct tgt gtt tat acc act aat aga aac gtc1680Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val545 550 555 560aat ccg gat ggt agc tta atc gct aat ggt tac aat tgg cca gaa ttt1728Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe565 570 575tca cga gaa aaa ctc aca acg gct atg att gct cac cac ttt aga atg1776Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met580 585 590ttc acg att aga gct tgg cat tta act gat gga ttc aat gaa aaa att1824Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile595 600 605gaa aat gcc gta gac tat gac atg ttc ctc aaa ctc agt gaa gtt gga1872Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly610 615 620aaa ttt aaa cat ctt aat aaa atc tgc tat aac cgt gta tta cat ggt1920Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly625 630 635 640gat aac aca tca att aag aaa ctt ggc att caa aag aaa aac cat ttt1968Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe645 650 655gtt gta gtc aat cag tca tta aat aga caa ggc ata act tat tat aat2016Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn660 665 670tat gac gaa ttt gat gat tta gat gaa agt aga aag tat att ttc aat2064Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn675 680 685aaa acc gct gaa tat caa gaa gag att gat atc tta aaa gat att aaa2112Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys690 695 700atc atc cag aat aaa gat gcc aaa atc gca gtc agt att ttt tat ccc2160Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro705 710 715 720aat aca tta aac ggc tta gtg aaa aaa cta aac aat att att gaa tat2208Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr725 730 735aat aaa aat ata ttc gtt att gtt cta cat gtt gat aag aat cat ctt2256
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu740 745 750aca cca gat atc aaa aaa gaa ata cta gcc ttc tat cat aaa cat caa2304Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln755 760 765gtg aat att tta cta aat aat gat atc tca tat tac acg agt aat aga2352Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg770 775 780tta ata aaa act gag gcg cat tta agt aat att aat aaa tta agt cag2400Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln785 790 795 800tta aat cta aat tgt gaa tac atc att ttt gat aat cat gac agc cta2448Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu805 810 815ttc gtt aaa aat gac agc tat gct tat atg aaa aaa tat gat gtc ggc2496Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly820 825 830atg aat ttc tca gca tta aca cat gat tgg atc gag aaa atc aat gcg2544Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala835 840 845cat cca cca ttt aaa aag ctc att aaa act tat ttt aat gac aat gac2592His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp850 855 860tta aaa agt atg aat gtg aaa ggg gca tca caa ggt atg ttt atg acg2640Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr865 870 875 880tat gcg cta gcg cat gag ctt ctg acg att att aaa gaa gtc atc aca2688Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr885 890 895tct tgc cag tca att gat agt gtg cca gaa tat aac act gag gat att2736Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile900 905 910tgg ttc caa ttt gca ctt tta atc tta gaa aag aaa acc ggc cat gta2784Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val915 920 925ttt aat aaa aca tcg acc ctg act tat atg cct tgg gaa cga aaa tta2832Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu930 935 940caa tgg aca aat gaa caa att gaa agt gca aaa aga gga gaa aat ata2880Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile945 950 955 960cct gtt aac aag ttc att att aat agt ata act cta2916Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu965 970
<210> 95<211> 972<212> PRT<213> 出血败血性巴斯德菌(Paseurella multocida)<400> 95Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr1 5 10 15Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg20 25 30Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala35 40 45His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys50 55 60Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu65 70 75 80Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu85 90 95Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu100 105 110Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val115 120 125Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys130 135 140Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu145 150 155 160Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr165 170 175Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile180 185 190Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly210 215 220Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr225 230 235 240Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp245 250 255Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile260 265 270Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp275 280 285Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr290 295 300Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp305 310 315 320Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser325 330 335Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp340 345 350Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly355 360 365Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe370 375 380Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys385 390 395 400Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile405 410 415Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala435 440 445Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn450 455 460Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr465 470 475 480Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg485 490 495Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn500 505 510Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser515 520 525Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe530 535 540Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val545 550 555 560Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe565 570 575Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met580 585 590Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile595 600 605Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly610 615 620Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly625 630 635 640Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe645 650 655Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn675 680 685Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys690 695 700Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro705 710 715 720Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr725 730 735Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu740 745 750Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln755 760 765Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg770 775 780Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln785 790 795 800Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu805 810 815Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly820 825 830Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala835 840 845His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp850 855 860Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr865 870 875 880Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile900 905 910Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val915 920 925Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu930 935 940Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile945 950 955 960Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu965 970<210> 96<211> 1206<212> DNA<213> 酿脓链球菌(Streptococcus pyogenes)<220>
<221> CDS<222> (1)..(1206)<223>
<400> 96atg aaa ata gca gtt gct gga tca gga tat gtt gga tta tca cta gga 48Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly1 5 10 15gtt ctt tta tca ctt caa aac gaa gtc act att gtt gat att ctt ccc 96Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro20 25 30tct aaa gtt gat aag att aat aat ggc tta tca cca att caa gat gaa144Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu35 40 45tat att gaa tat tac tta aaa agt aag caa tta tct att aaa gca act192Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr50 55 60tta gat agc aaa gca gct tat aaa gaa gcg gaa ctg gtc att att gcc240Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala65 70 75 80aca cct aca aat tac aac agt aga att aat tat ttt gat aca cag cat288Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His85 90 95gtt gaa aca gtt atc aaa gag gta cta agc gtt aat agc cat gca act336Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr
l00 105 110ctt atc atc aaa tca aca att cca ata ggt ttc att act gaa atg aga384Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg115 120 125cag aaa ttc caa act gat cgt att atc ttc agc cct gaa ttt tta aga432Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg130 135 140gaa tct aaa gct tta tat gac aac tta tat cca agc cga att att gtt480Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val145 150 155 160tct tgt gaa gaa aac gat tct cca aaa gta aag gca gac gca gaa aaa528Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys165 170 175ttt gca ctt tta tta aag tct gca gct aaa aaa aat aat gta cca gta576Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val180 185 190ctt att atg gga gct tca gaa gct gaa gca gta aaa cta ttt gcc aat624Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn195 200 205act tat tta gcg tta agg gta gct tat ttt aat gag tta gac act tac672Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr210 215 220gca gaa tcg aga aaa tta aat agt cac atg att att caa gga att tct720Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser225 230 235 240tat gat gat cga ata gga atg cat tat aat aac cca tca ttt ggt tat768Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr245 250 255gga ggt tat tgt cta cct aaa gat acg aag caa tta ttg gca aat tac816Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr260 265 270aat aat att cct caa acg cta att gaa gct atc gtt tca tca aat aat864Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn275 280 285gtg cgc aag tcc tat att gct aag caa att atc aac gtc tta gaa gag912Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu290 295 300cgg gag tcc cca gta aaa gta gtc ggg gtt tac cgt tta att atg aaa960Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys305 310 315 320agt aac tca gat aat ttt aga gaa agt gct atc aaa gat gtt att gac 1008Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp325 330 335
att ctt aaa agt aaa gac att aag ata att att tat gag cca atg tta1056Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu340 345 350aac aaa ctt gaa tct gaa gat caa tct gta ctt gta aat gat tta gag1104Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu355 360 365aat ttc aag aaa caa gca aat att atc gta act aat cgc tat gat aat1152Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn370 375 380gaa tta caa gat gtt aaa aat aaa gtt tac agt aga gat att ttt aat1200Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn385 390 395 400aga gac1206Arg Asp<210> 97<211> 402<212> PRT<213> 酿脓链球菌(Streptococcus pyogenes)<400> 97Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly1 5 10 15Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro20 25 30Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu35 40 45Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr50 55 60Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala65 70 75 80Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His85 90 95Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr100 105 110Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg115 120 125
Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg130 135 140Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val145 150 155 160Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys165 170 175Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val180 185 190Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn195 200 205Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr210 215 220Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser225 230 235 240Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr245 250 255Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr260 265 270Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn275 280 285Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu290 295 300Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys305 310 315 320Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp325 330 335Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu340 345 350
Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu355 360 365Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn370 375 380Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn385 390 395 400Arg Asp<210> 98<211> 912<212> DNA<213> 酿脓链球菌(Streptococcus pyogenes)<220>
<221> CDS<222> (1)..(912)<223>
<400> 98atg acc aaa gtc aga aaa gcc att att cct gct gca ggt cta gga aca 48Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr1 5 10 15cgt ttt tta cct gct acc aaa gct ctt gcc aaa gag atg ttg ccc atc 96Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile20 25 30gtt gat aaa cca acc atc cag ttt atc gtc gaa gaa gcg cta aaa tct144Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser35 40 45ggc atc gag gaa atc ctt gtg gtg acc gga aaa gct aaa cgc tct atc192Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Set Ile50 55 60gag gac cat ttt gat tca aac ttt gaa tta gaa tac aac ctc caa gct240Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala65 70 75 80aag ggg aaa aat gaa ctg ttg aaa tta gtg gat gaa acc act gcc att288Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile85 90 95aac ctt cat ttt atc cgt caa agc cac cca aga ggg ctg gga gat gct336Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala100 105 110gtc tta caa gcc aaa gcc ttt gtg ggc aat gaa ccc ttt gtg gtc atg384Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
115 120 125ctt gga gat gac tta atg gac att aca aat gca tcc gct aaa cct ctc432Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu130 135 140acc aaa caa crc atg gag gac tat gac aag acg cat gca tcc act atc480Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile145 150 155 160gct gtg atg aaa gtt cct cat gaa gat gtg tct age tat ggg gtt atc528Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile165 170 175gct cct caa ggc aag gct gtc aag ggc ctt tac agt gta gac acc ttt576Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe180 185 190gtt gaa aaa cca caa cca gaa gat gcg cct agt gat ttg get att att624Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile195 200 205ggt cgt tac ctc cta acc cct gaa att ttt ggt att ttg gaa aga cag672Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln210 215 220acc cct gga gca ggt aac gaa gtg caa ctc aca gat gct atc gat acc720Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr225 230 235 240ctc aat aaa act cag cgt gte ttt gca cga gaa ttt aaa ggc aat cgt768Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg245 250 255tac gat gtt ggg gat aaa ttt gga ttc atg aaa aca tct atc gac tat816Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr260 265 270gcc tta gaa cac cca cag gtc aaa gag gac ttg aaa aat tac att atc 864Ala Leu Glu His Pro Gln Val Lys Glu Asp Leu Lys Asn Tyr Ile Ile275 280 285aaa cta gga aaa gct ttg gaa aaa agt aaa gta cca aca cat tca aag912Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys290 295 300<210> 99<211> 304<212> PRT<213> 酿脓链球菌(Streptococcus pyogenes)<400> 99Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr1 5 10 15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile20 25 30Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser35 40 45Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile50 55 60Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala65 70 75 80Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile85 90 95Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala100 105 110Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met115 120 125Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu130 135 140Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile145 150 155 160Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile165 170 175Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe180 185 190Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile195 200 205Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln210 215 220Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr225 230 235 240Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg245 250 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr260 265 270Ala Leu Glu His Pro Gln Val Lys GLu Asp Leu Lys Asn Tyr Ile Ile275 280 285Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys290 295 300<210> 100<211> 1347<212> DNA<213> 马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)<220>
<221> CDS<222> (1)..(1347)<223>
<400> 100atg tca cat att aca ttt gat tat tca aag gtt ctt gag caa ttt gcc 48Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala1 5 10 15gga cag cat gaa att gac ttt tta caa ggt cag gta aca gag gct gat 96Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp20 25 30cag gca cta cgt cag ggc act gga cct gga tca gat ttc ttg ggc tgg144Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp35 40 45ctt gag tta cct gaa aac tat gac aaa gaa gaa ttt gct cgt atc ctt192Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu50 55 60aaa gca gct gag aag att aag gct gac agt gac gtt ctt gtt gtg att240Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile65 70 75 80ggt att ggt ggc tct tac ctt ggt gct aag gct gca att gac ttt ttg288Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu85 90 95aac agc cat ttt gcc aac cta caa aca gca aaa gag cgc aaa gca cca336Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro100 105 110caa att ctt tat gct ggt aac tcc atc tca tca agc tat ctt gct gat384Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp115 120 125ctt gtg gac tat gtt caa gat aaa gat ttc tct gtt aac gtg att tct432
Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser130 135 140aag tct ggt aca aca aca gag cct gca atc gcc ttt cgt gtc ttt aaa 480Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys145 150 155 160gaa tta ctt gtt aaa aag tac ggt caa gaa gag gcc aac aag cgt atc 528Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile165 170 175tat gca acg act gat aag gtc aag ggt gct gtt aag gtt gag gct gat 576Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp180 185 190gca aat cat tgg gaa acc ttt gtt gtg cca gat aat gtt ggt ggc cgt 624Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg195 200 205ttc tca gtg ctg aca gct gtg ggc ttg cta cca att gca gca tca ggg 672Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly210 215 220gct gat att acc gcg ctg atg gaa gga gca aat gca gct cgt aag gac 720Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp225 230 235 240ctg tca tca gat aaa atc tca gaa aac atc gct tac caa tat gct gtg 768Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val245 250 255gtc cgc aat atc ctc tat cgc aaa ggc tat gta act gaa att ttg gca 816Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala260 265 270aac tat gag cca tca ttg cag tat ttt agc gaa tgg tgg aag caa ctg 864Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu275 280 285gct ggt gag tct gaa gga aag gac caa aag ggt att tac cca act tca 912Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser290 295 300gct aat ttc tcg aca gac ctg cat tct ctt ggt caa ttt atc caa gaa 960Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu305 310 315 320ggc tac cgt aac ctc ttt gag aca gtg att cgt gtg gac aag cca cgt1008Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg325 330 335caa aat gtg att atc cca gaa atg gct gag gac ctt gat ggc ctt ggc1056Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly340 345 350tac cta caa gga aaa gac gtt gac ttt gtc aac aaa aaa gca aca gat1104Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp355 360 365
ggt gtc ctt ctt gcc cat aca gat ggt ggt gtg cca aat atg ttt atc1152Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile370 375 380acg ctt cca gag caa gac gaa ttt aca cta ggc tat acg atc tac ttc1200Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe385 390 395 400ttt gag ctt gct att gcc ctt tca ggc tac ctc aac ggg gtc aat cca1248Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro405 410 415ttt gat cag cca ggc gtt gag gct tac aag aaa aac atg ttt gcc ctt1296Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu420 425 430crt ggt aag cca ggc ttt gaa gag cta gga gca gcg ctc aac gca cgc1344Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg435 440 445ttg1347Leu<210> 101<211> 449<212> PRT<213> 马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)<400> 101Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala1 5 10 15Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp20 25 30Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp35 40 45Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu50 55 60Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile65 70 75 80Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu85 90 95Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro
100 105 110Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp115 120 125Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser130 135 140Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys145 150 155 160Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile165 170 175Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp180 185 190Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg195 200 205Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly210 215 220Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp225 230 235 240Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val245 250 255Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala260 265 270Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu275 280 285Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser290 295 300Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu305 310 315 320Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg325 330 335
Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly340 345 350Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp355 360 365Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile370 375 380Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe385 390 395 400Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro405 410 415Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu420 425 430Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg435 440 445Leu<210> 102<211> 1251<212> DNA<213> 乳房链球菌(Streptococcus uberis)<220>
<221> CDS<222> (1)..(1251)<223>
<400> 102atg gaa aaa cta aaa aat ctc att aca ttt atg act ttt att ttc ctg 48Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu1 5 10 15tgg ctc ata att att ggg ctt aat gtt ttt gta ttt gga act aaa gga 96Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly20 25 30agt cta aca gtg tat ggg att att cta tta acc tat ttg tcg ata aaa144Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys35 40 45atg gga tta tct ttt ttt tat cgt ccc tat aaa gga agt gta ggt caa192
Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln50 55 60tat aag gta gca gct att atc cca tct tat aat gag gat ggt gtc ggt240Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly65 70 75 80tta cta gaa act cta aag agt gtt caa aaa caa aca tat cca att gca288Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala85 90 95gaa att ttc gta att gac gat ggg tca gta gat aaa aca ggt ata aaa336Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys100 105 110ttg gtc gaa gac tat gtg aag tta aat ggc ttt gga gac caa gtt atc384Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile115 120 125gtt cat cag atg cct gaa aat gtt ggt aaa aga cat gct cag gct tgg432Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp130 135 140gca ttt gaa agg tct gat gct gat gtt ttc tta aca gtg gat tca gat480Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp145 150 155 160acc tac atc tat cct gat gct ctt gaa gaa tta tta aag aca ttt aat528Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn165 170 175gat cca gag gtc tac gct gca act ggt cat tta aat gca aga aat aga576Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg180 185 190caa act aat ctc tta act aga ctg act gat att cgt tac gat aat gca624Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala195 200 205ttt ggt gta gaa cgt gct gct cag tct gtt acg gga aat att ttg gtt672Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val210 215 220tgt tcc gga cct tta agt att tat aga cgt tcc gtc ggt att cca aat720Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn225 230 235 240ctt gaa cgc tat acc tca caa aca ttt ctt ggt gtc cct gta agc ata768Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile245 250 255ggg gat gac cgt tgt ttg aca aat tat gca act gat ttg gga aaa acg816Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr260 265 270gtt tat cag tca act gca aga tgt gat act gac gtt cca gat aag ttt864Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe275 280 285
aag gtt ttc atc aaa caa caa aat cgt tgg aat aag tca ttt ttt agg 912Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg290 295 300gag tct att atc tct gtt aag aag tta tta gcc aca cca agt gtt gct 960Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala305 310 315 320gtt tgg act att aca gaa gtt tcc atg ttc atc atg cta gtt tat tct1008Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser325 330 335atc ttt agc tta ttg ata gga gag gct caa gaa ttt aat ctc ata aaa1056Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys340 345 350ctg gtt gct ttt tta gtt att att ttc ata gta gct ctt tgt aga aat1104Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn355 360 365gtt cat tac atg gtt aag cat cca ttt gct ttt tta ttg tca ccg ttt1152Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe370 375 380tat gga ttg ata cat cta ttc gtt ttg caa cct ctt aag ata tat tcg1200Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser385 390 395 400tta ttt act ata aga aat gct aca tgg gga act cgt aaa aag aca agt1248Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser405 410 415aaa1251Lys<210> 103<211> 417<212> PRT<213> 乳房链球菌(Streptococcus uberis)<400> 103Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leul 5 10 15Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly20 25 30Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys35 40 45Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln
50 55 60Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly65 70 75 80Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala85 90 95Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys100 105 110Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile115 120 125Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp130 135 140Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp145 150 155 160Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn165 170 175Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg180 185 190Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala195 200 205Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val210 215 220Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn225 230 235 240Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile245 250 255Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr260 265 270Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe275 280 285
Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg290 295 300Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala305 310 315 320Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser325 330 335Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys340 345 350Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn355 360 365Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe370 375 380Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser385 390 395 400Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser405 410 415Lys<210> 104<211> 1203<212> DNA<213> 乳房链球菌(streptococcus uberis)<220>
<221> CDS<222> (1)..(1203)<223>
<400> 104gtg aaa att gca gtt gca ggt tct ggc tat gtt ggc cta tca tta agt 48Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser1 5 10 15gta tta tta gca cag aaa aat cct gtt aca gtt gta gat att att gag 96Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu20 25 30aag aaa gta aat ctc ata aat caa aaa caa tca cca atc cag gat gtt144Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val
35 40 45gat att gaa aac tat tta aaa gaa aaa aag tta caa tta aga gct act 192Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr50 55 60cta gac gcc gat caa gca ttt agg gat gca gat ata cta att att gct 240Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala65 70 75 80aca cca acc aat tat gat gtg gag aag aat ttt ttt gat act agt cat 288Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His85 90 95gtt gag act gta att gag aaa gct tta gct tta aat agt cag gct ttg 336Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu100 105 110tta gtt att aaa tca acg ata cca ctt ggt ttt att aaa aag atg cgt 384Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg115 120 125caa aaa tat cag aca gac cgt att att ttt agt ccc gaa ttt ctt aga 432Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg130 135 140gag tct aaa gct tta aaa gat aat ctt tat cct agt cga ata att gtt 480Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val145 150 155 160tcc ttt gaa gat gat gat tct atg gaa gta ata gaa gca gca aag act 528Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr165 170 175ttt gct caa ttg tta aaa gat ggt tct ttg gat aaa gat gtt cct gta 576Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val180 185 190ctt ttt atg ggt tca gca gag gct gaa gca gta aaa tta ttt gcc aat 624Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn195 200 205acc tat tta gct atg cgt gtc tcc tat ttt aat gag tta gat aca tat 672Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr210 215 220gct gaa aag aat ggt tta cgt gtg gat aat att att gag ggc gtt tgc 720Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys225 230 235 240cat gat cga cgc ata gga att cat tat aat aac cct tct ttt ggc tat 768His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr245 250 255gga gga tac tgc tta cct aaa gat acc aaa cag ttg cta gca ggc tat 816Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr260 265 270
gat ggt att cct caa tcg ctt ata aaa gca att gtt gat tct aat aaa 864Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys275 280 285att cgt aaa gag tat atc gca tca caa att tta caa caa ttg agt gat 912Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp290 295 300att aat gta gat cct aaa gat gca acg att ggt att tac cgc ctt atc 960Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile305 310 315 320atg aaa agt aac tct gat aat ttc aga gag agt gca ata aaa gat att1008Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile325 330 335att gat cat att aag agc tat caa att aat ata gtc ttg tat gag cca1056Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro340 345 350atg atg aat gaa gat ttt gat tta cca atc att gat gat tta tct gac1104Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp355 360 365ttc aaa gcc atg tca cat att atc gtt tca aat aga tat gat tta gcc1152Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala370 375 380tta gaa gat gtt aaa gaa aaa gtt tac acc aga gat att tac ggt gtg1200Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val385 390 395 400gat1203Asp<210> 105<211> 401<212> PRT<213> 乳房链球菌(Streptococcus uberis)<400> 105Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser1 5 10 15Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu20 25 30Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val35 40 45Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr50 55 60
Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala65 70 75 80Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His85 90 95Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu100 105 110Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg115 120 125Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg130 135 140Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val145 150 155 160Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr165 170 175Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val180 185 190Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn195 200 205Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr210 215 220Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys225 230 235 240His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr245 250 255Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr260 265 270Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys275 280 285
Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp290 295 300Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile305 310 315 320Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile325 330 335Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro340 345 350Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp355 360 365Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala370 375 380Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val385 390 395 400Asp<210> 106<211> 912<212> DNA<213> 乳房链球菌(Streptococcus uberis)<220>
<221> CDS<222> (1)..(912)<223>
<400> 106atg act aaa gta aga aaa gcc att att cca gct gcc gga ctt ggc aca 48Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr1 5 10 15cgt ttt tta cca gca aca aaa gct ctc gct aag gaa atg ttg ccc atc 96Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile20 25 30gtt gac aaa cca acc att caa ttc atc gtg gaa gaa gct ttg cgt tct144Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser35 40 45ggc att gaa gaa atc ttg gtc gta aca gga aaa tca aaa cgc tcc att192Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile
50 55 60gaa gac cat ttt gat tcc aac ttt gaa ctc gaa tat aat ttg caa gaa240Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu65 70 75 80aaa ggg aaa act gaa ctc tta aaa tta gtt gat gaa acc act tct ata288Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile85 90 95aac ttg cat ttc att cgt caa agt cat ccc aaa ggc tta ggg gat gct336Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala100 105 110gtt tta caa gca aaa gct ttt gta gga aat gaa ccc ttc att gtt atg384Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met115 120 125ctt ggt gac gat ttg atg gac att aca aat acc aaa gct gtc cca tta432Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu130 135 140acc aaa caa tta atg gac gat tat gaa aca aca cat gct tct aca ata480Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile145 150 155 160gcc gta atg aaa gtt cct cac gat gac gta tcc tct tat ggt gtc att528Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile165 170 175gct cca aac ggc aaa gcc ttg aat ggc tta tat agc gtg gat acc ttt576Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe180 185 190gtt gaa aaa cca aaa cct gag gac gca cca agt gac ctt gct atc att624Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile195 200 205gga cgt tat ctc tta aca cct gaa att ttt gac att ctt gaa aat caa672Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln210 215 220gca cca ggt gcc gga aac gaa gtc caa tta act gat gct atc gat acc720Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr225 230 235 240ctc aac aaa aca caa cgt gtt ttt gct cgt gag ttt act ggc aaa cgc768Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg245 250 255tac gat gtt gga gac aag ttt ggc ttc atg aaa aca tct atc gat tat816Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr260 265 270gcc cta aaa cac cat caa gtc aaa gat gac cta aaa gct tat att atc864Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile275 280 285
aag tta ggt aaa gaa tta gaa aaa gca caa gat tcc aaa gsa agc aaa912Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys290 295 300<210> 107<211> 304<212> PRT<213> 乳房链球菌(Streptococcus uberis)<400> 107Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr1 5 10 15Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile20 25 30Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser35 40 45Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile50 55 60Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu65 70 75 80Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile85 90 95Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala100 105 110Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met115 120 125Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu130 135 140Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile145 150 155 160Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile165 170 175Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe180 185 190
Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile195 200 205Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln210 215 220Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr225 230 235 240Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg245 250 255Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr260 265 270Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile275 280 285Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys290 295 300<210> 108<211> 5158<212> DNA<213> 似马链球菌(Streptococcus equisimilis)<400> 108tcaatttatg gctttttgct gatagcttac ctattagtca aaatgtcctt atcctttttt 60tacaagccat ttaagggaag ggctgggcaa tataaggttg cagccattat tccctcttat120aacgaagatg ctgagtcatt gctagagacc ttaaaaagtg ttcagcagca aacctatccc180ctagcagaaa tttatgttgt tgacgatgga agtgctgatg agacaggtat taagcgcatt240gaagactatg tgcgtgacac tggtgaccta tcaagcaatg tcattgttca tcggtcagag300aaaaatcaag gaaagcgtca tgcacaggcc tgggcctttg aaagatcaga cgctgatgtc360tttttgaccg ttgactcaga tacttatatc taccctgatg ctttagagga gttgttaaaa420acctttaatg acccaactgt ttttgctgcg acgggtcacc ttaatgtcag aaatagacaa480accaatctct taacacgctt gacagatatt cgctatgata atgcttttgg cgttgaacga540gctgcccaat ccgttacagg taatatcctt gtttgctcag gtccgcttag cgtttacaga600cgcgaggtgg ttgttcctaa catagataga tacatcaacc agaccttcct gggtattcct660
gtaagtattg gtgatgacag gtgcttgacc aactatgcaa ctgatttagg aaagactgtt 720tatcaatcca ctgctaaatg tattacagat gttcctgaca agatgtctac ttacttgaag 780cagcaaaacc gctggaacaa gtccttcttt agagagtcca ttatttctgt taagaaaatc 840atgaacaatc cttttgtagc cctatggacc atacttgagg tgtctatgtt tatgatgctt 900gtttattctg tggtggattt ctttgtaggc aatgtcagag aatttgattg gctcagggtt 960ttagcctttc tggtgattat cttcattgtt gccctgtgtc ggaacattca ttacatgctt1020aagcacccgc tgtccttctt gttatctccg ttttatgggg tgctgcattt gtttgtccta1080cagcccttga aattatattc tctttttact attagaaatg ctgactgggg aacacgtaaa1140aaattattat aaaccaacta gacctaggtt ctgacaaggg agctaagcta gggataaaca1200aagagttttg atccgactcg agcagctcat aaacgaaagc tatcccactt gtaattgaag1260ctaagagctt ttagcttgca gctctataaa gacgaaccag aggctgagtg tcagctttgg1320tgtgagggct aggtcattat gatccttcag gtgtggcacc tgagctccgg cagtagctaa1380ctgtactaag gtatcaaagg aaaaaatgaa gtgaaaattt ctgtagcagg ctcaggatat1440gtcggcctat ccttgagtat tttactggca caacataatg acgtcactgt tgttgacatt1500attgatgaaa aggtgagatt gatcaatcaa ggcatatcgc caatcaagga tgctgatatt1560gaggagtatt taaaaaatgc gccgctaaat ctcacagcga cgcttgatgg cgcaagcgct1620tatagcaatg cagaccttat tatcattgct actccgacaa attatgacag cgaacgcaac1680tactttgaca caaggcatgt tgaagaggtc atcgagcagg tcctagacct aaatgcgtca1740gcaaccatta ttatcaaatc aaccatacca ctaggcttta tcaagcatgt tagggaaaaa1800taccagacag atcgtattat ttttagccca gaatttttaa gagaatcaaa agccttatac1860gataaccttt acccaagtcg gatcattgtt tcttatgaaa aggacgactc accaagggtt1920attcaggctg ctaaagcctt tgctggtctt ttaaaggaag gagccaaaag caaggatact1980ccggtcttat ttatgggctc acaggaggct gaggcggtca agctatttgc gaataccttt2040ttggctatgc gggtgtctta ctttaatgaa ttagacacct attccgaaag caagggtcta2100gatgctcagc gcgtgattga aggagtctgt catgatcagc gcattggtaa ccattacaat2160aacccttcct ttggatatgg cggctattgc ctgccaaagg acagcaagca gctgttggca2220aattatagag gcattcccca gtccttgatg tcagcgattg ttgaatccaa caagatacga2280aaatcttatt tggctgaaca aatattagac agagcctcta gtcaaaagca ggctggtgta2340ccattaacga ttggctttta ccgcttgatt atgaaaagca actctgataa tttccgagaa2400
agcgccatta aagatattat tgatatcatc aacgactatg gggttaatat tgtcatttac2460gaacccatgc ttggcgagga tattggctac agggttgtca aggacttaga gcagttcaaa2520aacgagtcta caatcattgt gtcaaatcgc tttgaggacg acctaggaga tgtcattgat2580aaggtttata cgagagatgt ctttggaaga gactagtcag aaaacgaatg gcactcataa2640ggaaccacaa atcaaggagg aactcatgac aaaggtcaga aaagccatta tcccagccgc2700cggcctaggc actcgcttcc tgcccgccac caaggcactg gccaaggaaa tgctcccaat2760cgtcgataag ccaaccattc aattcatcgt cgaggaagcc ctaaaggcag gtatcgagga2820gattcttgtc gtcaccggca aggccaaacg ctctatcgag gaccactttg actccaactt2880cgagctcgaa tacaatctcc aagccaaggg caaaaccgag ctactcaagc tcgttgatga2940gaccactgcc atcaacctgc acttcattcg tcagagccac cctagaggac taggggacgc3000tgtcctccaa gccaaggcct ttgttggcaa tgagcccttt gtggtcatgc tgggggatga3060cctcatggat attaccaatc ctagtgccaa gcccttgacc aagcagctta ttgaggatta3120tgattgcaca cacgcctcaa cgattgcagt gatgagggtg ccgcatgagg aggtttccaa3180ttatggtgtg attgcaccgc aagggaaggc tgttaagggc ttgtatagtg tggagacctt3240tgttgagaag ccaagtccag atgaggcacc gagtgactta gcgattattg gtcgatattt3300gttgacgcct gagatttttg ccatattgga gaagcaggcg cctggagctg gcaatgaggt3360acagctgacc gatgcgattg acaagctcaa taagacacag cgggtttttg cgagggagtt3420taagggagag cggtatgatg ttggggacaa gtttggcttt atgaagacct cacttgacta3480tgctctcaag caccctcagg tcaaggacga cctcactgac tacattataa agctcagtaa3540gcaactgaac aaggacgtca agaaataggc gtttattgat cagctattgc agagctattt3600aaaagcattt agagctttaa ggtgggatac tagaggattg gtatctcact ttttaggctg3660acttgtatta ataccaaaag ccaaaactag gcagataagc ataaggaatt agattaaaaa3720taaggaacca aaacatgaaa aactacgcca ttatcctagc agctggaaag ggaacgcgca3780tgaagtcagc gcttcccaag gtgctgcaca aggtatcagg cctaagcatg ctggagcatg3840tcctcaagag tgtctcagcc ctagcccctc aaaagcagct cacagtgatc ggtcatcagg3900cagagcaggt gcgtgctgtc ctaggagagc aatcgctaac agtggtgcaa gaggagcagc3960tagggacagg ccatgcagtc atgatggcag aagaggagct atctggctta gaggggcaaa4020ccctagtgat tgcaggtgac acccccttga tcagaggaga aagcctcaag gctctgctag4080actatcatat cagagaaaag aatgtggcaa ccattctcac agccaatgcc aaggatccct4140
ttggctatgg acgaatcatt cgcaatgcag caggagaggt ggtcaacatc gttgagcaaa4200aggatgctaa tgaggcagag caagaggtca aggagatcaa cacagggact tatatctttg4260acaataagcg cctttttgag gctctaaagc atctcacgac tgataatgcc caaggggagt4320actacctaac cgatgtgatc agtattttca aggctggcca agaaagggtt ggcgcttacc4380tgctgaagga ctttgatgag agcctagggg ttaatgatcg cttagctcta gcccaggccg4440aggtgattat gcaagagcgg atcaacaggc agcacatgct taatggggtg accctgcaaa4500acccggcagc tacctatatt gaaagcagtg tagagattgc accagacgtc ttgattgaag4560ccaatgtgac cttaaaggga cagactagaa ttggcagcag aagtgtcata agcaatggga4620gctatatcct tgattcgagg cttggtgagg gtgtagtggt tagccagtcg gtgattgagg4680cttcagtctt agcagatgga gtgacagtag ggccatatgc acacattcgc ccggactccc4740agctcgatga gtgtgttcat attgggaact ttgtagaggt taaggggtct catctagggg4800ccaataccaa ggcagggcat ttgacttacc tggggaatgc cgagattggc tcagaggtta4860acattggtgc aggaagcatt acggttaatt atgatggtca acggaaatac cagacagtga4920ttggcgatca cgcttttatt gggagtcatt cgactttgat agctccggta gaggttgggg4980agaatgcttt aacagcagca gggtctacga tagcccagtc agtgccggca gacagtgtgg5040ctatagggcg cagccgtcag gtggtgaagg aaggctatgc caagaggctg ccgcaccacc5100caaatcaagc ctaatcgctc aaccaaaaga ggcaggtgag aaaacctagg ccattaaa 5158
权利要求
1.一种制备透明质酸的方法,包括(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
2.权利要求1的方法,其中透明质酸合酶编码序列编码I型透明质酸合酶。
3.权利要求2的方法,其中I型透明质酸合酶编码序列获自链球菌属菌株。
4.权利要求3的方法,其中链球菌菌株是似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。
5.权利要求1的方法,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO2、SEQ ID NO93或SEQ ID NO103有至少约70%、约75%、约80%、约85%、约90%或约95%同一性的;氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO1、SEQ ID NO92或SEQ ID NO102杂交的核酸序列;和(c)(a)或(b)的互补链。
6.权利要求5的方法,其中透明质酸合酶编码序列编码含有SEQ IDNO2、SEQ ID NO93或SEQ ID NO103或其具有透明质酸合酶活性的片段的氨基酸序列的多肽。
7.权利要求1的方法,其中透明质酸合酶编码序列编码II型透明质酸合酶。
8.权利要求7的方法,其中II型透明质酸合酶编码序列获自巴斯德菌属菌株。
9.权利要求8的方法,其中巴斯德菌属菌株为出血败血性巴斯德菌。
10.权利要求1的方法,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO95有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO94杂交的核酸序列;和(c)(a)或(b)的互补链。
11.权利要求10的方法,其中透明质酸合酶编码序列编码含有SEQ IDNO95或其具有透明质酸合酶活性的片段的氨基酸序列的多肽。
12.权利要求1的方法,其中透明质酸的前体糖由芽孢杆菌属宿主细胞供给或制备。
13.权利要求12的方法,其中前体糖为D-葡萄糖醛酸或N-乙酰葡糖胺。
14.权利要求12的方法,其中前体糖由芽孢杆菌属宿主细胞中内源性基因、非内源性基因,或内源性和非内源性基因的组合所编码。
15.权利要求1的方法,其中核酸构建体还包含一个或多个编码透明质酸前体糖的生物合成中的酶的基因或所述芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体,所述核酸构建体含有一个或多个编码透明质酸前体糖的生物合成中的酶的基因。
16.权利要求15的方法,其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
17.权利要求16的方法,其中所述UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。
18.权利要求17的方法,其中所述hasB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO41、SEQ ID NO97或SEQ ID NO105有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO40、SEQ ID NO96或SEQ ID NO104杂交的核酸序列;和(c)(a)或(b)的互补链。
19.权利要求18的方法,其中所述hasB基因编码含有SEQ ID NO41、SEQ ID NO97或SEQ ID NO105的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
20.权利要求17的方法,其中所述tuaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO12有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO11杂交的核酸序列;和(c)(a)或(b)的互补链。
21.权利要求20的方法,其中所述tuaD基因编码含有SEQ ID NO12的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
22.权利要求16的方法,其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。
23.权利要求22的方法,其中所述hasC基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO43、SEQ ID NO99或SEQ ID NO107有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO42或SEQ ID NO98或SEQ ID NO106杂交的核酸序列;和(c)(a)或(b)的互补链。
24.权利要求23的方法,其中所述hasC基因编码含有SEQ ID NO43或SEQ ID NO99或SEQ ID NO107的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
25.权利要求22的方法,其中所述gtaB基因选自(a)编码多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO22有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO21杂交的核酸序列;和(c)(a)或(b)的互补链。
26.权利要求25的方法,其中所述gtaB基因编码含有SEQ ID NO22的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
27.权利要求16的方法,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。
28.权利要求27的方法,其中所述hasD基因选自(a)编码多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO45有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严谨条件下与SEQ ID NO44杂交的核酸序列;和(c)(a)或(b)的互补链。
29.权利要求28的方法,其中所述hasD基因编码含有SEQ ID NO45的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。
30.权利要求27的方法,其中所述gcaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO30有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO29杂交的核酸序列;和(c)(a)或(b)的互补链。
31.权利要求30的方法,其中所述gcaD基因编码含有SEQ ID NO30的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。
32.权利要求16的方法,其中葡萄糖-6-磷酸异构酶基因为hasE或其同系物。
33.权利要求32的方法,其中所述hasE基因选自(a)编码多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO101有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO100杂交的核酸序列;和(c)(a)或(b)的互补链。
34.权利要求33的方法,其中所述hasE基因编码含有SEQ ID NO101的氨基酸序列,或其具有葡萄糖-6-磷酸异构酶活性的片段的多肽。
35.权利要求15的方法,其中一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
36.权利要求的方法35,其中所述相同或不同的启动子序列包含“共有序列”启动子,该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。
37.权利要求的方法35,其中所述相同或不同的启动子序列为串联启动子,其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。
38.权利要求1的方法,其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。
39.权利要求15的方法,其中所述核酸构建体还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。
40.权利要求1的方法,其中所述核酸构建体还包含可选择的标记基因。
41.权利要求1的方法,其中所述芽孢杆菌属宿主细胞选自Bacillusagaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌和苏芸金芽胞杆菌。
42.权利要求1的方法,其中所述芽孢杆菌属宿主细胞为枯草芽孢杆菌。
43.权利要求1的方法,其中所述芽孢杆菌属宿主细胞为地衣形芽胞杆菌。
44.权利要求1的方法,其中所述芽孢杆菌属宿主细胞未用可选择的标记进行标记。
45.权利要求1的方法,其中所述核酸构建体包含可操作性连接于包含“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因,UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
46.包含核酸构建体的芽孢杆菌属宿主细胞,所述核酸构建体含有可操作性连接于与透明质酸合酶编码序列异源的启动子序列。
47.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码I型透明质酸合酶。
48.权利要求47的芽孢杆菌属宿主细胞,其中所述I型透明质酸合酶编码序列获自链球菌属菌株。
49.权利要求48的芽孢杆菌属宿主细胞,其中所述链球菌属菌株为似马链球菌,酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。
50.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ IDNO2、SEQ ID NO93或SEQ ID NO103有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ IDNO1、SEQ ID NO92或SEQ ID NO102杂交的核酸序列;和(c)(a)或(b)的互补链。
51.权利要求50的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码含有SEQ ID NO2、SEQ ID NO93或SEQ ID NO103的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
52.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码II型透明质酸合酶。
53.权利要求52的芽孢杆菌属宿主细胞,其中所述II型透明质酸合酶编码序列获自巴斯德菌属菌株。
54.权利要求53的芽孢杆菌属宿主细胞,其中所述巴斯德菌属菌株为出血败血性巴斯德菌。
55.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ IDNO95有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO94杂交的核酸序列;和(c)(a)或(b)的互补链。
56.权利要求55的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码含有SEQ ID NO95的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
57.权利要求46的芽孢杆菌属宿主细胞,其中将透明质酸的前体糖供应给或由芽孢杆菌属宿主细胞生成。
58.权利要求57的芽孢杆菌属宿主细胞,其中所述前体糖为D-葡萄糖醛酸或N-乙酰葡糖胺。
59.权利要求57的芽孢杆菌属宿主细胞,其中所述前体糖由芽孢杆菌属宿主细胞中的内源性基因、非内源性基因,或内源性和非内源性基因的组合编码。
60.权利要求46的芽孢杆菌属宿主细胞,其中所述核酸构建体还包含一个或多个编码透明质酸前体糖的生物合成中的酶的基因或所述芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体,所述核酸构建体含有一个或多个编码透明质酸前体糖的生物合成中的酶的基因。
61.权利要求60的芽孢杆菌属宿主细胞,其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
62.权利要求61的芽孢杆菌属宿主细胞,其中所述UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。
63.权利要求62的芽孢杆菌属宿主细胞,其中所述hasB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO41、SEQID NO97或SEQ ID NO105有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO40、SEQ ID NO96或SEQ ID NO104杂交的核酸序列;和(c)(a)或(b)的互补链。
64.权利要求63的芽孢杆菌属宿主细胞,其中所述hasB基因编码含有SEQ ID NO41,SEQ ID NO97,或SEQ ID NO105的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
65.权利要求62的芽孢杆菌属宿主细胞,其中所述tuaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO12有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO11杂交的核酸序列;和(c)(a)或(b)的互补链。
66.权利要求65的芽孢杆菌属宿主细胞,其中所述tuaD基因编码含有SEQ ID NO12的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
67.权利要求61的芽孢杆菌属宿主细胞,其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。
68.权利要求67的芽孢杆菌属宿主细胞,其中所述hasC基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO43、SEQID NO99或SEQ ID NO107有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO42或SEQ ID NO98或SEQ ID NO106杂交的核酸序列;和(c)(a)或(b)的互补链。
69.权利要求68的芽孢杆菌属宿主细胞,其中所述hasC基因编码含有SEQ ID NO43、SEQ ID NO99或SEQ ID NO107的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
70.权利要求61的芽孢杆菌属宿主细胞,其中所述gtaB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO22有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO21杂交的核酸序列;和(c)(a)或(b)的互补链。
71.权利要求70的芽孢杆菌属宿主细胞,其中所述gtaB基因编码含有SEQ ID NO22的氨基酸序列,或其具有UDP-葡萄糖焦磷酸化酶活性的片段的多肽。
72.权利要求61的芽孢杆菌属宿主细胞,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。
73.权利要求72的芽孢杆菌属宿主细胞,其中所述hasD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO45有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO44杂交的核酸序列;和(c)(a)或(b)的互补链。
74.权利要求73的芽孢杆菌属宿主细胞,其中所述hasD基因编码含有SEQ ID NO45的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。
75.权利要求72的芽孢杆菌属宿主细胞,其中所述gcaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO30有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO29杂交的核酸序列;和(c)(a)或(b)的互补链。
76.权利要求75的芽孢杆菌属宿主细胞,其中所述gcaD基因编码含有SEQ ID NO30的氨基酸序列,或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。
77.权利要求61的芽孢杆菌属宿主细胞,其中6-磷酸葡萄糖异构酶基因为hasE或其同系物。
78.权利要求77的芽孢杆菌属宿主细胞,其中所述hasE基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO101有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO100杂交的核酸序列;和(c)(a)或(b)的互补链。
79.权利要求78的芽孢杆菌属宿主细胞,其中所述hasE基因编码含有SEQ ID NO101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段的多肽。
80.权利要求60的芽孢杆菌属宿主细胞,其中一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
81.权利要求80的芽孢杆菌属宿主细胞,其中所述所述相同或不同的启动子序列包含“共有序列”启动子,该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。
82.权利要求80的芽孢杆菌属宿主细胞,其中所述相同或不同的启动子序列为串联启动子,其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。
83.权利要求46的芽孢杆菌属宿主细胞,其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。
84.权利要求60的芽孢杆菌属宿主细胞,其中所述核酸构建体还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。
85.权利要求46的芽孢杆菌属宿主细胞,其中核酸构建体还包含可选择的标记基因。
86.权利要求47的芽孢杆菌属宿主细胞,其中所述芽孢杆菌属宿主细胞选自Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、和苏芸金芽胞杆菌。
87.权利要求46的芽孢杆菌属宿主细胞,其中所述芽孢杆菌属宿主细胞为枯草芽孢杆菌。
88.权利要求46的芽孢杆菌属宿主细胞,其中所述芽孢杆菌属宿主细胞为地衣形芽胞杆菌。
89.权利要求46的芽孢杆菌属宿主细胞,其未用可选择的标记进行标记。
90.权利要求46的芽孢杆菌属宿主细胞,其中所述核酸构建体包含可操作性连接于包含“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因,UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
91.含有透明质酸合酶编码序列的核酸构建体,所述透明质酸合酶编码序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列。
92.权利要求91的构建体,其中前体糖的基因由与透明质酸合酶编码序列的启动子相同的启动子表达。
93.权利要求91的构建体,其中前体糖的基因由与透明质酸合酶编码序列的启动子不同的启动子表达。
94.权利要求91的构建体,其中透明质酸合酶编码序列编码I型透明质酸合酶。
95.权利要求94的构建体,其中I型透明质酸合酶编码序列获自链球菌属菌株。
96.权利要求95的构建体,其中链球菌属菌株为似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。
97.权利要求的构建体91,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO2、SEQ ID NO93或SEQ ID NO103有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO1、SEQID NO92或SEQ ID NO102杂交的核酸序列;和(c)(a)或(b)的互补链。
98.权利要求97的构建体,其中所述透明质酸合酶编码序列编码含有SEQ ID NO2、SEQ ID NO93或SEQ ID NO103的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
99.权利要求91的构建体,其中所述透明质酸合酶编码序列编码II型透明质酸合酶。
100.权利要求99的构建体,其中所述II型透明质酸合酶编码序列获自巴斯德菌属菌株。
101.权利要求100的构建体,其中所述巴斯德菌属菌株为出血败血性巴斯德菌。
102.权利要求的构建体91,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO95有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO94杂交的核酸序列;和(c)(a)或(b)的互补链。
103.权利要求102的构建体,其中所述透明质酸合酶编码序列编码含有SEQ ID NO95的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
104.权利要求91的构建体,其中核酸构建体还包含一个或多个编码透明质酸的前体糖的生物合成中的酶的基因或芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体,所述核酸构建体包含一个或多个编码透明质酸的前体糖的生物合成中的酶的基因。
105.权利要求104的构建体,其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因,葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
106.权利要求105的构建体,其中UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。
107.权利要求106的构建体,其中hasB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO97或SEQ ID NO99有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO96或SEQ ID NO98杂交的核酸序列;和(c)(a)或(b)的互补链。
108.权利要求107的构建体,其中所述hasB基因编码含有SEQ ID NO97或SEQ ID NO99的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
109.权利要求106的构建体,其中所述tuaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO12有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO11杂交的核酸序列;和(c)(a)或(b)的互补链。
110.权利要求109的构建体,其中所述tuaD基因编码含有SEQ ID NO12的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
111.权利要求105的构建体,其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。
112.权利要求111的构建体,其中所述hasC基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO43、SEQ ID NO99或SEQ ID NO107有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO42或SEQ IDNO98或SEQ ID NO106杂交的核酸序列;和(c)(a)或(b)的互补链。
113.权利要求112的构建体,其中所述hasC基因编码含有SEQ ID NO43、SEQ ID NO99或SEQ ID NO107的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
114.权利要求111的构建体,其中所述gtaB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO22有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO21杂交的核酸序列;和(c)(a)或(b)的互补链。
115.权利要求112的构建体,其中所述gtaB基因编码含有SEQ ID NO22的氨基酸序列,或其具有UDP-葡萄糖焦磷酸化酶活性的片段的多肽。
116.权利要求105的构建体,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。
117.权利要求116的构建体,其中所述hasD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO105有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)核酸序列在低、中、或高严紧条件下与SEQ ID NO104杂交的核酸序列;和(c)(a)或(b)的互补链。
118.权利要求117的构建体,其中所述hasD基因编码含有SEQ ID NO105的氨基酸序列,或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。
119.权利要求116的构建体,其中所述gcaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO30有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO29杂交的核酸序列;和(c)(a)或(b)的互补链。
120.权利要求119的构建体,其中所述gcaD基因编码含有SEQ IDNO30的氨基酸序列,或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。
121.权利要求105的构建体,其中6-磷酸葡萄糖异构酶基因为hasE或其同系物。
122.权利要求121的构建体,其中所述hasE基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO101有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO100杂交的核酸序列;和(c)(a)或(b)的互补链。
123.权利要求122的构建体,其中所述hasE基因编码含有SEQ IDNO101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段的多肽。
124.权利要求104的构建体,其中一个或多个编码前体糖的基因受控于相同或不同的启动子或与透明质酸合酶编码序列不同的启动子。
125.权利要求124的构建体,其中所述相同或不同的启动子包含“共有序列”启动子,该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。
126.权利要求130的构建体,其中所述相同或不同的启动子序列为串联启动子,其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。
127.权利要求91的构建体,其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。
128.权利要求124的构建体,其中还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。
129.权利要求91的构建体,其还包含可选择的标记基因。
130.权利要求91的构建体,其包含可操作性连接于含有“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因,UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
131.编码透明质酸合酶操纵子的分离的核酸序列,含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的一个或多个选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的基因。
132.权利要求131的分离的核酸序列,其中所述透明质酸合酶基因为SEQ ID NO1、SEQ ID NO92、SEQ ID NO94或SEQ ID NO102或其编码具有透明质酸合酶活性的多肽的片段。
133.权利要求131的分离的核酸序列,其中所述UDP-葡萄糖6-脱氢酶基因为SEQ ID NO11、SEQ ID NO40或SEQ ID NO96、或SEQ ID NO104或其编码具有UDP-葡萄糖6-脱氢酶活性的多肽的片段。
134.权利要求131的分离的核酸序列,其中所述UDP葡萄糖焦磷酸化酶基因为SEQ ID NO21、SEQ ID NO42或SEQ ID NO98、SEQ ID NO106或其编码具有UDP葡萄糖焦磷酸化酶活性的多肽的片段。
135.权利要求131的分离的核酸序列,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为SEQ ID NO29或SEQ ID NO44;或其编码具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的片段。
136.权利要求131的分离的核酸序列,其中所述6-磷酸葡萄糖异构酶基因为SEQ ID NO100或其编码具有6-磷酸葡萄糖异构酶活性的多肽的片段。
137.权利要求131的分离的核酸序列,其还包含一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。
138.权利要求131的分离的核酸序列,其包含透明质酸合酶基因、UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
139.权利要求131的分离的核酸序列,含有SEQ ID NO108的核酸序列。
140.包含权利要求131的核酸构建体的重组表达载体。
141.包含权利要求139的核酸构建体的表达载体。
142.编码UDP-葡萄糖6-脱氢酶的分离的核酸序列,选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO41有至少约75%、约80%、约85%、约90%或约95%的同一性;(b)与SEQ ID NO40有至少75%,80%,85%,90%,或95%同一性的核酸序列;(c)在中或高严紧条件下与(i)SEQ ID NO40的核酸序列,(ii)SEQ ID NO40中所包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)、(b)或(c)的亚序列,其中所述亚序列编码具有UDP-葡萄糖6-脱氢酶活性的多肽片段。
143.权利要求142的核酸序列,其编码的多肽含有与SEQ ID NO41的氨基酸序列有至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列。
144.权利要求142的核酸序列,其编码含有SEQ ID NO41的氨基酸序列的多肽。
145.权利要求142的核酸序列,其编码的多肽含有SEQ ID NO41的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段。
146.权利要求145的核酸序列,其编码的多肽含有SEQ ID NO41的氨基酸序列。
147.权利要求142的核酸序列,其含有SEQ ID NO40的氨基酸序列。
148.权利要求142的核酸序列,其中所述核酸序列在中或高严紧条件下与(i)SEQ ID NO40的核酸序列,(ii)SEQ ID NO40所含的cDNA序列,或(iii)(i)或(ii)的互补链杂交。
149.权利要求142的核酸序列,其包含在质粒pMRT106中,所述质粒包含在大肠杆菌NRRL B-30536中。
150.含有可操作性连接于一个或多个控制序列的权利要求142的核酸序列的核酸构建体,所述控制序列在适宜的表达宿主中指导多肽的制备。
151.包含权利要求150的核酸构建体的重组表达载体。
152.包含权利要求150的核酸构建体的重组宿主细胞。
153.制备具有UDP-葡萄糖6-脱氢酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养权利要求152的宿主细胞;和(b)回收多肽。
154.由权利要求142的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
155.编码UDP葡萄糖焦磷酸化酶的分离的核酸序列,选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO43有至少约90%,95%,或97%的同一性;(b)与SEQ ID NO42有至少约90%、约95%,或约97%同一性的核酸序列;(c)在高或非常高严紧条件下与(i)SEQ IDNO42的核酸序列,(ii)SEQ ID NO42中所包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)、(b)或(c)的亚序列,其中所述亚序列编码具UDP葡萄糖焦磷酸化酶活性的多肽片段。
156.权利要求155的核酸序列,其编码的多肽含有与SEQ ID NO43的氨基酸序列有至少约至少约90%、约95%或约97%同一性的氨基酸序列。
157.权利要求155的核酸序列,其编码的多肽含有SEQ ID NO43的氨基酸序列。
158.权利要求155的核酸序列,其编码的多肽含有SEQ ID NO43的氨基酸序列,或其具有UDP-葡萄糖焦磷酸化酶活性的片段。
159.权利要求158的核酸序列,其编码的多肽含有SEQ ID NO43的氨基酸序列。
160.权利要求155的核酸序列,其含有SEQ ID NO42的核酸序列。
161.权利要求的核酸序列155,其中所述核酸序列在高或非常高严紧条件下与(i)SEQ ID NO42的核酸序列,(ii)SEQ ID NO42所含的cDNA序列,或(iii)(i)或(ii)的互补链杂交。
162.权利要求155的核酸序列,其包含在质粒pMRT106中,所述质粒包含在大肠杆菌NRRL B-30536中。
163.含有可操作性连接于一个或多个控制序列的权利要求155的核酸序列的核酸构建体,所述控制序列在适宜的表达宿主中指导多肽的制备。
164.包含权利要求163的核酸构建体的重组表达载体。
165.包含权利要求163的核酸构建体的重组宿主细胞。
166.制备具有UDP葡萄糖焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养权利要求165的宿主细胞;和(b)回收多肽。
167.由权利要求155的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
168.编码UDP-N-乙酰葡糖胺焦磷酸化酶的分离的核酸序列,选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO45有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQ ID NO44有至少75%、80%、85%、90%或95%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO44的核酸序列,(ii)SEQ ID NO44的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)、(b)或(c)的亚序列,其中所述亚序列编码具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
169.权利要求的核酸序列168,其编码的多肽含有具有与SEQ ID NO45的氨基酸序列至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列。
170.权利要求168的核酸序列,其编码的多肽包含SEQ ID NO45的氨基酸序列。
171.权利要求168的核酸序列,其编码的多肽含有SEQ ID NO45的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。
172.权利要求171的核酸序列,其编码含有SEQ ID NO45的氨基酸序列的多肽。
173.权利要求168的核酸序列,其含有SEQ ID NO44的核酸序列。
174.权利要求168的核酸序列,其中核酸序列在低、中、或高严紧条件下与(i)SEQ ID NO44的核酸序列,(ii)SEQ ID NO44所包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交。
175.权利要求168的核酸序列,其包含在质粒pMRT106中,所述质粒包含在大肠杆菌NRRL B-30536中。
176.含有可操作性连接于一个或多个控制序列的权利要求168的核酸序列的核酸构建体,所述控制序列在适宜的表达宿主中指导多肽的制备。
177.包含权利要求176的核酸构建体的重组表达载体。
178.包含权利要求176的核酸构建体的重组宿主细胞。
179.制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养权利要求178的宿主细胞;和(b)回收多肽。
180.由权利要求168的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
181.由权利要求168的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
182.权利要求1的方法,其中芽孢杆菌属宿主细胞包含破坏的或缺失的cypX和/或yvmC基因。
183.权利要求46的芽孢杆菌属宿主细胞,其包含破坏的或缺失的cypX和/或yvmC基因。
全文摘要
本发明涉及制备透明质酸的方法,包括(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列,所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。本发明还涉及编码UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因和UDP-N-乙酰葡糖胺焦磷酸化酶的分离的核酸序列。
文档编号C12N15/54GK1636052SQ02828283
公开日2005年7月6日 申请日期2002年12月20日 优先权日2001年12月21日
发明者艾伦·斯洛马, 里金·贝尔, 威廉·威德纳, 玛丽亚·唐, 戴维·斯滕伯格, 斯蒂芬·布朗 申请人:诺维信生物聚合物公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1