碱性蛋白酶及其产生方法

文档序号:450097阅读:1050来源:国知局
专利名称:碱性蛋白酶及其产生方法
技术领域
本发明涉及分离的核酸构建体以及包含这些构建体的重组载体和宿主细胞,所说构建体包含得自Bacillus sp.Group I菌株的编码新碱性蛋白酶的核酸序列。本发明还涉及获得所述蛋白酶的方法。本发明也涉及源于所说的碱性蛋白酶的启动子和信号序列以及利用所述启动子与信号序列在细菌中表达编码异源蛋白质的异源核酸序列的方法。
2.发明背景去垢剂酶在市场销售已超过20年,现在全世界在粉剂和液态去垢剂中它完全确立为通常的去垢剂成分。随着向更低洗涤温度的趋势,近年去垢剂酶的消费增加。用于洗涤制剂的酶包括蛋白酶、脂酶、淀粉酶、纤维素酶以及其它酶或其混合物。在商业中最重要的是蛋白酶。
通过分离实际上发现的蛋白酶、然后在去垢剂制剂中试验开发去垢剂蛋白酶。大多数去垢剂蛋白酶从芽孢杆菌属的成员中获得。目前,新类型的蛋白酶进入市场,提供了在各种特定的条件下产生更好的成本/性能比的可能性。
商业性蛋白酶产物的例子有ALCALASETM、ESPERASETM和SAVINASETM,全部由丹麦Novo Nordisk A/S供给。其它商业来源的这些和类似的酶产物在去垢剂溶液中(即在pH值范围8至11并在螯合剂、表面活性剂和漂白剂(如硼酸钠)存在时)是活性的。ALCALASETM蛋白酶由物种地衣芽孢杆菌的菌株产生。ESPERASETM和SAVINASETM蛋白酶通过培养嗜碱的芽孢杆菌属的菌株获得。
提供具有独特的底物范围、pH和/或最佳温度的新碱性蛋白酶是有利的。以高产量分离新蛋白酶或产生蛋白酶以便蛋白酶可在体外利用也是有利的。为了确定,例如,保守和非保守区以及活性位点而确定改进酶性能诱变的适当位点并能够利用重组DNA技术产生蛋白酶,确定这些蛋白酶的氨基酸和/或核酸序列是有利的。
通过确定全部蛋白酶基因的核酸序列,可以确定启动子和信号序列的位置。这样的序列可用于异源多肽的表达。
3.发明概述本发明涉及一种核酸构建体,该核酸构建体包含编码蛋白酶的核酸序列,所说蛋白酶具有通过SDS-PAGE测定的大约34kD的表观分子量、大约9.3的pI、在大约25℃下最佳pH范围约为9-11(酪蛋白为底物)、在大约pH9.5时最佳温度范围为40-55℃(酪蛋白为底物)并可以从第1组中的Bacillus sp.的菌株获得。第1组中的Bacillus sp.与枯草芽孢杆菌(B.subtilis)和坚强芽孢杆菌(B.firmus)最类似。在特定的实施方案中,本发明的蛋白酶可得自或源自PD498菌株或另一种携带编码蛋白酶基因的宿主有机体,该蛋白酶具有和源自Bacillus sp.PD498的蛋白酶的免疫化学性质实质上相同或部分相同的免疫化学性质。
在一个实施方案中,核酸构建体包含编码具有在SEQ ID NO1,SEQ IDNO2或SEQ ID NO3中所描述的氨基酸序列的蛋白酶的核酸序列,SEQID NO1显示了前原(prepro)形式的PD498碱性蛋白酶序列,SEQ ID NO2显示了原体(pro)形式的碱性蛋白酶,SEQ ID NO3显示了成熟形式的PD498碱性蛋白酶。在另一个实施方案中,核酸构建体包含在SEQ ID NO4,SEQID NO5,SEQ ID NO6或SEQ ID NO7中所描述的核酸序列,SEQ ID NO4显示了PD498碱性蛋白酶基因的全部核酸序列,该序列包含编码区以及5′和3′侧翼区,SEQ ID NO5显示了编码前原形式的PD498碱性蛋白酶的核酸序列,SEQ ID NO6显示了编码原体形式的PD498基因的核酸序列,SEQID NO7显示了编码成熟形式的PD498碱性蛋白酶的DNA序列。
为了促进新蛋白酶的产生,本发明也提供了载体和包含所要求的核酸构建体的重组宿主细胞,该载体、构建体和重组宿主细胞可以用于蛋白酶的重组产生。本发明的蛋白酶的重组产生可以通过在适合蛋白酶表达的条件下培养用本发明的核酸构建体或载体转化或转染的宿主细胞或其后代并从培养物回收蛋白酶达到。
本发明也涉及源自具有和所说的序列(其中所说的启动子具有在SEQ IDNO8中显示的序列)基本上相同的启动子活性的编码所说的新蛋白酶或其片段的基因的启动子序列。该启动子可以用于构建包含所说的启动子序列和用于把异源DNA序列插入所说的载体的位点的载体。术语异源有意于包括实质上不由宿主细胞表达的DNA序列。进而,该启动子可以用于产生异源蛋白质的方法,该方法包括(a)用所说的载体转化细菌细胞,优选地是革兰氏阳性细菌;(b)培养步骤(a)转化的细胞;(c)从步骤(b)的转化细胞回收所说的异源多肽。
本发明也涉及源自具有和所说的序列(其中所说的信号序列具有在SEQID NO9中显示的氨基酸序列)基本上相同的信号活性的编码所说的新蛋白酶或其片段的基因的信号序列。该信号序列可以由在SEQ ID NO10中所显示的DNA序列编码。信号序列可以用于载体的构建,该载体包含(a)所说的信号序列;(b)在所说的信号序列上游的启动子序列和核糖体结合位点序列,所说的信号序列的转录在所说的启动子序列控制下;(c)在所说的信号序列下游的把异源DNA序列插入所说的载体中的位点,所说的位点和所说的信号序列在相同的读框中。而且,该信号序列可以用于产生异源蛋白质的方法,该方法包括(a)用所说的载体转化细菌细胞,优选地是革兰氏阳性细菌;(b)培养步骤(a)转化的细胞;(c)从步骤(b)的转化细胞回收所说的异源多肽。
蛋白酶可以用于洗涤方法,因此可以制成去垢剂添加物和/或组合物。
4.附图简要描述本发明可以通过参考所附的附图进一步说明,其中

图1显示了用2%酪蛋白为底物、在pH9.5时测定的温度和PD498碱性蛋白酶的解蛋白活性之间的关系;缓冲液,缓冲液+0.1%STPP(三缩聚磷酸钠)。
图2显示了用1%酪蛋白为底物、在25℃下测定的pH和PD498碱性蛋白酶的解蛋白活性之间的关系。
图3A、3B和3C显示了PD498蛋白酶的全部氨基酸和核苷酸序列以及有关的上游和下游核苷酸序列。
图4显示了PD498蛋白酶的结构。
图5显示了启动子融合物的构建。
图6显示了质粒p118-498proml的图。
图7显示了pHP13amp的图。
图8显示了pLip3的图。
图9显示了p498-8的构建。
图10显示了pMHan37的图。
图11显示了PD498-脂酶(lipolase)融合物的图。
5.发明详述5.1.蛋白酶的分离5.1.1.微生物从土壤样品分离能够产生所说的碱性蛋白酶的微生物。
微生物是属于芽孢杆菌属第1组的好氧性的、形成孢子的细菌。在一个优选的实施方案中,在形态学上它可以描述为直径为0.7-0.9微米、长2-3微米的可运动的棒状。孢子为圆形至椭圆形,孢子囊近末端至末端稍膨胀。生长的最佳温度在25-37℃之内,生长的最佳pH在7-9之内。在pH9.7时不生长,在50℃下也不生长。在营养琼脂斜面培养基上,微生物形成黄色菌落,圆形,光滑,没有观察到色素扩散进琼脂。在特定的实施方案中,微生物是Bacillus sp.PD498,其按照布达佩斯条约在NCIMB保藏,保藏号为40484。
5.1.2.微生物的培养于好氧条件下在包含可同化的碳和氮以及其它必须的营养物的营养培养基中培养产生所说的碱性蛋白酶的微生物,培养基按照本领域已知的原则组成。
适合的碳源是碳水化合物(如蔗糖、葡萄糖和淀粉)或包含碳水化合物的物质(如谷粒、麦芽、稻和高梁)。掺入培养基的碳水化合物浓度可以在很大的范围内变化,例如,可高至大约25%,低至大约1-5%,但通常大约8-10%是适合的,百分比作为葡萄糖的等价物计算。
在营养培养基中的氮源可以属于无机和/或有机性质。适合的无机氮源是硝酸盐和铵盐。在有机氮源中,相当数量固定地用于包括细菌培养的发酵过程。说明性的例子是大豆粉、棉籽粉、花生粉、酪蛋白、玉米、玉米浸液、酵母提取物、尿素和白蛋白。此外,营养培养基也应包含通常的痕量物质。
微生物是芽孢杆菌属物种的菌株。芽孢杆菌属物种是微嗜碱性的。因此,培养优选地在微碱性的pH值下进行,这可以通过在生长培养基灭菌后添加适合的缓冲液(如碳酸氢钠)获得大约pH9.0。大容量发酵罐培养必须利用人工通气。通气速率类似于用于常规大容器发酵的通气速率。
在发酵后,可以通过从肉汤中除去粗制物产生液态蛋白酶浓缩物,如果需要,肉汤的浓缩可通过在低温下蒸发或超滤进行。最后,可以把防腐剂添加到浓缩物中。
可以通过用盐(如Na2SO4)或水-可溶混的溶剂(如乙醇或丙酮)沉淀从纯化的和/或浓缩的肉汤制备固体蛋白酶制剂。也可以使用适当的干燥方法(如喷雾干燥)除去肉汤中的水。
5.1.3.解蛋白活性的测定可以用酪蛋白为底物测定解蛋白的活性。一个酪蛋白蛋白酶单位(CPU)定义为在标准条件下(即在25℃、pH大约9.5时培养大约30分钟)每分钟释放大约1μM的一级氨基基团(通过与丝氨酸标准相比较测定)的蛋白酶的量。
也可以通过测定由所说的蛋白酶特异性水解琥珀酰-Ala-Ala-Pro-Leu-对硝基酰苯胺来测定解蛋白活性。首先把底物溶解在,例如,DMSO中,然后在大约0.035M的硼酸盐缓冲液(pH大约9.45)中稀释大约50倍。通过相同的硼酸盐缓冲液把所有蛋白酶样品稀释大约5-10倍。在ELISA读数平板的孔中混合相等体积的底物溶液与样品并于25℃下在大约405nm下读数。使所有样品活性和浓度分别标准化为标准的蛋白酶溶液活性和浓度。
5.2.蛋白酶所说的蛋白酶可通过下列特征描述。
5.2.1.理化性质当通过SDS-PAGE测定时,本发明的蛋白酶具有大约34kD的表观分子量。通过在LKB AmpholinePAG平板上的等电点聚焦测定到大约9.3的pI。通过PMSF(丝氨酸蛋白酶抑制剂)抑制蛋白酶活性。EDTA和大豆蛋白酶抑制剂不影响蛋白酶活性。
温-活性关系在图1中显示。活性在0.1%三缩聚磷酸钠(STPP,许多商业去垢剂中的普通成分)存在(白方框)和不存在(黑方框)时于pH大约9.5下用2%酪蛋白为底物测定。使用以前描述的解蛋白活性测定(其改变为温育温度在从大约15℃至大约70℃的间隔变化)。从图中看出从大约15℃至大约70℃蛋白酶具有解蛋白活性,并具有大约40-55℃范围的最佳温度。
通过相同的方法使用调整到预定的pH值(pH范围约为6至11)的缓冲液测定活性对pH值的依赖。结果在图2中显示。从图中看出在非常宽的pH范围(从低于pH 6至高于pH11,表观最佳pH在大约9-11的范围内)中蛋白酶具有解蛋白活性。
而且,人们发现当在欧洲型和美国型的去垢剂中测定时,本发明的蛋白酶在洗涤条件下于大约25℃时可稳定大约60分钟。
5.2.2.免疫化学性质所说的蛋白酶具有和源自菌株Bacillus sp.PD498,NCIMB40484号的蛋白酶的免疫化学性质基本上相同的或至少部分相同的免疫化学性质。
通过免疫学的交叉反应鉴定试验测定免疫化学性质。鉴定试验可通过众所周知的Ouchterlony双免疫扩散方法或按照N.H.Axelsen(凝胶免疫沉淀技术手册;Blackwell科学出版社(1983),第5和第14章)的串联交叉免疫电泳进行。术语“抗原等同性”和“部分抗原等同性”在同一书的第5、19和20章中描述。
按照以上提及的方法通过用本发明的纯化的蛋白酶免疫兔产生单特异性抗血清。把免疫原与弗氏佐剂混合并每两周皮下注射进兔中。在共8周的免疫时期后获得抗血清,如N.H.Axelsen(同上)所述从其中制备免疫球蛋白。
Ouchterlony双免疫扩散试验显示在本发明的蛋白酶和已知的得自芽孢杆菌属物种的碱性丝氨酸蛋白酶(例如,ALCALASETM、SAVINASETM、ESPERASETM、枯草杆菌蛋白酶Novo(可以从Novo Nordi sk A/S,丹麦得到)和KAZUSASETM(可以从SHOWA DENKO,日本得到))之间没有交叉反应。
5.3.核酸构建体本文所使用的术语“核酸构建体”有意于指任何基因组DNA、合成DNA或RNA起源的核酸分子。术语“构建体”有意于指单链或双链的并基于编码蛋白酶的全部或部分的天然产生的核苷酸序列的核酸片段。构建体可以可有可无地包含其它核酸片段。
编码所说的蛋白酶的本发明的核酸构建体可合适地属于基因组起源,例如,通过按照标准技术(参见Sambrook等,分子克隆实验室手册,冷泉港实验室,冷泉港,N.Y.,1989)使用合成寡核苷酸探针通过杂交制备基因组文库并筛选编码蛋白酶的全部或部分的DNA序列而获得。为了这种目的,通过5.1部分所述的(同上)从Bacillus sp.的菌株分离染色体DNA并筛选基因组DNA文库以获得编码蛋白酶的DNA序列。
也可以通过已建立的标准方法(例如,由Beaucage和Caruthers,Tetrahedron Letters22(1981),1859-1869描述的亚磷酰胺方法或由Matthes等,EMBO杂志,3(1984)801-805描述的方法)合成制备编码蛋白酶的本发明的核酸构建体。按照亚磷酰胺方法,例如,在自动DNA合成仪中合成、纯化、退火寡核苷酸并连接与克隆进适合的载体中。
而且,核酸构建体可以是混合的合成和基因组起源并通过按照标准技术连接合成或基因组DNA片段(在适当的情况下)与对应于全部核酸构建体的不同部分的片段制备。
也可以使用特异性引物通过聚合酶链式反应(例如,在美国4,683,202或Saiki等,科学239(1988),487-491中描述的)制备核酸构建体。
在一个当前优选的实施方案中,本发明的核酸构建体包含在SEQ IDNO4中显示的DNA序列以及编码在SEQ ID NO1、SEQTD NO2或SEQ ID NO3中显示的氨基酸序列的核酸序列,例如,分别在SEQ ID NO5、SEQ ID NO6或SEQ ID NO7中描述的DNA序列。本发明还包含在下列条件下与编码在SEQ ID NO1、SEQ ID NO2或SEQ ID NO3中显示的氨基酸序列的核酸分子(基因组或合成的)杂交的核酸序列在5×SSC中预浸渍,于大约40℃下在20%甲酰胺、50mM磷酸钠pH 6.8、50μg变性的声处理的小牛胸腺DNA的溶液中预杂交1小时,其后为在大约40℃下在相同的溶液中杂交18小时,然后在大约45℃的温度下在0.4×SSC中洗涤。
在上面限定的种类内有用的变体包括,例如,其中DNA编码变化的变体(其中进行了保守氨基酸的取代,该取代不显著地影响蛋白质的活性)。保守的取代是指相同类别的氨基酸可以由这一类别的任何另一种取代。例如,非极性脂肪族残基Ala、Val、Leu和Ile可以互换,碱性残基Lys和Arg或酸性残基Asp和Glu也是这样。同样地,Ser和Thr相互是保守的取代,Asn和Gln也是如此。对技术人员明显的是在对分子功能关键性区的外部可以进行这样的取代,也可以产生活性蛋白酶。通过利用以上所述的测定方法可以容易地测定所需活性的保留。
核酸构建体优选地是DNA构建体,在下面将专一地使用该术语。
5.4.重组载体在另一个方面,本发明涉及包含本发明的DNA构建体的重组载体。本发明的DNA构建体插入的重组载体可以是可方便地进行重组DNA过程的任何载体,载体的选择常取决于它所要导入的宿主细胞。这样,载体可以是自主复制载体,即作为染色体外实体存在的、其复制独立于染色体复制的载体,例如,质粒。另外,载体可以是当导入宿主细胞时整合进宿主细胞基因组并与它所整合进的染色体一起复制的载体。
该载体优选地是表达载体,其中编码本发明的蛋白酶的DNA序列可操作连接到DNA转录所需的另外的片段上。通常,表达载体源于质粒或病毒DNA,或可以包含二者的元件(element)。术语“可操作地连接”是指排列片段以便它们为了特定的目的协同作用,例如,转录在启动子中开始并通过编码本发明的蛋白酶的DNA序列进行。
启动子可以是在选择的宿主细胞中显示转录活性的任何DNA序列,并可源于编码对宿主细胞同源或异源的蛋白质的基因。具体来说,在细菌宿主细胞中使用的适合启动子的例子包括(但不限于)嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽淀粉酶基因、解淀粉芽孢杆菌(BAN)淀粉酶基因、枯草芽孢杆菌碱性蛋白酶基因、短小芽胞杆菌(Bacilluspumilus)木糖苷酶基因、苏云金芽孢杆菌(Bacillusthuringiensis)cryIIIA或地衣芽孢杆菌α-淀粉酶基因的启动子。可以使用的其它启动子包括(但不限于)噬菌体λPR或PL启动子或大肠杆菌lac、trp或tac启动子。
该启动子也可以源于编码所说的蛋白酶或其片段的基因,该基因具有和所说的序列基本上相同的启动子活性。启动子序列在SEQ ID NO8中显示。本发明还包含在下列条件下与在SEQ ID NO8中显示的启动子序列杂交(在5×SSC中预浸渍,于大约40℃下在20%甲酰胺、50mM磷酸钠、pH6.8、50μg变性的声处理的小牛胸腺DNA的溶液中预杂交1小时,其后为在大约40℃下在相同的溶液中杂交18小时,然后在大约45℃的温度下在0.4×SSC中洗涤)或与SEQ ID NO8有至少大约90%、优选地有大约95%同源性但是和所说的序列具有基本上相同的启动子活性的核酸序列。可以使用该启动子促进所说的蛋白酶或异源DNA序列(例如,lipolase、1,3-特异性脂酶,下文作为Lipolase)的表达。该酶可以通过在SEQ ID NO11中所显示的DNA序列编码并具有在SEQ ID NO12中显示的氨基酸序列。该酶也可以是Lipolase变体,例如,D96L、E210K、E210L(参见WO92/05249)。
本发明的重组载体还可以包含使载体能够在所说的宿主细胞中复制的DNA序列。当宿主细胞是细菌细胞时,使载体能够复制的序列是各种ori序列。
载体也可以包含可选择的标记,例如,其产物赋予对药物(例如,氨苄青霉素、卡那霉素、四环素、氯霉素、新霉素、潮霉素、甲氨蝶呤)抗性的基因。
为了指导本发明的蛋白酶进入宿主细胞的分泌途径,在重组载体中可以提供分泌信号序列(也已知作为前导序列或前序列)。把分泌信号序列连接到编码正确的读框中的原体未成熟蛋白酶的DNA序列上(参见,例如,图4)。原体序列是在前序列和蛋白酶分泌所必需的成熟蛋白酶之间的氨基酸序列。原体序列的裂解产生成熟的活性蛋白酶。分泌信号序列通常定位5′至编码蛋白酶的DNA序列上。通常分泌信号序列可以是与蛋白酶相关的序列或可以得自编码另一种分泌蛋白质的基因。
对于从细菌细胞中的分泌,信号肽可以是天然产生的信号肽或其功能部分,它也可以是合成肽。适合的信号肽包括(但不限于)源自地衣芽孢杆菌α-淀粉酶、迟缓芽孢杆菌(Bacillus lentus)碱性蛋白酶和解淀粉芽孢杆菌淀粉酶的序列。
对于从细菌细胞中的分泌,信号肽也可以是得自本申请中公开的蛋白酶的信号肽。信号序列的氨基酸序列在SEQ ID NO9中显示。信号序列可以由在SEQ ID NO10中所描述的核酸序列编码。本发明还包含在下列条件下与在SEQ ID NO10中显示的核酸序列杂交(在5×SSC中预浸渍,于大约40℃下在20%甲酰胺、50mM磷酸钠、pH6.8、50μg变性的声处理的小牛胸腺DNA的溶液中预杂交1小时,其后为在大约40℃下在相同的溶液中杂交18小时,然后在大约45℃的温度下在0.4×SSC中洗涤)或与SEQ ID NO5有至少大约90%、优选地有大约95%同源性但是和所说的序列具有基本上相同的信号活性的核酸序列。可以使用该信号促进所说的蛋白酶或异源DNA序列(例如,lipolase、1,3-特异性脂酶,下文作为Lipolase)的分泌。该酶可以通过在SEQ ID NO11中所显示的DNA序列编码并具有在SEQ IDNO12中显示的氨基酸序列。该酶也可以是Lipolase变体,例如,D96L、E210K、E210L(参见WO 92/05249)。
用于分别连接编码本发明的蛋白酶的DNA序列、启动子和/或分泌信号序列并把他们插入到包含复制所必需的信息的适合载体中所利用的方法对本领域的技术人员是熟知的(参见,例如,Sambrook等,op.cit.)。
5.5.宿主细胞导入宿主细胞的编码本发明的碱性蛋白酶的DNA序列可以和所说的宿主是同源或异源的。如果和宿主细胞同源,即实质上由宿主细胞产生,它可以可操作地连接到另一个启动子序列或(如果适用)另一个分泌信号序列和/或终止子序列而非其天然环境中。术语“同源”有意于包括编码对所说的宿主有机体天然的蛋白酶的核酸序列;可以把核酸序列以多拷贝形式导入宿主有机体。术语“异源”有意于包括实质上不由宿主细胞表达的DNA序列。这样,DNA序列可以得自另一种有机体,或它可以是合成序列。
本发明DNA构建体或重组载体导入的宿主细胞可以是能够产生本发明的碱性蛋白酶的任何细胞,包括(但不限于)细菌、酵母、真菌和高等真核细胞。
细菌宿主细胞(培养时能够产生和分泌本发明的蛋白酶)的例子是革兰氏阳性细菌(如芽孢杆菌属的菌株,如枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌B.alkalophilus)、解淀粉芽孢杆菌、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)、巨大芽胞杆菌(B.megatherium)或苏云金芽孢杆菌的菌株)或革兰氏阴性细菌(如大肠杆菌(Escherichia coli)。细菌的转化可以通过原生质体的转化或通过以本来已知的方式利用感受态细胞(参见Sambrook等,同上)来实现。
当在细菌(如大肠杆菌)中表达蛋白酶时,蛋白酶可以典型地作为不溶性粒子(已知为包含体)保留在细胞质中,或可以通过细菌分泌序列被引导到周质空间。在前一种情况下,溶解细胞,回收粒子并使其变性,其后通过稀释变性剂使蛋白酶再折叠。在后一种情况下,通过破坏细胞(例如,通过声处理或渗透压休克)从周质空间回收蛋白酶以释放周质空间的内容物并回收蛋白酶。
然后在适合的营养培养基中于使得本发明的蛋白酶可以表达的条件下培养以上所述的转化的宿主细胞,之后从培养物中回收形成的蛋白酶。培养细胞所利用的培养基可以是任何适合于培养宿主细胞的常规培养基,如基本或包含适当补料的复合培养基。适合的培养基可以从商业供应厂商得到或按照已公开的配方制备(例如,在美国典型培养物保藏中心的目录中)。然后可通过常规方法从培养基中回收由这些细胞产生的蛋白酶,该方法包括通过离心或过滤从培养基中分离宿主细胞、沉淀上清液中的蛋白质组分或通过盐(例如,硫酸铵)过滤、依赖于所说的蛋白酶的类型通过各种层析方法纯化(例如离子交换色谱、凝胶过滤色谱、亲和色谱等)。
在下列的实施例中进一步说明本发明,这在任何方面都无意于限制本发明所要求的范围。6.实施例6.1.PD498蛋白酶的分离于25℃下的旋转振荡台上(300r.p.m.)在包含100ml下列组成(每升)的培养基的500ml挡板(baffled)锥形瓶中培养Bacillus sp.PD498马铃薯淀粉 100g磨过的大麦50g大豆粉20gNa2HPO4×12H2O 9gPluronic54R(BASF)0.1g酪蛋白酸钠10g用α-淀粉酶液化培养基中的淀粉,通过在120℃下加热45分钟对培养基灭菌。
在灭菌之后,通过添加10ml的1M碳酸氢钠溶液把培养基的pH值调整至9.0。
在培养4天后,使用以上所述的方法测定培养物中的解蛋白活性。肉汤的蛋白酶活性是5CPU/l。
在分离固体物质后,通过常规的层析方法纯化蛋白酶。得自3.51的培养肉汤的产量具有120CPU/l的31ml。通过SDS-PAGE和等电点聚焦把纯度调整到90%以上。
按照本实施例制备的制剂的特征在本说明书的前面曾提到过,在此进行参考。
6.2.PD498蛋白酶的克隆和表达6.2.1.材料和方法6.2.1.1.菌株按照制造厂商的说明(BRL)将大肠杆菌DH5 F-Φ80dlacZΔ M15Δ(lacZYA-argF)U169 deoR recAl endAl hsdR17(rK-,mK+)supE44-thi-1gyrA96 relAl(BRL)用于所有的大肠杆菌的转化。通过Anagnostopolis和Spizizen的方法(细菌学杂志,81741-746,1961)使枯草芽孢杆菌蛋白酶缺陷菌株成为感受态。
6.2.1.2.DNA分离和基因文库构建如Pitcher等(应用微生物通信,8151-156,1989)所述分离PD498染色体DNA。用EcoR1消化100μg的DNA并在琼脂糖凝胶上电泳。利用Qiaex系统(Qiagen)分离5-8kb的DNA。把这种DNA连接到EcoR1一切口上,分别以4∶1的比率用CIP(牛小肠磷酸酶)处理pUC19(BRL)。然后把连接混合物转化进大肠杆菌菌株DH5α(BRL)。
6.2.1.3.1 80bp片段的PCR扩增利用两个基于蛋白酶的部分氨基酸序列的混合引物(组A和组B)进行蛋白酶基因的180bp片段的扩增。字母氨基酸序列是序列AAYQYGPQNT(SEQ ID NO13)和序列BYDFIDYDNNPMD(SEQ ID NO14)。在Ericomp PCR仪器中的95℃/5分钟、其后为30个循环的95℃/1分钟、55℃/1分钟、72℃/1分钟的反应中使用了该引物与总PD498 DNA。引物组AGCNTAYCARTAYGGNCCNCARAAYAC(SEQ ID NO15)引物组BTCCATNGGRTTRTTRTCRTARTCDATRAARTCRTA(SEQ ID NO16)6.2.1.4.PCR反应产物的亚克隆按照制造厂商的说明利用TA克隆载体pCRII(Invitrogen,San Diego,CA)克隆PCR产物以用于测序。插入DNA用DIG(digoxigenin)标记,利用Engler-Blum(1993,生物化学年评,210235-244)改进的得自Boehringer Mannheim的Genius系统进行Southern杂交和菌落印迹。
6.2.1.5.DNA测序利用具有荧光标记的双脱氧核苷酸的Taq聚合酶循环测序测定DNA序列。该测序反应在应用生物系统自动DNA测序仪(Model 373A 1.2.0版)上进行。
6.2.1.6.包含由amyL启动子驱动的PD498蛋白酶的载体的构建α-淀粉酶(amyL)启动子(SEQ ID NO17)是得自地衣芽孢杆菌的“上”突变启动子,通过利用下列引物从地衣芽孢杆菌DNA进行PCR扩增获得5′-AAGGCATGCGTCCTTC-3′(SEQ ID NO18)5′-CTTTCAATGTGTAACATA-3′(SEQ ID NO19)把形成的630bp片段克隆进pCRII载体(Invitrogen),该载体使克隆片段能够作为EcoRI片段容易地分离。
将蛋白酶基因作为1.9kb的EcoRI-EcoRV片段亚克隆进EcoRI、SmaI-切割的pUC19中,然后作为1.9kb的EcoRI-HindIII片段取出并克隆进EcoRI-HindIII-切割的pHP13amp(大肠杆菌-枯草芽孢杆菌穿梭载体)中(图8)。以EcoRI消化形成的质粒p498-4,用牛小肠磷酸酶(CIP)处理,并连接到上述的amyL启动子片段上,产生质粒p498-5(图5)。通过在与PD498编码区有关的正方向上包含所述启动子的枯草芽孢杆菌菌落在包含适当的抗生素与1%牛奶的琼脂平板上形成晕圈(halos)的能力选择这种菌落。
6.2.1.7.包含由cryIIIA启动子驱动的PD498蛋白酶的载体的构建利用下列引物通过PCR扩增得自苏云金芽孢杆菌粉虫变种(Bacillusthuringiensis var.tenebrionis)的cryIIIA启动子(SEQ ID NO20)5′-GAGACCCGGGAGCTTTCAGTGAAGTACGTG-3′(SEQ ID NO21)5′-CATAAATCCATTAGACGGTGC-3′(SEQ ID NO22)把形成的1500bp片段再次克隆进pCRII载体(Invitrogen)中,作为EcoRI片段除去,并连接到EcoRI-消化的p498-4质粒中以产生质粒p498-6(在此质粒中PD498蛋白酶的表达由cryIIIA启动子驱动)(图5)。通过在与PD498编码区有关的正方向上包含所述启动子的枯草芽孢杆菌菌落在包含适当的抗生素与1%牛奶的琼脂平板上形成晕圈的能力选择这种菌落。
6.2.1.8.包含由BAN启动子驱动的PD498蛋白酶的载体的构建利用包含另外的SphI接头5′-GCATGCAATCGATTGTTTGAGAAAAGAAG-3′(SEQ ID NO24)(在该接头中,第一组有下划线的核苷酸序列是所说的SphI位点,第二组有下划线的核苷酸序列是天然产生的ClaI位点)的上游引物以及下游引物5′-CATTTTCTTATACAAATTATATTTTACATATCAG-3′(SEQ ID NO25)从质粒(pSX222)(SEQ ID NO23)PCR-扩增解淀粉芽孢杆菌淀粉酶(BAN)启动子。
把形成的168bp片段克隆进pCRII载体(Invitrogen)中,作为EcoRI片段除去,并连接到EcoRI-消化的p498-4质粒中以产生质粒p498-7(在此质粒中PD498蛋白酶的表达由BAN启动子驱动)(图5)。通过在与PD498编码区有关的正方向上包含所述启动子的枯草芽孢杆菌菌落在包含适当的抗生素与1%牛奶的琼脂平板上形成晕圈的能力选择这种菌落。
通过在与PD498蛋白酶有关的相反方向上包含BAN启动子的枯草芽孢杆菌转化体在包含适当的抗生素与1%牛奶的琼脂平板上不能形成晕圈选择这种转化体。
6.2.2.PD498基因序列分析利用基于PD498蛋白酶的部分氨基酸序列的两组寡核苷酸,通过PCR扩增180bp依正确大小排列的片段并将其克隆进大肠杆菌载体pCRII。180bp插入片段的测序表明克隆的是正确的片段。利用180bp插入片段作为探针,Southern杂交从PD498染色体DNA鉴别出与所述探针杂交的6.5kbEcoR1片段。以EcoR1消化PD498的染色体DNA,选择大小为5-8kb的片段并连接进用EcoR1切割的pUC19中,然后用CIP处理。在转化进在包含Amp和X-gal的LB平板上选择的大肠杆菌菌株DH5α后,形成了成千上万的白色菌落。通过利用标记的180bp片段作为探针的菌落杂交得知筛选的600个菌落中的2个是阳性的。限制性分析表明两个菌落都包含具有6.5kb的EcoR1插入片段的相同质粒。
DNA测序表明5′EcoR1位点恰好在基因核糖体结合位点的上游(图3;SEQ ID NO26),其后为蛋白质的ATG起始密码子。前27个氨基酸类似于具有短序列(包含三个带正电的残基,其后为具有Ser-Leu-Ala的疏水链末端)的典型的芽孢杆菌属信号肽。在该切割位点后有一个90个氨基酸的前肽,其后为具有29270的预期分子量的280个氨基酸的成熟蛋白质,该成熟蛋白质与在SDS-PAGE上观察到的34,000分子量(图4)十分一致。
6.3.具有启动子活性的PD498开放读框上游的DNA序列的分离PD498编码区的DNA测序表明Asp718(也被KpnI识别的位点)、PstI、BglII以及其它单一限制位点的存在。以Asp718和各种其它酶消化PD498基因组DNA、把片段Southern转移至尼龙上并以180bpDIG-标记的DNA探针检测(如6.2.1.3和6.2.1.4部分所述)表明了1.4kb HindIII-Asp718片段的存在。从已知的Asp718限制位点在PD498编码区中的位置可知,1.4kbHindIII-Asp718片段应包含PD498蛋白酶的ATG翻译起点上游的大约750-850nts。把1-2kb的HindIII-Asp718片段的依大小选择的文库克隆进pUC118(Vieira和Messing,酶学方法,1533-11,1987)并转化进大肠杆菌XL1-Blue MRF′细胞(Stra tagene,San Diego,CA)中。通过Sambrook等(1989,同上)的菌落杂交技术使用180bp的DIG-标记的PCR片段筛选菌落。用探针检测到六个菌落,通过碱性溶胞技术(Sambrook等,1989,同上)从4个菌落中分离质粒DNA。所有四种质粒制剂包含1.4kb的HindIII-Asp718片段。在ABI 373A测序仪上用荧光标记的双脱氧核苷酸通过Taq聚合酶循环测序测定该片段的序列(SEQ ID NO4)。将包含该片段的质粒命名为p118-498proml(参见图6)。
6.4.具有PD498编码序列的PD498启动子的重建以三个步骤用其天然PD498编码序列重建上游HindIII-Asp718片段(参见图9)。首先,把得自p118-498proml的HindIII-Asp718片段克隆进pHP13amp。然后,以MscI和BamHI消化质粒p498-5以产生包含PD498蛋白酶编码区的1.0kb的MscI-BamHI片段。第三,把MscI-BamHI片段连接进用MscI和BamHI切割的第一步的质粒中。然后把连接混合物转化进大肠杆菌DH5α细胞中。通过碱性溶胞“小量制备”从转化体中分离所需的构建体p498-8(参见图9)。然后把所述质粒转化进枯草芽孢杆菌蛋白酶缺陷菌株并平板接种于包含1%无脂干奶和每毫升10μg氯霉素的TBAB平板上。通过转化的枯草芽孢杆菌菌落周围澄清区(晕圈)的形成表明蛋白酶从其天然启动子的表达。
6.5.PD498在具有用p498-5,6,7,8和“7R”转化的枯草芽孢杆菌蛋白酶缺陷菌株的蔗糖/大豆粉培养基中进行振荡培养瓶实验。这些质粒构建体由pHP13amp载体组成,该载体分别包含amyL、cryIIIA、BAN、498和逆BAN(逆方向的BAN启动子)并启动PD498蛋白酶表达。在四天后产生了在cryIIIA、BAN和PD498启动子控制下的地衣芽孢杆菌α-淀粉酶。
6.6.在枯草芽孢杆菌中表达脂酶在枯草芽孢杆菌蛋白酶缺陷背景下试验下列构建体(启动子/信号序列/Lipolase)Lipolase活性pHP13amp 0pLip3 5pHP13amp的图在图7中显示,pLip3的图在图8中显示。使用下列方法构建pLip3。把携带proLipolase编码序列的pMHan37的MscI-BamHI片段(参见图10)和得自p118-498proml的PD498的HindIII-MscI片段(包含启动子与信号肽编码序列)和HindIII/BamHI切割的pHP13amp连接以产生pLip3。用该构建体转化蛋白酶缺陷枯草芽孢杆菌菌株。当置于包含5μg氯霉素/ml和1%甘油三丁酸酯的TBAB平板上时,转化体比仅包含pHP13amp的枯草芽孢杆菌蛋白酶缺陷菌株产生了更大的澄清区。融合物的图在图11中显示。
利用蔗糖-大豆培养基从振荡培养瓶获得了这些结果。数据表明可以使用pD498启动子/信号序列在枯草芽孢杆菌中表达异源蛋白质。7.微生物的保藏下列生物材料保藏在农业研究机构专利培养物保藏中心(NRRL),北方区域研究中心,1815大学街,Peoria,伊利诺斯州,61604,美国。菌株保藏号保藏号包含p498-5的大肠杆菌 NRRLB-21434 1995年4月24日包含p118-498proml的大肠杆菌 NRRLB-21433 1995年4月24日菌株在如下的条件下以及在布达佩斯条约的条件下保藏保证在该专利申请未决期间该培养物对于由所授权的专利和商标委员会成员按照37C.F.R.§1.14和35 U.S.C.§122确定的人是可以得到的。保藏物代表了每种保藏菌株的生物学纯的培养物。保藏物在外国专利法需要时也可以得到(在这些国家中提出本申请的对应物或其子代)。然而,应该理解可得到保藏物不构成在解除通过政府作用授予的专利权中实施本发明的许可。
此处所描述的和所要求的本发明不限于本文公开的特定实施方案的范围,因为这些实施方案有意于说明本发明的几个方面。任何相当的实施方案都包括在本发明的范围之内。事实上,除了本文所显示的和所描述的之外,从以上的描述,本发明的各种修改对本领域技术人员是明显的。这样的修改也有意于包含在所附的权利要求的范围之内。
本文引用了各种参考文献,本说明书一并参考了其全部公开的内容。
序列表(1)一般信息(i)申请人(A)Novo Nordisk生物技术公司(B)街道1445 Drew大街(C)城市Davis(D)州加利福尼亚(E)国家美国(F)邮区代码95616-4880(G)电话(916)757 8100(H)传真(916)758 0317与(i)申请人(A)Novo Nordisk A/S(B)街道Novo Alle(C)城市Bagsvd(D)国家丹麦(E)邮区代码DK-2880(F)电话45-4444-8888(G)传真45-4449-0555(ii)发明名称碱性蛋白酶(iii)序列数27(iv)通讯地址(A)收信人北美Novo Nordisk公司(B)街道405Lexington大街,第64层(C)城市纽约(D)州纽约(E)国家美国(F)邮区代码10174-6401
(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Relea se#1.0,#1.30版(vi)目前申请资料(A)申请号待定(B)申请日1996年4月29日(C)分类号(vi)在先申请资料(A)申请号08/434,255(B)申请日1995年5月3日(C)分类号(viii)律师/代理人信息(A)姓名Agris Dr.,Cheryl H.
(B)登记号34,086(C)参考/档案号4797.204-WO/3764.404-WO(ix)电信信息(A)电话212-867-0123(B)传真212-878-9655(2)SEQ ID NO1的信息(i)序列特征(A)长度2702个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ix)特征(A)名称/关键词CDS(B)定位843..2033(xi)序列描述SEQ ID NO1AAGCTTAATC ATCCCGATGT ATCGCTTCAG CGCTTACCGT AGACGATTTT CTTTATAGTC 60TCGATGGATA AAAAGTACCT ATCTGAAATG GAAGCAATCG ACTCTCCTCC AGTAAAGGCT 120TCAAGGATCG ACGTGTTTCT CCGTTTAAGC GCTTCCCTTC CTCCTGACTT TGAGCCCCAG 180GCATTATACT CTTCTTTTCG CTTTGGGATA TAAATGGTTT GGCCTTGAAC ATAGTTTTGT 240AATTCTCTCA TTAAGTAATC AGGAATTTGA TTTACTGCTT TCAATCGTGT CAGCTCCTTA 300TCATTATTGG ATCAATAAGG GACAAAGCCG ACATATGAAT GGCGATTCAT CTAAAACTAC 360CACCCCATGC AAAGGATCGC CGAATCATAC AGGCTTTGCA TGAGATGCTG CAGATTTCGG 420AAAACGGATT TCCATATGAT CACCTCCTAG TATCAGTATA CTGATACTAG CAGAAAGATT 480TCCATAAGAA TTTCTTATAG TTACCATAAT ATTATTATAT AAACCTACTA TATTTGATTT 540TCAATTTGAG AAAATAAGTG ACCATTCACC TATCCTTAAA GTTGCTCAAC CCCATACAAT 600CATGAAACTT TTCATGCCAA ACGTTCATTA TGCGAAATCT ATCAAAAACT GAGAGTGAAT 660TCATTTTTTG ATAGAAAATT AAAACTATTC AATATTTTGT CACAACCTGC TAGAATCCTA 720GGTAATAAGG GTCCCCTACA TATCTATCAT TCATCACAAT GACCTTTGTT CATCTTGAAT 780TCTGAAGGGA GGATCGACCT GCTAATTTGT CGTAAAAAAA TAGAAAATGG AGGAATGCTT 840TT ATG AAG TTC AAA AAA ATA GCC GCT CTA TCC TTA GCA ACT TCC CTT887Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu1 5 10 15GCT TTA TTC CCT GCC TTC GGA GGT AGT TCA CTG GCC AAG GAA GCA CCG 935Ala Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro20 25 30AAA CCG TTC CAA CCT ATC AAC AAA ACT TTG GAT AAA GGC GCT TTC GAA 983Lys Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu35 40 45TCC GGT GAA GTC ATC GTC AAA TTC AAA GAT GGT GTA TCC AAA AAG GCA 1031Ser Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala50 55 60CAA GGT TCT GCT CTG AAC AAA GCG GAG GCA AAT GAA CAG AAA GCA TCA 1079Gln Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser65 70 75GCA AAA GAT CCA TTT CAG GTA TTG GAA GTA GCG GAC GTC GAT CAA GCT 1127Ala Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala80 85 90 95GTT AAA GCA CTG GAA AAC AAT CCG AAT GTA GAA TAT GCT GAA CCA AAC 1175Val Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn100 105 110TAT ACC TTC CAA GCG ACT TGG TCA CCG AAT GAC CCT TAC TAT TCT GCT 1223Tyr Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala115 120 125TAC CAG TAT GGA CCA CAA AAC ACC TCA ACC CCT GCT GCC TGG GAT GTA 1271Tyr Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val130 135 140ACC CGT GGA AGC AGC ACT CAA ACG GTG GCG GTC CTT GAT TCC GGA GTG 1319Thr Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val145 150 155GAT TAT AAC CAC CCT GAT CTT GCA AGA AAA GTA ATA AAA GGG TAC GAC 1367Asp Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp160 165 170 175TTT ATC GAC AGG GAC AAT AAC CCA ATG GAT CTT AAC GGA CAT GGT ACC1415Phe Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr180 185 190CAT GTT GCC GGT ACT GTT GCT GCT GAT ACG AAC AAT GGA ATT GGC GTA1463His Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val195 200 205GCC GGT ATG GCA CCA GAT ACG AAG ATC CTT GCC GTA CGG GTC CTT GAT1511Ala Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp210 215 220GCC AAT GGA AGT GGC TCA CTT GAC AGC ATT GCC TCA GGT ATC CGC TAT1559Ala Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr225 230 235GCT GCT GAT CAA GGG GCA AAG GTA CTC AAC CTC TCC CTT GGT TGC GAA1607Ala Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu240 245 250 255TGC AAC TCC ACA ACT CTT AAG AGT GCC GTC GAC TAT GCA TGG AAC AAA1655Cys Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys260 265 270GGA GCT GTA GTC GTT GCT GCT GCA GGG AAT GAC AAT GTA TCC CGT ACA1703Gly Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr275 280 285TTC CAA CCA GCT TCT TAC CCT AAT GCC ATT GCA GTA GGT GCC ATT GAC1751Phe Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp290 295 300TCC AAT GAT CGA AAA GCA TCA TTC TCC AAT TAC GGA ACG TGG GTG GAT1799Ser Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp305 310 315GTC ACT GCT CCA GGT GTG AAC ATA GCA TCA ACC GTT CCG AAT AAT GGC1847Val Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly320 325 330 335TAC TCC TAC ATG TCT GGT ACG TCC ATG GCA TCC CCT CAC GTG GCC GGT1895Tyr Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro His Val Ala Gly340 345 350TTG GCT GCT TTG TTG GCA AGT CAA GGT AAG AAT AAC GTA CAA ATC CGC1943Leu Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg355 360 365CAG GCC ATT GAG CAA ACC GCC GAT AAG ATC TCT GGC ACT GGA ACA AAC1991Gln Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn370 375 380TTC AAG TAT GGT AAA ATC AAC TCA AAC AAA GCT GTA AGA TAC2033Phe Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr385 390 395TAATAGATAA AACAAGAGCA CACCGTGAAT GGTGGGCTCT TTCATTATGT TCACTACTGT 2093TTTACGATCT GGCCGTTTTG GTTCAGGTAA ACACTCTGGA TGATGGTTCT ATTAAACGGT 2153TTCCCTTTAT AATCAGACTT AATATCCGTT GTCAGGTTGT AGGTTCCTTC TCCTCCATTG 2213AACACTGTAC CACTCCCCTT GACAGACTGG GACAAAGGTT TCCCCTTAGG GTAGAACTCA 2273AACATTGTGT GCTCGGTGAA CCCACTGACG ATACTTGATT GAACGCTGAC TCCCTTCTCA 2333GTGGTCGTTA CCACCAAGTC ATCATTCAAT GGACTTGTGA AACCAACATT CAGTAAATAT 2393GCCCCAGGTT CTTTTGACAA AGATGACACC TTCCACTCGC CTTCAATAGG GTTTTCAACC 2453GTTCCCACAT GATGAAACGC ACCTTTGAAA TAACTTTCCT GATCCTTTCC AGATGGTTTC 2513AGTGCCGTTA CCTTCCCATC TGGGCTTGTA AGGTAGACAT CTTCCTTCGA GTTCGATGCC 2573AACCAGTCAA TCGAAATCCG TTCTGCCCCA ACCTCTACCC AGAAAGTTTC ATCCGCATGC 2633TCTTTATACT CACCTCCGCG GATGAAGGAT GAAGTATTGG TCTTGAGAGC CGATTCCTTC 2693CTTGATATC 2702(2)SEQ ID NO2的信息(i)序列特征(A)长度397个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala1 5 10 15Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro Lys20 25 30Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu Ser35 40 45Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala Gln50 55 60Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser Ala65 70 75 80Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala Val85 90 95Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn Tyr100 105 110Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr115 120 125Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr130 135 140Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp145 150 155 160Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe165 170 175Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr His180 185 190Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala195 200 205Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala210 215 220Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala225 230 235 240Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys245 250 255Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly260 265 270Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe275 280 285Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser290 295 300Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val305 310 315 320Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr325 330 335Ser Tyr Met Ser Gly Thr Ser Met Ala Sar Pro His Val Ala Gly Leu340 345 350Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln355 360 365Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe370 375 380Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr385 390 395(2)SEQ ID NO3的信息(i)序列特征(A)长度1191个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ix)特征(A)名称/关键词CDS(B)定位1..1191(xi)序列描述SEQ ID NO3ATG AAG TTC AAA AAA ATA GCC GCT CTA TCC TTA GCA ACT TCC CTT GCT48Met Lys phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala400 405 410TTA TTC CCT GCC TTC GGA GGT AGT TCA CTG GCC AAG GAA GCA CCG AAA96Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro Lys415 420 425CCG TTC CAA CCT ATC AAC AAA ACT TTG GAT AAA GGC GCT TTC GAA TCC144Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu Ser430 435 440 445GGT GAA GTC ATC GTC AAA TTC AAA GAT GGT GTA TCC AAA AAG GCA CAA192Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala Gln450 455 460GGT TCT GCT CTG AAC AAA GCG GAG GCA AAT GAA CAG AAA GCA TCA GCA240Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser Ala465 470 475AAA GAT CCA TTT CAG GTA TTG GAA GTA GCG GAC GTC GAT CAA GCT GTT288Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala Val480 485 490AAA GCA CTG GAA AAC AAT CCG AAT GTA GAA TAT GCT GAA CCA AAC TAT336Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn Tyr495 500 505ACC TTC CAA GCG ACT TGG TCA CCG AAT GAC CCT TAC TAT TCT GCT TAC384Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr510 515 520 525CAG TAT GGA CCA CAA AAC ACC TCA ACC CCT GCT GCC TGG GAT GTA ACC432Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr530 535 540CGT GGA AGC AGC ACT CAA ACG GTG GCG GTC CTT GAT TCC GGA GTG GAT480Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp545 550 555TAT AAC CAC CCT GAT CTT GCA AGA AAA GTA ATA AAA GGG TAC GAC TTT528Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe560 565 570ATC GAC AGG GAC AAT AAC CCA ATG GAT CTT AAC GGA CAT GGT ACC CAT576Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr His575 580 585GTT GCC GGT ACT GTT GCT GCT GAT ACG AAC AAT GGA ATT GGC GTA GCC624Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala590 595 600 605GGT ATG GCA CCA GAT ACG AAG ATC CTT GCC GTA CGG GTC CTT GAT GCC672Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala610 615 620AAT GGA AGT GGC TCA CTT GAC AGC ATT GCC TCA GGT ATC CGC TAT GCT720Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala625 630 635GCT GAT CAA GGG GCA AAG GTA CTC AAC CTC TCC CTT GGT TGC GAA TGC768Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys640 645 650AAC TCC ACA ACT CTT AAG AGT GCC GTC GAC TAT GCA TGG AAC AAA GGA816Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly655 660 665GCT GTA GTC GTT GCT GCT GCA GGG AAT GAC AAT GTA TCC CGT ACA TTC864Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe670 675 680 685CAA CCA GCT TCT TAC CCT AAT GCC ATT GCA GTA GGT GCC ATT GAC TCC912Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser690 695 700AAT GAT CGA AAA GCA TCA TTC TCC AAT TAC GGA ACG TGG GTG GAT GTC960Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val705 710 715ACT GCT CCA GGT GTG AAC ATA GCA TCA ACC GTT CCG AAT AAT GGC TAC 1008Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr720 725 730TCC TAC ATG TCT GGT ACG TCC ATG GCA TCC CCT CAC GTG GCC GGT TTG 1056Ser Tyr Met Ser Gly Thr Ser Met Ala Sar Pro His Val Ala Gly Leu735 740 745GCT GCT TTG TTG GCA AGT CAA GGT AAG AAT AAC GTA CAA ATC CGC CAG 1104Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln750 755 760 765GCC ATT GAG CAA ACC GCC GAT AAG ATC TCT GGC ACT GGA ACA AAC TTC 1152Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe770 775 780AAG TAT GGT AAA ATC AAC TCA AAC AAA GCT GTA AGA TAC 1191Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr785 790(2)SEQ ID NO4的信息(i)序列特征(A)长度397个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala1 5 10 15Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro Lys20 25 30Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu Ser35 40 45Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala Gln50 55 60Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser Ala65 70 75 80Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala Val85 90 95Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn Tyr100 105 110Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr115 120 125Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr130 135 140Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp145 150 155 160Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe165 170 175Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr His180 185 190Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala195 200 205Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala210 215 220Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala225 230 235 240Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys245 250 255Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly260 265 270Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe275 280 285Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser290 295 300Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val305 310 315 320Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr325 330 335Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro His Val Ala Gly Leu340 345 350Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln355 360 365Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe370 375 380Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr385 390 395(2)SEQ ID NO5的信息(i)序列特征(A)长度1110个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(ix)特征(A)名称/关键词CDS(B)定位1..1110(xi)序列描述SEQ ID NO5AAG GAA GCA CCG AAA CCG TTC CAA CCT ATC AAC AAA ACT TTG GAT AAA48Lys Glu Ala Pro Lys Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys400 405 410GGC GCT TTC GAA TCC GGT GAA GTC ATC GTC AAA TTC AAA GAT GGT GTA96Gly Ala Phe Glu Ser Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val415 420 425TCC AAA AAG GCA CAA GGT TCT GCT CTG AAC AAA GCG GAG GCA AAT GAA 144Ser Lys Lys Ala Gln Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu430 435 440 445CAG AAA GCA TCA GCA AAA GAT CCA TTT CAG GTA TTG GAA GTA GCG GAC 192Gln Lys Ala Ser Ala Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp450 455 460GTC GAT CAA GCT GTT AAA GCA CTG GAA AAC AAT CCG AAT GTA GAA TAT 240Val Asp Gln Ala Val Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr465 470 475GCT GAA CCA AAC TAT ACC TTC CAA GCG ACT TGG TCA CCG AAT GAC CCT 288Ala Glu Pro Asn Tyr Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro480 485 490TAC TAT TCT GCT TAC CAG TAT GGA CCA CAA AAC ACC TCA ACC CCT GCT 336Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala495 500 505GCC TGG GAT GTA ACC CGT GGA AGC AGC ACT CAA ACG GTG GCG GTC CTT 384Ala Trp Asp Val Thr Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu510 515 520 525GAT TCC GGA GTG GAT TAT AAC CAC CCT GAT CTT GCA AGA AAA GTA ATA 432Asp Ser Gly Val Asp Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile530 535 540AAA GGG TAC GAC TTT ATC GAC AGG GAC AAT AAC CCA ATG GAT CTT AAC 480Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn545 550 555GGA CAT GGT ACC CAT GTT GCC GGT ACT GTT GCT GCT GAT ACG AAC AAT 528Gly His Gly Thr His Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn560 565 570GGA ATT GGC GTA GCC GGT ATG GCA CCA GAT ACG AAG ATC CTT GCC GTA 576Gly Ile Gly Val Ala Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val575 580 585CGG GTC CTT GAT GCC AAT GGA AGT GGC TCA CTT GAC AGC ATT GCC TCA 624Arg Val Leu Asp Ala Asn Gly Sar Gly Ser Leu Asp Ser Ile Ala Ser590 595 600 605GGT ATC CGC TAT GCT GCT GAT CAA GGG GCA AAG GTA CTC AAC CTC TCC672Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser610 615 620CTT GGT TGC GAA TGC AAC TCC ACA ACT CTT AAG AGT GCC GTC GAC TAT720Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr625 630 635GCA TGG AAC AAA GGA GCT GTA GTC GTT GCT GCT GCA GGG AAT GAC AAT768Ala Trp Asn Lys Gly Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn640 645 650GTA TCC CGT ACA TTC CAA CCA GCT TCT TAC CCT AAT GCC ATT GCA GTA816Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val655 660 665GGT GCC ATT GAC TCC AAT GAT CGA AAA GCA TCA TTC TCC AAT TAC GGA864Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly670 675 680 685ACG TGG GTG GAT GTC ACT GCT CCA GGT GTG AAC ATA GCA TCA ACC GTT912Thr Trp Val Asp Val Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val690 695 700CCG AAT AAT GGC TAC TCC TAC ATG TCT GGT ACG TCC ATG GCA TCC CCT960Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro705 710 715CAC GTG GCC GGT TTG GCT GCT TTG TTG GCA AGT CAA GGT AAG AAT AAC 1008His Val Ala Gly Leu Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn720 725 730GTA CAA ATC CGC CAG GCC ATT GAG CAA ACC GCC GAT AAG ATC TCT GGC 1056Val Gln Ile Arg Gln Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly735 740 745ACT GGA ACA AAC TTC AAG TAT GGT AAA ATC AAC TCA AAC AAA GCT GTA 1104Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val750 755 760 765AGA TAC 1110Arg Tyr(2)SEQ ID NO6的信息(i)序列特征(A)长度370个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO6Lys Glu Ala Pro Lys Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys1 5 10 15Gly Ala Phe Glu Ser Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val20 25 30Ser Lys Lys Ala Gln Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu35 40 45Gln Lys Ala Ser Ala Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp50 55 60Val Asp Gln Ala Val Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr65 70 75 80Ala Glu Pro Asn Tyr Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro85 90 95Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala100 105 110Ala Trp Asp Val Thr Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu115 120 125Asp Ser Gly Val Asp Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile130 135 140Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn145 150 155 160Gly His Gly Thr His Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn165 170 175Gly Ile Gly Val Ala Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val180 185 190Arg Val Leu Asp Ala Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser195 200 205Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser210 215 220Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr225 230 235 240Ala Trp Asn Lys Gly Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn245 250 255Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val260 265 270Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly275 280 285Thr Trp Val Asp Val Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val290 295 300Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro305 310 315 320His Val Ala Gly Leu Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn325 330 335Val Gln Ile Arg Gln Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly340 345 350Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val355 360 365Arg Tyr370(2)SEQ ID NO7的信息(i)序列特征(A)长度840个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ix)特征(A)名称/关键词CDS(B)定位1..840(xi)序列描述SEQ ID NO7TGG TCA CCG AAT GAC CCT TAC TAT TCT GCT TAC CAG TAT GGA CCA CAA48Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Gln375 380 385AAC ACC TCA ACC CCT GCT GCC TGG GAT GTA ACC CGT GGA AGC AGC ACT96Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr Arg Gly Ser Ser Thr390 395 400CAA ACG GTG GCG GTC CTT GAT TCC GGA GTG GAT TAT AAC CAC CCT GAT 144Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp Tyr Asn His Pro Asp405 410 415CTT GCA AGA AAA GTA ATA AAA GGG TAC GAC TTT ATC GAC AGG GAC AAT 192Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn420 425 430AAC CCA ATG GAT CTT AAC GGA CAT GGT ACC CAT GTT GCC GGT ACT GTT 240Asn Pro Met Asp Leu Asn Gly His Gly Thr His Val Ala Gly Thr Val435 440 445 450GCT GCT GAT ACG AAC AAT GGA ATT GGC GTA GCC GGT ATG GCA CCA GAT 288Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala Gly Met Ala Pro Asp455 460 465ACG AAG ATC CTT GCC GTA CGG GTC CTT GAT GCC AAT GGA AGT GGC TCA336Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala Asn Gly Ser Gly Ser470 475 480CTT GAC AGC ATT GCC TCA GGT ATC CGC TAT GCT GCT GAT CAA GGG GCA384Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala485 490 495AAG GTA CTC AAC CTC TCC CTT GGT TGC GAA TGC AAC TCC ACA ACT CTT432Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu500 505 510AAG AGT GCC GTC GAC TAT GCA TGG AAC AAA GGA GCT GTA GTC GTT GCT480Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly Ala Val Val Val Ala515 520 525 530GCT GCA GGG AAT GAC AAT GTA TCC CGT ACA TTC CAA CCA GCT TCT TAC528Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr535 540 545CCT AAT GCC ATT GCA GTA GGT GCC ATT GAC TCC AAT GAT CGA AAA GCA576Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala550 555 560TCA TTC TCC AAT TAC GGA ACG TGG GTG GAT GTC ACT GCT CCA GGT GTG624Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val Thr Ala Pro Gly Val565 570 575AAC ATA GCA TCA ACC GTT CCG AAT AAT GGC TAC TCC TAC ATG TCT GGT672Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly580 585 590ACG TCC ATG GCA TCC CCT CAC GTG GCC GGT TTG GCT GCT TTG TTG GCA720Thr Ser Met Ala Ser Pro His Val Ala Gly Leu Ala Ala Leu Leu Ala595 600 605 610AGT CAA GGT AAG AAT AAC GTA CAA ATC CGC CAG GCC ATT GAG CAA ACC768Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln Ala Ile Glu Gln Thr615 620 625GCC GAT AAG ATC TCT GGC ACT GGA ACA AAC TTC AAG TAT GGT AAA ATC816Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile630 635 640AAC TCA AAC AAA GCT GTA AGA TAC840Asn Ser Asn Lys Ala Val Arg Tyr645 650(2)SEQ ID NO8的信息(i)序列特征(A)长度280个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO8Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Glnl 5 10 15Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr Arg Gly Ser Ser Thr20 25 30Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp Tyr Asn His Pro Asp35 40 45Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn50 55 60Asn Pro Met Asp Leu Asn Gly His Gly Thr His Val Ala Gly Thr Val65 70 75 80Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala Gly Met Ala Pro Asp85 90 95Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala Asn Gly Ser Gly Ser100 105 110Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala115 120 125Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu130 135 140Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly Ala Val Val Val Ala145 150 155 160Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr165 170 175Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala180 185 190Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val Thr Ala Pro Gly Val195 200 205Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly210 215 220Thr Ser Met Ala Ser Pro His Val Ala Gly Leu Ala Ala Leu Leu Ala225 230 235 240Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln Ala Ile Glu Gln Thr245 250 255Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile260 265 270Asn Ser Asn Lys Ala Val Arg Tyr275 280(2)SEQ ID NO9的信息(i)序列特征(A)长度679个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO9AAGCTTAATC ATCCCGATGT ATCGCTTCAG CGCTTACCGT AGACGATTTT CTTTATAGTC 60TCGATGGATA AAAAGTACCT ATCTGAAATG GAAGCAATCG ACTCTCCTCC AGTAAAGGCT 120TCAAGGATCG ACGTGTTTCT CCGTTTAAGC GCTTCCCTTC CTCCTGACTT TGAGCCCCAG 180GCATTATACT CTTCTTTTCG CTTTGGGATA TAAATGGTTT GGCCTTGAAC ATAGTTTTGT 240AATTCTCTCA TTAAGTAATC AGGAATTTGA TTTACTGCTT TCAATCGTGT CAGCTCCTTA 300TCATTATTGG ATCAATAAGG GACAAAGCCG ACATATGAAT GGCGATTCAT CTAAAACTAC 360CACCCCATGC AAAGGATCGC CGAATCATAC AGGCTTTGCA TGAGATGCTG CAGATTTCGG 420AAAACGGATT TCCATATGAT CACCTCCTAG TATCAGTATA CTGATACTAG CAGAAAGATT 480TCCATAAGAA TTTCTTATAG TTACCATAAT ATTATTATAT AAACCTACTA TATTTGATTT 540TCAATTTGAG AAAATAAGTG ACCATTCACC TATCCTTAAA GTTGCTCAAC CCCATACAAT 600CATGAAACTT TTCATGCCAA ACGTTCATTA TGCGAAATCT ATCAAAAACT GAGAGTGAAT 660TCATTTTTTG ATAGAAAAT 679(2)SEQ ID NO10的信息(i)序列特征(A)长度81个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ix)特征(A)名称/关键词CDS(B)定位1..81(xi)序列描述SEQ ID NO10ATG AAG TTC AAA AAA ATA GCC GCT CTA TCC TTA GCA ACT TCC CTT GCT48Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala285 290 295TTA TTC CCT GCC TTC GGA GGT AGT TCA CTG GCC81Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala300 305(2)SEQ ID NO11的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO11Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala1 5 10 15Leu Phe Pro Ala Phe Gly Gly 5er Ser Leu Ala20 25(2)SEQ ID NO12的信息(i)序列特征(A)长度873个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ix)特征(A)名称/关键词CDS(B)定位1..873(xi)序列描述SEQ ID NO12ATG AGG AGC TCC CTT GTG CTG TTC TTT GTC TCT GCG TGG ACG GCC TTG48Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu30 35 40GCC AGT CCT ATT CGT CGA GAG GTC TCG CAG GAT CTG TTT AAC CAG TTC96Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe45 50 55AAT CTC TTT GCA CAG TAT TCT GCA GCC GCA TAC TGC GGA AAA AAC AAT 144Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn60 65 70 75GAT GCC CCA GCT GGT ACA AAC ATT ACG TGC ACG GGA AAT GCC TGC CCC 192Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro80 85 90GAG GTA GAG AAG GCG GAT GCA ACG TTT CTC TAC TCG TTT GAA GAC TCT 240Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser95 100 105GGA GTG GGC GAT GTC ACC GGC TTC CTT GCT CTC GAC AAC ACG AAC AAA 288Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys110 115 120TTG ATC GTC CTC TCT TTC CGT GGC TCT CGT TCC ATA GAG AAC TGG ATC 336Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile125 130 135GGG AAT CTT AAC TTC GAC TTG AAA GAA ATA AAT GAC ATT TGC TCC GGC 384Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly140 145 150 155TGC AGG GGA CAT GAC GGC TTC ACT TCG TCC TGG AGG TCT GTA GCC GAT 432Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp160 165 170ACG TTA AGG CAG AAG GTG GAG GAT GCT GTG AGG GAG CAT CCC GAC TAT 480Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr175 180 185CGC GTG GTG TTT ACC GGA CAT AGC TTG GGT GGT GCA TTG GCA ACT GTT528Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val190 195 200GCC GGA GCA GAC CTG CGT GGA AAT GGG TAT GAT ATC GAC GTG TTT TCA576Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser205 210 215TAT GGC GCC CCC CGA GTC GGA AAC AGG GCT TTT GCA GAA TTC CTG ACC624Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr220 225 230 235GTA CAG ACC GGC GGA ACA CTC TAC CGC ATT ACC CAC ACC AAT GAT ATT672Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile240245 250GTC CCT AGA CTC CCG CCG CGC GAA TTC GGT TAC AGC CAT TCT AGC CCA720Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro255 260 265GAG TAC TGG ATC AAA TCT GGA ACC CTT GTC CCC GTC ACC CGA AAC GAT768Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp270 275280ATC GTG AAG ATA GAA GGC ATC GAT GCC ACC GGC GGC AAT AAC CAG CCT816Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro285 290 295AAC ATT CCG GAT ATC CCT GCG CAC CTA TGG TAC TTC GGG TTA ATT GGG864Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly300 305 310 315ACA TGT CTT873Thr Cys Leu(2)SEQ ID NO13的信息(i)序列特征(A)长度291个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO13Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu1 5 10 15Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe20 25 30Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn35 40 45Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro50 55 60Glu Val Glu Lys Ala Asp Ala Thr phe Leu Tyr Ser Phe Glu Asp Ser65 70 76 80Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys85 90 95Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile100 105 110Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly115 120 125Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp130 135 140Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr145 150 155 160Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val165 170 175Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser180 185 190Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr195 200 205Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile210 215 220Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro225 230 235 240Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp245 250 255Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro260 265 270Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly275 280 285Thr Cys Leu290(2)SEQ ID NO14的信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO14Ala Tyr Gln Tyr Gly Pro Gln Asn Thr15(2)SEQ ID NO15的信息(i)序列特征(A)长度12个氨基酸(B)类型氨基酸
(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO15Tyr Asp Phe Ile Asp Tyr Asp Asn Asn Pro Met Asp15 10(2)SEQ ID NO16的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO16GCTACATAGG CCCAAAAC 18(2)SEQ ID NO17的信息(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO17TCCATGGTTT TTCTATCATA ATCTA 25(2)SEQ ID NO18的信息(i)序列特征(A)长度628个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(xi)序列描述SEQ ID NO18GAATTCGGCT TAAGGCATGC GTCCTTCTTT GTGCTTGGAA GCAGAGCCCA ATATTATCCC 60GAAACGATAA AACGGATGCT GAAGGAAGGA AACGAAGTCG GCAACCATTC CTGGGACCAT 120CCGTTATTGA CAAGGCTGTC AAACGAAAAA GCGTATCAGG AGATTAACGA CACGCAAGAA 180ATGATCGAAA AAATCAGCGG ACACCTGCCT GTACACTTGC GTCCTCCATA CGGCGGGATC 240AATGATTCCG TCCGCTCGCT TTCCAATCTG AAGGTTTCAT TGTGGGATGT TGATCCGGAA 300GATTGGAAGT ACAAAAATAA GCAAAAGATT GTCAATCATG TCATGAGCCA TGCGGGAGAC 360GGAAAAATCG TCTTAATGCA CGATATTTAT GCAACGTTCG CAGATGCTGC TGAAGAGATT 420ATTAAAAAGC TGAAAGCAAA AGGCTATCAA TTGGTAACTG TATCTCAGCT TGAAGAAGTG 480AAGAAGCAGA GAGGCTATTG AATAAATGAG TAGAAAGCGC CATATCGGCG CTTTTCTTTT 540GGAAGAAAAT ATAGGGAAAA TGGTACTTGT TAAAAATTCG GAATATTTAT ACAATATCAT 600ATGTTACACA TTGAAAGAAG CCGAATTC628(2)SEQ ID NO19的信息(i)序列特征(A)长度16个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO19AAGGCATGCG TCCTTC16(2)SEQ ID NO20的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO20CTTTCAATGT GTAACATA 18(2)SEQ ID NO21的信息
(i)序列特征(A)长度1514个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO21GAATTCGGCT TGAGACCCGG GAGCTTTCAG TGAAGTACGT GATTATACGG AGATGAAAAT 60TCGTACACTG TTAACGAGAA GGAAACGCCG ACGAAAGCGT AGCATCGGAT GGCAAAGATG 120GAGTAACGAA TATCTCTACG GTGTACTGGG GCTTTACTGA GACTAGAAAG TCCTTCCCTT 180GAAAAGTGCA GAGAGTTTTC GATAAAAGTG TCAGCCATTT GATAAGTCTC ATTCTCATAA 240CCTATTGATG AAGTTTATAG GGAAGCTGCT TGAGAGGGAA AACCTCACGA ACAGTTCTTA 300TGGGGAGAGA CTGGAAACAG GTCACAATTG ATACCTCGCT AATCTTTTAA CCGACAAAGT 360TTTTTTAAAC CGTGGAAGTC ATAATAACCT GGATATTGTG AATTTATAAA AGTTAACAAA 420TGGTTTATAT TAAGACAGTC ATAAACCAAA GATTTTTCTT CTAAAGCTAC GATAGCAAAA 480ATTTCACTAG AAATTAGTTA TACAAGCATT TTGTAAGAAT TATTAAAAAG ATAAATCCTG 540CTATTACGAG ATTAGTAGGA TGATATTGTG AAAAATTTTT TATCTATTCG ATTTAAAATA 600TTTATGAATT TTACATAAAC CTCATAAGAA AAAATACTAT CTATACTATT TTAAGAAATT 660TATTAGAATA AGCGGATTCA AAATAGCCCT GGCCATAAAA GTACCTCAGC AGTAGAAGTT 720TTGACCAAAA TTAAAAAAAT ACCCAATCAA GAGAATATTC TTAATTACAA TACGTTTTGC 780GAGGAACATA TTGATTGAAA TTTAATAAAT TTAGTCCTAA AATTTAAAGA AATTTAAGTT 840TTTCATATTT TTATGAACTA ACAAGAATAA AAATTGTGTT TATTTATTAT TCTTGTTAAA 900TATTTGATAA AGAGATATAT TTTTGGTCGA AACGTAAGAT GAAACCTTAG ATAAAAGTGC 960TTTTTTTGTT GCAATTGAAG AATTATTAAT GTTAAGCTTA ATTAAAGATA ATATCTTTGA1020ATTGTAACGC CCCTCAAAAG TAAGAACTAC AAAAAAAGAA TACGTTATAT AGAAATATGT1080TTGAACCTTC TTCAGATTAC AAATATATTC GGACGGACTC TACCTCAAAT GCTTATCTAA1140CTATAGAATG ACATACAAGC ACAACCTTGA AAATTTGAAA ATATAACTAC CAATGAACTT1200GTTCATGTGA ATTATCGCTG TATTTAATTT TCTCAATTCA ATATATAATA TGCCAATACA1260TTGTTACAAG TAGAAATTAA GACACCCTTG ATAGCCTTAC TATACCTAAC ATGATGTAGT1320ATTAAATGAA TATGTAAATA TATTTATGAT AAGAAGCGAC TTATTTATAA TCATTACATA1380TTTTTCTATT GGAATGATTA AGATTCCAAT AGAATAGTGT ATAAATTATT TATCTTGAAA1440GGAGGGATGC CTAAAAACGA AGAACATTAA AAACATATAT TTGCACCGTC TAATGGATTT1500ATGAAGCCGA ATTC 1514(2)SEQ ID NO22的信息(i)序列特征
(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO22GAGACCCGGG AGCTTTCAGT GAAGTACGTG 30(2)SEQ ID NO23的信息(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO23CATAAATCCA TTAGACGGTG C 21(2)SEQ ID NO24的信息(i)序列特征(A)长度162个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO24ATCGATTGTT TGAGAAAAGA AGAAGACCAT AAAAATACCT TGTCTGTCAT CAGACAGGGT 60ATTTTTTATG CTGTCCAGAC TGTCCGCTGT GTAAAAATAA GGAATAAAGG GGGGTTGTTA120TTATTTTACT GATATGTAAA ATATAATTTG TATAAGAAAA TG 162(2)SEQ ID NO25的信息(i)序列特征(A)长度29个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO25GCATGCAATC GATTGTTTGA GAAAAGAAG29(2)SEQ ID NO26的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO26CATTTTCTTA TACAAATTAT ATTTTACATA TCAG 34(2)SEQ ID NO27的信息(i)序列特征(A)长度2017个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO27TGCGAAATCT ATCAAAAACT GAGAGTGAAT TCATTTTTTG ATAGAAAATT AAAACTATTC 60AATATTTTGT CACAACCTGC TAGAATCCTA GGTAATAAGG GTCCCCTACA TATCTATCAT 120TCATCACAAT GACCTTTGTT CATCTTGAAT TCTGAAGGGA GGATCGACCT GCTAATTTGT 180CGTAAAAAAA TAGAAAATGG AGGAATGCTT TTATGAAGTT CAAAAAAATA GCCGCTGTAT 240CCTTAGCAAC TTCCCTTGCT TTATTCCCTG CCTTCGGAGG TAGTTCACTG GCCAAGGAAG 300CACCGAAACC GTTCCAACCT ATCAACAAAA CTTTGGATAA AGGCGCTTTC GAATCCGGTG 360AAGTCATCGT CAATTCAAAG ATGGTGTATC CAAAAAGGCA CAAGGTTCTG CTCTGAACAA 420AGCGGAGGCA AATGAACAGA AAGCATCAGC AAAAGATCCA TTTCAGGTAT TGGAAGTAGC 480GGACGTCGAT CAAGCTGTTA AAGCACTGGA AAACAATCCG AATGTAGAAT ATGCTGAACC 540AAACTATACC TTCCAAGCGA CTTGGTCACC GAATGACCCT TACTATTCTG CTTACCAGTA 600TGGACCACAA AACACCTCAA CCCCTGCTGC CTGGGATGTA ACCCGTGGAA GCAGCACTCA 660AACGGTGGCG GTCCTTGATT CCGGAGTGGA TTATAACCAC CCTGATCTTG CAAGAAAAGT 720AATAAAAGGG TACGACTTTA TCGACAGGGA CAATAACCCA ATGGATCTTA ACGGACATGG 780TACCCATGTT GCCGGTACTG TTGCTGCTGA TACGAACAAT GGAATTGGCG TAGCCGGTAT 840GGCACCAGAT ACGAAGATCC TTGCCGTACG GGTCCTTGAT GCCAATGGAA GTGGCTCACT 900TGACAGCATT GCCTCAGGTA TCCGCTATGC TGCTGATCAA GGGGCAAAGG TACTCAACCT 960CTCCCTTGGT TGCGAATGCA ACTCCACAAC TCTTAAGAGT GCCGTCGACT ATGCATGGAA 1020CAAAGGAGCT GTAGTCGTTG CTGCTGCAGG GAATGACAAT GTATCCCGTA CATTCCAACC 1080AGCTTCTTAC CCTAATGCCA TTGCAGTAGG TGCCATTGAC TCCAATGATC GAAAAGCATC 1140ATTCTCCAAT TACGGAACGT GGGTGGATGT CACTGCTCCA GGTGTGAACG AGGTTACTAG 1200CTTTTCGTAG TAAGAGGTTA ATGCCTTGCA CCCACCTACA GTGACGAGGT CCACACTTGA 1260TAGCATCAAC CGTTCCGAAT AATGGCTACT CCTACATGTC TGGTACGTCC ATGGCATCCC 1320CTCACGTGGC CGGTTTGGCT GCTTTGTTGG CAAGTCAAGG TAAGAATAAC GTACAAATCC 1380GCCAGGCCAT TGAGCAAACC GCCGATAAGA TCTCTGGCAC TGGAACAAAC TTCAAGTATG 1440GTAAAATCAA CTCAAACAAA GCTGTAAGAT ACTAATAGAT AAAACAAGAG CACACCGTGA 1500ATGGTGGGCT CTTTCATTAT GTTCACTACT GTTTTACGAT CTGGCCGTTT TGGTTCAGGT 1560AAACACTCTG GATGATGGTT CTATTAAACG GTTTCCCTTT ATAATCAGAC TTAATATCCG 1620TTGTCAGGTT GTAGGTTCCT TCTCCTCCAT TGAACACTGT ACCACTCCCC TTGACAGACA 168CATTATAGGCA ACAGTCCAAC ATCCAAGGAA GAGGAGGTAA CTTGTGACAT GGTGAGGGGA 1740ACTGTCTGTG GGACAAAGGT TTCCCCTTAG GGTAGAACTC AAACTTGTGT GCTCGGTGAA 1800CCCACTGACG ATACTTGACC CTGTTTCCAA AGGGGAATCC CATCTTGAGT TTGTAACACA 1860CGAGCCACTT GGGTGACTGC TATGAACTAA CTTGCGACTG AGGGAAAGAG TCACCAGCGT 1920GGTGGTTCAG TAGTAAGTTA CCTGAACACT TTGGTTCATT CAGTTTTGCC CCCAGGTTCT 1980GGGAAAAAGG ATGAACTTCC ACTTCGGCCC TTTTTTT 201权利要求
1.一种核酸构建体,该核酸构建体包含编码蛋白酶的核酸序列,所说的蛋白酶具有下列性质(a)通过SDS-PAGE测定的大约34kD的分子量;(b)大约9.3的pI;(c)在约25℃下以酪蛋白为底物时,pH最佳范围约为pH9-11;(d)在pH约为9.5而且以酪蛋白为底物时,最佳温度范围约为40-55℃;(e)可从Bacillus sp.Group I获得。
2.权利要求1的核酸构建体,其中所说的蛋白酶可以从Bacillus sp.,PD498获得。
3.一种核酸构建体,该核酸构建体包含编码具有如可以从Bacillussp.,PD498获得的蛋白酶的基本上所有的免疫化学性质的核酸序列,其中所说的蛋白酶具有下列性质(a)通过SDS-PAGE测定的大约34kD的分子量;(b)大约9.3的pI;(c)在约25℃下以酪蛋白为底物时,pH最佳范围约为pH9-11;(d)在pH约为9.5而且以酪蛋白为底物时,最佳温度范围约为40-55℃。
4.一种核酸构建体,该核酸构建体包含编码具有SEQ ID NO1中所描述的氨基酸序列的蛋白酶的核酸序列。
5.一种核酸构建体,该核酸构建体包含编码具有SEQ ID NO2中所描述的氨基酸序列的蛋白酶的核酸序列。
6.一种核酸构建体,该核酸构建体包含编码具有SEQ ID NO3中所描述的氨基酸序列的蛋白酶的核酸序列。
7.一种核酸构建体,该核酸构建体包含在SEQ ID NO4中所描述的核酸序列。
8.权利要求4的核酸构建体,其中所说的蛋白酶由在SEQ ID NO5中描述的核酸序列编码。
9.权利要求5的核酸构建体,其中所说的蛋白酶由在SEQ ID NO6中描述的核酸序列编码。
10.权利要求5的核酸构建体,其中所说的蛋白酶由在SEQ ID NO7中描述的核酸序列编码。
11.一种重组宿主细胞,该重组宿主细胞包含权利要求1的核酸构建体。
12.包含权利要求4的核酸构建体的所说的重组宿主细胞。
13.包含权利要求5的核酸构建体的所说的重组宿主细胞。
14.包含权利要求6的核酸构建体的所说的重组宿主细胞。
15.包含权利要求7的核酸构建体的所说的重组宿主细胞。
16.一种重组载体,该重组载体包含(a)权利要求1的核酸构建体;(b)一种可操作地连接到(a)的核酸序列上的启动子序列;(c)一种可选择的标记。
17.一种重组载体,该重组载体包含(a)权利要求4的核酸构建体;(b)一种可操作地连接到(a)的核酸序列上的启动子序列;(c)一种可选择的标记。
18.一种重组载体,该重组载体包含(a)权利要求5的核酸构建体;(b)一种可操作地连接到(a)的核酸序列上的启动子序列;(c)一种可选择的标记。
19.一种重组载体,该重组载体包含(a)权利要求6的核酸构建体;(b)一种可操作地连接到(a)的核酸序列上的启动子序列;(c)一种可选择的标记。
20.一种重组载体,该重组载体包含(a)权利要求7的核酸构建体;(b)一种可操作地连接到(a)的核酸序列上的启动子序列;(c)一种可选择的标记。
21.权利要求16的重组载体,其中所说的启动子序列选自由cryIIIA启动子、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶启动子、解淀粉芽孢杆菌(Bacillus amyloliquifaciens)α-淀粉酶启动子以及源于具有在SEQ ID NO8中显示的核酸序列的并编码芽孢杆菌属碱性蛋白酶的基因的启动子序列组成的组。
22.权利要求16的重组载体,其中所说的载体还包含信号序列。
23.权利要求22的重组载体,其中所说的信号序列选自由地衣芽孢杆菌α-淀粉酶启动子、解淀粉芽孢杆菌α-淀粉酶启动子以及源于具有在SEQID NO4中显示的核酸序列的并编码芽孢杆菌属碱性蛋白酶的基因的信号序列组成的组。
24.一种获得具有下列性质的蛋白酶的方法(i)通过SDS-PAGE测定的大约34kD的分子量;(ii)大约9.3的pI;(iii)在约25℃下以酪蛋白为底物时,pH最佳范围约为pH9-11;(iv)在pH约为9.5而且以酪蛋白为底物时,最佳温度范围约为40-55℃;(v)可以从Bacillus sp.Group I获得该方法包括在有益于蛋白酶表达的条件下培养权利要求中的重组宿主细胞并从培养物中回收蛋白酶。
25.一种启动子序列或其片段,该启动子序列源于编码具有下列性质的蛋白酶的基因(i)通过SDS-PAGE测定的大约34kD的分子量;(ii)大约9.3的pI;(iii)在约25℃下以酪蛋白为底物时,pH最佳范围约为pH9-11;(iv)在pH约为9.5而且以酪蛋白为底物时,最佳温度范围约为40-55℃;(v)可以从Bacillus sp.Group I获得,所说片段具有与所说的启动子序列基本上相同的启动子活性,其中所说的启动子具有SEQ IDNO8中所显示的序列。
26.一种载体,该载体包含权利要求25的启动子序列和把异源DNA序列插入所说的载体中的位点。
27.权利要求26的载体,其中所说的载体还包含编码异源多肽的DNA序列。
28.一种在细菌细胞中产生异源多肽的方法,该方法包括(a)用权利要求26的载体转化所说的细胞;(b)培养步骤(a)转化的细胞;(c)从步骤(b)转化的细胞回收所说的异源多肽。
29.一种信号序列或其片段,该信号序列源于编码具有下列性质的蛋白酶的基因(i)通过SDS-PAGE测定的大约34kD的分子量;(ii)大约9.3的pI;(iii)在约25℃下以酪蛋白为底物时,pH最佳范围约为pH9-11;(iv)在pH约为9.5而且以酪蛋白为底物时,最佳温度范围约为40-55℃;(v)可以从Bacillus sp.GroupI获得,所说片段具有与所说的序列基本上相同的信号活性,其中所说的信号序列具有SEQ ID NO9中所显示的氨基酸序列。
30.权利要求29的信号序列,其中所说的信号序列由SEQ ID NO10中所描述的核酸序列编码。
31.一种载体,该载体包含(a)权利要求29的信号序列;(b)在所说的信号序列上游的启动子序列、核糖体结合位点序列,所说的信号序列的转录在所说的启动子序列控制下;(c)在所说的信号序列下游的把异源DNA序列插入所说的载体中的位点,所说的位点和所说的信号序列在相同的读框中。
32.权利要求29的载体,其中所说的载体还包含编码异源多肽的DNA序列。
33.一种在细菌细胞中产生异源多肽的方法,该方法包括(a)用权利要求31的载体转化所说的细胞;(b)培养步骤(a)转化的细胞;(c)从步骤(b)转化的细胞回收所说的异源多肽。
全文摘要
本发明涉及分离的核酸构建体以及包含这些构建体的重组载体和宿主细胞,所说构建体包含编码具有大约34kD分子量的碱性蛋白酶并且可以从Bacillus sp.Group I菌株获得的核酸序列。本发明还涉及获得所述蛋白酶的方法。本发明也涉及源于所说的碱性蛋白酶的启动子和信号序列以及利用所述启动子与信号序列在细菌中表达编码异源蛋白质的异源核酸序列的方法。
文档编号C12P21/00GK1187218SQ96194496
公开日1998年7月8日 申请日期1996年5月1日 优先权日1996年5月1日
发明者A·P·司罗马, H·奥特拉普, C·达姆伯曼, D·A·阿思灵 申请人:诺沃诺尔迪斯克生物技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1