重组Ⅱ型限制性内切核酸酶MmeI和相关内切核酸酶以及制备这些酶的方法

文档序号:575232阅读:556来源:国知局
专利名称:重组Ⅱ型限制性内切核酸酶MmeI和相关内切核酸酶以及制备这些酶的方法
本申请是分案申请,原申请的申请日为2003年7月10日、申请号为03816564.3(PCT/US2003/021570)、发明名称为“重组II型限制性内切核酸酶MmeI和相关内切核酸酶以及制备这些酶的方法”。
背景技术
本发明涉及DNA(脱氧核糖核酸)片段,该片段编码具有两种相关的酶功能的多肽,一个酶功能是识别DNA序列5’-TCC(Pu)AC-3’并且剪切位于这个识别序列3’端第20和第21个残基之间的磷酸二酯键以及互补链上的识别序列5’-GT(Py)GGT-3’的5’端第18和19个残基之间的磷酸二酯键,从而产生具有两个碱基的3’粘末端(以下称为MmeI限制性内切酶),而第二个酶活性是识别同样的DNA序列,5’-TCC(Pu)AC-3’,但是通过增加一个甲基来修饰这段序列以防止内切酶MmeI的剪切。本发明还涉及含有该DNA片段的载体、含有该DNA片段的转化宿主,以及从这样的转化宿主中制备出MmeI限制性内切酶的改进的方法。本发明还涉及鉴定编码具有和MmeI同样特性但却很可能具有独特的DNA识别序列的酶的其它DNA片段的方法。这个方法依赖于本申请中所提出的MmeI酶的氨基酸序列的使用,或者由此依赖于通过这个方法鉴定出来的别的序列。本发明还涉及可以通过所述的该方法鉴定出来的其它的DNA片段,这些片段中的每一个都编码与MmeI多肽具有显著的氨基酸序列相似性的多肽。由这些DNA片段编码的多肽被预测表现出和MmeI相似的功能。特别地,这些多肽被预测具有双重的酶学功能在离特异性识别序列相对远的距离处以特异性的方式剪切DNA,而又修饰它们的识别序列以防止宿主DNA由于内切酶活性而被剪切。通过这种方法鉴定出来的酶的一个实例是CstMI(参见申请序列号为10/616,689的美国专利申请,其与本申请同时提交)。CstMI由于其与MmeI高度显著的氨基酸序列相似性而被认为是一种潜在的内切酶。CstMI识别序列5’-AAGGAG-3’,并剪切位于该识别序列3’端第20和第21个残基之间的磷酸二酯键以及互补链上识别序列5’-CTCCTT-3’的5’端第18和19个残基之间的磷酸二酯键,由此产生具有两个碱基的3’粘末端。
限制性内切酶是一类自然存在于原核生物中的酶。已知的限制性酶切系统有好几种,其中II型内切酶是在遗传工程中非常有用的一类。当这些II型内切酶与原核生物中的其它杂质组分分开而被纯化出来以后,就可以在实验室中用来将DNA分子打断成准确的片段。这种特性使得DNA分子可以被特定地鉴定出来并且被分到它们的组成基因中。限制性内切酶已经被证明是现代遗传学研究中不可或缺的工具。它们是生物化学上的“剪刀”,通过它们遗传工程和分析得以进行。
限制性内切酶通过识别并结合到DNA分子上特定的核苷酸序列(“识别序列”)而起作用。一旦结合到DNA序列上,II型内切酶就在这段序列的内部或者是一侧剪切核酸分子。不同的限制性内切酶对不同的识别序列具有亲和性。大多数限制性内切酶识别的序列长度为4到6个核苷酸,虽然最近也有少数识别7或8个特异核苷酸的限制性内切酶已经被分离出来。绝大多数识别序列都含有一对对称轴,而且在绝大多数情况下所有的核苷酸都是独特地确定的。然而,有些限制性内切酶具有简并或者不严格的特异性,因为它们在它们的识别序列中一个或者多个位置处识别多种碱基,而且有的限制性内切酶识别非对称的序列。HaeIII识别的序列是5’-GGCC-3’,这是具有对称性、非简并识别序列的一个实例;HaeII识别的序列是5’-(Pu)GCGC(Py)-3’,这是典型的具有简并的或者不严格的识别序列的限制性内切酶;而BspMI识别的序列为5’-ACCTGC-3’,这是典型的具有非对称识别序列的限制性内切酶。具有对称性识别序列的II型内切酶一般对称地在识别位点内部或者与之相邻的位置剪切,而那些识别非对称序列的限制性内切酶往往在距离识别位点一端1到20个碱基范围内剪切。本申请的酶MmeI(还有CstMI)具有的特性就是在距离所有已知的II型限制性内切酶的识别序列最远的位置剪切DNA。目前有多于200种独特的限制性内切酶在几千种已经研究过的细菌物种中被鉴定出来。
限制性系统的另一个组分是甲基化修饰酶。这些酶与限制性内切酶互补,它们为细菌提供可以保护自身的DNA并与外源侵染的DNA区分开来的手段。甲基化修饰酶识别并结合到与对应的限制性内切酶同样的识别序列上,但它们不是打断DNA,而是通过添加甲基基团来化学修饰序列中的一个或者其它的核苷酸。甲基化之后,识别序列便不再会被限制性内切酶剪切。细菌细胞的DNA借助它的甲基化修饰酶的活性而被修饰,因而它对内源限制性内切酶的存在变得不敏感。只有未被修饰因而也就被认为是外源的DNA才对限制性内切酶的识别和剪切敏感。甲基转移修饰酶常常是不同于它们的同源内切酶伴侣的另外一种酶。在某些情况下,一种单个的多肽同时具有甲基转移修饰酶和内切酶的功能,比如Eco57I。在这样的情况下,会有另外一个甲基转移酶存在并作为限制-修饰系统的一部分。相反,本申请中的MmeI系统没有另外的甲基转移酶与内切酶-甲基转移酶多肽相伴。
内切酶的命名是根据它们来源的细菌而制定的。因此,比如嗜血杆菌(Haemophilus ageyptius)合成三种不同的限制性内切酶,它们就会被命名为HaeI、HaeII和HaeIII。这些酶识别和剪切的序列分别为5’-(W)GGCC(W)-3’、5’-(Pu)GCGC(Py)-3’和5’-GGCC-3’。另一方面,大肠杆菌(Escherichia coli)RY13只合成一种内切酶EcoRI,它识别的序列是5’-GAATTC-3’。
虽然并不想受到理论的约束,但是一般认为在自然界中,限制性内切酶在细菌细胞的保障系统中起着保护性作用。它们可以使细菌能够抵抗外源DNA分子比如病毒或者质粒的侵染,不然这些分子可能会破坏或者寄生于细胞。它们是通过识别侵染DNA分子中出现的识别序列并在这些位置剪切DNA而达到抵抗的目的。由此产生的这种瓦解使得很多侵染性的基因失活,而且促使这些DNA易于进一步被外切酶降解。
已经有多于3000种限制性内切酶从各种细菌株系中被分离出来。其中超过240种是识别独特的序列,而其他种类的内切酶则分享共同的识别特异性。识别同样的核苷酸序列的限制性内切酶被称为“同裂酶(isoschizomer)”。虽然同裂酶的识别序列是一样的,但是它们的剪切位点却有可能会不同(比如XmaI和SmaI,Endow等,J.Mol.Biol.112521(1977);Waalwijk等,Nucleic Acids Res.53231(1978)),并且在不同位点的剪切速率也会有所不同(XhoI和PaeR7I,Gingeras等,Proc.Natl.Acad.Sci.U.S.A.80402(1983))。
限制性内切酶传统地被分成三个主要的大类I型、II型和III型。I型限制性系统召集多种肽构成复合物,其由限制性多肽、修饰性多肽和特异性或者DNA识别多肽组成。I型系统需要二价阳离子、ATP和S-腺苷甲硫氨酸(SAM)作为辅助因子。I型系统剪切DNA的位置随机,最远可以在距离它们的特异性识别位点几千个碱基对的位置。III型系统一般识别非对称的DNA序列,而剪切则发生在距离识别序列一侧20到30个碱基对的特异性位置。这样的系统需要ATP作为辅助因子,同时也需要SAM和二价阳离子。III型系统是由内切酶多肽和修饰性多肽构成的复合体组成,这样它便可以修饰识别序列处的DNA或者剪切DNA。由于它们的修饰活性和剪切活性之间的竞争,III型系统产生的是部分消化的DNA底物,因此也没有在遗传操作中被使用。
MmeI的DNA剪切活性不需要ATP,而且它剪切完全;因此它可以被归为一种II型内切酶。尽管如此,与其他II型内切酶所不同的是,MmeI由一条结合了内切酶和修饰活性的单个多肽组成,这使得它自身就足可以形成完整的限制-修饰系统。MmeI也是所有II型内切酶中在距离特异性DNA识别序列的最远处进行剪切的(本申请的CstMI也是如此)。MmeI相当大,似乎三个功能性结构域整合在一段多肽中。这些结构域由氨基末端结构域、DNA修饰结构域和羧基末端结构域组成;氨基末端结构域包含内切酶DNA剪切基序(motif),也参与DNA识别,DNA修饰结构域与γ类N6mA甲基转移酶最相似,羧基末端结构域被推测参与二聚体的形成和并可能参与DNA识别。这种酶的剪切和修饰活性都需要SAM。单个MmeI多肽足可以在体内条件下修饰携带基因的质粒载体以使得在体外条件下免受MmeI的剪切,而在使用含有Mg++和SAM的内切酶缓冲液时它也可以在体外条件下剪切没有修饰的DNA。
对于新的II型限制性内切酶的需要一直在持续不断。虽然目前已经有识别大量特异性核苷酸序列的II型限制性内切酶可以利用,但是识别新的序列的新的限制性内切酶对遗传操作会提供更多的机会和能力;每一个新的独特的内切酶都可以使科学家利用这种内切酶提供的所有机会来准确地在DNA分子内新的位置剪切DNA。
发明概述 根据本发明,提供了编码新型的限制性内切酶的新的DNA片段,这个片段可以从嗜甲醇营养菌(Methylophilus methylotrophus)(NEB#1190)中获得。因此这种内切酶被命名为“MmeI”,这种内切酶 (1)识别双链DNA分子中的简并核苷酸序列,如下所示 5’-TCC(Pu)AC-3’ 3’-AGG(Py)TG-5’ (其中G代表鸟嘌呤,C代表胞嘧啶,A代表腺嘌呤,T代表胸腺嘧啶,(Pu)代表一种嘌呤,A或者G,而(Py)代表一种嘧啶,C或者T);(2)在识别序列5’-TCC(Pu)AC-3’的3’侧第20个核苷酸位置后面的磷酸二酯健处和在互补链上识别序列5’-GT(Py)GGA-3’的5’侧第18个核苷酸位置前面的磷酸二酯键处剪切DNA,产生一个伸出两个碱基的3’端 5’-TCC(Pu)AC(N20)-3’ 3’-AGG(Py)TG(N18)-5’; (3)在体内条件下使(1)中指出的识别序列甲基化以保护宿主DNA免受内切酶MmeI活性造成的剪切。
本发明进一步涉及其它的DNA片段,这些片段中的每一个都被鉴定出编码具有与MmeI限制-修饰多肽显著的序列相似性的多肽。编码MmeI多肽的DNA片段使得这些其它的潜在的内切酶可以被鉴定出来,其中利用程序如BLAST(Altschul等,Nucleic Acids Res.253389-3402(1997))在数据库例如GENBANK可获得的序列中进行MmeI序列的相似性搜索。这些DNA片段以及其它的将会在以后提交到数据库中的具有与MmeI这样的相似性的片段,都是可以编码与MmeI类似的多肽的候选者,这些被编码的多肽同时作为限制性内切酶和甲基转移酶。类似于MmeI,这些多肽可以在距离识别序列类似远的位置处剪切DNA,范围是18到20个核苷酸或者更长,这种特性是独特的而且在某些分子生物学技术中是有用的。特别地,这些多肽含有在N6mADNA甲基转移酶中普遍的氨基酸基序,具有在限制性内切酶中普遍的并且位于多肽氨基末端部分的基序,这个基序由氨基酸D/E(X8~X12)D/EXK组成,而且这些多肽在保守的甲基转移酶基序之后还具有一个由数百个氨基酸组成的区域,它与MmeI的相应区域具有显著的相似性,这个区域被认为在二聚体化中起作用,也有可能是一个DNA序列识别结构域。这样的多肽的一个例子就是CstMI。已经表明CstMI识别6个碱基对的非对称序列5’-AAGGAG-3’,剪切DNA的方式和MmeI一样5’-AAGGAGN20/N18-3’。由这些DNA片段编码的内切酶可以通过如下所述的用于MmeI的方法来制备。
本发明进一步涉及生产限制性内切酶MmeI的方法。这个方法包括培养含有编码MmeI限制性系统多肽的DNA片段的转化宿主,比如大肠杆菌,收集培养的细胞,从中获得无细胞抽提物(cell-free extract),并从所述无细胞抽提物中分离和收集限制性内切酶MmeI。本发明进一步涉及生产由被鉴定为与MmeI同源的DNA序列编码的限制性内切酶的方法。这个方法包括培养含有编码这些限制性系统的基因的转化宿主,比如大肠杆菌,收集培养的细胞,从中获得无细胞抽提物,并从所述无细胞抽提物中分离和收集限制性内切酶。



图1-显示了MmeI剪切Lamda、T7、phiX174、pBR322和pUC19 DNA的琼脂糖凝胶。
图2-MmeI基因座的DNA序列(SEQ ID NO1)。
图3-MmeI基因座的氨基酸序列(SEQ ID NO2)。
图4-显示了MmeI剪切pTBMmeI.1DNA和未修饰DNA底物的琼脂糖凝胶。
图5-显示了MmeI剪切非甲基化、半甲基化和全甲基化的DNA底物的琼脂糖凝胶。
图6-将带标记的甲基整合到未甲基化、半甲基化和全甲基化的DNA底物中。
图7-MmeI氨基酸序列(SEQ ID NO3到SEQ ID NO14)和来自于公共数据库的同源多肽之间的多序列比对。
发明详述 本发明的内切酶的识别序列和剪切位点在以前已有过描述(Boyd,Nucleic Acids Res.145255-5274(1986))。然而,MmeI酶被证明从天然宿主嗜甲醇营养菌中的生产是困难的,这是由于这种酶的低产率以及嗜甲醇营养菌宿主相对比较难以大量培养。为了克服生产MmeI的这些限制,本申请描述了编码MmeI基因的DNA序列的鉴定,以及在合适的宿主——在本例中是大肠杆菌——中MmeI基因的表达。对编码MmeI的DNA片段的这种操作导致每克细胞所生产的酶的量的显著增加以及含有MmeI酶的大量细胞的生长的显著增加。
被克隆技术领域的技术人员经常采用的数种标准方法曾被应用于克隆MmeI,结果都没有获得成功。特别地,甲基化酶选择方法(Wilson等,美国专利号5,200,333)也没有试验成功。嗜甲醇营养菌DNA的数个随机文库已在大肠杆菌中被建立起来,并且经历了MmeI消化的考验,但是没有获得含有MmeI甲基化酶的克隆。
还尝试了另一种方法,但仍然失败了。在这种方法中,特异地针对N6mA的抗体被用于筛选在lamda噬菌体替换型载体中构建的随机克隆文库。这种方法成功地获得了甲基化酶的阳性克隆,但是所有的克隆经过验证之后都发现是在嗜甲醇营养菌中表达另外一个限制性系统的甲基转移酶,MmeII甲基化酶(识别序列为5’-GATC-3’),而不是所要的MmeI甲基化酶活性。
成功获得所需要的编码MmeI限制性系统的DNA片段的方法包括数个步骤。首先,一种新的纯化程序被发展出来以从嗜甲醇营养菌中纯化出同质的内切酶MmeI肽。一旦成功地获得了显著量的这种超纯的内切酶MmeI多肽,氨基端的氨基酸序列和内部溴化氰降解肽的氨基酸序列就可以被确定。利用所获得的氨基酸序列,互补于编码该氨基酸序列的DNA的简并DNA引物就可以被合成出来,并用于PCR扩增MmeI基因的一部分。这部分MmeI基因的DNA序列被测定。然后整个MmeI内切酶基因及其周围DNA序列可以通过应用反向PCR技术获得。与获得的DNA序列匹配的大量引物被设计、合成出来,并与大量不同的模板组合使用。反向PCR的模板是通过用各种限制性内切酶消化嗜甲醇营养菌基因组DNA,然后再将这些切开的嗜甲醇营养菌DNA在低浓度下连接以获得环状的分子而获得的。不同的引物尝试与不同的模板组合,以便找到能够产生特异性PCR扩增产物的引物-模板组合。将这样得到的产物进行测序。一旦编码整个内切酶MmeI基因的DNA序列被获得,就可以设计引物从嗜甲醇营养菌基因组DNA中特异性地扩增该基因。扩增后的基因被插入到一个表达载体中,再克隆到大肠杆菌宿主中。宿主经测试发现表达内切酶MmeI活性和在体内条件下修饰重组表达载体使得载体在体外条件下不被内切酶MmeI活性剪切。
编码内切酶MmeI的单个多肽也在体内条件下提供抵抗MmeI的保护这个发现与以前发表的关于MmeI的信息(Tucholski,Gene223293-302(1998))形成对比。特别地,这篇文献教导内切酶MmeI多肽不提供抵抗内切酶MmeI剪切的保护。这篇文献报道为了修饰两条链上的MmeI位点并由此阻止内切酶MmeI的剪切需要一个独立的48kD的甲基转移酶。特别地,该文献教导内切酶MmeI多肽只修饰识别序列上链(top strand)5’-TCCRAC-3’中的腺嘌呤,而这种被修饰的DNA会被内切酶MmeI剪切。本发明的DNA片段编码内切酶MmeI基因,当它单独在大肠杆菌宿主中生长的时候,可导致含有该内切酶MmeI的载体产生对纯化的内切酶MmeI的抗性。进一步,由这个片段产生的内切酶MmeI不剪切在上链5’TCCRAC-3’的腺嘌呤处有修饰而在反链或者下链(bottom strand)中都没有修饰存在的DNA片段。这个结果与Tucholski的文献中的教导相反。另外,本申请的内切酶MmeI不剪切其下链5’-GTYGGA-3’中的腺嘌呤残基被修饰的DNA片断,这也与Tucholski的文献中的教导相反。当上链和下链中腺嘌呤残基都被修饰时,内切酶MmeI不剪切该DNA。在该内切酶MmeI基因附近没有发现如Tucholski的文献中所报道的另一种甲基转移酶基因。在紧接着该内切酶MmeI基因的3’端的位置有一个开放阅读框,它所编码的蛋白的大小接近于所报道的第二甲基转移酶活性蛋白(48kD)。然而,这条潜在的多肽不具有在甲基转移酶中发现的氨基酸基序,而且在克隆进大肠杆菌后也不会提供抵抗内切酶MmeI的保护作用。虽然Tucholski的文献教导第二甲基转移酶多肽在保护宿主细胞免受内切酶MmeI活性影响中的必要性,但本申请表明编码内切酶MmeI多肽的DNA片段足可以提供这种保护作用。另外,在此所述的编码与MmeI相似的氨基酸序列的11个DNA片段两侧都没有可识别到的DNA甲基转移酶基因。这表明这些多肽本身也极有可能提供对宿主DNA的保护作用和对未修饰DNA底物的内切酶活性,而不需要别的甲基转移酶作为该限制性修饰系统的一部分。这与其它的II型限制性修饰系统形成对比。
同一研究组(Tucholski,Gene 223293-302(1998)和Anna Podhajska,私人交流)之前报道过单个内部溴化氰消化片段的8个残基的氨基酸序列(序列GRGRGVGV(SEQ ID NO50))。基于这段序列的PCR被尝试,然而失败了。在根据本发明确定了真实的MmeI氨基酸序列之后,发现上述序列与MemI没有关系。因此,使得MmeI基因得以克隆的内部氨基酸序列的正确测定依赖于本申请中描述的新的纯化方法,其中可以生产出足够量的足够纯的MmeI以便确定溴化氰消化的内部片段氨基酸序列,如在本申请中所实施的。
在实施例II中,我们通过培养带有MmeI基因的转化宿主,比如携带pTBMmeI.1的大肠杆菌ER2683,并从这些细胞中回收内切酶来获得MmeI。携带有pTBMmeI.1的大肠杆菌ER2683样品(NEB#1457)已经在布达佩斯条约的条款和条件下于2002年7月3日保藏于美国典型培养物保藏中心(ATCC),其相应的专利注册号(the Patent AccessionNo.)是PTA-4521。
为了回收本发明的酶,携带有pTBMmeI.1的大肠杆菌(NEB#1457)可以使用任何合适的技术来培养。比如,携带有pTBMmeI.1的大肠杆菌可以在含有100μg/ml氨苄青霉素的Luria broth培养基中,37℃通风有氧培养。处于对数生长期晚期的细胞通过加入0.3mM的IPTG进行诱导,继续生长4个小时,离心收集,然后立即破碎细胞或者于-70℃冷冻保存。
MmeI酶可以通过传统的蛋白纯化技术从携带有pTBMmeI.1的大肠杆菌中分离出来。比如,可以将细胞沉积物在缓冲液中重悬,然后再通过超声、高压分散或者酶消化来处理,使得内切酶被提取到缓冲溶液中。完整的细胞和细胞碎片然后通过离心除去,得到含有MmeI的无细胞抽提物。然后,伴随有其相应的内源性甲基化酶活性的内切酶MmeI通过离子交换层析、亲合层析、分子筛层析或者这些方法的组合从无细胞抽提物中纯化出来以生产出本发明的内切酶。
本发明还涉及鉴定其它的DNA片段的方法,其中每个片段都编码具有与MmeI多肽显著的氨基酸序列相似性的多肽。由这些DNA片段编码的多肽被预测执行与MmeI相似的功能。特别地,它们被预测具有双重酶功能,既在距离特定识别序列相对远的位置处以特定的方式剪切DNA,又修饰它们的识别序列以保护宿主DNA免受它们的内切酶活性的攻击。一旦内切酶MmeI的氨基酸序列根据本申请中描述的方法被确定出来,存储在数据库中的序列可以与该MmeI序列相比较,从而找出那些与MmeI极为显著相似的序列。这种方法与美国专利6,383,770(Roberts等)中描述的方法有些类似,不同的是在这里我们是寻找与内切酶MmeI序列的相似性,而不是寻找与甲基转移酶或内切酶蛋白数据库匹配的序列,然后在潜在的甲基转移酶开放阅读框的附近检查没有被鉴定出的开放阅读框。在鉴定出MmeI的氨基酸序列之前,编码与MmeI相关的蛋白的DNA序列还没有被包含在Roberts等如上所用的限制性和甲基转移酶基因序列数据库中,因为这些序列还没有联系到任何已知的内切酶功能上。在此公开的鉴定潜在MmeI样内切酶的方法因此要比美国专利6,383,770(Roberts等)中的方法更加具有特异性。
在数据库如GENBANK中对可获得的序列进行MmeI序列的相似性搜索是利用程序如BLAST(Altschul等.Nucleic Acids Res.253389-3402(1997))完成的。期望值(expectation value,E)分数低于E=e-10的序列被认为是潜在的内切酶候选者。期望值低得更多,比如低于E=e-30的序列被认为极有可能是类似于MmeI的内切酶。这些候选MmeI样肽被进一步检验以确认它们是否符合MmeI所表现出来的结构域组成。一个真正的候选者将会含有一个内切酶折叠基序,常常是以(D/E)X8~X12(D/E)XK的形式出现在肽的氨基端部分(Aravind等,Nucleic Acids Res.283417-3432(2000))。一个真正的候选者将会在肽的中间部分含有与γ类N6甲基腺嘌呤甲基转移酶类似的甲基转移酶基序,而且在候选肽的羧基端部分含有与MmeI的羧基端部分相似的序列。这样的BLAST搜索是在2003年6月12日进行的,返回的如下序列与MmeI高度相似
这些蛋白中的大多数在它们的数据库记录中被标记为假想(hypothetical)蛋白或者推定的(putative)蛋白。其中有许多似乎是全长的多肽,比如上面的序列#2GcrY。这些候选蛋白可以按照Roberts描述的方法来表达以鉴定期望的内切酶活性。一些内切酶基因在用于测序的特定菌株中可能是没有活性的(Lin等,Proc.Natl.Acad.Sci.USA982740-2745(2001))。在这样的情况下,通过修复导致这些基因失活的突变来表达功能性的内切酶被证明是可能的。MmeI的数个同源物,比如#7(SEQ ID NO14)(耐放射异常球菌(Deinococcus radiodurans)DR2267)和#8(SEQ ID NO13)(耐放射异常球菌DR0119.1),在它们的开放阅读框架中都有缺陷。DR2267在MmeI上由密码子GAG编码谷氨酸的位置处含有一个终止密码子TAG,它可以过早地终止该开放阅读框架。通过将这个TAG终止密码子改变成GAG,则有可能会重新激活这个潜在的内切酶基因。DR0119.1也是有缺陷的,因为它出现了框架漂移(frameshift),这使得开放阅读框架被破坏。通过使DR0119.1序列和MmeI序列之间的相似性最大化,可以将MmeI序列用作指导修复这种框架漂移的指南。这样可能会很好地恢复DR0119.1内切酶的活性。
另外一种产生新的潜在内切酶的方法是通过进行结构域交换(domain swapping)来利用它们之间相似的结构域。可以将MmeI蛋白的氨基端结构域与一种MmeI样肽的氨基端结构域交换,比如将新的潜在基因中直至第一个甲基转移酶基序(基序X,“GlyAla His TyrThr Ser”)的序列与MmeI中直至同一序列的这一部分交换。当只能获得部分的序列或者潜在基因已经由于多个突变而丧失了功能时,这种方法非常有效。这种方法会产生一个嵌合蛋白,这个蛋白可能具有内切酶活性并在距离识别序列一定距离的位置剪切DNA,就像MmeI一样,但是它识别的序列是新的DNA序列。也可能在数据库中发现有的序列虽然与MmeI相比具有高度的相似性,但却是不完全的序列。比如,上述的序列#11(SEQ ID NO9)(荧光假单胞菌(Pseudomonasfluorescens))就是来自于数据库中的DNA序列的一个小片段。为了由这个序列获得像MmeI一样有功能性的内切酶,可以用反向PCR或者其他技术获得与报道的片段相邻的DNA序列,然后用该序列获得完整的内切酶基因。
一旦序列被鉴定出来,潜在的内切酶就可以被表达并按照Roberts等如上描述的方法鉴定其特征。然而,在这里没有另外独立的甲基转移酶基因与该内切酶一起表达。一旦这样一个潜在的内切酶被克隆并在合适的宿主比如大肠杆菌中表达,那么无细胞抽提物可以被制备出来并被分析以检测任何内切酶活性。这样一个内切酶分析必须包括这些内切酶所需要的辅助因子SAM。一旦发现有特异性的DNA剪切活性,则识别序列和剪切位点就可以通过标准方法来确定(Schildkraut,(1984)在Genet.Eng.(NY)第6卷,(Setlow J.K.,Hollaender,A.Ed.).117-140页,Plenum Press,New York.“Screening for and Characterizingrestriction endonuclease.”)。
这样确定的酶可以通过传统的蛋白纯化技术从携带含有DNA片段的合适载体的大肠杆菌细胞中分离出来。例如,细胞沉积物可以在缓冲液中重悬,然后再通过超声、高压分散或者酶消化来处理,以使内切酶被提取到缓冲溶液中。完整的细胞和细胞碎片然后通过离心除去,得到含有所述酶的无细胞抽提物。所述内切酶,伴随着它对应的内源性甲基化酶活性,然后通过离子交换层析、亲合层析、分子筛层析或者这些方法的组合从无细胞抽提物中纯化出来以生产出本发明中的内切酶。
这些DNA片段以及其它的将会在以后提交到数据库中的与MmeI具有这样的相似性的片段,都被预测编码与MmeI类似的多肽,因为这些被编码的多肽同时作为限制性内切酶和甲基转移酶。类似于MmeI,这些多肽可以在距离识别序列类似远的位置处剪切DNA,范围是大约18到20个核苷酸或者更长,这种特性是独特的而且在某些分子生物学技术中是有用的。
根据这种方法鉴定出来的这样的酶的一个实例是CstMI(参见序列号为______美国专利申请,与本申请同时提交)。因为与MmeI高度显著的氨基酸序列相似性,CstMI被确定是一种潜在的内切酶。CstMI由上述序列#2(SEQ ID NO8)编码,这个序列在用BLAST与MmeI比对的时候给出了高度显著的期望值e-171。CstMI识别6个碱基对的非对称序列5’-AAGGAG-3’,而且剪切DNA的方式和MmeI一样它剪切位于这个识别序列3’侧第20和第21个残基之间的磷酸二酯键,以及互补链上的识别序列5’-CTCCTT-3’的5’侧第18和19个残基之间的磷酸二酯键,由此产生一个有两个碱基的3’粘末端。
本发明通过下面的实施例来进一步说明。提供这些实施例是用来帮助理解本发明,而并不作为本发明的限制。
以上和以下引用的文献都在此引入作为参考。
实施例1 内切酶MmeI的纯化 嗜甲醇营养菌(NEB#1190)的单个克隆在1升培养基M(0.08μMCuSO4、0.448μM MnSO4、0.348μM ZnSO4、6.0μM FeCl3、18μM CaCO3、1.6mM MgSO4、9.0mM NaH2PO4、10.9mM K2HPO4、13.6mM(NH4)2SO4)中生长24个小时。使用该培养物接种到100升的培养基M中。这些细胞在有氧条件下37℃过夜培养直至进入稳定期。用5份100升的发酵液收集到752克的湿细胞沉淀。
将750克嗜甲醇营养菌细胞沉淀悬浮在2.25升缓冲液A(20mMTris-HCl(pH 8.0)、50mM NaCl、1.0mM DTT、0.1mM EDTA、5%甘油)中,然后以大约12000psig通过Gaulin匀浆机,裂解物于13000×G离心40分钟后收集上清。
将上清溶液加到已经用缓冲液A平衡的500ml Heparin Hyper-D柱(Biosepra SA)上。用1升缓冲液A清洗柱子,然后将2升的NaCl浓度梯度为0.05M到1M的缓冲液A加到柱子上并收集分离级分。对级分进行MmeI内切酶活性的分析在补充有32μM的S-腺苷-L-甲硫氨酸(SAM)的50μl NEBufferl中与1μg的Lamda DNA(NEB)于37℃温育15分钟。MmeI活性是在0.3M到0.4M NaCl之间被洗脱下来。
含有MmeI活性的Heparin Hyper-D柱分离级分被汇集到一起,用(不含有NaCl的)缓冲液A稀释到50mM NaCl浓度,然后上样到105ml的已经用缓冲液A平衡好的Source15Q柱(Amersham Biotech)上。用210ml的缓冲液A清洗柱子,再用1升的NaCl浓度梯度为0.05M到0.7M的缓冲液A加到柱子上进行洗脱。级分被收集,并分析MmeI的内切酶活性。MmeI活性在未被结合的级分中被发现。
将Source15Q的汇集物加载到22ml的已经用缓冲液A平衡好的AF-Heparin-TSK柱(TosoHaas)上。用44ml的缓冲液A清洗柱子之后,接着用NaCl浓度梯度从0.05M到1M的缓冲液A线性洗脱。各级分被收集并分析内切酶MmeI的活性。MmeI活性在NaCl浓度为0.26M到0.29M之间被洗脱下来。这些含有活性的级分被汇集到一起,然后用缓冲液B(20mM NaPO4(pH 7.0)、50mM NaCl、1.0mM DTT、0.1mMEDTA、5%甘油)中透析。
经过透析的AF-Heparin-TSK汇集物被加载到已经用缓冲液B平衡好的6ml的Resource15 S柱(Amersham Biotech)上。用12ml缓冲液B清洗柱子之后,再用NaCl浓度梯度从0.05M到1M的缓冲液B线性洗脱。各级分被收集并分析内切酶MmeI的活性。MmeI活性在NaCl浓度0.14M和0.17M之间被洗脱下来。
这样洗脱下来的汇集级分被上样到已经用缓冲液C(20mMTris-HCl,pH 8.0、500mM NaCl、1.0mM DTT、0.1mM EDTA、5%甘油)平衡好的2升的Superdex 75大小分离柱(Amersham Biotech)上。用缓冲液C洗脱出的500ml和1500ml之间的洗脱级分被收集起来,然后通过Mme内切酶分析进行分析,在4-20%梯度胶上进行聚丙烯酰氨凝胶电泳,然后再用考马斯亮兰对蛋白质染色。在775ml到825ml之间洗脱出的级分对应于MmeI活性,对应的蛋白条带是105kDa。这些级分被汇集在一起,然后用缓冲液D(20mM NaPO4(pH7.0)、50mM NaCl、1mM DTT、5%甘油)进行透析。
透析之后的分离级分被上样到已经用缓冲液D平衡好的CeramicHTP柱(BioRad)上。用32ml缓冲液D清洗之后,再用NaPO4浓度梯度从0.02M到1M的缓冲液D线性洗脱。收集各级分并分析Mme内切酶活性,在4-20%的梯度胶上进行聚丙烯酰氨凝胶电泳,然后再用考马斯亮兰对蛋白质染色。MmeI在NaPO4浓度为0.26M和0.3M之间被洗脱下来。含有105kDa的单个同质的蛋白条带的数个级分中的一部分被用于蛋白质测序。剩下的纯化的MmeI级分被汇集到一起(6ml,浓度为0.36mg/ml),然后用保存缓冲液(10mM Tris(pH 7.9)、50mMKCl、1mM DTT、0.1mM EDTA、50%甘油)透析。纯化后的MmeI酶在-20℃保存。
活性测定 将1-4μl的样品加到50μl由1×NEBuffer 1、32μM的S-腺苷-L-甲硫氨酸和1μg的DNA(Lamda、PhiX174或者pUC19DNA)组成的底物溶液中。反应在37℃进行15分钟,然后加入20μl终止溶液,用1%琼脂糖凝胶电泳分析结果。
优化内切酶活性 从嗜甲醇营养菌中纯化出MmeI之后,进行实验以确定DNA剪切的最优反应条件。发现内切酶活性会由于反应缓冲液中钾离子的存在而大大增强。反应条件从4℃变化到37℃和从5分钟变化到60分钟都没有明显地改变剪切DNA的量。为了达到最大程度的剪切,要求酶浓度与DNA位点在化学计量上相等或接近。大大过量的酶会阻断剪切的发生。这些发现被用于重新评估MmeI的活性和定义可行的内切酶单位。
单位定义 一个单位(one unit)的MmeI被定义为在15分钟内在补充有80μM的S-腺苷-L-甲硫氨酸(SAM)的NEBuffer 4(20mM Tris-乙酸盐、10mM乙酸镁、50mM乙酸钾、1mM二硫苏糖醇(在25℃时pH 7.9))中于37℃完全剪切1μg的PhiX174DNA所需要的用量。
实施例II MmeI内切酶的克隆 1.DNA纯化制备嗜甲醇营养菌的总基因组DNA。5克的沉积细胞悬浮在20ml的25%蔗糖、0.05M Tris-HCl pH8.0中,其中还加入10ml的0.25M的EDTA,pH8.0。然后加入6ml的溶菌酶溶液(10mg/ml溶菌酶在0.25M的Tris-HCl中,pH8.0),之后细胞悬浮液在4℃放置16个小时。接着25ml的裂解混合物(1%Triton-X100、0.05M Tris、62mMEDTA,pH8.0)和5ml的10%SDS被加入,然后在37℃放置5分钟。接着用一倍体积的平衡酚∶氯仿∶异戊醇(50∶48∶2,v/v/v)提取该溶液,回收水相,再用一倍体积的氯仿∶异戊醇(24∶1,v/v)提取两次。将得到的水溶液用2升的10mM Tris、1mM EDTA,pH8.0的溶液透析四次。透析过的DNA溶液用RNase(100μg/ml)在37℃消化1小时。加入1/10体积的5M NaCl和0.55个体积的2-丙醇让DNA沉淀,并缠绕在玻璃棒上。用70%乙醇简单润洗DNA之后,简单地进行空气干燥,然后溶解在20ml的TE缓冲液(10mM Tris、1mM EDTA,pH8.0),浓度至大约500μg/ml,4℃保存。
2.MmeI内切酶按照上述实施例1中描述的方法纯化到同质。
3.MmeI内切酶的氨基酸序列是针对MmeI多肽的氨基端和数段内部溴化氰消化产物获得的。对按照上述实施例1中描述的方法制备的MmeI限制性内切酶进行电泳分析,然后根据Matsudaira(Matsudaira.J.Biol.Chem.26210035-10038,1987)的程序进行电印迹,其中按照已有的描述做了一定的修改(Looney等,Gene 80193-208(1989))。然后用考马斯亮兰R-250染膜,将大约105kD的蛋白条带切下来,然后在一台带有气相传递的ABI Procise 494Protein/Peptide Sequencer上进行有序的降解(Waite-Rees等,J.Bacteriol.1735207-5219(1991))。头14个氨基端残基的氨基酸序列被获得,如下ALSWNEIRRKAIEF(SEQID NO15)。
MmeI内切酶的另外一个样品-20μl中有20μg-用溶解在200μl 88%蒸馏甲酸中的2μg溴化氰(Sigma)在室温于黑暗处处理24个小时。这个反应混合物被蒸发至干,然后重新悬浮在20μl的上样缓冲液(1.5M Tris-HCl,pH8.5、12%甘油、4%SDS、0.05%Serva Blue G、0.05%酚红)中,100℃保持5分钟。这个样品在Tris-Tricine系统中的10到20%聚丙烯酰氨梯度凝胶(Invitrogen)上进行3个小时的电泳,然后再用10mM CAPS缓冲液(10mM 3-[环己胺基]-1-丙磺酸、10%甲醇、0.05%SDS、0.005%二硫苏糖醇,用NaOH调节pH至11.0)将蛋白转移到聚偏二氟乙烯(PVDF)膜(Problott,Applied Biosystems Inc.),转移是在用槽式电转仪(TE52,Hoeffer)在200伏特转移18小时完成的。用考马斯亮兰R-250染膜,观察到的主要条带是25kD、14kD、7.5kD和6kD,以及一些更小的条带。这些被染上的蛋白条带从膜上被切下来,然后进行渐次降解。这些不是氨基端片断的片断是来自于溴化氰在蛋白内甲硫氨酸残基位置处的剪切,因此其前面应该有甲硫氨酸。25kD的肽的前29个残基序列为 (M)KISDEFGNYFARIPLKSTXXIXEXNALQ(SEQ ID NO16)。标记成X的残基20、21、23和25是没有被鉴定出的残基。14kD片段的前40个氨基酸残基序列为 (M)DAKKRRNLGAHYTSEANILKLIKPLLLDELWVVFXKVKN(SEQID NO17)。第36号残基没有鉴定出来。7.5kD肽的前25个残基的序列对应为(M)KSRGKDLDKAYDQALDYFSGIAER(SEQ ID NO18)。6kD片段被发现含有三个序列的混合物。
4.扩增MmeI内切酶的一部分从氨基端肽、25kD、14kD和7.5kD肽获得的肽段序列信息被用于构建一系列对应于氨基酸残基密码子的简并PCR引物。这些内部肽片断的顺序是未知的,因此针对这些片段都制备了正向(正义链)和反向(反义链)引物,这些引物是 25kD片段残基DEFGNYFA(SEQ ID NO19) 正向 1)5’-GARTTYGGNAAYTAYTTYGC-3’(SEQ ID NO20) 反向 2)5’-AARTARTTNCCRAAYTCRTC-3’(SEQ ID NO21) 14kD片段残基MDAKKR(SEQ ID NO22) 正向A 3)5’-ATGGAYGCNAARAARCG-3’(SEQ ID NO23) 正向B 4)5’-ATGGAYGCNAARAARAG-3’(SEQ ID NO24) 反向 5)5’-CGNCGYTTYTTNGCRTCCAT-3’(SEQ ID NO25) 7.5kD片段残基DKAYDQA(SEQ ID NO26) 正向 6)5’-GAYAARGCNTAYGAYCARGC-3’(SEQ ID NO27) 反向 7)5’-GCYTGRTCRTANGCYTTRTC-3’(SEQ ID NO28) 其中 Y=T、C R=A、G H=A、T、C S=G、C N=A、C、G、T 引物1和2源自MmeI的25kD的CNBr肽段,准备导引基因的正义链(1)或者反义链(2)。引物3到5源自MmeI的14kD的CNBr肽段,准备导引基因的正义链(3和4)或者反义链(5),其中引物3和4在精氨酸残基的密码子使用上有所不同。引物6和7源自MmeI的7.5kD的CNBr肽段,准备导引基因的正义链(6)或者反义链(7)。
PCR扩增反应采用引物组合1和5、1和7、3和2、3和7、4和2、4和7、6和2、以及6和7来进行。MmeI基因的一部分可以在PCR反应中被扩增出来,反应溶液包括 80μl 10×Thermopol缓冲液(NEB) 50μl 4mM dNTP溶液(NEB) 4μl MmeI基因组DNA(500μg/ml储液) 16μl 100mM MgSO4 586μl dH2O 16μl(32个单位)

exo-DNA聚合酶(NEB) 上述混合溶液被分成每份90μl的8个等份,然后往每个等份中加入5μl的正向引物(10μM储液)和5μl的反向引物(10μM储液)。反应循环参数为95℃3分钟,一个循环;然后95℃30秒,46℃30秒,72℃2分钟,25个循环。
扩增反应的产物在1%的琼脂糖凝胶上电泳分离并分析。获得的主要的DNA扩增产物是450个碱基对(bp)(引物2和4)、650bp(引物5和6)和1100bp(引物2和6)的片段。这些片段的大小与7.5kD的CnBr降解片段位于最靠近蛋白氨基端的位置并距离14kD的CnBr片段大约650bp,14kD片段位于7.5kD片段和25kD片段中间而且邻近25kD片段相一致。这些扩增出来的DNA片段经过胶纯化,并利用用于扩增的引物进行测序。获得的DNA序列的翻译与来自于纯化的MmeI内切酶的氨基酸序列匹配,这表明MmeI内切酶基因DNA序列的一部分已经被成功获得了。
5.测定整个MmeI基因和邻近DNA的DNA序列利用反向PCR技术从上面得到的1060bp的MmeI基因片段的两端出发延伸DNA序列。为了达到这个目的,一系列与MmeI基因DNA序列匹配并用于反向PCR的引物被设计和合成出来。MmeI基因组DNA用一系列限制性内切酶剪切之后,在低浓度条件下连接形成环状的DNA模板。
A.MmeI基因组DNA用10种不同的限制性内切酶消化,然后环状连接以获得可以利用反向PCR技术来扩增的DNA模板。使用的限制性酶是 BspHI(T/CATGA) EcoRI(G/AATTC) HindIII(A/AGCTT) HinP1I(G/CGC) MspI(C/CGG) NlaIII(CATG/) PstI(CTGCA/G) SacI(GAGCT/C) SphI(GCATG/C) XbaI(T/CTAGA) 为了进行限制性内切酶消化,将下列试剂组合 5μl 10×为不同酶所推荐的NEBuffer(随着酶改变) 2μl嗜甲醇营养菌基因组DNA(1μg) 43μl dH2O 1μl(10~20单位)限制性酶。
反应在37℃温浴1个小时。将反应加热到65℃(对于PstI是80℃)持续20分钟使限制性内切酶失活。被消化的DNA通过加入50μl的10×T4DNA连接酶缓冲液、400μd dH2O和3μl浓的T4DNA连接酶(6000单位,新英格兰生物实验室公司)并在16℃温浴16小时而被连接成环状的片段。连接后的DNA用酚和氯仿提取,再用2-丙醇沉淀,之后重悬在100μl TE缓冲液中。
B.扩增与MmeI内切酶基因的1060bp片段邻近的DNA两对PCR引物被设计出来,一对分别靠近用简并引物直接PCR出来的1060bp序列的两端。这些引物序列是 引物IP1 5’-GTTGGATCCCGCACAGATTGCTCAGG-3’(SEQ ID NO29) 引物IP2 5’-GTTGGATCCTACGTTAATCTGAATAAGATG-3’(SEQ IDNO30) 引物IP3 5’-GTTGGATCCTGTTAATCTGAAACGCTGG-3’(SEQ IDNO31) 引物IP4 5’-GTTGGATCCTTATACCAAAATGTGAGGTC-3’(SEQ IDNO32)。
反向PCR反应是利用引物对IP1和IP2、IP3和IP4、以及IP1和IP3,以上述10种环状模板为模板进行的。为了进行扩增反应,将下列试剂组合 80μl 10×Thermopol缓冲液(NEB) 50μl 4mM dNTP溶液(NEB) 40μl IP引物(正向) 40μl IP引物(反向) 16μl 100mM MgSO4 534μl dH2O 16μl(32个单位)

exo-DNA聚合酶(NEB) 上述混合液被分装成10管,每管76μl,然后再往每管中加入4μl经过适当消化并环状连接的模板。反应循环参数为95℃3分钟,一个循环,然后95℃30秒,56℃30秒,72℃3分钟,25个循环。扩增产物用琼脂糖凝胶电泳分析。
对于引物IP1和IP2与SphI模板和NlaIII模板,得到的扩增产物大约是825bp。对于引物IP3和IP4与BspHI模板,得到的产物大约是800bp。对于引物IP1和IP3与EcoRI模板,得到的产物大约是1500bp。这些扩增得到的DNA片段经过胶纯化,测序,并与前面得到的序列组装。组装后的序列并不含有完整的MmeI内切酶开放阅读框。这个组装后的序列被用于指导第二轮反向PCR引物对的合成。这些引物的序列是 引物IP5 5’-TTCAGAAATACGAGCGATGC-3’(SEQ ID NO33) 引物IP6 5’-GTCAAGCCATAAACACCATC-3’(SEQ ID NO34) 引物IP7 5’-GAGGGTCAGAAAGGAAGCTG-3’(SEQ ID NO35) 引物IP8 5’-GTCCAACTAACCCTTTATGG-3’(SEQ ID NO36)。
反向PCR扩增反应按照上述条件进行。采用引物IP5和IP6,可以从NlaIII模板(大约450bp)和MspI模板(大约725bp)得到产物,但不能从其它环状连接模板得到产物。采用引物IP7和IP8,可以从EcoRI模板(大约500bp)、SphI模板(大约825bp)和BspHI模板(大约750bp)得到产物。这些DNA片段被测序,然后再与前面得到的序列组装。组装后的序列依然不含有完整的MmeI内切酶开放阅读框,因此要进行又一轮引物合成和反向PCR。额外的DNA模板按照上述方法获得,但是是用限制性酶ApoI(R/AATTY)、AseI(AT/TAAT)、BsaHI(GR/CGYC)、MfeI(C/AATTG)、SspI(AAT/ATT)和EcoRV(GAT/ATC)来消化嗜甲醇营养菌基因组DNA。第三轮中的引物的序列是 引物IP9 5’-TTCCTAGTGCTGAACCTTTG-3’(SEQ ID NO37) 引物IP10 5’-GTTGCGTTACTTGAAATGAC-3’(SEQ ID NO38) 引物IP11 5’-CCAAAATGGAACTTGTTTCG-3’(SEQ ID NO39) 引物IP12 5’-GTGAGTGCGCCCTGAATTAG-3’(SEQ ID NO40)。
反向PCR扩增反应如上所述地进行。采用引物IP9和IP10,可以从NlaIII模板(大约425bp)、MfeI模板(大约750bp)、ApoI模板(大约800bp)和MspI模板(大约2100bp)得到产物。采用引物IP11和IP12,可以从SphI模板(大约875bp)、BspHI模板(大约925bp)和EcoRI模板(大约950bp)得到产物。这些DNA片段被测序,然后再与前面获得的序列组装。利用如下三个额外的引物,进一步对IP9、IP10的MspI 2100bp产物进行测序 引物S1 5’-GCTTCATTTCATCCTCTGTGC-3’(SEQ ID NO41) 引物S2 5’-TAACCGCCAAAATTAATCGTG-3’(SEQ ID NO42) 引物S3 5’-CCACTATTCATTACAACACC-3’(SEQ ID NO43)。
最终组装成的序列(图2)含有完整的MmeI限制性内切酶基因,还包括基因上游1640bp的序列以及基因下游1610bp的序列。
6.在大肠杆菌中克隆MmeI内切酶基因推定的MmeI内切酶开放阅读框从由各反向PCR扩增出的DNA片段序列组装而获得的DNA序列中鉴定出来。开放阅读框的起始位点是基于预测的开放阅读框氨基端氨基酸序列与由MmeI内切酶蛋白确定的序列的匹配而鉴定出来的。预测的开放阅读框末端能够保证编码大约105kD的多肽,这与观察到的天然MmeI内切酶大小一致。从这个开放阅读框翻译得到的氨基酸序列含有N6mA DNA甲基转移酶的保守序列基序。然而,在邻近MmeI内切酶基因的区域没有发现含有在DNA甲基转移酶中保守的序列基序的开放阅读框,这与预测的结果是一致的。因此决定在没有另一个甲基转移酶存在以保护大肠杆菌宿主DNA免受剪切的情况下,在大肠杆菌中尝试表达MmeI内切酶。寡聚核苷酸引物被合成出来以特异性地从嗜甲醇营养菌基因组DNA中扩增出MmeI基因,使得它可以用克隆载体pRRS(Skoglund,Gene 881-5(1990))表达。正向引物含有方便克隆的PstI位点、与载体的lacZ基因处于同一阅读框的终止密码子、保守的大肠杆菌核糖体结合位点、ATG翻译起始位点(修改了嗜甲醇营养菌使用的GTG,这是为了在大肠杆菌中更好地表达),以及与嗜甲醇营养菌DNA序列匹配的20个核苷酸 5’-GTTCTGCAGTTAAGGATAACATATGGCTTTAAGCTGGAACGAG-3’(SEQ ID NO44)。
反向引物含有方便克隆的BamHI位点,以及与MmeI开放阅读框末端3’侧的嗜甲醇营养菌DNA序列匹配的22个核苷酸 5’-GTTGGATCCGTCGACATTAATTAATTTTTGCCCTTAG-3’(SEQ IDNO45)。
为了在PCR反应中扩增MmeI基因,将下列试剂组合 50μl 10×Thermopol缓冲液(NEB) 30μl 4mM dNTP溶液(NEB) 12.5μl正向引物(10μM储液) 12.5μl反向引物(10μM储液) 5μl MmeI基因组DNA(500μg/mI储液) 387μl dH2O 3μl(6个单位)

DNA聚合酶 反应溶液混合后分装到5个管中,每管80μl。将MgSO4(100mM储液)分别加入到各管使得终浓度分别为2mM、3mM、4mM、5mM和6mM。反应循环参数为95℃30秒,60℃30秒,72℃3分钟,24个循环。反应产物用凝胶电泳分析,结果发现Mg++浓度为3mM到6mM时的反应得到了所要的2.8kb的DNA条带。这些反应产物被汇集到一起,2.8kb的条带被胶纯化。2.8kb的MmeI基因扩增片段用BamHI和PstI内切酶(NEB)降解,条件如下 15μl 10×BamHI反应缓冲液(NEB) 1.5μl BSA(NEB) 50μl MmeI基因的2.8kb扩增DNA片段 80μl dH2O 5μl BamHI内切酶(100单位) 5μl PstI内切酶(100单位) 反应液混合之后在37℃温浴1小时。按照制造商提供的说明通过Qiagen的QiaPrep spin column进行纯化,将从2.8kb的DNA片段末端剪切下来的小片段和内切酶去除。
剪切后的MmeI基因DNA片段按照如下的程序被连接到pRRS载体中10μl经过消化、纯化的2.8kb MmeI片段与5μl事先用BamHI和PstI剪切并纯化过的pRRS载体混合,加入5μl的dH2O、20μl的2×QuickLigase缓冲液(NEB),混合,再加入2μl的QuickLigase。反应在室温温育5分钟。将5μl的连接反应产物转化到50μl的大肠杆菌ER2683化学感受态细胞中,将这些细胞涂在含有100μg/ml氨苄青霉素的L-broth平板上,37℃温育过夜。结果得到大约200个转化子,挑出18个代表性转化子进行如下分析来自每个克隆的质粒通过小量制备程序被分离出来,接着用AlwNI和NdeI内切酶消化以确定它们是否含有正确大小的插入片段。18个转化子中有2个具有正确大小的插入片段,大约是2800bp。两个克隆都被测试是否产生MmeI内切酶活性。这些克隆在500ml含有100μg/ml氨苄青霉素的L-broth培养基中37℃过夜培养。细胞通过离心收集,悬浮在10mL超声缓冲液(20mMTris-HCl、1mM DTT、0.1mM EDTA,pH7.5)中用超声破碎细胞。粗裂解物通过离心使之澄清,回收上清。裂解液被用来检测内切酶活性,将裂解液用含有20μg/ml Lamda DNA底物并补充有终浓度为100μM的SAM的1×反应缓冲液NEBufferl(新英格兰生物实验室)进行一系列稀释。反应在37℃温浴1小时。反应产物用1%的琼脂糖凝胶和1×TBE缓冲液通过琼脂糖凝胶电泳分析。两个克隆中有1个具有MmeI内切酶活性。这个有活性的克隆被标记为菌株NEB1457,可用于后续的MmeI生产。该克隆中表达MmeI活性的质粒构建物被标记为pTBMmeI.1。
实施例III MmeI内切酶在体内条件下提供抗MmeI剪切的保护作用 质粒pTBMmeI.1通过Qiagen的小量制备(miniprep)程序从NEB1457中纯化出来。这个质粒在载体骨架中具有两个MmeI位点,在MmeI基因中也有一个MmeI位点。质粒用MmeI消化以检测这段DNA是否对MmeI内切酶活性具有抗性,这种抗性意味着单个MmeI基因可以在体内条件下甲基化DNA以保护宿主DNA免受内切酶活性的影响。为了检测将下列试剂混合 10μl pTBMmeI.1 miniprep DNA 15μl 10×NEBuffer4 15μl SAM(1mM储液) 110μl dH2O 1μl MmeI内切酶(15单位)。
反应液混合之后分成三份。往第一个三分之一反应液中加入0.5μl水,往第二个三分之一反应液中加入0.5μl pRRS载体,往第三个三分之一反应液中加入0.5μl PhiX174DNA作为阳性对照。pTBMmeI.1不被MmeI内切酶活性剪切,而同在一个反应体系中的PhiX174和pRRSDNA都被剪切,这表明pTBMmeI.1DNA中的三个MmeI位点对MmeI内切酶活性都具有抗性。
实施例IV MmeI内切酶对甲基化的灵敏性 现有技术的文献报道MmeI内切酶只甲基化其识别序列中的一条链,并且认为这种半甲基化并不能阻止该内切酶继而对该DNA的剪切(Tucholski,Gene 223(1998)293-302)。为了测试这一点,四种寡聚核苷酸被合成出来,从而得到两条链都没有甲基化(寡聚物1+寡聚物2)、只有上链被甲基化(寡聚物3+寡聚物2)、只有下链被甲基化(寡聚物1+寡聚物4),或者两条链都被甲基化(寡聚物3+寡聚物4)的DNA底物。这些合成的寡聚核苷酸如下 寡聚物1 5’-FAM-GTTTGAAGACTCCGACGCGATGGCCAGCGATCGGCGCCTCAGCTTTTG-3’(SEQ ID NO46) 寡聚物2 5’-FAM-CAAAAGCTGAGGCGCCGATCGCTGGCCATCGCGTCGGAGTCTTCAAAC-3’(SEQ ID NO47) 寡聚物3 5’-FAM-GTTTGAAGACTCCG(6mA) CGCGATGGCCAGCGATCGGCGCCTCAGCTTTTG-3’(SEQ IDNO48) 寡聚物4 5’-FAM-CAAAAGCTGAGGCGCCGATCGCTGGCCATCGCGTCGG(6mA)GTCTTCAAAC-3’(SEQ ID NO49)。
(MmeI识别序列以外的其它核苷酸也在其它研究中被甲基化,但由于MmeI对于这些核苷酸没有任何序列特异性,因此确实可能影响MmeI活性的才表示出来,而其它甲基化为了简明起见而在这里略去)。双链DNA是通过将100μl上链寡聚核苷酸(14μm储液)和100μl下链寡聚核苷酸(14μm储液)混合,加热到85℃然后经20分钟缓慢冷却到30℃而形成的。然后使用MmeI在30μl的反应中剪切寡聚核苷酸对,反应体积中包括1×NEBuffer4、2.5μM寡聚核苷酸、100μM的SAM和2.5单位的MmeI。作为对照,限制性内切酶Hpy188I也被用于剪切所述寡聚DNA。Hpy188I的识别序列覆盖了这段DNA中MmeI识别序列的前5个核苷酸,5’-TCNGA-3’,而且Hpy188I的活性会被这段DNA中任一条链上的腺嘌呤甲基化所阻断。结果发现MmeI按照预想的一样剪切没有甲基化的DNA。与以前的教导(Tucholski,Gene 223293-302(1998))相反,MmeI并不剪切只有上链被甲基化的半甲基化DNA5’-TCCG(N6Ma)C-3’。当只有下链被甲基化的时候,MmeI确实会剪切该DNA。当两条链都被甲基化的时候,MmeI不剪切DNA。(图5)这个发现与观察到的单个MmeI酶在体内条件下保护宿主DNA免受剪切的能力以及MmeI只甲基化其识别序列上链的观察一致。我们通过用带有氚标记的H3-SAM甲基化上述寡聚核苷酸对,再洗去没有整合的SAM并对DNA进行放射性活性计数,从而确认MmeI酶只甲基化其识别序列的上链。未甲基化的寡聚DNA和上链没有甲基化、下链甲基化的DNA都具有比背景高10倍以上的计数量,而下链没有甲基化、上链甲基化的DNA和两条链都甲基化的DNA具有接近背景的计数量(图6)。这些发现表明MmeI是一种新型的不需要另外单独的甲基转移酶来修饰宿主DNA以提供抗该内切酶活性的保护作用的限制性修饰系统,就像IIG型(也称为IV型)的酶如Eco57I一样。
实施例V DNA测序和分析 DNA测序DNA测序是在ABI373或ABI377自动测序仪上用双链模板进行的。扩增的DNA片段和各个克隆用上述合成的引物或者载体上的通用引物进行测序。
计算机分析获得的DNA序列的计算机分析是用GeneticsComputer Group程序(Deverenx等,Nucleic Acids Res.12387-395(1984))进行的,而数据库相似性搜索是通过因特网在美国国立生物信息中心的网站(http://www.ncbi.nlm.nih.gov/BLAST/)上用BLASTX和BLASTP算法(Altschul等,J.Mol.Biol 215403-410(1990)和Gish等,Nature Genet.3266-722(1993))实施的。
序列表
<110>新英格兰生物实验室公司(New England Biolabs,Inc.)
<120>重组II型限制性内切核酸酶MmeI和相关内切核酸酶
以及制备这些酶的方法
<130>CPUSZ50007
<140>
<141>
<150>US 60/395,431
<151>2002-07-12
<160>50
<170>PatentIn version 3.2
<210>1
<211>6010
<212>DNA
<213>嗜甲醇营养菌(Methylophilus methylotrophus)
<220>
<221>misc_feature
<222>(800)..(800)
<223>n是a,c,g或t
<400>1
gaattccaga taggtagtcc tttggtactt ccatcccaac cagtgtcacg ttccgcgcca 60
aaccaatcgg ttaaagtgta agaaagtctt gcactgaagt agctgtagga caaaccgaag 120
ttaacctctg tggtatccca gcgaccacct ttaggtgttt gacggaagcc tgctgcgtca 180
cctgccaagt tatatttctt ccatgaacca cctgggtaca ggtagctgat caaaccagca 240
gtccaaccca agccttcaat agcaggaata gttccgttat acccaccata aatatcaatt 300
tcggcagttg catcagggaa ggtatttggt gtcacgtttg aaccccatgc accgacataa 360
aagccgctgt catgagtaat atcaataccg ccttgaacgg caggtttgtg ccagttttgt 420
gaaataccac gagcatagta atctgaaaca aatccaacgt ttgcagtagc agcccaggct 480
gatttttctt ctttagcctc ttcagctgcg tatgaaactt gggcaaaaga taatgtgctt 540
aacactgctg tgagcaatat agattgacgc attatgagtc ctctctctgt gaaatctttg 600
attaagttgt tgtaaacgag aatgaaacaa caaccacaaa gcaaagcacg tgccaaacta 660
taaataacat tataatcaat tatttaaaat atatttataa tctaaaatat taaattaatt 720
atttaataaa ctgtttttta ttgatttaac tctaaaacat atgggtgcaa ccaccctttt 780
tactcactga taatgctaan atagccaaca aaggagcctt caccatgctg atttcaaatg 840
aaaaaattca ggaattatct ttaaaaatca aacaactaat cgaatcaagc cccatttcag 900
agctaaataa caacttgcat gcactaattc agggcgcact caccaaaatg gaacttgttt 960
cgcgtgaaga attcgatatc caatctgcat tattagcgcg cacgcaagag caattaaaac1020
gtcttgaaga aaaaatcagc cagcttgaag aagggcaggc atccagaaag taaaaattaa1080
tttacaattg ttagcattcc attattgagg agtgcgctat gagtctggcg gtgttataca1140
gtcgcgcgtt aagcggcatg gaggcgccag aagtggtggt agaagtccac ttggcgaatg1200
gactacccag ctttaccatt gttgaaacat attgaaactt taagccttag cattttttca1260
aatatacaaa tgccccaagc tggtgcatta agaagaatgt aacaactccc tgcagactag1320
gaataacttc atgatttaac gaacatccct gagtttcaaa gtcgaatctt ctcgtgttgc1380
aaatttctac agcttccttt ctgaccctct tgcaccaaat tgcactatgg cgctaataaa1440
tcttctgcta tccaataatg tccaactaac cctttatgga ctcttaaaaa agatttaata1500
aatgattaag atgaattcaa ggaatttgat gcctggaaat atggcaaaag caaaaaggca1560
gcccagtgct gacttttttg ttttaacatt ggcccatata tccaatttca aataatttaa1620
aaattatcgg gagctaatct gtggctttaa gctggaacga gataagaaga aaagctattg1680
agttttctaa aagatgggaa gacgcctcag atgaaaacag tcaagccaaa ccctttttaa1740
tagatttttt cgaagttttt ggaataacta ataagagagt tgcaacattt gagcatgctg1800
tgaaaaagtt cgccaaggcc cataaggaac aatctcgagg attcgtagat ttgttttggc1860
ctggcattct tcttattgaa atgaaaagca gaggtaaaga cctcgacaaa gcgtatgacc1920
aggcacttga ttacttttct ggcattgcag aaagagactt acccagatac gttttagttt1980
gcgacttcca gcgtttcaga ttaacagacc taataacaaa agagtcagtt gaatttcttt2040
taaaggactt ataccaaaat gtgaggtctt ttggttttat agctggttat caaactcaag2100
taatcaagcc acaagaccct attaatatta aggcggctga acggatgggt aagcttcatg2160
acaccctgaa gttggttgga tatgagggac acgctttaga actttatcta gtgcgtttac2220
ttttttgctt attcgcagaa gacacaacta tttttgagaa aagtttattc caagaatata2280
tcgagacaaa gacgctagag gacggcagtg accttgcaca tcatatcaat acactttttt2340
atgttctcaa taccccagaa caaaaaagat taaagaatct agacgaacac cttgctgcat2400
ttccatatat caatggaaaa cttttcgagg agccacttcc gccagctcag tttgataaag2460
caatgagaga ggcattgctt gacttgtgct cattagattg gagcaggatt tcaccagcaa2520
tatttggaag tttattccaa agcattatgg atgctaaaaa gagaagaaat cttggggcac2580
actacaccag cgaagcaaat attctcaagt taatcaagcc attgtttctt gacgagctct2640
gggtagagtt cgagaaagtt aaaaataata aaaataaatt actagcgttc cacaaaaaac2700
taagaggact tacatttttc gaccctgcat gcggttgcgg aaattttctt gtaatcacat2760
accgagaact aagactttta gaaattgaag tgttaagagg attgcataga ggtggtcaac2820
aagttttgga tattgagcat cttattcaga ttaacgtaga ccagtttttt ggtatcgaaa2880
tagaggagtt tcccgcacag attgctcagg ttgctctctg gcttacagac caccaaatga2940
atatgaaaat ttcagatgag tttggaaact actttgcccg tatcccacta aaatctactc3000
ctcacatttt gaatgctaat gctttacaga ttgattggaa cgatgtttta gaggctaaaa3060
aatgttgctt catattagga aatcctccat ttgttggtaa aagtaaacaa acaccgggac3120
aaaaagcgga tttactatct gtttttggaa atcttaaatc cgcttcagac ttagacctag3180
ttgctgcttg gtatcccaaa gcagcacatt acattcaaac aaatgcaaac atacgctgtg3240
catttgtctc aacgaatagt attactcaag gtgagcaagt atcgttgctt tggccgcttc3300
tgctctcatt aggcataaaa ataaactttg ctcacagaac tttcagctgg acaaatgagg3360
cgtcaggagt agcggcggtt cactgcgtaa ttatcggatt tgggttgaag gattcagatg3420
aaaaaataat ctatgagtat gaaagtatta atggagaacc attagctatt aaggcaaaaa3480
atattaatcc atatttgaga gacggggtgg atgtgattgc ctgcaagcgt cagcagccaa3540
tctcaaaatt accaagcatg cgttatggca acaaaccaac agatgatgga aatttcctat3600
ttactgacga agaaaaaaac caatttatta caaatgagcc atcttccgaa aaatacttca3660
gacggtttgt gggcggggat gagttcataa acaatacaag tcgatggtgt ttatggcttg3720
acggtgctga catttcagaa atacgagcga tgcctttggt cttggctagg ataaaaaaag3780
tccaagaatt cagattaaaa agctcggcca aaccaactcg acaaagtgct tcgacaccaa3840
tgaagttctt ttatatatct cagccggata cggactatct gttgatacct gaaacatcat3900
ctgaaaacag acaatttatt ccaattggtt ttgttgatag aaatgtcatt tcaagtaacg3960
caacgtatca tattcctagt gctgaacctt tgatatttgg cctgctttca tcgaccatgc4020
acaactgctg gatgagaaat gtaggaggaa ggttagaaag tcgttataga tattctgcca4080
gcctggttta caacacgttt ccatggattc aacccaacga aaaacaatcg aaagcgatag4140
aagaagctgc atttgcgatt ttaaaagcta gaagcaatta tccaaacgaa agtttagctg4200
gtttatacga cccaaaaaca atgcctagtg agcttcttaa agcacatcaa aaacttgata4260
aggctgtgga ttctgtctat ggatttaaag gaccaaacac agaaattgct cgaatagctt4320
ttttgtttga aacataccaa aagatgactt cactcttacc accagaaaaa gaaattaaga4380
aatctaaggg caaaaattaa ttaatgtatt taacattaaa ccaccctgat ttatttcgaa4440
tagttcaaat gcttccatgt ggactaatcg ccttcaatca tattaaaaaa ccgacgctag4500
taataaaaac ttccaaagag gccatattaa ccgccaaaat taatcgtgaa tttaaaatat4560
atctttatca aaccacatcg gcttgtgttc tagtaagtgc attttttgac gattctgata4620
gtccactatt cattacaaca ccaattgttc gagatgacca acactcctta gacttgttaa4680
gatttttaat caacaatgat tttacgattt gcttctttga tgaactgaac cgagaatttc4740
tttccgttaa cgcaactggt aatttagtct ctatctttga gagcattcac ttgatgccac4800
tgccgagccc agaggaagcc cacaatgcat tgaatgaagc ggaattttgg ttcagtttac4860
gctcagctgc tgatgatgaa tcatctatcc aggtttcttt attggataat ctatttcctg4920
acgattttgt aatttatgac ctatcctcaa acaaaaacga tatgacatca ttggttagag4980
aaactaaacc aggatactat caggaagcag atattgcaaa gttactaaca agagctttta5040
gtttggaaag catttatcag aatccagtga aaacaagcga ttcaaaagag ttggcagacg5100
ttgtggtatt cggccaaaag gaaattttaa taattcaagc taaagatagt gaaaacaatc5160
agaaacaagt tttagaggtt tcgttagaca agaaatgcgc aaagtcttca aagaaacttt5220
ctgaagcttt ggcacaactc accgacacta tcttaacaat atccaataca ccaatagttg5280
atgttcgggt tggtaagaaa aaatgcactc tgaactttga gggaaagcag cttattggta5340
tcgtcgttgt taaagagctt tttaatgata tttacgataa atacagtcaa aaagtttttg5400
agcatgtaga gttgtctaaa gcacccattg tcttctttga ctatccagaa tttgcaagaa5460
tgacatttca ttgtaattct gaggaattat tactttatgc tttgcatagg atatttagtt5520
ctgcaataga aaatggaatg tataaacgat tgagatttac tcaacctatc ataactgatg5580
gtcatgacag ctacttcagg atacaaaaca ggccccattc tgatgaggcc tatttaattt5640
gcacagagga tgaaatgaag ctctcaaata agtttaaaga ctaaatttat attttcctca5700
gtatcttaaa aacaatattc attaaattgg aaagcccgca atgattgttg cagtatcaat5760
gcgggcatca gtatccagct cttgcaatac acggaagtat caagaagcga atcaggattc5820
taaccatacc tttttaattg caacaatcta atttccataa catgtgtagc tacatcgaaa5880
aaaagacctc gaagaggttg caagagcgtc cagctcgcgg catcaaaaga ccctagtctt5940
ttgacaaggg ggagccaaaa aactgaggtg gaggagcttg ccgacgaagc caggaagccc 6000
cagcgtccgg 6010
<210>2
<211>919
<212>PRT
<213>嗜甲醇营养菌(Methylophilus methylotrophus)
<400>2
Met Ala Leu Ser Trp Asn Glu Ile Arg Arg Lys Ala Ile Glu Phe Ser
1 5 10 15
Lys Arg Trp Glu Asp Ala Ser Asp Glu Asn Ser Gln Ala Lys Pro Phe
20 25 30
Leu Ile Asp Phe Phe Glu Val Phe Gly Ile Thr Asn Lys Arg Val Ala
35 40 45
Thr Phe Glu His Ala Val Lys Lys Phe Ala Lys Ala His Lys Glu Gln
50 55 60
Ser Arg Gly Phe Val Asp Leu Phe Trp Pro Gly Ile Leu Leu Ile Glu
65 70 75 80
Met Lys Ser Arg Gly Lys Asp Leu Asp Lys Ala Tyr Asp Gln Ala Leu
85 90 95
Asp Tyr Phe Ser Gly Ile Ala Glu Arg Asp Leu Pro Arg Tyr Val Leu
100 105 110
Val Cys Asp Phe Gln Arg Phe Arg Leu Thr Asp Leu Ile Thr Lys Glu
115 120 125
Ser Val Glu Phe Leu Leu Lys Asp Leu Tyr Gln Asn Val Arg Ser Phe
130 135 140
Gly Phe Ile Ala Gly Tyr Gln Thr Gln Val Ile Lys Pro Gln Asp Pro
145 150 155 160
Ile Asn Ile Lys Ala Ala Glu Arg Met Gly Lys Leu His Asp Thr Leu
165 170 175
Lys Leu Val Gly Tyr Glu Gly His Ala Leu Glu Leu Tyr Leu Val Arg
180 185 190
Leu Leu Phe Cys Leu Phe Ala Glu Asp Thr Thr Ile Phe Glu Lys Ser
195 200 205
Leu Phe Gln Glu Tyr Ile Glu Thr Lys Thr Leu Glu Asp Gly Ser Asp
210 215 220
Leu Ala His His Ile Asn Thr Leu Phe Tyr Val Leu Asn Thr Pro Glu
225 230 235 240
Gln Lys Arg Leu Lys Asn Leu Asp Glu His Leu Ala Ala Phe Pro Tyr
245 250 255
Ile Asn Gly Lys Leu Phe Glu Glu Pro Leu Pro Pro Ala Gln Phe Asp
260 265 270
Lys Ala Met Arg Glu Ala Leu Leu Asp Leu Cys Ser Leu Asp Trp Ser
275 280 285
Arg Ile Ser Pro Ala Ile Phe Gly Ser Leu Phe Gln Ser Ile Met Asp
290 295 300
Ala Lys Lys Arg Arg Asn Leu Gly Ala His Tyr Thr Ser Glu Ala Asn
305 310 315 320
Ile Leu Lys Leu Ile Lys Pro Leu Phe Leu Asp Glu Leu Trp Val Glu
325 330 335
Phe Glu Lys Val Lys Asn Asn Lys Asn Lys Leu Leu Ala Phe His Lys
340 345 350
Lys Leu Arg Gly Leu Thr Phe Phe Asp Pro Ala Cys Gly Cys Gly Asn
355 360 365
Phe Leu Val Ile Thr Tyr Arg Glu Leu Arg Leu Leu Glu Ile Glu Val
370 375 380
Leu Arg Gly Leu His Arg Gly Gly Gln Gln Val Leu Asp Ile Glu His
385 390 395 400
Leu Ile Gln Ile Asn Val Asp Gln Phe Phe Gly Ile Glu Ile Glu Glu
405 410 415
Phe Pro Ala Gln Ile Ala Gln Val Ala Leu Trp Leu Thr Asp His Gln
420 425 430
Met Asn Met Lys Ile Ser Asp Glu Phe Gly Asn Tyr Phe Ala Arg Ile
435 440 445
Pro Leu Lys Ser Thr Pro His Ile Leu Asn Ala Asn Ala Leu Gln Ile
450 455 460
Asp Trp Asn Asp Val Leu Glu Ala Lys Lys Cys Cys Phe Ile Leu Gly
465 470 475 480
Asn Pro Pro Phe Val Gly Lys Ser Lys Gln Thr Pro Gly Gln Lys Ala
485 490 495
Asp Leu Leu Ser Val Phe Gly Asn Leu Lys Ser Ala Ser Asp Leu Asp
500 505 510
Leu Val Ala Ala Trp Tyr Pro Lys Ala Ala His Tyr Ile Gln Thr Asn
515 520 525
Ala Asn Ile Arg Cys Ala Phe Val Ser Thr Asn Ser Ile Thr Gln Gly
530 535 540
Glu Gln Val Ser Leu Leu Trp Pro Leu Leu Leu Ser Leu Gly Ile Lys
545 550 555 560
Ile Asn Phe Ala His Arg Thr Phe Ser Trp Thr Asn Glu Ala Ser Gly
565 570 575
Val Ala Ala Val His Cys Val Ile Ile Gly Phe Gly Leu Lys Asp Ser
580 585 590
Asp Glu Lys Ile Ile Tyr Glu Tyr Glu Ser Ile Asn Gly Glu Pro Leu
595 600 605
Ala Ils Lys Ala Lys Asn Ile Asn Pro Tyr Leu Arg Asp Gly Val Asp
610 615 620
Val Ile Ala Cys Lys Arg Gln Gln Pro Ile Ser Lys Leu Pro Ser Met
625 630 535 640
Arg Tyr Gly Asn Lys Pro Thr Asp Asp Gly Asn Phe Leu Phe Thr Asp
645 650 655
Glu Glu Lys Asn Gln Phe Ile Thr Asn Glu Pro Ser Ser Glu Lys Tyr
660 665 670
Phe Arg Arg Phe Val Gly Gly Asp Glu Phe Ile Asn Asn Thr Ser Arg
675 680 685
Trp Cys Leu Trp Leu Asp Gly Ala Asp Ile Ser Glu Ile Arg Ala Met
690 695 700
Pro Leu Val Leu Ala Arg Ile Lys Lys Val Gln Glu Phe Arg Leu Lys
705 710 715 720
Ser Ser Ala Lys Pro Thr Arg Gln Ser Ala Ser Thr Pro Met Lys Phe
725 730 735
Phe Tyr lle Ser Gln Pro Asp Thr Asp Tyr Leu Leu Ile Pro Glu Thr
740 745 750
Ser Ser Glu Asn Arg Gln Phe Ile Pro Ile Gly Phe Val Asp Arg Asn
755 760 765
Val Ile Ser Ser Asn Ala Thr Tyr His Ile Pro Ser Ala Glu Pro Leu
770 775 780
Ile Phe Gly Leu Leu Ser Ser Thr Met His Asn Cys Trp Met Arg Asn
785 790 795 800
Val Gly Gly Arg Leu Glu Ser Arg Tyr Arg Tyr Ser Ala Ser Leu Val
805 810 815
Tyr Asn Thr Phe Pro Trp Ile Gln Pro Asn Glu Lys Gln Ser Lys Ala
820 825 830
Ile Glu Glu Ala Ala Phe Ala Ile Leu Lys Ala Arg Ser Asn Tyr Pro
835 840 845
Asn Glu Ser Leu Ala Gly Leu Tyr Asp Pro Lys Thr Met Pro Ser Glu
850 855 860
Leu Leu Lys Ala His Gln Lys Leu Asp Lys Ala Val Asp Ser Val Tyr
8658 70 875 880
Gly Phe Lys Gly Pro Asn Thr Glu Ile Ala Arg Ile Ala Phe Leu Phe
885 890 895
Glu Thr Tyr Gln Lys Met Thr Ser Leu Leu Pro Pro Glu Lys Glu Ile
900 905 910
Lys Lys Ser Lys Gly Lys Asn
915
<210>3
<211>932
<212>PRT
<213>未知
<220>
<223>GenBank号gi|28373198|ref|NP_783835.1
<400>3
Met Pro Thr Arg Gln Gln Ala Ala Arg Glu Phe Val Lys Thr Trp Ser
1 5 10 15
Ser Asp Lys Lys Gly Arg Glu Asp Ala Asp Arg Gln Thr Phe Trp Asn
20 25 30
Asp Leu Leu Gln Arg Val Tyr Gly Ile Asp Asn Tyr Tyr Asp Tyr Ile
35 40 45
Thr Tyr Glu Lys Asp Val Gln Val Lys Ala Asp Gly Lys Val Thr Thr
50 55 60
Arg Arg Ile Asp Gly Tyr Ile Pro Ser Thr Lys Ile Met Val Glu Met
65 70 75 80
Lys Gly Lys Asn Ile Lys AspLeu Ser Lys Pro Ile Thr Gln Ser Gly
85 90 95
Gly Asp Glu Leu Thr Pro Phe Glu Gln Ala Lys Arg Tyr Ala Asn Phe
100 105 110
Leu Pro Asn Ser Glu Gln Pro Arg Trp Ile Leu Val Ser Asn Phe Asn
115 120 125
Glu Ile Asp Ile His Asp Met Glu Arg Pro Leu Asp Glu Pro Lys Val
130 135 140
Ile Lys Leu Glu Asp Leu Pro Lys Lys Val Lys Ser Leu Glu Phe Met
145 150 155 160
Val Asp Ala Asn Gln Gln Gln Val Ile Asp Glu Lys Gln Leu Ser Val
165 170 175
Asp Ala Gly Asn Leu Val Ala Lys Ile Tyr Asn Glu Leu Thr Asn Ala
180 185 190
Tyr Ala Ala Gly Arg Gly Ile Asp Val Asn Glu Pro Arg Ile Gln Arg
195 200 205
Ser Leu Asn Met Leu Ile Val Arg Leu Val Phe Leu Leu Tyr Ala Asp
210 215 220
Asp Ser Asn Leu Phe Gly Lys Glu Asp Ile Phe Gln Ala Phe Ile Glu
225 230 235 240
Arg Arg Glu Pro Arg Asp Ile Arg Arg Asp Leu Ser Glu Leu Phe Lys
245 250 255
Val Leu Asp Gln Pro Glu Glu Gln Arg Asp Pro Tyr Leu Asp Asp Glu
260 265 270
Phe Asn Gln Phe Ala Tyr Val Asn Gly Gly Met Phe Ser Asp Glu Asn
275 280 285
Val Ile Ile Pro Gln Phe Thr Asp Glu Leu Lys Arg Leu Ile Val Glu
290 295 300
Asp Ala Gly Arg Gly Phe Asp Trp Ser Gly Ile Ser Pro Thr Ile Phe
305 310 315 320
Gly Ala Val Phe Glu Ser Thr Leu Asn Pro Glu Thr Arg Arg Ser Gly
325 330 335
Gly Met His Tyr Thr Ser Ile Glu Asn Ile His Lys Val Ile Asp Pro
340 345 350
Leu Phe Leu Asn Asp Leu His Asp Glu Phe Asp Lys Ile Gln Asn Met
355 360 365
Gly Asn Arg Arg Gln Arg Val Thr Arg Ala Lys Ala Phe Arg Asp Lys
370 375 380
Leu Gly Lys Leu Lys Phe Phe Asp Pro Ala Cys Gly Ser Gly Asn Phe
385 390 395 400
Leu Thr Glu Thr Tyr Leu Ser Leu Arg Lys Met Glu Asn Glu Cys Leu
405 410 415
Arg lle Ile Val Gly Asn Gln Gly Ala Leu Ala Leu Thr Asp Glu Ser
420 425 430
Glu Pro Lys Val Lys Ile Gln Asn Phe Tyr Gly Ile Glu Ile Asn Asp
435 440 445
Phe Ala Val Ser Val Ala Arg Thr Ala Met Trp Ile Ala Glu Ser Gln
450 455 460
Met Trp Glu Gln Thr Lys Asp Ile Thr Phe Ala Asn Lys Asp Phe Leu
465 470 475 480
Pro Leu Asp Ser Asn Asp Ser Ile Tyr Glu Gly Asn Ala Leu Arg Met
485 490 495
Asp Trp Asn Asp Ile Val Lys Pro Tyr Glu Leu Asp Tyr Ile Met Gly
500 505 510
Asn Pro Pro Phe Val Gly Tyr Ser Leu Gln Thr Lys Glu Gln Lys Gln
515 520 525
Asp Ile Lys Gln Glu Phe Phe Lys Tyr Thr Asp Lys Tyr Gly Lys Phe
530 535 540
Asp Tyr Val Ser Gly Trp Tyr Ile Lys Gly Ala Lys Tyr Ile Gln Asn
545 550 555 560
Ser Thr Ile Lys Val Gly Phe Val Ser Thr Asp Ser Ile Ile Gln Gly
565 570 575
Glu Gln Ala Pro Glu Ile Trp Lys Val Leu Phe Asn Asp Phe His Ile
580 585 590
Phe Ile Asn Tyr Gly Tyr Arg Ser Phe Glu Trp Asn Asn Glu Ala Ala
595 600 605
Asn Lys Ala Lys Val Asp Val Val Ile Val Gly Phe Ser Thr Lys Glu
610 615 620
Asp Lys Asn Pro Thr Ile Tyr Asp Glu Gln Lys Ile Ile Ser Ala Lys
625 630 635 640
His Ile Asn Gln Tyr Met Tyr Asp Ser Asp Asn Ile Phe Ile Asp Thr
645 650 655
Thr Arg Lys Tyr Ile Glu Ala Met Pro Lys Met Lys Thr Gly Asn Arg
660 665 670
Pro Ala Asp Gly Gly Ala Leu Ile Leu Ser Pro Lys Glu Ala Lys Glu
675 680 685
Leu Val Asn Glu Glu Pro Gln Ser Lys Gln Phe Ile Lys Lys Leu Thr
690 695 700
Gly Ser Lys Glu Phe Ile Thr Gly Lys Tyr Arg Tyr Cys Leu Trp Leu
705 710 715 720
Val Asn Val Thr Pro Lys Gln Leu Arg Ser Met Pro Leu Val Leu Lys
725 730 735
Arg Val Glu Gln Cys Lys Glu Asn Arg Leu Ser Gly Ala Pro Asp Arg
740 745 750
Gln Lys Leu Ala Ala Thr Pro His Leu Phe Arg Glu Gln Met Asn Pro
755 760 765
Asp Asn Tyr Met Ile Val Pro Leu Val Thr Gly Cys Arg Arg Lys Tyr
770 775 780
Val Pro Phe Gly Tyr Leu Gly Asn Asp Ile Ile Pro Thr Asn Leu Ala
785 790 795 800
Thr Ile Ile Pro Glu Ala Asp His Tyr Ala Phe Gly Val Leu Glu Ser
805 810 815
Ile Val His Met Ala Trp Met Arg Val Val Ala Gly Arg Lys Gly Thr
820 825 830
Ser Tyr Arg Tyr Ser Lys Asn Leu Val Tyr Thr Asn Phe Pro Trp Pro
835 840 845
Val Val Asp Ile Asn Gln Lys Glu Lys Ile Thr Ile Thr Ala Gln Asp
850 855 860
Ile Leu Asn Ala Arg Asn Leu Tyr Pro Asp Ser Ser Leu Ala Asp Leu
865 870 875 880
Tyr Asp Pro Leu Thr Met Pro Ile Glu Leu Arg Lys Ala His Glu Ala
885 890 895
Asn Asp Lys Ala Val Leu Lys Ala Tyr Gly Leu Lys Pro Ser Ala Thr
900 905 910
Glu Pro Glu Ile Val Gln His Leu Phe Lys Met Tyr Glu Lys Leu Thr
915 920 925
Lys Lys Asp Trp
930
<210>4
<211>354
<212>PRT
<213>未知
<220>
<223>GenBank号gi|27450519|gb|AA014619.1|AF465251_62
<400>4
Val Leu Phe Asn Asp Phe His Ile Phe Ile Asn Tyr Gly Tyr Arg Ser
1 5 10 15
Phe Glu Trp Asn Asn Glu Ala Ala Asn Lys Ala Lys Val Asp Val Val
20 25 30
Ile Val Gly Phe Ser Thr Lys Glu Asp Lys Asn Pro Thr Ile Tyr Asp
35 40 45
Ser Ser Asn Ile Ser His Cys Lys Asn Ile Asn Gly Tyr Leu Phe Asp
50 55 60
Gly Asn Asn Ile Phe Val Thr Asn Arg Pro Ala Pro Leu Ser Asn Val
65 70 75 80
Pro Arg Met His Asn Gly Cys Lys Leu Leu Asp Gly Gly Phe Tyr Thr
85 90 95
Leu Thr Ser Gln Glu Arg Lys Glu Ala Ile Ser Lys Asp Pro Tyr Ala
100 105 110
Asp Lys Phe Ile Arg Pro Tyr Leu Gly Ala Lys Asn Phe Ile His Gly
115 120 125
Thr Ala Arg Tyr Cys Ile Trp Leu Lys Asp Ala Asn Pro Lys Asp Ile
130 135 140
His Gln Ser Pro Phe Ile Leu Asp Arg Ile Asn Lys Val Ala Glu Phe
145 150 155 160
Arg Ser Gln Gln Lys Ser Lys Asp Thr Gln Lys Tyr Ala Lys Arg Pro
165 170 175
Met Leu Pro Thr Arg Leu Ala Tyr Tyr Ser His Asp Glu His Thr Asp
180 185 190
Met Leu Ile Val Pro Ala Thr Ser Ser Gln Arg Arg Glu Tyr Leu Pro
195 200 205
Ile Gly Tyr Val Ser Glu Lys Asn Ile Val Ser Tyr Ser Leu Met Leu
210 215 220
Ile Pro Asn Ala Ser Asn Phe Asn Phe Gly Ile Leu Glu Ser Lys Val
225 230 235 240
His Tyr Ile Trp Leu Lys Asn Phe Cys Gly Arg Leu Lys Ser Asp Tyr
245 250 255
Arg Tyr Ser Asn Thr Ile Ile Tyr Asn Asn Phe Pro Trp Pro Thr Val
260 265 270
Gly Asp Lys Gln Glu Gln Asn Ile Ser Glu Thr Ala Gln Gly Ile Leu
275 280 285
Asn Thr Arg Lys Leu Tyr Pro Asp Ser Ser Leu Ala Asp Leu Tyr Asp
290 295 300
Pro Leu Thr Met Pro Val Glu Leu Arg Lys Ala His Glu Ala Asn Asp
305 310 315 320
Lys Ala Val Leu Lys Ala Tyr Gly Leu Ser Pro Lys Ala Thr Glu Gln
325 330 335
Glu Ile Val Glu His Leu Phe Lys Met Tyr Glu Lys Leu Thr Lys Gly
340 345 350
Glu Arg
<210>5
<211>919
<212>PRT
<213>未知
<220>
<223>嗜甲醇营养菌(M.methylotrophus)氨基酸
<400>5
Met Ala Leu Ser Trp Asn Glu Ile Arg Arg Lys Ala Ile Glu Phe Ser
1 5 10 15
Lys Arg Trp Glu Asp Ala Ser Asp Glu Asn Ser Gln Ala Lys Pro Phe
20 25 30
Leu Ile Asp Phe Phe Glu Val Phe Gly Ile Thr Asn Lys Arg Val Ala
35 40 45
Thr Phe Glu His Ala Val Lys Lys Phe Ala Lys Ala His Lys Glu Gln
50 55 60
Ser Arg Gly Phe Val Asp Leu Phe Trp Pro Gly Ile Leu Leu Ile Glu
65 70 75 80
Met Lys Ser Arg Gly Lys Asp Leu Asp Lys Ala Tyr Asp Gln Ala Leu
85 90 95
Asp Tyr Phe Ser Gly Ile Ala Glu Arg Asp Leu Pro Arg Tyr Val Leu
100 105 110
Val Cys Asp Phe Gln Arg Phe Arg Leu Thr Asp Leu Ile Thr Lys Glu
115 120 125
Ser Val Glu Phe Leu Leu Lys Asp Leu Tyr Gln Asn Val Arg Ser Phe
130 135 140
Gly Phe Ile Ala Gly Tyr Gln Thr Gln Val Ile Lys Pro Gln Asp Pro
145 150 155 160
Ile Asn Ile Lys Ala Ala Glu Arg Met Gly Lys Leu His Asp Thr Leu
165 170 175
Lys Leu Val Gly Tyr Glu Gly His Ala Leu Glu Leu Tyr Leu Val Arg
180 185 190
Leu Leu Phe Cys Leu Phe Ala Glu Asp Thr Thr Ile Phe Glu Lys Ser
195 200 205
Leu Phe Gln Glu Tyr Ile Glu Thr Lys Thr Leu Glu Asp Gly Ser Asp
210 215 220
Leu Ala His His Ile Asn Thr Leu Phe Tyr Val Leu Asn Thr Pro Glu
225 230 235 240
Gln Lys Arg Leu Lys Asn Leu Asp Glu His Leu Ala Ala Phe Pro Tyr
245 250 255
Ile Asn Gly Lys Leu Phe Glu Glu Pro Leu Pro Pro Ala Gln Phe Asp
260 265 270
Lys Ala Met Arg Glu Ala Leu Leu Asp Leu Cys Ser Leu Asp Trp Ser
275 280 285
Arg Ile Ser Pro Ala Ile Phe Gly Ser Leu Phe Gln Ser Ile Mer Asp
290 295 300
Ala Lys Lys Arg Arg Asn Leu Gly Ala His Tyr Thr Ser Glu Ala Asn
305 310 315 320
Ile Leu Lys Leu Ile Lys Pro Leu Phe Leu Asp Glu Leu Trp Val Glu
325 330 335
Phe Glu Lys Val Lys Asn Asn Lys Asn Lys Leu Leu Ala Phe His Lys
340 345 350
Lys Leu Arg Gly Leu Thr Phe Phe Asp Pro Ala Cys Gly Cys Gly Asn
355 360 365
Phe Leu Val Ile Thr Tyr Arg Glu Leu Arg Leu Leu Glu Ile Glu Val
370 375 380
Leu Arg Gly Leu His Arg Gly Gly Gln Gln Val Leu Asp Ile Glu His
385 390 395 400
Leu Ile Gln Ile Asn Val Asp Gln Phe Phe Gly Ile Glu Ile Glu Glu
405 410 415
Phe Pro Ala Gln Ile Ala Gln Val Ala Leu Trp Leu Thr Asp His Gln
420 425 430
Met Asn Met Lys Ile Ser Asp Glu Phe Gly Asn Tyr Phe Ala Arg Ile
435 440 445
Pro Leu Lys Ser Thr Pro His Ile Leu Asn Ala Asn Ala Leu Gln Ile
450 455 460
Asp Trp Asn Asp Val Leu Glu Ala Lys Lys Cys Cys Phe Ile Leu Gly
4654 70 475 480
Asn Pro Pro Phe Val Gly Lys Ser Lys Gln Thr Pro Gly Gln Lys Ala
485 490 495
Asp Leu Leu Ser Val Phe Gly Asn Leu Lys Ser Ala Ser Asp Leu Asp
500 505 510
Leu Val Ala Ala Trp Tyr Pro Lys Ala Ala His Tyr Ile Gln Thr Asn
515 520 525
Ala Asn Ile Arg Cys Ala Phe Val Ser Thr Asn Ser Ile Thr Gln Gly
530 535 540
Glu Gln Val Ser Leu Leu Trp Pro Leu Leu Leu Ser Leu Gly Ile Lys
545 550 555 560
Ile Asn Phe Ala His Arg Thr Phe Ser Trp Thr Asn Glu Ala Ser Gly
565 570 575
Val Ala Ala Val His Cys Val Ile Ile Gly Phe Gly Leu Lys Asp Ser
580 585 590
Asp Glu Lys Ile Ile Tyr Glu Tyr Glu Ser Ile Asn Gly Glu Pro Leu
595 600 605
Ala Ile Lys Ala Lys Asn Ile Asn Pro Tyr Leu Arg Asp Gly Val Asp
610 615 620
Val Ile Ala Cys Lys Arg Gln Gln Pro Ile Ser Lys Leu Pro Ser Met
625 530 635 640
Arg Tyr Gly Asn Lys Pro Thr Asp Asp Gly Asn Phe Leu Phe Thr Asp
645 650 655
Glu Glu Lys Asn Gln Phe Ile Thr Asn Glu Pro Ser Ser Glu Lys Tyr
660 665 670
Phe Arg Arg Phe Val Gly Gly Asp Glu Phe Ile Asn Asn Thr Ser Arg
675 680 685
Trp Cys Leu Trp Leu Asp Gly Ala Asp Ile Ser Glu Ile Arg Ala Met
690 695 700
Pro Leu Val Leu Ala Arg Ile Lys Lys Val Gln Glu Phe Arg Leu Lys
705 710 715 720
Ser Ser Ala Lys Pro Thr Arg Gln Ser Ala Ser Thr Pro Met Lys Phe
725 730 735
Phe Tyr Ile Ser Gln Pro Asp Thr Asp Tyr Leu Leu Ile Pro Glu Thr
740 745 750
Ser Ser Glu Asn Arg Gln Phe Ile Pro Ile Gly Phe Val Asp Arg Asn
755 760 765
Val Ile Ser Ser Asn Ala Thr Tyr His Ile Pro Ser Ala Glu Pro Leu
770 775 780
Ile Phe Gly Leu Leu Ser Ser Thr Met His Asn Cys Trp Met Arg Asn
785 790 795 800
Val Gly Gly Arg Leu Glu Ser Arg Tyr Arg Tyr Ser Ala Ser Leu Val
805 810 815
Tyr Asn Thr Phe Pro Trp Ile Gln Pro Asn Glu Lys Gln Ser Lys Ala
820 825 830
Ile Glu Glu Ala Ala Phe Ala Ile Leu Lys Ala Arg Ser Asn Tyr Pro
835 840 845
Asn Glu Ser Leu Ala Gly Leu Tyr Asp Pro Lys Thr Met Pro Ser Glu
850 855 860
Leu Leu Lys Ala His Gln Lys Leu Asp Lys Ala Val Asp Ser Val Tyr
865 870 875 880
Gly Phe Lys Gly Pro Asn Thr Glu Ile Ala Arg Ile Ala Phe Leu Phe
885 890 895
Glu Thr Tyr Gln Lys Met Thr Ser Leu Leu Pro Pro Glu Lys Glu Ile
900 905 910
Lys Lys Ser Lys Gly Lys Asn
915
<210>6
<211>936
<212>PRT
<213>未知
<220>
<223>GenBank号gi|15794682|ref|NP_284504.1
<400>6
Met Lys Thr Leu Leu Gln Leu Gln Thr Ala Ala Gln Ash Phe Ala Ala
1 5 10 15
Tyr Tyr Lys Asp Gln Thr Asp Glu Arg Arg Glu Lys Asp Thr Phe Asn
20 25 30
Glu Phe Phe Ala Ile Phe Gly Ile Asp Arg Lys Asn Val Ala His Phe
35 40 45
Glu Tyr Pro Val Lys Asp Pro Ala Asp Asn Thr Gln Phe Val Asp Ile
50 55 60
Phe Trp Glu Gly Ile Phe Leu Ala Glu His Lys Ser Ala Asn Lys Asn
65 70 75 80
Leu Thr Lys Ala Lys Glu Gln Ala Glu Arg Tyr Leu Gln Glu Ile Gly
85 90 95
Arg Thr Lys Pro Ser Ala Leu Pro Glu Tyr Tyr Ala Val Ser Asp Phe
100 105 110
Ala His Phe His Leu Tyr Arg Arg Val Pro Glu Glu Gly Ala Glu Asn
115 120 125
Gln Trp Gln Phe Pro Leu Glu Glu Leu Pro Glu Tyr Ile Thr Arg Gly
130 135 140
Val Phe Asp Phe Met Phe Gly Ile Glu Ala Lys Val Arg Gln Ile Gln
145 150 155 160
Glu Glu Ala Asn Ile Gln Ala Ala Ala Thr Ile Gly Arg Leu His Asp
165 170 175
Ala Leu Lys Glu Glu Gly Ile Tyr Glu Glu His Glu Leu Arg Leu Phe
180 185 190
Ile Thr Arg Leu Leu Phe Leu Phe Phe Ala Asp Asp Ser Ala Val Phe
195 200 205
Arg Arg Asn Tyr Leu Phe Gln Asp Phe Leu Glu Asn Cys Lys Glu Ala
210 215 220
Asp Thr Leu Gly Asp Lys Leu Asn Gln Leu Phe Glu Phe Leu Asn Thr
225 230 235 240
Pro Asp Gln Lys Arg Ser Lys Thr Gln Ser Glu Lys Phe Lys Gly Phe
245 250 255
Glu Tyr Val Asn Gly Gly Leu Phe Lys Glu Arg Leu Arg Thr Phe Asp
260 265 270
Phe Thr Ala Lys Gln His Arg Ala Leu Ile Asp Cys Gly Asn Phe Asp
275 280 285
Trp Arg Asn Ile Ser Pro Glu Ile Phe Gly Thr Leu Phe Gln Ser Val
290 295 300
Met Asp Ala Gln Glu Arg Arg Glu Ala Gly Ala His Tyr Thr Glu Ala
305 310 315 320
Ala Asn Ile Asp Lys Val Ile Asn Gly Leu Phe Leu Glu Asn Leu Arg
325 330 335
Ala Glu Phe Glu Ala Val Lys Ala Leu Lys Arg Asp Lys Ala Lys Lys
340 345 350
Leu Ala Ala Phe Tyr Gln Lys Ile Gln Asn Leu Gln Phe Leu Asp Pro
355 360 365
Ala Cys Gly Cys Gly Asn Phe Leu Ile Val Ala Tyr Asp Arg Ile Arg
370 375 380
Ala Leu Glu Asp Asp Ile Ile Ala Glu Ala Leu Lys Asp Lys Ala Asp
385 390 395 400
Gly Leu Phe Asp Ser Pro Ser Val Gln Cys Arg Leu Lys Gln Phe His
405 410 415
Gly Ile Glu Ile Asp Glu Phe Ala Val Leu Ile Ala Arg Thr Ala Met
420 425 430
Trp Leu Lys Asn His Gln Cys Asn Ile Arg Thr Gln Ile Arg Phe Asp
435 440 445
Gly Glu Val Ala Cys His Thr Leu Pro Leu Glu Asp Ala Ala Glu Ile
450 455 460
Ile His Ala Asn Ser Leu Arg Thr Pro Trp Gln Ala Ala Asp Tyr Ile
465 470 475 480
Phe Gly Asn Pro Pro Phe Ile Gly Ser Thr Tyr Gln Thr Lys Glu Gln
485 490 495
Lys Asn Asp Leu Glu Ser Ile Cys Gly His Ile Lys Gly Tyr Gly Leu
500 505 510
Leu Asp Tyr Val Cys Asn Trp Tyr Val Lys Ala Ala Gly Ile Met Ala
515 520 525
Gln His Pro Gln Val Gln Thr Ala Phe Val Ser Thr Asn Ser Ile Cys
530 535 540
Gln Gly Gln Gln Val Glu Ile Leu Trp Gly Ser Leu Leu Asn Gln Gly
545 550 555 560
Ile Glu Ile His Phe Ala His Arg Thr Phe Gln Trp Thr Ser Gln Ala
565 570 575
Ala Gly Lys Ala Ala Val His Cys Ile Ile Val Gly Phe Arg Gln Lys
580585 590
Pro Pro Met Pro Ser Glu Lys Thr Leu Tyr Asp Tyr Pro Asp Ile Lys
595 600 605
Gly Glu Pro Glu Lys His Ala Val Ala Asn Ile Asn Pro Tyr Leu Ile
610 615 620
Asp Ala Pro Asp Leu Ile Ile Ala Lys Arg Ser Arg Pro Ile His Cys
625 630 635 640
Glu Pro Asp Met Val Asn Gly Ser Lys Pro Thr Glu Gly Gly Asn Leu
645 650 655
Ile Leu Ser Thr Ala Glu Lys Asp Ala Leu Ile Ala Ala Glu Pro Leu
660 665 670
Ala Glu Gln Tyr Ile Arg Pro Phe Ile Gly Ala Asp Glu Phe Leu Asn
675 680 685
Gly Lys Thr Arg Trp Cys Leu Trp Phe His Gly Val Ser Asp Val Lys
690 695 700
Arg Asn His Asp Leu Lys Gln Met Pro Gln Val Gln Ala Arg Ile Gln
705 710 715 720
Ala Val Lys Thr Met Arg Glu Ala Ser Ser Asp Lys Gln Thr Gln Lys
725 730 735
Asp Ala Ala Thr Pro Trp Leu Phe Gln Lys Ile Arg Gln Pro Ser Asp
740 745 750
Gly Asn Tyr Leu Ile Ile Pro Ser Val Ser Ser Glu Ser Arg Arg Phe
755 760 765
Ile Pro Ile Gly Tyr Leu Ser Phe Glu Thr Val Val Ser Asn Leu Ala
770 775 780
Phe Ile Leu Pro Asn Ala Thr Leu Tyr His Phe Gly Ile Leu Ser Ser
785 790 795 800
Thr Met His Asn Ala Phe Met Arg Thr Val Ala Gly Arg Leu Lys Ser
805 810 815
Asp Tyr Arg Tyr Ser Asn Thr Val Val Tyr Asn Asn Phe Pro Phe Pro
820 825 830
Glu Ser Cys Arg Leu Pro Ser Glu Asn Asp Arg Pro Asp Pro Leu Arg
835 840 845
Ala Ala Val Glu Ala Ala Ala Gln Thr Val Leu Asp Ala Arg Gly Gln
850 855 860
Tyr Arg Arg Glu Ala Gln Glu Ala Gly Leu Pro Glu Pro Thr Leu Ala
865 870 875 880
Glu Leu Tyr Ala Pro Asp Ala Gly Tyr Thr Ala Leu Asp Lys Ala His
885 890 895
Ala Thr Leu Asp Lys Ala Val Asp Lys Ala Tyr Gly Tyr Lys Thr Gly
900 905 910
Lys Asn Thr Asp Asp Glu Ala Glu Arg Val Ala Phe Leu Phe Glu Leu
915 920 925
Tyr Arg Lys Ala Ala Ala Ile Ala
930 935
<210>7
<211>879
<212>PRT
<213>未知
<220>
<223>GenBank号gi|16077744|ref|NP_388558.1
<400>7
Met Ala Leu Ile Asp Leu Glu Asp Lys Ile Ala Glu Ile Val Asn Arg
1 5 10 15
Glu Asp His Ser Asp Phe Leu Tyr Glu Leu Leu Gly Val Tyr Asp Val
20 25 30
Pro Arg Ala Thr Ile Thr Arg Leu Lys Lys Gly Asn Gln Asn Leu Thr
35 40 45
Lys Arg Val Gly Glu Val His Leu Lys Asn Lys Val Trp Phe Lys Glu
50 55 60
Ala Lys Lys Gly Lys Leu Phe Asp Ala Leu Ile Asp Ile Glu Gln Gln
65 70 75 80
Val Glu Tyr Leu Ser Ala Lys Pro Arg Tyr Leu Leu Val Thr Asp Tyr
85 90 95
Asp Gly Val Leu Ala Lys Asp Thr Lys Thr Leu Glu Ala Leu Asp Val
100 105 110
Lys Phe Glu Glu Leu Pro Gln Tyr Phe Asp Phe Phe Leu Ala Trp Lys
115 120 125
Gly Ile Glu Lys Val Glu Phe Glu Lys Glu Asn Pro Ala Asp Ile Lys
130 135 140
Ala Ala Glu Arg Phe Ala Arg Ile Tyr Asp Val Leu Arg Lys Glu Asn
145 150 155 160
Asn Ile Ile Glu Thr Ash Arg Gly Leu Asp Leu Phe Leu Ile Arg Leu
165 170 175
Leu Phe Cys Phe Phe Ala Glu Asp Thr Asp Ile Phe Lys Arg Asn Ser
180 185 190
Phe Thr Asn Leu Ile Lys Thr Leu Thr Glu Glu Asp Gly Ser Asn Leu
195 200 205
Asn Lys Leu Phe Ala Asp Leu Phe Ile Val Leu Asp Lys Asn Glu Arg
210 215 220
Asp Asp Val Pro Ser Tyr Leu Lys Glu Phe Pro Tyr Val Asn Gly Gln
225 230 235 240
Leu Phe Thr Glu Pro His Thr Glu Leu Glu Phe Ser Ala Lys Ser Arg
245 250 255
Lys Leu Ile Ile Glu Cys Gly Glu Leu Leu Asn Trp Ala Lys Ile Asn
260 265 270
Pro Asp Ile Phe Gly Ser Met Ile Gln Ala Val Ala Ser Glu Glu Ser
275 280 285
Arg Ser Tyr Leu Gly Met His Tyr Thr Ser Val Pro Asn Ile Met Lys
290 295 300
Val Ile Lys Pro Leu Phe Leu Asp Lys Leu Asn Gln Ser Phe Leu Asp
305 310 315 320
Ala Tyr Asp Asp Tyr Thr Lys Leu Glu Asn Leu Leu Thr Arg Ile Gly
325 330 335
Lys Ile Lys Phe Phe Asp Pro Ala Cys Gly Ser Gly Asn Phe Leu Ile
340 345 350
Ile Thr Tyr Lys Glu Leu Arg Arg Met Glu Ile Asn Ile Ile Lys Arg
355 360 365
Leu Gln Glu Leu Leu Gly Glu Tyr Leu Tyr Val Pro Ser Val Thr Leu
370 375 380
Ser Gln Phe Tyr Gly Ile Glu Ile Glu Asp Phe Ala His Asp Val Ala
385 390 395 400
Lys Leu Ser Leu Trp Ile Ala Glu His Gln Met Asn Glu Glu Leu Lys
405 410 415
Asn Glu Val His Asn Ala Val Arg Pro Thr Leu Pro Leu His Thr Ala
420 425 430
Gly Asp Ile Arg Cys Ala Asn Ala Ile Arg Val Glu Trp Thr Glu Val
435 440 445
Cys Pro Ala Gln Gly Ser Glu Glu Val Tyr Val Phe Gly Asn Pro Pro
450 455 460
Tyr Leu Gly Ser Lys Lys Gln Asn Lys Glu His Lys Ser Asp Met Leu
465 470 475 480
Ser Ile Phe Gly Lys Val Lys Asn Gly Lys Met Leu Asp Tyr Ile Ser
485 490 495
Ala Trp Phe Tyr Phe Gly Ala Lys Tyr Ala Ser Thr Thr Asn Ala Lys
500 505 510
Val Ala Phe Val Ser Thr Asn Ser Val Thr Gln Gly Glu Gln Val Ser
515 520 525
Ile Leu Trp Asn Glu Leu Phe Lys Phe Gly Ile Gln Ile Asn Phe Ala
530 535 540
Tyr Lys Ser Phe Lys Trp Ala Asn Asn Ala Lys Asn Asn Ala Ala Val
545 550 555 560
Ile Val Val Ile Val Gly Phe Gly Pro Leu Asp Thr Lys Val Asn Lys
565 570 575
Tyr Leu Phe Val Asp Glu Thr Lys Lys Leu Val Ser Asn Ile Ser Pro
580 585 590
Tyr Leu Thr Asp Gly Glu Asn Ile Leu Val Ser Ser Arg Thr Lys Pro
595 600 605
Ile Ser Asp Leu Pro Lys Leu His Phe Gly Asn Met Pro Asn Asp Gly
610 615 620
Gly Gly Leu Leu Phe Thr Ile Thr Glu Tyr Thr Asp Ala Ile Asn Lys
625 630 635 640
Tyr Pro Glu Leu Val Pro Tyr Phe Lys Lys Phe Ile Gly Ser Val Glu
645 650 655
Phe Ile Asn Gly Gly Leu Arg Tyr Cys Leu Trp Leu Asn Glu Ala Lys
660 665 670
Tyr Glu Lys Ile Lys Ser Asn Pro Leu Ile Gln Glu Arg Ile Ser Ile
675 680 685
Ser Lys Asn His Arg Glu Lys Ser Thr Asp Lys Gly Thr Asn Lys Leu
690 695 700
Ala Leu Thr Pro Trp Lys Phe Arg Asp Thr His Glu Thr Thr Asn Tyr
705 710 715 720
Ser Ile Val Val Pro Ser Val Ser Ser Glu Asn Arg Phe Tyr Ile Pro
725 730 735
Met Gly Leu Ala Gly Ala Asp Thr Ile Leu Ser Asn Leu Ile Tyr Val
740 745 750
Ile Tyr Asp Ala Glu Ile Tyr Leu Leu Gly Ile Leu Met Ser Arg Met
755 760 765
His Met Thr Trp Val Lys Ala Val Ala Gly Arg Leu Lys Thr Asp Tyr
770 775 780
Arg Tyr Ser Ala Gly Leu Cys Tyr Asn Thr Phe Pro Ile Pro Glu Leu
785 790 795 800
Ser Thr Arg Arg Lys Asn Glu Ile Glu Glu Ala Ile Leu Glu Ile Leu
805 810 815
Asp Leu Arg Glu Glu Gln Gly Gly Thr Leu Ala Glu Leu Tyr Asn Pro
820 825 830
Ser Thr Met Pro Ile Glu Leu Lys Val Ala His Glu Lys Leu Asp Gly
835 840 845
Ile Val Glu Arg Ala Tyr Arg Gln Lys Gln Phe Glu Ser Asp Glu Glu
850 855 860
Arg Leu Glu Val Leu Leu Lys Leu Tyr Gln Glu Met Thr Glu Arg
865 870 875
<210>8
<211>952
<212>PRT
<213>未知
<220>
<223>GenBank号gi|9945797|gb|AAG03371.1
<400>8
Met Val Met Ala Pro Thr Thr Val Phe Asp Arg Ala Thr Ile Arg His
1 5 10 15
Asn Leu Thr Glu Phe Lys Leu Arg Trp Leu Asp Arg Ile Lys Gln Trp
20 25 30
Glu Ala Glu Asn Arg Pro Ala Thr Glu Ser Ser His Asp Gln Gln Phe
35 40 45
Trp Gly Asp Leu Leu Asp Cys Phe Gly Val Asn Ala Arg Asp Leu Tyr
50 55 60
Leu Tyr Gln Arg Ser Ala Lys Arg Ala Ser Thr Gly Arg Thr Gly Lys
65 70 75 80
Ile Asp Met Phe Met Pro Gly Lys Val Ile Gly Glu Ala Lys Ser Leu
85 90 95
Gly Val Pro Leu Asp Asp Ala Tyr Ala Gln Ala Leu Asp Tyr Leu Leu
100 105 110
Gly Gly Thr Ile Ala Asn Ser His Met Pro Ala Tyr Val Val Cys Ser
115 120 125
Asn Phe Glu Thr Leu Arg Val Thr Arg Leu Asn Arg Thr Tyr Val Gly
130 135 140
Asp Ser Ala Asp Trp Asp Ile Thr Phe Pro Leu Ala Glu Ile Asp Glu
145 150 155 160
His Ile Glu Gln Leu Ala Phe Leu Ala Asp Tyr Glu Thr Ser Ala Tyr
165 170 175
Arg Glu Glu Glu Lys Ala Ser Leu Glu Ala Ser Arg Leu Met Val Glu
180 185 190
Leu Phe Arg Ala Met Asn Gly Asp Asp Val Asp Glu Ala Val Gly Asp
195 200 205
Asp Ala Pro Thr Thr Pro Glu Glu Glu Asp Glu Arg Val Met Arg Thr
210 215 220
Ser Ile Tyr Leu Thr Arg Ile Leu Phe Leu Leu Phe Gly Asp Asp Ala
225 230 235 240
Gly Leu Trp Asp Thr Pro His Leu Phe Ala Asp Phe Val Arg Ash Glu
245 250 255
Thr Thr Pro Glu Ser Leu Gly Pro Gln Leu Asn Glu Leu Phe Ser Val
260 265 270
Leu Asn Thr Ala Pro Glu Lys Arg Pro Lys Arg Leu Pro Ser Thr Leu
275 280 285
Ala Lys Phe Pro Tyr Val Asn Gly Ala Leu Phe Ala Glu Pro Leu Ala
290 295 300
Ser Glu Tyr Phe Asp Tyr Gln Met Arg Glu Ala Leu Leu Ala Ala Cys
305 310 315 320
Asp Phe Asp Trp Ser Thr Ile Asp Val Ser Val Phe Gly Ser Leu Phe
325 330 335
Gln Leu Val Lys Ser Lys Glu Ala Arg Arg Ser Asp Gly Glu His Tyr
340 345 350
Thr Ser Lys Ala Asn Ile Met Lys Thr Ile Gly Pro Leu Phe Leu Asp
355 360 365
Glu Leu Arg Ala Glu Ala Asp Lys Leu Val Ser Ser Pro Ser Thr Ser
370 375 380
Val Ala Ala Leu Glu Arg Phe Arg Asp Ser Leu Ser Glu Leu Val Phe
385 390 395 400
Ala Asp Met Ala Cys Gly Ser Gly Asn Phe Leu Leu Leu Ala Tyr Arg
405 410 415
Glu Leu Arg Arg Ile Glu Thr Asp Ile Ile Val Ala Ile Arg Gln Arg
420 425 430
Arg Gly Glu Thr Gly Met Ser Leu Asn Ile Glu Trp Glu Gln Lys Leu
435 440 445
Ser Ile Gly Gln Phe Tyr Gly Ile Glu Leu Asn Trp Trp Pro Ala Lys
450 455 460
Ile Ala Glu Thr Ala Met Phe Leu Val Asp His Gln Ala Asn Lys Glu
465 470 475 480
Leu Ala Asn Ala Val Gly Arg Pro Pro Glu Arg Leu Pro Ile Lys Ile
485 490 495
Thr Ala His Ile Val His Gly Asn Ala Leu Gln Leu Asp Trp Ala Asp
500 505 510
Ile Leu Ser Ala Ser Ala Ala Lys Thr Tyr Ile Phe Gly Asn Pro Pro
515 520 525
Phe Leu Gly His Ala Thr Arg Thr Ala Glu Gln Ala Gln Glu Leu Arg
530 535 540
Asp Leu Trp Gly Thr Lys Asp Ile Set Arg Leu Asp Tyr Val Thr Gly
545 550 555 560
Trp His Ala Lys Cys Leu Asp Phe Phe Lys Ser Arg Glu Gly Arg Phe
565 570 575
Ala Phe Val Thr Thr Asn Ser Ile Thr Gln Gly Asp Gln Val Pro Arg
580 585 590
Leu Phe Gly Pro Ile Phe Lys Ala Gly Trp Arg Ile Arg Phe Ala His
595 600 605
Arg Thr Phe Ala Trp Asp Ser Glu Ala Pro Gly Lys Ala Ala Val His
610 615 620
Cys Val Ile Val Gly Phe Asp Lys Glu Ser Gln Pro Arg Pro Arg Leu
625 630 635 640
Trp Asp Tyr Pro Asp Val Lys Gly Glu Pro Val Ser Val Glu Val Gly
645 650 655
Gln Ser Ile Asn Ala Tyr Leu Val Asp Gly Pro Asn Val Leu Val Asp
660 665 670
Lys Ser Arg His Pro Ile Ser Ser Glu Ile Ser Pro Ala Thr Phe Gly
675 680 685
Asn Met Ala Arg Asp Gly Gly Asn Leu Leu Val Glu Val Asp Glu Tyr
690 695 700
Asp Glu Val Met Ser Asp Pro Val Ala Ala Lys Tyr Val Arg Pro Phe
705 710 715 720
Arg Gly Ser Arg Glu Leu Met Asn Gly Leu Asp Arg Trp Cys Leu Trp
725 730 735
Leu Val Asp Val Ala Pro Ser Asp Ile Ala Gln Ser Pro Val Leu Lys
740 745 750
Lys Arg Leu Glu Ala Val Lys Ser Phe Arg Ala Asp Ser Lys Ala Ala
755 760 765
Ser Thr Arg Lys Met Ala Glu Thr Pro His Leu Phe Gly Gln Arg Ser
770 775 780
Gln Pro Asp Thr Asp Tyr Leu Cys Leu Pro Lys Val Val Ser Glu Arg
785 790 795 800
Arg Ser Tyr Phe Thr Val Gln Arg Tyr Pro Ser Asn Val Ile Ala Ser
805 810 815
Asp Leu Val Phe His Ala Gln Asp Pro Asp Gly Leu Met Phe Ala Leu
820 825 830
Ala Ser Ser Ser Met Phe Ile Thr Trp Gln Lys Ser Ile Gly Gly Arg
835 840 845
Leu Lys Ser Asp Leu Arg Phe Ala Asn Thr Leu Thr Trp Asn Thr Phe
850 855 860
Pro Val Pro Glu Leu Asp Glu Lys Thr Arg Gln Arg Ile Ile Lys Ala
865 870 875 880
Gly Lys Lys Val Leu Asp Ala Arg Ala Leu His Pro Glu Arg Ser Leu
885 890 895
Ala Glu His Tyr Asn Pro Leu Ala Met Ala Pro Glu Leu Ile Lys Ala
900 905 910
His Asp Ala Leu Asp Arg Glu Val Asp Lys Ala Phe Gly Ala Pro Arg
915 920 925
Lys Leu Thr Thr Val Arg Gln Arg Gln Glu Leu Leu Phe Ala Asn Tyr
930 935 940
Glu Lys Leu Ile Ser His Gln Pro
945 950
<210>9
<211>168
<212>PRT
<213>未知
<220>
<223>GenBank号gi|23451826|gb|AAN32874.1
<400>9
Pro Ala Asp Glu Arg Ser Gln Met Asp Ala Gly Gly Lys Pro Val Glu
1 5 10 15
Gly Gly Asn Leu Leu Phe Ala Glu Glu Glu Lys Gln Arg Leu Val Glu
20 25 30
Gly Asn Val Asp Val Val Lys Phe Leu Lys Arg Val Tyr Gly Ala Ser
35 40 45
Glu Tyr Ile Arg Gly Glu Val Arg Phe Cys Leu Trp Ile Ser Asp Ser
50 55 60
Gln Glu Gln Glu Ala Lys Ser Asn Ser Asp Ile Asn Cys Lys Leu Asn
65 70 75 80
Ala Val Ala Ala Phe Arg Leu Lys Ser Pro Lys Ala Ala Thr Lys Lys
85 90 95
Gly Ala Ala Trp Pro His Lys Phe Glu Glu Val Lys Gln Ile Gly Asn
100 105 110
Glu Val Val Thr Ile Val Pro Lys Val Ser Ser Glu Ser Arg Glu Tyr
115 120 125
Leu Pro Val Gly Leu Leu Pro Arg Gly Ser Ile Val Thr Asp Leu Ala
130 135 140
Phe Ala Leu Tyr Asp Ala Pro Leu Trp Asn Met Ala Leu Ile Ala Ser
145 150 155 160
Arg Leu His Leu Val Trp Ile Gly
165
<210>10
<211>909
<212>PRT
<213>未知
<220>
<223>GenBank号gb|23110638|gb|ZP00096791.1
<400>10
Met Asn Pro Val Glu Ile Glu Glu Ala Val Ser Asp Leu Ala Arg Ala
1 5 10 15
Pro Tyr Asp Ala Ser Glu Phe Pro Phe Gln Phe Leu Ala Ala Phe Gly
20 25 30
Asn Lys Gln Thr Thr Leu Gln Arg Leu Arg Ala Gly Asn Ser Asn Gln
35 40 45
Ser Asp Leu Pro Gly Ala Val Leu Gln Arg Asn His Ile His Ile Ala
50 55 60
Thr Cys Asp Ala Gly Asn Val Asp Arg Thr Leu Ala Ala Leu Arg Lys
65 70 75 80
Ser Pro Lys Thr Ala Ser Gln Lys Ala Arg Phe Ile Leu Ala Thr Asp
85 90 95
Gly Val Ala Phe Gln Ala Glu Asp Met Ala Ser Gly Glu Thr Val Ala
100 105 110
Cys Asn Tyr Ala Ala Phe Pro Asp Lys Phe Ala Phe Phe Leu Pro Leu
115 120 125
Ala Gly Ile Thr Thr Val Gln Gln Ile Arg Glu Ser Ser Phe Asp Ile
130 135 140
Lys Ala Thr Gly Arg Leu Asn Lys Leu Tyr Val Glu Leu Leu Lys Asp
145 150 155 160
Asn Pro Asp Trp Ala Ser Arg Ser Glu Asp Met Asn His Phe Met Ala
165 170 175
Arg Leu Ile Phe Cys Phe Phe Ala Glu Asp Thr Asp Ile Phe Val Gly
180 185 190
Glu Gly Leu Phe Ser Arg Thr Val Glu Thr Met Ser Ale Arg Asp Ala
195 200 205
Ser Asp Thr His Met Val Ile Ala Glu Ile Phe Arg Ala Met Asp Thr
210 215 220
Arg Leu Ala Asp Arg Ala Ala Ala Gly Ile Lys Ser Trp Ala Asp Val
225 230 235 240
Phe Pro Tyr Val Asn Gly Gln Leu Phe Ser Gly Ser Thr Glu Cys Pro
245 250 255
Arg Phe Ser Lys Ils Ala Arg Ser Tyr Leu Leu His Ile Gly Ser Leu
260 265 270
Asp Trp Gln Lys Ile Asn Pro Asp Ile Phe Gly Ser Met Ile Gln Ala
275 280 285
Val Ala Asp Asp Glu Glu Arg Gly Ala Leu Gly Met His Tyr Thr Ser
290 295 300
Val Pro Asn Ile Leu Lys Val Leu Asn Pro Leu Phe Leu Asp Asp Leu
305 310 315 320
Arg Ala Lys Leu Glu Glu Ala Gly Asp Asn Ser Arg Lys Leu Leu Asn
325 330 335
Leu Arg Asn Arg Met Ala Lys Ile Arg Val Phe Asp Pro Ala Cys Gly
340 345 350
Ser Gly Asn Phe Leu Val Ile Ala Tyr Lys Gln Met Arg Glu Leu Glu
355 360 365
Ala Glu Ile Asn Arg Arg Arg Gly Glu Ala Asp Arg Arg Ser Asp Ile
370 375 380
Pro Leu Thr Asn Phe Arg Gly Ile Glu Leu Arg Asn Phe Pro Ala Glu
385 390 395 400
Ile Ala Arg Leu Ala Leu Ile Ile Ala Glu Tyr Gln Cys Asp Val Leu
405 410 415
Tyr Arg Gly Gln Lys Glu Ala Leu Ala Glu Phe Leu Pro Leu Asp Ser
420 425 430
Gln Asn Trp Ile Thr Cys Gly Asn Ala Leu Arg Leu Asp Trp Leu Ser
435 440 445
Ile Cys Pro Pro Thr Gly Thr Ala Val Lys Leu Gln Ala Asn Asp Leu
450 455 460
Phe Glu Met Pro Leu Asp Gln Ala Glu Ile Asp Phe Glu Asn Glu Gly
465 470 475 480
Gly Glu Thr Tyr Ile Cys Gly Asn Pro Pro Tyr Leu Gly Ala Lys Lys
485 490 495
Lys Ser Ser Asp Gln Ile Glu Asp Met Lys Arg Val Gly Leu Asp Lys
500 505 510
Ala Gln Leu Leu Asp Tyr Val Ser Ala Phe Ile Val Arg Gly Leu Pro
515 520 525
Leu Val Ala Gln Gln Arg Cys Asp Met Ala Leu Val Ser Thr Ser Ser
530 535 540
Ile Cys Gln Gly Glu Gln Val Ser Leu Ile Trp Pro Arg Ile Leu Lys
545 550 555 560
Ser Ala Asn Val Lys Phe Ala Tyr Arg Pro Phe Arg Trp Ser Asn Ser
565 570 575
Ala Ala Asn Asn Ala Gly Val Tyr Cys Thr Ile Ile Gly Leu Thr Gly
580 585 590
Ser Glu Val Ser Asn Lys Lys Leu Phe Gly Glu Gly Ser Val Val Glu
595 600 605
Cys Ser Ser Ile Ala Pro Tyr Leu Val Pro Gly Pro Glu Ile Ile Cys
610 615 620
Ala Pro Arg Gln Ser Ser Ile Ser Gly Phe Ala Arg Met Val Met Gly
625 630 635 640
Ser Asn Pro Val Asp Gly Lys Arg Leu Ile Phe Glu Gln Asp Glu Lys
645 650 655
Glu Ser Val Val Ala Ala Asp Pro Arg Ser Glu Arg Phe Phe Lys Arg
660 665 670
Tyr Gly Gly Thr Gln Glu Leu Val Asn Gly Val Asp Arg Trp Cys Leu
675 680 685
Trp Ile Asn Asp Asp Gln Val Asp Asp Ala Lys Ala Ile Ala Glu Ile
690 695 700
Ala Lys Val Leu Glu Ser Cys Arg Ser Tyr Arg Gln Gly Ala Gly Arg
705 710 715 720
Asp Ala Gln Lys Ala Ala Asn Arg Pro His Ser Phe Cys Tyr Arg Thr
725 730 735
Phe Gln Glu Asn Ile Gly Ile His Val Gly Leu Thr Ile Gly Asn Gly
740 745 750
Leu Ser His Val Pro Ala Asp Leu Lys Ser Ser Gly Phe Val Ser Ser
755 760 765
His Thr Ala Tyr Met lle Tyr Gly Trp His Pro Val Glu Phe Ala Leu
770 775 780
Leu Asn Ser Arg Leu Met Leu Val Trp Thr Glu Thr Val Gly Gly Arg
785 790 795 800
Leu Gly Asn Gly Met Arg Phe Ser Asn Thr Ile Val Tyr Asn Thr Phe
805 810 815
Pro Val Pro Ser Leu Thr Asp Gln Asn Lys Ala Asp Leu Thr Arg Cys
820 825 830
Ala Glu Asp Ile Leu Leu Ala Arg Glu Ser His Phe Pro Ala Thr Ile
835 840 845
Ala Asp Leu Tyr Asp Pro Glu Thr Met Pro Glu Ser Leu Arg Ala Ala
850 855 860
His Asp Arg Asn Asp Glu Val Leu Glu Arg Ile Tyr Ile Gly Arg Arg
865 870 875 880
Phe Arg Asn Asp Thr Glu Arg Leu Glu Lys Leu Phe Glu Leu Tyr Thr
885 890 895
Lys Met Thr Gly Gly Arg Ser Ser Glu Gly Gly Ala Ala
900 905
<210>11
<211>1048
<212>PRT
<213>未知
<220>
<223>GenBank号gi|20803963|emb|CAD31540.1
<400>11
Met Ser Leu Gly Ala Ala Gly Leu Thr Pro Ile Thr Pro Ala Ala Phe
1 5 10 15
Ile Lys Lys Trp Arg Lys Ser Glu Leu Gly Glu Arg Gln Ala Ala Gln
20 25 30
Glu His Phe Leu Asp Ile Cys Ser Leu Val Gly His Pro Ser Pro Ser
35 40 45
Asp Glu Asp Pro Thr Gly Ala Phe Phe Ala Phe Glu Lys Gly Ala Asn
50 55 60
Lys Leu Gly Gly Gly Lys Gly Phe Ala Asp Val Trp Lys Lys Gly His
65 70 75 80
Phe Ala Trp Glu Tyr Lys Arg Lys Lys Gly Asn Leu Asp Glu Ala Leu
85 90 95
Leu Gln Leu Met Arg Tyr Ala Pro Ala Leu Leu Ser Pro Pro Leu His
100 105 110
Ile Val Cys Asp Ile Glu Arg Leu Arg Ile His Thr Ala Trp Thr Asn
115 120 125
Thr Val Pro Ser Thr Tyr Val Ile Thr Leu Asp Asp Leu Ala Glu Pro
130 135 140
Ser Ala Arg Glu Met Leu His Asn Val Phe Phe Ser Pro Glu Lys Leu
145 150 155 160
Arg Pro Thr Arg Thr Arg Ala Ala Val Thr Lys Glu Ala Ala Asp Lys
165 170 175
Phe Ser Ala Ile Ala Leu Arg Val Gln Gly Arg Gly Thr Pro Asp Glu
180 185 190
Ile Ala His Phe Val Asn Gln Leu Val Phe Cys Phe Phe Ala Gln Ser
195 200 205
Val Ser Leu Leu Pro Asp Gly Leu Phe Thr Lys Leu Leu Lys Arg Ser
210 215 220
Ala Arg Ala Pro Glu Arg Ala Met Ser Tyr Leu Asp Lys Leu Phe Glu
225 230 235 240
Ala Met Glu Arg Gly Gly Glu Phe Asp Leu Thr Asp Ile Thr Trp Phe
245 250 255
Asn Gly Gly Leu Phe Asp Gly Arg Arg Ala Leu Arg Leu Asp Asp Gly
260 265 270
Asp Ile Gly Leu Leu Val Ala Ala Asp Ser Leu Asp Trp Gly Leu Ile
275 280 285
Asp Pro Thr Ile Phe Gly Thr Leu Phe Glu Arg Phe Leu Asp Pro Glu
290 295 300
Lys Arg Ala Gln lle Gly Ala His Tyr Thr Asp Pro Glu Lys Ile Met
305 310 315 320
Arg Leu Val Asp Pro Val Ile Leu Arg Pro Leu Arg Gln Glu Trp Glu
325 330 335
Gln Ala Arg Arg Glu Ile Val Glu Leu Leu Asn Gly Asn Arg Lys Pro
340 345 350
Pro Met Arg Arg Gln Gln Ser Arg Arg Met Lys Arg Glu Glu Ala Ala
355 360 365
Ala Glu Val Arg Ser Arg Phe Thr Glu Arg Leu Arg Lys Leu Arg Ile
370 375 380
Leu Asp Pro Ala Cys Gly Ser Gly Asn Phe Leu Tyr Leu Ala Leu Gln
385 390 395 400
Gly Val Lys Asp Ile Glu His Arg Ala Asn Leu Asp Cys Glu Met Leu
405 410 415
Gly Met Pro Ala Gln Leu Pro Leu Val Gly Pro Glu Ile Leu Arg Gly
420 425 430
Ile Glu Ile Asn Met Met Ala Ala Glu Leu Ala Arg Thr Thr Ile Trp
435 440 445
Ile Gly Asp Ile Gln Trp Gln Ile Lys Asn Gly Ile Arg Ser Lys Ser
450 455 460
Ile Pro Ile Leu Arg Lys Leu Asp Ala Ile Glu Arg Arg Asp Ala Leu
465 470 475 480
Val Arg Gln Ala Gln Asp Val Asp Thr Ala Arg Asp Ala Gln Gly Asp
485 490 495
Leu Leu Ala Ala Leu Gln Pro Val Ser Glu Asp Ala Glu Ala Glu Trp
500 505 510
Pro Glu Ala Glu Phe Ile Val Gly Asn Pro Pro Phe Val Gly Val Arg
515 520 525
Leu Met Arg Gln Ala Leu Gly Asp Pro Thr Val Asp Arg Leu Phe Asp
530 535 540
Val Tyr Asp Gly Arg Val Ser Arg Glu Ala Asp Leu Val Cys Tyr Trp
545 550 555 560
Val Glu Lys Ser Arg Ala Ala Val Ala Ala Asp Arg Thr Arg Arg Val
565 570 575
Gly Leu Val Thr Thr Asn Ser Ile Arg Gly Gly Ala Asn Arg Arg Val
580 585 590
Leu Asp Arg Ile Ile Ala Glu Ser Arg Leu Phe Glu Ala Trp Ser Asp
595 600 605
Glu Pro Trp Val Val Asp Gly Ala Ala Val Arg Val Ser Leu Ile Cys
610 615 620
Phe Gly His Gly Glu Asp Pro Leu Cys Leu Asp Gly Arg Thr Val Ala
625 630 635 640
Gln Ile Asn Ala Asp Leu Thr Ala Gly Val Thr Asp Leu Thr Lys Ala
645 650 655
Arg Arg Leu Ser Glu Asn Gln Asn Val Ala Phe Met Gly Asp Thr Lys
660 665 670
Gly Gly Ala Phe Asp Val Pro Gly Ser Leu Ala Arg Ala Trp Leu Ser
675 680 685
Met Pro Met Asn Pro Asn Gly Arg Pro Asn Ser Asp Val Leu Arg Pro
690 695 700
Trp Arg Asn Gly Met Asp Val Ala Arg Arg Gly Arg Asp Met Trp Ile
705 710 715 720
Val Asp Phe Gly Trp Glu Met Ser Glu Gln Glu Ala Ala Leu Tyr Glu
725 730 735
Ala Pro Phe Gln His Ile Arg Glu His Val Phe Pro Glu Arg Ser Lys
740 745 750
Asn Arg Arg Asp Ala Tyr Arg Glu Arg Trp Trp Arg His Val Glu Pro
755 760 765
Arg Pro Ala Phe His Ala Ser Leu Gln Gly His Ser Arg Tyr Met Ala
770 775 780
Thr Pro Arg Val Ala Lys His Arg Thr Phe Val Trp Leu Asp Gln Ala
785 790 795 800
Ile Val Pro Asp Ser Arg Ile Phe Ala Phe Ser Arg Ser Asp Asp Val
805 810 815
Phe Phe Gly Ile Leu His Ser Arg Phe His Glu Ala Trp Ser Phe Gly
820 825 830
Thr Cys Ser Trp His Gly Val Gly Asn Asp Pro Thr Tyr Asn Ser Ala
835 840 845
Gly Val Phe Glu Thr Phe Pro Phe Pro Glu Gly Leu Thr Pro Asp Ile
850 855 860
Pro Ala Val Arg Tyr Glu Lys Asp Ser Arg Ala Ile Ala Ile Ser Lys
865 870 875 880
Ala Ala Lys Arg Leu Asp Asp Ile Arg Asn Ala Trp Leu Asn Pro Ser
885 890 895
Asp Leu Val Gln Ile Lys Pro Glu Val Val Pro Gly Tyr Pro Asp Arg
900 905 910
Ile Leu Pro Lys Asp Ile Ala Ser Asp Ala Ile Leu Arg Asp Arg Thr
915 920 925
Leu Thr Asn Leu Tyr Asn Arg Arg Pro Gln Trp Leu Val Asp Ala His
930 935 940
Ser Asp Leu Asp Ala Ala Val Ala Gly Ala Tyr Gly Trp Pro Ala Asp
945 950 955 960
Ile Ser Glu Asp Glu Ala Leu Ala Asn Leu Leu Glu Leu Asn Leu Ala
965 970 975
Arg Glu Ala Phe Asn Glu His Ala Lys Ser Gly Leu Lys Thr Arg Lys
980 985 990
Pro Arg Arg Arg Pro Thr Pro Glu Glu Val Arg Arg Ala Pro Gln Met
995 10001005
Lys Leu Pro Ile Ala Gly Gly Arg Lys Ser Val Val Gly Pro Gln
101010151020
Gln Leu Thr Thr Lys Asp Arg Glu Asn Gln Pro Thr Ser Ala Glu
102510301035
Arg Pro Arg Asn Thr Lys Arg Arg Thr Ser
10401045
<210>12
<211>959
<212>PRT
<213>未知
<220>
<223>GenBank号gi|16125079|ref|NP_419643.1
<400>12
Asp Leu Cys Arg Met Leu Glu Val Pro Thr Pro Ala Glu Asp Asp Pro
1 5 10 15
Leu Gly Glu Arg Tyr Cys Phe Glu Arg Gly Ala Ala Lys Thr Gly Gly
20 25 30
Gly Asp Gly Trp Ala Asp Val Trp Arg Lys Gly Cys Phe Gly Trp Glu
35 40 45
Tyr Lys Gly Lys His Lys Asn Leu Asp Ala Ala Leu Arg Gln Leu Gln
50 55 60
Ala Tyr Ala Leu Asp Leu Gln Asn Pro Pro Tyr Leu Val Val Ser Asp
65 70 75 80
Met Glu Arg Ile Ile Val His Thr Asn Trp Thr Asn Thr Ile Ser Arg
85 90 95
Lys Ile Glu Phe Thr Leu Asp Asp Leu His Glu Pro Glu Lys Leu Ala
100 105 110
Mer Ler Arg Gln Val Phe Asp Gly Ser Asp Ser Leu Lys Pro Lys Ile
115 120 125
Ser Pro Gln Glu Leu Thr Ala Lys Val Ala Gln Arg Phe Gly Asp Leu
130 135 140
Gly Arg Arg Leu Gln Glu Arg Gly His His Pro Arg Asp Val Ala His
145 150 155 160
Phe Leu Asn Arg Val Val Phe Cys Met Phe Ala Glu Asp Ala Lys Leu
165 170 175
Leu Pro Glu Gly Leu Phe Thr Arg Leu Thr Arg Ser Met Gln Met Arg
180 185 190
Pro Pro Ala Glu Ala Ala Pro Gln Phe Asp Ala Leu Phe Ala Met Met
195 200 205
Arg Ala Gly Gly Met Phe Gly Ala Asp Ile Val His Trp Phe Asn Gly
210 215 220
Gly Leu Phe Asp Glu Lys Pro Ala Leu Pro Leu Glu Arg Ala Asp Ile
225 230 235 240
Lys Leu Ile His Asp Thr Ala Ala Glu His Asp Trp Ser Asp Leu Asp
245 250 255
Pro Ser Val Phe Gly Asn Met Phe Glu Glu Ala Leu Lys Ala Thr Arg
260 265 270
Glu Arg Ala Ala Leu Gly Ala His Tyr Thr Asp Arg Glu Lys Ile Leu
275 280 285
Lys Ile Ile Asp Pro Val Ile Thr Trp Pro Leu Met Ala Gln Trp Glu
290 295 300
Thr Ala Leu Ala Glu Ile Arg Ala Ala Leu Asp Ala Arg Ala Ala Ala
305 310 315 320
Glu Ala Glu Arg Lys Ala Val Leu Glu Ala Ala Ala Glu Ala Met Arg
325 330 335
Ala Asp Pro Val Lys Ala Lys Ala Gly Glu Ala Ala Arg Arg Lys Thr
340 345 350
Leu Thr Ala Ile Ala Lys Arg Ser Asp Ala Ala Leu Gly Gln Ala Lys
355 360 365
Asp Arg Leu Glu Ala Phe Leu Ser Arg Leu Ala Ala Phe Arg Val Leu
370 375 380
Asp Pro Ala Cys Gly Ser Gly Asn Phe Leu Tyr Val Ala Leu His Ala
385 390 395 400
Leu Lys Asp Ile Glu Arg Arg Ala Leu Val Asp Ala Glu Arg Leu Gly
405 410 415
Leu Glu Val Pro Thr Pro Arg Val Gly Leu Ala Cys Val Arg Gly Ile
420 425 430
Glu Ile Glu Glu Tyr Ala Ala Glu Leu Ala Arg Val Thr Leu Trp Ile
435 440 445
Gly Asp Leu Gln Trp His Ala Lys Asn Asn Tyr Arg Gly Phe Ala Glu
450 455 460
Pro Ile Leu Ser Ser Leu Asp Gln Ile Glu Cys Arg Asp Ala Leu Leu
465 470 475 480
Asn Ala Asp Gly Thr Glu Ala Gln Trp Pro Ala Val Asp Val Ile Val
485 490 495
Gly Asn Pro Pro Phe Leu Gly Ser Lys Arg Leu Arg Asp Gly Leu Gly
500 505 510
Asn Asp Tyr Val Glu Arg Leu Phe Ser Thr Tyr Arg Gly Lys Val Pro
515 520 525
Ala Glu Ala Asp Phe Val Ala Tyr Trp Ile Ala Lys Ala Trp Glu Leu
530 535 540
Val Gln Ala Gln Gln Gly Arg Arg Ala Gly Leu Val Thr Thr Asn Ser
545 550 555 560
Val Arg Gly Gly Ala Ser Arg Lys Val Leu Asp Pro Ile Ala Asp Ala
565 570 575
Gly Ala Leu Met Glu Ala Trp Ala Asp Glu Pro Trp Ala Leu Glu Gly
580 585 590
Ala Ala Val Arg Val Ser Met Phe Gly Phe Gly Asp Gly Phe Ala Glu
595 600 605
Arg Arg Leu Glu Gly Arg Lys Ala Glu His Leu His Ser Asp Phe Arg
610 615 620
Gly Ala Ser Thr Asp Val Thr Lys Ala Leu Arg Leu Lys Glu Asn Ala
625 630 635 640
Ser Ile Ala Phe Met Gly Asp Thr Lys Gly Gly Ala Phe Asp Val Ser
645 650 655
Gly Glu Ile Ala Arg Glu Trp Leu Arg Leu Pro Leu Asn Pro Ash Gly
660 665 670
Arg Pro Asn Ser Asp Val Leu Lys Pro Trp Arg Asn Ala Met Asp Met
675 680 685
Thr Arg Arg Ser Ser Asp Lys Trp Ile Ile Asp Phe Gly Trp Thr Met
690 695 700
Ser Glu Ala Asp Ala Ala Leu Phe Glu Thr Pro Phe Arg His Val Leu
705 710 715 720
Leu His Val Lys Pro Glu Arg Asp Arg Ash Asn Arg Glu Met Tyr Arg
725 730 735
Leu Asn Trp Trp Lys His Val Glu Pro Arg Gln Gly Leu Met Lys Arg
740 745 750
Val Pro Ala Leu Ser Arg Leu Leu Val Thr Pro Glu Val Ser Lys His
755 760 765
Arg Leu Phe Ile Trp Leu Asp Ala Arg Val Leu Pro Asp His Lys Leu
770 775 780
Gln Val Val Thr Leu Asp Asp Asp Cys Ser Phe Gly Val Leu His Ser
785 790 795 800
Arg Phe His Glu Val Trp Ala Leu Ala Ala Gly Ser Trp His Gly Ser
805 810 815
Gly Asn Asp Pro Arg Tyr Thr Ile Ser Thr Thr Phe Glu Thr Phe Pro
820 825 830
Phe Pro Glu Gly Leu Thr Pro Asn Ile Ala Ala Val Asp Tyr Glu Gly
835 840 845
Asp Pro Arg Ala Gln Ala Ile Ala Ala Ala Ala Ala Glu Leu Asn Arg
850 855 860
Leu Arg Glu Ala Trp Leu Asn Pro Pro Asp Leu Val Arg Ile Glu Pro
865 870 875 880
Glu Val Val Pro Gly Tyr Pro Asp Arg Val Leu Pro Val Ser Pro Glu
885 890 895
Ala Gly Ala Glu Leu Lys Lys Arg Thr Leu Thr Asn Leu Tyr Asn Gln
900 905 910
Arg Pro Ala Trp Leu Asp Met Ala His Gln Arg Leu Asp Ala Ala Val
915 920 925
Ala Ala Ala Tyr Gly Trp Pro Asp Gly Leu Thr Asp Asp Glu Ile Leu
930 935 940
Glu Arg Leu Phe Ala Leu Asn Gln Glu Arg Ala Ala Ala Gly Arg
945 950 955
<210>13
<211>909
<212>PRT
<213>未知
<220>
<223>GenBank号gi|15807788|ref|NP_285443.1
<400>13
Met His Pro Gln Glu Phe Ala Asp Thr Trp Ser Arg Arg Ala Leu Lys
1 5 10 15
Ala Thr Glu Arg Asp Ser Tyr Val Gln His Trp Leu Asp Leu Cys Gln
20 25 30
Leu Leu His His Glu Ala Pro Gly Ala Asp Pro Asp Tyr Lys Phe Glu
35 40 45
Arg Arg Val Thr Lys Val Gly Thr Lys Asp Lys Gly Phe Ala Asp Val
50 55 60
Phe Lys Lys Ala His Phe Ile Thr Glu Tyr Lys Arg Pro Gly Ser Asp
65 70 75 80
Leu Gly Ala Ala Leu Gln Gln Ala Thr Leu Tyr Ser Arg Asp Leu Gly
85 90 95
Asn Pro Pro Leu Leu Leu Thr Ser Asp Phe Gln Arg Ile Glu Ile Asn
100 105 110
Thr Ala Phe Thr Gly Thr Ser Pro Lys Ser Tyr Leu Ile Thr Leu Asp
115 120 125
Asp Ile Ala Glu Asn Arg Val Val Gly Gly Asn Asp Val Pro Ala Leu
130 135 140
Gln Ile Leu His Ser Ala Leu His Gln Pro Tyr Asp Leu Asp Pro Arg
145 150 155 160
Leu Phe Arg Glu Arg Ile Thr Thr Asp Ala Thr Arg Gln Val Gly Leu
165 170 175
Val Ala Arg Arg Leu Gly Glu Arg Glu Gly Arg Thr Arg Ala Ala His
180 185 190
Met Met Met Arg Val Val Phe Ala Leu Phe Ala Glu Asp Thr Gly Met
195 200 205
Leu Glu Arg Gly Ile Val Thr Arg Leu Leu Glu Arg Ala Arg Ala Pro
210 215 220
Pro Gly Glu Asp Gln Leu Tyr Phe Gln Asp Leu Phe Gly Ala Met Lys
225 230 235 240
Gly Gly Gly Glu Phe Trp Gly Thr Asp Ile Arg His Phe Asn Gly Gly
245 250 255
Leu Phe Asp Ser Glu Asp Ala Leu Ala Leu Thr Ser Glu Asp Ala Ala
260 265 270
Ala Leu Ile Ile Ala Ala Lys Leu Asp Trp Ser Glu Val Glu Pro Ser
275 280 285
Ile Phe Gly Thr Leu Phe Glu Asn Ser Leu Asp Val Asp Thr Arg Ser
290 295 300
Arg Arg Gly Ala His Tyr Thr Ser Val Asn Asp Ile Glu Arg Ile Val
305 310 315 320
Asp Arg Val Val Met Glu Pro Leu Trp Ala Glu Trp Asp Ala Leu Arg
325 330 335
Leu Ser Leu Pro Glu Leu Lys Lys Asn Val Arg Leu Glu Arg Leu Phe
340 345 350
Ala Phe Gln Asp Arg Leu Thr Ala Val Arg Ile Leu Asp Pro Ala Cys
355 360 365
Gly Ser Gly Asn Phe Leu Phe Val Ala Leu Lys Lys Leu Leu Asp Leu
370 375 380
Glu Tyr Gln Val Arg Met Ala Ala Val Met Asn Asp Ile Gly Glu Phe
385 390 395 400
Glu Met Pro Pro Leu Val His Pro Gln Gln Met Leu Gly Ile Glu Ile
405 410 415
Glu Thr Phe Ala His Glu Leu Ala Ser Ile Thr Leu Trp Met Gly Tyr
420 425 430
Phe Gln Trp Lys Arg Ala His Gly Gly His Trp Glu Thr Pro Ile Leu
435 440 445
Gln Arg Leu Asp Asn Ile Gln Asn Arg Asp Ala Leu Leu Asn Pro Asp
450 455 460
Gly Thr Glu Ala Thr Trp Pro Arg Ala Asp Phe Ile Val Gly Asn Pro
465 470 475 480
Pro Phe Leu Gly Asp Lys Met Met Arg Ser Gln Leu Gly Glu Ala Tyr
485 490 495
Thr Thr Gln Leu Arg Glu Thr Phe Lys Asp Arg Leu Pro Gly Gln Ser
500 505 510
Asp Leu Val Cys Tyr Trp Pro Glu Lys Ala Arg Ala Leu Ile Glu Ala
515 520 525
Gly Val Thr Thr Arg Ala Gly Phe Val Thr Thr Asn Ser Ile Arg Gly
530 535 540
Gly Lys Asn Arg Val Val Leu Glu Arg Ile Lys Ala Thr Gly Asp Leu
545 550 555 560
Phe Met Ala Trp Pro Asp Glu Pro Trp Gln Gln Asn Gly Ala Ala Val
565 570 575
Arg Val Ser Leu Phe Gly Phe Asp Asn Gly Thr Glu Thr Leu Arg Thr
580 585 590
Leu Asn Asp Gly His Val Gly Val Ile Asn Ala Asp Leu Asn Ala Gly
595 600 605
Thr Asp Val Lys Gln Ala Gln Lys Leu Pro Glu Asn Ala Gly Val Ser
610 615 620
Phe Ile Gly Thr Gln Lys Gly Gly Ala Phe Asp Ile Pro Gly Asp Leu
625 630 635 640
Ala Arg Ser Trp Leu Ser Val Pro Asn Pro Asp Arg Val Ser Asn Ala
645 650 655
Asp Val Leu Lys Pro Trp Val Asn Gly Met Asp Leu Thr Arg Arg Pro
660 665 670
Ser Gly Arg Trp Ile Ile Asp Phe Ala Gln Met Asp Glu Gly Glu Ala
675 680 685
Arg Gln Tyr Leu Gln Pro Met Ala Tyr Val Glu Gln Lys Ile Arg Pro
690 695 700
Glu Arg Ala Thr Asn Ser Asp Arg Pro Ser Arg Glu Arg Trp Trp Leu
705 710 715 720
His Gln Arg Ser Arg Pro Glu Leu Arg Glu Ala Thr Ile Glu Leu Asp
725 730 735
Arg Phe Ile Gly Ile Pro Arg Val Ala Lys His Leu Leu Pro Val Trp
740 745 750
Leu Pro Glu Gly Thr Leu Pro Asp Ser Gln Val Val Val Ile Ala Arg
755 760 765
Asp Asp Asp Phe Ile Phe Gly Val Leu Ala Ser Thr Ile His Arg Ser
770 775 780
Trp Ala Arg Met Gln Gly Thr Tyr Met Gly Val Gly Asn Asp Leu Arg
785 790 795 800
Tyr Thr Pro Ser Thr Cys Phe Glu Thr Phe Pro Val Pro Ala Pro Thr
805 810 815
Asp Glu Gln Arg Ala Glu Ile Glu Lys Trp Ala Lys Tyr Ile Val Gln
820 825 830
Leu Arg Glu His Leu Leu Asn Gln Asp Ala Lys Gly Thr Leu Thr Gly
835 840 845
Ile Tyr Asn Gln Leu Glu Lys Leu Arg Asn Ser Pro Asp Ala Ala His
850 855 860
Pro Val Ser Ala Leu Ala Thr Ala His Asp Lys Leu Asp Gln Ala Val
865 870 875 880
Ala Thr Ala Tyr Gly Trp Glu Trp Pro Leu Asn Glu Asp Gln Val Leu
885 890 895
Glu Arg Leu Leu Ala Leu Asn Leu Glu Arg Cys Pro Ala
900 905
<210>14
<211>955
<212>PRT
<213>未知
<220>
<223>GenBank号gi|15807258|ref|NP_295988.1
<220>
<221>misc_feature
<222>(920)..(920)
<223>Xaa可以是任何天然发生的氨基酸
<400>14
Met Pro Gln Thr Glu Thr Ala Gln Arg Met Glu Asp Phe Val Ala Tyr
1 5 10 15
Trp Arg Thr Leu Lys Gly Asp Glu Lys Gly Glu Ser Gln Val Phe Leu
20 25 30
Asp Arg Leu Phe Gln Ala Phe Gly His Ala Gly Tyr Lys Glu Ala Gly
35 40 45
Ala Glu Leu Glu Tyr Arg Val Ala Lys Gln Gly Gly Gly Lys Lys Phe
50 55 60
Ala Asp Leu Leu Trp Arg Pro Arg Val Leu Ile Glu Met Lys Lys Arg
65 70 75 80
Gly Glu Lys Leu Ala Asn His Tyr Gln Gln Ala Phe Asp Tyr Trp Leu
85 90 95
Lys Leu Val Pro Asp Arg Pro Arg Tyr Ala Val Leu Cys Asn Phe Asp
100 105 110
Glu Leu Trp Val Tyr Asp Phe Asn Gln Gln Leu Asp Glu Pro Met Asp
115 120 125
Arg Leu Arg Ile Glu Glu Leu Pro Glu Arg Tyr Thr Val Leu Asn Phe
130 135 140
Met Phe Glu Gln Glu Arg Ala Pro Leu Phe Gly Asn Asn Arg Val Asp
145 150 155 160
Val Thr Arg Glu Ala Ala Asp Ser Val Ala Lys Val Leu Asn Ser Val
165 170 175
Ile Ala Arg Gly Glu Asp Arg Ala Arg Ala Gln Arg Phe Leu Leu Gln
180 185 190
Cys Val Met Ala Met Phe Ala Glu Asp Phe Glu Leu Ile Pro Arg Gly
195 200 205
Phe Phe Thr Glu Leu Ala Asp Asp Ala Arg Ala Gly Arg Gly Ser Ser
210 215 220
Phe Asp Leu Phe Gly Gly Leu Phe Arg Gln Met Asn Thr Ser Glu Arg
225 230 235 240
Ala Arg Gly Gly Arg Phe Ala Pro Ile Pro Tyr Phe Asn Gly Gly Leu
245 250 255
Phe Arg Ala Val Asp Pro Ile Glu Leu Asn Arg Asp Glu Leu Tyr Leu
260 265 270
Leu His Lys Ala Ala Leu Glu Asn Asn Trp Ala Arg Ile Gln Pro Gln
275 280 285
Ile Phe Gly Val Leu Phe Gln Ser Ser Met Asp Lys Lys Glu Gln His
290 295 300
Ala Lys Gly Ala His Tyr Thr Ser Glu Ala Asp Ile Met Arg Val Val
305 310 315 320
Leu Pro Thr Ile Val Thr Pro Phe Gln Arg Gln Ile Glu Ala Ala Thr
325 330 335
Thr Gln Lys Glu Leu Arg Ala Ile Leu Asp Glu Leu Ala Ser Phe Gln
340 345 350
Val Leu Asp Pro Ala Cys Gly Ser Gly Asn Phe Leu Tyr Val Ala Tyr
355 360 365
Arg Glu Leu Arg Arg Leu Glu Ala Arg Ala Leu Leu Arg Leu Arg Asp
370 375 380
Leu Ser Ala Pro Gly Thr Ala Leu Pro Pro Ala Arg Val Ser Ile Arg
385 390 395 400
Gln Met His Gly Leu Glu Tyr Asp Pro Phe Gly Val Glu Leu Ala Lys
405 410 415
Val Thr Leu Thr Leu Ala Lys Glu Leu Ala Ile Arg Glu Met His Asp
420 425 430
Leu Leu Gly Asn Thr Gly Leu Asp Phe Asp Gln Pro Leu Pro Leu Asp
435 440 445
Asn Leu Asp Asp Arg Ile Val Gln Gly Asp Ala Leu Phe Thr Pro Trp
450 455 460
Pro Arg Val Asp Ala Ile Val Gly Asn Pro Pro Phe Gln Ser Lys Asn
465 470 475 480
Lys Leu Gln Arg Glu Met Gly Ala Ala Tyr Val Lys Lys Leu Arg Ala
485 490 495
His Tyr Pro Asp Val Pro Gly Arg Ala Asp Tyr Cys Val Tyr Trp Ile
500 505 510
Arg Lys Ala His Asp Gln Leu Gly Ser Gly Gln Arg Ala Gly Leu Val
515 520 525
Gly Thr Asn Thr Ile Arg Gln Asn Asp Ser Arg Val Gly Gly Leu Asp
530 535 540
Tyr Val Val Gln His Gly Gly Thr Ile Thr Asp Ala Val Gly Thr Gln
545 550 555 560
Val Trp Ser Gly Asp Ala Ala Val His Val Ser Ile Val Asn Trp Val
565 570 575
Lys Gly Pro Ala Glu Gly Pro Lys His Leu Ala Trp Gln Val Gly Asp
580 585 590
His Arg Thr Ser Pro Trp Gln Ser Thr Glu Leu Pro Val Ile Asn Ser
595 600 605
Ala Leu Ser Ala Gly Thr Asp Val Thr Gln Ala Gln Lys Leu Arg Val
610 615 620
Asn Met Asn Ser Gly Ala Cys Tyr Gln Gly Gln Thr His Gly His Lys
525 630 635 640
Gly Phe Leu Leu Asp Gly Leu Glu Ala Gly Gln ret Leu Ser Ala Glu
645 650 655
Arg Lys Asn Ala Glu Val Ile Phe Pro Tyr Leu Thr Gly Asp Glu Leu
660 665 670
Leu Arg Thr Ser Pro Pro His Pro Thr Arg Tyr Val Ile Asp Phe Gln
675 680 685
Pro Arg Asp Val Phe Gly Ala Arg Ala Tyr Lys Leu Pro Phe Ala Arg
690 695 700
lle Glu Arg Glu Val Leu Pro Thr Arg Gln Ala Ala Ala Ala Glu Glu
705 710 715 720
Glu Ala Arg Asn Ala Glu Val Leu Ala Ala Asn Pro Lys Ala Lys Thr
725 730 735
Asn Lys His His Arg Asn Phe Leu Asn Gln Trp Trp Ala Leu Ser Tyr
740 745 750
Gly Arg Ser Glu Met Ile Glu Lys Ile Ser Ser Leu Ser Arg Tyr Ile
755 760 765
Val Cys Ser Arg Val Thr Lys Arg Gln Val Phe Glu Phe Leu Asp Asn
770 775 780
Gly Ile Arg Pro Ser Asp Gly Leu Gln Ile Phe Ala Phe Glu Asp Asp
785 790 795 800
Tyr Ser Phe Gly Val Ile Gln Ser Ser Val His Trp Gln Trp Leu Ile
805 810 815
Ala Arg Gly Gly Thr Leu Thr Ala Arg Leu Met Tyr Thr Ser Asp Thr
820 825 830
Val Phe Asp Thr Phe Pro Trp Pro Asp Pro Thr Leu Ala Gln Val Arg
835 840 845
Ala Val Ala Ala Ala Ala Val Lys Leu Arg Glu Leu Arg Asn Lys Val
850 855 860
Met Arg Glu Gln Gly Trp Ser Leu Arg Asp Leu Tyr Arg Thr Leu Asp
865 870 875 880
Met Pro Gly Lys Asn Pro Leu Arg Asp Ala Gln Glu Arg Leu Asp Ala
885 890 895
Ala Val Ser Ala Ala Tyr Gly Leu Pro Ala Gly Ala Asp Met Leu Asp
900 905 910
Phe Leu Leu Ala Leu Asn Ala Xaa Val Ala Ala Ala Glu Ala Arg Gly
915 920 925
Ala Ala Val Thr Gly Pro Gly Leu Pro Ala Gly Leu Asn Thr Ala Asp
930 935 940
Phe Val Thr Ala Asp Ala Val Arg Pro Leu Gly
945 950 955
<210>15
<211>14
<212>PRT
<213>未知
<220>
<223>MmeI的前14个氨基端残基
<400>15
Ala Leu Ser Trp Asn Glu Ile Arg Arg Lys Ala Ile Glu Phe
1 5 10
<210>16
<211>29
<212>PRT
<213>未知
<220>
<223>25kD肽的前29个残基
<220>
<221>MISC_FEATURE
<222>(20)..(20)
<223>X=Xaa(任何氨基酸)
<220>
<221>MISC_FEATURE
<222>(21)..(21)
<223>X=Xaa(任何氨基酸)
<220>
<221>MISC_FEATURE
<222>(23)..(23)
<223>X=Xaa(任何氨基酸)
<220>
<221>MISC_FEATURE
<222>(25)..(25)
<223>X=Xaa(任何氨基酸)
<400>16
Met Lys Ile Ser Asp Glu Phe Gly Asn Tyr Phe Ala Arg Ile Pro Leu
1 5 10 15
Lys Ser Thr Xaa Xaa Ile Xaa Glu Xaa Asn Ala Leu Gln
20 25
<210>17
<211>40
<212>PRT
<213>未知
<220>
<223>由14kD片段获得的前40个氨基酸残基
<220>
<221>MISC_FEATURE
<222>(36)..(36)
<223>X=Xaa(任何氨基酸)
<400>17
Met Asp Ala Lys Lys Arg Arg Asn Leu Gly Ala His Tyr Thr Ser Glu
1 5 10 15
Ala Asn Ile Leu Lys Leu Ile Lys Pro Leu Leu Leu Asp Glu Leu Trp
20 25 30
Val Val Phe Xaa Lys Val Lys Asn
35 40
<210>18
<211>25
<212>PRT
<213>未知
<220>
<223>7.5kD肽的前25个残基
<400>18
Met Lys Ser Arg Gly Lys Asp Leu Asp Lys Ala Tyr Asp Gln Ala Leu
1 5 10 15
Asp Tyr Phe Ser Gly Ile Ala Glu Arg
20 25
<210>19
<211>8
<212>PRT
<213>未知
<220>
<223>25kD片段引物
<400>19
Asp Glu Phe Gly Asn Tyr Phe Ala
1 5
<210>20
<211>20
<212>DNA
<213>未知
<220>
<223>正向引物
<220>
<221>misc_feature
<222>(3)..(3)
<223>R=A或G
<220>
<221>misc_feature
<222>(6)..(6)
<223>Y=T或C
<220>
<221>misc_feature
<222>(9)..(9)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(12)..(12)
<223>Y=T或C
<220>
<221>misc_feature
<222>(15)..(15)
<223>Y=T或C
<220>
<221>misc_feature
<222>(18)..(18)
<223>Y=T或C
<400>20
garttyggna aytayttygc 20
<210>21
<211>20
<212>DNA
<213>未知
<220>
<223>反向引物
<220>
<221>misc_feature
<222>(3)..(3)
<223>R=A或G
<220>
<221>misc_feature
<222>(6)..(6)
<223>R=A或G
<220>
<221>misc_feature
<222>(9)..(9)
<223>n是a.c,g或t
<220>
<221>misc_feature
<222>(12)..(12)
<223>R=A或G
<220>
<221>misc_feature
<222>(15)..(15)
<223>Y=T或C
<220>
<221>misc_feature
<222>(18)..(18)
<223>R=A或G
<400>21
aartarttnc craaytcrtc 20
<210>22
<211>6
<212>PRT
<213>未知
<220>
<223>14kD片段引物
<400>22
Met Asp Ala Lys Lys Arg
1 5
<210>23
<211>17
<212>DNA
<213>未知
<220>
<223>正向引物
<220>
<221>misc_feature
<222>(6)..(6)
<223>Y=T或C
<220>
<221>misc_feature
<222>(9)..(9)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(12)..(12)
<223>R=A或G
<220>
<22I>misc_feature
<222>(15)..(15)
<223>R=A或G
<400>23
atggaygcna araarcg 17
<210>24
<211>17
<212>DNA
<213>未知
<220>
<223>反向引物
<220>
<221>misc_feature
<222>(6)..(6)
<223>Y=T或C
<220>
<221>misc_feature
<222>(9)..(9)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(12)..(12)
<223>R=A或G
<220>
<221>misc_feature
<222>(15)..(15)
<223>R=A或G
<400>24
atggaygcna araarag 17
<210>25
<211>20
<212>DNA
<213>未知
<220>
<223>反向引物
<220>
<221>misc_feature
<222>(3)..(3)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(6)..(6)
<223>Y=T或C
<220>
<221>misc_feature
<222>(9)..(9)
<223>Y=T或C
<220>
<221>misc_feature
<222>(12)..(12)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(15)..(15)
<223>R=A或G
<400>25
cgncgyttyt tngcrtccat 20
<210>26
<211>7
<212>PRT
<213>未知
<220>
<223>7.5kD片段引物
<400>26
Asp Lys Ala Tyr Asp Gln Ala
1 5
<210>27
<211>20
<212>DNA
<213>未知
<220>
<223>正向引物
<220>
<221>misc_feature
<222>(3)..(3)
<223>Y=T或C
<220>
<221>misc_feature
<222>(6)..(6)
<223>R=A或G
<220>
<221>misc_feature
<222>(9)..(9)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(11)..(11)
<223>Y=T或C
<220>
<221>misc_feature
<222>(14)..(14)
<223>Y=T或C
<220>
<221>misc_feature
<222>(17)..(17)
<223>R=A或G
<400>27
gayaargcnt aygaycargc 20
<210>28
<211>20
<212>DNA
<213>未知
<220>
<223>反向引物
<220>
<221>misc_feature
<222>(3)..(3)
<223>Y=T或C
<220>
<221>misc_feature
<222>(6)..(6)
<223>R=A或G
<220>
<221>misc_feature
<222>(9)..(9)
<223>R=A或G
<220>
<221>misc_feature
<222>(12)..(12)
<223>n是a,c.g或t
<220>
<221>misc_feature
<222>(15)..(15)
<223>Y=T或C
<220>
<221>misc_feature
<222>(18)..(18)
<223>R=A或G
<400>28
gcytgrtcrt angcyttrtc 20
<210>29
<211>26
<212>DNA
<213>未知
<220>
<223>引物IP 1
<400>29
gttggatccc gcacagattg ctcagg 26
<210>30
<211>30
<212>DNA
<213>未知
<220>
<223>引物IP 2
<400>30
gttggatcct acgttaatct gaataagatg 30
<210>31
<211>28
<212>DNA
<213>未知
<220>
<223>引物IP 3
<400>31
gttggatcct gttaatctga aacgctgg 28
<210>32
<211>29
<212>DNA
<213>未知
<220>
<223>引物IP 4
<400>32
gttggatcct tataccaaaa tgtgaggtc29
<210>33
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 5
<400>33
ttcagaaata cgagcgatgc20
<210>34
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 6
<400>34
gtcaagccat aaacaccatc20
<210>35
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 7
<400>35
gagggtcaga aaggaagctg20
<210>36
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 8
<400>36
gtccaactaa ccctttatgg20
<210>37
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 9
<400>37
ttcctagtgc tgaacctttg20
<210>38
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 10
<400>38
gttgcgttac ttgaaatgac20
<210>39
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 11
<400>39
ccaaaatgga acttgtttcg20
<210>40
<211>20
<212>DNA
<213>未知
<220>
<223>引物IP 12
<400>40
gtgagtgcgc cctgaattag 20
<210>41
<211>21
<212>DNA
<213>未知
<220>
<223>引物S1
<400>41
gcttcatttc atcctctgtg c 21
<210>42
<211>21
<212>DNA
<213>未知
<220>
<223>引物S2
<400>42
taaccgccaa aattaatcgt g 21
<210>43
<211>20
<212>DNA
<213>未知
<220>
<223>引物S3
<400>43
ccactattca ttacaacacc 20
<210>44
<211>43
<212>DNA
<213>未知
<220>
<223>与嗜甲醇营养菌(M.methyltrophus)DNA序列匹配的20个核苷酸
<400>44
gttctgcagt taaggataac atatggcttt aagctggaac gag43
<210>45
<211>37
<212>DNA
<213>未知
<220>
<223>与嗜甲醇营养菌(M.methyltrophus)DNA序列匹配的22个核昔酸
<400>45
gttggatccg tcgacattaa ttaatttttg cccttag 37
<210>46
<211>48
<212>DNA
<213>未知
<220>
<223>寡聚核苷酸1
<400>46
gtttgaagac tccgacgcga tggccagcga tcggcgcctc agcttttg48
<210>47
<211>48
<212>DNA
<213>未知
<220>
<223>寡聚核昔酸2
<400>47
caaaagctga ggcgccgatc gctggccatc gcgtcggagt cttcaaac48
<210>48
<211>48
<212>DNA
<213>未知
<220>
<223>寡聚核昔酸3
<220>
<221>misc_feature
<222>(15)..(15)
<223>A=6-甲基腺嘌呤
<400>48
gtttgaagac tccgacgcga tggccagcga tcggcgcctc agcttttg48
<210>49
<211>48
<212>DNA
<213>未知
<220>
<223>寡聚核昔酸4
<220>
<221>misc_feature
<222>(38)..(38)
<223>A=6-甲基腺嘌呤
<400>49
caaaagctga ggcgccgatc gctggccatc gcgtcggagt cttcaaac48
<210>50
<211>8
<212>PRT
<213>未知
<220>
<223>单个内部CnBr消化片段
<400>50
Gly Arg Gly Arg Gly Val Gly Val
1 权利要求
1.分离的DNA,其编码结合了内切核酸酶活性和修饰活性的限制性酶,并具有编码保守氨基酸基序的核苷酸序列,所述保守基序是(D/E)X8-X12(D/E)XK,并且此时,在利用图3的氨基酸序列的Blast搜索中,所述编码的氨基酸序列的期望值(e)分数低于E=e-10。
全文摘要
根据本发明,提供一种编码重组Ⅱ型限制性内切酶MmeI的DNA(脱氧核糖核酸)片段。这种酶具备两种相关的酶学功能;一个是识别DNA序列5’-TCC(Pu)AC-3’的内切酶活性,并在如箭头标记的地方剪切DNA5’-TCCRAC(N20)↓-3’和3’-AGGYTG(N18)↑-5’,另一个酶活性是识别同样的DNA序列5’-TCC(Pu)AC-3’,但是通过增加甲基的方式来修饰该序列以防止MmeI内切酶活性的剪切。
文档编号C12N1/21GK101693898SQ20091017407
公开日2010年4月14日 申请日期2003年7月10日 优先权日2002年7月12日
发明者R·D·摩根, T·巴蒂亚, T·戴维斯, L·洛沃什科 申请人:新英格兰生物实验室公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1