丝氨酸蛋白酶、编码丝氨酸酶的核酸以及包含它们的载体和宿主细胞的制作方法

文档序号：426895阅读：566来源：国知局

专利名称：丝氨酸蛋白酶、编码丝氨酸酶的核酸以及包含它们的载体和宿主细胞的制作方法
技术领域：
本发明提供了新的丝氨酸蛋白酶，编码这些酶的新的遗传物质，和获自微球菌亚目某些种(Micrococcineae spp.)的蛋白水解蛋白质，从中开发出的变体蛋白质，其中所述微球菌亚目某些种包括但是不限于纤维单胞菌属某些种(Cellulomonas spp.)。特别地，本发明提供了获自纤维单胞菌属某些种的蛋白酶组合物，编码所述蛋白酶的DNA，包括编码所述蛋白酶的DNA的载体，用所述载体DNA转化的宿主细胞，和由所述宿主细胞产生的酶。本发明也提供了清洗组合物(例如洗涤剂组合物)、动物饲料组合物和纺织品和皮革加工组合物，上述组合物包括获自微球菌亚目某些种的蛋白酶，其中微球菌亚目某些种包括但是不限于纤维单胞菌属某些种。在可选择的实施方案中，本发明提供了源自本文中描述的野生型蛋白酶的突变体(也就是变体)蛋白酶。也发现这些突变体蛋白酶可用于大量应用中。
背景技术：
丝氨酸蛋白酶是羰基水解酶的亚组，包括各种类型的具有宽范围的特异性和生物功能的酶(参见例如Stroud，Sci.Amer.，13174-88)。尽管它们的功能多种多样，但是丝氨酸蛋白酶的催化机制与至少两种遗传上不同的酶家族相似，这两种酶家族是1)枯草蛋白酶；和2)哺乳动物胰凝乳蛋白酶-相关的和同源的细菌丝氨酸蛋白酶(例如胰蛋白酶和灰色链霉菌(S.griseus)胰蛋白酶)。这两个丝氨酸蛋白酶家族显示出非常相似的催化机制(参见例如Kraut，Ann.Rev.Biochem.，46331-358 )。此外，尽管一级结构不相关，这两个酶家族的三级结构都装配出由丝氨酸、组氨酸和天冬氨酸组成的保守的氨基酸催化三联体。枯草蛋白酶和胰凝乳蛋白酶-相关的丝氨酸蛋白酶都具有包括天冬氨酸、组氨酸和丝氨酸的催化三联体。在枯草蛋白酶-相关的蛋白酶中，从氨基端到羧基端读起，这些氨基酸的相对顺序为天冬氨酸-组氨酸-丝氨酸。然而，在胰凝乳蛋白酶-相关的的蛋白酶中，相对顺序是组氨酸-天冬氨酸-丝氨酸。很大程度上由于枯草蛋白酶在清洗和饲料应用中的用途，对枯草蛋白酶已经开展了许多研究。其他的研究工作集中在不利的环境条件上(例如暴露于氧化剂、螯合剂、极端温度和/或pH)，这样的环境条件对这些酶在各种应用中的功能性具有不利的影响。尽管如此，本领域依然需要这样的酶体系，该酶体系能够抵抗这些的不利的条件，并且比起本领域的目前已知的那些酶体系，保留或具有改进的活性。
发明概述
本发明提供了新颖的丝氨酸蛋白酶、编码这些酶的新颖遗传物质、和获自微球菌亚目某些种的蛋白水解蛋白质，由此开发而得的变体蛋白质，其中微球菌亚目某些种包括但是不限于纤维单胞菌属某些种。特别地，本发明提供了获自纤维单胞菌属某些种的蛋白酶组合物，编码所述蛋白酶的DNA，包括编码所述蛋白酶的DNA的载体，用所述载体DNA转化的宿主细胞，和由所述宿主细胞产生的酶。本发明也提供了清洗组合物(例如洗涤剂组合物)、动物饲料组合物和纺织品和皮革加工组合物，上述组合物包括获自微球菌亚目某些种的蛋白酶，其中微球菌亚目某些种包括但是不限于纤维单胞菌属某些种。在可选择的实施方案中，本发明提供了源自本文中描述的野生型蛋白酶的突变体(也就是变体)蛋白酶。发现这些突变体蛋白酶在大量应用中有用处。
本发明提供了获自微球菌亚目成员的分离的丝氨酸蛋白酶。在一些实施方案中，蛋白酶是纤维单胞菌蛋白酶(cellulomonadins)。在一些优选的实施方案中，蛋白酶获自选自纤维单胞菌属(Cellulomonas)、厄氏菌属(Oerskovia)、纤维微细菌属(Cellulosimicrobium)、木聚糖细菌属(Xylanibacterium)和原小单孢菌属(Promicromonospora)的生物体。在一些特别优选的实施方案中，蛋白酶获自纤维单胞菌69B4。在进一步的实施方案中，蛋白酶包括在SEQ ID NO8中阐述的氨基酸序列。在其他实施方案中，本发明提供了分离的丝氨酸蛋白酶，该分离的丝氨酸蛋白酶与包含SEQ ID NO8的丝氨酸蛋白酶具有至少45％的氨基酸同一性。在一些实施方案中，分离的丝氨酸蛋白酶包括至少50％的同一性、优选至少55％、更优选至少60％、更优选至少65％、甚至更优选至少70％、更优选至少75％、更优选至少80％、更优选85％、更优选90％、甚至更优选至少95％和最优选99％的同一性。
本发明也提供了包括分离的丝氨酸蛋白酶的组合物，所述分离的丝氨酸蛋白酶与获自微球菌亚目的丝氨酸蛋白酶具有免疫交叉反应性。在一些优选的实施方案中，丝氨酸蛋白酶与获自纤维单胞菌69B4的丝氨酸蛋白酶具有免疫交叉反应性。在可选择的实施方案中，丝氨酸蛋白酶与包括SEQ ID NO8中阐述的氨基酸序列的丝氨酸蛋白酶具有免疫交叉反应性。在还进一步的实施方案中，丝氨酸蛋白酶与获自微球菌亚目的丝氨酸蛋白酶、纤维单胞菌69B4蛋白酶和/或包括SEQ IDNO8中阐述的氨基酸序列的丝氨酸蛋白酶中的任一蛋白酶的片段(即部分)具有免疫交叉反应性。
在一些实施方案中，本发明提供了在SEQ ID NO8中阐述的氨基酸序列，其中，所述序列包括至少一个氨基酸位置的替换，该氨基酸位置选自位置2、8、10、11、12、13、14、15、16、24、26、31、33、35、36、38、39、40、43、46、49、51、54、61、64、65、67、70、71、76、78、79、81、83、85、86、90、93、99、100、105、107、109、112、113、116、118、119、121、123、127、145、155、159、160、163、165、170、174、179、183、184、185、186、187和188。在选择性实施方案中，序列包括至少一个氨基酸位置上的替换，该氨基酸位置选自位置1、4、22、27、28、30、32、41、47、48、55、59、63、66、69、75、77、80、84、87、88、89、92、96、110、111、114、115、117、128、134、144、143、146、151、154、156、158、161、166、176、177、181、182、187和189。
在一些实施方案中，本发明提供了蛋白酶变体，该变体具有包括至少一个氨基酸替换的氨基酸序列，所述氨基酸替换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，该纤维单胞菌69B4蛋白酶包括在SEQ ID NO8中阐述的氨基酸序列。在选择性实施方案中，本发明提供了蛋白酶变体，该变体具有包括至少一个氨基酸替换的氨基酸序列，所述氨基酸替换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，该纤维单胞菌69B4蛋白酶包括SEQ ID NO8的至少一部分。在一些实施方案中，替换发生在与下述位置等同的位置上具有SEQ ID NO8中阐述的氨基酸序列的纤维单胞菌69B4蛋白酶中的位置2、8、10、11、12、13、14、15、16、24、26、31、33、35、36、38、39、40、43、46、49、51、54、61、64、65、67、70、71、76、78、79、81、83、85、86、90、93、99、100、105、107、109、112、113、116、118、119、121、123、127、145、155、159、160、163、165、170、174、179、183、184、185、186、187和188。在选择性实施方案中，替换发生在与下述位置等同的位置上具有SEQ ID NO8中阐述的氨基酸序列的纤维单胞菌69B4蛋白酶中的位置1、4、22、27、28、30、32、41、47、48、55、59、63、66、69、75、77、80、84、87、88、89、92、96、110、111、114、115、117、128、134、144、143、146、151、154、156、158、161、166、176、177、181、182、187和189。在一些优选的实施方案中，蛋白酶变体包括包含SEQ ID NO8的氨基酸序列，其中，选自14、16、35、36、65、75、76、79、123、127、159和179的至少一个位置的氨基酸用另一氨基酸置换。在一些特别优选的实施方案中，蛋白酶包括至少一个突变，该突变选自R14L、R16I、R16L、R16Q、R35F、T36S、G65Q、Y75G、N76L、N76V、R79T、R123L、R123Q、R127A、R127K、R127Q、R159K、R159Q和R179Q。在一些可选择的优选实施方案中，蛋白酶包括多个突变，所述突变选自R16Q/R35F/R159Q、R16Q/R123L、R14L/R127Q/R159Q、R14L/R179Q、R123L/R127Q/R179Q、R16Q/R79T/R127Q和R16Q/R79T。在一些特别优选的实施方案中，蛋白酶包括下述突变R123L、R127Q和R179Q。
本发明也提供了蛋白酶变体，该变体具有包括至少一个置换的氨基酸序列，所述置换选自T36I、A38R、N170Y、N73T、G77T、N24A、T36G、N24E、L69S、T36N、T36S、E119R、N74G、T36W、S76W、N24T、N24Q、T36P、S76Y、T36H、G54D、G78A、S187P、R179V、N24V、V90P、T36D、L69H、G65P、G65R、N7L、W103M、N55F、G186E、A70H、S76V、G186V、R159F、T36Y、T36V、G65V、N24M、S51A、G65Y、Q71I、V66H、P118A、T116F、A38F、N24H、V66D、S76L、G177M、G186I、H85Q、Q71K、Q71G、G65S、A38D、P118F、A38S、G65T、N67G、T36R、P118R、S114G、Y75I、I181H、G65Q、Y75G、T36F、A38H、R179M、T183I、G78S、A64W、Y75F、G77S、N24L、W103I、V3L、Q81V、R179D、G54R、T36L、Q71M、A70S、G49F、G54L、G54H、G78H、R179I、Q81K、V90I、A38L、N67L、T109I、R179N、V66I、G78T、R179Y、S187T、N67K、N73S、E119K、V3I、Q71H、I11Q、A64H、R14E、R179T、L69V、V150L、Q71A、G65L、Q71N、V90S、A64N、I11A、N145I、H85T、A64Y、N145Q、V66L、S92G、S188M、G78D、N67A、N7S、V80H、G54K、A70D、P118H、D2G、G54M、Q81H、D2Q、V66E、R79P、A38N、N145E、R179L、T109H、R179K、V66A、G54A、G78N、T109A、R179A、N7A、R179E、H104K、A64R和V80L。在进一步的实施方案中，其中，蛋白酶变体的氨基酸序列包括至少一个置换，所述置换选自H85R、H85L、T62I、N67H、G54I、N24F、T40V、T86A、G63V、G54Q、A64F、G77Y、R35F、T129S、R61M、I126L、S76N、T182V、R79G、T109P、R127F、R123E、P118I、T109R、I71S、T183K、N67T、P89N、F1T、A64K、G78I、T109L、G78V、A64M、A64S、T10G、G77N、A64L、N67D、S76T、N42H、D184F、D184R、S76I、S78R、A38K、V72I、V3T、T107S、A38V、F47I、N55Q、S76E、P118Q、T109G、Q71D、P118K、N67S、Q167N、N145G、I28L、I11T、A64I、G49K、G49A、G65A、N170D、H85K、S185I、I181N、V80F、L69W、S76R、D184H、V150M、T183M、N67Q、S51Q、A38Y、T107V、N145T、Q71F、A83N、S76A、N67R、T151L、T163L、S51F、Q81I、F47M、A41N、P118E、N67Y、T107M、N73H、67V、G63W、T10K、I181G、S187E、T107H、D2A、L142V、A143N、A8G、S187L、V90A、G49L、N170L、G65H、T36C、G12W、S76Q、A143S、F1A、N7H、S185V、A110T、N55K、N67F、N7I、A110S、N170A、Q81D、A64Q、Q71L、A38I、N112I、V90T、N145L、A64T、I11S、A30S、R123I、D2H、V66M、Q71R、V90L、L68W、N24S、R159E、V66N、D184Q、E133Q、A64V、D2N、G13M、T40S、S76K、G177S、G63Q、S15F、A8K、A70G和A38G。在一些优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，这些变体具有改进的酪蛋白水解性能。
本发明也提供了蛋白酶变体，该变体具有包括至少一个置换的氨基酸序列，所述置换选自R35E、R35D、R14E、R14D、Q167E、G49C、S15R、S15H、I11W、S15C、G49Q、R35Q、R35V、G49E、R123D、R123Y、G49H、A38D、R35S、F47R、R123C、T151L、R14T、R35T、R123E、G49A、G49V、D56L、R35N、R35A、G12D、R35C、R123N、T46V、R123H、S155C、T121E、R127E、S113C、R123T、R16E、T46F、T121L、A38C、T46E、R123W、T44E、N55G、A8G、E119G、R35P、R14G、F59W、R127S、R61E、R14S、S155W、R123F、R123S、G49N、R127D、E119Y、A48E、N170D、R159T、S99A、G12Q、P118R、F165W、R127Q、R35H、G12N、A22C、G12V、R16T、Y57G、T100A、T46Y、R159E、E119R、T107R、T151C、G54C、E119T、R61V、I11E、R14I、R61M、S15E、A22S、R16C、T36C、R16V、L125Q、M180L、R123Q、R14A、R14Q、R35M、R127K、R159Q、N112P、G124D、R179E、G49L、A41D、G177D、R123V、E119V、T10L、T109E、R179D、G12S、T10C、G91Q、S15Y、S155Y、R14C、T163D、T121F、R14N、F165E、N24E、A41C、R61T、G12I、P118K、T46C、I11T、R159D、N170C、R159V、S155I、I11Q、D2P、T100R、R159S、S114C、R16D和P134R。在选择性实施方案中，蛋白酶变体具有包括至少一个置换的氨基酸序列，所述置换选自S99G、T100K、R127A、F1P、S155V、T128A、F165H、G177E、A70M、S140P、A87E、D2I、R159K、T36V、R179C、E119N、T10Y、I172A、A8T、F47V、W103L、R61K、D2V、R179V、D2T、R159N、E119A、G54E、R16Q、G49S、R16I、S51L、S155E、S15M、R179I、T10Q、G12H、R159C、R179T、T163C、R159A、A132S、N157D、G13E、L141M、A41T、R123M、R14M、A8R、Q81P、N24T、T10D、A88F、R61Q、S99K、R179Y、T121A、N112E、S155T、T151V、S99Q、T10E、S92T、T109K、T44C、R123A、A87C、S15F、S155F、D56F、T10F、A83H、R179M、T121D、G13D、P118C、G49F、Q174C、S114E、T86E、F1N、T115C、R127C、R123K、V66N、G12Y、S113A、S15N、A175T、R79T、R123G、R179S、R179N、R123I、P118A、S187E、N112D、A70G、E119L、E119S、R159M、R14H、R179F、A64C、A41S、R179W、N24G、T100Q、P118W、Q81G、G49K、R14L、N55A、R35K、R79V、D2M、T160D、A83D、R179L、S51A、G12P、S99H、N42D、S188E、T10M、L125M、T116N、A70P、Q174S、G65D、S113D、E119Q、A83E、N170L、Q81A、S51C、P118G、Q174T、I28V、S15G和T116G。在一些优选实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，这些变体具有改进的LAS稳定性。
本发明也提供了蛋白酶变体，该变体具有包括至少一个置换的氨基酸序列，所述置换选自G26I、G26K、G26Q、G26V、G26W、F27V、F27W、I28P、T29E、T129W、T40D、T40Q、R43D、P43H、P43K、P43L、A22C、T40H、P89W、G91L、S18E、F59K、A30M、A30N、G31M、C33M、G161L、G161V、P43N、G26E、N73P、G84C、G84P、G45V、C33L、Y9E、Y9P、A147E、C158H、I28W、A48P、A22S、T62R、S137R、S155P、S155R、G156I、G156L、Q81A、R96C、I4D、I4P、A70P、C105E、C105G、C105K、C105M、C105N、C105S、T128A、T128V、T128G、S140P、G12D、C33N、C33E、T164G、G45A、G156P、S99A、Q167L、S155W、I28T、R96F、A30P、R123W、T40P、T39R、C105P、T100A、C105W、S155K、T46Y、R123F、I4G、S155Y、T46V、A93S、Y57N、Q81S、G186S、G31H、T10Y、G31V、A83H、A38D、R123Y、R79T、C158G、G31Y、Q81P、R96E、A30Y、R159K、A22T、T40N、Y57M、G31N、Q81G、T164L、T121E、T10F、Q164P、R123N、V3R、P43G、Q81H、Q81D、G161I、C158M、N24T、T10W、T128S、T160I、Y176P、S155F、T128C、L125A、P168Y、T62G、F166S、S188A、Q81F、T46W、A70G和A38G。在选择性实施方案中，蛋白酶变体具有包括至少一个置换的氨基酸序列，所述置换选自S118E、S188V、Y117K、Y117Q、Y117R、Y117V、R127K、R127Q、R123L、T86S、R123I、Q81E、L125M、H32A、S188T、N74F、C33D、F27I、A83M、Q71Y、R123T、V90A、F59W、L141C、N170E、T46F、S51V、G162P、S185R、A41S、R79V、T151C、T107S、T129Y、M180L、F166C、C105T、T160E、P89A、R159T、T183P、S188M、T10L、G25S、N24S、E119L、T107L、T107Q、G161K、G15Q、S15R、G153K、G153V、S188G、A83E、G186P、T121D、G49A、S15C、C105Y、C105A、R127F、Q71A、T10C、R179K、T86I、W103N、A87S、F166A、A83F、R123Q、A132C、A143H、T163I、T39V、A93D、V90M、R123K、P134W、G177N、V115I、S155T、T110D、G105L、N170D、T107A、G84V、G84M、L111K、P168I、G154L、T183I、S99G、S15T、A8G、S15N、P189S、S188C、T100Q、A110G、A121A、G12A、R159V、G31A、G154R、T182L、V115L、T160Q、T107F、R159Q、G144A、S92T、T101S、A83R、G12HM S15H、T116Q、T36V、G154、Q81C、V130T、T183A、P118T、A87E、T86M、V150N和N24E。在一些优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，这些变体具有改进的热稳定性。
本发明也提供了蛋白酶变体，该变体具有包括至少一个置换的氨基酸序列，所述置换选自T36I、I172T、N24E、N170Y、G77T、G186N、I181L、N73T、A38R、N74G、N24A、G54D、S76D、R123E、I59E、N112E、R35E、R179V、R123D、N24T、R179T、R14L、A38D、V90P、R14Q、R123I、R179D、S76V、R79G、R35L、S76E、S76Y、R79D、R79P、R35Q、R179N、N112D、R179E、G65P、Y75G、V90S、R179M、R35F、R123F、A64I、N24Q、R14I、R179A、R127A、R179I、N170D、R35A、R159F、T109E、R14D、N67D、G49A、N112Q、G78D、T121E、L69S、T116E、V90I、T36S、T36G、N145E、T86D、S51D、R179K、T107E、T129S、L142V、R79A、R79E、A38H、T107S、R123A、N55E、R123L、R159N、G65D、R14N、G65Q、R123Q、N24V、R14G、T116Q、A38N、R159Q、R179Y、A83E、N112L、S99N、G78A、T10N、H85Q、R35Q、N24L、N24H、G49S、R79L、S76T、S76L、G65S、N55F、R79V、G65T、R123N、T86E、Y75F、F1T、S76N、S99V、R79T、N112V、R79M、T107V、R79S、G54E、G65V、R127Q、R159D、T107H、H85T、R35T、T36N、Q81E、R123H、S76I、A38F、V90T和R14T。在选择性实施方案中，蛋白酶变体具有包括至少一个置换的氨基酸序列，所述置换选自G65L、S99D、T107M、S113T、S99T、G77S、R14M、A64N、R61M、A70D、Q71G、A93D、S92G、N112Y、S15W、R159K、N67G、T10E、R127H、A64Y、R159C、A38L、T160E、T183E、R127S、A8E、S51Q、N7L、G63D、A38S、R35H、R14K、T107I、G12D、A64L、S76W、A41N、R35M、A64V、A38Y、T183I、W103M、A41D、R127K、T36D、R61T、G65Y、G13S、R35Y、R123T、A64H、G49H、A70H、A64F、R127Y、R61E、A64P、T121D、V115A、R123Y、T101S、T182V、H85L、N24M、R127E、N145D、Q71H、S76Q、A64T、G49F、A64Q、T10D、F1D、A70G、R35W、Q71D、N121I、A64M、T36H、A8G、T107N、R35S、N67T、S92A、N170L、N67E、S114A、R14A、R14S、Q81D、S51H、R123S、A93S、R127F、I19V、T40V、S185N、R123G、R179L、S51V、T163D、T109I、A64S、V72I、N67S、R159S、H85M、T109G、Q71S、R61H、T107A、Q81V、V90N、T109A、A38T、N145T、R159A、A110S、Q81H、A48E、S51T、A64W、R159L、N67H、A93E、T116F、R61S、R123V、V3L和R159Y。在一些优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，这些变体具有改进的角蛋白水解活性。
本发明也提供了蛋白酶变体，该变体具有包括至少一个置换的氨基酸序列，所述置换选自T36I、P89D、A93T、A93S、T36N、N73T、T36G、R159F、T36S、A38R、S99W、S76W、T36P、G77T、G54D、R127A、R159E、H85Q、T36D、S76L、S99N、Y75G、S76Y、R127S、N24E、R127Q、D184F、N170Y、N24A、S76T、H85L、Y75F、S76V、L69S、R159K、R127K、G65P、N74G、R159H、G65Q、G186V、A48Q、T36H、N67L、R14I、R127L、T36Y、S76I、S114G、R127H、S187P、V3L、G78D、R123I、I181Q、R35F、H85R、R127Y、N67S、Q81P、R123F、R159N、S99A、S76D、A132V、R127F、A143N、S92A、N24T、R79P、S76N、R14M、G186E、N24Q、N67A、R127T、H85K、G65T、G65Y、R179V、Y75I、I11Q、A38L、T36L、R159Y、R159D、N24V、G65S、N157D、G186I、G54Q、N67Y、R127G、S76A、A38S、T109E、V66H、T116F、R123L、G49A、A64H、T36W、D184H、S99D、G161K、P134E、A64F、N67G、S99T、D2Q、S76E、R16Q、G54N、N67V、R35L、Q71I、N7L、N112E、L69H、N24H、G54I、R16L、N24M、A64Y、S113A、H85F、R79G、I11A、T121D、R61V和G65L。在选择性实施方案中，蛋白酶变体具有包括至少一个置换的氨基酸序列，所述置换选自N67Q、S187Q、Q71H、T163D、R61K、R159V、Q71F、V31F、V90I、R79D、T160E、R123Q、A38Y、S113G、A88F、A70G、I11T、G78A、N24L、S92G、R14L、D184R、G54L、N112L、H85Y、R16N、G77S、R179T、V80L、G65V、T121E、Q71D、R16G、P89N、N42H、G49F、I11S、R61M、R159C、G65R、T183I、A93D、L111E、S51Q、G78N、N67T、A38N、T40V、A64W、R159L、T10E、R179K、R123E、V90P、A64N、G161E、H85T、A8G、L142V、A41N、S185I、Q71L、A64T、R16I、A38D、G54M、N112Q、R16A、R14E、V80H、N170D、S99G、R179N、S15E、G49H、A70P、A64S、G54A、S185W、R61H、T10Q、A38F、N170L、T10L、N67F、G12D、D184T、R14N、S187E、R14P、N112D、S140A、N112G、G49S、L11ID、N67M、V150L、G12Y、R123K、P89V、V66D、G77N、S51T、A8D、I181H、T86N、R179D、N55F、N24S、D184L、R61S、N67K、G186L、F1T、R159A、I11L、R61T、D184Q、A93E、Q71T、R179E、L69W、T163I、S188Q、L125V、A38V、R35A、P134G、A64V、N145D、V90T和A143S。在一些优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，这些变体具有改进的BMI特性。
本发明也提供了蛋白酶变体，该变体具有包括至少一个置换的氨基酸序列，所述置换选自T36I、N170Y、A38R、R79P、G77T、L69S、N73T、S76V、S76Y、R179V、T36N、N55F、R159F、G54D、G65P、L69H、T36G、G177M、N24E、N74G、R159E、T36S、Y75G、S76I、S76D、A8R、A24A、V90P、R159C、G65Q、T121E、A8V、S76L、T109E、R179M、A8T、T107N、G186E、S76W、R123E、A38F、T36P、N67G、Y75F、S76N、R179I、S187P、N67V、V90S、R127A、R179Y、R35F、N145S、G65S、R61M、S51A、R179N、R123D、N24T、N55E、R79C、G186V、R123I、G161E、G65Y、A38S、R14L、V90I、R79G、N145E、N67L、R127S、R150Y、M180D、N67T、A93D、T121D、Q81V、T109I、A93E；T107S、R179T、R179L、R179K、R159D、R179A、R79E、R123F、R79D、T36D、A64N、L142V、T109A、I172V、A83N、T85A、R179D、A38L、I126L、R127Q、R127L、L69W、R127K、G65T、R127H、P134A、N67D、R14M、N24Q、A143N、N55S、N67M、S51D、S76E、T163D、A38D、R159K、T183I、G63V、A8S、T107M、H85Q、N112E、N67F、N67S、A64H、T86I、P134E、T182V、N67Y、A64S、G78D、V90T、R61T、R16Q、G65R、T86L、V90N、R159Q、G54I、S76C、R179E、V66D、L69V、R127Y、R35L、R14E和T86F。在选择性实施方案中，蛋白酶变体具有包括至少一个置换的氨基酸序列，所述置换选自G186I、A64Q、T109G、G64L、N24L、A8E、N112D、A38H、R179W、S114G、R123L、A8L、T129S、N170D、R159N、N67C、S92C、T107A、G54E、T107E、T36V、R127T、A8N、H85L、A110S、N170C、A64R、A132V、T36Y、G63D、W103M、T151V、R123P、W103Y、S76T、S187T、R127F、N67A、P171M、A70S、R159H、S76Q、L125V、G54Q、G49L、R14I、R14Q、A83I、V90L、T183E、R159A、T101S、G65D、G54A、T107Q、Q71M、T86E、N24M、N55Q、R61V、P134D、R96K、A88F、N145Q、A64M、A64T、N24V、S140A、A8H、A64I、R123Q、T183Q、N24H、A64W、T62I、T129G、R35A、T40V、I11T、A38N、N145G、A175T、G77Q、T109H、A8P、R35E、T109N、A110T、N67Q、G63P、H85R、S92G、A175V、S51Q、G63Q、T116F、G65A、R79L、N145P、L69Q、Q146D、A83D、F166Y、R123A、T121L、R123H、A70P、T132W、S76A、A64F、T107H、G186L、Q81I、R123K、A64L、A67R、V3L、S187E、S161K、T86M、I4M、G77N、G49A、A41N、G54M、T107V、Q81E、A38I、T109L、T183K、A70G、A71D、T183L、Q81H、A64V、A93Q、S188E、S51F、G186P、G186T、R159L、P134G、N145T、N55V、V66E、R159V、Y176L和R16L。在一些优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，这些变体在低pH条件下具有改进的BMI特性。
本发明也提供了丝氨酸蛋白酶，该丝氨酸蛋白酶包括选自SEQ ID NO8、SEQID NO6、SEQ ID NO7和SEQ ID NO9的氨基酸序列的至少一部分。在一些实施方案中，编码这些丝氨酸蛋白酶的核苷酸序列包括选自SEQ ID NO1、SEQ IDNO2、SEQ ID NO3、SEQ ID NO4和SEQ ID NO5的核苷酸序列。在一些实施方案中，丝氨酸蛋白酶是具有类似于SEQ ID NO8中描述的氨基酸序列的变体。在一些优选的实施方案中，蛋白酶获自微球菌亚目成员。在一些特别优选实施方案中，蛋白酶获自生物体，所述生物体选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属。在一些特别优选的实施方案中，蛋白酶获自纤维单胞菌69B4的变体。
本发明也提供了分离的蛋白酶变体，该变体具有包括至少一个氨基酸置换的氨基酸序列，所述氨基酸置换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，该纤维单胞菌69B4蛋白酶包括在SEQ ID NO8中阐述的氨基酸序列，其中，蛋白酶的氨基酸包括Arg14、Ser15、Arg16、Cys17、His32、Cys33、Phe52、Asp56、Thr100、Val115、Thr116、Tyr117、Pro118、Glu119、Ala132、Glu133、Pro134、Gly135、Asp136、Ser137、Thr151、Ser152、Gly153、Gly154、Ser155、Gly156、Asn157、Thr164和Phe165。在一些实施方案中，蛋白酶的催化三联体包括His32、Asp56和Ser137。在选择性实施方案中，蛋白酶包括Cys131、Ala132、Glu133、Pro134、Gly135、Thr151、Ser152、Gly153、Gly154、Ser155、Gly156、Asn157和GIy162、Thr163和Thr164。在一些优选实施方案中，蛋白酶的氨基酸序列包括Phe52、Tyr117、Pro118和Glu119。在一些特别优选的实施方案中，蛋白酶的氨基酸序列具有Gly 154与底物主链之间的主链-主链氢键。
在一些实施方案中，本发明的蛋白酶包括三个二硫键。在一些优选的实施方案中，二硫键位于C17和C38、C95和C105以及C131和C158之间。在一些特别优选的实施方案中，二硫键位于SEQ ID NO8的C17和C38、C95和C105以及C131和C158之间。在可选择的蛋白酶变体实施方案中，二硫键位于与SEQ IDNO8中的二硫键等同的位置。
本发明也提供了分离的蛋白酶变体，该变体具有包括至少一个氨基酸置换的氨基酸序列，所述氨基酸置换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，该纤维单胞菌69B4蛋白酶包括在SEQ ID NO8中阐述的氨基酸序列，其中，相比起野生型纤维单胞菌69B4蛋白酶，所述变体具有改变的底物特异性。在一些进一步优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，变体具有改变的pIs。在其他优选实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，变体具有改进的稳定性。在进一步优选的实施方案中，变体展示出改变的表面特性。在一些特别优选的实施方案中，相比起野生型纤维单胞菌69B4蛋白酶，变体显示出改变的表面特性。在其他特别优选的实施方案中，变体包括选自下述位置上的至少一个置换的突变1、2、4、7、8、10、11、12、13、14、15、16、22、24、25、32、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、57、59、61、62、63、64、65、66、67、68、69、71、73、74、75、76、77、78、79、80、81、83、84、85、86、87、88、89、90、91、92、93、95、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、123、124、126、127、128、130、131、132、133、134、135、137、143、144、145、146、147、148、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、170、171、173、174、175、176、177、178、179、180、181、182、183和184。
本发明也提供蛋白酶变体，该变体相比起野生型蛋白酶具有至少一种改进的特性。在一些特别优选的实施方案中，变体是获自微球菌亚目成员的丝氨酸蛋白酶的变体。在一些特别优选的实施方案中，蛋白酶获自生物体，所述生物体选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属。在一些特别优选的实施方案中，蛋白酶获自纤维单胞菌69B4的变体。在一些优选实施方案中，至少一个改进的特性选自酸稳定性、热稳定性、酪蛋白水解性、角蛋白水解性、清洗性能和LAS稳定性。
本发明也提供了表达载体，该载体包括编码蛋白酶变体的多核苷酸序列，所述变体具有包括至少一个氨基酸置换的氨基酸序列，所述置换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，该纤维单胞菌69B4蛋白酶包括在SEQ IDNO8中阐述的氨基酸序列。在进一步的实施方案中，本发明提供了包括这些表达载体的宿主细胞。在一些特别优选的实施方案中，宿主细胞选自芽孢杆菌属某种(Bacillus sp.)、链霉菌属某种(Streptomyces sp.)、曲霉属某种(Aspergillus sp.)和木霉菌某种(Trichoderma sp.)。本发明也提供了由所述宿主细胞产生的丝氨酸蛋白酶。
本发明也提供了变体蛋白酶，该变体蛋白酶包括选自SEQ ID NOS54、56、58、60、62、64、66、68、70、72、74、76和78的氨基酸序列。在一些优选实施方案中，氨基酸序列由选自SEQ ID NOS53、55、57、59、61、63、65、67、69、71、73、75和77的多核苷酸序列编码。在进一步的实施方案中，本发明提供了包括编码至少一种蛋白酶变体的多核苷酸序列的表达载体。在其他实施方案中，本发明提供了包括这些表达载体的宿主细胞。在一些特别优选的实施方案中，宿主细胞选自芽孢杆菌某种、链霉菌属某种、曲霉属某种和木霉菌某种。本发明也提供了由所述宿主细胞产生的丝氨酸蛋白酶。
本发明也提供了包括获自微球菌亚目成员的分离的丝氨酸蛋白酶的至少一部分的组合物，其中蛋白酶由选自SEQ ID NO1、SEQ ID NO2、SEQ ID NO3和SEQ ID NO4的多核苷酸序列编码。在一些优选实施方案中，序列包括SEQ IDNO1的至少一部分。在进一步的实施方案中，本发明提供了包括这些表达载体的宿主细胞。在一些特别优选的实施方案中，宿主细胞选自芽孢杆菌某种、链霉菌属某种、曲霉属某种和木霉菌某种。本发明也提供了由宿主细胞产生的丝氨酸蛋白酶。
本发明也提供了变体丝氨酸蛋白酶，其中蛋白酶包括对应于SEQ ID NO8中的氨基酸位置的至少一个置换，并且其中，相比起野生型纤维单胞菌69B4蛋白酶，在选自角蛋白水解、热稳定性、酪蛋白活性、LAS稳定性和清洗作用中的至少一个特性中，变体蛋白酶具有更好的表现。
本发明也提供了分离的多核苷酸，包括下述核苷酸序列(i)与SEQ ID NO4具有至少70％的同一性，或(ii)在中度至高严紧型条件下，能够与源自SEQ IDNO4所述的核苷酸序列的探针杂交；(iii)与SEQ ID NO4所述的核苷酸序列互补。在实施方案中，本发明提供了包括至少一个此类多核苷酸的表达载体。在进一步的实施方案中，本发明提供了包括这些表达载体的宿主细胞。在一些特别优选的实施方案中，宿主细胞选自芽孢杆菌某种、链霉菌属某种、曲霉属某种和木霉菌某种。本发明也提供了由宿主细胞产生的丝氨酸蛋白酶。在进一步的实施方案中，本发明提供了与SEQ ID NO4中所述的序列的至少一部分互补的多核苷酸。
本发明也提供了产生具有蛋白酶活性的酶的方法，该方法包括用包括与SEQ ID NO4具有至少70％的序列同一性的多核苷酸的表达载体转化宿主细胞；在适合于宿主细胞的条件下培养转化的宿主细胞。在一些实施方案中，宿主细胞选自链霉属、曲霉属、木霉属和芽孢杆菌属的种。
本发明也提供了探针，该探针包括与SEQ ID NO4的相应片段基本上相同的4至150个核苷酸的序列，其中探针被用于检测编码具蛋白水解活性的酶的核酸序列，并且其中，核酸序列获自微球菌亚目的成员。在一些实施方案中，微球菌亚目是纤维单胞菌属某些种。在一些优选实施方案中，纤维单胞菌是纤维单胞菌属菌株69B4。
本发明也提供了清洗组合物，该组合物包括至少一种获自微球菌亚目成员的丝氨酸蛋白酶。在一些实施方案中，至少一种蛋白酶获自选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属的生物体。在一些优选实施方案中，蛋白酶获自纤维单胞菌69B4。在一些特别优选的实施方案中，所述至少一种蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。在一些进一步的实施方案中，本发明提供了分离的丝氨酸蛋白酶，该分离的丝氨酸蛋白酶与包括SEQ IDNO8的丝氨酸蛋白酶具有至少45％的氨基酸同一性。在一些实施方案中，分离的丝氨酸蛋白酶包括至少50％的同一性、优选至少55％、更优选至少60％、更优选至少65％、甚至更优选至少70％、更优选至少75％、还更优选至少80％、更优选85％、还更优选90％、甚至更优选至少95％和最优选99％的同一性。75. 本发明进一步提供了包括至少一种丝氨酸蛋白酶的清洗组合物，其中，至少一种丝氨酸蛋白酶与获自微球菌亚目的成员的丝氨酸蛋白酶具有免疫交叉反应性。在一些优选实施方案中，丝氨酸蛋白酶与获自纤维单胞菌69B4的丝氨酸蛋白酶具有免疫交叉反应性。在选择性的实施方案中，丝氨酸蛋白酶与包括SEQ IDNO8中所述氨基酸序列的丝氨酸蛋白酶具有免疫交叉反应性。在还有进一步的实施方案中，丝氨酸蛋白酶与下述任何蛋白酶的片段(即部分)具有交叉反应性获自微球菌亚目的丝氨酸蛋白酶、纤维单胞菌69B4蛋白酶、和/或包括SEQ IDNO8所述的氨基酸序列的丝氨酸蛋白酶。
本发明进一步提供了包括至少一种丝氨酸蛋白酶的清洗组合物，其中蛋白酶是具有包括至少一个氨基酸置换的氨基酸序列的变体蛋白酶，所述置换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，所述纤维单胞菌69B4蛋白酶具有SEQ ID NO8中阐述的氨基酸序列。在一些实施方案中，置换发生在与纤维单胞菌69B4蛋白酶中的位置2、8、10、11、12、13、14、15、16、24、26、31、33、35、36、38、39、40、43、46、49、51、54、61、64、65、67、70、71、76、78、79、81、83、85、86、90、93、99、100、105、107、109、112、113、116、118、119、121、123、127、145、155、159、160、163、165、170、174、179、183、184、185、186、187和188等同的位置上，所述纤维单胞菌69B4蛋白酶包括SEQID NO8中阐述的氨基酸序列。在选择性的实施方案中，置换发生在与纤维单胞菌69B4蛋白酶中的位置1、4、22、27、28、30、32、41、47、48、55、59、63、66、69、75、77、80、84、87、88、89、92、96、110、111、114、115、117、128、134、144、143、146、151、154、156、158、161、166、176、177、181、182、187和189等同的位置，所述纤维单胞菌69B4蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。在进一步的实施方案中，蛋白酶包括在与SEQ ID NO8阐述的氨基酸序列等同的氨基酸序列中的位置14、16、35、36、65、75、76、79、123、127、159和179上至少一个氨基酸置换。在还进一步的实施方案中，蛋白酶包括选自R14L、R16I、R16L、R16Q、R35F、T36S、G65Q、Y75G、N76L、N76V、R79T、R123L、R123Q、R127A、R127K、R127Q、R159K、R159Q和R179Q的至少一个突变。在还有其他实施方案中，蛋白酶包括选自R16Q/R35F/R159Q、R16Q/R123L、R14L/R127Q/R159Q、R14L/R179Q、R123L/R127Q/R179Q、R16Q/R79T/R127Q和R16Q/R79T的一组突变。在一些特别优选的实施方案中，蛋白酶包括下述突变R123L、R127Q和R179Q。在一些特别优选的实施方案中，变体丝氨酸蛋白酶包括对应于SEQ ID NO8中的氨基酸位置的至少一个替换，其中相比起野生型纤维单胞菌69B4蛋白酶，变体蛋白酶在选自角蛋白水解性、热稳定性、酪蛋白活性、LAS稳定性和清洗性能的至少一种特性中具有更好的性能。在一些实施方案中，变体蛋白酶包括选自SEQ ID NOS54、56、58、60、62、64、66、68、70、72、74、76和78的氨基酸序列。在选择性的实施方案中，变体蛋白酶氨基酸序列由选自SEQ ID NOS53、55、57、59、61、63、65、67、69、71、73、75和77的多核苷酸序列编码。
本发明也提供了清洗组合物，其包括清洗有效量的蛋白水解酶，即包括与SEQ ID NO4具有至少70％的序列同一性的氨基酸序列的酶，和合适的清洗配方。在一些优选实施方案中，清洗组合物还包括一种或多种其他的酶或酶衍生物，酶或酶衍生物选自蛋白酶、淀粉酶、脂酶、甘露聚糖酶、果胶酶、角质酶、氧化还原酶、半纤维素酶和纤维素酶。
本发明也提供了包括获自微球菌亚目成员的至少一种丝氨酸蛋白酶的组合物，其中该组合物还包括至少一种稳定剂。在一些实施方案中，稳定剂选自硼砂和甘油。在一些实施方案中，本发明提供了适合于使本发明的酶对阴离子表面活性剂稳定的竞争性抑制剂。在一些实施方案中，至少一种蛋白酶获自生物体，所述生物体选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属。在一些优选实施方案中，蛋白酶获自纤维单胞菌69B4。在一些特别优选的实施方案中，至少一种蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
本发明进一步提供了包括获自微球菌亚目成员的至少一种丝氨酸蛋白酶的组合物，其中所述丝氨酸蛋白酶是自溶稳定的变体。在一些实施方案中，至少一种蛋白酶获自生物体，所述生物体选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属。在一些优选实施方案中，变体蛋白酶获自纤维单胞菌69B4。在一些特别优选的实施方案中，至少一种变体蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
本发明也提供了清洗组合物，其包括至少0.0001重量百分比的本发明的丝氨酸蛋白酶，以及可选地，包括辅助成份。在一些实施方案中，组合物包括辅助成份。在一些优选实施方案中，组合物包括足够数量的pH调节剂，以使得组合物的净pH(neat pH)在约3至约5之间，组合物基本上无在pH为约3至约5时水解的物质。在一些特别优选的实施方案中，进行水解的物质包括表面活性剂物质。在其他实施方案中，清洗组合物是液体组合物。在进一步的实施方案中，表面活性剂物质包括烷基硫酸钠表面活性剂，其包括环氧乙烷部分。
本发明还提供了包括至少一种酸稳定性酶的清洗组合物，该清洗组合物组合物包括足够数量的pH调节剂，以使得组合物的净pH在约3至约5之间，该组合物基本上无在pH为约3至约5时水解的物质。在进一步的实施方案中，水解的物质包括表面活性剂物质。在一些优选实施方案中，清洗组合物是液体组合物。在还有其他实施方案中，表面活性剂物质包括烷基硫酸钠表面活性剂，其包括环氧乙烷部分。在一些实施方案中，清洗组合物包括合适的辅助成份。在一些其他实施方案中，该组合物包括合适的辅助成份。在一些优选实施方案中，该组合物包括约0.001至约0.5重量％的ASP。
在一些可选择的优选实施方案中，所述组合物包括约0.01至约0.1重量百分比的ASP。
本发明也提供了清洗方法，该方法包括步骤a)将表面和/或包括纺织品的物品与包括本发明的丝氨酸蛋白酶的清洗组合物接触，清洗组合物为合适的浓度；和b)可选地，洗涤和/或漂洗所述表面或物品。在选择性的实施方案中，本文中提供的任何合适的组合物都可以应用于这些方法。
本发明也提供了包括获自微球菌亚目成员的至少一种丝氨酸蛋白酶的动物饲料。在一些实施方案中，至少一种蛋白酶获自生物体，所述生物体选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属。在一些优选实施方案中，蛋白酶获自纤维单胞菌69B4。在一些特别优选的实施方案中，至少一种蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
本发明提供了具有蛋白水解活性的分离的多肽(例如蛋白酶)，该多肽具有SEQ ID NO8中阐述的氨基酸序列。在一些实施方案中，本发明提供了分离的多肽，该多肽与SEQ ID NO8中阐述的序列具有约40％至98％的同一性。在一些优选实施方案中，该多肽与SEQ ID NO8中阐述的序列具有约50％至95％的同一性。在一些其他的优选实施方案中，该多肽与SEQ ID NO8阐述的序列具有约60％至90％的同一性。在还有其他实施方案中，该多肽与SEQ ID NO8阐述的序列具有约65％至85％的同一性。在一些特别优选的实施方案中，该多肽与SEQ ID NO8阐述的序列具有约90％至95％的同一性。
本发明进一步提供了获自微球菌亚目的细菌的蛋白酶。在一些优选实施方案中，蛋白酶获自原小单孢菌科(Promicromonosporaceae)的成员。在进一步的实施方案中，蛋白酶获自木聚糖微细菌属、木聚糖细菌属、木聚糖单胞菌属、产丝菌属和原小单孢菌属的成员。在一些优选实施方案中，蛋白酶获自纤维单胞菌科(Cellulomonadaceae)的成员。在一些特别优选的实施方案中，蛋白酶获自纤维单胞菌属和厄氏菌属的成员。在一些进一步优选实施方案中，蛋白酶来自纤维单胞菌属的某些种。在一些实施方案中，所述纤维单胞菌属某些种选自粪便纤维单胞菌(Cellulomonas fimi)、双氮纤维单胞菌(Cellulomonas biazotea)、Cellulomonascellasea、人纤维单胞菌(Cellulomonas hominis)、产黄纤维单胞菌(Cellulomonasflavigena)、Cellulomonas persica、Cellulomonas iranensis、Cellulomonas gelida、Cellulomonas humilata、特氏纤维单胞菌(Cellulomonas turbata)、Cellulomonas uda、发酵纤维单胞菌(Cellulomonas fermentans)、Cellulomonas xylanilytica、Cellulomonashumilata和纤维单胞菌菌株69B4(DSM 16035)。
在选择性的实施方案中，蛋白酶来自厄氏菌属某些种(Oerskovia spp.)。在一些优选实施方案中，所述厄氏菌属某些种选自Oerskovia jenensis、Oerskoviapaurometabola、Oerskovia enterophila、特氏厄氏菌(Oerskovia turbata)和特氏厄氏菌菌株DSM 20577。
在一些实施方案中，蛋白酶的表观分子量约17kD至21kD，表观分子量用基质辅助激光解吸附/离子化-飞行时间(“MALDI-TOF”)分光光度计测定。
本发明进一步提供了分离的多核苷酸，该分离的多核苷酸编码包括与SEQID NO8的氨基酸序列具有至少40％氨基酸序列同一性的氨基酸序列的蛋白酶。在一些实施方案中，该蛋白酶与SEQ ID NO8具有至少50％的氨基酸序列同一性。在一些实施方案中，该蛋白酶与SEQ ID NO8具有至少60％的氨基酸序列同一性。在一些实施方案中，该蛋白酶与SEQ ID NO8具有至少70％的氨基酸序列同一性。在一些实施方案中，该蛋白酶与SEQ ID NO8具有至少80％的氨基酸序列同一性。在一些实施方案中，该蛋白酶与SEQ ID NO8具有至少90％的氨基酸序列同一性。在一些实施方案中，该蛋白酶与SEQ ID NO8具有至少95％的氨基酸序列同一性。本发明也提供了包括上面提供的任何多核苷酸的表达载体。
本发明进一步提供了用本发明的表达载体转化的宿主细胞，这样，至少一种蛋白酶被宿主细胞表达。在一些实施方案中，宿主细胞是细菌，而在其他实施方案中，宿主细胞是真菌。在一些优选实施方案中，细菌宿主细胞选自芽孢杆菌属和链霉菌属。在一些选择性优选实施方案中，真菌宿主细胞是木霉属的成员，而在其他选择性优选实施方案中，真菌宿主细胞是曲霉属的成员。
本发明也提供了分离的多核苷酸，包括下述核苷酸序列(i)与SEQ ID NO3或4具有至少70％的同一性，或(ii)在中度至高严紧型条件下，能够与源自SEQ IDNO3或4所公开的核苷酸序列的探针杂交；(iii)与SEQ ID NO3或4所公开的核苷酸序列互补。在一些实施方案中，本发明提供了包括至少此类多核苷酸的表达载体。在进一步的实施方案中，本发明提供了用这样的表达载体转化的宿主细胞。
本发明进一步提供了产生至少一种具有蛋白酶活性的酶的方法，该方法包括步骤用包括与SEQ ID NO4具有至少70％序列同一性的多核苷酸的表达载体转化宿主细胞；在适合于宿主细胞产生蛋白酶的条件下培养转化的宿主细胞；和回收蛋白酶。在一些实施方案中，宿主细胞是链霉属某些种(Streptomyces spp.)，而在其他实施方案中，宿主细胞是芽孢杆菌属某些种(Bacillus spp.)、木霉属某些种(Trichoderma spp.)和/或曲霉属某些种(Aspergillus spp.)。在一些实施方案中，链霉属某些种是青紫链霉菌(Streptomyces lividans)。在选择性的实施方案中，宿主细胞是里氏木霉(T.reesei)。在进一步的实施方案中，曲霉属某些种是黑曲霉(A.niger)。
本发明也提供了编码本文中提供的蛋白酶的DNA的片段(即部分)。发现这些片段可用于获取部分长度的DNA片段，所述DNA片段能够被用于从纤维单胞菌69B4分离或鉴定出编码本文描述的成熟蛋白酶或其具有蛋白水解活性的片段的多核苷酸。在一些实施方案中，发现SEQ ID NO1中给出的DNA的部分可用于从其他种，特别是微球菌亚目某些种获得同源的DNA片段，所述片段编码蛋白酶或其具有蛋白水解活性的部分。
本发明进一步提供了至少一个探针，该探针包括与SEQ ID NOS1、2、3或4的片段基本上相同的多核苷酸，其中，该探针被用于检测编码具有蛋白水解活性的酶的核酸序列，并且其中核酸序列获自细菌来源。在一些实施方案中，细菌来源是纤维单胞菌属某些种。在一些优选实施方案中，细菌来源是纤维单胞菌属菌株69B4。
本发明进一步提供了包括至少一种本文中提供的蛋白酶的组合物。在一些优选实施方案中，组合物是清洗组合物。在一些实施方案中，本发明提供了包括清洗有效数量的至少一种蛋白酶的清洗组合物，该至少一种蛋白酶包括与SEQ IDNO8具有至少40％的序列同一性的氨基酸序列，与SEQ ID NO8具有至少90％的序列同一性的氨基酸序列，和/或具有SEQ ID NO8的氨基酸序列。在一些实施方案中，清洗组合物进一步包括至少一种合适的清洗助剂。在一些实施方案中，蛋白酶来自纤维单胞菌属某一种。在一些优选实施方案中，纤维单胞菌属某些种选自粪便纤维单胞菌、双氮纤维单胞菌、Cellulomonas cellasea、人纤维单胞菌、产黄纤维单胞菌、Cellulomonas persica、Cellulomonas iranensis、Cellulomonas gelida、Cellulomonas humilata、特氏纤维单胞菌、Cellulomonas uda和纤维单胞菌属菌株69B4(DSM 16035)。在一些特别优选的实施方案中，纤维单胞菌属某些种是纤维单胞菌属菌株69B4。在进一步的实施方案中，清洗组合物还包括至少一种选自蛋白酶、淀粉酶、脂酶、甘露聚糖酶和纤维素酶的其他的酶或酶衍生物。
本发明也提供了分离的天然存在的蛋白酶，所述蛋白酶包括这样的氨基酸序列，该氨基酸序列与SEQ ID NO8具有至少45％的序列同一性，与SEQ ID NO8具有至少60％的序列同一性，与SEQ ID NO8具有至少75％的序列同一性，与SEQID NO8具有至少90％的序列同一性，与SEQ ID NO8具有至少95％的序列同一性，和/或具有与SEQ ID NO8相同的序列，所述蛋白酶分离自纤维单胞菌属某些种。在一些实施方案中，所述蛋白酶分离自纤维单胞菌属菌株69B4(DSM 16035)。
在其他实施方案中，本发明提供了本发明的丝氨酸蛋白酶的工程化的(engineered)变体。在一些实施方案中，该工程化的变体用重组DNA技术进行遗传修饰，而在其他实施方案中，该变体是天然存在的。本发明还包括同源酶的工程化变体。在一些实施方案中，该工程化的变体同源蛋白酶用重组DNA技术进行遗传修饰，而在其他实施方案中，该变体同源蛋白酶是天然存在的。
本发明也提供了与本发明的纤维单胞菌69B4蛋白酶(即ASP)进行免疫交叉反应的丝氨酸蛋白酶。事实上，本发明的目的是包括ASP蛋白酶的片段(例如表位)，该ASP蛋白酶的片段在动物(包括但不限于人)中刺激免疫应答，和/或被任何类型的抗体识别。本发明还包括与ASP表位交叉反应的蛋白酶上的表位。在一些实施方案中，ASP表位被抗体识别，但不在动物(包括但不限于人)中刺激免疫应答，而在其他实施方案中，ASP表位在至少一种动物(包括但不限于人)中刺激免疫应答，并被任何类型的抗体识别。本发明也提供了鉴定和评价交叉反应表位的手段和组合物。
本发明进一步提供了编码信号肽的至少一种多核苷酸，该信号肽(i)与SEQID NO9具有至少70％的序列同一性，或(ii)在中度至高严紧型条件下，能够与源自编码SEQ ID NO9的多肽序列的探针杂交；(iii)与SEQ ID NO9提供的多肽序列互补。在进一步的实施方案中，本发明提供了包括上述多核苷酸的载体。在还有其他实施方案中，提供了用载体转化的宿主细胞。
本发明也提供了产生蛋白酶的方法，该方法包括(a)用包括多核苷酸的表达载体转化宿主细胞，所述多核苷酸与SEQ ID NO4具有至少70％的序列同一性，与SEQ ID NO4具有至少95％的序列同一性，和/或具有SEQ ID NO4的多核苷酸序列；(b)在适合于宿主细胞产生蛋白酶的条件下培养转化的宿主细胞；和(c)回收蛋白酶。在一些实施方案中，宿主细胞是芽孢杆菌属的种(例如枯草芽孢杆菌、克劳氏芽孢杆菌或地衣芽孢杆菌)。在选择性的实施方案中，宿主细胞是链霉属某些种(例如青紫链霉菌)。在其他实施方案中，宿主细胞是木霉属某些种(例如里氏木酶)。在进一步的实施方案中，宿主细胞是曲霉属某些种(例如黑曲霉)。
将会认识到，本发明的优点是已经分离到这样的多核苷酸，该多核苷酸赋予了进一步分离编码具有丝氨酸蛋白酶活性的蛋白质的多核苷酸的能力，其中具有丝氨酸蛋白酶活性的蛋白质的主架(backbone)与本发明的纤维单胞菌属蛋白酶基本上相同。
在进一步的实施方案中，本发明提供了产生宿主细胞方法，该宿主细胞能够相对大量地产生本发明的丝氨酸蛋白酶。在特别优选实施方案中，本发明提供了产生蛋白酶的方法，该蛋白酶在需要多肽的降解或合成的地方具有各种商业应用，包括清洗组合物以及饲料组分、纺织品加工、皮革修整、谷物加工、肉类加工、清洗、蛋白质水解产物的制备、消化助剂、杀微生物组合物、细菌抑制组合物、真菌抑制组合物、个人护理产品包括口腔护理、毛发护理和/或皮肤护理。
本发明进一步提供了酶组合物，该组合物相比起目前使用的枯草蛋白酶具有可媲美的或改进的洗涤性能。通过阅读本说明书，本发明的其他目的和优点是显而易见的。
本发明提供了具有蛋白水解活性的分离的多肽(例如蛋白酶)，该多肽具有SEQ ID NO8中阐述的氨基酸序列。在一些实施方案中，本发明提供了分离的多肽，该分离的多肽与SEQ ID NO8中阐述的序列具有约40％至98％的同一性。在一些优选实施方案中，该多肽与SEQ ID NO8中阐述的序列具有约50％至95％的同一性。在一些其他的优选实施方案中，该多肽与SEQ ID NO8中阐述的序列具有约60％至90％的同一性。在还有其他实施方案中，该多肽与SEQ ID NO8中阐述的序列具有约65％至85％的同一性。在一些特别优选的实施方案中，该多肽与SEQ IDNO8中阐述的序列具有约90％至95％的同一性。
本发明进一步提供了分离自微球菌亚目的细菌的蛋白酶。在一些优选实施方案中，蛋白酶获自原小单孢菌科的成员。在进一步的实施方案中，蛋白酶获自木聚糖微细菌属(Xylanimicrobium)、木聚糖细菌属(Xylanimicrobium)、木聚糖单胞菌属(Xylanimonas)、产丝菌属(Myceligenerans)和原小单孢菌属的任何成员。在一些优选实施方案中，蛋白酶获自纤维单胞菌科的成员。在一些特别优选的实施方案中，蛋白酶获自纤维单胞菌属和厄氏菌属的成员。在一些进一步的优选实施方案中，蛋白酶来自纤维单胞菌属某些种。在一些实施方案中，所述纤维单胞菌属某些种选自粪便纤维单胞菌、双氮纤维单胞菌、Cellulomonas cellasea、人纤维单胞菌、产黄纤维单胞菌、Cellulomonas persica、Cellulomonas iranensis、Cellulomonasgelida、Cellulomonas humilata、特氏纤维单胞菌、Cellulomonas uda、发酵纤维单胞菌、Cellulomonas xylanilytica、Cellulomonas humilata和纤维单胞菌属菌株69B4(DSM 16035)。
在可选择的实施方案中，蛋白酶来自厄氏菌属某些种。在一些优选实施方案中，厄氏菌属某些种选自Oerskovia jenensis、Oerskovia paurometabola、Oerskoviaenterophila、特氏厄氏菌和特氏厄氏菌菌株DSM 20577。
在一些实施方案中，蛋白酶的表观分子量约17kD至21kD，表观分子量用基质辅助激光解吸附/离子化-飞行时间(“MALDI-TOF”)分光光度计测定。
本发明进一步提供了编码蛋白酶的分离的多核苷酸，所述蛋白酶包括这样的氨基酸序列，该氨基酸序列与SEQ ID NO8具有至少40％的氨基酸序列同一性。在一些实施方案中，蛋白酶与SEQ ID NO8具有至少50％的氨基酸序列同一性。在一些实施方案中，蛋白酶与SEQ ID NO8具有至少60％的氨基酸序列同一性。在一些实施方案中，蛋白酶与SEQ ID NO8具有至少70％的氨基酸序列同一性。在一些实施方案中，蛋白酶与SEQ ID NO8具有至少80％的氨基酸序列同一性。在一些实施方案中，蛋白酶与SEQ ID NO8具有至少90％的氨基酸序列同一性。在一些实施方案中，蛋白酶与SEQ ID NO8具有至少95％的氨基酸序列同一性。本发明也提供了包括任何前面给出的多核苷酸的表达载体。
本发明进一步提供了用本发明的表达载体转化的宿主细胞，这样，至少一种蛋白酶被宿主细胞表达。在一些实施方案中，宿主细胞是细菌，而在其他实施方案中，宿主细胞是真菌。在一些优选实施方案中，细菌宿主细胞选自芽孢杆菌属和链霉属。在一些可选择的优选实施方案中，真菌宿主细胞是木霉属的成员，而在其他可选择的优选实施方案中，真菌宿主细胞是曲霉属的成员。
本发明也提供了分离的多核苷酸，包括下述核苷酸序列，其(i)与SEQ IDNO3或4具有至少70％的同一性，或(ii)在中度至高严紧型条件下，能够与来自SEQ ID NO3或4所公开的核苷酸序列的探针杂交；(iii)与SEQ ID NO3或4所公开的核苷酸序列互补。在一些实施方案中，本发明提供了包括至少一个此类多核苷酸的表达载体。在进一步的实施方案中，本发明提供了用此类载体转化的宿主细胞。
本发明进一步提供了产生至少一种具有蛋白酶活性的酶的方法，该方法包括步骤用包括与SEQ ID NO4具有至少70％序列同一性的多核苷酸的表达载体转化宿主细胞；在适合于宿主细胞产生蛋白酶的条件下培养转化的细胞；和回收蛋白酶。在一些实施方案中，宿主细胞是链霉属某些种，而在其他实施方案中，宿主细胞是芽孢杆菌属某些种、木霉属某些种和/或曲霉属某些种。在一些实施方案中，链霉属某些种是青紫链霉菌。在选择性的实施方案中，宿主细胞是里氏木霉。在进一步的实施方案中，曲霉属某些种是黑曲霉。
本发明也提供了编码本文中提供的蛋白酶的DNA的片段(即部分)。发现这些片段可用于获取部分长度的DNA片段，所述部分长度的DNA片段能够被用于从纤维单胞菌69B4中分离或鉴定编码成熟蛋白酶或其具有蛋白水解活性的片段的多核苷酸。在一些实施方案中，发现SEQ ID NO1中提供的DNA的部分可用于从其他种，特别是微球菌亚目某些种获得同源DNA片段，该片段编码蛋白酶或其具有蛋白酶活性的部分。
本发明进一步提供了至少一种探针，该探针包括与SEQ ID NOS1、2、3或4的片段基本上相同的多核苷酸，其中，该探针被用于检测编码具有蛋白水解活性的酶的核酸序列，并且其中核酸序列获自细菌来源。在一些实施方案中，细菌来源是纤维单胞菌属某些种。在一些优选实施方案中，细菌来源是纤维单胞菌属菌株69B4。
本发明进一步提供了包括至少一种本文中提供的蛋白酶的组合物。在一些优选实施方案中，组合物是清洗组合物。在一些实施方案中，本发明提供了包括清洗有效数量的至少一种蛋白酶的清洗组合物，该至少一种蛋白酶包括与SEQ IDNO8具有至少40％序列同一性的氨基酸序列、与SEQ ID NO8具有至少90％序列同一性的氨基酸序列，和/或具有SEQ ID NO8的氨基酸序列。在一些实施方案中，清洗组合物进一步包括至少一种合适的清洗助剂。在一些实施方案中，蛋白酶来自纤维单胞菌属某种。在一些优选实施方案中，纤维单胞菌属某些种选自粪便纤维单胞菌、双氮纤维单胞菌、Cellulomonas cellasea、人纤维单胞菌、产黄纤维单胞菌、Cellulomonas persica、Cellulomonas iranensis、Cellulomonas gelida、Cellulomonas humilata、特氏纤维单胞菌、Cellulomonas uda和纤维单胞菌属菌株69B4(DSM 16035)。在一些特别优选的实施方案中，所述纤维单胞菌属某些种是纤维单胞菌属菌株69B4。在进一步的实施方案中，清洗组合物还包括至少一种选自蛋白酶、淀粉酶、脂酶、甘露聚糖酶和纤维素酶的其他的酶或酶衍生物。
本发明也提供了分离的天然存在的蛋白酶，该蛋白酶包括这样的氨基酸序列，该氨基酸序列与SEQ ID NO8具有至少45％的序列同一性，与SEQ ID NO8具有至少60％的序列同一性，与SEQ ID NO8具有至少75％的序列同一性，与SEQID NO8具有至少90％的序列同一性，与SEQ ID NO8具有至少95％的序列同一性，和/或具有与SEQ ID NO8相同的序列，所述蛋白酶分离自纤维单胞菌属某些种。在一些实施方案中，蛋白酶分离自纤维单胞菌属菌株69B4(DSM 16035)。
在其他实施方案中，本发明提供了本发明的丝氨酸蛋白酶的工程化的变体。在一些实施方案中，该工程化的变体用重组DNA技术进行遗传修饰，而在其他实施方案中，该变体是天然存在的。本发明还包括同源酶的工程化变体。在一些实施方案中，该工程化的变体同源蛋白酶用重组DNA技术进行遗传修饰，而在其他实施方案中，该变体同源蛋白酶是天然存在的。
本发明也提供了与本发明的ASP蛋白酶免疫交叉反应的丝氨酸蛋白酶。事实上，本发明的目的是包括ASP蛋白酶的片段(例如表位)，该ASP蛋白酶的片段在动物(包括但不限于人)中刺激免疫应答，和/或被任何类型的抗体识别。本发明还包括与ASP表位交叉反应的蛋白酶上的表位。在一些实施方案中，ASP表位被抗体识别，但不在动物(包括但不限于人)中刺激免疫应答，而在其他实施方案中，ASP表位在至少一种动物(包括但不限于人)中刺激免疫应答，并被任何类型的抗体识别。本发明也提供了鉴定和评价交叉反应表位的方法和组合物。
木发明进一步提供了至少一种编码信号肽的多核苷酸(i)与SEQ ID NO9具有至少70％的序列同一性，或(ii)在中度至高严紧型条件下，能够与源自编码SEQID NO9的多肽序列的探针杂交；(iii)与SEQ ID NO9提供的多肽序列互补。在进一步的实施方案中，本发明提供了包括上述多核苷酸的载体。在还有其他实施方案中，提供了用载体转化的宿主细胞。
本发明也提供了产生蛋白酶的方法，该方法包括(a)用包括多核苷酸的表达载体转化宿主细胞，所述多核苷酸与SEQ ID NO4具有至少70％的序列同一性，与SEQ ID NO4具有至少95％的序列同一性，和/或具有SEQ ID NO4的多核苷酸序列；(b)在适合于宿主细胞产生蛋白酶的条件下培养转化的细胞；(c)和回收蛋白酶。在一些实施方案中，宿主细胞是芽孢杆菌属种(例如枯草芽孢杆菌(B.subtilis)、克劳氏芽孢杆菌(B.clausii)或地衣芽孢杆菌(B.licheniformis))。在选择性的实施方案中，宿主细胞是链霉属某些种(例如青紫链霉菌)。在其他实施方案中，宿主细胞是木霉属某些种(例如里氏木霉)。在还有进一步的实施方案中，宿主细胞是曲霉属某些种(例如黑曲霉(Aspergillus niger))。
将会被认识到的是，本发明的优点是已经分离到这样的多核苷酸，该多核苷酸赋予了分离进一步的多核苷酸的能力，该进一步的多核苷酸编码具有丝氨酸蛋白酶活性的蛋白质，其主架基本上与本发明的纤维单胞菌蛋白酶基本上相同。
在进一步的实施方案中，本发明提供了产生宿主细胞方法，该宿主细胞能够相对大量地产生本发明的丝氨酸蛋白酶。在特别优选地实施方案中，本发明提供了产生蛋白酶的方法，该蛋白酶在需要多肽的降解或合成的地方具有各种商业应用，包括清洗组合物以及饲料组分、纺织品加工、皮革修整、谷物加工、肉类加工、清洗、蛋白水解产物的制备、消化助剂、杀微生物组合物、细菌抑制组合物、真菌抑制组合物，个人护理产品包括口腔护理、毛发护理和/或皮肤护理。
本发明进一步提供了酶组合物，该组合物相比起目前使用的枯草蛋白酶蛋白酶具有可媲美的或改进的性能。通过阅读本说明书，本发明的其他目的和优点是显而易见的。

图1提供了无根系统发育树，示出了新型菌株69B4与纤维单胞菌科和微球菌亚目的其他相关属的成员的关系。
图2提供了ASP蛋白酶的系统发育树。
图3给出了来自纤维单胞菌属菌株69B4的蛋白酶的MALDI TOF光谱。
图4给出了来自产黄纤维单胞菌的N-端最典型的肽的序列。
图5给出了pSEGCT载体的质粒图谱。
图6给出了pSEGCT69B4载体的质粒图谱。
图7给出了pSEA469BCT载体的质粒图谱。
图8给出了pHPLT-Asp-C1-1载体的质粒图谱。
图9给出了pHPLT-Asp-C1-2载体的质粒图谱。
图10给出了pHPLT-Asp-C2-1载体的质粒图谱。
图11给出了pHPLT-Asp-C2-2载体的质粒图谱。
图12给出了pHPLT-ASP-III载体的质粒图谱。
图13给出了pHPLT-ASP-IV载体的质粒图谱。
图14给出了pHPLT-ASP-VII载体的质粒图谱。
图15给出了pXX-Kpn1载体的质粒图谱。
图16给出了p2JM103-DNNP1载体的质粒图谱。
图17给出了pHPLT载体的质粒图谱。
图18给出了打开的pHPLT-ASP-C1-2的图谱和MXL-prom序列。
图19给出了pENMx3载体的质粒图谱。
图20给出了pICatH载体的质粒图谱。
图21给出了pTREX4载体的质粒图谱。
图22给出了pSLGAMpR2载体的质粒图谱。
图23给出了pRAXdes2-ASP载体的质粒图谱。
图24给出了pAPDI载体的质粒图谱。
图25给出了显示ASP自溶的图表。图A的图表显示了在无LAS的缓冲液中观察到的ASP自溶肽。图B的图表显示了在含有0.1％LAS的缓冲液中观察到的ASP自溶肽。
图26比较了在液体TIDE_洗涤剂中，在北美洗涤条件(North American washconditions)下，某些丝氨酸蛋白酶(69B4[-x-]；PURAFECT_[-◆-]；RELASETM[-▲-]；和OPTIMASETM[-■-])的清洗活性(在405nm的吸光度)剂量(ppm)响应曲线。
图27给出了图表，该图表比较了在洗涤剂组合物(Detergent Composition)III粉末洗涤剂(0.66g/l)北美浓度/洗涤剂制剂中，在日本洗涤条件(Japanese washconditions)下，某些丝氨酸蛋白酶(69B4[-x-]；PURAFECT_[-◆-]；RELASETM[-▲-]；和OPTIMASETM[-■-])的清洗活性(在405nm的吸光度)剂量(ppm)响应曲线。
图28给出了图表，该图标比较了在ARIEL_REGULAR洗涤剂粉末中，在欧洲洗涤条件下，某些丝氨酸蛋白酶(69B4[-x-]；PURAFECT_[-◆-]；RELASETM[-▲-]；和OPTIMASETM[-■-])的清洗活性(在405nm的吸光度)剂量(ppm)响应曲线。
图29给出了图表，该图标比较了在PURE CLEAN洗涤剂粉末中，在日本洗涤条件下，某些丝氨酸蛋白酶(69B4[-x-]；PURAFECT_[-◆-]；RELASETM[-▲-]；和OPTIMASETM[-■-])的清洗活性(在405nm的吸光度)剂量(ppm)响应曲线。
图30给出了图表，该图表比较了在洗涤剂组合物III粉末(1.00g/l)中，在北美洗涤条件下，某些丝氨酸蛋白酶(69B4[-x-]；PURAFECT_[-◆-]；RELASETM[-▲-]；和OPTIMASETM[-■-])的清洗活性(在405nm的吸光度)剂量(ppm)响应曲线。
图31给出了图表，该图表示出了各种丝氨酸蛋白酶(100ppm)的相对氧化失活，其中在pH 9.45，25℃，用0.1M H2O2测量随时间(分钟)变化的酶活性百分比(69B4[-x-]；BPN’-变体1[-◆-]；PURAFECT_[-▲-]；和GG36-变体1[-■-])。
图32给出了图表，该图表示出了各种丝氨酸蛋白酶(100ppm)的相对螯合剂失活，其中在pH 8.20、45℃，用10mM EDTA测量随时间(分钟)变化的酶活性百分比(69B4[-x-]；BPN’-变体1[-◆-]；PURAFECT_[-▲-]；和GG36-变体1[-■-])。
图33给出了图表，该图示出了各种丝氨酸蛋白酶(100ppm)的相对热失活，在pH 8.0、45℃，50mM Tris测量随时间(分钟)变化的酶活性百分比(69B4[-x-]；BPN’变体1[-◆-]；PURAFECT_[-▲-]；和GG36-变体1[-■-])。
图34给出了图表，该图示出了在pH 8.60，在57℃至62℃的温度梯度中，各种丝氨酸蛋白酶(69B4[-x-]；BPN’-变体[-◆-]；PURAFECT_[-▲-]；和GG36-变体-1[-■-])的相对热失活. 图35给出了图表，该图示出了在37℃，pH 5至12范围内，某些丝氨酸蛋白酶(2.5ppm)(69B4[-■-]；BPN’-变体[-◆-]；PURAFECT_[-▲-]；和GG36-变体1[-●-])的酶活性(利用在405nm的吸光度测量二甲基酪蛋白的水解)。
图36给出了柱状图，该图示出了分别在温度25℃、35℃和45℃，pH为3 、4 、5 至6 时的某些丝氨酸蛋白酶(2.5ppm)(69B4、BPN’-变体；PURAFECT_和GG36-变体1)的酶稳定性，酶稳定性用％剩余活性(通过在405nm的吸光度测量二甲基酪蛋白的水解)表示。
图37给出了图表，该图表示出了分别在25℃、35℃和45℃，pH在3(-◆-)、4(--■--)、5(--▲--)至6(--×--)范围内的BPN’-变体的酶稳定性，其用％剩余活性表示。
图38给出了图表，该图表示出了分别在25℃、35℃和45℃，pH在3(-◆-)、4(--■--)、5(--▲--)至6(--×--)范围内的PURAFECT_TM蛋白酶的酶稳定性，其用％剩余活性表示。
图39给出了图表，该图表示出了分别在25℃、35℃和45℃，pH在3(-◆-)、4(--■--)、5(--▲--)至6(--×--)范围内的69B4蛋白酶的酶稳定性，其用％剩余活性表示。
发明描述[115]本发明提供了新颖的丝氨酸蛋白酶，编码这些酶的新颖遗传物质，和获自微球菌亚目某些种(Micrococcineae spp.)的蛋白水解蛋白质，由此开发而得的变体蛋白质，其中微球菌亚目某些种包括但不限于纤维单胞菌属某些种(Cellulomonasspp.)。特别地，本发明提供了获自纤维单胞菌属某些种的蛋白酶物质，编码所述蛋白酶的DNA，包括编码所述蛋白酶的DNA的载体，用所述载体DNA转化的宿主细胞，和由所述宿主细胞产生的酶。木发明也提供了清洗组合物(例如洗涤剂组合物)、动物饲料组合物和纺织品和皮革加工组合物，上述组合物包括获自微球菌亚目某些种的蛋白酶，其中微球菌亚目某些种包括但不限于纤维单胞菌属某些种。在可选择的实施方案中，木发明提供了源自本文中描述的野生型蛋白酶的突变体(也就是变体)蛋白酶。也发现这些突变体蛋白酶可用于大量应用中。
革兰氏阳性嗜碱性细菌已经从盐碱湖(alkaline soda lakes)中或附近分离出(参见例如美国专利5,401,657，其通过参考并入本文)。对这些嗜碱性细菌相互之间以及已知的细菌，依据数值分类学原则进行分析，并用分类学方法表征。产生六个天然的嗜碱性细菌群或同型种。在分离的菌株中，鉴定到菌株69B4。
纤维单胞菌属某些种是革兰氏阳性细菌，归为放线菌纲(Actinobacteria)，放线菌目(Actinomycetales)，微球菌亚目，纤维单胞菌科科的成员。生长出的纤维单胞菌形状为细长型，常常为不规则的杆状，其偶尔可以显示出分枝，但无菌丝体形成。此外，非好氧生长，也不形成孢子。纤维单胞菌和链霉菌仅在遗传水平上有较远的关系。纤维单胞菌和链霉菌之间巨大的遗传(基因组)差异反映在表型性状的巨大差异。尽管之前已经研究了在链霉菌中的丝氨酸蛋白酶，但显然还未报道由纤维单胞菌属某些种分泌的任何丝氨酸蛋白酶(MW约为18,000至20,000)。此外，之前显然还未报道过用于清洗和/或饲料工业的纤维单胞菌蛋白酶。
链霉菌是革兰氏阳性细菌，归类为放线菌纲，放线菌目，链霉菌亚目，链霉菌科的成员。链霉菌生长表现为大量的分枝状初生菌丝或基内菌丝，和丰富的气生菌丝，其在成熟时候携带特征孢子。链霉蛋白酶(Streptogrisins)是各种链霉菌属菌株大量分泌的丝氨酸蛋白酶。由至少9个不同的链霉菌属种，测定了链霉菌蛋白酶的氨基酸序列，这些不同的链霉菌属种包括灰色链霉菌(Streptomyces griseus)链霉蛋白酶C(登记号P52320)；来自链霉菌属某种的碱性蛋白酶(登记号PC2053)(EC 3.4.21.)；来自链霉菌属某种的碱性丝氨酸蛋白酶I(登记号S34672)；来自青紫链霉菌的丝氨酸蛋白酶(登记号CAD4208)；来自蓝色链霉菌(Streptomycescoelicolor)A3(2)的推断的丝氨酸蛋白酶(登记号NP 625129)；来自阿维链霉菌(Streptomyces avermitilis)MA-4680的推断的丝氨酸蛋白酶(登记号NP 822175)；来自青紫链霉菌的丝氨酸蛋白酶(登记号CAD42809)；来自蓝色链霉菌A3(2)的推断的丝氨酸蛋白酶前体(登记号NP 628830))。表观分子量为19,000道尔顿和分离自灰色链霉菌一变种(Streptomyces griseus var.alcalophilus)的推断的天然碱性蛋白酶和包括该蛋白酶的清洗组合物已被描述(参见例如美国专利5,646,028，该专利通过参考并入本文)。
本发明提供了由这些生物体产生的蛋白酶。重要地，这些酶具有良好的稳定性和蛋白水解活性。发现这些酶在各种应用中有用处，包括但是不限于清洗组合物、动物饲料、纺织品加工等。本发明也提供了产生这些酶的方法。在一些优选实施方案中，本发明的蛋白酶是纯的或相对纯的形式。
本发明也提供了适合于在重组生物体中产生本发明的蛋白酶的核苷酸序列。在一些实施方案中，重组生产提供了大量产生蛋白酶的手段，其在商业上是可行的。
除非另外指出，本发明的实施涉及常用于分子生物学、微生物学和重组DNA技术中的常规技术，这些技术在本领域技术范围内。此类技术是本领域技术人员所知道的，并描述在众多教材和参考文献中(参见例如Sambrook等″MolecularCloningA Laboratory Manual″，第二版(Cold Spring Harbor)， )；和Ausubel等″Current Protocols in Molecular Biology″ )。上文和下文中提及的所有专利、专利申请、论文和出版物，通过参考特意地并入本文。
除非本文中另外指出，在此所用的技术和科学术语与本专利所属的技术领域的普通技术人员所普遍理解的具有同样的意义。例如，Singleton和Sainsbury，Dictionary of Microbiology and Molecular Biology，第二版，John Wiley和Sons，NY(1994)；以及Hale和Marham，The Harper Collins Dictionary of Biology，HarperPerennial，NY(1991)为本领域技术人员提供了许多被本发明使用的术语的一般性释义。尽管与本文中描述的类似或等同的任何方法和材料都可以用于本发明的实践之中，在此描述了优选的方法和材料。因此，下面即将定义的术语通过参考作为整体的说明书而被充分描述。此外，如本文中所使用的，单数“一(a)”、“一(an)”和“该(the)”包括复数涵义，除非上下文明确地表明其他意思。数字范围包括定义范围的端值。除非另有指明，核酸以5’-3’的方向从左至右书写；氨基酸序列以氨基末端向羧基末端的方向从左至右书写。应该理解，本发明不限于所描述的具体的方法学、方案和试剂，因为它们可以变化，这取决于它们被本领域技术人员使用的环境。
除非另外指出，本发明的实施利用了蛋白质纯化、分子生物学、微生物学和重组DNA技术和蛋白质测序这样的常规技术，所有这些技术在本领域技术人员的技术范围内。
此外，本文提出的标题不是对本发明各个方面或者各种实施方案的限制，可以通过参考整个说明书来考虑它们。因此，通过将说明书作为一个整体来考虑，下面即将被定义的术语可以被更为充分地定义。尽管如此，为了帮助理解本发明，下面定义了许多术语。
I.定义[125]如本文中所使用的，术语“蛋白酶”和“蛋白水解活性”指能够水解具有肽键的肽或底物的蛋白质或肽。已有许多已知的方法可以用于测量蛋白水解活性(Kalisz，″Microbial Proteinases，″InFiechter(ed.)，Advances in BiochemicalEngineering/Biotechnology， )。例如，通过分析各蛋白酶水解商业底物的能力的比较分析，可以确定蛋白水解活性。可以用于这样的蛋白酶或蛋白水解活性分析的示范性底物包括但不限于二甲基酪蛋白(Sigma C-9801)、牛胶原(SigmaC-9879)、牛弹性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。使用这些底物的比色分析法是本领域熟知的(参见WO 99/34011；和美国专利6,376,450，这两篇专利通过参考并入本文)。pNA分析法(参见例如Del Mar等Anal.Biochem.，99316-320 )也可用于测定在梯度洗脱过程中收集的级分的活性酶浓度。该分析法测量当酶水解可溶性合成底物琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对-硝基苯胺(succinyl-alanine-alanine-proline-phenylalanine-p-nitroanilide)(sAAPF-pNA)时，对硝基苯胺释放的速度。用分光光度计在410nm处测量黄颜色从水解反应产生的速率，该速率与活性酶浓度成比例。此外，在280nm的吸光度测量值可以被用于确定总蛋白质浓度。活性酶/总蛋白质的比率给出了酶纯度。
如在此所使用地，术语“ASP蛋白酶”、“Asp蛋白酶”和“Asp”指本文中描述的丝氨酸蛋白酶。在一些优选实施方案中，Asp蛋白酶是获自纤维单胞菌属菌株69B4的、本文中命名为69B4蛋白酶的蛋白酶。因此，在优选述实施方案中，术语“69B4蛋白酶”指来自纤维单胞菌属菌株69B4(DSM 16035)的、天然存在的成熟蛋白酶，其具有与SEQ ID NO8中提供的序列基本上相同的氨基酸序列。在选择性的实施方案中，本发明提供了ASP蛋白酶的一部分(portions)。
术语“纤维单胞菌蛋白酶同源物”指天然存在的蛋白酶，该蛋白酶具有与来自纤维单胞菌属菌株69B4的成熟蛋白酶基本上相同的氨基酸序列，或编码此类天然存在的蛋白酶的多核苷酸序列，其中该蛋白酶保留由此类核酸编码的丝氨酸蛋白酶的功能特征。在一些实施方案中，这些蛋白酶同源物称作“纤维单胞菌蛋白酶(cellulomonadins)”。
如在此所使用地，术语“蛋白酶变体”、“ASP变体”、“ASP蛋白酶变体”和“69B蛋白酶变体”被用于指与野生型ASP类似的蛋白酶，特别是在它们的功能上，但在它们的氨基酸序列中有使得它们在序列上不同于野生型蛋白酶的突变。
如在此所使用地，术语“纤维单胞菌属某些种”指在“纤维单胞菌属”内的所有菌株，它们是革兰氏阳性细菌，被归类为放线菌纲，放线菌目，微球菌亚目亚目，纤维单胞菌科的成员。已被认识到，纤维单胞菌属在分类学上不断地被重新调整。因此，该属旨在包括已被重新分类的种。
如在此所使用地，“链霉菌属某些种”指“链霉菌属”内的所有菌株，它们是革兰氏阳性细菌，被归类为放线菌纲，放线菌目，链霉菌亚目，链霉菌科的成员。已被认识到，链霉菌属在分类学上不断地被重新调整。因此，该属旨在包括已被重新分类的种。
如在此所使用地，“芽孢杆菌属”包括本领域技术人员所知道的在“芽孢杆菌属”内的所有种，包括但不限于枯草芽孢杆菌、地衣芽胞杆菌、缓慢芽孢杆菌(B.lentus)、短小芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳氏芽孢杆菌、B.halodurans、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、B.lautus和苏云金芽孢杆菌(B.thuringiensis)。已被认识到，芽孢杆菌属不断经历分类学重新调整。因此，该属旨在包括已被重新分类的种，包括但是不限于此类生物体，如嗜热脂肪芽孢杆菌，其现在命名为“Geobacillusstearothermophilus”。在氧存在下产生抗性内孢子被认为是芽孢杆菌属的限定性特征，尽管该特征也适用于最近命名的Alicyclobacillus、Amphibacillus、解硫胺素芽孢杆菌属(Aneurinibacillus)、Anoxybacillus、短芽孢杆菌属(Brevibacillus)、Filobacillus、薄壁芽孢杆菌属(Gracilibacillus)、喜盐芽孢杆菌属(Halobacillus)、类芽孢杆菌属(Paenibacillus)、需盐芽孢杆菌属(Salibacillus)、耐热芽孢杆菌属(Thermobacillus)、Ureibacillus和枝芽孢杆菌属(Virgibacillus)。
在本文中可交换使用的术语“多核苷酸”和“核酸”指任何长度的核苷酸聚合物形式，其或者是核糖核苷酸或者是脱氧核糖核苷酸。这些术语包括但不限于单链、双链或三链DNA、基因组DNA、cDNA、RNA、DNA-RNA杂交体、或聚合物，其包括嘌啉和嘧啶碱基、或者其他天然、化学、生物化学修饰的、非天然或衍生的核苷酸碱基。下面是多核苷酸的非限制性例子基因、基因片段、染色体片段、EST、外显子、内含子、mRNA、tRNA、rRNA、核酶、cDNA、重组多核苷酸、分枝多核苷酸、质粒、载体、分离的任何序列的DNA、分离的任何序列的RNA、核酸探针和引物。在一些实施方案中，多核苷酸包括修饰的核苷酸，诸如甲基化的核苷酸和核苷酸类似物，尿嘧啶，其他糖和连接基团诸如氟核糖(Fluororibose)和thioate，和核苷酸分枝(nucleotide branches)。在选择性的实施方案中，核苷酸的序列夹杂有非核苷酸成份。
如在此所使用的，术语“DNA构建物”和“转化DNA”被交换使用，指用于将序列引入宿主细胞或生物体的DNA。DNA可以通过PCR或本领域技术人员知道的任何其他合适的技术在体外产生。在特别优选的实施方案中，DNA构建物包括感兴趣的序列(例如作为引入的序列)。在一些实施方案中，序列可操作性地与其他元件诸如控制序列(例如启动子等)连接。DNA构建物还可以包括选择性标记。它还可以包括侧面与同源框(homology box)相接的引入序列。在进一步的实施方案中，转化DNA包括添加到端部的其他非同源序列(例如填充序列(stuffer sequences)或侧翼序列(flanks))。在一些实施方案中，引入序列的端部是闭合的，这样转化DNA形成闭合环。转化序列可以是野生型的，突变的或修饰的。在一些实施方案中，DNA构建物包括与宿主细胞染色体同源的序列。在其他实施方案中，DNA构建物包括非同源的序列。一旦DNA构建物在体外组装成之后，它可以被用于1)将异源序列插入宿主细胞期望的目标序列中，和/或；2)诱变宿主细胞染色体的某一区域(即用异源序列替换内源性序列)；3)删除目标基因；和/或将复制型质粒引入宿主细胞。
如在此所使用地，术语“表达盒”和“表达载体”指重组和合成产生的核酸构建物，该核酸构建物携带允许特定的核酸在目标细胞中转录的一系列特定的核酸元件。重组表达盒可以被整合入质粒、染色体、线粒体DNA、质体DNA、病毒和核酸片段。典型地，表达载体的重组表达盒部分包括待被转录的核酸序列和启动子和其它序列。在优选的实施方案中，表达载体能够将异源DNA片段整合入宿主细胞并在宿主细胞中表达。许多原核和真核表达载体是商业上可获得的。合适的表达盒的选择在本领域技术人员的知识范围内。在本文中，术语“表达盒”可与“DNA构建物”以及它们的语法等同物交换使用。合适的表达载体的选择在本领域技术人员的知识范围之内。
如在此所使用地，术语“载体”指设计用于将核酸引入一个或多个细胞型的多核苷酸构建物。载体包括克隆载体、表达载体、穿梭载体、质粒、盒(cassette)和类似物。在一些实施方案中，多核苷酸构建物包括编码蛋白酶(例如前体或成熟蛋白酶)的DNA序列，该DNA序列可操作性地连接到能够影响该DNA在合适的宿主中表达的合适的原序列(prosequence)(例如促分泌原序列等)。
如在此所使用地，术语“质粒”指用作克隆载体的环状双链DNA构建物，其在一些真核或原核生物中形成染色体外自主复制的遗传成份，或整合入宿主染色体。
如在本文中将核酸序列引入细胞的上下文中所使用地，术语“引入”指适合于将核酸序列转移入细胞的任何方法。此类引入方法包括但是不限于原生质体融合、转染、转化、接合和转导(参见例如Ferrari等，″Genetics，″于Hardwood等(eds.)，Bacillus，Plenum Publishing Corp.，第57-72页， )。
如在此所使用地，术语“转化的”和“稳定转化的”指含有非天然(异源的)多核苷酸序列的细胞，所述多核苷酸序列整合入它的基因组，或作为附加体质粒存在，其保留至少两代。
如在此所使用地，术语“编码选择性标记的核苷酸序列”指能够在宿主细胞中表达的核苷酸序列，并且该选择性标记的表达赋予含有该表达的基因的细胞在相应的选择性试剂存在下或缺少必需营养物的情况下生长的能力。
如在此所使用地，术语“可选择标记”和“选择性标记”指能够在宿主细胞中表达，从而使得含有载体的那些宿主易于被选择的核酸(例如基因)。此类可选择的标记的例子包括但是不限于抗微生物试剂。因此，术语“可选择标记”指这样的基因，其指示出宿主细胞已经吸收了感兴趣的引入DNA或一些其他的反应已经发生。典型地，选择性标记是赋予宿主细胞抗微生物试剂抗性或代谢优势的基因，以使得能将含有外源DNA的细胞与在转化期间不接受任何外源序列的细胞区别开来。“驻留选择性标记”是位于待被转化的微生物染色体上的标记。驻留选择性标记编码不同于转化DNA构建物上的选择性标记的基因。选择性标记是本领域技术人员熟知的。如上面所示，优选地，标记是抗微生物试剂抗性标记(例如ampR；phleoR；specR；kanR；eryR；tetR；cmpR；和neoR；参见例如Guerot-Fleury，Gene，167335-337 ；Palmcros等，Gene 247255-264 ；和Tricu-Cuot等，Gene，23331-341 )。根据本发明，其他可使用的标记包括但不限于营养缺陷型标记，诸如色氨酸；和检测标记诸如β-半乳糖苷酶。
如在此所使用地，术语“启动子”指其功能为指导下游基因转录的核酸序列。在优选的实施方案中，启动子适合于目标基因在其中被表达的宿主细胞。启动子，以及其他转录和翻译调控核酸序列(也称为“控制序列”)是表达给定的基因所必需的。一般来说，转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列、和增强子或激动子序列。
当被置于与另一核酸序列的功能关系中时，核酸便被“可操作性地连接”。例如，如果编码促分泌前导肽(即信号肽)的DNA作为参与多肽分泌的蛋白前体表达，则它是被可操作性地连接到编码多肽的DNA；如果启动子或增强子影响序列的转录，则该启动子或增强子被可操作性地连接到编码序列；或者如果核糖体结合位点被安置以帮助翻译，则该核糖体结合位点被可操作性地连接到编码序列。一般而言，“可操作性地连接”指被连接的DNA序列是邻接的，并且在促分泌前导肽的情况中，是邻接的且处于同一阅读框(reading phase)中。然而，增强子不必是邻接的。通过在常规的限制性位点进行连接，连接得以实现。如果这样的位点不存在，可根据常规的实践，使用合成的寡核苷酸适体或接头。
如在此所使用地，术语“基因”指编码多肽的多核苷酸(例如DNA片段)，并包括在编码区之前和之后的区域以及在各个编码片段(外显子)之间的间插序列(内含子)。
如在此所使用地，“同源基因”指来自不同但通常相关种的一对基因，其相互对应，并且相互之间相同或非常类似。该术语包含通过物种形成(即新种发生)而分离的基因(例如直向同源基因)，以及通过遗传复制而分离的基因(例如共生同源基因)。
如在此所使用地，“直向同源物”和“直向同源基因”指在不同的物种中，通过物种形成从共同的祖先基因进化而来的基因(即同源基因)。典型地，直向同源物在进化过程期间保留相同的功能。发现对直向同源物的鉴定可用于可靠地预测在新测序的基因组中的基因功能。
如在此所使用地，“种内同源物”和“共生同源基因”指在基因组内通过复制而相关的基因。直向同源物在进化过程中保留相同的功能，而种内同源基因进化出新的功能，尽管一些功能常常与原始的功能相关。共生同源基因的例子包括但是不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因，它们都是丝氨酸蛋白酶，并在同样的种中一起出现。
如在此所使用地，“同源性”指序列相似性或同一性，优选同一性。该同源性使用本领域的标准技术进行测定(参见例如Smith和Waterman，Adv.Appl.Math.，2482 ；Needleman和Wunsch，J.Mol.Biol.，48443 ；Pearson和Lipman，Proc.Natl.Acad Sci.USA 852444 ；在Wisconsin Genetics Software Package中的程序诸如GAP、BESTFIT、FASTA和TFASTA(Genetics Computer Group，Madison，WI)；和Devereux等，Nucl.Acid Res.，12387-395 )。
如在此所使用地，“同功序列(analogous sequence)”指这样的序列，其中该基因的功能与纤维单胞菌属菌株69B4蛋白酶的基因基本上相同。此外，同功序列包括与纤维单胞菌属菌株69B4蛋白酶的序列至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％、98％、99％或100％的序列同一性。可选择地，同功序列在纤维单胞菌属菌株69B4蛋白酶区域中具有70至100％的基因序列匹配，和/或在与纤维单胞菌属菌株69B4染色体的基因比对的区域中具有至少5-10个基因。在其他实施方案中，一个以上的上述特性适用于该序列。利用已知的序列比对方法确定同功序列。尽管如上面和下面所示，还有其他方法也可以用于比对序列，但常用的比对方法是BLAST。
可使用的算法的一个例子是PILEUP。PILEUP使用渐进性配对比对，由一组相关的序列，产生多序列比对。它也可以绘出显示用于产生比对的群集关系(clustering relationship)的树。PILEUP使用Feng和Doolittle(Feng和Doolittle，J.Mol.Evol.，35351-360 )的简化形式的渐进比对方法。该方法类似于由Higgins和Sharp(Higgins和Sharp，CABIOS 5151-153 )描述的方法。有用的PILEUP参数包括默认空位权重(default gap weight)3.00，默认空位长度权重(default gap lengthweight)0.10，和加权末端空位(weighted end gaps)。
可使用的算法的另一个例子是BLAST算法，由Altschul等(Altschul等，J.Mol.Biol.，215403-410，；和Karlin等，Proc.Natl.Acad.Sci.USA 905873-5787 )描述。特别有用的BLAST程序是WU-BLAST-2程序(参见Altschul等，Meth.Enzymol.，266460-480 )。WU-BLAST-2使用若干搜索参数，大部分参数设置为默认值。可调整的参数设置如下重叠跨度(overlap span)＝1，重叠分数(overlapfraction)＝0.125，字阈值(word threshold)(T)＝11。HSP S和HSP S2参数是动态值，并依据特定序列的组成和搜索感兴趣的序列时所用的特定数据库的组成，由软件本身建立。然而，值可以被调整以增加灵敏性。通过用匹配的相同残基的数目除以比对的区域中“较长的”序列的总残基数，确定％氨基酸序列同一性值。“较长的”序列是比对的区域中具有最多实际残基的序列(由WU-Blast-2引入以最大化匹配分值(alignment score)的空位不计)。
因此，“百分(％)核酸序列同一性”被定义为在候选序列中与起始序列(即感兴趣的序列)的核苷酸残基相同的核苷酸残基的百分比。优选的方法利用设置为默认参数的WU-BLAST-2的BLASTN模式(module)，重叠跨度和重叠分数分别设置为1和0.125。
如在此所使用地，术语“杂交(Hybridization)”是指核酸链与互补链通过碱基配对联结的过程，如本领域所知道的。
如果两序列在中度至高度严紧型杂交和洗涤条件下特异性地相互杂交，那么便认为其中一个核酸对于另一个参照核酸，是“可选择性地杂交”的。杂交条件是基于核酸结合复合物或者探针的解链温度(Tm)。例如“最大严紧型”典型地发生在大约Tm-5℃(低于探针的Tm 5℃)；“高严紧型”发生在低于Tm大约5-10℃；“中间严紧型”发生在低于探针的Tm大约10-20℃；“低严紧型”发生在低于Tm大约20-25℃。从功能上来说，最大严紧型条件可以被用来鉴定与杂交探针具有严格同一性或者接近严格的同一性的序列，而中等或低严紧型杂交被用来鉴定或检测多核苷酸序列同源物。
中等和高严紧型杂交条件是本领域熟知的。高严紧型条件的例子包括在约42℃，50％甲酰胺、5×SSC、5×Denhardt′s溶液、0.5％SDS和100μg/ml变性载体DNA中杂交，然后在室温中，2×SSC和0.5％SDS中洗涤两次，再在42℃，在0.1×SSC和0.5％SDS中洗涤两次。中等严紧型条件的例子包括在37℃，在包括20％甲酰胺、5×SSC(150mM NaCI、15mM柠檬酸三钠)、50mM磷酸纳(pH 7.6)、5×Denhardt′s溶液、10％硫酸葡聚糖和20mg/ml变性剪切的鲑鱼精DNA的溶液中，温育过夜，然后在约37-50℃，用1×SSC洗涤滤膜。如果需要，本领域技术人员知道如何调整温度、离子强度等，以适应各种因素诸如探针长度和类似因素。
如在此所使用地，术语“重组子”，指这样的细胞或载体，其已经通过异源性核酸序列的导入而被修饰，或者衍生于如此修饰的细胞的细胞。因此，例如，重组细胞表达未以同样的形式在该细胞的天然(非重组)形式中发现的基因，或者表达的是天然基因，但是该天然基因以另外的方式异常地表达、表达不足或者根本不表达，作为谨慎的人为干扰的结果。“重组”、“重组的”和产生“重组的”核酸通常是两条或更多条核酸片段的装配，其中该装配产生嵌合基因。
在优选实施方案中，突变体DNA序列通过在至少一个密码子中进行位点饱和诱变(site saturation mutagenesis)而产生。在另一优选实施方案中，位点饱和诱变对两个或更多个密码子实施。在进一步的实施方案中，突变体DNA序列与野生型序列具有大于50％、大于55％、大于60％、大于65％、大于70％、大于75％、大于80％、大于85％、大于90％、大于95％、大于98％的同源性。在选择性的实施方案中，突变体DNA使用任何已知的诱变技术体内产生，诸如辐射、亚硝基胍和类似方法。然后分离期望的DNA序列，并用于本文提供的方法中。
如在此所使用地，术语“目标序列”指宿主细胞中编码序列的DNA序列，其中它对于将引入序列插入到宿主细胞基因组中是有利的。在一些实施方案中，目标序列编码功能性的野生型基因或操纵子，而在其他实施方案中，目标序列编码功能性的突变基因或操纵子，或非功能性的基因或操纵子。
如在此所使用地，“侧翼序列(flanking sequence)”指在所讨论的序列的上游或者下游的任何序列(例如，对于基因A-B-C，A和C基因序列在基因B的两侧侧翼)。在优选的实施方案中，同源框位于引入序列的每一侧。在另一实施方案中，引入序列和同源框构成在每一侧有填充序列的单元。在一些实施方案中，侧翼序列仅仅存在于一侧(或者3′侧或者5′侧)，但是在优选的实施方案中，侧翼序列存在于两侧。
如在此所使用地，术语“填充序列”指位于同源框侧面的额外的DNA(典型地是载体序列)。然而，该术语包含任何非同源DNA序列。不受任何理论限制，填充序列为细胞起始DNA吸收提供了非关键性的目标。
如在此所使用地，术语“扩增”和“基因扩增”指这样的过程，通过该过程，特定的DNA序列不成比例地被复制，这样，扩增的基因以高于最初存在于基因组的拷贝数存在。在一些实施方案中，通过在药物(例如可抑制的酶的抑制剂)存在下的生长进行的细胞选择，导致扩增了编码在该药物存在下生长所必需的基因产物的内源基因，或扩增编码该基因产物的外源(即输入的)序列，或两种情况都有。
“扩增”是涉及模板特异性的核酸复制的特殊情况。它与非特异性模板复制(即，模板依赖型的复制，但不依赖于特定的模板)形成对比。模板特异性在这里不同于复制保真度(即，正确的多核苷酸序列的合成)和核苷酸(核糖核苷酸或脱氧核糖核苷酸)特异性。模板特异性常常是针对“目标”特异性而言。在词义上看，目标序列是试图从其他核酸中检选出来的“目标”。扩增技术主要被设计用于该检选用途。
如在此所使用地，术语“共扩增”指将可扩增的标记联合其他基因序列(即包括一个或多个非选择性基因，诸如那些包含在表达载体中的基因)一起引入单个细胞中，应用合适的选择性压力，这样，细胞不但扩增可扩增的标记也扩增其他非选择性基团序列。可扩增的标记可以通过物理的方法连接到其他基因序列上，或者两独立的DNA片段，一个含有可扩增的标记而另一个含有非选择性标记，它们可以被引入到同一细胞中。
如在此所使用地，术语“可扩增标记”、“可扩增基因”和“扩增载体”指基因或编码基因的载体，其使得该基因能够在合适的生长条件下扩增。
通过选择酶，可以在大部分扩增技术中实现“模板特异性”。扩增酶是这样的酶，其在它们被使用的条件下，在核酸的不均一混合物中，将仅仅加工特定的核酸序列。例如，在Qβ复制酶的情况中，MDV-1 RNA是该复制酶特定的模板(参见例如，Kacian等，Proc.Natl.Acad.Sci.USA 693038 )。其他的核酸不被该扩增酶复制。类似地，在T7 RNA聚合酶的情况中，该扩增酶对它自己的启动子具有严格的特异性(参见Chamberlin等，Nature 228227 )。在T4 DNA连接酶的情况中，在连接结合(ligation junction)处寡核苷酸或多核苷酸底物和模板之间有错配时，该酶将不连接所述两寡核苷酸或多核苷酸(参见Wu和Wallace，Genomics 4560 )。最后，Taq和Pfu聚合酶，由于它们能在高温中发挥功能，发现它们对结合的序列显示出高特异性，并因此被引物限定；高温导致了有利于引物与目标序列杂交而不与非目标序列杂交的热动力学条件。
如在此所使用地，术语“可扩增核酸”指可以通过任何扩增方法扩增的核酸。可以考虑的是，“可扩增核酸”通常包括“样品模板”。
如在此所使用地，术语“样品模板(sample template)”指来自样品的核酸，其被用于分析是否存在“目标”(在下面定义)。相反，“背景模板(background template)”被用于指除样品模板之外的核酸，其可以或不必存在于样品中。背景模板大部分是疏忽造成的。它可能是遗留的结果，或它可能是由于存在着核酸污染物的缘故，所述核酸污染物可以试图从样品中纯化掉。例如，来自被检测生物体之外的生物体的核酸可以作为检测样品中的背景。
如在此所使用地，术语“引物”指寡核苷酸，无论是作为纯化的限制性消化产物(digest)天然存在的，或者合成产生的，当放置在与核酸链互补的引物延伸产物的合成被诱导的条件下时(即在核苷酸和诱导剂诸如DNA聚合酶存在下和在合适的温度和pH中)，该寡核苷酸能够充当合成的起始点。引物优选是单链的，以获得最大的扩增效率，但是可选择地可以是双链的。如果是双链的，在用于制备延伸产物前，引物首先进行处理，以将它的链分开。优选地，引物是寡脱氧核糖核苷酸。引物必需足够长，以在诱导剂存在下起始延伸产物的合成。引物精确的长度将取决于许多因素，包括温度、引物来源和使用的方法。
如在此所使用地，术语“探针”指寡核苷酸(即核苷酸序列)，无论是作为纯化的限制性消化产物(digest)天然存在的，或者合成、重组或通过PCR扩增产生的，其能够与另一感兴趣的寡核苷酸杂交。探针可以是单链的或双链的。探针可以用于检测、鉴定和分离特定的基因序列。可以考虑，用于本发明的任何探针可以用任何“报告分子”标记，这样，在任何检测系统中是可检测的，检测系统包括但是不限于酶(例如ELISA，以及基于酶的组织化学分析)、荧光、放射和发光系统。本发明不旨在限制任何特定的检测系统或标记。
如在此所使用地，术语“目标”，当用于聚合酶链式反应时，指被用于聚合酶链式反应的引物结合的核酸区域。因此，“目标”试图被从其他核酸序列拣选出来。“片段”定义为在目标序列内的核酸区域。
如在此所使用地，术语“聚合酶链式反应”(″PCR″)，指美国专利4,683,195、4,683,202和4,965,188中的方法，这些专利通过参考并入本文，其包括增加在基因组DNA混合物中目标序列片段的浓度的方法，不包括克隆或纯化。用于扩增目标序列的该方法由下述步骤组成，将过量的寡核苷酸引物加入到含有期望的目标序列的DNA混合物中，然后在DNA聚合酶存在下进行精确的有次序的热循环。这两条引物分别与双链目标序列的两条链互补。为了实现扩增，将混合物变性，然后使引物与它们在目标分子内的互补序列退火。退火之后，用聚合酶延伸引物，以便形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(即变性、退火和延伸构成一个“循环”；可以有多个“循环”)，以获得高浓度的期望目标序列的扩增片段。期望目标序列的扩增片段的长度可以由引物相互之间的相对位置决定，因此，长度是可控参数。依据该方法的重复性，该方法称为“聚合酶链式反应”(下文中称为“PCR”)。因为目标序列的期望的扩增片段成为混合物中主要的序列(就浓度而言)，它们被叫作“PCR扩增的”。
如在此所使用地，术语“扩增试剂”指除了引物、核酸模板和扩增酶之外扩增所必需的那些试剂(脱氧核糖核苷三磷酸、缓冲液等)。典型地，扩增试剂以及其他反应组分被置于并包含在反应管中(试管、微孔等)。
对于PCR，有可能将基因组DNA中的单拷贝的特定目标序列扩增到用若干不同方法可以检测的水平(方法例如与标记探针杂交；掺入生物素化的引物，然后进行抗生物素蛋白-酶偶联物检测；将32P-标记脱氧核苷三磷酸，诸如dCTP或dATP掺入到扩增片段中)。除了基因组DNA，任何寡核苷酸或多核苷酸序列可以用合适的引物分子对进行扩增。特别地，由PCR方法产生的扩增片段本身就是随后PCR扩增的有效模板。
如在此所使用地，术语“PCR产物”、“PCR片段”和“扩增产物”是PCR变性、退火和延伸步骤的两个或更多个循环完成之后，产生的化合物混合物。这些术语包含这样的情况，即扩增了一个或多个目标序列的一个或多个片段。
如在此所使用地，术语“RT-PCR”指RNA序列的复制和扩增。在该方法中，逆转录与PCR相结合，常常使用利用了热稳定聚合酶的一种酶程序，如美国专利5,322,770所描述，该专利通过参考并入本文。在RT-PCR中，因聚合酶的逆转录酶活性，RNA模板被转化为cDNA，然后使用聚合酶的聚合活性进行扩增(即，如在其他PCR方法中所述)。
如在此所使用地，术语“限制性核酸内切酶”和“限制性酶”指细菌酶，它们中的每一个在特定的核苷酸序列上或附近切割双链DNA。
“限制性位点”是被给定的限制性核酸内切酶识别并切割的核苷酸序列，并且常常是插入DNA片段的位点。在本发明的某些实施方案中，限制性位点被工程化构建入选择性标记中，以及DNA构建物的5′和3′端中。
如在此所使用地，术语“染色体整合”指这样的过程，由此引入的序列被引入到宿主细胞的染色体中。转化DNA的同源区域与染色体的同源区域联配。结果，同源框之间的序列以双交换(double crossover)被引入的序列替换(即同源重组)。在本发明的一些实施方案中，DNA构建物的失活染色体片段的同源片段与杆菌染色体内源(indigenous)染色体区域的侧翼同源区域匹配。结果，内源染色体区域以双交换的方式被DNA构建物删除(即同源重组)。
“同源重组”指在相同或几乎相同的核苷酸位置上，两DNA分子之间或成对的染色体之间进行的DNA片段的交换。在优选实施方案中，染色体整合就是同源重组。
本文中使用的“同源序列”指当以最佳的方式进行比对以用于比较时，与另一核酸或多肽序列具有100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、88％、85％、80％、75％或70％序列同一性的核酸或多肽序列。在一些实施方案中，同源序列具有85％至100％的序列同一性，而在其他实施方案中，具有90％至100％的序列同一性，在更加优选的实施方案中，具有95％至100％的序列同一性。
本文中使用的“氨基酸”指肽或蛋白质序列或其部分。术语“蛋白质”、“肽”和“多肽”被交换使用。
如在此所使用地，“感兴趣的蛋白质”和“感兴趣的多肽”指被需要的和/或被评价的蛋白质/多肽。在一些实施方案中，感兴趣的蛋白质在细胞内被表达，而在其他实施方案中，它是分泌的多肽。在特别优选的实施方案中，这些酶包括本发明的丝氨酸蛋白酶。在一些实施方案中，感兴趣的蛋白质是与信号肽融合的分泌多肽(即在待被分泌的蛋白质上有氨基端的延伸)。几乎所有的分泌蛋白质都使用氨基端蛋白延伸，其在将前体蛋白质靶向膜并转移通过膜中起到关键的作用。该延伸物在膜转移期间或紧接膜转移之后，通过信号肽酶，以蛋白水解的方式去除。
如在此所使用地，术语“异源蛋白质”指不在宿主细胞中天然存在的蛋白质或多肽。异源蛋白质的例子包括酶，诸如水解酶，包括蛋白酶。在一些实施方案中，编码蛋白质的基因是天然存在的基因，而在其他实施方案中，使用突变的和/或合成的基团。
如本文中所使用的，“同源蛋白质”指在细胞中天然存在的蛋白质或多肽。在优选的实施方案中，细胞是革兰氏阳性细胞，而在特别优选的实施方案中，细胞是芽孢杆菌宿主细胞。在选择性的实施方案中，同源蛋白质是由其他生物体产生的天然蛋白质，包括但是不限于大肠杆菌、链霉属、木霉属和曲霉属。本发明包含通过重组DNA技术产生同源蛋白质的宿主细胞。
如在此所使用地，“操纵子区域”包括一组邻接的基因，其作为单个转录单元由共同的启动子转录，并因此受到共调节(co-regulation)。在一些实施方案中，操纵子包括调节子基因。在大部分优选的实施方案中，使用这样的操纵子，其被高度表达，如通过RNA水平所测量的，但其具有未知的或非必需的功能。
如在此所使用地，“抗微生物剂区域(antimicrobial region)”是含有至少一个编码抗微生物剂蛋白质的基因的区域。
如果，在它的天然状态中或当通过本领域技术人员知道的方法被操纵时，多核苷酸能够被转录和/或翻译以产生RNA、多肽或其片段，那么该多核苷酸被认为能“编码”RNA或多肽。此类核酸的反义链也被认为可以编码序列。
如本领域所知道的，DNA可以被RNA聚合酶转录以产生RNA，但是RNA可以被逆转录酶逆转录以产生DNA。因此，DNA能够编码RNA，反之亦然。
术语“调节片段”或“调节序列”或“表达控制序列”指DNA多核苷酸序列，该序列与编码多肽链氨基酸序列的DNA的多核苷酸序列可操作性地连接，以影响编码的氨基酸序列的表达。调节序列可以抑制、阻止或促进编码氨基酸的可操作地连接的多核苷酸序列的表达。
“宿主菌株”或“宿主细胞”指包括本发明的DNA的表达载体的合适宿主。
如果酶在细胞中以高于在它在相应野生型细胞中的表达水平被表达，那么该酶在宿主细胞中被“过量”表达。
术语“蛋白质”和“多肽”在本文中被交换使用。遵照IUPAC-IUB JointCommission on Biochemical Nomenclature(JCBN)定义的氨基酸3字母密码子通篇用于本公开中。应该理解，由于遗传密码子简并性的缘故，多肽可以用一种以上的核苷酸序列编码。
“原序列(prosequence)”是信号序列和成熟蛋白酶之间的氨基酸序列，其是蛋白酶的分泌所必需的。对原序列的切割将产生成熟的活性蛋白酶。
术语“信号序列”或“信号肽”指可以参与分泌成熟或前体形式的蛋白质的任何核苷酸和/或氨基酸序列。信号序列的该定义是功能性定义，旨在包括所有那些由蛋白质基因的N-端部分编码的氨基酸序列，其参与完成蛋白质的分泌。它们经常但不是一律地结合到蛋白质的N-端部分，或结合到前体蛋白质的N-端部分。信号序列可以是内源性的或外源性的。信号序列可以是正常情况下与该蛋白质(例如蛋白酶)连接的序列，或可以来自编码另一分泌蛋白质的基因。一个示范性外源信号序列包括来自枯草芽孢杆菌枯草蛋白酶的信号序列的前7个氨基酸残基，其被融合到来自缓慢芽孢杆菌(ATCC 21536)的枯草蛋白酶的信号序列的剩余部分上。
术语“杂合信号序列(hybrid signal sequence)”指这样的信号序列，其中部分序列获自表达宿主，其被融合到待被表达的基因的信号序列上。在一些实施方案中，利用合成的序列。
术语“基本上同样的信号活性(substantially the same signal activity)”指这样的信号活性，表示为蛋白酶基本上同样地分泌到发酵培养基中，例如发酵培养基蛋白酶水平是由SEQ ID NOS5和/或9的信号序列提供的发酵培养基中分泌蛋白酶水平的至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％。
术语“成熟”形式的蛋白质或肽指最终功能形式的蛋白质或肽。例如，成熟形式的本发明蛋白酶至少包括与SEQ ID NO8的残基位置1-189相同的氨基酸序列。
术语“前体”形式的蛋白质或肽指具有可操作地连接到蛋白质的氨基或羧基端的原序列的成熟形式的蛋白质。前体也可以具有可操作地连接到原序列的氨基端的“信号”序列。前体也可以具有参与翻译后活性的额外的多核苷酸(例如，由此切割下来以产生成熟形式的蛋白质或肽的多核苷酸)。
“天然存在的酶”指具有与自然界中发现的序列相同的、未修饰的氨基酸序列的酶。天然存在的酶包括天然酶、那些自然表达的酶或在特定微生物中发现的酶。
术语“来自(derived from)”和“获自(obtained from)”不仅指由所论及的菌株生物体产生或可由其产生的蛋白酶，也指由分离自这样的菌株的DNA序列编码的，并在含有这样的DNA序列的宿主生物体中产生的蛋白酶。此外，该术语也指由合成的和/或cDNA来源的DNA编码的蛋白酶，并且其具有所论及的蛋白酶的识别特征。作为示范，“来自纤维单胞菌的蛋白酶”指那些由纤维单胞菌天然产生的、具有蛋白水解活性的酶，以及这样的丝氨酸蛋白酶，即，那些从纤维单胞菌来源生成的，但是其通过使用遗传工程技术由用编码所述丝氨酸蛋白酶的核酸转化的非纤维单胞菌生物体产生的丝氨酸蛋白酶。
该定义范围内的“衍生物”通常保留在野生型、天然或亲代形式中观察到特有的蛋白水解活性，并且达到这样的程度，以至于衍生物可用于与野生型、天然或亲代形式相似的目的。丝氨酸蛋白酶的功能衍生物包含天然存在的、合成的或重组产生的肽或肽片段，其具有本发明的丝氨酸蛋白酶的一般特征。
术语“功能衍生物”是具有编码丝氨酸蛋白酶的核酸的功能性特征的核酸衍生物。编码本发明丝氨酸蛋白酶的核酸的功能衍生物包含天然存在的、合成或重组产生的核酸或片段并编码本发明特征性的丝氨酸蛋白酶。编码本发明丝氨酸蛋白酶的野生型核酸包括天然存在的等位基因和同源物，这基于本领域已知的遗传密码的简并性。
术语“同一的”，在两条核酸或多肽序列的上下文中指当被比对以获得最大一致性(correspondence)时，两序列中相同的残基，这用下述的序列比较或分析算法中的其中一种来测量。
术语“最优联配(optimal alignment)”指给出最高百分同一性分值的比对。
“百分序列同一性”、“百分氨基酸序列同一性”、“百分基因序列同一性”和/或“百分核酸/多核苷酸序列同一性”，涉及到两氨基酸、多核苷酸和/或基因序列(如适当的话)时，指当序列被最优联配时在两序列中相同的残基的百分比。因此，80％氨基酸同一性指在两最优联配的多肽序列中，80％的氨基酸是相同的。
词语“基本上相同的”，在两条核酸或多肽的上下文中指当与参考序列相比时，具有至少70％序列同一性、优选的至少75％序列同一性、优选的至少80％序列同一性、优选的至少85％序列同一性、优选的至少90％序列同一性、优选的至少95％序列同一性、优选的至少97％序列同一性、优选的至少98％序列同一性、优选的至少99％序列同一性的多核苷酸或多肽，其中利用使用了标准参数的程序或算法(例如BLAST、ALIGN、CLUSTAL)。两多肽基本上相同的一个表征是第一多肽与第二多肽具有免疫交叉反应性。典型地，差异为保守氨基酸置换的多肽具有免疫交叉反应性。因此，例如当两肽的差异仅仅在于保守置换时，该多肽与第二多肽基本上相同。两核酸序列基本上相同的另一个表征是两分子在严紧型条件下相互杂交(例如在中度至高严紧型范围内)。
词语“等同的(equivalent)”在该上下文中指由多核苷酸编码的丝氨酸蛋白酶，该多核苷酸能够在中度至最高严紧型条件下与具有SEQ ID NO1中示出的序列的多核苷酸杂交。例如，“等同的”指等同的成熟丝氨酸蛋白酶，其与具有SEQ ID NO8的氨基酸序列的成熟纤维单胞菌丝氨酸蛋白酶具有至少70％、至少75％、至少80％、至少85％、至少90％，、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％和/或至少99％的序列同一性。
术语“分离的”或“纯化的”指从它的原始环境(例如如果它是天然存在的，则指自然环境)移出的物质。例如，当以比在自然发生或野生型生物体中存在的浓度高或低的浓度存在于特定组合物中时，或与在由自然发生或野生型生物体表达时通常不存在的组分结合时，该物质可以说是“纯化的”。例如，存在于活动物中的天然存在多核苷酸或多肽不是分离的，但是与天然系统中的一些或所有共存物质分离开的同样的多核苷酸或多肽则是分离的。此类多核苷酸可能是载体的一部分，和/或此类多核苷酸或多肽可能是组合物的一部分，并且仍然是分离的，原因是此载体或组合物不是它的天然环境的一部分。在优选的实施方案中，核酸或蛋白质可以是纯化的，例如如果在电泳凝胶或印迹中产生基本上一个条带的话。
术语“分离的”，当用于涉及DNA序列时，指已经从它的自然遗传环境中移出并因此无其他额外或不需要的编码序列的DNA序列，并且是适合用于遗传工程蛋白质生产系统的形式。此类分离的分子是那些分离自它们的天然环境的分子，包括cDNA和基因组克隆。本发明分离的DNA分子没有它们通常与之联系的其他基因，但是可以包括天然存在的5′和3′非翻译区，诸如启动子和终止子。对有联系的区域的鉴定对本领域技术人员是显而易见的(参见例如，Dynan和Tijan，Nature316774-78 )。术语“分离的DNA序列”可选择性地指“克隆的DNA序列”。
术语“分离的”，当用于蛋白质时，指在它的自然环境以外的环境中发现的蛋白质。在优选的形式中，分离的蛋白质基本上没有其他蛋白质，特别是其他同源蛋白质。如通过SDS-PAGE测定的，分离的蛋白质纯度大于10％、优选纯度大于20％、甚至更优选纯度大于30％。本发明的其他方面包含高度纯化形式的蛋白质(即纯度大于40％、纯度大于60％、纯度大于80％、纯度大于90％、纯度大于95％、纯度大于97％、甚至纯度大于99％)，如通过SDS-PAGE测定的。
如在此所使用地，术语“组合诱变(combinatorial mutagenesis)”指产生起始序列的变体文库的方法。在这些文库中，变体含有从预先确定的一组突变选出的一个或若干个突变。此外，所述方法提供了引入随机突变的手段，所述随机突变不是预先确定的突变组中的成员。在一些实施方案中，方法包括在2000年10月26日提交的美国专利申请09/699.250中阐述的方法，该专利申请通过参考并入本文。在选择性的实施方案中，组合诱变方法包括商业可获得的试剂盒(例如QuikChange_Multisite，Stratagene，San Diego，CA)。
如在此所使用地，术语“突变体文库”指它们的基因组的大部分相同，但是包括一个或多个基因的不同同源物的细胞群。此文库可以被用于例如鉴定具有改进的特性的基因或操纵子。
如在此所使用地，术语“起始基因”指感兴趣的基因，其编码利用本发明待被改进和/或改变的感兴趣的蛋白质。
如在此所使用地，术语“多序列联配”(″MSA″)指使用算法(例如Clustal W)进行比对的起始基因的多个同源物的序列。
如在此所使用地，术语“共有序列(consensus sequence)”和“规范序列(canonicalsequence)”指原始型(archetypical)氨基酸序列，感兴趣的特定蛋白质或序列的所有变体都与其进行比较。该术语也指显示有最经常存在于感兴趣的DNA序列中的核苷酸的序列。对于基因的每一个位置，共有序列给出了MSA中那个位置上出现最多的氨基酸。
如在此所使用地，术语“共有突变(consensus mutation)”指起始基因序列和共有序列之间的差异。通过比较MSA的共有序列和起始基因序列，鉴定出共有突变。在一些实施方案中，共有突变被引入起始基团中，这样它变得与共有序列更相似。共有突变也包括氨基酸变化，其将起始基因中的氨基酸改变为MSA中在那个位置的氨基酸，后者在MSA中被发现的频率相对于起始基因中的氨基酸的频率来说要更加频繁。因此，术语“共有突变”包括所有的单氨基酸改变，其将起始基因的氨基酸替换为在MSA中比该氨基酸更多地出现的氨基酸。
如在此所使用地，术语“最初命中(initial hit)”指通过筛选组合共有诱变文库而被鉴定到的变体。在优选的实施方案中，相比起起始基因，最初命中具有改善的性能特征。
如在此所使用地，术语“改善的命中(improved hit)”指通过筛选增强的组合共有诱变文库而被鉴定到的变体。
如在此所使用地，术语“改善性突变”和“性能增强性突变”指当它被引入到起始基因时可导致改善的性能的突变。在一些优选实施方案中，这些突变通过在方法的筛选步骤期间对被鉴定出的命中进行测序而被鉴定。在大部分实施方案中，与未筛选的组合共有诱变文库相比，更常见于命中(hit)中的突变很有可能是改善性突变。
如在此所使用地，术语“增强的组合共有诱变文库(enhanced combinatorialconsensus mutagenesis library)”指CCM文库，其是基于获自较早轮的CCM诱变和筛选的筛选和/或测序结果进行设计和构建的。在一些实施方案中，增强的CCM文库基于由较早轮CCM产生的最初命中的序列。在其他实施方案中，增强的CCM被设计，其偏袒于在由较早轮诱变和筛选产生的最初命中中经常发现的突变。在一些优选实施方案中，这通过省去编码性能降低突变的引物，或通过增加编码性能增强突变的引物——相对于用于较早CCM文库中的其他引物——的浓度来实现。
如在此所使用地，术语“性能降低突变(performance-reducing mutations)”指组合共有诱变文库中较少见于由筛选产生的命中的突变，与未筛选的组合共有诱变文库相比而言。在优选的实施方案中，筛选过程去除和/或降低了含有“性能减少突变”的变体的丰度。
如在此所使用地，术语“功能分析”指给出蛋白质活性指示的分析。在特别优选的实施方案中，该术语指分析系统，在该分析系统中，分析蛋白质以它平常的能量发挥功能的能力。例如，在酶的例子中，功能分析涉及测定酶在催化反应中效率。
如在此所使用地，术语“目标特性”指待被改变的起始基因的特性。本发明不旨在限制任何特定的目标特性。然而，在一些优选实施方案中，目标特性是基因产物的能力(例如对变性的抗性、蛋白水解特性或其他降解因素)，而在其他实施方案中，在生产宿主中的生产水平被改变。事实上，可以考虑的是，起始基因的任何特性都将可用于本发明。
如在此所使用地，术语“特性”或其语法上等同的术语在核酸上下文中，指可以被选择或检测的核酸任何特征或性质。这些特性包括但不限于，影响与多肽结合的特性、赋予包括特定核酸的细胞的特性、影响基因转录的特性(例如启动子长度、启动子识别、启动子调节、增强子功能)、影响RNA加工的特性(例如RNA剪接、RNA稳定性、RNA构象和转录后修饰)、影响翻译的特性(例如水平、调节、mRNA与核糖体蛋白质的结合、翻译后修饰)。例如，转录因子、聚合酶、调节因子等的核酸结合位点可以被改变以产生期望的特征或鉴定不想要的特征。
如在此所使用地，术语“特性”或其语法上等同的术语在蛋白质上下文中，指可以被选择或检测的蛋白质任何特征或性质。这些特性包括但不限于氧化稳定性、底物特异性、催化活性、热稳定性、碱稳定性、pH活性特征、对蛋白水解降解的抗性、KM、kcat、kcat/kM比率、蛋白质折叠、诱导免疫应答、与配体结合的能力、与受体结合的能力、被分泌的能力、被展示在细胞表面的能力、寡聚化的能力、信号传导的能力、刺激细胞增殖的能力、抑制细胞增殖的能力、诱发细胞凋亡的能力、通过磷酸化作用或糖基化作用进行修饰的能力、治疗疾病的能力。
如在此所使用地，术语“筛选”具有它在本领域中通常的意义，一般是多步骤过程。在第一步中，提供了突变核酸或由此产生的变体多肽。在第二步中，测定突变核酸或变体多肽的特性。在第三步中，将测定的特性与相应的前体核酸的特性、相应的天然存在的多肽的特性或与用于产生突变核酸的起始物质(例如最初序列)的特性相比较。
对本领域技术人员显而易见地是，用于获得具有改变的特性的核酸或蛋白的筛选程序取决于起始材料的特性，产生突变核酸的目的是为了便于对起始材料进行修饰。因此，技术人员将认识到本发明不局限于待被筛选的任何具体的特性，下述特性的描述仅仅是列出示范性的例子。筛选任何特定特性的方法通常在本领域中有所描述。例如，技术人员可以在突变之前和之后测量结合、pH、特异性等，其中变化表明有改变。优选地，筛选以高通量的方式进行，包括同时筛选的多个样品，包括但不限于利用芯片、噬菌体展示以及多底物和/或指示物的分析。
如在此所使用地，在一些实施方案中，筛选包括选择步骤，在选择步骤中感兴趣的变体从变体群体中富集起来。这些实施方案的例子包括选择这样的变体，其赋予宿主生物体以生长优势，以及噬菌体展示或任何其他的展示方法，其中变体可以基于它们的结合或催化特性从变体群体捕获得到。在优选实施方案中，将变体文库暴露于应激(热、蛋白酶、变性)，随后依然完整的变体在筛选中被鉴定，或通过选择被富集。该术语旨在包括用于选择的任何合适的手段。事实上，本发明不限制任何特定的筛选方法。
如在此所使用地，术语“目标随机化(targeted randomization)”指产生其中一个或多个位置已被随机化的许多序列的过程。在一些实施方案中，随机化可以在随机化的位置上完成(即所有四种核苷酸A、T、G和C)。在选择性的实施方案中，核苷酸的随机化限于四种核苷酸的一部分。目标随机化可以应用于编码一个或若干感兴趣的蛋白质的序列的一个或若干密码子。当被表达时，所得的文库产生蛋白质群，在其中一个或多个氨基酸位置可以含有所有20种氨基酸或一部分氨基酸的混合物，如通过随机化密码子的随机化方案所确定的。在一些实施方案中，由目标随机化产生的群的各个成员在氨基酸数量上不同，这是由于密码子有目标的或随机的插入或缺失的缘故。在进一步的实施方案中，合成的氨基酸包括在产生的蛋白质群中。在一些优选实施方案中，由目标随机化产生的群体的大多数成员显示出比起始基因更大的与共有序列的序列同源性。在一些实施方案中，序列编码一个或多个感兴趣的蛋白质。在选择性的实施方案中，蛋白质具有不同的生物学功能。在一些优选实施方案中，引入的序列包括至少一个选择性标记。
术语“修饰的序列”和“修饰的基因”在本文中可以交换使用，指包括天然存在的核酸序列的删除、插入或中断的序列。在一些优选实施方案中，修饰的序列的表达产物是截短的蛋白质(例如如果所述修饰是序列的删除或中断的话)。在一些特别优选的实施方案中，截短的蛋白质保留生物学活性。在选择性的实施方案中，修饰的序列的表达产物是延长的蛋白质(例如修饰包括在核酸序列中的插入)。在一些实施方案中，插入导致截短的蛋白质(例如当插入导致终止子的形成时)。因此，插入可以或者产生截短的蛋白质或产生延长的蛋白质作为表达产物。
如在此所使用地，术语“突变序列”和“突变基因”被交换使用，指在宿主细胞的野生型序列中具有至少一个密码子改变的序列。突变序列的表达产物是相对于野生型具有改变的氨基酸序列的蛋白质。表达产物可以具有改变的功能能量(例如增强的酶活性)。
术语“诱变引物”或“诱变寡核苷酸”(本文中可以交换使用)旨在指这样的寡核苷酸组合物，其对应于模板序列的一部分，并能够由与该模板杂交。至于诱变引物，引物将不与模板核酸精确匹配，在引物中的错配或多个错配被用于将期望的突变引入核酸文库。如在此所使用地，“非诱变引物”或“非诱变寡核苷酸”指与模板核酸精确匹配的寡核苷酸组合物。在本发明的一个实施方案中，仅仅使用诱变引物。在本发明另一优选的实施方案中，如此设计引物，以便对于已包括诱变引物的至少一个区域，在寡核苷酸混合物中也有非诱变引物。通过加入诱变引物和对应于至少一个诱变引物的非诱变引物的混合物，有可能产生存在各种组合诱变类型的核酸文库。例如，如果希望突变核酸文库的一些成员在某些位置上保留它们的前体序列，而其他成员在这些位置是突变的，那么对于给定残基，非诱变引物提供了在核酸文库内获得特定水平的非突变成员的能力。本发明方法利用诱变和非诱变寡核苷酸，其长度一般在10-50碱基之间，更优选长度约15-45个碱基。然而，使用或者小于10个碱基或者大于50个碱基的引物以获得期望的诱变结果也可能是必要的。至于相应的诱变和非诱变引物，相应的寡核苷酸长度没有必要完全相同，仅仅需要在对应于突变的区域具有重叠。
可以根据本发明以预先确定的比率加入引物。例如，如果希望所得的文库具有相当水平的某具体的突变并且在相同位置或不同位置上具有较少数量的不同的突变，通过调整加入的引物的数量，则有可能产生期望的偏好性文库(biasedlibrary)。可选择性地，通过加入较少或较多数量的非诱变引物，有可能调整在突变核酸文库中产生相应的突变的频率。
如在此所使用地，词语“邻接突变(contiguous mutations)”指存在于同一寡核苷酸引物内的突变。例如，邻接突变互相可以是彼此相邻的或靠近的，然而，它们将被同一引物引入到所得到的突变模板核酸中。
如在此所使用地，词语“不连续突变(discontiguous mutations)”指存在于分开的寡核苷酸引物中的突变。例如，利用分开制备的寡核苷酸引物，不连续突变将被引入到所得到的突变模板核酸中。
术语“野生型序列”或“野生型基因”在本文中被交换使用，指天然的或自然存在于宿主细胞中的序列。在一些实施方案中，野生型序列指作为蛋白质工程项目起点的感兴趣的序列。野生型序列可以编码同源或者异源蛋白质。同源蛋白质是不加以干涉便由宿主产生的蛋白质。异源蛋白质是在没有干涉的情况下宿主细胞不会产生的蛋白质。
如在此所使用地，术语“抗体”指免疫球蛋白。抗体包括但不限于直接获自可以被期望产生抗体的任何物种的免疫球蛋白。此外，本发明包括修饰的抗体。该术语也指保留了结合到完整抗体所结合的表位的能力的抗体片段，并且包括多克隆抗体、单克隆抗体、嵌合抗体、抗-独特型(抗-ID)抗体。抗体片段包括但不限于互补决定区(CDRs)、单链片段可变区(scFv)、重链可变区(VH)、轻链可变区(VL)。多克隆和单克隆抗体也包括本发明范围内。优选地，抗体是单克隆抗体。
术语“氧化稳定的”指在蛋白水解、水解、清洗或其他本发明过程期间常见的条件下，例如当暴露于漂白剂或氧化剂或与漂白剂或氧化剂接触时，在给定时间段里保留特定数量的酶活性的本发明蛋白酶。在一些实施方案中，在蛋白酶与漂白剂或氧化剂接触一段给定的时间例如至少1分钟、3分钟、5分钟、8分钟、12分钟、16分钟、20分钟等之后，蛋白酶保留至少50％、60％、70％、75％、80％、85％、90％、92％、95％、96％、97％、98％或99％的蛋白水解活性。在一些实施方案中，稳定性按照实施例中所描述的进行测量。
术语“螯合剂稳定的”指在蛋白水解、水解、清洗或其他本发明过程期间常见的条件下，例如当暴露于螯合剂或与螯合剂接触时，在给定的时间段里保留特定数量的酶活性的本发明蛋白酶。在一些实施方案中，在蛋白酶与螯合剂接触一段给定的时间例如至少10分钟、20分钟、40分钟、60分钟、100分钟等之后，蛋白酶保留至少50％、60％、70％、75％、80％、85％、90％、92％、95％、96％、97％、98％或99％的蛋白水解活性。在一些实施方案中，螯合剂稳定性按照实施例中所描述的进行测量。
术语“热力稳定的”和“热稳定的”指在蛋白水解、水解、清洗或其他本发明过程期间常见的条件下，例如当暴露于改变的温度时，在暴露于确定的温度一段给定的时间后，保留特定数量的酶活性的本发明蛋白酶。改变的温度包括增加或降低的温度。在一些实施方案中，在蛋白酶暴露于改变的温度一段给定的时间例如至少60分钟、120分钟、180分钟、240分钟、300分钟等之后，蛋白酶保留至少50％、60％、70％、75％、80％、85％、90％、92％、95％、96％、97％、98％或99％的蛋白水解活性。在一些实施方案中，热稳定性按照实施例中所描述的进行测定。
术语“增强的稳定性”，在氧化、螯合剂、热和/或pH稳定蛋白酶的上下文中，指相比起其他丝氨酸蛋白酶(例如枯草蛋白酶)和/或野生型酶，在一段时间里具有较高的保留的蛋白水解活性。
术语“降低的稳定性”在氧化、螯合剂、热和/或pH稳定蛋白酶的上下文中，指相比起其他丝氨酸蛋白酶(例如枯草蛋白酶)和/或野生型酶，在一段时间里具有较低的保留的蛋白水解活性。
除非另外指出，如在此所使用的，术语“清洗组合物”包括颗粒或粉末形式的多用途或“高效(heavy-duty)”清洗试剂，特别是清洗洗涤剂；液体、凝胶或糊形式的多用途清洗试剂，特别是所谓的高效液体类型；液体精细织物洗涤剂；手工洗碟剂或轻载(light duty)洗碟剂，特别是那些高泡沫类型的洗碟剂；机器洗碟剂，包括各种片剂、颗粒、液体和漂洗辅助类型的洗碟剂，用于家庭和工业用途；液体清洗和消毒剂，包括抗细菌手洗类型，清洗条块、漱口水、假牙清洗剂、车用和地毯用香波、浴室用清洗剂；洗发香波和净发剂；沐浴露和泡沫浴和金属清洗剂；以及清洗辅助剂诸如漂白添加剂和“stain-stick”或预处理类型。
应该理解描述在本文实施例中的测试方法被用于测定本发明参数的各个值，这样发明在本文中被描述并要求保护。
除非另外指出，所有组分或组合物水平参照组分或组合物的活性水平，且不包括杂质，例如残留溶剂或副产物，其可以存在于商业可获得的来源中。
酶组分重量是基于总活性蛋白质来进行计算。
除非另外指出，所有百分比和比率用重量计算。除非另外指出，所有百分比和比率基于总组合物进行计算。
应该理解，整个本说明书中给出的每一最大数值限值包括每一较小的数值限值，就好像此较小的数值限值清楚地书写在本文中一样。整个本说明书中给出的每一最小数值限值包括每一较大的数值限值，就好像此较大的数值限值清楚地书写在本文中一样。整个本说明书中给出的每一数值范围将包括落入此较宽的数值范围内的每一较窄的数值范围，就好像此较窄的数值范围都清楚地书写在本文中一样。
术语“清洗活性”指在蛋白水解、水解、清洗或其他本发明过程期间常见的条件下，由蛋白酶实现的清洗性能。在一些实施方案中，通过应用各种清洗分析方法测定清洗性能，所述分析方法涉及酶敏感性污物，例如草、血、牛奶或蛋蛋白质，在将污物置于标准洗涤条件中后，利用各种层析、分光光度或其他定量方法进行测定。示范性的分析方法包括但不限于WO 99/34011和美国专利6,605,458(两者通过参考并入本文)中描述的方法，以及那些包括在实施例中的方法。
术语“清洗有效数量”的蛋白酶指上文中描述的蛋白酶的数量，其在特定的清洗组合物中获得理想水平的酶促活性。此有效数量容易由本领域普通技术人员确定，并且基于许多因素，诸如所使用的特定的蛋白酶、清洗用途、清洗组合物具体的成份、以及是否要求液体的或干的(例如颗粒、条形)组合物等。
如在此所使用地，术语“清洗辅助物质”指根据所需要的清洗组合物的特定类型和产品形式(例如液体、颗粒、粉末、条形、糊状、喷雾、片剂、凝胶或泡沫组合物)所选择的任何液体、固体或气体物质，所述物质也优选与应用于组合物中的蛋白酶相容。在一些实施方案中，颗粒组合物是“压缩”形式的，而在其他实施方案中，液体组合物是“浓缩”形式的。
术语“增强的性能”在清洗活性的上下文中，指对某些酶敏感污物诸如蛋、牛奶、草或血增加的或更大的清洗活性，这在标准洗涤循环和/或多洗涤循环之后，利用常用的评价方法测定。
术语“降低的性能”在清洗活性的上下文中，指对某些酶敏感污物诸如蛋、牛奶、草或血降低的或较小的清洗活性，这在标准洗涤循环之后，利用常用的评价方法测定。
术语“可比较的性能”在清洗活性的上下文中，指可比较的枯草蛋白酶(例如商业上可获得的蛋白酶)的清洗活性的至少60％、至少70％、至少80％、至少90％、至少95％，所述可比较的枯草蛋白酶包括但不限于OPTIMASETM蛋白酶(Genencor)、PURAFECTTM蛋白酶产品(Genencor)、SAVINASETM蛋白酶(Novozymes)、BPN′-变体(参见例如，美国专利号Re 34,606)、RELASETM、DURAZYMETM、EVERLASETM、KANNASETM蛋白酶(Novozymes)、MAXACALTM、MAXAPEMTM、PROPERASETM蛋白酶(Genencor；也参见美国专利号Re 34,606，美国专利5,700,676；5,955,340；6,312,936；6,482,628)和缓慢芽孢杆菌变体蛋白酶产品[例如那些在WO 92/21760、WO 95/23221和/或WO 97/07770(Henkel)中描述的。示范性枯草蛋白酶变体包括但不限于那些在等同于BPN’的位置76、101、103、104、120、159、167、170、194、195、217、232、235、236、245、248和/或252的残基位置上具有置换或删除的蛋白酶。在各种清洗分析中通过将本发明的蛋白酶与那些枯草蛋白酶比较来确定清洗性能，所述清洗分析涉及酶敏感性污物，例如草、血或牛奶，在标准的洗涤循环条件后利用常用的发光光度或分析方法测定。
如在此所使用地，“低洗涤剂浓度”系统包括少于约800ppm的洗涤剂组分存在于洗涤水中的洗涤剂。日本洗涤剂通常被认为是低洗涤剂浓度系统，因为它们在洗涤水通常具有近似667ppm的洗涤剂组分。
如在此所使用地，“中等洗涤剂浓度”系统包括约800ppm至约2000ppm的洗涤剂组分存在于洗涤水中的洗涤剂。北美洗涤剂通常被认为是中等洗涤剂浓度系统，因为它们在洗涤水通常具有近似975ppm的洗涤剂组分。巴西洗涤剂在洗涤水通常具有近似1500ppm的洗涤剂组分。
如在此所使用地，“高洗涤剂浓度”系统包括大于约2000ppm的洗涤剂组分存在于洗涤水中的洗涤剂。欧洲洗涤剂通常被认为是高洗涤剂浓度系统，因为它们在洗涤水通常具有近似3000-8000ppm的洗涤剂组分。
如在此所使用地，“织物清洗组合物”包括手工和机器洗衣洗涤剂组合物，包括洗衣添加剂组合物和适合用于浸泡和/或预处理污染的织物(例如布、亚麻布和其他织物材料)的组合物。
如在此所使用地，″非织物清洗组合物″包括非织物(即纺织品)表面清洗组合物，包括但不限于洗碟洗涤剂组合物、口腔清洗组合物、牙齿清洗组合物和个人清洗组合物。
“压缩”形式的清洗组合物在本文中最好用密度表示，对于组合物，用无机填料盐的数量表示。无机填料盐是粉末形式的洗涤剂组合物的常规组分。在常规洗涤剂组合物中，填料盐大量存在，典型地，按重量计为总组合物的17-35％。相反，在压缩组合物中，填料盐以不超过总组合物的15％的量存在。在一些实施方案中，按组合物重量计，填料盐以不超过10％，，或更优选不超过5％的量存在。在一些实施方案中，无机填料盐选自碱金属和碱土金属的硫酸盐和氯化物。优选的填料盐是硫酸钠。
II.丝氨酸蛋白酶和编码丝氨酸蛋白酶的核酸[260]木发明提供了编码氨基酸序列，编码蛋白酶的分离的多核苷酸。在一些实施方案中，这些多核苷酸序列包括与SEQ ID NOS6-8中示出的氨基酸序列至少65％的氨基酸序列同一性，优选至少70％的氨基酸序列同一性，更优选至少75％的氨基酸序列同一性，还更优选至少80％的氨基酸序列同一性，更优选至少85％的氨基酸序列同一性，甚至更优选至少90％的氨基酸序列同一性，更优选至少92％的氨基酸序列同一性，还更优选至少95％的氨基酸序列同一性，更优选至少97％的氨基酸序列同一性，还更优选至少98％的氨基酸序列同一性，最优选至少99％的氨基酸序列同一性，(例如具有蛋白质水解活性的、由多核苷酸编码的氨基酸序列的至少一部分，包括催化底物的肽键水解的成熟蛋白酶)，和/或在确定的洗涤条件下显示出可媲美的或增强的洗涤性能。
在一些实施方案中，同一性百分比(氨基酸序列、核酸序列、基因序列)通过直接比较两分子之间的序列信息进行测定，通过下述程序测定比对序列；对两比对的序列之间确切的匹配数目进行计数，并除以较短序列的长度；将所得结果乘以100。可容易地获取的计算机程序可用于这些分析中，诸如上面描述的程序。用于测定核苷酸序列同一性的程序可获自Wisconsin序列分析软件包(WisconsinSequence Analysis Package)，版本8(Genetics Computer Group，Madison，WI)，例如BESTFIT、FASTA和GAP程序，其也依靠Smith和Waterman算法。这些程序易于使用，默认参数为制造商推荐的参数，并描述在上述Wisconsin序列分析软件包中。
适合于测定序列相似性的算法的一个例子是BLAST算法，该算法描述在Altschul等，J.Mol.Biol.，215403-410(1990)中。用于进行BLAST分析的软件可通过公开的渠道从国家生物技术信息中心(National Center for BiotechnologyInformation)(http://www.ncbi.nim.nih.gov/)获得。该算法包括首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoringsequence pairs，HSPs)，所述字串在与数据库序列中同样长度的字串联配时，匹配或者满足某个正值的阈值T。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着被比较的两个序列中的每一个序列向两个方向延伸，只要累积的联配分数在增加。出现下面情况时，字串在各个方向上的延伸便停止累积的联配分数由达到的最大值下降了数量X；累积分数达到0或者0以下；或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序默认的是字串长度(W)为11，BLOSUM62记分矩阵(参见Henikoff和HenikoffProc.Natl.Acad.Sci.USA8910915(1989))联配(B)为50，期望值(E)为10，M’5，N’-4，对两条链进行比较。
BLAST算法然后进行两个序列之间的相似性的统计学分析(参见例如Karlin和Altschul，Proc.Nat′l.Acad.Sci.USA 905873-5787 )。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability，P(N))，其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如，在受测核酸和丝氨酸蛋白酶核酸的比较中，如果最小合计概率小于大约0.1，更优选小于约0.01，最优选小于约0.001，就认为该核酸与本发明的丝氨酸蛋白酶核酸相似。在受测核酸编码丝氨酸蛋白酶多肽时，如果比较产生的最小合计概率小于约0.5，更优选小于约0.2，就认为它与指定的丝氨酸蛋白酶核酸相似。
在本发明的一些实施方案中，序列用BLAST和蛋白质翻译序列工具分析。在一些实验中，优选的版本是BLAST(Basic BLAST version 2.0)。选择的程序是“BlastX”，选择的数据库是“nr”。使用标准/默认参数值。
在一些优选实施方案中，本发明包含SEQ.ID NO1中长为约1621个碱基对的多核苷酸。起始密码子用粗体示出于SEQ ID NO1中。在本发明的另一实施方案中，编码这些氨基酸序列的多核苷酸包括1485个碱基对部分(SEQ ID NO2的残基1-1485)，如果被表达的话，其被认为编码信号序列(SEQ ID NO5的核苷酸1-84)，编码SEQ ID NO9的氨基酸1-28；和N-端原序列(编码SEQ ID NO6的氨基酸残基29-198的核苷酸84-594)；成熟蛋白酶序列(编码SEQ ID NO8的氨基酸残基1-89的SEQ ID NO2的核苷酸595-1161)；和C-端原序列(编码SEQ ID NO6的氨基酸残基388-495的核苷酸1162-1486)。可选择地，信号肽、N-端原序列、成熟丝氨酸蛋白酶序列和C-端原序列相对于SEQ ID NO6的被编号为1-189的成熟蛋白酶氨基酸残基进行编号，即信号肽(残基-198至-171)、N-端原序列(残基-171至-1)、成熟丝氨酸蛋白酶序列(残基1-189)、C-端原序列(残基190-298)。在本发明的另一优选实施方案中，编码具有蛋白水解活性的氨基酸序列的多核苷酸包括SEQ ID NO2的核苷酸1至1485这部分的核苷酸序列，其编码信号肽和前体蛋白酶。在本发明的另一优选实施方案中，编码氨基酸序列的多核苷酸包括多核苷酸的核苷酸1至1412的序列，所述多核苷酸编码纤维单胞菌蛋白酶前体(SEQ IDNO3)。在还有另一实施方案中，编码氨基酸序列的多核苷酸包括编码成熟纤维单胞菌蛋白酶的多核苷酸的核苷酸1至587这部分的序列(SEQ ID NO4)。
将会被本领域技术人员理解的是，由于遗传密码的简并性，多种多核苷酸能够编码分别在SEQ ID NOS6、7和/或8中提供的信号肽、前体蛋白酶和/或成熟蛋白酶，或具有上述％序列同一性的蛋白酶。本发明的另一个实施方案包含包括核苷酸序列的多核苷酸，所述核苷酸序列分别与SEQ ID NOS2、3和/或4的多核苷酸序列具有至少70％的序列同一性、具有至少75％的序列同一性、具有至少80％的序列同一性、具有至少85％的序列同一性、具有至少90％的序列同一性、具有至少92％的序列同一性、具有至少95％的序列同一性、具有至少97％的序列同一性、具有至少98％的序列同一性和具有至少99％的序列同一性，其分别编码信号肽和前体蛋白酶、前体蛋白酶和/或成熟蛋白酶。
在其他实施方案中，本发明提供编码蛋白酶的DNA片段或部分，只要编码的片段保留蛋白水解活性即可。本发明的另一实施方案包括这样的多核苷酸，该多核苷酸具有SEQ ID NO2的多核苷酸序列或编码前体蛋白酶的SEQ ID NO1残基185-1672的至少20％的序列长度、至少30％的序列长度、至少40％的序列长度、至少50％的序列长度、至少60％的序列长度、至少70％的序列长度、至少75％的序列长度、至少80％的序列长度、至少85％的序列长度、至少90％的序列长度、至少92％的序列长度、至少95％的序列长度、至少97％的序列长度、至少98％的序列长度和至少99％的序列长度。在选择性的实施方案中，所述序列长度的这些片段或部分是具有所述序列长度的连续部分，其可用于在重组DNA序列中进行DNA序列重排(参见例如美国专利6,132,970)。
本发明的另一实施方案包括在此描述的DNA的片段，根据本领域公认的技术，发现该片段可用于获得部分长度的DNA片段，该DNA片段能够被用于从纤维单胞菌属菌株69B4分离或鉴定编码本文中描述的成熟蛋白酶或其具有蛋白水解活性的片段的多核苷酸。此外，SEQ ID NO1中给出的DNA可用于从其他物种特别是从纤维单胞菌属某些种，鉴定同源DNA片段，其编码蛋白酶或其具有蛋白水解活性的部分。
此外，本发明包括使用由SEQ ID NO1或其合适的部分或片段(例如至少约5-20或10-15个连续的核苷酸)构建的引物或探针序列，作为筛选基因组来源或者cDNA来源的核酸的探针或引物。在一些实施方案中，本发明提供了期望长度的DNA探针(即，长度一般在100和1000个碱基之间)，它们基于SEQ ID NOS 1、2、3和/或4中的序列。
在一些实施方案中，DNA片段通过电泳分离，从凝胶切割下来，并从凝胶的琼脂基质回收。在优选的实施方案中，然后将该纯化的DNA片段进行标记(例如，根据制造商的指示使用Megaprime标记系统)，以将p32掺入DNA中。将标记的探针通过加热到95℃一段给定的时间(例如5分钟)，使其变性，并立即加入至膜和预杂交溶液。杂交反应在合适的条件进行一段合适的时间(例如在37℃中进行18小时)，同时温和地摇动或旋转。漂洗膜(例如在SSC/0.3％SDS中两次)，然后在合适的洗涤条件中洗涤，并温和搅动。需要的严紧型(stringency)反映了洗涤膜(filter)的条件。在本文中的一些实施方案中，“低严紧型”条件涉及在20℃，用0.2×SSC/0.1％SDS的溶液洗涤15分钟，而在其他实施方案中，“中度严紧型”条件涉及进一步的洗涤步骤，其包括在37℃，用0.2×SSC/0.1％SDS的溶液洗涤30分钟，而在其他实施方案中，“高严紧型”条件涉及进一步的洗涤步骤，其包括在37℃，用0.2×SSC/0.1％SDS的溶液洗涤45分钟，在进一步的实施方案中，“最大严紧型(maximum-stringency)”条件涉及进一步的洗涤步骤，其包括在37℃，用0.2×SSC/0.1％SDS的溶液洗涤60分钟。因此，本发明的各种实施方案提供了这样的多核苷酸，该核苷酸能在中度、高和/或最大严紧型条件下，与来自SEQ ID NOS1、2、3、4和/或5中提供的核苷酸序列的探针杂交。
洗涤之后，将膜干燥并检测结合的探针。如果p32或其他放射性同位素被用作标记试剂，那么结合的探针通过放射自显影进行检测。用于可视化其他探针的其他技术是本领域技术人员熟知的。如果检测到结合的探针，则表明核酸序列具有期望的同源性，并因此与SEQ ID NOS1、2、3、4和/或5具有同一性，并包含在本发明之内。因此，本发明提供了检测编码本发明包含的蛋白酶的核酸的方法，该方法包括将SEQ ID NOS1、2、3、4和/或5的核酸序列的一部分或整个序列与基因组来源或者cDNA来源的其他核酸杂交。
如上所示，在其他实施方案中，杂交条件是基于核酸结合复合体的解链温度(Tm)，以赋予如下解释的确定的“严紧型”。“最大严紧型”一般发生在约Tm-5℃(探针的Tm以下5℃)；“高严紧型”一般发生在Tm以下约5℃至10℃；“中度严紧型”一般发生在Tm以下约10℃至20℃；“低严紧型”一般发生在Tm以下约20℃至25℃。如本领域技术人员所知道地，中度、高、和/或最大严紧型杂交被选择，以便优化条件以鉴定或检测多核苷酸序列同源物或等同的多核苷酸序列。
在其他实施方案中，本发明提供了核酸构建物(即表达载体)，该构建物包括编码本发明蛋白酶的多核苷酸。在进一步的实施方案中，本发明提供了用这些载体中的至少一种载体转化的宿主细胞。
在其他的实施方案中，本发明提供了还编码信号序列的多核苷酸。在一些实施方案中，本发明包括具有信号活性的多核苷酸，其包括这样的核苷酸序列与SEQ ID NO5具有至少65％的序列同一性、至少70％的序列同一性、优选地至少75％的序列同一性、更优选地至少80％的序列同一性、还更优选地至少85％的序列同一性、甚至更优选地至少90％的序列同一性、更优选地至少95％的序列同一性、更优选地至少97％的序列同一性、至少98％的序列同一性、以及最优选地至少99％的序列同一性。因此，在这些实施方案中，本发明提供了具有推定的信号序列的序列，以及能够在中度、高和/或最大严紧型条件下与来自SEQ ID NO5中公开的核苷酸序列的探针杂交的多核苷酸，其中所述信号序列具有与本发明的多核苷酸编码的信号序列基本上相同的信号活性。
在一些实施方案中，信号活性表示为与起始材料(starting material)基本上相同的蛋白酶分泌到发酵培养基中的水平。例如，在一些实施方案中，本发明提供的发酵培养基蛋白酶水平为由SEQ ID NO3的信号序列提供的发酵培养基中的分泌蛋白酶水平的至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少98％。在一些实施方案中，分泌的蛋白酶水平通过蛋白酶活性分析诸如pNA分析来确定(参见例如Del Mar，，如下)。测定革兰氏阳性宿主细胞中的同源或异源蛋白质的分泌水平以及检测分泌的蛋白质的其他手段包括，使用对蛋白质具有特异性的多克隆或者单克隆抗体。例子包括酶联免疫测定(ELISA)、放射性免疫测定(RIA)和荧光激活细胞分选(FACS)，以及本领域熟知的方法。
在进一步的实施方案中，本发明提供了多核苷酸，该多核苷酸编码信号肽的氨基酸序列(SEQ ID NO5的核苷酸1-84)，如SEQ ID NO9所示，SEQ ID NO2的核苷酸残基位置1至85，和/或SEQ ID NO5。本发明进一步包含这样的核酸序列，该核酸序列在低、中度、高严紧型和/或最大严紧型条件下，与SEQ ID NO5中示出的核酸序列杂交，但其具有与该序列基本上相同的信号活性。本发明包含所有此类多核苷酸。
在进一步的实施方案中，本发明提供了与本文中描述的核苷酸序列互补的多核苷酸。示范性的互补核苷酸序列包括那些在SEQ ID NOS1-5中给出的核苷酸序列。
本发明进一步的方面包含具有蛋白水解活性的多肽，该多肽与SEQ ID NO6(即信号和前体蛋白酶)、SEQ ID NO7(即前体蛋白酶)和/或SEQ ID NO8(即成熟蛋白酶)的氨基酸序列具有至少65％的氨基酸序列同一性、至少70％的氨基酸序列同一性、至少75％的氨基酸序列同一性、至少80％的氨基酸序列同一性、至少85％的氨基酸序列同一性、至少90％的氨基酸序列同一性、至少92％的氨基酸序列同一性、至少95％的氨基酸序列同一性、至少97％的氨基酸序列同一性、至少98％的氨基酸序列同一性和至少99％的氨基酸序列同一性。这些多肽的蛋白水解活性使用本领域已知的方法测定，包括例如那些被用于评价洗涤剂功能的方法。在进一步的实施方案中，多肽是分离的。在本发明的其他实施方案中，多肽包括与选自SEQ ID NOS6、7或8的氨基酸序列相同的氨基酸序列。在一些进一步的实施方案中，多肽与SEQ ID NOS6、7或8的一部分相同。
在一些实施方案中，本发明提供了具有蛋白水解活性的分离的多肽，包括长度约495个氨基酸的氨基酸序列，如SEQ ID NO6中所给出的。在进一步的实施方案中，本发明包含了具有蛋白水解活性的多肽，包括长度约467个氨基酸的氨基酸序列，如SEQ ID NO7中所给出的。在一些实施方案中，这些氨基酸序列包括信号序列(SEQ ID NO9的氨基酸1-28)；和蛋白酶前体(SEQ ID NO7的氨基酸1-467)。在其他实施方案中，本发明包含包括N-端原序列(SEQ ID NO7的氨基酸1-170)；成熟蛋白酶序列(SEQ ID NO8的氨基酸1-189)，和C-端原序列(SEQ IDNO7的氨基酸360-467)的多肽。在还有进一步的实施方案中，本发明包含包括前体蛋白酶序列(例如SEQ ID NO7的氨基酸1-467)的多肽。在还有另一实施方案中，本发明包含包括成熟蛋白酶序列的多肽，该成熟蛋白酶序列包括氨基酸(例如SEQID NO8的1-189)。
在进一步的实施方案中，本发明提供了包括上述序列的氨基酸序列的多肽和/或蛋白酶，上述序列来自包括但不限于微球菌的细菌种，其通过氨基酸序列同源性研究进行鉴定。在一些实施方案中，如果微球菌亚目蛋白酶前体的氨基酸残基与在纤维单胞菌属菌株69B4蛋白酶中的特定残基或残基的部分是同源(即，在一级或者三级结构中的位置上相对应)或者类似(即，具有相同或类似的联合、反应或化学相互作用的功能)的话，那么该微球菌亚目蛋白酶前体的氨基酸残基与纤维单胞菌属菌株69B4的残基等同。
在一些优选实施方案中，为了确定与一级结构的同源性，将蛋白酶前体的氨基酸序列直接与纤维单胞菌属菌株69B4成熟蛋白酶氨基酸序列比较，特别是与一组保守的残基比较，这些保守的残基被认识到在所有或大多数的、序列已知的纤维单胞菌属菌株样蛋白酶中是不变的。将保守残基进行比对——其中允许进行必要的插入或删除以维持联配(即，通过任意的删除和插入而避免排除掉保守残基)之后，确定对应于成熟蛋白酶(SEQ ID NO8)和纤维单胞菌属菌株69B4蛋白酶中的特定氨基酸的残基。保守残基的联配优选应该保留100％的此类残基。然而，大于75％或低至45％的保守残基的联配也足以限定出等同的残基。然而，SEQ IDNO8的催化三联体His32/Asp56/Ser137的保守性应该被维持。
例如，在一些实施方案中，将来自纤维单胞菌属菌株69B4和其他上述微球菌亚目某些种的蛋白酶的氨基酸序列进行比对，以提供氨基酸序列之间的最大数量的同源性。这些序列的比较表明，在每一序列中含有许多保守残基。这些残基是被鉴定并被用于确立氨基酸的等同残基位置的残基，所述等同残基位置在讨论的前体或成熟微球菌亚目蛋白酶中被鉴定。
这些保守的残基被用于确定在一种或多种微球菌亚目同源物(例如本文中的Cellulomonas cellasea(DSM 20118)和/或纤维单胞菌同源物)中纤维单胞菌属菌株69B4蛋白酶的相应的氨基酸残基。将这些特定的氨基酸序列与纤维单胞菌属菌株69B4蛋白酶的序列进行比对，以产生保守残基的最大同源性。通过该比对，在与其他纤维单胞菌属某些种的比较中，观察纤维单胞菌属菌株69B4的序列和特定残基位置。因此，催化三联体(例如在纤维单胞菌属菌株69B4蛋白酶中)的等同氨基酸在其他微球菌亚目某些种中可以鉴定到。在本发明的一些实施方案中，蛋白酶同源物包括SEQ ID NO8的His32/Asp56/Ser137的等同物。
两多肽基本上相同的另一指征是第一多肽与第二多肽具有免疫交叉反应性。测定免疫交叉反应性的方法描述在本领域中，也描述在本文中的实施例中。一般而言，因保守氨基酸置换而出现差异的多肽具有免疫交叉反应性。因此，例如，当两肽的差异仅仅在于保守置换时，该多肽与第二多肽基本上相同。
本发明包含获自各种来源的蛋白酶。在一些优选实施方案中，蛋白酶获自细菌，而在其他实施方案中，蛋白酶获自真菌。
在一些特别优选的实施方案中，细菌来源选自微球菌亚目亚门的成员。在一些实施方案中，细菌来源是原小单孢菌科。在一些优选实施方案中，原小单孢菌某些种(Promicromonosporaceae spp.)包括和/或选自柠檬原小单孢菌(Promicromonospora citrea)(DSM 43110)、Promicromonospora sukumoe(DSM44121)、Promicromonospora aerolata(CCM 7043)、Promicromonosporavindobonensis(CCM 7044)、Myceligenerans xiligouense(DSM 15700)、Isoptericolavariabilis(DSM 10177，基原异名Cellulosimicrobium variabile)、纤维化纤维微细菌(Cellulosimicrobium cellulans)(DSM 20424、基原异名诺卡氏菌(Nocordiacellulans)、Cellulomonas cellulans)、Cellulosimicrobium funkei、Xylanimonascellulosilytica(LMG 20990)、Xylanibacterium ulmi(LMG 21721)和Xylanimicrobiumpachnodae(DSM 12657、基原异名Promicromonospora pachnodae)。
在其他特别优选的实施方案中，细菌来源是纤维单胞菌科。在一些优选实施方案中，纤维单胞菌某些种包括和/或选自粪便纤维单胞菌(ATCG 484、DSM20113)、双氮纤维单胞菌(ATCC 486、DSM 20112)、Cellulomonas cellasea(ATCC487、21681、DSM 20118)、Cellulomonas denverensis、人纤维单胞菌(DSM 9581)、产黄纤维单胞菌(ATCC 482、DSM 20109)、Cellulomonas persica(ATCC 700642、DSM 14784)、Cellulomonas iranensis(ATCC 700643、DSM 14785)；发酵纤维单胞菌(ATCC 43279、DSM 3133)、Cellulomonas gelida(ATCC 488、DSM 20111、DSM20110)、Cellulomonas humilata(ATCC 25174、基原异名Actinomyces humiferus)、Cellulomonas uda(ATCC 491、DSM 20107)、Cellulomonas xylanilytica(LMG 21723)、Cellulomonas septic、Cellulomonas parahominis、特氏厄氏菌(ATCC 25835、DSM20577、异名特氏纤维单胞菌)、Oerskovia jenensis(DSM 46000)、Oerskoviaenterophila(ATCC 35307、DSM 43852、基原异名Promicromonospora enterophila)、Oerskovia paurometabola(DSM 14281)和纤维单胞菌属菌株69B4(DSM 16035)。在进一步的实施方案中，细菌来源也包括和/或选自高温双岐菌属某些种(Thermobifida spp.)、稀有杆菌属某些种(Rarobacter spp.)和/或溶杆菌属某些种(Lysobacter spp.)。在还有其他实施方案中，高温双岐菌属某些种是褐色高温双岐菌(Thermobifida fusca)(基原异名褐色高温单孢菌(Thermomonospora fusca))(tfpA，AAC23545；参见Lao等，Appl.Environ.Microbiol.，624256-4259 )。在选择性实施方案中，稀有杆菌某些种是渣腐稀有杆菌(Rarobacter faecitabidus)(RPI，A45053；参见例如，Shimoi等，J.Biol.Chem.，26725189-25195 )。在还有另一实施方案中，溶杆菌属某些种是Lysobacter enzymogenes。
在进一步的实施方案中，本发明提供了获自和/或分离自真菌来源的多肽和/或多核苷酸。在一些实施方案中，真菌来源包括绿僵菌属某些种(Metarhizium spp.)。在一些优选实施方案中，真菌来源是金龟子绿僵菌(Metarhizium anisopliae)(CHY1(CAB60729)。
在另一实施方案中，本发明提供了来自纤维单胞菌属菌株的多肽和/或多核苷酸，所述菌株选自描述于美国专利5,401,657的分类学分类的聚类2，该美国专利并入本文作为参考。在美国专利5,401,657中，根据(1)Dussault modification of theGram′s staining reaction(Dussault，J.Bacteriol.，70484-485 )；(2)the KOHsensitivity test(Gregersen，Eur.J.Appl.Microbiol.Biotechnol.，5123-127 ；Halebian等，J.Clin.Microbiol.，13444-448 ；和(3)the aminopeptidase reaction(Cerny，Eur.J.Appl.Microbiol.，3223-225 ；Cerny，Eur.J.Appl.Microbiol.，5113-122 )，将分离自碱性湖中及附近的二十个细菌菌株分入已知为革兰氏阳性菌的细菌类型。此外，在大多数的情况下，使用Collins(参见Collins，InGoodfellow and Minnikin(eds)，Chemical Methods in Bacterial Systematics，AcademicPress，London ，第267-288页)描述的方法，根据醌分析(Collins and Jones，Microbiol.Rev.，45316-354 )，也可以进行确认。此外，可以测试菌株的200个性状，使用数值分类学原则(参见例如Sneath and Sokal，Numerical Taxonomy，W.H.Freeman & Co.，.San Francisco，CA )分析结果。示范性的测试性状、测试方法和编集方法(codification method)也描述于美国专利5,401,657中。
如美国专利5,401,657所描述地，对由200个单位性状组成的表型数据打分，并以″n乘t (n.times.t)″矩阵形式排列，它的t列代表根据相似性待被分组的″t″个细菌菌株，它的″n″行是单位性状。利用相似系数评价细菌菌株的分类学相似性(Sneathand Sokal，supra，pp.114-187)。尽管许多不同的系数已经被用于生物学分类，发现只有少数系数已常用于细菌学。应用三个联合系数(参见例如Sneath and Sokal，supra，第129页)，即Gower、Jaccard和Simple匹配系数。这些系数已经常常被用于分析细菌学数据，并被本领域技术人员广泛接受，这是因为它们已经显示可产生有说服力的分类。
使用TAXPAK程序包，分析编码的数据(Sackin，Meth.Microbiol.，19459-494 )，在University of Leicester，U.K的DEC VAX计算机上运行。
使用TAXPAK中的RTBNSIM程序，利用带有允许有负匹配的选项的Gower系数(SG)(参见Sneath and Sokal，supra，at pp.135-136)，对所有菌株对构建相似性矩阵。作为首要的分析工具并且大部分的分类学数据基于其而给出，选择Gower系数而不是其他系数来产生相似性矩阵，这是因为它可应用于所有类型的性状或数据，即二态的(two-state)、多态的(规则的和定性的)和定量的。
通过运行TAXPAK中的SMATCLST子程序(sub-routine)，使用UnweightedPair Group Method with Arithmetic Averages(UPGMA)算法，也称为UnweightedAverage Linkage方法，完成相似性矩阵的聚类分析。
系统树图示出了细菌菌株之间的相似性水平。在一些实施方案中，通过利用TAXPAK中的DENDGR程序，获得系统树图。通过运行TAXPAK中的RTBNSIM程序，使用Jaccard系数(SJ)(Sneath and Sokal，supra，at p.131)和简单匹配系数(Simple Matching Coefficient)(SSM)(Sneath，P.H.A.and Sokal，R.R.，ibid，p.132)，重新分析表型数据。通过利用TAXPAK中的具有UPGMA选项的SMATCLST和DENDGR子程序，获得其他两个系统树图。
通过使用SG/UPGMA方法，在79％相似性水平产生嗜碱性细菌的六个天然聚类或同型种。这六个聚类包括分离自盐碱湖的20个嗜碱性细菌中的15个。尽管将79％用于描绘相似性水平是被任意选择的，但是它对于数值分类学的目前实践是合适的(参见例如，Austin Priest，Modern Bacterial Taxonomy，Van NostrandReinhold，Wokingham，U.K.，，p.37)。将描绘(delineation)置于更低的百分比会将多组明显不相干的生物体组合起来，其界定得不到数据支持。在79％水平，3个聚类专一性地含有新型嗜碱性细菌，代表新分离的菌株中的13个(有可能代表新的类群)。通过该方法，蛋白酶69B4被分入聚类2中。
在该水平形成聚类的显著性(significance)得到TESTDEN程序的结果的支持。该程序测试了由UPGMA产生的系统树图中聚类的所有二歧对(dichotomous pairsof clusters)(包括4个或更多个菌株)的显著性，其中平方欧氏距离(SquaredEuclidean distances)或它们的子集(complement)作为量度，并假设这些聚类是超球面的(hyperspherical)。临界重叠(critical overlap)设置为0.25％。聚类的分离具有高度的显著性。
SJ系数是SG系数的有用的辅助，因为它可以被用于检测后者中的同型种，其基于负匹配或因施加在潜在主观定性数据上的不适当的权重而产生的扭曲(distortion)。结果，SJ系数可以用于确认最初通过使用SG系数而定义的聚类的有效性。Jaccard系数在比较生物化学上不反应的生物体时是特别有用的(Austin andPriest，supra，at p.37)。此外，关于匹配负性状状态的可容许性可能有一些置疑(参见Sneath and Sokal，supra，at p.131)，在这种情况下，简单匹配系数(Simple MatchingCoefficient)是广泛应用的选择。通过这种方法，菌株69B4被分入聚类2中。
大多数情况下，所有由SG/UPGMA方法产生的聚类(特别是新菌株的聚类)，在由SJ/UPGMA方法(共表型相关性(cophenetic correlation)，0.795)和SSM/UPGMA方法(共表型相关性，0.814)产生的系统树图中重现。这些变换的主要结果是将所有芽孢杆菌菌株聚集在一个大的聚类中，这进一步用来强调嗜碱性芽孢杆菌菌种与新的嗜碱性细菌之间的分离，以及后者的独特性。基于这些方法学，菌株69B4被认为是聚类2细菌。
在本发明的其他方面，多核苷酸来自这样的细菌，该细菌的16S rRNA基因核苷酸序列与纤维单胞菌属菌株69B4的16S rRNA基因核苷酸序列具有至少70％、75％、80％、85％、88％、90％、92％、95％、98％的序列同一性。16S rRNA基因的序列保存在GenBank中，登记号为X92152。
图1提供了无根系统发育树，示出了新型菌株69B4与纤维单胞菌科(包括纤维单胞菌属菌株69B4)和微球菌亚目的其他相关属的成员的关系。使用TREECONW v.1.3b(Van de Peer and De Wachter，Comput.Appl.Biosci.，10569-570 )，由比对的16S rDNA序列(1374nt)，构建系统树图。使用Jukes和Cantor的置换率校准(Jukes and Cantor，″Evolution of protein molecules，″In，Munro(ed.)，Mammalian Protein Metabolism，Academic Press，NY，at pp.21-132， )和Neighbor-Joining算法(Saitou and Nei，Mol.Biol.Evol.，4406-425 )推断的树拓扑学，计算距离估算值(Distance estimations)。节点处的数指来自100个重新取样的数据组的自展值(Felsenstein，Evol.，39783-789 )，比例尺(scale bar)表示100nt中的2个核苷酸置换。
菌株69B4显示出与纤维单胞菌科的纤维单胞菌属和厄氏菌属的成员最密切的16S rDNA关系。最密切的亲戚被认为是C.cellasea(DSM 20118)和C.fimi(DSM20113)，它们与纤维单胞菌属菌株69B4的16S rRNA基因核苷酸序列具有至少95％的序列同一性(例如分别为96％和95％同一性)。
在本发明的一些优选实施方案中，纤维单胞菌属某些种是纤维单胞菌属菌株69B4(DSM16035)。该菌株最早分离自在Acacia Camp，肯尼亚Bogoria湖岸区(纬度0°12’N，经度36°07’E)的沉淀物和水样品，其在1988年10月10日采集得到。水温是33℃，pH 10.5，导电性44mS/cm。测定纤维单胞菌属菌株69B4，获得下面描述的表型性状。新鲜培养物是革兰氏阳性菌，细长，一般是直的、杆状的细菌，近似0.5-0.7μm×1.8-4μm。较长时间的培养物主要含有短杆状和球状细胞。细胞偶尔成对出现或以V型出现，但未发现初生分枝。未检测到内孢子。在碱性GAM琼脂上，37℃温育2-3天后，菌株形成不透明的、有反光的、浅黄色、圆形和凸起或穹形菌落，具有完整边缘，直径约2mm。菌落有粘性，或粘稠性的，当用环刮取时，容易形成块。在中性胰蛋白胨大豆琼脂上，菌株生长较不旺盛，生成半透明的黄色菌落，通常直径＜1mm。培养物兼性厌氧，因为它们能够在严格厌氧条件下生长。然而，相比起有氧生长，在厌氧条件下的生长显著减少。在标准氧化酶、脲酶、氨基肽酶和KOH测试中，菌株也呈阳性。此外，硝酸盐未被还原，尽管该生物体是过氧化氢酶阳性的，并且在碱性条件下产生DNA酶。优选的生长温度范围是20-37℃，最佳温度在30-37℃，在15℃或45℃，未观察到生长。
该菌株是嗜碱性和微嗜盐性的。菌株也可以表征为在pH值在6.0和10.5之间有生长，最佳pH约为9-10。在pH 11或pH 5.5未观察到生长。在pH 7以下的生长不如在最佳温度中生长的培养物旺盛和丰富。观察到菌株在含有0-8％(w/v)NaCl的培养基中生长。此外，该菌株也表征为化学有机营养型的，因为它在复合培养基中生长，诸如酵母提取物和蛋白胨；以及水解的淀粉、明胶、酪蛋白、羧甲基纤维素和无定形纤维素。
观察到菌株具有呼吸代谢以及发酵代谢。由下述物质有氧地和厌氧地产生酸(API 50CH)L-阿拉伯糖、D-木糖、D-葡萄糖、D-果糖、D-甘露糖、鼠李糖(弱)、纤维二糖、麦芽糖、蔗糖、海藻糖、龙胆二糖、D-松二糖、D-来苏糖和5-酮-葡萄糖酸盐(弱)。也可以利用苦杏仁苷、熊果苷、水杨苷和七叶苷。菌株不能利用核糖、乳糖、半乳糖、蜜二糖、D-棉子糖、糖原、甘油、赤藻糖醇、肌醇、甘露醇、山梨醇、木糖醇、阿糖醇、葡萄糖酸盐和乳酸盐。
也测定到菌株对氨苄青霉素、氯霉素、红霉素、梭链孢酸、甲氧西林、新生霉素、链霉素、四环素、磺胺苯吡唑、竹桃霉素、多粘菌素、利福霉素、万古霉素和杆菌肽的敏感性；但是对庆大霉素、呋喃妥因、萘啶酸、sulphmethoxazole、甲氧苄啶、青霉素G、新霉素和卡那霉素具有抗性。
除了本发明的蛋白酶，也被观察到产生下述酶(ApiZym，API Coryne)C4-酯酶、C8-酯酶/脂酶、亮氨酸芳基酰胺酶、α-胰凝乳蛋白酶、α-葡萄糖苷酶、β-葡萄糖苷酶和吡嗪酰胺酶。
观察到菌株展示出下述化学分类学性状。主要的脂肪酸(＞总数的10％)是C16:1(28.1％)、C18:0(31.1％)、C18:1(13.9％)；N-饱和(79.1％)、n-不饱和(19.9％)。具有偶数碳原子的脂肪酸占98％。主要极性类脂成分存在磷脂酰甘油(PG)的三个未鉴定的糖脂(α-酚阳性)，未检查到DPG、PGP、PI和PE。甲基萘醌类MK-4、MK-6、MK-7和MK-9是主要存在的异戊二烯类化合物。细胞壁的肽聚糖类型是A4β，在肽-肽桥中具有作为二氨基酸的L-鸟氨酸和D-天冬氨酸。至于毒性评价，没有已知的与纤维单胞菌属的细菌有关的毒性或病原性问题。
尽管在给定的生物物种中，天然存在的酶的序列中可能有变异，但在给定的条件下(例如温度、pH、水的硬度、氧化条件、螯合条件和浓度)等，就底物特异性和/或蛋白水解活性水平而言，由同样的种的生物体产生的具体类型的酶一般基本上相同。因此，对于本发明的目的，考虑的是，纤维单胞菌属的其他菌株和种也产生本发明的纤维单胞菌蛋白酶，并因此为本发明的蛋白酶提供有用的来源。事实上，如本文中提出的，考虑到微球菌的其他成员可用于本发明。
在一些实施方案中，本发明的蛋白水解多肽进行物理化学表征，而在其他实施方案中，它们根据它们的功能进行表征，而在进一步的实施方案中，它们使用这两组性质来表征。物理化学表征利用熟知技术诸如SDS电泳、凝胶过滤、氨基酸组成、质谱(例如MALDI-TOF-MS、LC-ES-MS/MS等)和沉淀以测定蛋白质的分子量、等电聚焦以测定蛋白质的pI、氨基酸序列测序以测定蛋白质的氨基酸序列、结晶学研究以测定蛋白质的三级结构，以及抗体结合以测定存在于蛋白质中的抗原表位。
在一些实施方案中，功能特征用蛋白酶领域的从业者熟知的技术进行测定，包括但是不限于各种商业底物诸如二甲基酪蛋白(″DMC″)和/或AAPF-pNA的水解。用于功能表征的优选技术更详细地描述在本文给出的实施例中。
在本发明的一些实施方案中，该蛋白酶的分子量为约17kD至约21kD，例如约18kD至19kD，例如18700道尔顿至18800道尔顿，例如约18764道尔顿，分子量通过MALDI-TOF-MS测定。在本发明的另一方面，用MALDI-TOF-MS光谱测定的蛋白酶示出于图3中。
成熟蛋白酶也现示出蛋白水解活性(例如对具有肽键的底物的水解活性)如DMC。在进一步的实施方案中，本发明的蛋白酶提供了在确定的条件下增强的洗涤性能。尽管本发明包含本文中描述的蛋白酶69B，但在一些实施方案中，相比起69B4的蛋白水解活性，本发明的蛋白酶显示出至少50％、60％、70％、75％、80％、85％、90％、92％、95％、96％、97％、98％或99％的蛋白水解活性。在一些实施方案中，在同样的条件下，相比起以商标SAVINASE_(Novzymes)或PURAFECT_(Genencor)出售的蛋白酶的蛋白水解活性，本发明的蛋白酶现示出至少50％、60％、70％、75％、80％、85％、90％、92％、95％、96％、97％、98％或99％的蛋白水解活性。在一些实施方案中，在确定的条件下，相比起在同样的条件下的69B4，本发明的蛋白酶显示出可媲美的或增强的洗涤性能。在一些优选实施方案中，相比起在同样的条件下以商标SAVINASE_(Novzymes)或PURAFECT_(Genencor)出售的蛋白酶，本发明的蛋白酶在确定的条件下显示出可媲美的或增强的洗涤性能。
在进一步的实施方案中，本发明的蛋白酶和/或编码蛋白酶的多核苷酸以纯化的形式(即，以比在自然发生的或野生型生物体中存在的浓度高或低的浓度存在于特定的组合物中)提供，或与在由自然发生或野生型生物体表达时通常不存在的组分组合。然而，本发明不旨在局限于任何具体纯度水平的蛋白酶，这是因为发现各种纯度范围的蛋白酶都可以用于本发明的蛋白酶适合的各种应用中。
III.获取编码本发明微球菌亚目(例如纤维单胞菌属)蛋白酶的多核苷酸[314]在一些实施方案中，利用本领域已知的标准方法由例如克隆DNA(例如DNA“文库”)、化学合成、cDNA克隆、PCR、基因组DNA或其片段的克隆，获取编码本发明的蛋白酶的核酸，或由期望的细胞诸如细菌或真菌种的细胞纯化得到(参见例如Sambrook等，supra ；和Glover and Hames(eds.)，DNA CloningAPractical Approach，Vols 1和2，第二版)。多核苷酸序列的合成是本领域熟知的(参见例如Beaucage and Caruthers，Tetrahedron Lett.，221859-1862 )，包括使用自动合成仪(参见例如，Needham-VanDevanter等，Nucl.Acids Res.，126159-6168 )。DNA序列也可以定制和从各种商业来源定购。如在本文中较详细描述的，在一些实施方案中，除了编码区域外，来自基因组DNA的核酸序列还含有调节区域。
在一些涉及对基因组DNA的基因进行分子克隆的实施方案中，产生DNA片段，它们中的一些包括至期望的基因的至少一部分。在一些实施方案中，使用各种限制性酶在特定的位点切割DNA。在一些选择性实施方案中，在锰存在下使用DNA酶以获得DNA片段，或物理剪切DNA(例如通过超声波)。产生的线性DNA片段然后根据大小进行分离，并用标准技术进行扩增，包括但是不限于琼脂糖和聚丙烯酰胺凝胶电泳、PCR和层析。
一旦产生核酸片段，可以用许多方法鉴定编码蛋白酶的特定的DNA片段。例如，在一些实施方案中，分离编码蛋白水解酶的asp基因或它的特定RNA，或其片段，诸如探针或引物，并进行标记，然后用于本领域已知的杂交分析，以检测产生的基因(参见例如Benton和Davis，Science 196180 ；和Grunstein和Hogness，Proc.Natl.Acad.Sci.USA 723961 )。在优选的实施方案中，与探针具有实质上的序列相似性的DNA片段在中度至高严紧型条件下发生杂交。
在一些优选实施方案中，使用PCR完成扩增，这是本领域已知的。在一些优选实施方案中，将来自SEQ ID NOS1、2、3和/或4的至少约4个核苷酸和可多至大约60个核苷酸的核酸序列(即片段)，优选约12至30个核苷酸，更优选约25个核苷酸的核酸序列以任何合适的组合用作PCR引物。发现同样的这些片段也可作为探针用于杂交和产物检测方法。
在一些实施方案中，利用使用了简并寡核苷酸引物的PCR，从cDNA或基因组文库分离本发明的核酸结构物，所述简并寡核苷酸引物基于具有SEQ ID NOS1-5所示氨基酸序列的蛋白的氨基酸序列制备。引物可以是任何片段长度，例如长度为至少4、至少5、至少8、至少15、至少20个核苷酸。在本申请中的示范性探针利用包括TTGWHCGT和GDSGG多核苷酸序列的引物，如在实施例中更充分描述的。
基于上面的描述，将会被认识到，本文中提供的基于SEQ ID NOS1-5中的多核苷酸序列的多核苷酸序列可用于从其他种获得相同的或同源的多核苷酸片段，特别是从编码具有由蛋白酶69B4表现出的丝氨酸蛋白酶活性的酶的细菌获得多核苷酸片段。
IV.本发明的丝氨酸蛋白酶的表达和回收[320]用于表达和回收本发明的丝氨酸蛋白酶的任何合适的方法都可以应用于此。事实上，本领域技术人员知道许多适合于克隆具有蛋白水解活性的衍生自纤维单胞菌的多肽以及其他酶(例如具有蛋白水解活性的第二肽，诸如蛋白酶、纤维素酶、甘露糖酶或淀粉酶等)的方法。将编码本发明的酶的多核苷酸的至少一个(例如多个)拷贝连同任何其他期望的序列，导入宿主细胞基因或基因组的大量方法也是本领域已知的。
一般地，用于克隆基因和将外源蛋白酶编码区域(包括多拷贝的外源编码区域)导入所述基因的标准技术可用于获得纤维单胞菌69B4蛋白酶衍生物或其同源物。事实上，本说明书，包括实施例，提供了此类教导。然而，本领域已知的其他方法也是适用的(参见例如Sambrook等，supra(1989)；Ausubel等，supra ；和Harwood和Cutting，(eds.)Molecular Biological Methods for Bacillus，″John Wileyand Sons，；和WO 96/34946)。
在一些优选实施方案中，根据本领域已经确立的技术，通过将本发明的多核苷酸序列可操作性地连接到合适的表达载体中的表达控制序列上，并用该表达载体转化合适的宿主细胞，来表达本发明的多核苷酸序列。在一些实施方案中，根据本领域已经确立的技术，从细胞培养物的发酵物分离由本发明的DNA序列的表达而产生的多肽，并通过各种方法进行纯化。本领域技术人员有能力选择最合适的分离和纯化技术。
更特别地，本发明提供了包括本文中描述的多核苷酸的构建物，载体，用此载体转化的宿主细胞，由此细胞表达的蛋白酶，产生丝氨酸蛋白酶的表达方法和表达系统，所述丝氨酸蛋白酶来自微生物，特别地来自微球菌亚目的成员，包括但是不限于纤维单胞菌属的种。在一些实施方案中，编码丝氨酸蛋白酶的多核苷酸被用于产生适合于表达丝氨酸蛋白酶的重组宿主细胞。在一些优选实施方案中，表达宿主能够以商业上可行的量产生蛋白酶。
IV.重组载体[324]如上所述，在一些实施方案中，本发明提供了包括前述多核苷酸的载体。在一些实施方案中，本发明编码蛋白酶的载体(例如构建物)来源于基因组(例如根据标准技术，利用基因组文库，并通过使用合成寡核苷酸探针通过杂交筛选编码整个或部分蛋白酶的DNA序列)。在一些优选实施方案中，通过从纤维单胞菌属菌株69B4分离染色体DNA，并通过PCR方法扩增序列，获得编码蛋白酶的DNA序列(参见实施例)。
在选择性的实施方案中，编码蛋白酶的本发明核酸构建物通过已建立的标准方法合成制备而得(参见例如Beaucage和Caruthers，Tetra.Lett.221859-1869 ；和Matthes等，EMBO J.，3801-805 )。根据亚磷酰胺方法，寡核苷酸被合成(例如用自动DNA合成仪)、纯化、退火、连接和在合适的载体中克隆。
在其他实施方案中，核酸构建物是混合的合成和基因组来源。在一些实施方案中，通过连接合成的或基因组的DNA(合适的话)的片段制备构建物，其中所述片段对应于整个核酸结构物的各个部分，这根据标准技术进行。
在进一步的实施方案中，本发明提供了包括本发明的至少一个DNA构建物的载体。在一些实施方案中，本发明包含重组载体。被考虑的是，任何合适的载体将可用于本发明，包括自主复制载体以及整合在宿主细胞基因组内(瞬时或者稳定)的载体。事实上，适合于在真菌(霉菌和酵母)、细菌、昆虫和植物细胞中克隆、转化和表达的许多载体和表达序列盒是本领域技术人员知道的。典型地，载体或序列盒含有指导核酸转录和翻译的序列、选择性标记和允许自主复制或染色体整合的序列。在一些实施方案中，合适的载体包括基因的5’区域，其包括转录起始控制，和DNA片段的3’区域，其控制转录终止。这些控制区域可以来自与宿主同源或异源的基因，只要选择的控制区域能够在宿主细胞中发挥功能。
载体优选是表达载体，在其中编码本发明的蛋白酶的DNA序列可操作地连接到DNA转录所需要的其他片段上。在一些优选实施方案中，表达载体衍生自质粒或病毒DNA，或在选择性的实施方案中，含有这两种成份。示范性载体包括但是不限于pSEGCT、pSEACT和/或pSEA4CT，以及描述在本文实施例中的所有载体。此种载体的构建也描述在本文中，并且方法是本领域熟知的(参见例如，美国专利6,287,839；和WO 02/50245)。在一些优选实施方案中，载体pSEGCT(约8302bp；参见图5)发现可用于构建包括本文中描述的多核苷酸的载体(例如pSEG69B4T；参见图6)。在可选的优选实施方案中，载体pSEA469B4CT(参见图7)发现可用于构建包括本文中描述的多核苷酸的载体。事实上，考虑到本文中描述的所有的载体将可用于本发明。
在一些实施方案中，转录所必需的其他片段包括调节片段(例如启动子、分泌片段、抑制子和全局调节子等)，这是本领域所知道的。一个例子包括在选择的宿主细胞中显示转录活性的任何DNA序列，其来自编码与宿主细胞同源或异源的蛋白的基因。具体地，用于细菌宿主细胞的合适的启动子的例子包括但是不限于嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)(BAN)淀粉酶基因、枯草芽孢杆菌碱性蛋白酶基因、克劳氏芽孢杆菌碱性蛋白酶基因、短小芽孢杆菌(Bacillus pumilus)木糖苷酶基因、苏云金芽孢杆菌(Bacillus thuringiensis)cryIIIA和地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因的启动子。其他的启动子包括A4启动子，如本文中所述。可用于本发明的其他启动子包括但不限于噬菌体λPR或PL启动子，以及大肠杆菌lac、trp或tac启动子。
在一些实施方案中，启动子来自编码所述蛋白酶或其片段的基因，其具有与所述序列基本上相同的启动子活性。本发明还包括这样的核酸序列，该核酸序列在中度、高和/或最大严紧型条件下与启动子序列杂交，或者其与此类启动子具有至少约90％同源性以及优选地具有约95％同源性，但是具有基本上相同的启动子活性。在一些实施方案中，该启动子被用于促进蛋白酶和/或异源DNA序列(例如除了本发明的蛋白酶之外的其它酶)表达。在其他实施方案中，载体还包括至少一种选择性标记。
一些实施方案中，本发明的重组载体还包括使得载体能够在宿主细胞中复制的DNA序列。在一些涉及细菌宿主细胞的优选实施方案中，这些序列包括允许质粒复制所需的所有序列(例如ori和/或rep序列)。
在一些特别优选的实施方案中，信号序列(例如前导序列或前序列)也包括在载体中，以将本发明的多肽引导进入宿主细胞的分泌途径。在一些更为优选的实施方案中，在正确的阅读框中，将分泌信号序列连接到编码前体蛋白酶的DNA序列(参见例如SEQ ID NOS1和2)。取决于蛋白酶是将在胞内表达还是被分泌，将本发明的多核苷酸序列或表达载体与或不与天然多肽信号序列或在细菌(例如芽孢杆菌某种)、真菌(例如木霉)、其他原核或真核生物中发挥功能的信号序列构建在一起。在一些实施方案中，通过去除或部分地去除信号序列，来完成表达。
在一些涉及从细菌细胞分泌的实施方案中，信号肽是天然存在的信号肽或其功能部分，而在其他实施方案中，它是合成肽。合适的信号肽包括但不限于来自地衣芽孢杆菌α-淀粉酶、克劳氏芽孢杆菌碱性蛋白酶和解淀粉芽孢杆菌淀粉酶的序列。一个优选的信号序列是来自纤维单胞菌属菌株69B4的信号肽，如本文中所述。因此，在一些特别优选的实施方案中，信号肽包括来自本文中描述的蛋白酶的信号肽。该信号可用于帮助分泌69B4蛋白酶和/或异源DNA序列(例如第二蛋白酶，诸如另一野生型蛋白酶、BPN′变体蛋白酶、GG36变体蛋白酶、脂酶、纤维素酶、甘露聚糖酶等)。在一些实施方案中，这些第二酶编码自本领域已知的DNA序列和/或氨基酸序列(参见例如，美国专利号6,465,235、6,287,839、5,965,384和5,795,764；以及WO 98/22500、WO 92/05249、EP 0305216B1和WO 94/25576)。此外，考虑的是，在一些实施方案中，信号序列肽也被可操作地连接到内源性序列上，以激发和分泌此类内源性编码的蛋白酶。
用于将编码本发明蛋白酶的DNA序列分别连接到启动子和/或分泌信号序列的方法，和用于将它们插入到含有复制所必需的信息的合适的载体的方法是本领域技术人员所熟知的。如上所示，在一些实施方案中，使用应用了特异性引物的PCR，制备核酸构建物。
V.宿主细胞[335]如上所示，在一些实施方案中，本发明也提供了用上述载体转化的宿主细胞。在一些实施方案中，被引入宿主细胞的、编码本发明的蛋白酶的多核苷酸是同源的，而在其他实施方案中，该多核苷酸对于宿主细胞是异源的。在其中多核苷酸对于宿主细胞为同源(例如由宿主细胞产生的天然蛋白酶的额外拷贝被引入)的一些实施方案中，将该多核苷酸可操作地连接到另外的同源或异源启动子序列。在选择性的实施方案中，另外的分泌信号序列和/或终止序列可用于本发明中。因此，在一些实施方案中，多肽DNA序列包括多拷贝的同源多肽序列、来自其他生物体的异源多肽序列或合成的多肽序列。事实上，本发明不旨在限于任何特定的宿主细胞和/或载体。
其中引入有本发明的DNA构建物的宿主细胞可以是任何细胞，其能够产生本发明的碱性蛋白酶，包括但是不限于细菌、真菌和高等真核生物细胞。
可用于本发明的细菌宿主细胞的例子包括但不限于革兰氏阳性细菌，诸如芽孢杆菌、链霉菌和高温双岐菌，例如枯草芽孢杆菌、地衣芽孢杆菌、缓慢芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、克劳氏芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、B.lautus、巨大芽孢杆菌、苏云金芽孢杆菌、灰色链霉菌、青紫链霉菌、蓝色链霉菌、青紫链霉菌和褐色高温双岐菌的菌株；以及革兰氏阴性细菌诸如埃希氏菌属的成员(例如大肠埃希氏菌)。在一些特别优选的实施方案中，宿主细胞是枯草芽孢杆菌、克劳氏芽孢杆菌和/或地衣芽孢杆菌。在其他优选的实施方案中，宿主细胞是青紫链霉菌的菌株(例如TK23和/或TK21)。任何合适的细菌转化方法可用于本发明，包括但不限于原生质体转化，使用感受态细胞等，如本领域所知道的。在一些优选实施方案中，美国专利5,264,366(将其引入作为参考)中提供的方法可用于本发明。对于青紫链霉菌，转化和蛋白质表达的一个优选方法由Fernandez-Abalos等描述，参见Fernandez-Abalos等，Microbiol.，1491623-1632 ；也参见Hopwood，等，Genetic Manipulation of StreptomycesLaboratory Manual，Innis ，这两篇文献引入本文作为参考)。当然，本文实施例中描述的方法可用于本发明。
可用于本发明的真菌宿主细胞的例子包括但不限于木霉属某些种和曲霉属某些种。在一些特别优选的实施方案中，宿主细胞是里氏木霉和/或黑曲霉。在一些实施方案中，用曲霉进行转化和表达如在美国专利5,364,770中描述地那样实施，该美国专利在此引入作为参考。当然，本文实施例中描述的方法可用于本发明。
在一些实施方案中，需要特定的启动子和信号序列，以获得有效的转化和本发明蛋白酶的表达。因此，在一些涉及使用芽孢杆菌属宿主细胞的优选实施方案中，aprE启动子与已知的来自芽孢杆菌的信号和其他调控序列联合使用。在一些涉及在曲霉属中表达的优选实施方案中，使用glaA启动子。在一些涉及链霉菌宿主细胞的实施方案中，使用密苏里游动放线菌(Actinoplanes missouriensis)的葡萄糖异构酶(GI)启动子，而在其他实施方案中，使用A4启动子。
在一些涉及在细菌诸如大肠杆菌中表达的实施方案中，蛋白酶保留在细胞质中，通常是不溶性的颗粒(即，包涵体)。然而，在其他实施方案中，蛋白酶被细菌分泌序列引导到周质空间。在前一种情况中，细菌被裂解，颗粒被回收并变性，之后，通过稀释变性剂使蛋白酶重新折叠。在后一种情况下，通过破碎细胞(例如通过超声波或渗透压突击处理)，以释放周质空间的内含物并回收蛋白酶，从而从周质空间回收蛋白酶。
在一些优选的实施方案中，在允许本发明蛋白酶表达的条件下，将本发明的转化的宿主细胞培养在合适的营养培养基中，之后，从培养物回收所得的蛋白酶。用于培养细胞的培养基包括适合于宿主细胞生长的任何常规的培养基，诸如基本培养基或含有适当的补充物的复合培养基。合适的培养基可以从商业供应商获得，或可以根据以公开的配方制备(例如在美国典型培养物保藏中心(American TypeCulture Collection)目录中的配方)。在一些实施方案中，细胞产生的蛋白酶用常规方法从培养基中回收，所述常规方法包括但不限于通过离心或过滤从培养基分离宿主细胞、利用盐(例如硫酸铵)沉淀上清液或过滤物中的蛋白质组分、层析纯化(例如离子交换、凝胶过滤、亲合层析等)。因此，可以使用适合于回收本发明的蛋白酶的任何方法。事实上，本发明不旨在局限于任何特定的纯化方法。
VI.丝氨酸蛋白酶的应用[342]如本文中更为详细描述的，本发明的蛋白酶具有使得它们非常适合用于某些应用的重要特征。例如，相比起一些目前使用的蛋白酶，本发明的蛋白酶具有增加的热稳定性、增加的氧化稳定性和增加的螯合剂稳定性。
因此，这些蛋白酶可用于清洗组合物(cleaning compositions)。事实上，在某些洗涤条件下，相比起目前使用的枯草蛋白酶，本蛋白酶显示出可媲美的或增强的洗涤性能。因此，考虑的是，本发明的清洗和/或酶组合物将在各种清洗组合物中被提供。在一些实施方案中，本发明的蛋白酶以与枯草蛋白酶(即目前使用的蛋白酶)同样的方式被利用。因此，本发明蛋白酶可用于各种清洗组合物，以及动物饲料应用，皮革加工(例如软化)、蛋白质水解，和纺织品用途。鉴定的蛋白酶也可用于个人护理用途。
因此，本发明的蛋白酶可用于许多工业用途，特别是用于清洗、消毒、动物饲料和纺织品/皮革工业中。在一些实施方案中，将本发明的蛋白酶与洗涤剂、增效剂、漂白剂和其他常规的组分结合，以产生各种新的清洗组合物，用于洗衣和其他清洗领域，诸如洗衣洗涤剂(粉末和液体)、洗衣预浸泡剂、全棉漂白剂、自动洗碟洗涤剂(液体和粉末)、家用清洗剂，特别是条状和液体肥皂应用，和排放疏通剂(drain opener)。此外，蛋白酶可用于清洗隐形眼镜以及其他物品，这通过将此类物质与清洗组合物的含水溶液接触来进行。此外，这些天然存在的蛋白酶例如可以用于肽水解、废物处理、纺织品用途、医疗设备清洗、生物膜去除，以及用作蛋白质生产中的融合-切割酶，等等。这些产品的组成对于本发明不是至关重要的，只要蛋白酶在使用的环境中维持它们的功能就行。在一些实施方案中，通过将清洗有效量的蛋白酶或包括蛋白酶制备物的酶组合物与此类组合物的常规组分组合，容易地制备出所述组合物，其中常规组分的数量是在其领域内公认的数量。
A.清洗组合物[345]本发明的清洗组合物可以有利地应用于例如洗衣用途、硬表面清洗、自动洗碟应用以及化妆品应用，诸如牙、牙齿、头发和皮肤。然而，由于在低温溶液中增加的效力这样的独特优点以及优异的颜色安全性(color-safety)特性，本发明的酶理想地适用于洗衣用途诸如纺织品的漂白。而且，本发明的酶可以以颗粒和液体组合物的形式被利用。
本发明的酶也可以应用于清洗添加剂产品中。当需要额外的漂白效果时，包括本发明的酶的清洗添加剂产品理想地适合于包含在洗涤过程中。此种例子可以包括但不限于低温溶液清洗用途。最简单形式的添加剂产品可以是一种或多种蛋白酶，包括ASP。此类添加剂可以以剂量形式包装，用于加入到这样的清洗过程中，其中利用了过氧化物(peroxygen)源并且需要增加的漂白效果。这样的单剂量形式可以包括丸、片剂、胶囊或其他单剂量单位，诸如预先称量的粉末或液体。可以引入填料或载体物质，以增加此类组合物的体积。合适的填料或载体物质包括但不限于各种硫酸盐、碳酸盐和硅酸盐以及云母、粘土和类似物。用于液体组合物的填料或载体物质可以是水或低分子量的伯醇和仲醇，包括多元醇和二醇。此类醇的例子包括但不限于甲醇、乙醇、丙醇和异丙醇。组合物可以含有约5％至约90％的此类物质。可以使用酸性填料以降低pH。可选择地，清洗添加剂可以包括下面定义的活化的过氧化物源或下面充分定义的辅助组分。
本发明的清洗组合物和清洗添加剂需要在此提供的有效量的ASP酶和/或变体。通过加入一种或多种本发明的酶，可以获得需要的酶水平。典型地，本清洗组合物将包括至少0.0001重量百分比、约0.0001至约1、约0.001至约0.5或甚至约0.01至约0.1重量百分比的至少一种本发明的酶。
本发明的清洗组合物通常这样配制，使得在应用于含水清洗操作时，洗涤水的pH将为约5.0至约11.5或甚至约7.5至约10.5。液体产品制剂通常配制成净pH为约3.0至约9.0或甚至约3至约5。颗粒洗衣产品通常配制成pH为约9至约11。将pH控制在推荐的使用水平的技术包括使用缓冲液、碱、酸等，并且这是本领域技术人员所熟知的。
合适的低pH清洗组合物通常的净pH为约3至约5，并且通常没有在此pH环境中水解的表面活性剂。此类表面活性剂包括烷基硫酸钠表面活性剂，其包括至少一个环氧乙烷部分，或甚至约1至16摩尔的环氧乙烷。此类清洗组合物通常包括有效量的pH修饰剂，诸如氢氧化钠、单乙醇胺或盐酸，以提供净pH为约3至约5的此类清洗组合物。此类组合物通常包括至少一种酸稳定酶。所述组合物可以是液体或固体。此类液体组合物的pH被测量为净pH。此类固体组合物的pH是作为所述组合物的10％固体溶液时被测量，其中所述溶剂是蒸馏水。在这些实施方案中，所有pH测量在20℃进行。
当丝氨酸蛋白酶用于粒状组合物或液体中时，包囊化颗粒的形式对于酶是有利的，可以保护此酶在保藏期间免遭粒状组合物中的其他组分的影响。此外，包囊化也是在清洗过程期间控制酶的可获得性的手段，并且可以增强在此提供的酶的性能表现。在这方面，本发明的丝氨酸蛋白酶可以用本领域已知的任何包囊材料进行包囊化。
包囊材料通常包囊有至少一部分的用于本发明的酶的催化剂。典型地，包囊材料是水溶性和/或水可分散性的。包囊材料可以具有0℃或更高的玻璃化转变温度(Tg)。玻璃化转变温度更详细地描述在WO 97/11151中，特别是第6页第25行至第7页第2行中。
包囊材料可以选自碳水化合物、天然或合成的胶、几丁质和壳聚糖、纤维素和纤维素衍生物、硅酸盐、磷酸盐、硼酸盐、聚乙烯醇、聚乙二醇、固体石腊和它们的组合。当包囊材料是碳水化合物时，它一般选自单糖、寡糖、多糖和它们的组合。典型地，包囊材料是淀粉。合适的淀粉描述于EP 0 922 499；US 4,977,252；US 5,354,559和US 5,935,826中。
包囊材料可以是由塑料制成的微球体，塑料诸如热塑性塑料、丙烯腈、甲基丙烯腈、聚丙烯腈、聚甲基丙烯腈和它们的混合物；可以被使用的商业上可获得的微球体是由Stockviksverken，Sweden的Expancel提供的商标为Expancel_的微球体，和Valley Forge，Pennsylvania U.S.A的PQ Corp.提供的商品名为PM 6545、PM6550、PM 7220、PM 7228、Extendospheres_、Luxsil_、Q-cel_和Sphericel_的微球体。
如本文中所述，发现本发明的蛋白酶在清洗工业中有特殊用途，清洗工业包括但不限于洗衣和洗碟洗涤剂。这些应用将酶置于各种环境压力下。由于它们在各种条件下的稳定性，本发明的蛋白酶提供了超出许多现用酶的优点。
事实上，存在各种洗涤条件，包括变化的洗涤剂制剂、洗涤水体积、洗涤水温度和洗涤时间长度，这些都是参与洗涤的蛋白酶所遭遇的洗涤条件。此外，用于不同地理区域的洗涤剂制剂在洗涤水中，具有不同的相关组分浓度。例如，欧洲洗涤剂在洗涤水中一般具有约4500-5000ppm的洗涤剂组分，而日本洗涤剂在洗涤水中一般具有大约667ppm的洗涤剂组分。在北美，特别是美国，洗涤剂在洗涤水中一般具有约975ppm的洗涤剂组分。
低洗涤剂浓度系统包括这样的洗涤剂，其中少于约800ppm的洗涤剂组分存在于洗涤水中。日本洗涤剂一般被认为是低洗涤剂浓度系统，因为它们在洗涤水中具有约667ppm的洗涤剂组分。
中度洗涤剂浓度包括这样的洗涤剂，其中约800ppm至约2000ppm的洗涤剂组分存在于洗涤水中。北美洗涤剂一般被认为是中度洗涤剂浓度系统，因为它们在洗涤水中具有约975ppm的洗涤剂组分。巴西洗涤剂一般在洗涤水中具有约1500ppm的洗涤剂组分。
高洗涤剂浓度系统包括这样的洗涤剂，其中高于约2000ppm的洗涤剂组分存在于洗涤水中。欧洲洗涤剂一般被认为是高洗涤剂浓度系统，因为它们在洗涤水中具有约4500-5000ppm的洗涤剂组分。
拉丁美洲洗涤剂通常是高泡沫磷酸盐增效洗涤剂(high suds phosphate builderdetergent)，用于拉丁美洲的洗涤剂的范围可以是在中度和高洗涤剂浓度，它们在洗涤水中具有约1500ppm至6000ppm范围内的洗涤剂组分。如上所描述，巴西在洗涤水中一般具有约1500ppm的洗涤剂组分。然而，其他高泡沫磷酸盐增效洗涤剂地理，不限于其他拉美国家，可以具有在洗涤水中高达约6000ppm洗涤剂组分的高洗涤剂浓度系统。
根据前面的描述，明显地，在全世界典型的洗涤溶液中的洗涤剂组合物的浓度在下述范围内变化，即从少于约800ppm的洗涤剂组合物(″低洗涤剂浓度地理″)，例如在日本约667ppm，到在约800ppm至约2000ppm(″中度洗涤剂浓度地理″)，例如在美国约975ppm和巴西约1500ppm，到高于约2000ppm(″高洗涤剂浓度地理″)，例如在在欧洲约4500ppm至约5000ppm和在高泡沫磷酸盐增效剂地理中约6000ppm。
典型的洗涤溶液的浓度依经验确定。例如，在美国，典型的洗涤机器容纳约64.4L洗涤溶液这样的体积。因此，为了在洗涤溶液中获得约975ppm的洗涤剂浓度，必须将约62.79g的洗涤剂组合物加入到64.4L的洗涤溶液中。该数量是消费者使用随洗涤剂提供的量杯，量取加入到洗涤水中的典型数量。
作为进一步的例子，不同的地理使用不同的洗涤温度。在日本，洗涤水的温度通常低于在欧洲使用的洗涤水的温度。例如，在北美和日本，洗涤水的温度可以在10和30℃之间(例如约20℃)，而在欧洲，洗涤水的温度典型地在30和60℃之间(例如约40℃)。
作为进一步的例子，不同的地理一般具有不同的水硬度。水硬度通常以每加仑中混合Ca2+/Mg2+的粒子数(格令)描述。硬度是水中钙(Ca2+)和镁(Mg2+)的数量的量度。在美国，大部分的水是硬的，但是硬度有所变化。中度硬度水(60-120ppm)至硬水(121-181ppm)具有的百万分之60至181(ppm)的硬度矿物质(百万份数转换成美国格令是将ppm#除以17.1即为格令硬度)。

欧洲水硬度一般为高于10.5(例如10.5-20.0)格令的混合Ca2+/Mg2+(例如，约15格令的混合Ca2+/Mg2+)。北美水硬度一般大于日本水硬度，但是小于欧洲水硬度。例如，北美水硬度可以是在3至10格令之间、3-8格令或约6格令。日本水硬度一般低于北美水硬度，通常小于4，例如3格令混合Ca2+/Mg2+。
因此，在一些实施方案中，本发明提供了在至少一组洗涤条件中(例如水温、水硬度和/或洗涤剂浓度)显示出惊异的洗涤性能的蛋白酶。在一些实施方案中，本发明的蛋白酶在洗涤性能上可与枯草蛋白酶媲美。在一些实施方案中，相比起枯草蛋白酶，本发明的蛋白酶显示出增强的洗涤性能。因此，在本发明的一些优选的实施方案，在此提供的蛋白酶显示出增强的氧化稳定性、增强的热稳定性和/或增强的螯合剂稳定性。
在一些优选实施方案中，本发明提供了ASP蛋白酶以及该蛋白酶的同源物和变体。这些蛋白酶可用于任何用途中，其中期望从织物或纺织品清洗掉基于蛋白质的污物。
在一些实施方案中，本发明的清洗组合物被配制成手工和机器洗衣洗涤剂组合物，包括洗衣添加剂组合物，和适合用于预处理受污织品的组合物、漂洗添加织品柔软剂组合物、和用于普通家用硬表面清洗操作以及洗碟操作的组合物。本领域技术人员熟悉可以用作清洗组合物的不同制剂。在优选的实施方案中，在洗涤剂组合物中，本发明的蛋白酶包括可媲美的或增强的性能(即，与其他蛋白酶相比时)。在一些实施方案中，利用标准方法，通过在各种清洗分析中将本发明的蛋白酶与枯草蛋白酶比较，评价清洗性能，所述分析利用酶敏感性污物，诸如蛋、草、血、牛奶等。事实上，本领域技术人员熟悉用于在标准洗涤循环条件下评价洗涤剂性能的分光光度方法和其他分析方法。
可用于本发明的分析包括但不限于WO 99/34011和美国专利6,605,458中描述的分析方法(参见例如实施例3)。在美国专利6,605,458，实施例3中，使用的洗涤剂剂量为3.0g/l，pH 10.5，洗涤时间是15分钟，温度为15℃，水硬度6°dH，酶浓度为10nM，其在带有搅拌棒的150ml玻璃烧杯中，5片织物(phi 2.5cm)，其在50ml来自Center for Test Materials Holland的EMPA 117测试物质中。使用Macbeth ColorEye 7000光度计，在460nm处测量在测试物质上的反射率″R″。在本文的实施例中提供了其他方法。因此，这些方法也可以用于本发明。
将本发明的蛋白酶加入到常规清洗组合物中不会产生任何特殊的使用限制。换句话说，适合于洗涤剂的任何温度和pH也适合于本发明组合物，只要pH在本文描述的范围内，并且温度在描述的蛋白酶变性温度之下。此外，本发明的蛋白酶可以用于不包括洗涤剂的清洗组合物，或者单独，或者与增效剂和稳定剂联合使用。
当用于清洗组合物或洗涤剂时，进一步考虑的是氧化稳定性。因此，在一些应用中，稳定性被增加、降低，或可与枯草蛋白酶相媲美，如各种用途所期望的。在一些优选实施方案中，增加的氧化稳定性是期望的。本发明的一些蛋白酶在此类应用中特别有用。
当用于清洗组合物或洗涤剂时，进一步考虑的是热稳定性。因此，在一些应用中，稳定性被增加、降低，或可与枯草蛋白酶相媲美，如各种用途所期望的。在一些优选实施方案中，增加的热稳定性是期望的。本发明的一些蛋白酶在此类应用中特别有用。
当用于清洗组合物或洗涤剂时，进一步考虑的是螯合剂稳定剂。因此，在一些应用中，如各种用途所期望的，稳定性被增加、降低，或可与枯草蛋白酶相媲美。在一些优选实施方案中，增加的螯合剂稳定性是期望的。本发明的一些蛋白酶在此类应用中特别有用。
在本发明的一些实施方案中，提供了天然发生的蛋白酶，比起枯草蛋白酶，该蛋白酶在不同pH中表现出改进的酶活性。pH-活性谱图是pH对酶活性的作图，可以如实施例中描述的和/或通过本领域已知的方法构建。在一些实施方案中，获得具有较宽谱图的天然发生的蛋白酶是期望的(即，在pH范围内比可比较的枯草蛋白酶具有更大的活性的那些蛋白酶)。在其他实施方案中，酶并非在任何pH都具有明显更大的活性，或者是具有更尖锐的谱图(sharper profiles)的天然发生的同源物(即，当与枯草蛋白酶相比，在给定的pH具有增加的活性而在别处具有更小的活性的酶)。因此，在各种实施方案中，本发明的蛋白酶具有不同的pH最佳值和/或范围。本发明不旨在限于任何具体的pH或pH范围。
在本发明的一些实施方案中，清洗组合物包括本发明的蛋白酶，即按组合物的重量计为0.00001％至10％水平的69B4和/或本发明的其他蛋白酶，以及包括清洗辅助物质的平衡物(balance)(例如99.999％至90.0％)，按组合物的重量计算。在本发明的其他方面中，本发明的清洗组合物包括按组合物的重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％的69B4和/或本发明的其他蛋白酶，以及包括清洗辅助物质的清洗组合物平衡物(例如，按重量计为99.9999％至90.0％、99.999％至98％、99.995％至99.5％)。
在一些实施方案中，除了本发明的蛋白酶制剂，优选的清洗组合物包括一种或多种其他的酶或酶衍生物，其提供清洗性能和/或织品护理益处。此类酶包括但不限于其他的蛋白酶、脂酶、角质酶、淀粉酶、纤维素酶、过氧化物酶、氧化酶(例如漆酶)和/或甘露聚糖酶。
适合用于碱性溶液的任何其他蛋白酶都可以用于本发明的组合物中。合适的蛋白酶包括动物、植物或微生物来源的蛋白酶。在特别优选的实施方案中，使用微生物蛋白酶。在一些实施方案中，也包括化学或遗传修饰的突变体。在一些实施方案中，蛋白酶是丝氨酸蛋白酶，优选碱性微生物蛋白酶或胰蛋白样蛋白酶。碱性蛋白酶的例子包括枯草蛋白酶，特别是衍生自芽孢杆菌的蛋白酶(例如枯草芽孢杆菌、缓慢芽孢杆菌、解淀粉芽孢杆菌、枯草芽孢杆菌Carlsberg、枯草芽孢杆菌309、枯草芽孢杆菌147和枯草芽孢杆菌168)。其他例子包括在美国专利RE34,606、5,955,340、5,700,676、6,312,936和6,482,628中描述的那些突变体蛋白酶，所有这些专利整合入本文作为参考。其他蛋白酶的例子包括但不限于胰蛋白酶(例如猪或牛来源的胰蛋白酶)，和描述于WO 89/06270中的镰刀霉(Fusarium)蛋白酶。优选的商业上可获得的蛋白酶包括在商品名MAXATASE_、MAXACALTM、MAXAPEMTM、OPTICLEAN_、OPTIMASE_、PROPERASE_、PURAFECT_和PURAFECT_OXP(Genencor)下出售的蛋白酶，那些在商品名ALCALASES_、SAVINASE_、PRIMASE_、DURAZYMTM、RELASE_和ESPERASE_(Novozymes)下出售的酶；和那些在商品名BLAPTM(Henkel Kommanditgesellschaft auf Aktien，Duesseldorf，Germany)下出售的酶。各种蛋白酶描述于WO 95/23221、WO 92/21760和美国专利5,801,039、5,340,735、5,500,364、5,855,625中。其他的BPN’变体(″BPN′-var 1″和″BPN-变体1″；如本文中所提及的)描述于US RE 34,606中。其他的GG36-变体(″GG36-var.1″和″GG36-变体1″；如本文中所提及的)描述于US5,955,340和5,700,676中。进一步的GG36-变体描述于美国专利6,312,936和6,482,628中。在本发明的一个方面，本发明的清洗组合物包括按组合物重量计为0.00001％至10％水平的额外的蛋白酶，和按组合物重量计为99.999％至90.0％的清洗辅助物质。在本发明的其他实施方案中，本发明的清洗组合物也包括按组合物重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％水平的69B4蛋白酶(或它的同源物或变体)，和包括清洗辅助物质的清洗组合物平衡物(例如按重量计为99.9999％至90.0％、99.999％至98％、99.995％至99.5％)。
此外，适合用于碱性溶液的任何脂酶都可用于本发明。合适的脂酶包括但不限于细菌或真菌来源的脂酶。本发明包括化学或遗传修饰的突变体。有用的脂酶的例子包括Humicola lanuginosa脂酶(参见例如EP 258 068和EP 305 216)、Rhizomucor miehei脂酶(参见例如EP 238 023)、假丝酵母属(Candida)脂酶，诸如C.antartica脂酶(例如C.antartica脂酶A或B；参见例如EP 214 761)、假单孢菌属(Pseudomonas)脂酶诸如产碱假单胞菌(P.alcaligenes)和假产碱假单胞菌(P.pseudoalcaligenes)脂酶(参见例如EP 218 272)、洋葱假单胞菌(P.cepacia)脂酶(参见例如EP 331 376)、斯氏假单胞菌(P.Stutzeri)脂酶(参见例如GB 1,372,034)、荧光假单胞菌(P.fluorescens)脂酶、芽孢杆菌属脂酶(例如枯草芽胞杆菌脂酶[Dartois等，Biochem.Biophys.Acta 1131253-260 )；嗜热脂肪芽孢杆菌脂酶[参见例如JP64/744992]；和短小芽孢杆菌脂酶[参见例如，WO 91/16422]]。
此外，许多克隆的脂酶可用于本发明的一些实施方案中，包括但不限于Penicillium camembertii脂酶(参见Yamaguchi等，Gene 10361-67 )、白地霉(Geotricum candidum)脂酶(参见Schimada等，J.Biochem.，106383-388 )和各种根霉属(Rhizopus)脂酶，诸如德氏根霉(R.delemar)脂酶(参见Hass等.，Gene109117-113 )、雪白根霉(R.niveus)脂酶(Kugimiya等，Biosci.Biotech.Biochem.56716-719 )和米根霉(R.oryzae)脂酶。
其他类型的脂水解酶诸如角质酶也可用本发明的一些实施方案中，包括但不限于来自门多萨假单胞菌(Pseudomonas mendocina)的角质酶(参见WO 88/09367)，或来自Fusarium solani pisi的角质酶(参见WO 90/09446)。
其他合适的脂酶包括商业上可获得的脂酶诸如M1 LIPASETM、LUMAFASTTM和LIPOMAXTM(Genencor)；LIPOLASE_和LIPOLASE_ULTRA(Novozymes)；和LIPASE PTM“Amano”(Amano Pharmaceutical Co.Ltd.，Japan)。
在本发明的一些实施方案中，本发明的清洗组合物还包括按组合物重量计为0.00001％至10％水平的额外的脂酶，和按组合物重量计的清洗辅助物平衡物。在本发明的其他方面，本发明的清洗组合物也包括按组合物重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％水平的脂酶。
任何适用于碱性溶液的淀粉酶(α和/或β淀粉酶)也可用在本发明的一些实施方案中。合适的淀粉酶包括但不限于细菌或真菌来源的酶。化学或遗传修饰的突变体包括在一些实施方案中。淀粉酶可用于本发明中，包括但不限于来自地衣芽胞杆菌的α-淀粉酶(参见例如GB 1,296,839)。商业上可获得的淀粉酶可用于本发明，包括但不限于DURAMYL_、TERMAMYL_、FUNGAMYL_和BANTM(Novozymes)和RAPIDASE_和MAXAMYL_P(Genencor International)。
在本发明的一些实施方案中，本发明的清洗组合物还包括按组合物重量计为0.00001％至10％水平的额外的淀粉酶，和按组合物重量计的清洗辅助物平衡物。在本发明的其他方面，本发明的清洗组合物也包括按组合物重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％的淀粉酶。
任何适用于碱性溶液的纤维素酶可用在本发明的一些实施方案中。合适的纤维素酶包括但不限于细菌或真菌来源的酶。化学或遗传修饰的突变体包括在一些实施方案中。合适的纤维素酶包括但不限于Humicola insolens纤维素酶(参见例如，美国专利4,435,307)。尤其合适的纤维素酶是具有颜色护理优点的纤维素酶(参见例如EP 0 495 257)。
可用于本发明的商业上可获得的纤维素酶包括但不限于CELLUZYME_(Novozymes)和KAC-500(B)TM(Kao Corporation)。在一些实施方案中，纤维素酶作为成熟野生型纤维素酶或变体纤维素酶的部分或片段被掺入，其中N-端部分被删除掉(参见例如美国专利5,874,276)。
在一些实施方案中，本发明的清洗组合物还可以包括按组合物重量计为0.00001％至10％的额外的纤维素酶，和按组合物重量计的清洗辅助物质平衡物。在本发明的其他方面，本发明的清洗组合物也包括按组合物重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％的纤维素酶。
任何适用于洗涤剂组合物或碱性溶液的甘露聚糖酶可用在本发明中。合适的甘露聚糖酶包括但不限于细菌或真菌来源的酶。化学或遗传修饰的突变体包括在一些实施方案中。可以用于本发明的各种甘露聚糖酶是已知的(参见例如美国专利6,566,114、美国专利6,602,842和美国专利6,440,991，所有这些专利通过参考并入本文)。
在一些实施方案中，本发明的清洗组合物还可以包括按组合物重量计为0.00001％至10％的额外的甘露聚糖酶，和按组合物重量计的清洗辅助物质平衡物。在本发明的其他方面，本发明的清洗组合物也包括按组合物重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％的甘露聚糖酶。
在一些实施方案中，过氧化物酶与过氧化氢或其来源(例如过碳酸盐、过硼酸盐或过硫酸盐)联合使用。在选择性的实施方案中，氧化酶与氧联合使用。两种类型酶都是用于“溶液漂白”(即，当纺织品在洗涤液体中一起洗涤时，防止纺织品染料从染色的纺织品转移到其他纺织品)，优选与增强剂一起使用(参见例如WO94/12621和WO 95/01426)。合适的过氧化物酶/氧化酶包括但不限于植物、细菌或真菌来源。化学或遗传修饰的突变体包括在一些实施方案中。
在一些实施方案中，本发明的清洗组合物还包括按组合物重量计为0.00001％至10％的额外的过氧化物酶和/或氧化酶，和按组合物重量计的清洗辅助物质平衡物。在本发明的其他方面，本发明的清洗组合物也包括按组合物重量计为0.0001％至10％、0.001％至5％、0.001％至2％、0.005％至0.5％的过氧化物酶和/或氧化酶。
上述酶的混合物包括在本文中，特别是69B4酶、一种或多种其他的蛋白酶、至少一种淀粉酶、至少一种脂酶、至少一种甘露聚糖酶和/或至少一种纤维素酶的混合物。事实上，这些酶的各种混合物都可以考虑用于本发明。
可以考虑的是，不同水平的蛋白酶和一种或多种其他的酶两者可以独立地在至10％的范围内，清洗组合物的平衡物是清洗辅助物质。通过考虑待清洗的表面、物品或纺织品和针对使用期间(例如整个洗涤剂使用期间)清洗条件的组合物期望形式，容易作出对清洗辅助物质的具体选择。
合适的清洗辅助物质的例子包括但不限于表面活性剂、增效剂、漂白剂、漂白活化剂、漂白催化剂、其他酶、酶稳定系统、螯合掩蔽剂、光学增亮剂、土释放聚合物(soil release polymers)、染料转移剂、分散剂、抑泡剂、染料、香料、着色剂、填料盐、水溶助剂(hydrotropes)、光活化剂、荧光剂、织物调理剂(fabricconditioner)、可水解表面活性剂、防腐剂、抗氧化剂、抗收缩剂、抗皱剂、杀菌剂、杀真菌剂、有色斑点(color speckles)、银护理剂(silvercare)、防锈剂和/或抗腐蚀剂、碱性源(alkalinity sources)、增溶剂、载体、加工助剂、色素和pH控制剂(参见例如美国专利6,610,642、6,605,458、5,705,464、5,710,115、5,698,504、5,695,679、5,686,014和5,646,101，所有这些专利通过参考并入本文。具体清洗组合物物质的实施方案在下面详细举例说明。
如果清洗辅助物质与清洗组合物中的本发明蛋白酶不相容，那么使用合适的方法将清洗辅助物质和蛋白酶分离开来(即相互不接触)，直到两组分的组合是适宜时。这样的分开方法包括本领域已知的任何合适的方法(例如凝胶胶囊(gelcaps)、包囊化、片剂、物理分开等)。
优选地，有效数量的一种或多种本文中提供的蛋白酶被包括在组合物中，用于清洗各种需要去除蛋白质污物的表面。此类清洗组合物包括用于诸如清洗硬表面、纺织品和碟的这样的应用的清洗组合物。事实上，在一些实施方案中，本发明提供了织物清洗组合物，而在其他实施方案中，本发明提供了非织物清洗组合物。特别地，本发明也提供了适用于个人护理的清洗组合物，包括口腔护理(包括洁牙剂(dentrifices)、牙膏、漱口水等以及牙清洗组合物)、皮肤和头发清洗组合物。本发明旨在包括任何形式的洗涤剂组合物(即液体、颗粒、条形、半固体、凝胶、乳状、片剂、胶囊等)。
通过实例，使用本发明蛋白酶的若干清洗组合物更为详细地描述于下。在本发明的清洗组合物被配制成适合用于洗衣机洗涤方法的组合物的实施方案中，本发明的组合物优选含有至少一种表面活性剂和至少一种增效剂化合物，以及一种或多种清洗辅助物质，优选选自有机聚合化合物、漂白剂、其他酶、抑泡剂、分散剂、石灰皂分散剂(lime-soap dispersants)、土悬浮剂(soil suspension)和抗再沉淀剂(anti-redeposition agents)和腐蚀抑制剂。在一些实施方案中，洗衣组合物也含有柔软剂(即，作为额外的清洗辅助物质)。
本发明的组合物也用于固体或液体形式的洗涤剂添加剂产品。此种添加剂产品旨在补充和/或提高常规洗涤剂组合物的性能并且可以在任何清洗过程阶段加入。
在配制用于手工洗碟方法的组合物的实施方案中，本发明的组合物优选含有至少一种表面活性剂和优选至少一种额外的清洗辅助物质，其选自有机聚合化合物、泡沫增强剂、II族金属离子、溶剂、水溶助剂和额外的酶。
在一些实施方案中，本文中洗衣洗涤剂组合物的密度在400至1200g/升范围内，而在其他实施方案中，它在500至950g/升组合物范围内，在20℃测量。
在一些实施方案中，各种清洗组合物诸如在美国专利6,605,458中提供的组合物可与本发明的蛋白酶一起使用。因此，在一些实施方案中，包括至少一种本发明蛋白酶的组合物是压缩的颗粒状织物清洗组合物，而在其他的实施方案中，组合物是可用于洗涤有色纺织品的颗粒状织物清洗组合物。在进一步的实施方案中，组合物是颗粒状织物清洗组合物，其在整个洗涤性能中提供了软化效果，在其他实施方案中，组合物是高效(heavy duty)液体织物清洗组合物。
在一些实施方案中，包括至少一种本发明蛋白酶的组合物是织物清洗组合物，诸如美国专利6,610,642和6,376,450中描述的那些。此外，本发明的蛋白酶可用于在欧洲或日本洗涤条件下具有特别效用的颗粒状洗衣洗涤剂组合物(参见例如美国专利6,610,642)。
在选择性的实施方案中，本发明提供了包括至少一种本文提供的蛋白酶的硬表面清洗组合物。因此，在一些实施方案中，包括至少一种本发明蛋白酶的组合物是硬表面清洗组合物，诸如在美国专利6,610,642、6,376,450和6,376,450中描述的那些。
在进一步的实施方案中，本发明提供了包括至少一种本文提供的蛋白酶的洗碟组合物。因此，在一些实施方案中，包括至少一种本发明蛋白酶的组合物是硬表面清洗组合物，诸如在美国专利6,610,642和6,376,450中描述的那些。
在进一步的实施方案中，本发明提供了包括至少一种本文提供的蛋白酶的洗碟组合物。因此，在一些实施方案中，包括至少一种本发明蛋白酶的组合物包括口腔护理组合物，诸如美国专利6,376,450和6,376,450中的那些。
制剂以及化合物和清洗辅助物质的描述包含在前述美国专利6,376,450、6,605,458、6,605,458和6,610,642中，所有这些专利通过参考特意并入本文。其他的例子阐述于下面的实施例中。
I)制备和使用本发明的清洗组合物的方法[406]本发明的清洗组合物可以配制成任何合适的形式，可以通过配制者选择的任何方法制备，其非限制性例子描述于美国专利5,879,584、5,691,297、5,574,005、5,569,645、5,565,422、5,516,448、5,489,392和5,486,303中，所有这些专利通过参考并入本文。当需要低pH清洗组合物时，通过加入诸如单乙醇胺或酸性物质诸如HCl的物质来调节此类组合物的pH。
II)加入到本发明的丝氨酸蛋白酶的辅助物质[407]尽管对于本发明的目的不是必需的，下文列出的佐剂的非限制性清单适合用于即用型清洗组合物中，并可以有利地掺入本发明的某些实施方案中，例如以辅助或增强清洗性能、以处理待清洗的底物，或在有香料、着色剂、染料或类似物的情况下修饰清洗组合物的美观性。应该理解，此类佐剂是对本发明的丝氨酸蛋白酶的补充。这些额外的组分的精确特性和其掺入的水平，将取决于组合物的物理形式和它被使用时的清洗操作的性质。合适的辅助物质包括但不限于表面活性剂、增效剂、螯合剂、染料转移抑制剂(dye transfer inhibiting agents)、沉积助剂、分散剂、额外的酶和酶稳定剂、催化物质、漂白活化剂、漂白促进剂、过氧化氢、过氧化氢源、预制过酸(preacids)、聚合物分散剂、粘土清除剂/抗再沉积剂、增亮剂、抑泡剂、染料、香料、结构弹性剂(structure elasticizing agents)、织物柔软剂、载体、水溶助剂、加工助剂和/或色素。除了下面公开的内容，此类其他助剂和使用水平的合适例子参见美国专利5,576,282、6,306,812和6,326,348，这些专利通过参考并入本文。上述助剂成分可以构成本发明的清洗组合物的平衡物(balance)。
表面活性剂——本发明的清洗组合物可以包括表面活性剂或表面活性剂系统，其中表面活性剂可以选自非离子表面活性剂、阴离子表面活性剂、阳离子表面活性剂、两性表面活性剂、兼性离子表面活性剂、半极性非离子表面活性剂和它们的混合物。当需要低pH清洗组合物，诸如净pH在约3至约5的组合物时，此类组合物通常不含有乙氧基化硫酸烷基酯，因为认为此类表面活性剂可以被此类组合物的酸性内含物水解。
表面活性剂通常以约0.1％至约60％、约1％至约50％、甚至约5％至约40％的水平存在，基于目标清洗组合物的重量计算。
增效剂——本发明的清洗组合物可以包括一种或多种去污剂增效剂或增效剂系统。当使用增效剂时，目标清洗组合物通常将包括至少约1％、约3％至约60％、甚至约5％至约40％的增效剂，基于目标清洗组合物的重量计算。
增效剂包括但不限于多磷酸的碱金属盐、铵盐和烷醇铵盐，碱金属硅酸盐、碱土金属和碱金属碳酸盐、硅酸铝盐增效剂聚羧酸化合物、羟基聚羧酸醚酯(etherhydroxypolycarboxylates)、马来酸酐和乙烯或乙烯基甲醚的共聚物、1，3，5-三羟基苯-2，4，6-三磺酸和羧甲氧基琥珀酸(carboxymethyloxysuccinic acid)，聚乙酸的各种碱金属、铵和取代铵盐，诸如乙二胺四乙酸和次氨基三乙酸，以及聚羧酸，诸如苯六甲酸、琥珀酸、柠檬酸、氧二琥珀酸、聚马来酸、苯1，3，5-三羧酸、羧甲氧基琥珀酸和它们的可溶性盐。
螯合剂——本文中的清洗组合物可以含有螯合剂。合适的螯合剂包括铜、铁和/或锰螯合剂和它们的混合物。
当使用螯合剂时，清洗组合物可以含有约0.1％至约15％或甚至约3.0％至约10％的螯合剂，基于目标清洗组合物的重量计算。
沉积助剂——本文中的清洗组合物可以含有沉积助剂。合适的沉积助剂包括聚乙二醇、聚丙二醇、聚羧酸盐、土释放聚合物(soil release polymers)诸如聚对苯二甲酸，粘土诸如高岭土、蒙脱石、绿坡缕石、伊利石、膨润土、埃洛石或它们的混合物。
染料转移抑制剂——本发明的清洗组合物也可以包括一种或多种染料转移抑制剂。合适的聚合物染料转移抑制剂包括但不限于聚乙烯吡咯烷酮聚合物、聚胺N-氧化物聚合物、N-乙烯吡咯烷酮和N-乙烯咪唑的共聚物、聚乙烯噁唑烷酮和聚乙烯咪唑或它们的混合物。
当存在于目标清洗组合物时，染料转移抑制剂按在清洗组合物中的重量计可以以约0.0001％至约10％、约0.01％至约5％或甚至约0.1％至约3％的水平存在。
分散剂——本发明的清洗组合物也可以含有分散剂。合适的水溶性有机物质包括均聚合物或共聚合物酸或它们的盐，其中，聚羧酸包括至少两个羧酸基团，它们相互之间被不超过两个的碳原子分开。
酶——清洗组合物可以包括一种或多种洗涤剂酶，它们提供清洗性能和/或纺织品护理益处。合适的酶的例子包括但不限于半纤维素酶、过氧化物酶、蛋白酶、纤维素酶、木聚糖酶、脂酶、磷脂酶、酯酶、角质酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质素酶、支链淀粉酶、鞣酸酶、戊聚糖酶、木聚糖酶、β-葡聚糖酶、阿拉伯糖苷酶、透明质酸酶、软骨素酶、漆酶和淀粉酶或它们的混合物。典型组合是常规适用的酶如蛋白酶、脂酶、角质酶和/或纤维素酶与淀粉酶的混合物。
酶稳定剂——用于洗涤剂的酶可以通过常规技术被稳定化。本文中利用的酶可以通过在完成的组合物中钙和/或镁离子的水溶性来源的存在来稳定化，所述钙和/或镁离子的水溶性来源为酶提供此类离子。
催化性金属复合物——本发明的清洗组合物可以包括催化性金属复合物。一种类型的含金属漂白催化剂是这样的催化系统，其包括具有确定的漂白催化活性的过渡金属阳离子诸如铜、铁、钛、钌、钨、钼或锰阳离子，具有较低或没有漂白催化活性的辅助金属阳离子诸如锌或铝阳离子，以及对催化和辅助金属阳离子具有确定的稳定常数的螯合剂，特别是乙二胺四乙酸、乙二胺四(亚甲基膦酸)和它们的水溶性盐。此类催化剂公开于美国专利4,430,243中。
如果需要，本文中的组合物可以借助锰化合物来催化。此类化合物和使用水平是本领域熟知的，包括例如公开于美国专利5,576,282中的基于锰的催化剂。
可用于本文中的钴漂白催化剂是已知的，公开于例如美国专利5,597,936和5,595,967中。此类钴催化剂用已知的程序容易制备，诸如在美国专利5,597,936和5,595,967中所教导的。
本文的组合物也适合包括大多环刚性配体(macropolycyclic rigid ligand)——缩写为“MRL”——的过渡金属复合物。作为实施实例，而不是为了限制，本文中的组合物和清洗方法可以进行调整，以在含水洗涤介质中提供至少一亿分之一的数量级的活性MRL物质，优选地在洗涤液体中提供约0.005ppm至约25ppm、更优选地约0.05ppm至约10ppm、最优选地约0.1ppm至约5ppm的MRL。
在即用型过渡金属漂白催化剂中优选的过渡金属包括锰、铁和铬。本文中优选的MRL是一类特殊的交联超刚性配体，诸如5，12-二乙基-1，5，8，12-四氮杂双环[6.6.2]十六烷。
合适的过渡金属MRL用已知的程序容易制备，诸如WO 00/332601和美国专利6,225,464所教导的。
III)制备和使用清洗组合物的方法[426]本发明的清洗组合物可以配制成任何合适的形式，可以通过配制者选择的任何方法制备，其非限制性例子描述于美国专利5,879,584、5,691,297、5,574,005、5,569,645、5,516,448、5,489,392和5,486,303中，这些专利通过参考并入本文。
IV)使用方法[427]本文中公开的清洗组合物可以被用于清洗表面或纺织品和其它部位。典型地，部位的至少一部分与本发明的一种清洗组合物相接触，所述组合物为纯的形式或稀释在洗涤液体中，然后该部位被任选地洗涤和/或漂洗。对于本发明的目的，洗涤包括但是不限于擦洗和机械搅拌。纺织品可以包括能够在正常消费者使用条件下被洗涤的大多数任何纺织品。公开的清洗组合物通常以在溶液中约500ppm至约15,000ppm的浓度被利用。当洗涤溶剂是水时，水温通常在约5℃至约90℃范围内，当部位包括纺织品时，水与纺织品质量的比率通常为约1∶1至约30∶1。
B.动物饲料[428]此外，本发明提供了用于产生食物或动物饲料的组合物和方法，其特征是将本发明的蛋白酶与食物或动物饲料混合。在一些实施方案中，在加工之前将蛋白酶以干产品加入，而在其他实施方案中，在加工之前或之后，蛋白酶以液体的形式加入。在利用干粉的一些实施方案中，酶被稀释作为液体加到干载体诸如磨过的谷物上。本发明的蛋白酶可用作动物饲料和/或添加剂的的组分，诸如在美国专利5,612,055、美国专利5,314,692和美国专利5,147,642中所描述的那些，所有这些专利通过参考并入本文。
本发明的酶饲料添加剂适合用许多方法制备。例如，在一些实施方案中，简单地通过混合具有合适活性的不同的酶产生酶混合物来制备。在一些实施方案中，该酶混合物直接与饲料混合，而在其他实施方案中，它被浸渍到基于谷物的载体物质上，诸如磨过的小麦、玉米或大豆粉。本发明也包含这些浸渍过的载体，因为它们可以用作酶饲料添加剂。
一些可选择的实施方案中，基于谷物的载体(例如磨过的小麦或玉米)或者同时或者顺序地用具有合适活性的酶浸渍。例如，在一些实施方案中，磨过的小麦载体首先喷以木聚糖酶，然后喷以蛋白酶，以及可选地，喷以β-葡聚糖酶。本发明也包含这些浸渍的载体，因为它们可以用作酶饲料添加剂。在优选的实施方案中，这些浸渍的载体包括本发明的至少一种蛋白酶。
在一些实施方案中，本发明的饲料添加剂直接与动物饲料混合，而在选择性的实施方案中，它与一种或多种其他的饲料添加剂混合，诸如维生素饲料添加剂、矿物质饲料添加剂和/或氨基酸饲料添加剂。然后将所得的包括若干不同类型组分的饲料添加剂以合适的量与饲料混合。
在一些优选实施方案中，一般地，包括基于谷物的载体的本发明饲料添加剂以每千克饲料0.01-50g的量混合，更优选地为0.1-10g/kg，最优选地为约1g/kg。
在可选的实施方案中，本发明的酶饲料添加剂涉及重组微生物的构建，其以期望的相对量提供期望的酶。在一些实施方案中，这通过增加编码至少一种本发明蛋白酶的基因的拷贝数，和/或通过适宜地使用可操作地连接到编码蛋白酶的多核苷酸上的强启动子而得以实现。在进一步的实施方案中，重组微生物菌株的某些酶活性被删除(例如纤维素酶、内切葡聚糖酶等)，如果需要的话。
在其他实施方案中，本发明提供的酶饲料添加剂也包括其他酶，包括但不限于至少一种下述酶木聚糖酶、α-淀粉酶、葡糖淀粉酶、果胶酶、甘露聚糖酶、α-半乳糖苷酶、植酸酶和/或脂酶。在一些实施方案中，在或者将酶浸渍到基于谷物的载体上或者选择性地将这样的酶同时或顺序地浸渍到这样的谷物载体上之前，将具有期望活性的酶与木聚糖酶和蛋白酶混合。然后再将载体与基于谷物的饲料混合，以制备最终的饲料。在选择性的实施方案中，将酶饲料添加剂配制成具有各种酶活性的溶液，然后与预制成丸(pellet)或糊(mash)的饲料材料混合。
在进一步的实施方案中，通过将酶饲料添加剂掺入到第二种(即不同的)饲料或动物饮用水中，来将酶饲料添加剂包括在动物膳食中。因此，将本发明提供的酶混合物掺入到谷物饲料本身中并不是必需的，尽管这样的掺入形成本发明特别优选的实施方案。每克饲料添加剂木聚糖酶活性单位与每克饲料添加剂蛋白酶活性单位的比率优选为1∶0.001-1,000，更优选为1∶0.01-100，最优选为1∶0.1-10。如上所示，本发明提供的酶混合物优选可用作制备谷物饲料的饲料添加剂。
在一些实施方案中，谷物饲料包括按重量计至少25％或更优选地至少35％的小麦或玉米或这两种谷物的组合。饲料还包括蛋白酶(即，本发明的至少一种蛋白酶)，饲料包括的蛋白酶的数量使得饲料含有100-100,000个单位的蛋白酶活性/kg的蛋白酶。
根据本发明提供的谷物饲料可以用作各种非人动物的饲料，包括禽类(例如火鸡、鹅、鸭、鸡等)、牲畜(例如猪、羊、牛、山羊等)和赔伴动物(companion animal)(例如马、狗、猫、兔、鼠等)。所述饲料特别适合于禽类和猪，特别是肉鸡(broilerchicken)。
C.纺织品和皮革处理[438]本发明也提供了用于处理纺织品的组合物，其包括本发明的至少一种蛋白酶。在一些实施方案中，本发明的至少一种蛋白酶是适合于处理丝或羊毛的组合物的组分(参见例如美国RE专利216,034、EP 134,267、美国专利4,533,359和EP344,259)。
此外，本发明的蛋白酶可用于需要将磷从植酸盐分离开的各种应用中。因此，本发明也提供了生产具有改善的特性的羊毛或动物毛发物质的方法。在一些优选实施方案中，这些方法包括步骤在选自等离子体处理工艺和Delhey工艺的工艺中预处理羊毛、羊毛纤维或动物毛发物质，将预处理的羊毛或动物毛发物质用蛋白水解酶(例如，本发明的至少一种蛋白酶)处理，所用的蛋白水解酶的量能有效地改善特性。在一些实施方案中，蛋白水解酶处理在等离子体处理之前进行，而在其他实施方案中，它在等离子体处理之后进行。在一些进一步的实施方案中，它作为一个独立的步骤进行，而在其他实施方案中，它与羊毛或动物毛发物质的擦洗或染色联合进行。在其他实施方案中，在酶处理步骤期间存在至少一种表面活性剂和/或至少一种软化剂，而在其他实施方案中，表面活性剂和/或软化剂在独立的步骤中掺入，其中羊毛或动物毛发物质接受软化处理。
在一些实施方案中，本发明的组合物可用于对羊毛纤维进行防缩处理的方法中(参见例如JP 4-327274)。在一些实施方案中，组合物用于通过下述步骤对羊毛进行防缩处理的方法中对纤维进行低温等离子体处理，然后用防缩树脂处理，防缩树脂诸如嵌段氨基甲酸酯树脂、聚酰胺环氯醇树脂、乙二醛树脂、乙烯-脲树脂或丙烯酸树脂，然后用减重(weight reducing)蛋白水解酶处理，以获得软化效果。在一些实施方案中，等离子体处理步骤是低温处理，优选电晕放电处理或辉光放电处理。
在一些实施方案中，低温等离子体处理通过使用气体来实施，气体优选选自空气、氮气、氨气、氦气或氩气。常规地，使用空气，但是使用其他指出的气体中的任何一种气体也可能是有益的。
优选地，低温等离子体处理在约0.1torr至5torr之间的压力中实施约2秒至约300秒，优选约5秒至约100秒，更优选约5秒至约30秒。
如上所示，本发明可用与诸如Delhey处理之类的方法联合使用(参见例如DE-A-43 32 692)。在该处理中，羊毛在可溶性钨酸盐存在下，在过氧化氢含有溶液中处理，任选地，在合成聚合物溶液或分散液中处理，以改善羊毛的防毡缩(anti-felting)特性。在该方法中，羊毛在2-60％(w/w)，优选8-20％(w/w)的催化剂(优选Na2WO4)存在下，在非离子润湿剂存在下，在过氧化氢(0.1-35％(w/w)，优选2-10％(w/w))含水溶液中处理。优选地，处理在pH 8-11，以及室温中进行。处时间度取决于过氧化氢和催化剂的浓度，但是优选2分钟或更少。氧化处理之后，羊毛用水冲洗。为了除去残留的过氧化氢，以及任选地获得额外的漂白处理，羊毛进一步在还原剂的酸性溶液(例如亚硫酸盐、亚磷酸盐等)中处理。
在一些实施方案中，该酶处理步骤实施约1分钟至约120分钟。该步骤在约20℃至约60℃的温度中，更优选在约30℃至约50℃的温度中实施。可选择地，羊毛浸泡在含水酶溶液中，或填塞(padded)以含水酶溶液，然后在常规的温度和压力下蒸通常约30秒至约3分钟。在一些优选实施方案中，蛋白水解酶处理在酸性或中性或碱性介质中进行，该介质可以包括缓冲剂。
在选择性的实施方案中，酶处理步骤在一种或多种常规阴离子、非离子(例如Dobanol；Henkel AG)或阳离子表面活性剂存在下进行。有用的非离子表面活性剂的例子是Dobanol(来自Henkel AG)。在进一步的实施方案中，羊毛或动物毛发物质用超声波处理，在用蛋白水解酶处理前或者与蛋白水解酶处理同时进行。在一些优选实施方案中，超声波处理在约50℃进行约5分钟。在一些优选实施方案中，用于酶处理步骤的蛋白水解酶的数量在约0.2w/w％至约10w/w％之间，这基于羊毛或动物毛发物质的重量计算。在一些实施方案中，为了处理步骤的数量，酶处理在染色和/或擦洗羊毛或动物毛发物质期间，简单地通过将蛋白酶加入到染色、漂洗和/或擦洗浴中来实施。在一些实施方案中，酶处理在等离子体处理之后实施，但是在其他实施方案中，这两处理步骤以相反的顺序实施。
通常用于羊毛的软化剂常常是阳离子软化剂，其为有机阳离子软化剂或有机硅基产品，但是阴离子或非离子软化剂也是有用的。有用的软化剂的离子包括但不限于聚乙烯软化剂和有机硅软化剂(即，二甲基聚硅氧烷(硅油))、H-聚硅氧烷、有机硅弹性体、氨基官能性二甲基聚硅氧烷、氨基官能性有机硅弹性体和环氧官能性二甲基聚硅氧烷，和有机阳离子软化剂(例如烷基季铵衍生物)。
在其他实施方案中，本发明提供了用于处理动物皮的组合物，其包括本发明的至少一种蛋白酶。在一些实施方案中，本发明的蛋白酶可用于用来处理动物皮的组合物，诸如WO 03/00865(Insect Biotech Co.，Taejeon-Si，Korea)中描述的。在其他实施方案中，本发明提供了将皮和/或皮肤加工成皮革的方法，该方法包括用本发明的蛋白酶酶法处理皮或皮肤(参见例如WO 96/11285)。在其他实施方案中，本发明提供了用于将动物皮肤或皮加工成皮革的组合物，该组合物包括本发明的至少一种蛋白酶。
在制革厂，收到的兽皮和皮肤常常是盐渍或干燥的生皮或皮肤的形式。将兽皮或皮肤加工成皮革的过程包括若干不同的加工步骤，包括浸泡、去毛和软化步骤。这些步骤构成湿处理工艺，在浸灰间进行。利用本发明蛋白酶的酶处理可适用于涉及皮革加工的工艺期间的任何时候。然而，通常在湿处理期间使用酶(即，在浸泡、去毛和/或软化期间)。因此，在一些优选实施方案中，用本发明至少一种蛋白酶的酶处理在湿处理阶段进行。
在一些实施方案中，本发明的浸泡处理在常规的浸泡条件下进行(例如pH在6.0-11的范围内)。在一些优选实施方案中，范围为pH 7.0-10.0。在选择性的实施方案中，温度在20-30℃范围内，而在其他实施方案中，它优选在24-28℃范围内。在进一步的实施方案中，反应时间在2-24小时范围内，而优选的范围为4-16小时。在其他实施方案中，如果需要，提供界面活性剂和/或防腐剂。
软化步骤的第二阶段通常以加入软化剂本身开始。在一些实施方案中，酶处理在软化期间发生。在一些优选实施方案中，酶处理在软化期间，脱灰阶段之后发生。在一些实施方案中，本发明的软化处理使用常规条件进行(例如pH在6.0-9.0范围内)。在一些优选实施方案中，pH范围为6.0至8.5。在进一步的实施方案在一些实施方案中，温度在20-30℃范围内，而在优选实施方案中，温度在25-28℃范围内。在一些实施方案中，反应时间在20-90分钟范围内，而在其他实施方案中，在40-80分钟范围内。皮革制造的工艺对本领域技术人员来说是熟知的(参见例如WO 94/069429、WO 90/1121189、美国专利3,840,433、EP 505920、GB 2233665和美国专利3,986,926，所有这些专利通过参考并入本文)。
在进一步的实施方案中，本发明提供了软化剂，该软化剂包括本发明的至少一种蛋白酶。软化剂是含有化学活性组分的试剂或含酶制剂，其应用于浸灰间工艺，特别是在皮革制造工艺的软化步骤中。在一些实施方案中，本发明提供了包括蛋白酶和合适的赋形剂的软化剂。在一些实施方案中，试剂包括但是不限于在本领域已知的并使用的化学制品，例如稀释剂、乳化剂、除灰剂和载体。在一些实施方案中，包括本发明的至少一种蛋白酶的软化剂按照本领域已知地配制(参见例如GB-A2250289、WO 96/11285和EP 0784703)。
在一些实施方案中，本发明的软化剂每克软化剂含有0.00005至0.01g活性蛋白酶，而在其他实施方案中，每克软化剂含有0.0002至0.004g的活性蛋白酶。
因此，本发明的蛋白酶可用于大量应用和环境中。
实验[454]本发明在下面的实施例中被更为详细地描述，这些实施例绝不旨在限制所要求保护的发明范围。附图意欲被认为是发明说明书和描述的一部分。对于所有在本文描述的，所有引用的参考文献通过引用明确并入本文。提供下面的实施例是为了举例说明所要求保护的发明而不是对其进行限制。
在随后的实验公开内容中，使用下面的缩写PI(蛋白酶抑制剂)、ppm(百万分之份数)；M(摩尔每升)；mM(毫摩尔每升)；μM(微摩尔每升)；nM(纳摩尔每升)；mol(摩尔)；mmol(毫摩尔)；μmol(微摩尔)；nmol(纳摩尔)；gm(克)；mg(毫克)；μg(微克)；pg(皮克)；L(升)；ml和mL(毫升)；μl和μL(微升)；cm(厘米)；mm(毫米)；μm(微米)；nm(纳米)；U(单位)；V(伏特)；MW(分子量)；sec(秒)；min(s)(分钟/许多分钟)；h(s)和hr(s)(小时/许多小时)；℃(摄氏度)；QS(足量)；ND(未做)；NA(不适用)；rpm(每分钟的转数)；H2O(水)；dH2O(去离子水)；HCl(盐酸)；aa(氨基酸)；bp(碱基对)；kb(千碱基对)；kD(千道尔顿)；cDNA(拷贝或互补DNA)；DNA(脱氧核糖核苷酸)；ssDNA(单链DNA)；dsDNA(双链DNA)；dNTP(脱氧核糖核苷三磷酸)；RNA(核糖核酸)；MgCl2(氯化镁)；NaCl(氯化钠)；w/v(重量与体积之比)；v/v(体积与体积之比)；g(重力)；OD(光密度)；Dulbecco’s磷酸盐缓冲液(DPBS)；SOC(2％Bacto-胰蛋白胨、0.5％Bacto酵母提取物、10mM NaCl、2.5mM KCl)；Terrific Broth(TB；12g/l Bacto胰蛋白胨、24g/l甘油、2.31g/l KH2PO4和12.54g/l K2HPO4)；OD280(在280nm的光密度)；OD600(在600nm的光密度)；A405(在405nm的吸光度)；Vmax(酶催化反应的最大初速度)；PAGE(聚丙烯酰胺凝胶电泳)；PBS(磷酸盐缓冲盐水[150mM NaCl、10mM硫酸钠缓冲液，pH 7.2])；PBST(PBS+0.25％TWEEN_20)；PEG(聚乙二醇)；PCR(聚合酶链式反应)；RT-PCR(逆转录PCR)；SDS(十二烷基磺酸钠)；Tris(三(羟甲基)氨基甲烷)；HEPES(N-[2-羟乙基]哌嗪-N-[2-乙烷磺酸]；HBS(HEPES缓冲盐水)；SDS(十二烷基磺酸钠)；Tris-HCl(三[羟甲基]氨基甲烷-盐酸盐)；Tricine(N-[三-(羟甲基)-甲基]-甘氨酸)；CHES(2-(N-环-己氨基)乙烷-磺酸)；TAPS(3-{[三-(羟甲基)-甲基]-氨基}-丙烷磺酸)；CAPS(3-(环-己氨基)-丙烷-磺酸)；DMSO(二甲基亚砜)；DTT(1，4-二硫-DL-苏糖醇)；SA(芥子酸(s，5-二甲氧基-4-羟基肉桂酸)；TCA(三氯乙酸)；Glut和GSH(还原谷胱甘肽)；GSSG(氧化谷胱苷肽)；TCEP(三[2-羧乙基]膦)；Ci(居里)；mCi(毫居里)；μCi(微居里)；HPLC(高压液相色谱)；RP-HPLC(反相高压液相色谱)；TLC(薄层层析)；MALDI-TOF(基质辅助激光解吸/电离-时间飞行)；Ts(甲苯磺酰基)；Bn(苄基)；Ph(苯基)；Ms(甲磺酰基)；Et(乙基)、Me(甲基)；Taq(嗜热水生菌(Thermus aquaticus)DNA聚合酶)；Klenow(DNA聚合酶I大(Klenow)片段)；rpm(每分钟转速)；EGTA(乙二醇-二(β-氨基乙醚)N，N，N′，N′-四乙酸)；EDTA(乙二胺四乙酸)；bla(β-内酰胺酶或氨苄青霉素抗性基因)；HDL(高效液体洗涤剂，即洗衣洗涤剂)；MJ Research(MJ Research，Reno，NV)；Baseclear(Baseclear BV，Inc.，Leiden，the Netherlands)；PerSeptive(PerSeptiveBiosystems，Framingham，MA)；ThermoFinnigan(ThermoFinnigan，San Jose，CA)；Argo(Argo BioAnalytica，Morris Plains，NJ)；Seitz EKS(SeitzSchenk FiltersystemsGmbH，Bad Kreuznach，Germany)；Pall(Pall Corp.，East Hills，NY)；Spectrum(Spectrum Laboratories，Dominguez Rancho，CA)；Molecular Structure(MolecularStructure Corp.，Woodlands，TX)；Accelrys(Accelrys，Inc.，San Diego，CA)；ChemicalComputing(Chemical Computing Corp.，Montreal，Canada)；New Brunswick(NewBrunswick Scientific，Co.，Edison，NJ)；CFT(Center for Test Materials，Vlaardingeng，the Netherlands)；Procter & Gamble(Procter & Gamble，Inc.，Cincinnati，OH)；GEHealthcare(GE Healthcare，Chalfont St.Giles，United Kingdom)；DNA2.0(DNA2.0，Menlo Park，CA)；OXOID(Oxoid，Basingstoke，Hampshire，UK)；Megazyme(Megazyme International Ireland Ltd.，Bray Business Park，Bray，Co.，Wicklow，Ireland)；Finnzymes(Finnzymes Oy，Espoo，Finland)；Kelco(CP Kelco，Wilmington，DE)；Corning(Corning Life Sciences，Corning，NY)；NEN(NEN Life Science products，Boston，MA)；Pharma AS(Pharma AS，Oslo，Norway)；Dynal(Dynal，Oslo，Norway)；Bio-Synthesis(Bio-Synthesis，Lewisville，TX)；ATCC(American Type CultureCollection，Rockville，MD)；Gibco/BRL(Gibco/BRL，Grand Island，NY)；Sigma(Sigma Chemical Co.，St.Louis，MO)；Pharmacia(Pharmacia Biotech，Piscataway，NJ)；NCBI(National Center for Biotechnology Information)；Applied Biosystems(Applied Biosystems，Foster City，CA)；BD Biosciences和/或Clontech(BDBiosciences CLONTECH Laboratories，Palo Alto，CA)；Operon Technologies(OperonTechnologies，Inc.，Alameda，CA)；MWG Biotech(MWG Biotech，High Point，NC)；Oligos Etc(Oligos Etc.Inc，Wilsonville，OR)；Bachem(Bachem Bioscience，Inc.，Kingof Prussia，PA)；Difco(Difco Laboratories，Detroit，MI)；Mediatech(Mediatech，Herndon，VA)；Santa Cruz(Santa Cruz Biotechnology，Inc.，Santa Cruz，CA)；Oxoid(Oxoid Inc.，Ogdensburg，NY)；Worthington(Worthington Biochemical Corp.，Freehold，NJ)；GIBCO BRL或Gibco BRL(Life Technologies，Inc.，Gaithersburg，MD)；Millipore(Millipore，Billerica，MA)；Bio-Rad(Bio-Rad，Hercules，CA)；Invitrogen(Invitrogen Corp.，San Diego，CA)；NEB(New England Biolabs，Beverly，MA)；Sigma(Sigma Chemical Co.，St.Louis，MO)；Pierce(Pierce Biotechnology，Rockford，IL)；Takara(Takara Bio Inc.，Otsu，Japan)；Roche(Hoffmann-La Roche，Basel，Switzerland)；EM Science(EM Science，Gibbstown，NJ)；Qiagen(Qiagen，Inc.，Valencia，CA)；Biodesign(Biodesign Intl.，Saco，Maine)；Aptagen(Aptagen，Inc.，Herndon，VA)；Sorvall(Sorvall brand，来自Kendro Laboratory Products，Asheville，NC)；Molecular Devices(Molecular Devices，Corp.，Sunnyvale，CA)；R&D Systems(R&D Systems，Minneapolis，MN)；Stratagene(Stratagene Cloning Systems，La Jolla，CA)；Marsh(Marsh Biosciences，Rochester，NY)；Bio-Tek(Bio-Tek Instruments，Winooski，VT)；Biacore(Biacore，Inc.，Piscataway，NJ)；PeproTech(PeproTech，RockyHill，NJ)；SynPep(SynPep，Dublin，CA)；New Objective(New Objective brand；Scientific Instrument Services，Inc.，Ringoes，NJ)；Waters(Waters，Inc.，Milord，MA)；Matrix Science(Matrix Science，Boston，MA)；Dionex(Dionex，Corp，Sunnyvale，CA)；Monsanto(Monsanto Co.，St.Louis，MO)；Wintershall(Wintershall AG，Kassel，Germany)；BASF(BASF Co.，Florham Park，NJ)；Huntsman(Huntsman PetrochemicalCorp.，Salt Lake City，UT)；Enichem(Enichem Iberica，Barcelona，Spain)；FlukaChemie AG(Fluka Chemie AG，Buchs，Switzerland)；Gist-Brocades(Gist-Brocades，NV，Delft，the Netherlands)；Dow Corning(Dow Corning Corp.，Midland，MI)；和Microsoft(Microsoft，Inc.，Redmond，WA)。
实施例1分析[456]在后面的实施例中，使用了各种分析，诸如蛋白质测定、应用测试(application-based test)和稳定性测试(stability-based test)。为了便于阅读，后面的分析被描述于下，它们在各实施例中被提及。在开发本发明期间所进行的任何实验与下面所给出的方案的任何差异，都在实施例中被说明。
用于下面实施例中的一些洗涤剂具有下述组成。在组合物I和II中，平衡物(填至100％)是香料/染料和/或水。对于组合物I，这些组合物的pH为约5至约7，对于组合物II，为约7.5至约8.5。在组合物III中，平衡物(填至100％)由水和/或少量的香水、染料、增亮剂/SRPI/羧甲基纤维素钠/光漂白剂/MgSO4/PVPVI/抑泡剂/高分子量PEG/粘土组成。

组合物IIIC14-C15AS或牛脂烷基硫酸钠(sodium tallow alkyl sulfate)3.0LAS 8.0C12-C15AE3S1.0C12-C15E5或E35.0
QAS-沸石A 11.0SKS-6(干加(dry add)) 9.0MA/AA 2.0AA -二水柠檬酸三钠 -柠檬酸(无水) 1.5DTPA -EDDS 0.5HEDP 0.2PB1-过碳酸盐 3.8NOBS -NACA OBS 2.0TAED 2.0BB10.34BB2-无水碳酸钠 8.0硫酸盐 2.0硅酸盐 -蛋白酶B-蛋白酶C-脂酶 -淀粉酶 -纤维素酶 -果胶裂解酶 0.001醛糖氧化酶 0.05PAAC -A.在96孔微量滴定板中对蛋白质含量进行测定的TCA分析[460]该分析使用过滤的培养物上清液开始，该上清液来自于在33℃生长4天的微量滴定板，在生长时伴随以230RPM的摇动以及增湿通气。新的96孔平底板被用于分析。首先，将100μL/孔的0.25NHCl置于孔中。然后，将50μL过滤的培养物肉汤(culture broth)加入到孔中。然后测定在405nm的光散射/吸光度(在平板读数仪中，使用5sec混合模式(mixing mode))，以提供“空白”读数。
对于测试，则将100μL/孔的15％(w/v)TCA置于板中，室温中温育5至30分钟。然后测定在405nm的光散射/吸光度(在平板读数仪中，使用5sec混合模式)。
通过用含有TCA时的测试读数减去空白值(即没有TCA)，来进行计算。如果需要，可以用已知转换因子的克隆AAPF分析校准TCA读数，从而产生标准曲线。然而，对于50至500ppm浓度的蛋白质，TCA结果是线性的，因此可以针对酶性能直接作图，以达到选择良好性能的变体的目的。
B.在96孔微量滴定板中对蛋白酶的suc-AAPF-pNA分析[463]在该分析系统中，使用的试剂溶液是1.100mM Tris/HCl，pH 8.6，含有0.005％TWEEN_-80(Tris缓冲液)2.100mM Tris缓冲液，pH 8.6，含有10mM CaCl2和0.005％TWEEN_-80(Tris缓冲液)3.在DMSO中的160mM suc-AAPF-pNA(suc-AAPF-pNA储液)(SigmaS-7388)[464]为了制备suc-AAPF-pNA工作溶液，将1ml AAPF的储液加入到100mlTris/Ca缓冲液中，并充分混合至少10秒钟。通过将10μl稀释的蛋白酶溶液加入到每个孔中，然后(快速)加入190μl 1mg/ml AAPF工作溶液，实施本分析。将该溶液混合5秒钟，在25℃，在410nm，用MTP读数器读取吸光度变化。蛋白酶活性用AU(活性＝δOD·min-1·ml-1)表示。
C.角蛋白水解分析[465]在该分析系统中，使用的化学制品和试剂溶液是角蛋白ICN 902111洗涤剂洗涤剂组合物II将1.6g的洗涤剂溶解在1000ml水(pH＝8.2)中，加入0.6ml 10,000gpg的CaCl2/MgCl2以及1190mg HEPES，得到的硬度和缓冲剂强度分别为6gpg和5mM。用NaOH将pH调整到8.2。
三硝基苯磺酸(TNBS)Sigma P-2297(5％溶液，在水中)试剂A45.4g Na2B4O7·10H2O(Merck 6308)和15ml的4N NaOH一起溶解，最终体积为1000ml(如果需要通过加热完成)试剂B35.2g NaH2PO4·1H2O(Merck 6346)和0.6g Na2SO3(Merck 6657)一起溶解，最终体积为1000ml。
方法[466]温育之前，将角蛋白一次小份地在100μm筛上筛。然后，将在室温，将10g的＜100μm的角蛋白在洗涤剂溶液中搅拌至少20分钟，pH常规地调整为8.2。最后，将悬浮液在室温离心20分钟(Sorvall，GSA转子，13,000rpm)。然后重复该程序。最后，将湿的沉淀物悬浮在洗涤剂中，使总体积为200ml，吸移期间持续搅拌悬浮液。在温育之前，用Biohit多通道移液其和1200μl吸头，将微量滴定板(MTPs)每孔充以200μl底物(6次分配，每次200μl，并且要尽可能快地分配以避免角蛋白沉积在吸头中)。然后，将10μl的过滤过的培养物加入到含有底物的MTPs中。板用胶带覆盖，并放置在温育箱中，在20℃，以350rpm的转速温育3小时(Innova 4330[New Brunswick])。温育之后，以3000rpm将板离心3分钟(iSigma 6K 15离心机)。从温育箱移出第一个板之前约15分钟，通过将每50ml试剂A混合以1ml TNBS溶液，制备TNBS试剂。
MTPs每孔充以60μl TNBS试剂A。从温育的板，将10μl转移到含有TNBS试剂A的MTP。板用胶带覆盖，在室温中，以500rpm在桌式摇床(BMG Thermostar)中振荡20分钟。最后，将200μl的试剂B加入到孔中，在摇床上混合1分钟，并用MTP读数器测量在405nm的吸光度。
角蛋白水解活性的计算[468]获得的吸光度值用空白值校正(底物，无酶)。所得的吸光度提供了水解活性的量度。对每一样品(变体)，计算性能指数(performance index)。性能指数是将相同蛋白质浓度的变体的性能(实际值)和标准酶的性能(理论值)进行比较。此外，理论值可以被计算出，使用标准酶的Langmuir方程的参数。大于1的性能指数(PI)(PI＞1)表示较好的变体(与标准[例如野生型]相比)，等于1的PI(PI＝1)表示性能与标准相同的变体，小于1的PI(PI＜1)表示性能不如标准的变体。因此，PI可鉴定出优胜者，以及在某些环境中应用不理想的变体。
D.用于测试蛋白酶性能的微型样本分析(Microswatch Assay)[469]用于这些分析中的所有洗涤剂不含有酶。
洗涤剂制备物1.欧洲洗涤剂溶液[470]将Milli-Q水调节到15gpg硬度(Ca/Mg＝4/1)，加入7.6g/l ARIEL_Regular洗涤剂，并激烈搅拌洗涤剂溶液至少30分钟。在用于分析之前，将洗涤剂通过0.22μm过滤器过滤(例如Nalgene瓶顶式过滤器(top bottle filter))。
2.日本洗涤剂溶液[471]将Milli-Q水调节到3gpg硬度(Ca/Mg＝3/1)，加入0.66g/l洗涤剂组合物III，并激烈搅拌洗涤剂溶液至少30分钟。在用于分析之前，将洗涤剂通过0.22μm过滤器过滤(例如Nalgene瓶顶式过滤器)。
3.冷水液体洗涤剂(美国条件) 将Milli-Q水调节到6gpg硬度(Ca/Mg＝3/1)，加入1.60g/l TIDE_LVJ-1洗涤剂，并激烈搅拌洗涤剂溶液至少15分钟。加入5mM Hepes缓冲液并将pH设置为8.2。在用于分析之前，将洗涤剂通过0.22μm过滤器过滤(例如Nalgene瓶顶式过滤器)。
4.低pH液体洗涤剂(美国条件)[473]将Milli-Q水调节到6gpg硬度(Ca/Mg＝3/1)，加入1.60g/l洗涤剂组合物I，并激烈搅拌洗涤剂溶液至少15分钟。使用1N NaOH溶液，将pH设置为6.0。在用于分析之前，将洗涤剂通过0.22μm过滤器过滤(例如Nalgene瓶顶式过滤器)。
微型样本[474]定购1/4″圆直径的微型样本，由CFT Vlaardingen发送。使用下面描述的固定方法预处理微型样本。将单个的微型样本垂直置于96孔微量滴定板的每个孔中，以暴露整个表面积(即，不是平放在孔底上)。
漂白固定(Bleach Fixation)(″Superfixed″)[475]在含有10L水的10L不锈钢烧杯中，将水加热到60℃，以便固定用于欧洲条件中的样本(＝Superfixed)。对于日本条件和其他条件，样本在室温中(＝3K)被固定。然后，加入10ml的30％过氧化氢(1ml/L的H2O2，H2O2的最终浓度为300ppm)。然后，将100份样本(10份样本/L)加入到溶液中。溶液被放置30分钟，偶尔搅拌一下，并监测温度。用冷水将样本冲洗7-8次，置于试验台上直到干燥。将纸巾置于样本的顶部，这防止样本卷起。对于3K样本，重复该程序(不同的是水不加热，并且加入10倍数量的过氧化氢)。
可选择的固定(″3K″样本固定)[476]该特别的样本固定在室温中进行，然而加入的30％H2O2的数量为Superfixed样本固定中的加入量10倍。可以观察到气泡形成(起泡)，因此使用更大的烧杯来解决这个问题是必要的。首先，将8升的蒸馏水置于10L烧杯中，并加入80ml 30％的过氧化氢。用勺子将水和过氧化物充分混合。然后，在加入到溶液中之前，将40片EMPA 116样本展开成扇形(spread in to a fan)以确保形成一致的固定。将样本在溶液中搅动(使用勺子)30分钟，在头5分钟持续地搅动，在剩余的25分钟偶尔搅动。弃掉溶液，将样本冲洗6次，每次用约6升的蒸馏水。将样本置于纸巾上，直到干燥。用1/4″圆形模，在冲压机(expulsion press)上将空气干燥的样本冲孔。将单个的微型样本垂直置于96孔微量滴定板的每个孔中，以暴露整个表面积(即，不是平放在孔底部)。
酶样品针对各个地理条件，酶样品在合适的浓度被测试，用10mM NaCl、0.005％TWEEN_80溶液进行稀释。
测试方法[478]将温育箱设置在需要的温度对于冷水液体条件，20℃；对于低pH液体条件，30℃；对于欧洲条件，40℃；对于日本和北美条件，20℃。将预处理和预切割的样本置于96孔MTP的孔中，如上所述。如果需要的话，将酶样品用10mMNaCl，0.005％TWEEN_-80稀释为需要的浓度的20倍。期望的洗涤剂溶液依照上面描述地来制备。然后，将190μl的洗涤剂溶液加入到MTP的每一个孔中。对该混合物，将10μl的酶溶液加入到每个孔(使得总体积为200μL/孔)。用板密封物密封MTP，并置于温育箱中60分钟，以350rpm的速度摇动。在合适的条件下温育之后，从每一个孔移出100μl溶液，并置于新的MTP中。在405nm，用MTP读数器读取含有100μl溶液/孔的新MTP。也包括空白对照，以及含有微型样本和洗涤剂但是不含有酶的对照。
表1-1在微型样本(μSwatch)分析中的洗涤剂组合物和温育条件

**储液以15,000gpg的浓度使用储液#1＝Ca/Mg 3∶1(1.92M Ca2+＝282.3g/L CaCl2·2H2O；0.64M Mg2+＝30.1g/L MgCl2·6H2O)储液#2＝Ca/Mg 4∶1(2.05M Ca2+＝301.4g/L CaCl2·2H2O；0.51M Mg2+＝103.7g/L MgCl2·6H2OBMI性能计算[480]获得的吸光度值用空白值(在缺少酶的情况下温育微型样本后所获得的值)校正。所得的吸光度提供了水解活性的量度。对每一样品(变体)，计算性能指数。性能指数是将相同蛋白质浓度的变体的性能(实际值)和标准酶的性能(理论值)进行比较。此外，理论值可以被计算出，使用标准酶的Langmuir方程的参数。大于1的性能指数(PI)(PI＞1)表示较好的变体(与标准[例如野生型]相比)，等于1的PI(PI＝1)表示性能与标准相同的变体，小于1的PI(PI＜1)表示性能不如标准的变体。因此，PI可鉴定出优胜者，以及在某些环境中应用不理想的变体。
D.二甲基酪蛋白水解分析(96孔)[481]在该分析系统中，使用的化学制品和试剂溶液是二甲基酪蛋白(DMC) Sigma C-9801TWEEN_-80Sigma P-8074PIPES缓冲液(无酸) 将Sigma P-1851；15.1g溶解到约960ml水中；用4N NaOH将pH调整到7.0；加入1ml 5％TWEEN_-80，使体积达到1000ml。PIPES和TWEEN_-80的最终浓度分别为50mM和0.005％。
三硝基苯磺酸(TNBS)Sigma P-2297(5％溶液，在水中)试剂A45.4g Na2B4O7·10H2O(Merck 6308)和15ml的4N NaOH一起溶解，最终体积为1000ml(如果需要通过加热完成)试剂B35.2g NaH2PO4·1H2O(Merck 6346)和0.6g Na2SO3(Merck 6657)一起溶解，最终体积为1000ml。
方法[482]为了制备底物，将4g DMC溶解在400ml PIPES缓冲液中。将过滤的培养物上清液用PIPES缓冲液稀释；生长板中对照的最终浓度为20ppm。然后，将10μl的每一份上清液加入到MTP孔的200μl底物中。MTP板用胶带覆盖，振荡数秒，置于炉中，37℃，2小时，不搅动。
从炉移出第一个板之前约15分钟，通过将每50ml试剂A混合以1ml TNBS溶液，制备TNBS试剂。MTPs每孔充以60μl TNBS试剂A。温育过的板振荡数秒，之后，将10μl转移到含有TNBS试剂A的MTP。板用胶带覆盖，在室温中，以500rpm在台式摇床(BMG Thermostar)中振荡20分钟。最后，将200μl的试剂B加入到孔中，在摇床上混合1分钟，并用MTP读数器读取在405nm的吸光度。
二甲基酪蛋白水解活性的计算[484]获得的吸光度值用空白值校正(底物，无酶)。所得的吸光度提供了水解活性的量度。通过吸光度除以测定的蛋白质浓度，计算样品(随意定义的)比活性。
E.热稳定性分析[485]该方法是基于加热缓冲培养物上清液之前和之后的二甲基酪蛋白水解。使用与描述在二甲基酪蛋白水解分析相同的化学制品和试剂溶液。
方法[486]将过滤的培养物上清液用PIPES缓冲液稀释至20ppm(基于生长板中对照的浓度)。然后，将50μl的每一稀释上清液置于MTP的空孔中。在60℃和400rpm的条件下，将MTP板在iEMS培养箱/摇床HT(Thermo Labsystems)中温育90分钟。将板在冰上冷却5分钟。然后，将10μl的溶液加入到含200μl二甲基酪蛋白底物/孔的新MTP中。该MTP用胶带覆盖，振荡数秒，置于37℃炉中2小时，不搅动。使用与用于DMC水解分析相同的检测方法。
热稳定性计算[487]样品的残留活性表示为最终吸光度和最初吸光度的比值，两者都用空白校正。
F.LAS稳定性分析[488]在存在0.06％LAS(十二烷基苯磺酸钠)的条件下温育受测蛋白酶之后，测量LAS稳定性，使用AAPF分析测定残留活性。
试剂[489]十二烷基苯磺酸盐，钠盐(＝LAS)Sigma D-2525TWEEN_-80Sigma P-8074TRIS缓冲液(无酸)Sigma T-1378)；将6.35g溶解在约960ml水中；用4N HCl将pH调节到8.2。TRIS的最终浓度是52.5mM。
LAS储液制备在MQ水中的10.5％LAS溶液(＝10.5g/100ml MQ)Tris缓冲液-100mM/pH 8.6(100mM Tris/0.005％Tween80)TRIS-Ca缓冲液，pH 8.6(100mM Tris/10mM CaCl2/0.005％Tween80)硬件[490]平底MTPsCostar(#9017)Biomek FXASYS多次移液器(Multipipettor)Spectramax MTP读数器IEMS培养箱/摇床Innova 4330培养箱/摇床Biohit多通道移液器BMG Thermostar摇床(Shaker)方法用pH 8.2的52.5mM Tris缓冲液，制备10μl的0.063％LAS溶液。通过将1ml的100mg/ml AAPF储液(在DMSO中)加入到pH为8.6的100ml(100mM)Tris缓冲液，制备AAPF工作溶液。为了稀释上清液，使平底板充满稀释缓冲液，加入一份上清液并充分混合。稀释比率取决于在生长板中ASP对照的浓度(AAPF活性)。期望的蛋白质浓度是80ppm。
将10μl稀释的上清液加入到190μl 0.063％LAS缓冲液/孔。MTP用胶带覆盖，振荡数秒，在25℃下，置于培养箱(Innova 4230)中60分钟，以200rpm的速度摇动。在温育10分钟之后，通过将每一孔中10μl的混合物转移到含有190μlAAPF工作溶液的新MTP中，测定初始活性(t＝10分钟)。将这些溶液充分混合，使用MTP读数器测量AAPF活性(在5分钟内读数20次，在25℃)。
在温育60分钟之后，从温育板移去另外10μl的溶液，测定最终活性(t＝60分钟)。然后如上所述地那样测定AAPF活性。按照如下方法计算％残留活性为[t-60值]×100/[t-10值]。
G.搅拌蛋(scrambled egg)水解活性[494]蛋白酶从放入96孔微量滴定板的孔中加以烘烤的搅拌蛋中释放出不溶性颗粒。将搅拌蛋包覆的孔用含有蛋白酶的培养过滤物和ADW(自动洗碟洗涤剂)的混合物处理，以测定在除去搅拌蛋(scrambled egg removal)中的酶性能。浊度比是酶活性的量度。
材料[495]水浴携带机械空气循环的烘箱(Memmert ULE 400)振幅为0.25cm的培养箱/摇床(Multitron)，装备有MTP支架和铝盖和底Biomek FX液体处理系统(Beckman)微板读数器(Molecular Devices Spectramax 340，SOFTmax Pro Software)Nichiryo 8800多通道注射分配器+注射器微量滴定板胶带带有吸头的单和多通道移液管Grade Amedium蛋CaCl2·2H2O(Merck 102382)；MgCl2·6H2O(Merck105833)；Na2CO3(Merck 6392)ADW产品LH-粉末(＝Light House)程序[496]在玻璃烧杯中用叉子将3个蛋搅拌，并加入100ml牛奶(4℃或室温中)。将烧杯置于85℃水浴中，用匙持续搅拌混合物。当混合物变稠时，小心地不断地从烧杯壁和底刮擦凝固的物质。当混合物具有微微流动性时(约25分钟)，将烧杯从水浴中移去。将另外40ml的牛奶加入到混合物中，用手动混合器或搅拌器混合2分钟。将混合物冷却到室温(可以使用冰浴)。该底物然后用额外的5至15％水(通常7.5％)量进行搅拌。
测试方法[497]首先，将50μl的搅拌蛋底物分配人MTP的每个孔中。使板在室温中干燥过夜(约17小时)，在80℃烘箱中烘烤2小时，然后冷却至室温。
通过将2.85g的LH粉末溶解到1L水中，制备ADW产品溶液。仅需要约15分钟的溶解时间，无需过滤溶液。然后，加入1.16mL的人工硬度溶液，2120mgNa2CO3被溶解在溶液中。
通过在1L demi水中混合188.57g CaCl2·2H2O和86.92g MgCl2·6H2O(等于1.28M Ca+0.43M Mg，总共10000gpg)，制备硬度溶液。因为要将10μl上清液加入到190μl ADW溶液中的缘故，上述ADW、CaCl2和MgCl2的数量已经是成比例增加的值(200/190×)。
将ADW溶液(190μl)加入到底物板的每一个孔中。通过将10μl上清液加入到每一孔中，并用胶带密封该板，处理MTP。将板置于预加温的培养箱/摇床中，用金属盖和夹子固定。然后将板在合适的温度(对于美国，50℃)中，在700rpm，洗涤30分钟。将板从培养箱/摇床移去。随着轻轻地上下移动液体，将约125μl温热的上清液转移到空的平底板。冷却之后，将精确的100μl分散体分配入空的平底板的孔中。用微量滴定板读数器测定在405nm的吸光度。
计算搅拌蛋水解活性[501]获得的吸光度值用空白值校正(底物，无酶)。所得的吸光度为水解活性的量度。对每一样品(变体)，计算性能指数。性能指数是将相同蛋白质浓度的变体的性能(实际值)和标准酶的性能(理论值)进行比较。此外，理论值可以被计算出，使用标准酶的Langmuir方程的参数。大于1的性能指数(PI)(PI＞1)表示较好的变体(与标准[例如野生型]相比)，等于1的PI(PI＝1)表示性能与标准相同的变体，小于1的PI(PI＜1)表示性能不如标准的变体。因此，PI可鉴定出优胜者，以及在某些环境中应用不理想的变体。
实施例2由革兰氏阳性嗜碱性细菌69B4产生69B4蛋白酶[502]该实施例描述了用于最初分离本发明的新型蛋白酶69B4的纤维单胞菌属菌株69B4。在37℃，在含有下述物质(g L-1)的碱性酪蛋白培养基上，分离碱性微生物体纤维单胞菌属菌株69B4(DSM 16035)(参见例如Duckworth等，FEMS Microbiol.Ecol.，19181-191 )。
葡萄糖(Merck 1.08342)10蛋白胨(Difco 0118) 5酵母提取物(Difco 0127) 5K2HPO41MgSO4·7H2O 0.2NaCl 40Na2CO310酪蛋白 20琼脂 20[503]其他的碱性培养基(Grant Alkaliphile Medium)也被用来培养纤维单胞菌属菌株69B.4，如下提供[504]Grant Alkaliphile Medium(″GAM″)溶液A(g L-1)葡萄糖(Merck 1.08342)10蛋白胨(Difco 0118) 5酵母提取物(Difco 0127) 5K2HPO41MgSO4·7H2O 0.2被溶解于800ml蒸馏水中，并高压灭菌。
GAM溶液B(g L1)NaCl 40Na2CO310被溶解于200ml蒸馏水中，高压灭菌。
通过将溶液A(800ml)和溶液B(200ml)混合，制备完全GAM培养基。通过加入琼脂(2％w/v)，制备固体培养基。
生长条件[506]从新解冻的培养物甘油瓶(培养物在甘油(20％v/v，储液)中冷冻保存在-80℃)，用接种环将微生物接种在上述Grant Alkaliphile Medium(GAM)琼脂板上，在37℃生长至少2天。然后用一个菌落接种到含有pH 10的100ml GAM的500ml摇瓶。在37℃，以280rpm，将该摇瓶在旋转摇床上温育1-2天，直到获得良好的生长(根据视觉观察)。然后，100ml肉汤培养物被用于接种含有5升GAM的7L发酵罐。在37℃发酵2-3天，以获得最大的蛋白酶生产量。通过以5L/min的水平将空气注入叶轮区域，在整个发酵过程中维持充分的有氧条件，其中叶轮以约500rpm的速度旋转。在开始时，将pH设置在pH 10，但在发酵过程中不控制pH。
制备69B4粗酶样品[507]从发酵罐收集培养物肉汤，通过在5000×g，10℃，离心30分钟除去细胞。通过用Seitz EKS(SeitzSchenk Filtersystems)深度过滤，澄清所得的上清液。通过使用具有10kDa截留值的超滤盒(Pall Omega 10kDa Minisette；Pall)进行超滤，将所得的无菌培养上清液进一步浓缩约10倍。将所得的浓缩的粗69B4样品冷冻，保存在-20℃，直到再次使用。
纯化[508]使用8K分子量截留值的(Molecular Weight Cut Off，MWCO)Spectra-Por7(Spectrum)透析管，用20mM 2-(4-吗啉代)-乙磺酸(″MES″)，pH 5.4，1mM CaCl2透析细胞被分离的培养物肉汤。过夜进行透析，直到样品的传导率小于或等于MES缓冲液的传导率。使用带有10×100mm(7.845mL)POROS High DensitySulfo-propyl(HS)20(20微米)阳离子交换柱(PerSeptive Biosystems)的BioCadVISION(Applied Biosystems)，纯化透析过的酶样品。在以5mL/min将酶上样到之前平衡的柱上之后，柱用pH梯度以40mL/min洗涤，pH梯度为由25mM MES，pH6.2，1mM CaCl2至25mM(N-[2-羟乙基]哌嗪-N′-[2-乙烷]磺酸[C8H8N2O4S，CAS#7365-45-9])(″HEPES″)pH 8.0，1mM CaCl2，用量为25倍柱体积。级分(8mL)在该操作过程中被收集。pH 8.0洗涤步骤被维持，其用量为5倍柱体积，然后使用梯度(0-100mM NaCl，35倍柱体积，同样的缓冲液中)洗脱酶。使用pNA分析(sAAPF-pNA分析；DelMar等，如上)监测级分中的蛋白酶活性。在40mM NaCl时洗脱出的蛋白酶活性被浓缩，并且缓冲液交换(使用5K MWCO VIVA Science20mL浓缩器)为20mM MES，pH 5.8，1mMCaCl2。该材料被用于该酶的进一步表征。
实施例3丝氨酸蛋白酶基因片段的PCR扩增[509]在该实施例中，描述了丝氨酸蛋白酶基因片段的PCR扩增。
简并引物设计[510]基于公开的丝氨酸蛋白酶氨基酸序列的比对，针对保守的结构和催化区域，设计了一系列的简并引物。此类区域包括丝氨酸蛋白酶中高度保守的区域，以及已知对酶结构和功能重要的那些区域。
在开发本发明期间，对9个公开的丝氨酸蛋白酶(链霉蛋白酶C(StreptogrisinC)同源物)的蛋白质序列进行了比对，显示如下。所述序列是灰色链霉菌链霉蛋白酶C(登记号P52320)；来自褐色高温双岐菌的碱性丝氨酸蛋白酶前体(登记号AAC23545)；来自链霉菌属某种的碱性蛋白酶(登记号PC2053)(EC 3.4.21.-)；来自链霉菌属某种的碱性丝氨酸蛋白酶I(登记号S34672)；来自青紫链霉菌的丝氨酸蛋白酶(登记号CAD4208)；来自蓝色链霉菌A3(2)的推定的丝氨酸蛋白酶(登记号NP 625129)；来自阿维链霉菌MA-4680的推定的丝氨酸蛋白酶(登记号NP 822175)；来自青紫链霉菌的丝氨酸蛋白酶(登记号CAD42809)；来自蓝色链霉菌A3(2)的推定的丝氨酸蛋白酶前体(登记号NP 628830)。所有这些序列都可以通过公共渠道从GenBank获得。这些比对提供于下。在该比对中，两个保守盒用下划线标出并用粗体显示。
AAC23545 (1)--MNHSSR--RTTSLLFTAALAATALVAATTPAS----------------PC2053 (1)--MRHTGR-NAIGAAIAASALAFALVPSQAAAN------DTLTERAEAAVS34672 (1)--MRLKGRTVAIGSALAASALALSLVPANASSELP----SAETAKADALVCAD42808 (1)MVGRHAAR-SRRAALTALGALVLTALPSAASAAPPPVPGPRPAVARTPDANP_625129 (1)MVGRHAAR-SRRAALTALGALVLTALPSAASAAPPPVPGPRPAVARTPDANP_822175 (1)MVHRHVG--AGCAGLSVLATLVLTGLPAAAAIEPP-GPAPAPSAVQPLGACAD42809 (1)MPHRHRHH-RAVGAAVAATAALLVAGLSGSASAGTAPAGSAPTAAETLRTNP_628830 (1)MPHRHRHH-RAVGAAVAATAALLVAGLSGSASAGTAPAGSAPTAAETLRTP52320 (1)---MERTT-LRRRALVAGTATVAVGALALAGLTGVASADPAATAAPPVSA51 100AAC23545(31)-----AQELALKRDLGLSDAEVAELRAAEAEAVELEEELRDSLGSDFGGVPC2053(42)ADLPAGVLDAMERDLGLSEQEAGLKLVAEHDAALLGETLSADLDAFAGSWS34672(45)EQLPAGMVDAMERDLGVPAAEVGNQLVAEHEAAVLEESLSEDLSGYAGSWCAD42808(50)ATAPARMLSAMERDLRLAPGQAAARPVNEAEAGTRAGMLRNTLGDRFAGANP_625129(50)ATAPARMLSAMERDLRLAPGQAAARLVNEAEAGTRAGMLRNTLGDRFAGANP_822175(48)GNPSTAVLGALQRDLHLTDTQAKTRLVNEMEAGTRAGRLQNALGKHFAGACAD42809(50)DAAPPALLKAMQRDLGIDRRQAERRLVNEAEAGATAGRLRAALGGDFAGANP_628830(50)DAAPPALLKAMQRDLGLDRRQAERRLVNEAEAGATAGRLRAALGGDFAGAP52320(47)DSLSPGMLAALERDLGLDEDAARSRIANEYRAAAVAAGLEKSLGARYAGA101150AAC23545(76)YLDADT-TEITVAVTDPAAVSRVDADDVTVDVVDFGETALNDFVASLNAIPC2053(92)LAEGT---ELVVATTSEAEAAEITEAGATAEVVDHTLAELDSVKDALDTA
S34672 (95)IVEGTS--EHVVATTDRAEAAEITAAGATATVVEHSLAELEAVKDILDEACAD42808 (100)WVSGATSAELTVATTDAADTAAIEAQGAKAAVVGRNLAELRAVKEKLDAANP_625129 (100)WVSGATSAELTVATTDAADTAAIEAQGAKAAVVGRNLAELRAVKEKLDAANP_822175 (98)WVHGAASADLTVATTHATDIPAITAGGATAVVVKTGLDDLKGAKKKLDSACAD42809 (100)WVRGAESGTLTVATTDAGDVAAVEARGAEAKVVRHSLADLDAAKARLDTANP_628830 (100)WVRGAESGTLTVATTDAGDVAAIEARGAEAKVVRHSLADLDAAKARLDTAP52320 (97)RVSGAK-ATLTVATTDASEAARITEAGARAEVVGHSLDRFEGVKKSLDKA151200AAC23545 (125)ADT--ADPKVTGWYTDLESDAVVITTLRGGTPAAEELAERAGLDERAVRIPC2053 (139)AES-YDTTDAPVWYVDVTTNGVVLLTSD--VTEAEGFVEAAGVNAAAVDIS34672 (143)ATA-NPEDAAPVWYVDVTTNEVVVLASD--VPAAEAFVAASGADASTVRVCAD42808 (150)AVR-TRTRQTPVWYVDVKTNRVTVQATG--ASAAAAFVEAAGVPAADVGVNP_625129 (150)AVR-TRTRQTPVWYVDVKTNRVTVQATG--ASAAAAFVEAAGVPAADVGVNP_822175 (148)VAHGGTAVNTPVRYVDVRTNRVTLQARS--RAAADALIAAAGVDSGLVDVCAD42809 (150)AAG-LNTADAPVWYVDTRTNTVVVEAIR--PAAARSLLTAAGVDGSLAHVNP_628830 (150)AAG-LNTADAPVWYVDTRTNTVVVEAIR--PAAARSLLTAAGVDGSLAHVP52320 (146)ALD-KAPKNVPVWYVDVAANRVVVNAAS--PAAGQAFLKVAGVDRGLVTV201250AAC23545 (173)VEEDEEPQSLAAIIGGNPYYFGN-YRCSIGFSVRQGSQTGFATAGHCGSTPC2053 (186)QTSDEQPQAFYDLVGGDAYYMGG-GRCSVGFSVTQGSTPGFATAGHCGTVS34672 (190)ERSDESPQPFYDLVGGDAYYIGN-GRCSIGFSVRQGSTPGFVTAGHCGSVCAD42808 (197)RVSPDQPRVLEDLVGGDAYYIDDQARCSIGFSVTKDDQEGFATAGHCGDPNP_625129 (197)RVSPDQPRVLEDLVGGDAYYIDDQARCSIGFSVTKDDQEGFATAGHCGDPNP_822175 (196)KVSEDRPRALFDIRGGDAYYIDNTARCSVGFSVTKGNQQGFATAGHCGRACAD42809 (197)KNRTERPRTFYDLRGGEAYYINNSSRCSIGFPITKGTQQGFATAGHCDRANP_628830 (197)KNRTERPRTFYDLRGGEAYYINNSSRCSIGFPITKGTQQGFATAGHCGRAP52320 (193)ARSAEQPRALADIRGGDAYYMNGSGRCSVGFSVTRGTQNGFATAGHCGRV251 300AAC23545 (222)GTRVS----SPSGTVAGSYFPGRDMGWVRITSADTVTPLVNRYNGGTVTVPC2053 (235)GTSTTGYNQAAQGTFEESSFPGDDMAWVSVNSDWNTTPTVNE--GE-VTVS34672 (239)GNATTGFNRVSQGTFRGSWFPGRDMAWVAVNSNWTPTSLVRNS-GSGVRVCAD42808 (247)GATTTGYNEADQGTFQASTFPGKDMAWVGVNSDWTATPDVKAEGGEKIQLNP_625129 (247)GATTTGYNEADQGTFQASTFPGKDMAWVGVNSDWTATPDVKAEGGEKIQLNP_822175 (246)GAPTAGFNEVAQGTVQASVFPGHDMAWVGVNSDWTATPDVAGAAGQNVSICAD42809 (247)GSSTTGANRVAQGTFQGSIFPGRDMAWVATNSSWTATPYVLGAGGQNVQVNP_628830 (247)GSSTTGANRVAQGTFQGSIFPGRDMAWVATNSSWTATPYVLGAGGQNVQVP52320 (243)GTTTNGVNQQAQGTFQGSTFPGRDIAWVATNANWTPRPLVNGYGRGDVTV301350AAC23545 (268)TGSQEAATGSSVCRSGATTGWRCGTIQSKNQTVRYAEGTVTGLTRTTACAPC2053 (282)SGSTEAAVGASICRSGSTTGWHCGTIQQHNTSVTYPEGTITGVTRTSVCAS34672 (288)TGSTQATVGSSICRSGSTTGWRCGTIQQHNTSVTYPQGTITGVTRTSACACAD42808 (297)AGSVEALVGASVCRSGSTTGWHCGTIQQHDTSVTYPEGTVDGLTGTTVCANP_625129 (297)AGSVEALVGASVCRSGSTTGWHCGTIQQHDTSVTYPEGTVDGLTETTVCANP_822175 (296)AGSVQAIVGAAICRSGSTTGWHCGTVEEHDTSVTYEEGTVDGLTRTTVCACAD42809 (297)TGSTASPVGASVCRSGSTTGWHCGTVTQLNTSVTYQEGTISPVTRTTVCANP_628830 (297)TGSTASPVGASVCRSGSTTGWHCGTVTQLNTSVTYQEGTISPVTRTTVCAP52320 (293)AGSTASVVGASVCRSGSTTGWHCGTIQQLNTSVTYPEGTISGVTRTSVCA351 400AAC23545 (318)EGGDSGGPWLTGSQAQGVTSGGTGDCRSGGITFFQPINPLLSYFGLQLVTPC2053 (332)EPGDSGGSYISGSQAQGVTSGGSGNCTSGGTTYHQPINPLLSAYGLDLVTS34672 (338)QPGDSGGSFISGTQAQGVTSGGSGNCSIGGTTFHQPVNPILSQYGLTLVRCAD42808 (347)EPGDSGGPFVSGVQAQGTTSGGSGDCTNGGTTFYQPVNPLLSDFGLTLKTNP_625129 (347)EPGDSGGPFVSGVQAQGTTSGGSGDCTNGGTTFYQPVNPLLSDFGLTLKTNP_822175 (346)EPGDSGGSFVSGSQAQGVTSGGSGDCTRGGTTYYQPVNPILSTYGLTLKTCAD42809 (347)EPGDSGGSFISGSQAQGVTSGGSGDCRTGGGTFFQPINALLQNYGLTLKTNP_628830 (347)EPGDSGGSFISGSQAQGVTSGGSGDCRTGGETFFQPINALLQNYGLTLKTP52320 (343)EPGDSGGSYISGSQAQGVTSGGSGNCSSGGTTYFQPINPLLQAYGLTLVT401 450AAC23545 (368)G-------------------------------------------------PC2053 (382)G-------------------------------------------------S34672 (388)S-------------------------------------------------CAD42808 (397)TSAATQTPAPQDNAAA------DAWTAGRVYEVGTTVSYDGVRYRCLQSHNP_625129 (397)TSAATQTPAPQDNAAA------DAWTAGRVYEVGTTVSYDGVRYRCLQSHNP_822175 (396)STAPTDTPSDPVDQSG-------VWAAGRVYEVGAQVTYAGVTYQCLQSHCAD42809 (397)TGGDDGGGDDGG-----EEPGG-TWAAGTVYQPGDTVTYGGATFRCLQGHNP_628830 (397)TGGDDGGGDDGGGDDGGEEPGG-TWAAGTVYQPGDTVTYGGATFRCLQGHP52320 (393)SGGGTPTDPPTTPPTDSP---GGTWAVGTAYAAGATVTYGGATYRCLQAH451468AAC23545 (369)------------------ (SEQ ID NO648)PC2053 (383)------------------ (SEQ ID NO649)
S34672 (389)------------------ (SEQ ID NO650)CAD42808 (441)QAQGVGSPASVPALWQRV (SEQ ID NO651)NP_625129 (441)QAQGVGSPASVPALWQRV (SEQ ID NO652)NP_822175 (439)QAQGVWQPAATPALWQRL (SEQ ID NO653)CAD42809 (441)QAYAGWEPPNVPALWQRV (SEQ ID NO654)NP_628830 (446)QAYAGWEPPNVPALWQRV (SEQ ID NO655)P52320 (440)TAQPGWTPADVPALWQRV (SEQ ID NO656)[512]选择两个特别的区域以满足上面的标准，基于这些氨基酸区域设计正向引物和反向引物。用于设计引物的具体的氨基酸区域在序列中用粗体突出显示，直接显示于上面的比对中。使用密码子使用中的遗传密码，通过MWG-Biotech，合成简并核苷酸PCR引物。产生的简并引物序列是正向引物TTGWXCGT_FW5′ACNACSGGSTGGCRGTGCGGCAC 3′(SEQ IDNO10)反向引物GDSGGX_RV5′-ANGNGCCGCCGGAGTCNCC-3′(SEQ ID NO11)[513]所有引物以5′-3′方向合成，对于混合碱基位点使用标准IUB码(例如，对于A/C/T/G，命名为″N″)。通过PCR，简并引物TTGWXCGT_FW和GDSGGX_RV从纤维单胞菌属某种分离株69B4成功地扩增了177bp区域，如下描述。
丝氨酸蛋白酶基因片段的PCR扩增[514]纤维单胞菌属某种分离株69B4基因组DNA被用作推定的丝氨酸蛋白酶基因片段PCR扩增的模板，该PCR扩增使用上述引物。使用High Fidelity PlatinumTaq聚合酶(目录编号11304-102；Invitrogen)，进行PCR。条件依各个试验而确定，但是通常在热循环仪中(MJ Research)运行30个循环。通过在1％琼脂糖TBE胶上对PCR反应进行电泳，检验成功的扩增。用引物TTGWXCGT_FW和GDSGGX_RV从纤维单胞菌属某种69B4扩增得到的PCR产物，根据制造商的说明，使用Qiaquick Spin Gel Extraction试剂盒(目录28704；Qiagen)，通过凝胶提取进行纯化。根据制造商的说明，将纯化的PCR产物克隆入商业获得的pCR2.1TOPO载体系统(Invitrogen)，并转化入感受态大肠杆菌TOP10细胞。使用蓝/白选择可以观察含有重组质粒的菌落。为了快速筛选重组转化子，由推断的阳性(即白色)菌落的培养物，制备质粒DNA。使用Qiagen质粒纯化试剂盒，分离DNA，并通过Baseclear进行测序。其中一个克隆含有177bp的DNA插入片段，该片段与各种链霉菌菌种的数种链霉蛋白酶样蛋白酶基因具有一定的同源性，也与来自其他细菌种的丝氨酸蛋白酶基因具有同源性。该177bp片段的DNA和蛋白质编码序列提供于图13中。
序列分析[515]通过BLAST和其他蛋白质翻译序列工具，分析序列。在核苷酸水平上进行的BLAST比较显示与公开的丝氨酸蛋白酶序列具有各种水平的同一性。开始时，对核苷酸序列进行BLAST(Basic BLAST版本2.0)。选择的程序是″BlastX″，选择的数据库是″nr.″。利用标准/默认参数值。将推断的纤维单胞菌69B4蛋白酶基因片段的序列数据以FASTA格式输入，向BLAST提交查询请求，以将本发明的序列与那些已经存在于数据库中的序列进行比较。返回给该177bp片段的结果是来自各种链霉属某些种的蛋白酶基因的命中(hits)，所述各种链霉属某些种包括灰色链霉菌、青紫链霉菌、蓝色链霉菌、白浅灰链霉菌(S.albogriseolus)、普拉特链霉菌(S.platensis)、弗氏链霉菌(S.fradiae)和链霉菌属某种。结论是，期望对克隆自纤维单胞菌属某种分离株69B4的177bp片段作进一步分析。
实施例4通过反向PCR由纤维单胞菌69B4的基因组分离编码丝氨酸蛋白酶的多核苷酸序列[516]在该实施例中，描述了分离编码由纤维单胞菌属某种69B4产生的丝氨酸蛋白酶的多核苷酸序列的实验。
对纤维单胞菌属某种69B4基因组DNA进行反向PCR，以分离编码纤维单胞菌属菌株69B4蛋白酶的基因[517]反向PCR被用于从纤维单胞菌属某种69B4分离和克隆全长丝氨酸蛋白酶基因。基于实施例3中描述的纤维单胞菌蛋白酶基因的177bp片段的DNA序列，设计新的DNA引物69B4int_RV 15′-CGGGGTAGGTGACCGAGGAGTTGAGCGCAGTG-3′(SEQ IDNO14)69B4int_FW2 5′-GCTCGCCGGCAACCAGGCCCAGGGCGTCACGTC-3′(SEQ IDNO15)[518]用限制性酶ApaI、BamHI、BssHII、KpnI、NarI、NcoI、NheI、PvuI、SalI或SstII消化纤维单胞菌属某种69B4的染色体DNA，使用Qiagen PCR纯化试剂盒(Qiagen，Catalogue#28106)进行纯化，用T4 DNA连接酶(Invitrogen)进行自连接，这些根据制造商的说明书进行。连接混合物用Qiagen PCR纯化试剂盒纯化，PCR用引物69B4int_RV1和69B4int_FW2进行。对用NcoI消化然后自连接的DNA片段进行PCR，产生约1.3kb的PCR产物。DNA序列分析(BaseClear)显示，该DNA片段涵盖了来自纤维单胞菌的链霉蛋白酶样蛋白酶基因的主要部分。该蛋白酶命名为″69B4蛋白酶″，编码纤维单胞菌69B4蛋白酶的基因命名为″asp基因″。asp基因的全序列来自另外的反向PCR反应，其中使用引物69B40int_FW2和另一引物69B4-for4(5′AAC GGC GGG TTC ATC ACC GCC GGC CAC TGC GGC C 3′(SEQ ID NO16)。对纤维单胞菌属某种69B4基因组DNA的用NcoI、BssHII、ApaI和PvuI消化并自连接的DNA片段，用这些引物进行反向PCR，由此鉴定了asp基因全序列。
核苷酸和氨基酸序列[519]为了方便起见，各序列被包括在下面。首先，下面提供的asp基因的DNA序列(SEQ ID NO1)编码信号肽(SEQ ID NO9)和丝氨酸蛋白酶前体(SEQ IDNO7)，它们来自纤维单胞菌属菌株69B4(DSM 16035)。编码纤维单胞菌属菌株69B4蛋白酶的信号肽的起始多核苷酸用粗体表示(ATG)。
1 GCGCGCTGCG CCCACGACGA CGCCGTCCGC CGTTCGCCGG CGTACCTGCGTTGGCTCACCCGCGCGACGC GGGTGCTGCT GCGGCAGGCG GCAAGCGGCC GCATGGACGCAACCGAGTGG61 ACCCACCAGA TCGACCTCCA TAACGAGGCC GTATGACCAG AAAGGGATCTGCCACCGCCCTGGGTGGTCT AGCTGGAGGT ATTGCTCCGG CATACTGGTC TTTCCCTAGACGGTGGCGGG121 ACCAGCACGC TCCTAACCTC CGAGCACCGG CGACCGCCGG GTGCGATGAAAGGGACGAACTGGTCGTGCG AGGATTGGAG GCTCGTGGCC GCTGGCGGCC CACGCTACTTTCCCTGCTTG181 CGAGATGACA CCACGCACAG TCACGCGGGC CCTGGCCGTG GCCACCGCAGCCGCCACACTGCTCTACTGT GGTGCGTGTC AGTGCGCCCG GGACCGGCAC CGGTGGCGTCGGCGGTGTGA241 CCTGGCAGGC GGCATGGCCG CCCAGGCCAA CGAGCCCGCA CCACCCGGGAGCGCGAGCGCGGACCGTCCG CCGTACCGGC GGGTCCGGTT GCTCGGGCGT GGTGGGCCCTCGCGCTCGCG301 ACCGCCACGC CTGGCCGAGA AGCTCGACCC CGACCTCCTC GAGGCCATGGAGCGCGACCTTGGCGGTGCG GACCGGCTCT TCGAGCTGGG GCTGGAGGAG CTCCGGTACCTCGCGCTGGA361 GGGCCTCGAC GCGGAGGAAG CCGCCGCCAC CCTGGCGTTC CAGCACGACGCAGCCGAGACCCCGGAGCTG CGCCTCCTTC GGCGGCGGTG GGACCGCAAG GTCGTGCTGCGTCGGCTCTG
421CGGCGAGGCC CTCGCCGAAG AGCTCGACGA GGACTTCGCC GGCACCTGGG TCGAGGACGAGCCGCTCCGG GAGCGGCTTC TCGAGCTGCT CCTGAAGCGG CCGTGGACCC AGCTCCTGCT481CGTCCTGTAC GTCGCCACCA CCGACGAGGA CGCCGTCGAG GAGGTCGAGG GCGAAGGCGCGCAGGACATG CAGCGGTGGT GGCTGCTCCT GCGGCAGCTC CTCCAGCTCC CGCTTCCGCG541CACGGCCGTC ACCGTCGAGC ACTCCCTGGC CGACCTCGAG GCCTGGAAGA CCGTCCTCGAGTGCCGGCAG TGGCAGCTCG TGAGGGACCG GCTGGAGCTC CGGACCTTCT GGCAGGAGCT601CGCCGCCCTC GAGGGCCACG ACGACGTGCC CACCTGGTAC GTCGACGTCC CGACCAACAGGCGGCGGGAG CTCCCGGTGC TGCTGCACGG GTGGACCATG CAGCTGCAGG GCTGGTTGTC661CGTCGTCGTC GCCGTCAAGG CCGGAGCCCA GGACGTCGCC GCCGGCCTCG TCGAAGGTGCGCAGCAGCAG CGGCAGTTCC GGCCTCGGGT CCTGCAGCGG CGGCCGGAGC AGCTTCCACG721CGACGTCCCG TCCGACGCCG TGACCTTCGT CGAGACCGAC GAGACCCCGC GGACCATGTTGCTGCAGGGC AGGCTGCGGC ACTGGAAGCA GCTCTGGCTG CTCTGGGGCG CCTGGTACAA781CGACGTGATC GGCGGCAACG CCTACACCAT CGGGGGGCGC AGCCGCTGCT CGATCGGGTTGCTGCACTAG CCGCCGTTGC GGATGTGGTA GCCCCCCGCG TCGGCGACGA GCTAGCCCAA841CGCGGTCAAC GGCGGGTTCA TCACCGCCGG CCACTGCGGC CGCACCGGCG CCACCACCGCGCGCCAGTTG CCGCCCAAGT AGTGGCGGCC GGTGACGCCG GCGTGGCCGC GGTGGTGGCG901CAACCCCACC GGGACCTTCG CCGGGTCCAG CTTCCCGGGC AACGACTACG CGTTCGTCCGGTTGGGGTGG CCCTGGAAGC GGCCCAGGTC GAAGGGCCCG TTGCTGATGC GCAAGCAGGC961TACCGGGGCC GGCGTGAACC TGCTGGCCCA GGTCAACAAC TACTCCGGTG GCCGCGTCCAATGGCCCCGG CCGCACTTGG ACGACCGGGT CCAGTTGTTG ATGAGGCCAC CGGCGCAGGT1021GGTCGCCGGG CACACCGCGG CCCCCGTCGG CTCGGCCGTG TGCCGGTCCG GGTCGACCACCCAGCGGCCC GTGTGGCGCC GGGGGCAGCC GAGCCGGCAC ACGGCCAGGC CCAGCTGGTG1081CGGGTGGCAC TGCGGCACCA TCACTGCGCT CAACTCCTCG GTCACCTACC CCGAGGGCACGCCCACCGTG ACGCCGTGGT AGTGACGCGA GTTGAGGAGC CAGTGGATGG GGCTCCCGTG1141CGTCCGCGGC CTGATCCGCA CCACCGTCTG CGCCGAGCCC GGCGACTCCG GTGGCTCGCTGCAGGCGCCG GACTAGGCGT GGTGGCAGAC GCGGCTCGGG CCGCTGAGGC CACCGAGCGA1201GCTCGCCGGC AACCAGGCCC AGGGCGTCAC GTCCGGCGGC TCCGGCAACT GCCGCACCGGCGAGCGGCCG TTGGTCCGGG TCCCGCAGTG CAGGCCGCCG AGGCCGTTGA CGGCGTGGCC1261TGGCACCACG TTCTTCCAGC CGGTCAACCC CATCCTCCAG GCGTACGGCC TGAGGATGATACCGTGGTGC AAGAAGGTCG GCCAGTTGGG GTAGGAGGTC CGCATGCCGG ACTCCTACTA1321CACCACGGAC TCGGGCAGCA GCCCGGCCCC TGCACCGACC TCCTGCACCG GCTACGCCCGGTGGTGCCTG AGCCCGTCGT CGGGCCGGGG ACGTGGCTGG AGGACGTGGC CGATGCGGGC1381CACCTTCACC GGGACCCTCG CGGCCGGCCG GGCCGCCGCC CAGCCCAACG GGTCCTACGTGTGGAAGTGG CCCTGGGAGC GCCGGCCGGC CCGGCGGCGG GTCGGGTTGC CCAGGATGCA1441GCAGGTCAAC CGGTCCGGGA CCCACAGCGT GTGCCTCAAC GGGCCCTCCG GTGCGGACTTCGTCCAGTTG GCCAGGCCCT GGGTGTCGCA CACGGAGTTG CCCGGGAGGC CACGCCTGAA1501CGACCTCTAC GTGCAGCGCT GGAACGGCAG CTCCTGGGTG ACCGTCGCCC AGAGCACCTCGCTGGAGATG CACGTCGCGA CCTTGCCGTC GAGGACCCAC TGGCAGCGGG TCTCGTGGAG1561CCCCGGCTCC AACGAGACCA TCACCTACCG CGGCAACGCC GGCTACTACC GCTACGTGGTGGGGCCGAGG TTGCTCTGGT AGTGGATGGC GCCGTTGCGG CCGATGATGG CGATGCACCA1621CAACGCCGCG TCCGGCTCCG GTGCCTACAC CATGGGGCTC ACCCTCCCCT GACGTAGCGCGTTGCGGCGC AGGCCGAGGC CACGGATGTG GTACCCCGAG TGGGAGGGGA CTGCATCGCG (SEQ ID NO1) 下面的DNA序列(SEQ ID NO2)编码信号肽(SEQ ID NO9)，其可操作地连接到蛋白酶前体(SEQ ID NO7)，它们来自纤维单胞菌属菌株69B4(DSM 16035)。编码纤维单胞菌属菌株69B4蛋白酶的信号肽的起始多核苷酸用粗体表示(ATG)。星号表示终止密码子(TGA)，从残基1486开始。残基85、595和1162分别表示N端原序列(N terminal prosequence)、成熟序列和羧基端序列原序列(carboxylterminal prosequence)的起始残基，用粗体和下划线示出。
1ATGACACCAC GCACAGTCAC GCGGGCCCTG GCCGTGGCCA CCGCAGCCGC CACACTCCTGTACTGTGGTG CGTGTCAGTG CGCCCGGGAC CGGCACCGGT GGCGTCGGCG GTGTGAGGAC.8561GCAGGCGGCA TGGCCGCCCA GGCCAACGAG CCCGCACCAC CCGGGAGCGC GAGCGCACCGCGTCCGCCGT ACCGGCGGGT CCGGTTGCTC GGGCGTGGTG GGCCCTCGCG CTCGCGTGGC121CCACGCCTGG CCGAGAAGCT CGACCCCGAC CTCCTCGAGG CCATGGAGCG CGACCTGGGCGGTGCGGACC GGCTCTTCGA GCTGGGGCTG GAGGAGCTCC GGTACCTCGC GCTGGACCCG181CTCGACGCGG AGGAAGCCGC CGCCACCCTG GCGTTCCAGC ACGACGCAGC CGAGACCGGCGAGCTGCGCC TCCTTCGGCG GCGGTGGGAC CGCAAGGTCG TGCTGCGTCG GCTCTGGCCG241GAGGCCCTCG CCGAAGAGCT CGACGAGGAC TTCGCCGGCA CCTGGGTCGA GGACGACGTCCTCCGGGAGC GGCTTCTCGA GCTGCTCCTG AAGCGGCCGT GGACCCAGCT CCTGCTGCAG301CTGTACGTCG CCACCACCGA CGAGGACGCC GTCGAGGAGG TCGAGGGCGA AGGCGCCACGGACATGCAGC GGTGGTGGCT GCTCCTGCGG CAGCTCCTCC AGCTCCCGCT TCCGCGGTGC361GCCGTCACCG TCGAGCACTC CCTGGCCGAC CTCGAGGCCT GGAAGACCGT CCTCGACGCCCGGCAGTGGC AGCTCGTGAG GGACCGGCTG GAGCTCCGGA CCTTCTGGCA GGAGCTGCGG421GCCCTCGAGG GCCACGACGA CGTGCCCACC TGGTACGTCG ACGTCCCGAC CAACAGCGTCCGGGAGCTCC CGGTGCTGCT GCACGGGTGG ACCATGCAGC TGCAGGGCTG GTTGTCGCAG481GTCGTCGCCG TCAAGGCCGG AGCCCAGGAC GTCGCCGCCG GCCTCGTCGA AGGTGCCGACCAGCAGCGGC AGTTCCGGCC TCGGGTCCTG CAGCGGCGGC CGGAGCAGCT TCCACGGCTG
595541 GTCCCGTCCG ACGCCGTGAC CTTCGTCGAG ACCGACGAGA CCCCGCGGAC CATGTTCGACCAGGGCAGGC TGCGGCACTG GAAGCAGCTC TGGCTGCTCT GGGGCGCCTG GTACAAGCTG601 GTGATCGGCG GCAACGCCTA CACCATCGGG GGGCGCAGCC GCTGCTCGAT CGGGTTCGCGCACTAGCCGC CGTTGCGGAT GTGGTAGCCC CCCGCGTCGG CGACGAGCTA GCCCAAGCGC661 GTCAACGGCG GGTTCATCAC CGCCGGCCAC TGCGGCCGCA CCGGCGCCAC CACCGCCAACCAGTTGCCGC CCAAGTAGTG GCGGCCGGTG ACGCCGGCGT GGCCGCGGTG GTGGCGGTTG721 CCCACCGGGA CCTTCGCCGG GTCCAGCTTC CCGGGCAACG ACTACGCGTT CGTCCGTACCGGGTGGCCCT GGAAGCGGCC CAGGTCGAAG GGCCCGTTGC TGATGCGCAA GCAGGCATGG781 GGGGCCGGCG TGAACCTGCT GGCCCAGGTC AACAACTACT CCGGTGGCCG CGTCCAGGTCCCCCGGCCGC ACTTGGACGA CCGGGTCCAG TTGTTGATGA GGCCACCGGC GCAGGTCCAG841 GCCGGGCACA CCGCGGCCCC CGTCGGCTCG GCCGTGTGCC GGTCCGGGTC GACCACCGGGCGGCCCGTGT GGCGCCGGGG GCAGCCGAGC CGGCACACGG CCAGGCCCAG CTGGTGGCCC0901 TGGCACTGCG GCACCATCAC TGCGCTCAAC TCCTCGGTCA CCTACCCCGA GGGCACCGTCACCGTGACGC CGTGGTAGTG ACGCGAGTTG AGGAGCCAGT GGATGGGGCT CCCGTGGCAG0961 CGCGGCCTGA TCCGCACCAC CGTCTGCGCC GAGCCCGGCG ACTCCGGTGG CTCGCTGCTCGCGCCGGACT AGGCGTGGTG GCAGACGCGG CTCGGGCCGC TGAGGCCACC GAGCGACGAG1021 GCCGGCAACC AGGCCCAGGG CGTCACGTCC GGCGGCTCCG GCAACTGCCG CACCGGTGGCCGGCCGTTGG TCCGGGTCCC GCAGTGCAGG CCGCCGAGGC CGTTGACGGC GTGGCCACCG1081 ACCACGTTCT TCCAGCCGGT CAACCCCATC CTCCAGGCGT ACGGCCTGAG GATGATCACCTGGTGCAAGA AGGTCGGCCA GTTGGGGTAG GAGGTCCGCA TGCCGGACTC CTACTAGTGG11621141 ACGGACTCGG GCAGCAGCCC GGCCCCTGCA CCGACCTCCT GCACCGGCTA CGCCCGCACCTGCCTGAGCC CGTCGTCGGG CCGGGGACGT GGCTGGAGGA CGTGGCCGAT GCGGGCGTGG1201 TTCACCGGGA CCCTCGCGGC CGGCCGGGCC GCCGCCCAGC CCAACGGGTC CTACGTGCAGAAGTGGCCCT GGGAGCGCCG GCCGGCCCGG CGGCGGGTCG GGTTGCCCAG GATGCACGTC1261 GTCAACCGGT CCGGGACCCA CAGCGTGTGC CTCAACGGGC CCTCCGGTGC GGACTTCGACCAGTTGGCCA GGCCCTGGGT GTCGCACACG GAGTTGCCCG GGAGGCCACG CCTGAAGCTG1321 CTCTACGTGC AGCGCTGGAA CGGCAGCTCC TGGGTGACCG TCGCCCAGAG CACCTCCCCCGAGATGCACG TCGCGACCTT GCCGTCGAGG ACCCACTGGC AGCGGGTCTC GTGGAGGGGG1381 GGCTCCAACG AGACCATCAC CTACCGCGGC AACGCCGGCT ACTACCGCTA CGTGGTCAACCCGAGGTTGC TCTGGTAGTG GATGGCGCCG TTGCGGCCGA TGATGGCGAT GCACCAGTTG1486*1441 GCCGCGTCCG GCTCCGGTGC CTACACCATG GGGCTCACCC TCCCCTGA(SEQ ID NO2)CGGCGCAGGC CGAGGCCACG GATGTGGTAC CCCGAGTGGG AGGGGACT 下面的DNA序列(SEQ ID NO3)编码源自纤维单胞菌属菌株69B4(DSM16035)的前体蛋白酶。
1 AACGAGCCCG CACCACCCGG GAGCGCGAGC GCACCGCCAC GCCTGGCCGA GAAGCTCGACTTGCTCGGGC GTGGTGGGCC CTCGCGCTCG CGTGGCGGTG CGGACCGGCT CTTCGAGCTG61 CCCGACCTCC TCGAGGCCAT GGAGCGCGAC CTGGGCCTCG ACGCGGAGGA AGCCGCCGCCGGGCTGGAGG AGCTCCGGTA CCTCGCGCTG GACCCGGAGC TGCGCCTCCT TCGGCGGCGG121 ACCCTGGCGT TCCAGCACGA CGCAGCCGAG ACCGGCGAGG CCCTCGCCGA AGAGCTCGACTGGGACCGCA AGGTCGTGCT GCGTCGGCTC TGGCCGCTCC GGGAGCGGCT TCTCGAGCTG181 GAGGACTTCG CCGGCACCTG GGTCGAGGAC GACGTCCTGT ACGTCGCCAC CACCGACGAGCTCCTGAAGC GGCCGTGGAC CCAGCTCCTG CTGCAGGACA TGCAGCGGTG GTGGCTGCTC241 GACGCCGTCG AGGAGGTCGA GGGCGAAGGC GCCACGGCCG TCACCGTCGA GCACTCCCTGCTGCGGCAGC TCCTCCAGCT CCCGCTTCCG CGGTGCCGGC AGTGGCAGCT CGTGAGGGAC301 GCCGACCTCG AGGCCTGGAA GACCGTCCTC GACGCCGCCC TCGAGGGCCA CGACGACGTGCGGCTGGAGC TCCGGACCTT CTGGCAGGAG CTGCGGCGGG AGCTCCCGGT GCTGCTGCAC361 CCCACCTGGT ACGTCGACGT CCCGACCAAC AGCGTCGTCG TCGCCGTCAA GGCCGGAGCCGGGTGGACCA TGCAGCTGCA GGGCTGGTTG TCGCAGCAGC AGCGGCAGTT CCGGCCTCGG421 CAGGACGTCG CCGCCGGCCT CGTCGAAGGT GCCGACGTCC CGTCCGACGC CGTGACCTTCGTCCTGCAGC GGCGGCCGGA GCAGCTTCCA CGGCTGCAGG GCAGGCTGCG GCACTGGAAG481 GTCGAGACCG ACGAGACCCC GCGGACCATG TTCGACGTGA TCGGCGGCAA CGCCTACACCCAGCTCTGGC TGCTCTGGGG CGCCTGGTAC AAGCTGCACT AGCCGCCGTT GCGGATGTGG541 ATCGGGGGGC GCAGCCGCTG CTCGATCGGG TTCGCGGTCA ACGGCGGGTT CATCACCGCCTAGCCCCCCG CGTCGGCGAC GAGCTAGCCC AAGCGCCAGT TGCCGCCCAA GTAGTGGCGG601 GGCCACTGCG GCCGCACCGG CGCCACCACC GCCAACCCCA CCGGGACCTT CGCCGGGTCCCCGGTGACGC CGGCGTGGCC GCGGTGGTGG CGGTTGGGGT GGCCCTGGAA GCGGCCCAGG661 AGCTTCCCGG GCAACGACTA CGCGTTCGTC CGTACCGGGG CCGGCGTGAA CCTGCTGGCCTCGAAGGGCC CGTTGCTGAT GCGCAAGCAG GCATGGCCCC GGCCGCACTT GGACGACCGG721 CAGGTCAACA ACTACTCCGG TGGCCGCGTC CAGGTCGCCG GGCACACCGC GGCCCCCGTCGTCCAGTTGT TGATGAGGCC ACCGGCGCAG GTCCAGCGGC CCGTGTGGCG CCGGGGGCAG781 GGCTCGGCCG TGTGCCGGTC CGGGTCGACC ACCGGGTGGC ACTGCGGCAC CATCACTGCGCCGAGCCGGC ACACGGCCAG GCCCAGCTGG TGGCCCACCG TGACGCCGTG GTAGTGACGC841 CTCAACTCCT CGGTCACCTA CCCCGAGGGC ACCGTCCGCG GCCTGATCCG CACCACCGTCGAGTTGAGGA GCCAGTGGAT GGGGCTCCCG TGGCAGGCGC CGGACTAGGC GTGGTGGCAG901 TGCGCCGAGC CCGGCGACTC CGGTGGCTCG CTGCTCGCCG GCAACCAGGC CCAGGGCGTCACGCGGCTCG GGCCGCTGAG GCCACCGAGC GACGAGCGGC CGTTGGTCCG GGTCCCGCAG961 ACGTCCGGCG GCTCCGGCAA CTGCCGCACC GGTGGCACCA CGTTCTTCCA GCCGGTCAACTGCAGGCCGC CGAGGCCGTT GACGGCGTGG CCACCGTGGT GCAAGAAGGT CGGCCAGTTG1021 CCCATCCTCC AGGCGTACGG CCTGAGGATG ATCACCACGG ACTCGGGCAG CAGCCCGGCCGGGTAGGAGG TCCGCATGCC GGACTCCTAC TAGTGGTGCC TGAGCCCGTC GTCGGGCCGG1081 CCTGCACCGA CCTCCTGCAC CGGCTACGCC CGCACCTTCA CCGGGACCCT CGCGGCCGGCGGACGTGGCT GGAGGACGTG GCCGATGCGG GCGTGGAAGT GGCCCTGGGA GCGCCGGCCG1141 CGGGCCGCCG CCCAGCCCAA CGGGTCCTAC GTGCAGGTCA ACCGGTCCGG GACCCACAGCGCCCGGCGGC GGGTCGGGTT GCCCAGGATG CACGTCCAGT TGGCCAGGCC CTGGGTGTCG1201 GTGTGCCTCA ACGGGCCCTC CGGTGCGGAC TTCGACCTCT ACGTGCAGCG CTGGAACGGCCACACGGAGT TGCCCGGGAG GCCACGCCTG AAGCTGGAGA TGCACGTCGC GACCTTGCCG1261 AGCTCCTGGG TGACCGTCGC CCAGAGCACC TCCCCCGGCT CCAACGAGAC CATCACCTACTCGAGGACCC ACTGGCAGCG GGTCTCGTGG AGGGGGCCGA GGTTGCTCTG GTAGTGGATG1321 CGCGGCAACG CCGGCTACTA CCGCTACGTG GTCAACGCCG CGTCCGGCTC CGGTGCCTACGCGCCGTTGC GGCCGATGAT GGCGATGCAC CAGTTGCGGC GCAGGCCGAG GCCACGGATG1381 ACCATGGGGC TCACCCTCCC CTGA (SEQ ID NO3)TGGTACCCCG AGTGGGAGGG GACT 下面的DNA序列(SEQ ID NO4)编码源自纤维单胞菌属菌株69B4(DSM16035)的成熟蛋白酶。
1 TTCGACGTGA TCGGCGGCAA CGCCTACACC ATCGGGGGGC GCAGCCGCTG CTCGATCGGGAAGCTGCACT AGCCGCCGTT GCGGATGTGG TAGCCCCCCG CGTCGGCGAC GAGCTAGCCC61 TTCGCGGTCA ACGGCGGGTT CATCACCGCC GGCCACTGCG GCCGCACCGG CGCCACCACCAAGCGCCAGT TGCCGCCCAA GTAGTGGCGG CCGGTGACGC CGGCGTGGCC GCGGTGGTGG121GCCAACCCCA CCGGGACCTT CGCCGGGTCC AGCTTCCCGG GCAACGACTA CGCGTTCGTCCGGTTGGGGT GGCCCTGGAA GCGGCCCAGG TCGAAGGGCC CGTTGCTGAT GCGCAAGCAG181CGTACCGGGG CCGGCGTGAA CCTGCTGGCC CAGGTCAACA ACTACTCCGG TGGCCGCGTCGCATGGCCCC GGCCGCACTT GGACGACCGG GTCCAGTTGT TGATGAGGCC ACCGGCGCAG241CAGGTCGCCG GGCACACCGC GGCCCCCGTC GGCTCGGCCG TGTGCCGGTC CGGGTCGACCGTCCAGCGGC CCGTGTGGCG CCGGGGGCAG CCGAGCCGGC ACACGGCCAG GCCCAGCTGG301ACCGGGTGGC ACTGCGGCAC CATCACTGCG CTCAACTCCT CGGTCACCTA CCCCGAGGGCTGGCCCACCG TGACGCCGTG GTAGTGACGC GAGTTGAGGA GCCAGTGGAT GGGGCTCCCG361ACCGTCCGCG GCCTGATCCG CACCACCGTC TGCGCCGAGC CCGGCGACTC CGGTGGCTCGTGGCAGGCGC CGGACTAGGC GTGGTGGCAG ACGCGGCTCG GGCCGCTGAG GCCACCGAGC421CTGCTCGCCG GCAACCAGGC CCAGGGCGTC ACGTCCGGCG GCTCCGGCAA CTGCCGCACCGACGAGCGGC CGTTGGTCCG GGTCCCGCAG TGCAGGCCGC CGAGGCCGTT GACGGCGTGG481GGTGGCACCA CGTTCTTCCA GCCGGTCAAC CCCATCCTCC AGGCGTACGG CCTGAGGATGCCACCGTGGT GCAAGAAGGT CGGCCAGTTG GGGTAGGAGG TCCGCATGCC GGACTCCTAC561ATCACCACGG ACTCGGGCAG CAGCCCG (SEQ ID NO4)TAGTGGTGCC TGAGCCCGTC GTCGGGC[523]下面的DNA序列(SEQ ID NO5)编码源自纤维单胞菌属菌株69B4(DSM16035)的信号肽。
1ATGACACCAC CACAGTCAC GCGGGCCCTG GCCGTGGCCA CCGCAGCCGC CACACTCCTGTACTGTGGTG CGTGTCAGTG CGCCCGGGAC CGGCACCGGT GGCGTCGGCG GTGTGAGGAC61GCAGGCGGCA TGGCCGCCCA GGCC (SEQ ID NO5)CGTCCGCCGT ACCGGCGGGT CCGG[524]下面的序列是源自纤维单胞菌属菌株69B4(DSM 16035)的信号序列和前体蛋白酶的氨基酸序列(SEQ ID NO6)，包括信号序列[片段1a-c](残基1-28[-198至-171])、N-端原序列[片段2a-r](残基29-198[-170至-1])、成熟蛋白酶[片段3a-t](残基199-387[1-189])和C-端原序列[片段4a-1](残基388-495[190-398])，它们由SEQ IDNOS1、2、3和4中描述的DNA序列编码。成熟蛋白酶氨基酸序列的N-端序列用粗体表示。
1MTPRTVTRALAVATAAATLLAGGMAAQANEPAPPGSASAPPRLAEKLDPD1a 1b 1c 2a 2b 2c51LLEAMERDLG LDAEEAAATL AFQHDAAETG EALAEELDED FAGTWVEDDV2d 2e 2f 2g 2h101LYVATTDEDA VEEVEGEGAT AVTVEHSLAD LEAWKTVLDA ALEGHDDVPT2i 2j 2k 2l 2m151WYVDVPTNSV VVAVKAGAQD VAAGLVEGAD VPSDAVTFVE TDETPRTMFD
2n2o 2p 2q 2r3a201VIGGNAYTIG GRSRCSIGFA VNGGFITAGH CGRTGATTAN PTGTFAGSSF3b3c 3d 3e 3f251PGNDYAFVRT GAGVNLLAQV NNYSGGRVQV AGHTAAPVGS AVCRSGSTTG3g3h 3i 3j 3k301WHCGTITALN SSVTYPEGTV RGLIRTTVCA EPGDSGGSLL AGNQAQGVTS3l3m 3n 3o 3p351GGSGNCRTGG TTFFQPVNPILQAYGLRMIT TDSGSSPAPA PTSCTGYART3q3r 3s 3t4a 4b401FTGTLAAGRA AAQPNGSYVQ VNRSGTHSVC LNGPSGADFD LYVQRWNGSS4c4d 4e 4f 4g451WVTVAQSTSP GSNETITYRG NAGYYRYVVN AASGSGAYTM GLTLP(SEQ IDNO6)4h 4i 4j 4k 4l[525]下面的序列(SEQ ID NO7)是源自纤维单胞菌属菌株69B4(DSM 16035)的前体蛋白酶的氨基酸序列。
1 NEPAPPGSAS APPRLAEKLD PDLLEAMERD.LGLDAEEAAA.TLAFQHDAAE51 TGEALAEELD EDFAGTWVED DVLYVATTDE DAVEEVEGEG ATAVTVEHSL101ADLEAWKTVL DAALEGHDDV PTWYVDVPTN SVVVAVKAGA QDVAAGLVEG151ADVPSDAVTF VETDETPRTM FDVIGGNAYT IGGRSRCSIG FAVNGGFITA201GHCGRTGATT ANPTGTFAGS SFPGNDYAFV RTGAGVNLLA QVNNYSGGRV251QVAGHTAAPV GSAVCRSGST TGWHCGTITA LNSSVTYPEG TVRGLIRTTV301CAEPGDSGGS LLAGNQAQGV TSGGSGNCRT GGTTFFQPVN PILQAYGLRM351ITTDSGSSPA PAPTSCTGYA RTFTGTLAAG RAAAQPNGSY VQVNRSGTHS401VCLNGPSGAD FDLYVQRWNG SSWVTVAQST SPGSNETITY RGNAGYYRYV451VNAASGSGAY TMGLTLP (SEQ ID NO7)[526]下面的序列(SEQ ID NO8)是源自纤维单胞菌属菌株69B4(DSM 16035)的成熟蛋白酶的氨基酸序列。催化三联体残基H32、D56和S132用粗体和下划线示出。
1 FDVIGGNAYT IGGRSRCSIG FAVNGGFITA GHCGRTGATT ANPTGTFAGS51 SFPGNDYAFV RTGAGVNLLA QVNNYSGGRV QVAGHTAAPV GSAVCRSGST101TGWHCGTITA LNSSVTYPEG TVRGLIRTTV CAEPGDSGGS LLAGNQAQGV151TSGGSGNCRT GGTTFFQPVN PILQAYGLRM ITTDSGSSP(SEQ ID NO8)[527]下面的序列(SEQ ID NO9)是源自纤维单胞菌属菌株69B4(DSM 16035)的蛋白酶的信号肽的氨基酸序列。
1MTPRTVTRAL AVATAAATLL AGGMAAQA(SEQ ID NO9) 下面的序列(SEQ ID NO10)是用于鉴定纤维单胞菌属菌株69B4的蛋白酶的177bp片段的简并引物。
TTGWXCGT_FW5′ACNACSGGSTGGCRGTGCGGCAC 3′(SEQ ID NO10)[529]下面的序列(SEQ ID NO11)是用于鉴定来自纤维单胞菌属菌株69B4的蛋白酶的177bp片段的反向引物。
GDSGGX_RV5′-ANGNGCCGCCGGAGTCNCC-3′(SEQ ID NO11)[530]下面是177bp片段的DNA序列(SEQ ID NO13)和氨基酸序列(SEQ IDNO12)，该177bp片段编码来自纤维单胞菌属菌株69B4的蛋白酶基因的一部分。简并引物的序列(SEQ ID NOS10和11)用下划线和粗体示出。
D G W D C GT I T A L N S S V T Y P E G ·1ACGACGGCTG GGACTGCGGC ACCATCACTG CGCTCAACTCCTCGGTCACC TACCCCGAGGTGCTGCCGAC CCTGACGCCG TGGTAGTGAC GCGAGTTGAGGAGCCAGTGG ATGGGGCTCC· T V R G L IR T T VC A E P G D S G G S ·61GCACCGTCCG CGGCCTGATC CGCACCACCG TCTGCGCCGAGCCCGGCGAC TCCGGTGGCTCGTGGCAGGC GCCGGACTAG GCGTGGTGGC AGACGCGGCTCGGGCCGCTG AGGCCACCGA· L L A G N QA Q G VT S G D S G G S121CGCTGCTCGC CGGCAACCAG GCCCAGGGCG TCACGTCCGGCGACTCCGGC GGCTCATGCGACGAGCG GCCGTTGGTC CGGGTCCCGC AGTGCAGGCCGCTGAGGCCG CCGAGTA纤维单胞菌属某种69B4蛋白酶的序列的分析[531]用1∶1 v/v的乙腈(″ACN″)/0.1％甲酸溶液制备饱和芥子酸(3，5-二甲氧基-4-羟基肉桂酸)(″SA″)溶液。将所得的混合物涡旋60秒钟，然后在14,000rpm离心20秒钟。然后将5μl的基质上清液(matrix supernatant)转移到0.5ml Eppendorf管，并将1μl的10pmole/μl蛋白酶69B4样品加入到该SA基质上清液，并涡旋5秒。然后，将1μl的分析物/基质溶液转移到样品板上，在完全干燥之后，用VoyagerDE-STR(PerSeptive)，基质辅助激光解吸/电离-飞行时间(MALDI-TOF)质谱仪进行分析，设置如下工作模式线性；引出模式(Extraction mode)延迟；极性正；加速电压25000V；引出延迟时间(Extraction delay time)350nsec；获得质量范围(Acquisition mass range)4000-20000Da；激光射击数(Number of laser shots)100/光谱；和激光强度2351。所得的光谱提供于图4中。
胰蛋白酶消化图谱用本领域已知的方法产生(Christianson等，Anal.Biochem.223119-29 )，按照本文中描述的进行了修改。含有10-50μg蛋白酶的蛋白酶溶液在1.5ml微量管中用冷却水以1∶1稀释。加入1.0N HCl至最终浓度为0.1NHCl，充分混合，并在冰上温育10分钟。然后，加入50％三氯乙酸(″TCA″)至最终浓度为10％TCA，并混合。将样品在冰上温育10分钟，离心2分钟，弃除上清液。然后，加入1ml冷的90％丙酮，以重悬浮沉淀。然后将所得的样品离心1分钟，迅速轻轻倒空上清液，通过真空蒸发除去剩余液体。将干的沉淀溶解在12μl 8.0M脲溶液中(480mg脲[Roche，目录#1685899])，该脲溶液处于0.65ml碳酸氢铵溶液中(碳酸氢盐的最终浓度0.5M)，并在37℃温育3-5分钟。该溶液用48μl的n-辛基-β-D-吡喃葡糖苷溶液(″o-水″)(200mg的n-辛基-β-D-吡喃葡糖苷[C14H28O6，f.w.292.4]，在200ml水中)缓慢稀释。然后，加入2.0μl胰蛋白酶(2.5mg/ml，在1mMHCl中)，将混合物在37℃温育15分钟。蛋白质水解反应用6μl10％三氟乙酸(″TFA″)淬灭。通过离心1分钟，从样品中去除不溶性物质和气泡。通过在2.1×150mm C-18柱(5μl颗粒尺寸，300埃孔径)上进行RP-HPLC，分离胰蛋白酶消化物。洗脱梯度由在水中的0.1％(v/v)TFA和在乙腈中的0.08％(v/v)TFA形成，流速为0.2ml/min。将柱室(column compartment)加热到50℃。在215nm处，监测肽洗脱，在215nm和280nm处采集数据。然后在带有Surveyor HPLC的LCQ Advantage质谱仪上(两者都来自Thermo Finnigan)，分析样品。按下述设置操作LCQ质谱仪喷电压(Sprayvoltage)4.5kV；毛细管温度225℃。用TurboSEQUEST和Xcalibur(ThermoFinnigan)进行数据处理。也可以部分地通过Argo BioAnalytica对胰蛋白酶消化部分进行测序。
对asp基因的完整序列的分析表明，它编码495个氨基酸的原序列蛋白酶(SEQ ID NO6)。前28个氨基酸被预测构成信号肽。由纤维单胞菌属菌株69B4产生的69B4蛋白酶的成熟链的质量具有18764的分子量(通过MALDI-TOF测定)。成熟链的N-端序列也由MALDI-TOF分析测定，以序列FDVIGGNAYTIGGR(SEQID NO17)开始。据信，69B4蛋白酶具有携带NH2-和COOH端原序列的独特的前体结构，这已知出现在一些其他的酶上(例如T.aquaticus aqualysin I；参见例如Lee等，FEMS Microbiol.Lett.，169-74 ；Sakamoto等，Biosci.Biotechnol.Biochem.，591438-1443 ；Sakamoto等，Appl.Microbiol.Biotechnol.，4594-101 ；Kim等，Biochem.Biophys.Res.Commun.，231535-539 ；和Oledzka等，Protein Expr.Purific.，29223-229 )。如SEQ ID NO8中提供的成熟69B4蛋白酶的预测分子量是18776.42，其与分离自纤维单胞菌属某种69B4的具有蛋白水解活性的纯化的酶的分子量(即18764)很好地保持一致。69B4蛋白酶中COOH端原序列的预测还基于69B4蛋白酶与T.aquaticus aqualysin I的比对，如下面提供的。在该比对中，纤维单胞菌69B4信号序列和前体蛋白酶的氨基酸序列与Thermusaquaticus的信号序列和前体蛋白酶Aqualysin I比对(Aqualysin I的COOH端原序列用下划线和粗体标出)。
Aqualysin I (1)----MRKTYWLMALFAVLVLGGCQMASRSDPTPTLAEAFWPKEAPVYGLD69B4 (1)MTPRTVTRALAVATAAATLLAGGMAAQANEPAPPGSASAPPRLAEKLDPDConsensus (1) MA A LLAG A DP P A A PK A D51 100AqualYsin I(47)DPEAIPGRYIVVFKKGKGQSLLQGGITTLQARLAPQGVVVTQAYTGALQG69B4(51)LLEAMERDLGLDAEEAAATLAFQHDAAETGEALAEE---LDEDFAGTWVEConsensus(51) EAI LA AQ LA L F G101150Aqualysin I(97)FAAEMAPQALEAFRQSPDVEFIEADKVVRAWATQSPAPWGLDRIDQRDLP69B4(98)DDVLYVATTDEDAVEEVEGEGATAVTVEHSLADLEAWKTVLDAALEGHDDConsensus (101) E D E A V A ALD151200Aqualysin I (147)LSNSYTYTATGRGVNVYVIDTGIRTTHREFGGRARVGYDALGGNGQDCNG69B4 (148)VPTWYVDVPTNS--VVVAVKAGAQDVAAGLVEGADVPSDAVT--FVETDEConsensus (151)L YTV I G A V DAL D201250Aqualysin I (197)HGTHVAGTIGGVTYGVAKAVNLYAVRVLDCNGSGSTSGVIAGVDWVTRNH69B4 (194)TPRTMFDVIGGNAYTIGGRS--------RCSIGFAVNGGFITAGHCGRTGConsensus (201)M IGG Y IACA G R251300Aqualysin I (247)RRPAVANMSLGGGVSTALDNAVKNSIAAGVVYAVAAGNDNANACNYSPAR69B4 (236)ATTANPTGTFAGSSFPGNDYAFVETGAG--------VNLLAQVNNYSGGRConsensus (251) AS AGA D A S AA N AN NYS AR301350Aqualysin I (297)VAEALTVGATTSSDARASFSNYGSCVDLFAPGASIPSAWYTSDTATQTLN69B4 (278)VQVAGHTAAPVGSAVCRSGSTTGWHCGTIT--ALNSSVTYPEGTVRGLIRConsensus (301)V A AA SS S G A S Y TI351400Aqualysin I (347)GTSMATPHVAGVAALYLEQNPSATPASVASAILNGATTGRLSGIGSGSPN69B4 (326)TTVCAEPGDSGGSLLAGNQAQGVTSGGSGNCRTGGTTFFQPVNPILQAYGConsensus (351) T A P AG A L QT A A G T A401450Agualysin I (397)RLLYSLLSSGSGSTAPCTSCSYYTGSLSG---PGDYNFQPNGTYYYSP-A69B4 (376)LRMITTDS-GSS PAPAPTSCTGYARTFTG TLA AGRAAAQPNGSYVQVN R SConsensus (401) L S S GS TSCS Y S SG GQPNGSY A451 500Aqualysin I (443)GTHRAWLRGPAGTDFDLYLWRWDGSRWLTVGSSTGPTSEESLSYSGTAGY69B4 (425) GTHSVCLNGPSGADFDLYVQRWNGSSWVTVAQSTSPGSNETITYRGNAGYConsensus (451) GTH L GPAG DFDLYL RW GS WLTVA ST P S ESISY G AGY501 521Aqualysin I (493)YLWRIYAYSGSGMYEFWLQRP(SEQ ID NO644)69B4 (475)YRYVVNAASGSGAYTMGLTLP (SEQ ID NO645)Consensus (501)Y W I A SGSG Y L P (SEQ ID NO646) 通过MALDI-TOF分析，测定了来自纤维单胞菌属某种69B4的具有蛋白水解活性的纯化的酶的三个内肽(internal peptides)的序列。也在分离的asp基因的翻译产物中鉴定了所有三个肽，这证实了正确的蛋白酶基因的鉴定(参见上面的SEQ ID NO1)。
Asp和链霉蛋白酶之间的百分比同一性比较[535]使用BLAST程序和实施例3中描述的设置，asp基因的推断的多肽产物(成熟链)被用于与其他丝氨酸蛋白酶的同源性分析。初步分析显示了约44-48％的同一性(参见下表4-1)。连同对翻译的序列的分析，这些结果证明asp基因编码与链霉蛋白酶样丝氨酸蛋白酶的成熟链具有少于50％序列同一性的蛋白酶。下面提供了Asp与灰色链霉菌的链霉蛋白酶A、链霉蛋白酶B、链霉蛋白酶C、链霉蛋白酶D的比对。在该比对中，纤维单胞菌69B4成熟蛋白酶(″69B4成熟(69B4 mature)″)的氨基酸序列与链霉蛋白酶C(″Sq-链霉蛋白酶C成熟(sg-StreptogrisinCmature)″)、链霉蛋白酶B(″Sq-链霉蛋白酶B成熟(sg-StreptogrisinBmature)″)、链霉蛋白酶A(″Sq-链霉蛋白酶A成熟(sg-StreptogrisinAmature)″)、链霉蛋白酶D(″Sq-链霉蛋白酶D成熟(sg-StreptogrisinDmature)″)的成熟蛋白酶氨基酸序列和共有(consensus)残基进行比对。
1 5069B4 mature (1)FDVIGGNAYTIGGRSRCSIGFAVN----GGFITAGHCGRTGATT------Sg-StreptogrisinC mature (1)ADIRGGDAYYMNGSGRCSVGFSVTRGTQNGFATAGHCGRVGTTTNG--VNSg-StreptogrisinBmature (1)--ISGGDAIYSST-GRCSLGFNVRSGSTYYFLTAGHCTDGATTWWANSARSg-StreptogrisinAmature (1)--IAGGEAITTGG-SRCSLGFNVSVNGVAHALTAGHCTNISASWS-----Sg-StreptogrisinDmature (1)--IAGGDAIWGSG-SRCSLGFNVVKGGEPYFLTAGHCTESVTSWSD-TQGConsensus (1) IAGGDAIY G SRCSLGFNV G YFLTAGHCT GTTW51 100Asp mature(41)ANPTGTFAGSSFPGNDYAFVRTGAGVNLLAQVNNYSGGRVQVAGHTAAPVSg-StreptogrisinC mature(49)QQAQGTFQGSTPPGRDIAWVATNANWTPRPLVNGYGRGDVTVAGSTASVVSg-StreptogrisinBmature(48)TTVLGTTSGSSFPNNDYGIVRYTNTTIPKDGTVGG----QDITSAANATVSg-StreptogrisinAmature(43)---IGTRTGTSFPNNDYGIIRHSNPAAADGRVYLYNGSYQDITTAGNAFVSg-StreptogrisinDmature(47)GSEIGANEGSSFPENDYGLVKYTSDTAHPSEVNLYDGSTQAITQAGDATVConsensus(51) IGT GSSFP NDYGIVRYTA VN Y G Q IT AG A V101150Asp mature(91)GSAVCRSGSTTGWHCGTITALNSSVTYPEG-TVRGLIRTTVCAEPGDSGGSg-StreptogrisinC mature(99)GASVCRSGSTTGWHCGTIQQLNTSVTYPEG-TISGVTRTSVCAEPGDSGGSg-StreptogrisinBmature(94)GMAVTRRGSTTGTHSGSVTALNATVNYGGGDVVYGMIRTNVCAEPGDSGGSg-StreptogrisinAmature(90)GQAVQRSGSTTGLRSGSVTGLNATVNYGSSGIVYGMIQTNVCAEPGDSGGSg-StreptogrisinDmature(97)GQAVTRSGSTTQVHDGEVTALDATVNYGNGDIVNGLIQTTVCAEPGDSGGConsensus (101)G AV RSGSTTG H GSVTALNATVNYG G IV GLIRTTVCAEPGDSGG151200Asp mature (140)SLLAGNQAQGVTSGGSGNCRTGGTTFFQPVNPILQAYGLRMITTDSGSSPSg-StreptogrisinC mature (148)SYISGSQAQGVTSGGSGNCSSGGTTYFQPINPLLQAYGLTLVTSGGGTPTSg-StreptogrisinBmature (144)PLYSGTRAIGLTSGGSGNCSSGGTTFFQPVTEALSAYGVSVY--------Sg-StreptogrisinAmature (140)SLFAGSTALGLTSGGSGNCRTGGTTFYQPVTEALSAYGATVL--------Sg-StreptogrisinDmature (147)ALFAGDTALGLTSGGSGDCSSGGTTFFQPVPEALAAYGAEIG--------Consensus (151)SLFAGS ALGLTSGGSGNCSSGGTTFFQPV EALSAYGLTVI201250Asp mature (190)--------------------------------------------------Sg-StreptogrisinC mature (198)DPPTTPPTDSPGGTWAVGTAYAAGATVTYGGATYRCLQAHTAQPGWTPADSg-StreptogrisinBmature (186)--------------------------------------------------Sg-StreptogrisinAmature (182)--------------------------------------------------Sg-StreptogrisinDmature (189)--------------------------------------------------Consensus (201)251Asp mature (190)-------- (SEQ ID NO8)
Sg-StreptogrisinC mature(248)VPALWQRV(SEQ ID NO639)Sg-StreptogrisinBmature(186)--------(SEQ ID NO640)Sg-StreptogrisinAmature(182)--------(SEQ ID NO641)Sg-StreptogrisinDmature(189)--------(SEQ ID NO642)Consensus(251)(SEQ ID NO643)表4-1百分比同一性由asp编码的纤维单胞菌属某种69B4蛋白酶和其他丝氨酸蛋白酶之间的比较(成熟链之间的同一性)
也研究了其他蛋白酶序列。在这些分析中，用BLAST搜索在蛋白质序列上与ASP的成熟结构域同源的蛋白酶。然后使用多序列比对程序clustalW，将那些被鉴定出蛋白酶进行比对。下面的比对的顶部的数字指成熟ASP蛋白酶的氨基酸序列。在比对的侧边上的数字是序列标识(identifier)，其在比对的底部被描述。
Sequence 11020 3040ASP FDVIGGNAYTIGGRSRCSIGFAVN-----GGFITAGHCGRTGATTANPTG--------TF2TPLIAGGEAITTGGSRCSLGFNV-SVNGVAHALTAGHCTNISASWS----------IGTR3--IAGGEAIYAAGGGRCSLGFNVRSSSGATYALTAGHCTEIASTWYTNSGQTSL--LGTR4NKLIQGGDAIYASSWRCSLGFNVRTSSGAEYFLTAGHCTDGAGAWRASSGGTV---IGQT5NKLIQGGDAIYASSWRCSLGFNVRTSSGAEYFLTAGHCTDGAGAWRASSGGTV---IGQT6TKLIQGGDAIYASSWRCSLGFNVRSSSGVDYFLTAGHCTDGAGTWYSNSARTTA--IGST7TKLISGGDAIYSSTGRCSLGFNVRSGS-TYYFLTAGHCTDGATTWWANSARTTV--LGTT8---VLGGGAIYGGGSRCSAAFNV-TKGGARYFVTAGHCTNISANWSASSGGSV---VGVR9QREVAGGDAIYGGGSRCSAAFNV-TKNGVRYFLTAGHCTNLSSTWSSTSGGTS---IGVR10 KPFIAGGDAITGNGGRCSLGFNVTKG-GEPHFLTAGHCTEGISTWSDSSG--QV--IGEN11 KPFVAGGDAITGGGGRCSLGFNVTKG-GEPYFITAGHCTESISTWSDSSG--NV--IGEN12 TPLIAGGDAIWGSGSRCSLGFNVVKG-GEPYFLTAGHCTESVTSWSDTQGG-SE--IGAN13 KTFASGGDAIFGGGARCSLGFNVTAGDGSAAFLTRGHCGGGATMWSDAQGGQPI--ATVD14 KTFASGGDAIFGGGARCSLGFNVTAGDGSPAFLTAGHCGVAADQWSDAQGGQPI--ATVD15 ------------------------------------------------------------16 TTRLNGAEPILSTAGRCSAGFNVTDG-TSDFILTAGHCGPTGSVWFGDRPGDGQ--VGRT17 ATVQGGDVYYINRSSRCSIGFAVT-----TGFVSAGHCGGSGASATTSSGEAL----GTF18 ADIRGGDAYYMNGSGRCSVGFSVTRG-TQNGFATAGHCGRVGTTTNGVNQQAQ----GTF19 YDLRGGEAYYINNSSRCSIGFPITKG-TQQGFATAGHCGRAGSSTTGANRVAQ----GTF20 YDLVGGDAYYIGN-GRCSIGFSVRQG-STPGFVTAGHCGSVGNATTGFNRVSQ----GTF21 YDLVGGDAYYMGG-GRCSVGFSVTQG-STPGFATAGHCGTVGTSTTGYNQAAQ----GTF22 EDLVGGDAYYIDDQARCSIGFSVTKD-DQEGFATAGHCGDPGATTTGYNEADQ----GTF23 LAAIIGGNPYYFGNYRCSIGFSVRQG-SQTGFATAGHCGSTGTRVSSPSG--------TV24 ANIVGGIEYSINNASLCSVGFSVTRG-ATKGFVTAGHCGTVNATARIGGAVV-----GTF25 AAGTVGGDPYYTGNVRCSIGFSVH-----GGFVTAGHCGRAGAGVSGWDRSYI----GTF26 VIVPVRDYWGGDALSGCTLAFPVYGG-----FLTAGHCAVEGKGHILKTEMTGGQ-IGTV27 DPPLRSGLAIYGTNVRCSSAFMAYSG-SSYYMMTAGHCAEDSSYWEVPTYSYGYQGVGHV
50 6070 8090100ASP AGSSFPGN-DYAFVRTGAGVNLLAQVNNYSGGR-VQVAGHTAAPVGSAVCRSGSTTGWHC2 TGTSFPNNDYGIIRHSNPAAA--DGRVYLYNGSYQDITTAGNAFVGQAVQRSGSTTGLRS3 AGTSFPGNDYGLIRHSNASAA--DGRVYLYNGSYRDITGAGNAYVGQTVQRSGSTTGLHS4 AGSSFPGNDYGIVQYTGS-------VSRPGTANGVDITRAATPSVGTTVIRDGSTTGTHS5 AGSSFPGNDYGIVQYTGS-------VSRPGTANGVDITRAATPSVGTTVIRDGSTTGTHS6 AGSSFPGNDYGIVRYTGS-------VSRPGTANGVDITRAATPSVGTTVIRDGSTTGTHS7 SGSSFPNNDYGIVRYTNTT------IPKDGTVGGQDITSAANATVGMAVTRRGSTTGTHS8 EGTSFPTNDYGIVRYTDGSSP--AGTVDLYNGSTQDISSAANAVVGQAIKKSGSTTKVTS9 EGTSFPTNDYGIVRYTTTTNV--DGRVNLYNGGYQDIASAADAVVGQAIKKSGSTTKVTS10AASSFPGDDYGLVKYIADVAH--PSQVNLYDGSSQSISGAAEAAVGMQVTRSGSTTQVHS11AASSFPDNDYGLVKYTADVDH--PSEVNLYNGSSQAISGAAEATVGMQVTRSGSTTQVHD12EGSSFPENDYGLVKYTSDTAH--PSEVNLYDGSTQAITQAGDATVGQAVTRSGSTTQVHD13QAVFPPEGDFGLVRYDGPSTE--APSEVDLGDQTLPISGAAEASVGQEVFRMGSTTGLAD14QAVFPGEGDFALVRYDDPATE--APSEVDLGDQTLPISGAAEAAVGQEVFRMGSTTGLAD15------------------------------------------------------------16VAGSFPGDDFSLVEYANGKAGDGADVVAVGDGKGVRITGAGEPAVGQRVFRSGSTSGLRD17SGSVFPGSADMAYVRTVSGTVLRGYINGYGQGS-FPVSGSSEAAVGASICRSGSTTQVHC18QGSTFPGR-DIAWVATNANWTPRPLVNGYGRGD-VTVAGSTASVVGASVCRSGSTTGWHC19QGSIFPGR-DMAWVATNSSWTATPYVLGAGGQN-VQVTGSTASPVGASVCRSGSTTGWHC20RGSWFPGR-DMAWVAVNSNWTPTSLVRNSGSG--VRVTGSTQATVGSSICRSGSTTGWRC21EESSFPGD-DMAWVSVNSDWNTTPTVNEGE----VTVSGSTEAAVGASICRSGSTTGWHC22QASTFPGK-DMAWVGVNSDWTATPDVKAEGGEK-IQLAGSVEALVGASVCRSGSTTGWHC23AGSYFPGR-DMGWVRITSADTVTPLVNRYNGGT-VTVTGSQEAATGSSVCRSGATTGWRC24AARVFPGN-DRAWVSLTSAQTLLPRVANGSSF--VTVRGSTEAAVGAAVCRSGRTTGYQC25QGSSFPDN-DYAWVSVGSGWWTVPVVLGWGTVSDQLVRGSNVAPVGASICRSGSTTHWHC26EASQFGDGIDAAWAKNYGDWNGRGRVTHWNGGGGVDIKGSNEAAVGAHMCKSGRTTKWTC27ADYTFGYYGDSAIVRVDDPGF---WQPRGWVYPSTRITNWDYDYVGQYVCKQGSTTGYTC110 120130 140150ASP GTITALNSSVTYPEGTV-RGLIRTTVCAEPGDSGGSLLAGN-QAQGVTSGGS--------2 GSVTGLNATVNYGSSGIVYGMIQTNVCAEPGDSGGSLF-AGSTALGLTSGGS--------3 GRVTGLNATVNYGGGDIVSGLIQTNVCAEPGDSGGALF-AGSTALGLTSGGS--------4 GRVTALNATVNYGGGDVVGGLIQTTVCAEPGDSGGSLYGSNGTAYGLTSGGS--------5 GRVTALNATVNYGGGDVVGGLIQTTVCAEPGDSGGSLYGSNGTAYGLTSGGS--------6 GRVTALNATVNYGGGDIVSGLIQTTVCAEPGDSGGPLYGSNGTAYGLTSGGS--------7 GSVTALNATVNYGGGDVVYGMIRTNVCAEPGDSGGPLY-SGTRAIGLTSGGS--------8 GTVTAVNVTVNYGDGP-VYNMGRTTACSAGGDSGGAHF-AGSVALGIHSGSS--------9 GTVSAVNVTVNYSDGP-VYGMVRTTACSAGGDSGGAHF-AGSVALGIHSGSS--------10GTVTGLDATVNYGNGDIVNGLIQTDVCAEPGDSGGSLFSGDK-AVGLTSGGS--------11GTVTGLDATVNYGNGDIVNGLIQTDVCAEPGDSGGSLFSGDQ-AIGLTSGGS--------12GEVTALDATVNYGNGDIVNGLIQTTVCAEPGDSGGALFAGDT-ALGLTSGGS--------13GQVLGIDVTVNYPEG-TVTGLIQTDVCAEPGDSGGSLFTRDGLAIRLTSGGT--------14GQVLGLDATVNYPEG-MVTGLIQTDVCAEPGDSGGSLFTRDGLAIGLTSGGS--------15-----------------VDGLIQTDVCAEPGDSGGALFDGDA-AIGLTSGGS--------16GRVTALDATVNYPEG-TVTGLIETDVCAEPGDSGGPMFSEGV-ALGVTSGGS--------17GTIGAKGATVNYPQGAV-SGLTRTSVCAEPGDSGGSFYSGS-QAQGVTSGGS--------18GTIQQLNTSVTYPEGTI-SGVTRTSVCAEPGDSGGSYISGS-QAQGVTSGGS--------19GTVTQLNTSVTYQEGTI-SPVTRTTVCAEPGDSGGSFISGS-QAQGVTSGGS--------20GTIQQHNTSVTYPQGTI-TGVTRTSACAQPGDSGGSFISGT-QAQGVTSGGS--------21GTIQQHNTSVTYPEGTI-TGVTRTSVCAEPGDSGGSYISGS-QAQGVTSGGS--------22GTIQQHDTSVTYPEGTV-DGLTETTVCAEPGDSGGPFVSGV-QAQGTTSGGS--------23GTIQSKNQTVRYAEGTV-TGLTRTTACAEGGDSGGPWLTGS-QAQGVTSGGT--------24GTITAKNVTANYAEGAV-RGLTQGNACMGRGDSGGSWITSAGQAQGVMSGGNVQSNGNNC25GTVLAHNETVNYSDGSVVHQLTKTSVCAEGGDSGGSFISGD-QAQGVTSGGW--------26GYLLRKDVSVNYGNGHI-VTLNETSACALGGDSGGAYVWND-QAQGITSGSN--------27GQITETNATVSYPGRTL-TGMTWSTACDAPGDSGSGVYDGSTAHGILSGGPN--------160 170 180 189ASP GNCRTGGTTFFQPVNPILQAYGLRMITTDSGSSP (SEQ ID NO18)2 GNCRTGGTTFYQPVTEALSAYGATVL-------- (SEQ ID NO19)3 GNCRTGGTT------------------------- (SEQ ID NO20)4 GNCSSGGTTFFQPVTEALSAYGVSVY-------- (SEQ ID NO21)5 GNCSSGGTTFFQPVTEALSAYGVSVY-------- (SEQ ID NO22)6 GNCSSGGTTFFQPVTEALSAYGVSVY-------- (SEQ ID NO23)7 GNCSSGGTTFFQPVTEALSAYGVSVY-------- (SEQ ID NO24)8 GCSGTAGSAIHQPVTKALSAYGVTVYL------- (SEQ ID NO25)
9 GCIGINGSAIHQPVREALSAYGVNVY--------(SEQ ID NO26)10GDCTSGGTTFFQPVTEALSATGTQIG--------(SEQ ID NO27)11GDCTSGGETFFQPVTEALSATGTQIG--------(SEQ ID NO28)12GDCSSGGTTFFQPVPEALAAYGAEIG--------(SEQ ID NO29)13RDCTSGGETFFQPVTTALAAVGGTLGGEDGGDG-(SEQ ID NO30)14GDCTVGGETFFQPVTTALAAVGATLGGEDGGAGA(SEQ ID NO31)15GDCSQGGETFFQPVTEALKAYGAQIGGGQGEPPE(SEQ ID NO32)16GDCAKGGTTFFQPLPEAMASLGVRLIVPGREGAA(SEQ ID NO33)17GDCSRGGTTYFQPVNRILQTYGLTLVTA------(SEQ ID NO34)18GNCSSGGTTYFQPINPLLQAYGLTLVTSGG--GT(SEQ ID NO35)19GDCRTGGETFFQPINALLQNYGLTLKTTGGDDGG(SEQ ID NO36)20GNCSIGGTTFHQPVNPILSQYGLTLVRS------(SEQ ID NO37)21GNCTSGGTTYHQPINPLLSAYGLDLVTG------(SEQ ID NO38)22GDCTNGGTTFYQPVNPLLSDFGLTLKTTSA----(SEQ ID NO39)23GDCRSGGITFFQPINPLLSYFGLQLVTG------(SEQ ID NO40)24GIPASQRSSLFERLQPILSQYGLSLVTG------(SEQ ID NO41)25GNCSSGGETWFQPVNEILNRYGLTLHTA------(SEQ ID NO42)26-MDTNNCRSFYQPVNTVLNKWKLSLVTSTDVTTS(SEQ ID NO43)27----SGCGMIHEPISRALADRGVTLLAG------(SEQ ID NO44)[537]在上面的列表中，数字对应如下1 ASP蛋白酶2 链霉蛋白酶A(灰色链霉菌)3 谷氨酰内肽酶(弗氏链霉菌)4 链霉蛋白酶B(青紫链霉菌)5 SAM-P20(蓝色链霉菌)6 SAM-P20(白浅灰链霉菌)7 链霉蛋白酶B(灰色链霉菌)8 谷氨酰内肽酶II(灰色链霉菌)9 谷氨酰内肽酶II(弗氏链霉菌)10 链霉蛋白酶D(白浅灰链霉菌)11 链霉蛋白酶D(蓝色链霉菌)12 链霉蛋白酶D(灰色链霉菌)13 亚家族S1E未指定(unassigned)肽酶(SalO蛋白)(青紫链霉菌)14 亚家族S1E未指定肽酶(SALO蛋白)(蓝色链霉菌)15 链霉蛋白酶D(普拉特链霉菌)16 亚家族S1E未指定肽酶(3SC5B7.10蛋白)(蓝色链霉菌)17 CHY1蛋白酶(金龟子绿僵菌)18 链霉蛋白酶C(灰色链霉菌)19 链霉蛋白酶C(SCD40A.16c蛋白)(蓝色链霉菌)20 亚家族S1E未指定肽酶(I)(链霉菌属某种)21 亚家族S1E未指定肽酶(II)(链霉菌属某种)22 亚家族S1E未指定肽酶(SCF43A.19蛋白)(蓝色链霉菌)23 亚家族S1E未指定肽酶(褐色高温双岐菌；基原异名褐色高温单孢菌)
24 α-裂解内肽酶(Lysobacter enzymogenes)25 亚家族S1E未指定肽酶(SC10G8.13C蛋白)(蓝色链霉菌)26 酵母菌-裂解内肽酶(渣腐稀有杆菌)27 亚家族S1E未指定肽酶(SC10A5.18蛋白)(蓝色链霉菌)实施例5通过PCR筛选69B4蛋白酶的新颖同源物[538]在该实施例中，描述了被用于筛选69B4蛋白酶的新型同源物的方法。微球菌亚目的细菌菌株，特别是纤维单胞菌科和原小单孢菌科的菌株，从德国培养物保藏中心(German culture collection)，DSMZ(Braunschweig)定购，收到的是冻干培养物。其他菌株从Belgian Coordinated Collections of Microorganisms，BCCMTM/LMG(University of Ghent)获得。按照DSMZ的指导，打开冻干安瓿，用无菌生理盐水(1.5ml)该材料重新水合1小时。充分混合，将重新水合的细胞悬浮液(300μL)转移到无菌Eppendorf管，用于随后的PCR。
PCR方法i)样品预处理[539]将重新水合的微生物细胞悬浮液置于沸水浴中10分钟。然后将悬浮液在16000rpm离心5分钟(Sigma 1-15离心机)，以除去所有细胞残片和剩余的细胞，清澈的上清液组分作为PCR反应的模板。
(ii)PCR试验条件[540]来自这些类型的细菌(放线菌纲)的DNA的一个特征是高度富含GC(一般＞55mol％)，因此，加入DMSO是必要的。选择的浓度基于早期用纤维单胞菌属某种菌株69B4进行的研究工作，为4％v/v DMSO。
(iii)PCR引物(选自下列引物对)[541]Prot-int_FW1 5′-TGCGCCGAGCCCGGCGACTC-3′(SEQ ID NO45)Prot-int_RV1 5′-GAGTCGCCGGGCTCGGCGCA-3′(SEQ ID NO46)Prot-int_FW2 5′-TTCCCCGGCAACGACTACGCGTGGGT-3′(SEQ ID NO47)Prot-int_RV2 5′-ACCCACGCGTAGTCGTTGCCGGGGAA-3′(SEQ ID NO48)Cellu-FW1 5′-GCCGCTGCTCGATCGGGTTC-3′(SEQ ID NO49)Cellu-RV1 5′-GCAGTTGCCGGAGCCGCCGGACGT-3′(SEQ ID NO50)(iv)PCR混合物(所有材料由Invitrogen供应) 模板DNA 4μl10×PCR缓冲液5μl50mM MgSO42μl10mM dNTP′s 1μl引物(10μM soln.)各1μlPlatinum Taq高保真聚合酶 0.5μlDMSO 2μlMilliQ水 33.5μl(v)PCR方案[543]1)94℃ 5min2)94℃ 30sec3)55℃ 30sec4)68℃ 3min5)重复步骤2-4 重复29循环6)68℃ 10min7)15℃ 1min[544]通过琼脂糖凝胶电泳检测扩增的PCR产物。从凝胶上切割下针对各个生物体的不同条带，使用Qiagen凝胶提取试剂盒纯化，通过BaseClear使用同样的引物组合进行测序。
(vi)序列分析[545]分析核苷酸序列数据，将DNA序列翻译成氨基酸序列，以评价与69B4成熟蛋白质的同源性。使用AlignX，Vector NTI suite 9.0.0的组件，进行序列比对。所得结果汇编在表5-1中。编号是在SEQ ID NO8中使用的编号。

这些结果显示，基于69B4蛋白酶基因(成熟链)的多核苷酸序列，SEQ ID NO4的PCR引物，成功地在微球菌亚目的细菌菌株中检测到同源基因，特别是从纤维单胞菌科和原小单孢菌科。
图2提供了ASP蛋白酶的系统发育树。利用胰凝乳蛋白酶超家族的类似成员和已就其推断出有意义的成熟序列的ASP同源物的成熟序列，通过各种方法，研究了该蛋白酶的系统发育。使用本领域已知的蛋白质距离方法(protein distancemethods)(参见例如Kimura，The Neutral Theory of Molecular Evolution，CambridgeUniversity Press，Cambridge，UK )，获得了类似的树，其中或者包括空位或者排除空位。使用TREECONW v.1.3b (Van de Peer and De Wachter，Comput.Appl.Biosci.，10569-570 )和由Neighbor-Joining算法推导的树拓扑学(Saitou andNei，Mol.Biol.Evol.，4406-425 )，由比对的序列(SEQ ID NO8的位置16-181)构建出图2的系统发育树。如该树所示，数据表明ASP系列的同源蛋白酶(″纤维单胞菌蛋白酶(cellulomonadins)″)形成独立的蛋白质亚家族。在图2中，括号中提供的数对应于本文中提供的序列。
下面是纤维单胞菌69B4 ASP蛋白酶和本文中描述的相关属的同源蛋白酶之间的比对。
(其中，69B4(ASP)complete表示69B4(ASP)全序列，69B4(ASP)mature表示69B4(ASP)成熟序列，consensus表示共有序列)
1 5069B4(ASP)complete (1) MTPRTVTRALAVATAAATLLAGGMAAQANEPAPPGSASAPPRLAEKLDPDCellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (1) --------------------------------------------------Cellulomonas biazotea (1) --------------------------------------------------Cellulomonas fimi (1) --------------------------------------------------Cellulomonas iranensis (1) --------------------------------------------------Cellulomonas cellasea (1) --------------------------------------------------C.xylanilytica (1) --------------------------------------------------Oerskovia turbata (1) MARSFWRTLATACAATALVAGPAALTANAATPTPDTPTVSPQTSSKVSPEOerskovia jenensis (1) --------------------------------------------------Cm.cellulans (1) --------------------------------------------------Pm.citrea (1) --------------------------------------------------Pm.sukumoe (1) --------------------------------------------------69B4(ASP)mature(1) --------------------------------------------------Consensus (1)51 10069B4(ASP)complete (51) LLEAMERDLGLDAEEAAATLAFQHDAAETGEALAEELDEDF-AGTWVEDDCellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (1) --------------------------------------------------Cellulomonas biazotea (1) --------------------------------------------------Cellulomonas fimi (1) --------------------------------------------------Cellulomonas iranensis (1) --------------------------------------------------Cel1ulomonas cellasea (1) -------------------------------------------------VC.xylanilytica (1) --------------------------------------------------Oerskovia turbata (51) VLRALQRDLGLSAKDATKRLAFQSDAASTEDALADSLDAYAGAWVDPARNOerskovia jenensis (1) --------------------------------------------------Cm.cellulans (1) --------------------------------PRAAGRAARSSGSRASASPm.citrea (1) --------------------------------------------------Pm.sukumoe (1) --------------------------------------------------69B4(ASP)mature(1) --------------------------------------------------Consensus (51)101 15069B4(ASP)complete (100) VLYVATTDEDAVEEVEGEGATAVTVEHSLADLEAWKTVLDAALEGHDDVPCellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (1) --------------------------------------------------Cellulomonas biazotea (1) ---------------KQTASEFVIRLTIGELNLAAANSPLPIGHAWSTALCellulomonas fimi (1) --------------------------------------------------Cellulomonas iranensis (1) --------------------------------------------------Cellulomonas cellasea (2) GRVRQLPLRGHDVLPARERDPAGLRSASRPGLTRSRRARLDAAGPSARVAC.xylanilytica (1) --------------------------------------------------Oerskovia turbata (101) TLYVGVADRAEAKEVRSAGATPVVVDHTLAELDTWKAALDGELNDPAGVPOerskovia jenensis (1) --------------------------------------------------Cm.cellulans (19) TSPGPTSVTASASSCGRATGRRQRWTFEADGTVRAGGKCMDVAWAPRPTAPm.citrea (1) --------------------------------------------------Pm.sukumoe (1) --------------------------------------------------69B4(ASP)mature(1) --------------------------------------------------Consensus (101)15120069B4(ASP)complete (150) TWYVDVPTNSVVVAVKAGAQDVAAGLVEGADVPSDAVTFVETDETPRTMFCellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (1) -------------------------------------------------VCellulomonas biazotea (36) GWYVDVTTNTVVVNATALAVAQATEIVAAATVPADAVRVVETTEAPRTFICellulomonas fimi (1) -------------------------------------------------VCellulomonas iranensis (1) --------------------------------------------------Cellulomonas cellasea (52) AWYVDVPTNKLVVESVG--DTAAAADAVAAAGLPADAVTLATTEAPRTFVC.xylanilytica (1) --------------------------------------------------Oerskovia turbata (151) SWFVDVTTNQVVVNVHDGGRALAELAAASAGVPADAITYVTTTEAPRPLVO.jenenensis revi (1) --------------------------------------------------Cm.cellulans (69) RRSSSRTARQRGPEVRAQRRGRPRVGAGEQSASTPPGAHRGTRGAVRAHGPm.citrea (1) --------------------------------------------------Pm.sukumoe (1) --------------------------------------------------69B4(ASP)mature(1) -------------------------------------------------FConsensus (151)201250
69B4(ASP)complete (200) DVIGGNAYTIGGRSR-----CSIGFAVNGGFITAGHCGRTGA-----TTACellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (2) DVIGGNAYYIGSRSR-----CSIGFAVEGGFVTAGHCGRAGA-----STSCellulomonas biazotea (86) DVIGGNRYRINNTSR-----CSVGFAVSGGFVTAGHCGTTGA-----TTTC.fimi.revi(2) DVIGGDAYYIGGRSR-----CSIGFAVTGGFVTAGHCGRTGA-----ATTC.iranensis revi (1) --------------------------------------------------Cellulomonas cellasea (100) DVIGGNAYYINASSR-----CSVGFAVEGGFVTAGHCGRAGA-----STSC.xylanilytica (1) --------------R-----CSIGFAVTGGFVTAGHCGRSGA-----TTTOerskovia turbata (201) DWGGNAYTMGSGGR------CSVGFAVNGGFITAGHCGSVGT-----RTSOerskovia jenensis (1) --------------R-----CSVGFAVNGGFVTAGHCGTVGT-----RTSCm.cellulans (119) DVRGGDRYITRDPGASSGSACSIGYAVQGGFVTAGHCGRGGTRRVLTASWPm.citrea (1) --------------------------------------------------Pm.sukumoe (1) --------------------------------------------------69B4(ASP)mature(2) DVIGGNAYTIGGRSR-----CSIGFAVNGGFITAGHCGRTGA-----TTAConsensus (201) DVIGG Y IR CSIGFAV GGFVTAGHCGR GA TS25130069B4(ASP)complete (240) NPTGTFAGSSFPGNDYAFVRTGAGVNLLAQVNNYSGGRVQVAGHTAAPVGCellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (42) SPSGTFRGSSFPGNDyAWVQVASGNTPRGLVNNHSGGTVRVTGSQQAAVGCellulomonas biazotea (126) KPSGTFAGSSFPGNDYAWVRVASGNTPVGAVNNYSGGTVAVAGSTQATVGCellulomonas fimi (42) SPSGTFAGSSFPGNDYAWVRVASGNTPVGAVNNYSGGTVAVAGSTQAAVGCellulomonas iranensis (1) ---------FPGNDYAWVQVGSGDTPRGLVNNYAGGTVRVTGSQQAAVVGCellulomonas cellasea (140) SPSGTFRGSSFPGNDYAWVQVASGNTPRGLVNNHSGGTVRVTGSQQAAVGC.xylanilytica (27) SPSGTFAGSSFPGNDYAWVRAASGNTPVGAVNRYDGSRVTVAGSTDAAVGOerskovia turbata (241) GPGGTFRGSNFPGNDYAWVQVDAGNTPVGAVNNYSGGRVAVAGSTAAPVGOerskovia jenensis (27) GPGGTFRGSSFPGNDYAWVQVDAGNTPVGAVNNYSGGRVAVAGSTAAPVGCm.cellulans (169) ARMGTVQAASFPGHDYAWVRVDAGFSPVPRVNNYAGGTVDVAGSAEAPVGPm.citrea (1) ----------FPGNDYAWVNTGTDDTLVGAVNNYSGGTVNVAGSTRAAVGPm.sukumoe (1) ----------FPGNDYAWVNVGSDDTPIGAVNNYSGGTVNVAGSTQAAVG69B4(ASP)mature(42) NPTGTFAGSSFPGNDYAFVRTGAGVNLLAQVNNYSGGRVQVAGHTAAPVGConsensus (251) P GTF GSSFPGNDYAWVQVASGNTPVGAVNNYSGGTV VAGST AAVG30135069B4(ASP)complete (290) SAVCRSGSTTGWHCGTITALNSSVTYPEGTVRGLIRTTVCAEPGDSGGSLCellulomonas gelida(1) --------------------------------------------------Cellulomonas flavigena (92) SYVCRSGSTTGWRCGYVRAYNTTVRYAEGSVSGLIRTSVCAEPGDSGGSLCellulomonas biazotea (176) ASVCRSGSTTGWRCGTIQAFNSTVNYAQGSVSGLIRTNVCAEPGDSGGSLCellulomonas fimi (92) ATVCRSGSTTGWRCGTIQAFNATVNYAEGSVSGLIRTNVCAEPGDSGGSLCellulomonas iranensis (41) AYVCRSGSTTGWRCGTVQAYNASVRYAEGTVSGLIRTNVCAEPGD-----Cellulomonas cellasea (190) SYVCRSGSTTGWRCGYVRAYNTTVRYAEGSVSGLIRTSVCAEPGDSGGSLC.xylanilytica (77) AAVCRSGSTTAWGCGTIQSRGASVTYAQGTVSGLIRTNVCAEPGDSGGSLOerskovia turbata (291) ASVCRSGSTTGWHCGTIGAYNTSVTYPQGTVSGLIRTNVCAEPGDSGGSLOerskovia jenensis (77) SSVCRSGSTTGWRCGTIAAYNSSVTYPQGTVSGLIRTNVCAEPGDSGGSLCm.cellulans (219) ASVCRSGATTGWRCGVIEQKNITVNYGNGDVPGLVRGSACAEGGDSGGSVPm.citrea (41) ATVCRSGSTTGWHCGTIQALNASVTYAEGTVSGLIRTNVCAEPGD-----Pm.sukumoe (41) STVCRSGSTTGWHCGTIQAFNASVTYAEGTVSGLIRTNVCAEPGD-----69B4(ASP)mature(92) SAVCRSGSTTGWHCGTITALNSSVTYPEGTVRGLIRTTVCAEPGDSGGSLConsensus (301) ASVCRSGSTTGWRCGTI AYNASV YAEGTVSGLIRTNVCAEPGDSGGSL35140069B4(ASP)complete (340) LAGNQAQGVTSGGSGNCRTGGTTFFQPVNPILQAYGLRMITT-DSGSSPACellulomonas gelida(1) LAGNQAQGVTSGGSGNCSSGGTTYFQPVNEALRVYGLTLVTS-DGGGTE-Cellulomonas flavigena (142) VAGTQAQGVTSGGSGNCRYGGTTYFQPVNEILQDQPGPSTTR-AL-----Cellulomonas biazotea (226) IAGNQAQGLTSGGSGNCTTGGTTYFQPVNEALSAYGLTLVTSSGGGGGGGCellulomonas fimi (142) VAG-----------------------------------------------Cellulomonas iranensis (86) --------------------------------------------------Cellulomonas cellasea (240) VAGTQAQGVTSGGSGNCRYGGTTYFQPVNEILQAYGLRLVLG-HARGGPSC.xylanilytica (127) IAGTQARGVTSGGSGNC---------------------------------Oerskovia turbata (341) LAGNQAQGVTSGGSGNCSSGGTTYFQPVNEALGGYGLTLVTSDGGGPSRROerskovia jenensis (127) LAGNQAQGLTSGGSGNCSSGGTTYFQPVNEALSAYGLTLVTSGGRGNC--Cm.cellulans (269) ISGNQAQGVTSGRINDCSNGGKFLYQPDRRPVARDHGRRVGQRARRARGQPm.citrea (86) --------------------------------------------------Pm.sukumoe (86) --------------------------------------------------69B4(ASP)mature(142) LAGNQAQGVTSGGSGNCRTGGTTFFQPVNPILQAYGLRMITTDSGSSP--Consensus (351) LAGNQAQGVTSGGSGNC GGTTYFQPVN L YGL LV69B4(ASP)complete (389) -PAPTSCTGYARTFTGTLAAGRAAAQPNGSYVQVNRSGTHSVCLNGPSGACellulomonas gelida(49) -PPPTGCQGYARTYQGSVSAGTSVAQPNGSYVTTG-GGTHRVCLSGPAGTCellulomonas flavigena (186) --------------------------------------------------Cellulomonas biazotea (276) ----TTCTGYARTYTGSLASRQSAVQPSGSYVTVGSSGTIRVCLDGPSGTCellulomonas fimi (145) --------------------------------------------------Cellulomonas iranensis (86) --------------------------------------------------Cellulomonas cellasea (289) -PARRAPAPPARA-------------------------------------C.xylanilytica (144) --------------------------------------------------
Oerskovia turbata(391) RPGARAMRGPTRAASRPGRRSRSERFVRHDRGRATGCA------------Oerskovia jenensis (175) --------------------------------------------------Cm.cellulans (319) VHRRPRVRLQ----------------------------------------Pm.citrea(86) --------------------------------------------------Pm.sukumoe (86) --------------------------------------------------69B4(ASP)mature (190) --------------------------------------------------Consensus(401)451 50069B4(ASP)complete(438) DFDLYVQRWNGSSWVTVAQSTSPGSNETITYRGNAGYYRYVVNAASGSGACellulomonas gelida (97) DLDLYLQKWNGYSWASVAQSTSPGATEAVTYTGTAGYYRYVVHAYAGSGACellulomonas flavigena (186) --------------------------------------------------Cellulomonas biazotea(322) DFDLYLQKWNGSAW------------------------------------Cellulomonas fimi(145) --------------------------------------------------Cellulomonas iranensis (86) --------------------------------------------------Cellulomonas cellasea(301) --------------------------------------------------C.xylanilytica (144) --------------------------------------------------Oerskovia turbata(429) --------------------------------------------------Oerskovia jenensis (175) --------------------------------------------------Cm.cellulans (329) --------------------------------------------------Pm.citrea(86) --------------------------------------------------Pm.sukumoe (86) --------------------------------------------------69B4(ASP)mature (190) --------------------------------------------------Consensus(451)50169B4(ASP)complete(488) YTMGLTLP (SEQ ID NO6)Cellulomonas gelida (147) YTLGATTP (SEQ ID NO60)Cellulomonas flavigena (186) -------- (SEQ ID NO54)Cellulomonas biazotea(336) -------- (SEQ ID NO56)Cellulomonas fimi(145) -------- (SEQ ID NO58)Cellulomonas iranensis (86) -------- (SEQ ID NO62)Cellulomonas cellasea(301) -------- (SEQ ID NO64)C.xylanilytica (144) -------- (SEQ ID NO66)Oerskovia turbata(429) -------- (SEQ ID NO68)Oerskovia jenensis (175) -------- (SEQ ID NO70)Cm.cellulans (329) -------- (SEQ ID NO72)Pm.citrea(86) -------- (SEQ ID NO74)Pm.sukumoe (86) -------- (SEQ ID NO76)69B4(ASP)mature (190) -------- (SEQ ID NO8)Consensus(501) (SEQ ID NO647)
实施例6通过免疫印迹检测69B4蛋白酶的新颖同源物[549]在该实施例中，描述了用于检测69B4的同源物的免疫印迹试验。下述生物体被用于这些试验中。
1.双氮纤维单胞菌DSM 201122.产黄纤维单胞菌DSM 201093.粪便纤维单胞菌DSM 201134.Cellulomonas cellasea DSM 201185.Cellulomonas uda DSM 201076.Cellulomonas gelida DSM 201117.Cellulomonas xylanilytica LMG 217238.Cellulomonas iranensis DSM 147859.Oerskovia jenensis DSM 4600010.特氏厄氏菌DSM 2057711.纤维化纤维微细菌DSM 2042412.Xylanibacterium ulmi LMG2172113.Isoptericola variabilis DSM 1017714.Xylanimicrobium pachnodae DSM 1265715.柠檬原小单孢菌DSM 4311016.Promicromonospora sukumoe DSM 4412117.分枝壤霉菌(Agromyces ramosus)DSM 43045[550]首先将菌株培养在Heart Infusion/脱脂奶琼脂板上(72h，30℃)，以确证菌株纯度——清除脱脂奶的蛋白酶反应，并用作接种株。在230rpm，30℃，将细菌菌株在带有挡板的100/500 Erlenmeyer摇瓶中用脑心浸出液(Brain Heart Infusion)培养基培养5天，所述脑心浸出液培养基补充有酪蛋白(0.8％ w/v)。通过显微镜检测微生物生长。通过在4766×g离心30min，将细胞与上清液分开。其它的固体通过在9500rpm离心被除去。使用Vivaspin 20ml浓缩器(Vivascience)，截流值10kDa，通过在4000×g离心，浓缩上清液。将浓缩物以每等份0.5mL保存在-20℃。
一抗[551]针对由69B4成熟蛋白酶(SEQ ID NO8)中的氨基酸151-164和178-189组成的两个肽，产生用于免疫印迹反应的一抗(EP034323)，其由Eurogentec(LiègeScience Park，Seraing，Belgium)制备，所述两个肽即[552]TSGGSGNCRTGGTT(表位1；SEQ ID NO51)和LRMITTDSGSSP(表位2；SEQ ID NO52)，如下面在69B4成熟蛋白酶的氨基酸序列中所示
1 FDVIGGNAYT IGGRSRCSIG FAVNGGFITA GHCGRTGATT ANPTGTFAGS51SFPGNDYAFV RTGAGVNLLA QVNNYSGGRV QVAGHTAAPV GSAVCRSGST101 TGWHCGTITA LNSSVTYPEG TVRGLIRTTV CAEPGDSGGS LLAGNQAQGV151 FFQPVN PILQAYG (SEQ ID NO8)电泳和免疫印迹[553]样品制备1.浓缩的培养物上清液(50μL)2.PMSF(1μl；20mg/ml)3.1M HCI(25μL)4.Nu PAGE LDS样品缓冲液(25μL)(Invitrogen，Carlsbad，CA，USA)混合并在90℃加热10min。
电泳[554]进行SDS-PAGE，一式两份，使用NuPAGE 10％ Bis-Tris凝胶(Invitrogen)和MES-SDS分离缓冲液，在100v工作5分钟，再保持在200v。如果可能，将25μL的样品上样到各个槽中。每一对胶中的一块胶用考马斯蓝染色，而另一块胶用于按照Boehringer Mannheim生色蛋白质印迹方案(Roche)进行的免疫印迹。
免疫印迹[555]使用的转移缓冲液是Transfer bufferTris(0.25M)-甘氨酸(1.92M)-甲醇(20％v/v)。通过连续在甲醇、去离子水中以及最后在转移缓冲液中润湿，使PVDF膜预润湿。
将PAGE胶短暂地在去离子水中清洗，并转移到浸在转移缓冲液中的印迹板上，覆盖以预润湿的PVDF膜和预浸的印迹板。在转移缓冲液中，以400mA的恒电流，进行印迹2.5-3小时。将膜在Tris缓冲盐水(TBS)(0.5M Tris，0.15M NaCl，pH7.5)中短暂清洗(2×)。通过在4℃将膜温育在含有1％v/v小鼠/兔封闭试剂(Roche)的马来酸溶液(100mM马来酸，150mM NaCl，pH7.5)中过夜，防止非特异性抗体结合。
用于这些反应中的一抗是EP034323，稀释度为1∶1000。该反应用稀释在1％封闭溶液中的该抗体进行30分钟。将膜用TBST(TSB+0.1％v/v Tween 20)清洗4次，每次10min。
二抗由抗小鼠/抗兔IgG(Roche)组成，73μL，溶于20ml 1％封闭溶液中，反应30分钟。将膜用TBST洗涤4次，每次15min。用BM生色蛋白印迹试剂(Chromogenic Western Blotting Reagent)(Roche)进行底物反应(碱性磷酸酶)，直到出现染色。
与一次多克隆抗体的交叉反应性的结果显示在表6-1中。
基于这些结果，明显地，用于这些试验的抗体在检测与69B4蛋白酶具有非常高的氨基酸序列同一性百分比的同源物中具有高度的特异性。此外，这些结果指出，69B4成熟蛋白酶链的C-端部分是相当多变的，尤其在所述2肽表位的区域。在这些实验中，被确定的是，在该区域有2个以上的氨基酸差异的情况下，则会产生阴性蛋白印迹反应结果。
实施例7反向PCR和基因组步移(Genome Walking)[561]在该实施例中，描述了实施用来阐明ASP的多核苷酸序列的试验。用于这些试验的微生物是1.双氮纤维单胞菌DSM 201122.产黄纤维单胞菌DSM 201093.粪便纤维单胞菌DSM 201134.Cellulomonas cellasea DSM 201185.Cellulomonas gelida DSM 201116.Cellulomonas iranensis(DSM 14785)7.Oerskovia jenensis DSM 460008.特氏厄氏菌DSM 205779.纤维化纤维微细菌DSM 2042410.柠檬原小单孢菌DSM 4311011.Promicromonospora sukumoe DSM 44121[562]在230rpm，30℃，将这些细菌菌株在带有挡板的100/500 Erlenmeyer瓶中用脑心浸出液(Brain Heart Infusion)培养基或胰蛋白胨大豆(Tryptone Soya)培养基培养2天。通过在4766×g离心30min，将细胞与培养物肉汤分离。
通过本领域已知的标准酚/氯仿抽提方法，从用溶菌酶/EDTA消化的细胞，获得染色体DNA(参见例如Sambrook等.，如上)。染色体DNA用选自下列的限制性酶消化ApaI、BamHI、BssHII、KpnI、NarI、NcoI、NheI、PvuI、SalI或SstII。
这些微生物的核苷酸和氨基酸序列提供于下。在这些列表中，成熟蛋白酶用粗体表示，信号序列用下划线表示。
-[590]
C.flavigena(DSM 20109)1GTCGACGTCA TCGGGGGCAA CGCGTACTAC ATCGGGTCGC GCTCGCGGTGCAGCTGCAGT AGCCCCCGTT GCGCATGATG TAGCCCAGCG CGAGCGCCAC51 CTCGATCGGG TTCGCGGTCG AGGGCGGGTT CGTCACCGCG GGGCACTGCGGAGCTAGCCC AAGCGCCAGC TCCCGCCCAA GCAGTGGCGC CCCGTGACGC101 GGCGCGCGGG CGCGAGCACG TCGTCACCGT CGGGGACCTT CCGCGGCTCGCCGCGCGCCC GCGCTCGTGC AGCAGTGGCA GCCCCTGGAA GGCGCCGAGC151 TCGTTCCCCG GCAACGACTA CGCGTGGGTC CAGGTCGCCT CGGGCAACACAGCAAGGGGC CGTTGCTGAT GCGCACCCAG GTCCAGCGGA GCCCGTTGTG201 GCCGCGCGGG CTGGTGAACA ACCACTCGGG CGGCACGGTG CGCGTCACCGCGGCGCGCCC GACCACTTGT TGGTGAGCCC GCCGTGCCAC GCGCAGTGGC251 GCTCGCAGCA GGCCGCGGTC GGCTCGTACG TGTGCCGATC GGGCAGCACGCGAGCGTCGT CCGGCGCCAG CCGAGCATGC ACACGGCTAG CCCGTCGTGC301 ACGGGATGGC GGTGCGGCTA CGTCCGGGCG TACAACACGA CCGTGCGGTATGCCCTACCG CCACGCCGAT GCAGGCCCGC ATGTTGTGCT GGCACGCCAT351 CGCGGAGGGC TCGGTCTCGG GCCTCATCCG CACGAGCGTG TGCGCCGAGCGCGCCTCCCG AGCCAGAGCC CGGAGTAGGC GTGCTCGCAC ACGCGGCTCG401 CGGGCGACTC CGGCGGCTCG CTGGTCGCCG GCACGCAGGC CCAGGGCGTCGCCCGCTGAG GCCGCCGAGC GACCAGCGGC CGTGCGTCCG GGTCCCGCAG451 ACGTCGGGCG GGTCCGGCAA CTGCCGCTAC GGGGGCACGA CGTACTTCCA
TGCAGCCCGC CCAGGCCGTT GACGGCGATG CCCCCGTGCT GCATGAAGGT501 GCCCGTGAAC GAGATCCTGC AGGACCAGCC CGGGCCGTCG ACCACGCGTGCGGGCACTTG CTCTAGGACG TCCTGGTCGG GCCCGGCAGC TGGTGCGCAC551 CCCTAGGGAT (SEQ ID NO53)Cellulomonas flavigena(DSM 20109)1VDVIGGNAYY IGSRSRCSIG FAVEGGFVTA GHCGRAGAST SSPSGTFRGS51 SFPGNDYAWV QVASGNTPRG LVNNHSGGTV RVTGSQQAAV GSYVCRSGST101 TGWRCGYVRA YNTTVRYAEG SVSGLIRTSV CAEPGDSGGS LVAGTQAQGV151 TSGGSGNCRY GGTTYFQPVN EILQDQPGPS TTRAL (SEQ ID NO54)Cellulomonas biazotea(DSM 20112)1TAAAACAGAC GGCCAGTGAA TTTGTAATAC GACTCACTAT AGGCGAATTGATTTTGTCTG CCGGTCACTT AAACATTATG CTGAGTGATA TCCGCTTAAC51 AATTTAGCGG CCGCGAATTC GCCCTTACCT ATAGGGCACG CGTGGTCGACTTAAATCGCC GGCGCTTAAG CGGGAATGGA TATCCCGTGC GCACCAGCTG101 GGCCCTGGGC TGGTACGTCG ACGTCACTAC CAACACGGTC GTCGTCAACGCCGGGACCCG ACCATGCAGC TGCAGTGATG GTTGTGCCAG CAGCAGTTGC151 CCACCGCCCT CGCCGTGGCC CAGGCGACCG AGATCGTCGC CGCCGCAACGGGTGGCGGGA GCGGCACCGG GTCCGCTGGC TCTAGCAGCG GCGGCGTTGC201 GTGCCCGCCG ACGCCGTCCG GGTCGTCGAG ACCACCGAGG CGCCCCGCACCACGGGCGGC TGCGGCAGGC CCAGCAGCTC TGGTGGCTCC GCGGGGCGTG251 GTTCATCGAC GTCATCGGCG GCAACCGTTA CCGGATCAAC AACACCTCGCCAAGTAGCTG CAGTAGCCGC CGTTGGCAAT GGCCTAGTTG TTGTGGAGCG301 GCTGCTCGGT CGGCTTCGCC GTCAGCGGCG GCTTCGTCAC CGCCGGGCACCGACGAGCCA GCCGAAGCGG CAGTCGCCGC CGAAGCAGTG GCGGCCCGTG351 TGCGGCACGA CCGGCGCGAC CACGACGAAA CCGTCCGGCA CGTTCGCCGGACGCCGTGCT GGCCGCGCTG GTGCTGCTTT GGCAGGCCGT GCAAGCGGCC401 CTCGTCGTTC CCCGGCAACG ACTACGCGTG GGTGCGCGTC GCGTCCGGCAGAGCAGCAAG GGGCCGTTGC TGATGCGCAC CCACGCGCAG CGCAGGCCGT451 ACACCCCGGT CGGCGCCGTG AACAACTACA GCGGCGGCAC CGTGGCCGTCTGTGGGGCCA GCCGCGGCAC TTGTTGATGT CGCCGCCGTG GCACCGGCAG501 GCCGGCTCGA CGCAGGCGAC CGTCGGTGCG TCCGTCTGCC GCTCCGGCTCCGGCCGAGCT GCGTCCGCTG GCAGCCACGC AGGCAGACGG CGAGGCCGAG551 CACCACGGGG TGGCGCTGCG GGACGATCCA GGCGTTCAAC TCCACCGTCAGTGGTGCCCC ACCGCGACGC CCTGCTAGGT CCGCAAGTTG AGGTGGCAGT
601 ACTACGCGCA GGGCAGCGTC TCCGGCCTCA TCCGCACGAA CGTGTGCGCCTGATGCGCGT CCCGTCGCAG AGGCCGGAGT AGGCGTGCTT GCACACGCGG651 GAGCCCGGCG ACTCCGGCGG CTCGCTCATC GCCGGCAACC AGGCCCAGGGCTCGGGCCGC TGAGGCCGCC GAGCGAGTAG CGGCCGTTGG TCCGGGTCCC701 CCTGACGTCC GGCGGGTCGG GCAACTGCAC CACCGGCGGG ACGACGTACTGGACTGCAGG CCGCCCAGCC CGTTGACGTG GTGGCCGCCC TGCTGCATGA751 TCCAGCCCGT CAACGAGGCG CTCTCCGCCT ACGGCCTGAC GCTCGTCACGAGGTCGGGCA GTTGCTCCGC GAGAGGCGGA TGCCGGACTG CGAGCAGTGC801 TCGTCCGGCG GCGGCGGTGG CGGCGGCACG ACCTGCACCG GGTACGCGCGAGCAGGCCGC CGCCGCCACC GCCGCCGTGC TGGACGTGGC CCATGCGCGC851 GACCTACACC GGCTCGCTCG CCTCGCGGCA GTCCGCCGTC CAGCCGTCCGCTGGATGTGG CCGAGCGAGC GGAGCGCCGT CAGGCGGCAG GTCGGCAGGC901 GCAGCTATGT GACCGTCGGG TCCAGCGGCA CCATCCGCGT CTGCCTCGACCGTCGATACA CTGGCAGCCC AGGTCGCCGT GGTAGGCGCA GACGGAGCTG951 GGCCCGAGCG GGACGGACTT CGACCTGTAC CTGCAGAAGT GGAACGGGTCCCGGGCTCGC CCTGCCTGAA GCTGGACATG GACGTCTTCA CCTTGCCCAG1001 CGCGTGGGC (SEQ ID NO55)GCGCACCCGCellulomonas biazotea(DSM 20112)1 KOTASEFVIR LTIGELNLAA ANSPLPIGHA WSTALGWYVD VTTNTVVVNA51TALAVAQATE IVAAATVPAD AVRVVETTEA PRTFIDVIGG NRYRINNTSR101 CSVGFAVSGG FVTAGHCGTT GATTTKPSGT FAGSSFPGND YAWVRVASGN151 TPVGAVNNYS GGTVAVAGST QATVGASVCR SGSTTGWRCG TIQAFNSTVN201 YAQGSVSGLI RTNVCAEPGD SGGSLIAGNQ AQGLTSGGSG NCTTGGTTYF251 QPVNEALSAY GLTLVTSSGG GGGGGTTCTG YARTYTGSLA SRQSAVQPSG301 SYVTVGSSGT IRVCLDGPSG TDFDLYLQKW NGSAW (SEQ ID NO56)Cellulomonas fimi(DSM 20113)1 GTGGACGTGA TCGGCGGCGA CGCCTACTAC ATCGGCGGCC GCAGCCGCTGCACCTGCACT AGCCGCCGCT GCGGATGATG TAGCCGCCGG CGTCGGCGAC51TTCGATCGGG TTCGCCGTCA CCGGGGGCTT CGTGACCGCC GGGCACTGCGAAGCTAGCCC AAGCGGCAGT GGCCCCCGAA GCACTGGCGG CCCGTGACGC101 GCCGCACCGG CGCGGCCACG ACGAGCCCGT CGGGCACGTT CGCCGGCTCGCGGCGTGGCC GCGCCGGTGC TGCTCGGGCA GCCCGTGCAA GCGGCCGAGC151 AGCTTCCCGG GCAACGACTA CGCGTGGGTG CGGGTCGCGT CGGGCAACACTCGAAGGGCC CGTTGCTGAT GCGCACCCAC GCCCAGCGCA GCCCGTTGTG
201GCCCGTCGGC GCGGTGAACA ACTACAGCGG CGGCACGGTC GCCGTCGCCGCGGGCAGCCG CGCCACTTGT TGATGTCGCC GCCGTGCCAG CGGCAGCGGC251GCTCGACCCA GGCCGCCGTC GGTGCGACCG TGTGCCGCTC GGGCTCCACCCGAGCTGGGT CCGGCGGCAG CCACGCTGGC ACACGGCGAG CCCGAGGTGG301ACCGGCTGGC GGTGCGGCAC CATCCAGGCG TTCAACGCGA CCGTCAACTATGGCCGACCG CCACGCCGTG GTAGGTCCGC AAGTTGCGCT GGCAGTTGAT351CGCCGAGGGC AGCGTCTCCG GCCTCATCCG CACGAACGTG TGCGCCGAGCGCGGCTCCCG TCGCAGAGGC CGGAGTAGGC GTGCTTGCAC ACGCGGCTCG401CCGGCGACTC GGGCGGCTCG CTCGTCGCCG GCAACCAGGC GCAGGGCATGGGCCGCTGAG CCCGCCGAGC GAGCAGCGGC CGTTGGTCCG CGTCCCGTAC451ACGTCCGGCG GCTCCGACAA CTGC (SEQ ID NO57)TGCAGGCCGC CGAGGCTGTT GACGCellulomonas fimi(DSM 20113)1 VDVIGGDAYY IGGRSRCSIG FAVTGGFVTA GHCGRTGAAT TSPSGTFAGS51 SFPGNDYAWV RVASGNTPVG AVNNYSGGTV AVAGSTQAAV GATVCRSGST101TGWRCGTIQA FNATVNYAEG SVSGLIRTNV CAEPGDSGGS LVAG (SEQ IDNO58)Cellulomonas gelida(DSM 20111)1 CTCGCGGGCA ACCAGGCGCA GGGCGTGACG TCGGGCGGGT CGGGCAACTGGAGCGCCCGT TGGTCCGCGT CCCGCACTGC AGCCCGCCCA GCCCGTTGAC51 CTCGTCGGGC GGGACGACGT ACTTCCAGCC CGTCAACGAG GCCCTCCGGGGAGCAGCCCG CCCTGCTGCA TGAAGGTCGG GCAGTTGCTC CGGGAGGCCC101TGTACGGGCT CACGCTCGTG ACCTCTGACG GTGGGGGCAC CGAGCCGCCGACATGCCCGA GTGCGAGCAC TGGAGACTGC CACCCCCGTG GCTCGGCGGC151CCGACCGGGT GCCAGGGCTA TGCGCGGACC TACCAGGGCA GCGTCTCGGCGGCTGGCCCA CGGTCCCGAT ACGCGCCTGG ATGGTCCCGT CGCAGAGCCG201CGGGACGTCG GTCGCGCAGC CGAACGGTTC GTACGTCACG ACCGGGGGCGGCCCTGCAGC CAGCGCGTCG GCTTGCCAAG CATGCAGTGC TGGCCCCCGC251GGACGCACCG GGTGTGCCTG AGCGGACCGG CGGGCACGGA CCTGGACCTGCCTGCGTGGC CCACACGGAC TCGCCTGGCC GCCCGTGCCT GGACCTGGAC301TACCTGCAGA AGTGGAACGG GTACTCGTGG GCCAGCGTCG CGCAGTCGACATGGACGTCT TCACCTTGCC CATGAGCACC CGGTCGCAGC GCGTCAGCTG351GTCGCCTGGT GCCACGGAGG CGGTCACGTA CACCGGGACC GCCGGCTACTCAGCGGACCA CGGTGCCTCC GCCAGTGCAT GTGGCCCTGG CGGCCGATGA401ACCGCTACGT GGTCCACGCG TACGCGGGTT CGGGGGCGTA CACCCTGGGGTGGCGATGCA CCAGGTGCGC ATGCGCCCAA GCCCCCGCAT GTGGGACCCC
451GCGACGACCC CG (SEQ ID NO59)CGCTGCTGGG GCCellulomonas gelida(DSM 20111)1 LAGNQAQGVT SGGSGNCSSG GTTYFQPVNE ALRVYGLTLV TSDGGGTEPP51 PTGCQGYART YQGSVSAGTS VAQPNGSYVT TGGGTHRVCL SGPAGTDLDL101YLQKWNGYSW ASVAQSTSPG ATEAVTYTGT AGYYRYVVHA YAGSGAYTLG151ATTP (SEQ ID NO60)Cellulomonas iranensis(DSM 14785)1 TTCCCCGGCA ACGACTACGC GTGGGTCCAG GTCGGGTCGG GCGACACCCCAAGGGGCCGT TGCTGATGCG CACCCAGGTC CAGCCCAGCC CGCTGTGGGG51 CCGCGGCCTG GTCAACAACT ACGCGGGCGG CACCGTGCGG GTCACCGGGTGGCGCCGGAC CAGTTGTTGA TGCGCCCGCC GTGGCACGCC CAGTGGCCCA101CGCAGCAGGC CGCGGTCGGC GCGTACGTCT GCCGGTCGGG CAGCACGACGGCGTCGTCCG GCGCCAGCCG CGCATGCAGA CGGCCAGCCC GTCGTGCTGC151GGCTGGCGCT GCGGCACCGT GCAGGCCTAC AACGCGTCGG TCCGCTACGCCCGACCGCGA CGCCGTGGCA CGTCCGGATG TTGCGCAGCC AGGCGATGCG201CGAGGGCACC GTCTCGGGCC TCATCCGCAC CAACGTCTGC GCCGAGCCCGGCTCCCGTGG CAGAGCCCGG AGTAGGCGTG GTTGCAGACG CGGCTCGGGC251GCGACTC (SEQ ID NO61)CGCTGAGCellulomonas iranensis(DSM 14785)1 FPGNDYAWVQ VGSGDTPRGL VNNYAGGTVR VTGSQQAAVG AYVCRSGSTT51 GWRCGTVQAY NASVRYAEGT VSGLIRTNVC AEPGD (SEQ ID NO62)Cellulomonas cellasea(DSM 20118)1 GTCGGGCGGG TCCGGCAACT GCCGCTACGG GGGCACGACG TACTTCCAGCCAGCCCGCCC AGGCCGTTGA CGGCGATGCC CCCGTGCTGC ATGAAGGTCG51 CCGTGAACGA GATCCTGCAG GCCTACGGTC TGCGTCTCGT CCTGGGCTGAGGCACTTGCT CTAGGACGTC CGGATGCCAG ACGCAGAGCA GGACCCGACT101CACGCTCGCG GCGGGCCCGG CTCGACGCGG CCGGCCCGTC GGCCCGGGTCGTGCGAGCGC CGCCCGGGCC GAGCTGCGCC GGCCGGGCAG CCGGGCCCAG151GCCGCCTGGT ACGTCGACGT GCCGACCAAC AAGCTCGTCG TCGAGTCGGTCGGCGGACCA TGCAGCTGCA CGGCTGGTTG TTCGAGCAGC AGCTCAGCCA
201CGGCGACACC GCGGCGGCCG CCGACGCCGT CGCCGCCGCG GGCCTGCCTGGCCGCTGTGG CGCCGCCGGC GGCTGCGGCA GCGGCGGCGC CCGGACGGAC251CCGACGCCGT GACGCTCGCG ACCACCGAGG CGCCACGGAC GTTCGTCGACGGCTGCGGCA CTGCGAGCGC TGGTGGCTCC GCGGTGCCTG CAAGCAGCTG301GTCATCGGCG GCAACGCGTA CTACATCAAC GCGAGCAGCC GCTGCTCGGTCAGTAGCCGC CGTTGCGCAT GATGTAGTTG CGCTCGTCGG CGACGAGCCA351CGGCTTCGCG GTCGAGGGCG GGTTCGTCAC CGCGGGCCAC TGCGGGCGCGGCCGAAGCGC CAGCTCCCGC CCAAGCAGTG GCGCCCGGTG ACGCCCGCGC401CGGGCGCGAG CACGTCGTCA CCGTCGGGGA CCTTCCGCGG CTCGTCGTTCGCCCGCGCTC GTGCAGCAGT GGCAGCCCCT GGAAGGCGCC GAGCAGCAAG451CCCGGCAACG ACTACGCGTG GGTCCAGGTC GCCTCGGGCA ACACGCCGCGGGGCCGTTGC TGATGCGCAC CCAGGTCCAG CGGAGCCCGT TGTGCGGCGC501CGGGCTGGTG AACAACCACT CGGGCGGCAC GGTGCGCGTC ACCGGCTCGCGCCCGACCAC TTGTTGGTGA GCCCGCCGTG CCACGCGCAG TGGCCGAGCG551AGCAGGCCGC GGTCGGCTCG TACGTGTGCC GATCGGGCAG CACGACGGGATCGTCCGGCG CCAGCCGAGC ATGCACACGG CTAGCCCGTC GTGCTGCCCT601TGGCGGTGCG GCTACGTCCG GGCGTACAAC ACGACCGTGC GGTACGCGGAACCGCCACGC CGATGCAGGC CCGCATGTTG TGCTGGCACG CCATGCGCCT651GGGCTCGGTC TCGGGCCTCA TCCGCACGAG CGTGTGCGCC GAGCCGGGCGCCCGAGCCAG AGCCCGGAGT AGGCGTGCTC GCACACGCGG CTCGGCCCGC701ACTCCGGCGG CTCGCTGGTC GCCGGCACGC AGGCCCAGGG CGTCACGTCGTGAGGCCGCC GAGCGACCAG CGGCCGTGCG TCCGGGTCCC GCAGTGCAGC751GGCGGGTCCG GCAACTGCCG CTACGGGGGC ACGACGTACT TCCAGCCCGTCCGCCCAGGC CGTTGACGGC GATGCCCCCG TGCTGCATGA AGGTCGGGCA801GAACGAGATC CTGCAGGCCT ACGGTCTGCG TCTCGTCCTG GGCTGACACGCTTGCTCTAG GACGTCCGGA TGCCAGACGC AGAGCAGGAC CCGACTGTGC851CTCGCGGCGG GCCCTCCCCT GCCCGTCGCG CGCCGGCCCC ACCAGCCCGGGAGCGCCGCC CGGGAGGGGA CGGGCAGCGC GCGGCCGGGG TGGTCGGGCC901GCCG (SEQ ID NO63)CGGCCellulomonas cellasea(DSM 20118)1 VGRVRQLPLR GHDVLPARER DPAGLRSASR PGLTRSRRAR LDAAGPSARV51 AAWYVDVPTN KLVVESVGDT AAAADAVAAA GLPADAVTLA TTEAPRTFVD101VIGGNAYYIN ASSRCSVGFA VEGGFVTAGH CGRAGASTSS PSGTFRGSSF151PGNDYAWVQV ASGNTPRGLV NNHSGGTVRV TGSQQAAVGS YVCRSGSTTG201WRCGYVRAYN TTVRYAEGSV SGLIRTSVCA EPGDSGGSLV AGTQAQGVTS
251GGSGNCRYGG TTYFQPVNEI LQAYGLRLVL G*HARGGPSP ARRAPAPPAR301A (SEQ ID NO64)Cellulomonas xylanilytica(LMG 21723)1 CGCTGCTCGA TCGGGTTCGC CGTGACGGGC GGCTTCGTGA CCGCCGGCCACTGCGGACGG TCCGGCGCGA CGACGACGTC GCCGAGCGGC ACGTTCGCCGGCGACGAGCT AGCCCAAGCG GCACTGCCCG CCGAAGCACT GGCGGCCGGTGACGCCTGCC AGGCCGCGCT GCTGCTGCAG CGGCTCGCCG TGCAAGCGGC101GGTCCAGCTT TCCCGGCAAC GACTACGCCT GGGTCCGCGC GGCCTCGGGCAACACGCCGG TCGGTGCGGT GAACCGCTAC GACGGCAGCC GGGTGACCGTCCAGGTCGAA AGGGCCGTTG CTGATGCGGA CCCAGGCGCG CCGGAGCCCGTTGTGCGGCC AGCCACGCCA CTTGGCGATG CTGCCGTCGG CCCACTGGCA201GGCCGGGTCC ACCGACGCGG CCGTCGGTGC CGCGGTCTGC CGGTCGGGGTCGACGACCGC GTGGGGCTGC GGCACGATCC AGTCCCGCGG CGCGAGCGTCCCGGCCCAGG TGGCTGCGCC GGCAGCCACG GCGCCAGACG GCCAGCCCCAGCTGCTGGCG CACCCCGACG CCGTGCTAGG TCAGGGCGCC GCGCTCGCAG301ACGTACGCCC AGGGCACCGT CAGCGGGCTC ATCCGCACCA ACGTGTGCGCCGAGCCGGGT GACTCCGGGG GGTCGCTGAT CGCGGGCACC CAGGCGCGGGTGCATGCGGG TCCCGTGGCA GTCGCCCGAG TAGGCGTGGT TGCACACGCGGCTCGGCCCA CTGAGGCCCC CCAGCGACTA GCGCCCGTGG GTCCGCGCCC401GCGTGACGTC CGGCGGCTCC GGCAACTGC (SEQ ID NO65)CGCACTGCAG GCCGCCGAGG CCGTTGACGCellulomonas xylanilytica(LMG 21723)1 RCSIGFAVTG GFVTAGHCGR SGATTTSPSG TFAGSSFPGN DYAWVRAASG51 NTPVGAVNRY DGSRVTVAGS TDAAVGAAVC RSGSTTAWGC GTIQSRGASV101TYAQGTVSGL IRTNVCAEPG DSGGSLIAGT QARGVTSGGS GNC (SEQ IDNO66)Oerskovia turbata(DSM 20577)1 ATGGCACGAT CATTCTGGAG GACGCTCGCC ACGGCGTGCG CCGCGACGGCTACCGTGCTA GTAAGACCTC CTGCGAGCGG TGCCGCACGC GGCGCTGCCG51 ACTGGTTGCC GGCCCCGCAG CGCTCACCGC GAACGCCGCG ACGCCCACCCTGACCAACGG CCGGGGCGTC GCGAGTGGCG CTTGCGGCGC TGCGGGTGGG101CCGACACCCC GACCGTTTCA CCCCAGACCT CCTCGAAGGT CTCGCCCGAGGGCTGTGGGG CTGGCAAAGT GGGGTCTGGA GGAGCTTCCA GAGCGGGCTC
151GTGCTCCGCG CCCTCCAGCG GGACCTGGGG CTGAGCGCCA AGGACGCGACCACGAGGCGC GGGAGGTCGC CCTGGACCCC GACTCGCGGT TCCTGCGCTG201GAAGCGTCTG GCGTTCCAGT CCGACGCGGC GAGCACCGAG GACGCTCTCGCTTCGCAGAC CGCAAGGTCA GGCTGCGCCG CTCGTGGCTC CTGCGAGAGC251CCGACAGCCT GGACGCCTAC GCGGGCGCCT GGGTCGACCC TGCGAGGAACGGCTGTCGGA CCTGCGGATG CGCCCGCGGA CCCAGCTGGG ACGCTCCTTG301ACCCTGTACG TCGGCGTCGC CGACAGGGCC GAGGCCAAGG AGGTCCGTTCTGGGACATGC AGCCGCAGCG GCTGTCCCGG CTCCGGTTCC TCCAGGCAAG351GGCCGGAGCG ACCCCCGTGG TCGTCGACCA CACGCTCGCC GAGCTCGACACCGGCCTCGC TGGGGGCACC AGCAGCTGGT GTGCGAGCGG CTCGAGCTGT401CGTGGAAGGC GGCGCTCGAC GGTGAGCTCA ACGACCCCGC GGGCGTCCCGGCACCTTCCG CCGCGAGCTG CCACTCGAGT TGCTGGGGCG CCCGCAGGGC451AGCTGGTTCG TCGACGTCAC GACCAACCAG GTCGTCGTCA ACGTGCACGATCGACCAAGC AGCTGCAGTG CTGGTTGGTC CAGCAGCAGT TGCACGTGCT501CGGCGGACGC GCCCTCGCGG AGCTGGCTGC CGCGAGCGCG GGCGTGCCCGGCCGCCTGCG CGGGAGCGCC TCGACCGACG GCGCTCGCGC CCGCACGGGC551CCGACGCCAT CACCTACGTG ACGACGACCG AGGCTCCTCG TCCCCTCGTCGGCTGCGGTA GTGGATGCAC TGCTGCTGGC TCCGAGGAGC AGGGGAGCAG601GACGTGGTGG GCGGCAACGC GTACACCATG GGTTCGGGCG GGCGCTGCTCCTGCACCACC CGCCGTTGCG CATGTGGTAC CCAAGCCCGC CCGCGACGAG651GGTCGGCTTC GCGGTGAACG GGGGCTTCAT CACGGCCGGG CACTGCGGCTCCAGCCGAAG CGCCACTTGC CCCCGAAGTA GTGCCGGCCC GTGACGCCGA701CGGTCGGCAC CCGCACCTCG GGGCCGGGCG GCACGTTCCG GGGGTCGAACGCCAGCCGTG GGCGTGGAGC CCCGGCCCGC CGTGCAAGGC CCCCAGCTTG751TTCCCCGGCA ACGACTACGC CTGGGTGCAG GTCGACGCGG GTAACACCCCAAGGGGCCGT TGCTGATGCG GACCCACGTC CAGCTGCGCC CATTGTGGGG801GGTCGGCGCG GTCAACAACT ACAGCGGTGG GCGCGTCGCG GTCGCAGGGTCCAGCCGCGC CAGTTGTTGA TGTCGCCACC CGCGCAGCGC CAGCGTCCCA851CGACGGCCGC GCCCGTGGGG GCCTCGGTCT GCCGGTCCGG TTCCACGACGGCTGCCGGCG CGGGCACCCC CGGAGCCAGA CGGCCAGGCC AAGGTGCTGC901GGCTGGCACT GCGGCACCAT CGGCGCGTAC AACACCTCGG TGACGTACCCCCGACCGTGA CGCCGTGGTA GCCGCGCATG TTGTGGAGCC ACTGCATGGG951GCAGGGCACC GTCTCGGGGC TCATCCGCAC GAACGTGTGC GCCGAGCCCGCGTCCCGTGG CAGAGCCCCG AGTAGGCGTG CTTGCACACG CGGCTCGGGC1001 GCGACTCGGG CGGCTCGCTC CTCGCGGGCA ACCAGGCGCA GGGCGTGACCCGCTGAGCCC GCCGAGCGAG GAGCGCCCGT TGGTCCGCGT CCCGCACTGG
1051TCGGGCGGGT CGGGCAACTG CTCGTCGGGC GGGACGACGT ACTTCCAGCCAGCCCGCCCA GCCCGTTGAC GAGCAGCCCG CCCTGCTGCA TGAAGGTCGG1101CGTCAACGAG GCCCTCGGGG GGTACGGGCT CACGCTCGTG ACCTCTGACGGCAGTTGCTC CGGGAGCCCC CCATGCCCGA GTGCGAGCAC TGGAGACTGC1151GTGGGGGCCC GAGCCGCCGC CGACCGGGTG CCAGGGCTAT GCGCGGACCTCACCCCCGGG CTCGGCGGCG GCTGGCCCAC GGTCCCGATA CGCGCCTGGA1201ACCAGGGCAG CGTCTCGGCC GGGACGTCGG TCGCGCAGCG AACGGTTCGTTGGTCCCGTC GCAGAGCCGG CCCTGCAGCC AGCGCGTCGC TTGCCAAGCA1251ACGTCACGAC CGGGGGCGGG CGACCGGGTG TGCC (SEQ ID NO67)TGCAGTGCTG GCCCCCGCCC GCTGGCCCAC ACGGOerskovia turbata(DSM 20577)1MARSFWRTLA TACAATALVA GPAALTANAA TPTPDTPTVS PQTSSKVSPE51 VLRALQRDLG LSAKDATKRL AFQSDAASTE DALADSLDAY AGAWVDPARN101 TLYVGVADRA EAKEVRSAGA TPVVVDHTLA ELDTWKAALD GELNDPAGVP151 SWFVDVTTNQ VVVNVHDGGR ALAELAAASA GVPADAITYV TTTEAPRPLV201 DVVGGNAYTM GSGGRCSVGF AVNGGFITAG HCGSVGTRTS GPGGTFRGSN251 FPGNDYAWVQ VDAGNTPVGA VNNYSGGRVA VAGSTAAPVG ASVCRSGSTT301 GWHCGTIGAY NTSVTYPQGT VSGLIRTNVC AEPGDSGGSL LAGNQAQGVT351 SGGSGNCSSG GTTYFQPVNE ALGGYGLTLV TSDGGGPSRR RPGARAMRGP401 TRAASRPGRR SRSERFVRHD RGRATGCA (SEQ ID NO68)Oerskovia jenensis(DSM 46000)1 GCCGCTGCTC GGTCGGCTTC GCGGTGAACG GCGGCTTCGT CACCGCAGGCCGGCGACGAG CCAGCCGAAG CGCCACTTGC CGCCGAAGCA GTGGCGTCCG51 CACTGCGGGA CGGTGGGCAC CCGCACCTCG GGGCCGGGCG GCACGTTCCGGTGACGCCCT GCCACCCGTG GGCGTGGAGC CCCGGCCCGC CGTGCAAGGC101 CGGGTCGAGC TTCCCCGGCA ACGACTACGC CTGGGTGCAG GTCGACGCGGGCCCAGCTCG AAGGGGCCGT TGCTGATGCG GACCCACGTC CAGCTGCGCC151 GGAACACCCC GGTCGGGGCC GTCAACAACT ACAGCGGTGG ACGCGTCGCGCCTTGTGGGG CCAGCCCCGG CAGTTGTTGA TGTCGCCACC TGCGCAGCGC201 GTCGCGGGCT CGACGGCCGC ACCCGTGGGT TCCTCGGTCT GCCGGTCCGGCAGCGCCCGA GCTGCCGGCG TGGGCACCCA AGGAGCCAGA CGGCCAGGCC251 TTCCACGACG GGCTGGCGCT GCGGCACGAT CGCGGCCTAC AACAGCTCGGAAGGTGCTGC CCGACCGCGA CGCCGTGCTA GCGCCGGATG TTGTCGAGCC301 TGACGTACCC GCAGGGGACC GTCTCCGGGC TCATCCGCAC CAACGTGTGCACTGCATGGG CGTCCCCTGG CAGAGGCCCG AGTAGGCGTG GTTGCACACG351 GCCGAGCCGG GCGACTCGGG CGGCTCGCTC CTCGCGGGCA ACCAGGCACA
CGGCTCGGCC CGCTGAGCCC GCCGAGCGAG GAGCGCCCGT TGGTCCGTGT401GGGCCTGACG TCGGGCGGGT CGGGCAACTG CTCGTCGGGC GGCACGACGTCCCGGACTGC AGCCCGCCCA GCCCGTTGAC GAGCAGCCCG CCGTGCTGCA451ACTTCCAGCC CGTCAACGAG GCGCTCTCGG CCTACGGCCT CACGCTCGTGTGAAGGTCGG GCAGTTGCTC CGCGAGAGCC GGATGCCGGA GTGCGAGCAC501ACCTCCGGCG GCAGGGGCAA CTGC (SEQ ID NO69)TGGAGGCCGC CGTCCCCGTT GACGOerskovia jenensis(DSM 46000)1 RCSVGFAVNG GFVTAGHCGT VGTRTSGPGG TFRGSSFPGN DYAWVQVDAG51 NTPVGAVNNY SGGRVAVAGS TAAPVGSSVC RSGSTTGWRC GTIAAYNSSV101TYPQGTVSGL IRTNVCAEPG DSGGSLLAGN QAQGLTSGGS GNCSSGGTTY151FQPVNEALSA YGLTLVTSGG RGNC (SEQ ID NO70)Cellulosimicrobium cellulans(DSM 20424)1 CCACGGGCGG CGGGTCGGGC AGCGCGCTCG TCGGGCTCGC GGGCAAGTGCGGTGCCCGCC GCCCAGCCCG TCGCGCGAGC AGCCCGAGCG CCCGTTCACG51ATCGACGTCC CCGGGTCCGA CTTCAGTGAC GGCAAGCGCC TCCAGCTGTGTAGCTGCAGG GGCCCAGGCT GAAGTCACTG CCGTTCGCGG AGGTCGACAC101 GACGTGCAAC GGGTCGCAGG CAGCGCTGGA CGTTCGAAGC CGACGGCACCCTGCACGTTG CCCAGCGTCC GTCGCGACCT GCAAGCTTCG GCTGCCGTGG151 GTACGCGCGG GCGGCAAGTG CATGGACGTC GCGTGGGCGC CGCGGCCGACCATGCGCGCC CGCCGTTCAC GTACCTGCAG CGCACCCGCG GCGCCGGCTG201 GGCACGGCGC TCCAGCTCGC GAACTGCACG GCAACGCGGC CCAGAAGTTCCCGTGCCGCG AGGTCGAGCG CTTGACGTGC CGTTGCGCCG GGTCTTCAAG251 GTGCTCAACG GCGCGGGCGA CCTCGTGTCG GTGCTGGCGA ACAAAGTGCGCACGAGTTGC CGCGCCCGCT GGAGCACAGC CACGACCGCT TGTTTCACGC301 TCGACGCCGC CGGGTGCGCA CCGAGGTACT CGCGGCGCCG TACGAGCTCAAGCTGCGGCG GCCCACGCGT GGCTCCATGA GCGCCGCGGC ATGCTCGAGT351 CGGCGACGTG CGCGGCGGCG ACCGCTACAT CACACGGGAC CCGGGCGCGTGCCGCTGCAC GCGCCGCCGC TGGCGATGTA GTGTGCCCTG GGCCCGCGCA401 CGTCGGGCTC GGCCTGCTCG ATCGGGTACG CCGTCCAGGG CGGCTTCGTCGCAGCCCGAG CCGGACGAGC TAGCCCATGC GGCAGGTCCC GCCGAAGCAG451 ACGGCGGGGC ACTGCGGACG CGGCGGGACA AGGAGAGTGC TCACCGCGAGTGCCGCCCCG TGACGCCTGC GCCGCCCTGT TCCTCTCACG AGTGGCGCTC501 CTGGGCGCGC ATGGGGACGG TCCAGGCGGC GTCGTTCCCC GGCCACGACT
GACCCGCGCG TACCCCTGCC AGGTCCGCCG CAGCAAGGGG CCGGTGCTGA551 ACGCGTGGGT GCGCGTCGAC GCCGGGTTCT CCCCCGTCCC GCGGGTGAACTGCGCACCCA CGCGCAGCTG CGGCCCAAGA GGGGGCAGGG CGCCCACTTG601 AACTACGCCG GCGGCACCGT CGACGTCGCC GGCTCGGCCG AGGCGCCCGTTTGATGCGGC CGCCGTGGCA GCTGCAGCGG CCGAGCCGGC TCCGCGGGCA651 GGGTGCGTCG GTGTGCCGCT CGGGCGCCAC GACCGGCTGG CGCTGCGGCGCCCACGCAGC CACACGGCGA GCCCGCGGTG CTGGCCGACC GCGACGCCGC701 TCATCGAGCA GAAGAACATC ACCGTCAACT ACGGCAACGG CGACGTTCCCAGTAGCTCGT CTTCTTGTAG TGGCAGTTGA TGCCGTTGCC GCTGCAAGGG751 GGCCTCGTGC GCGGCAGCGC GTGCGCGGAG GGCGGCGACT CGGGCGGGTCCCGGAGCACG CGCCGTCGCG CACGCGCCTC CCGCCGCTGA GCCCGCCCAG801 GGTGATCTCC GGCAACCAGG CGCAGGGCGT CACGTCGGGC AGGATCAACGCCACTAGAGG CCGTTGGTCC GCGTCCCGCA GTGCAGCCCG TCCTAGTTGC851 ACTGCTCGAA CGGCGGCAAG TTCCTCTACC AGCCCGATCG ACGGCCTGTCTGACGAGCTT GCCGCCGTTC AAGGAGATGG TCGGGCTAGC TGCCGGACAG901 GCTCGTGACC ACGGGCGGCG GGTCGGGCAG CGCGCTCGTC GGGCTCGCGGCGAGCACTGG TGCCCGCCGC CCAGCCCGTC GCGCGAGCAG CCCGAGCGCC951 GCAAGTGCAT CGACGTCCCC GGGTCCGACT TCAG (SEQ ID NO71)CGTTCACGTA GCTGCAGGGG CCCAGGCTGA AGTCCellulosimicrobium cellulans(DSM 20424)1 PRAAGRAARS SGSRASASTS PGPTSVTASA SSCGRATGRR QRWTFEADGT51 VRAGGKCMDV AWAPRPTARR SSSRTARQRG PEVRAQRRGR PRVGAGEQSA101 STPPGAHRGT RGAVRAHGDV RGGDRYITRD PGASSGSACS IGYAVQGGFV151 TAGHCGRGGT RRVLTASWAR MGTVQAASFP GHDYAWVRVD AGFSPVPRVN201 NYAGGTVDVA GSAEAPVGAS VCRSGATTGW RCGVIEQKNI TVNYGNGDVP251 GLVRGSACAE GGDSGGSVIS GNQAQGVTSG RINDCSNGGK FLYQPDRRPV301 ARDHGRRVGQ RARRARGQVH RRPRVRLQ (SEQ ID NO72)Promicromonospora citrea(DSM 43110)1 TTCCCCGGCA ACGACTACGC GTGGGTGAAC ACGGGCACGG ACGACACCCTAAGGGGCCGT TGCTGATGCG CACCCACTTG TGCCCGTGCC TGCTGTGGGA51 CGTCGGCGCC GTGAACAACT ACAGCGGCGG CACGGTCAAC GTCGCGGGCTGCAGCCGCGG CACTTGTTGA TGTCGCCGCC GTGCCAGTTG CAGCGCCCGA101 CGACCCGTGC CGCCGTCGGC GCGACGGTCT GCCGCTCGGG CTCCACGACCGCTGGGCACG GCGGCAGCCG CGCTGCCAGA CGGCGAGCCC GAGGTGCTGG151 GGCTGGCACT GCGGCACCAT CCAGGCGCTG AACGCGTCGG TCACCTACGC
CCGACCGTGA CGCCGTGGTA GGTCCGCGAC TTGCGCAGCC AGTGGATGCG201CGAGGGCACC GTGAGCGGCC TCATCCGCAC CAACGTGTGC GCCGAGCCCGGCTCCCGTGG CACTCGCCGG AGTAGGCGTG GTTGCACACG CGGCTCGGGC251GCGACTC (SEQ ID NO73)CGCTGAGPromicromonospora citrea(DSM 43110)1 FPGNDYAWVN TGTDDTLVGA VNNYSGGTVN VAGSTRAAVG ATVCRSGSTT51 GWHCGTIQAL NASVTYAEGT VSGLIRTNVC AEPGD (SEQ ID NO74)Promicromonospora sukumoe(DSM 44121)1 TTCCCCGGCA ACGACTACGC GTGGGTGAAC GTCGGCTCCG ACGACACCCCAAGGGGCCGT TGCTGATGCG CACCCACTTG CAGCCGAGGC TGCTGTGGGG51 GATCGGTGCG GTCAACAACT ACAGCGGCGG CACCGTGAAC GTCGCGGGCTCTAGCCACGC CAGTTGTTGA TGTCGCCGCC GTGGCACTTG CAGCGCCCGA101CGACCCAGGC CGCCGTCGGC TCCACCGTCT GCCGCTCCGG TTCCACGACCGCTGGGTCCG GCGGCAGCCG AGGTGGCAGA CGGCGAGGCC AAGGTGCTGG151GGCTGGCACT GCGGCACCAT CCAGGCCTTC AACGCGTCGG TCACCTACGCCCGACCGTGA CGCCGTGGTA GGTCCGGAAG TTGCGCAGCC AGTGGATGCG201CGAGGGCACC GTGTCCGGCC TGATCCGCAC CAACGTCTGC GCCGAGCCCGGCTCCCGTGG CACAGGCCGG ACTAGGCGTG GTTGCAGACG CGGCTCGGGC251GCGACTC (SEQ ID NO75)CGCTGAGPromicromonospora sukumoe(DSM 44121)1 FPGNDYAWVN VGSDDTPIGA VNNYSGGTVN VAGSTQAAVG STVCRSGSTT51 GWHCGTIQAF NASVTYAEGT VSGLIRTNVC AEPGD (SEQ ID NO76)Xylanibacterium ulmi(LMG 21721)1 GCCGCTGCTC GATCGGGTTC GCCGTGACGG GCGGCTTCGT GACCGCCGGCCGGCGACGAG CTAGCCCAAG CGGCACTGCC CGCCGAAGCA CTGGCGGCCG51 CACTGCGGAC GGTCCGGCGC GACGACGACG TCCGCGAGCG GCACGTTCGCGTGACGCCTG CCAGGCCGCG CTGCTGCTGC AGGCGCTCGC CGTGCAAGCG101CGGGTCCAGC TTTCCCGGCA ACGACTACGC CTGGGTCCGC GCGGCCTCGGGCCCAGGTCG AAAGGGCCGT TGCTGATGCG GACCCAGGCG CGCCGGAGCC
151 GAACACGCCG GTCGGTGCGG TGAACCGCTA CGACGGCAGC CGGGTGACCGCTTGTGCGGC CAGCCACGCC ACTTGGCGAT GCTGCCGTCG GCCCACTGGC201 TGGCCGGGTC CACCGACGCG GCCGTCGGTG CCGCGGTCTG CCGGTCGGGGACCGGCCCAG GTGGCTGCGC CGGCAGCCAC GGCGCCAGAC GGCCAGCCCC251 TCGACGACCG CGTGGCGCTG CGGCACGATC CAGTCCCGCG GCGCGACGGTAGCTGCTGGC GCACCGCGAC GCCGTGCTAG GTCAGGGCGC CGCGCTGCCA301 CACGTACGCC CAGGGCACCG TCAGCGGGCT CATCCGCACC AACGTGTGCGGTGCATGCGG GTCCCGTGGC AGTCGCCCGA GTAGGCGTGG TTGCACACGC351 CCGAGCCGGG TGACTCCGGG GGGTCGCTGA TCGCGGGCAC CCAGGCGCAGGGCTCGGCCC ACTGAGGCCC CCCAGCGACT AGCGCCCGTG GGTCCGCGTC401 GGCGTGACGT CCGGCGGCTC CGGCAACTGC (SEQ ID NO77)CCGCACTGCA GGCCGCCGAG GCCGTTGACGXylanibacterium ulmi(LMG 21721)1 RCSIGFAVTG GFVTAGHCGR SGATTTSASG TFAGSSFPGN DYAWVRAASG51 NTPVGAVNRY DGSRVTVAGS TDAAVGAAVC RSGSTTAWRC GTIQSRGATV101 TYAQGTVSGL IRTNVCAEPG DSGGSLIAGT QAQGVTSGGS G (SEQ ID NO78)
反向PCR[591]反向PCR被用于由来自微球菌亚目的细菌菌株的染色体DNA测定全长丝氨酸蛋白酶基因，其通过PCR或免疫印迹被显示为本文中描述的新的纤维单胞菌属某种69B4蛋白酶的新颖的同源物。
消化的DNA用PCR纯化试剂盒(Qiagen，目录编号#28106)纯化，用T4 DNA连接酶(Invitrogen)自连接，这根据制造商的说明书进行。连接混合物用PCR纯化试剂盒(Qiagen)纯化，用选择下列的引物进行PCRRV-1 Rest 5’-ACCCACGCGTAGTCGTTGCC-3’(SEQ ID NO79)RV-1 Cellul 5’-ACCCACGCGTAGTCGTKGCCGGGG-3’(SEQ ID NO80)RV-2 biaz-fimi5’-TCGTCGTGGTCGCGCCGG-3’(SEQ ID NO81)RV-2 cella-flavi 5’-CGACGTGCTCGCGCCCG-3’(SEQ ID NO82)RV-2 cellul 5’-CGCGCCCAGCTCGCGGTG-3’(SEQ ID NO83)RV-2 turb 5’-CGGCCCCGAGGTGCGGGTGCCG-3’(SEQ ID NO84)Fw-1 biaz-fimi5’-CAGCGTCTCCGGCCTCATCCGC-3’(SEQ ID NO85)Fw-1 cella-flavi 5’-CTCGGTCTCGGGCCTCATCCGC-3’(SEQ ID NO86)Fw-1 cellul 5’-CGACGTTCCCGGCCTCGTGCGC-3’(SEQ ID NO87)Fw-1 turb 5’-CACCGTCTCGGGGCTCATCCGC-3’(SEQ ID NO88)Fw-2 rest 5’-AGCARCGTGTGCGCCGAGCC-3’(SEQ ID NO89)Fw-2 cellul 5’-GGCAGCGCGTGCGCGGAGGG-3’(SEQ ID NO90)Fw-1 gelida 5’-GCCGCTGCTCGATCGGGTTC-3’(SEQ ID NO91)Rv-1 gelida 5’-GCAGTTGCCGGAGCCGCCGGACGT-3’.(SEQ ID NO92) 扩增的PCR产物利用琼脂糖凝胶电泳(0.8％琼脂糖，在TBE缓冲液中(Invitrogen))检测。对于每一生物体，将在1.3-2.2kbp范围内的不同条带切割下来，使用Qiagen凝胶提取试剂盒纯化，利用BaseClear分析序列。序列分析显示，这些DNA片段涵盖了与纤维单胞菌69B4蛋白酶基因同源的蛋白酶基因的一些其他部分。
使用基因组末端快速扩增(RAGE)进行的基因组步移[594]本领域已知的一种基因组步移方法(RAGE)被用来测定来自微球菌亚目的细菌菌株的染色体DNA中的全长丝氨酸蛋白酶基因，其通过PCR或免疫印迹显示是新的纤维单胞菌属某种69B4蛋白酶的新颖的同源物。使用UniversalGenomeWalkerTMKit(BD Biosciences Clontech)进行RAGE，对制造商的实验方案(BD Biosciences用户手册PT3042-1，Version #PR03300)作了一些修改。对制造商的方案的修改包括向总体积为50μL微升的反应混合物中加入DMSO(3μL)，这是因为模板DNA高GC含量的缘故，并且使用AdvantageTM-GC Genomic PolymeraseMix(BD Biosciences Clontech)来进行PCR反应，PCR反应按如下进行PCR1PCR299℃-0.05sec94℃-0.25sec/72℃-3.00min 7个循环 4个循环94℃-0.25sec/67℃-4.00min 39个循环24个循环67℃-7.00min15℃-1.00minPCR用选自下述的引物(Invitrogen，Paisley，UK)进行(从5’至3’方向列出)；RV-1 Rest 5’-ACCCACGCGTAGTCGTTGCC-3’(SEQ ID NO79)RV-1 Cellul 5’-ACCCACGCGTAGTCGTKGCCGGGG-3’(SEQ ID NO80)RV-2 biaz-fimi5’-TCGTCGTGGTCGCGCCGG-3’(SEQ ID NO81)RV-2 cella-flavi 5’-CGACGTGCTCGCGCCCG-3’(SEQ ID NO82)RV-2 cellul 5’-CGCGCCCAGCTCGCGGTG-3’(SEQ ID NO83)RV-2 turb 5’-CGGCCCCGAGGTGCGGGTGCCG-3’(SEQ ID NO84)Fw-1 biaz-fimi5’-CAGCGTCTCCGGCCTCATCCGC-3’(SEQ ID NO85)Fw-1 cella-flavi 5’-CTCGGTCTCGGGCCTCATCCGC-3’(SEQ ID NO86)Fw-1 cellul 5’-CGACGTTCCCGGCCTCGTGCGC-3’(SEQ ID NO87)
Fw-1 turb CACCGTCTCGGGGCTCATCCGC(SEQ ID NO88)Fw-2 rest AGCARCGTGTGCGCCGAGCC(SEQ ID NO89)Fw-2 cellulGGCAGCGCGTGCGCGGAGGG(SEQ ID NO90)Fw-1 gelidaGCCGCTGCTCGATCGGGTTC(SEQ ID NO91)Rv-1 gelidaGCAGTTGCCGGAGCCGCCGGACGT(SEQ ID NO92)Flavi FW1 TGCGCCGAGCCCGGCGACTCCGGC(SEQ ID NO93)Flavi FW2 GGCACGACGTACTTCCAGCCCGTGAAC(SEQ ID NO94)Flavi RV1 GACCCACGCGTAGTCGTTGCCGGGGAACGACGA(SEQ ID NO95)Flavi RV2 GAAGGTCCCCGACGGTGACGACGTGCTCGCGCC(SEQ ID NO96)Turb FW1 CAGGCGCAGGGCGTGACCTCGGGCGGGTCG(SEQ ID NO97)Turb FW2 GGCGGGACGACGTACTTCCAGCCCGTCAA(SEQ ID NO98)Cellu RV1 CACCCACGCGTAGTCGTGGCCGGGGAACGA(SEQ ID NO99)Cellu RV2 GAAGCCGCCCTGGACGGCGTACCCGATCGAGCA(SEQ ID NO100)Cellu FW1 TGCGCGGAGGGCGGCGACTCGGGCGGGTCG(SEQ ID NO101)Cellu FW2 TTCCTCTACCAGCCCGTCAACCCGATCCTA(SEQ ID NO102)Cella RV2 CGCCGCGGGGACGAACCCGCCCTCGACCGCGAA(SEQ ID NO103)Cella RV1 CGCGTAGTCGTTGCCGGGGAACGACGAGCC(SEQ ID NO104)Cella FW1 GGCCTCATCCGCACGAGCGTGTGCGCCGAG(SEQ ID NO105)Cella FW2 ACGTCGGGCGGGTCCGGCAACTGCCGCTACGGGGGC(SEQ IDNO106)Gelida RV1 GAGCCCGTACACCCGGAGGGCCTCGTTGACGGGCTGGAA(SEQ IDNO107)Gelida RV2 CGTCACGCCCTGCGCCTGGTTGCCCGCGAG(SEQ ID NO108)Gelida FW1 TCCAGCCCGTCAACGAGGCCCTCCGGGTGTACGGGCTC(SEQ IDNO109)Gelida FW2 ACGTCGGTCGCGCAGCCGAACGGTTCGTACGTC(SEQ ID NO110)Biazot RV1 CGTGGTCGCGCCGGTCGTGCCGCAGTGCCC(SEQ ID NO111)Biazot RV2 GACGACGACCGTGTTGGTAGTGACGTCGACGTACCA(SEQ ID NO112)Biazot FW1 TCCACCACGGGGTGGCGCTGCGGGACGATC(SEQ ID NO113)Biazot FW2 GTGTGCGCCGAGCCCGGCGACTCCGGCGGC(SEQ ID NO114)Turb RVC-matureGCTCGGGCCCCCACCGTCAGAGGTCACGAGCGTGAG(SEQ IDNO115)Turb FW signalATGGCACGATCATTCTGGAGGACGCTCGCCACGGCG(SEQ ID NO116)Cellu internal FWTGCTCGATCGGGTACGCCGTCCAGGGCGGCTTC(SEQ ID NO117)Cellu internal RVTAGGATCGGGTTGACGGGCTGGTAGAGGAA(SEQ ID NO118)Biazot Int Fw TGGTACGTCGACGTCACTACCAACACGGTCGTCGTC(SEQ ID NO119)Biazot Int Rv 5’-GCCGCCGGAGTCGCCGGGCTCGGCGCACAC(SEQ ID NO120)flavi Nterm5’-GTSGACGTSATCGGSGGSAACGCSTACTAC(SEQ ID NO121)flavi Cterm5’-SGCSGTSGCSGGNGANGA(SEQ ID NO122)fimi Nterm 5’-GTSGAYGTSATCGGCGGCGAYGCSTAC(SEQ ID NO123)fimi Cterm 5’-SGASGCGTANCCCTGNCC(SEQ ID NO124) 将PCR产物亚克隆入pCR4-TOPO TA克隆载体(Invitrogen)，并转化入大肠杆菌Top10 one-shot电感受态细胞(Invitrogen)。将转化子在携带有100μg/ml氨苄青霉素的2xTY培养基中温育(37℃，260 rpm，16小时)。分离的质粒DNA(使用Qiagen Qiaprep pDNA分离试剂盒分离)通过BaseClear测序。
序列分析[596]使用Vector NTI suite v.9.0.0(Invitrogen)中的ContigExpress和AlignX程序，由PCR片段序列组装出全长多核苷酸序列，使用实施例4中获得的原始多核苷酸序列作为模板，ASP成熟蛋白酶和ASP全长序列用于比对。多核苷酸序列的结果显示在表7-1中，翻译的氨基酸序列显示在表7-2中。对于每一个天然的细菌菌株，每一种同源蛋白酶的多核苷酸序列和翻译的氨基酸序列已在上面给出。
表7-1提供了ASP蛋白酶和获自其他细菌菌株的各种其他序列之间的比较信息。Asp-成熟-蛋白酶同源物的氨基酸序列信息获自13个种1.双氮纤维单胞菌DSM 201122.产黄纤维单胞菌DSM 201093.粪便纤维单胞菌DSM 201134.Cellulomonas cellasea DSM 201185.Cellulomonas gelida DSM 201116.Cellulomonas iranensis DSM 147847.Cellulomonas xylanilytica LMG 217238.Oerskovia jenensis DSM 460009.特氏厄氏菌DSM 2057710.纤维化纤维微细菌DSM 2042411.柠檬原小单孢菌DSM 4311012.Promicromonospora sukumoe DSM 4412113.Xylanibacterium ulmi LMG 21721[598]明显地，来自Cellulomonas gelida的48个氨基酸的序列对于有用的共有匹配而言太短。在此便提供了成熟Asp与剩下12个种的序列比对。至此为止，特氏厄氏菌、Cellulomonas cellasea、双氮纤维单胞菌和纤维化纤维微细菌的完整成熟序列已经被确定。然而，对于公众已知的序列信息可能还有一些问题而且序列保真性并不被保证，Cellulomonas cellasea蛋白酶明显与Asp同源(61.4％同一性)。然而，C-端区域的10个独立PCR片段的测序都在位置184给出了终止密码子，这表明没有C-端原序列。此外，纤维化纤维微细菌是纤维单胞菌的密切的亲属，并且明显具有Asp同源蛋白酶。然而，序列同一性低，只有47.7％。它在位置43-44含有4个氨基酸的插入片段，并且还不确定该蛋白质的N端从哪里开始。尽管如此，这里提供的数据明显显示，存在着与本文中描述的ASP蛋白酶具有同源性的酶。因此，本发明的目的是包括分离自纤维单胞菌属菌株69B4的ASP蛋白酶，以及其他同源蛋白酶。
在该表中，核苷酸编号是基于69B4蛋白酶的全长基因(SEQ ID NO2)，其中nt 1-84编码信号肽，nt 85-594编码N-端原序列，nt 595-1161编码成熟69B4蛋白酶，nt 1162-1485编码C-端原序列。
下面的表(表7-2)提供了关于天然分离菌株的翻译的氨基酸序列数据与全长ASP相比校的信息。

这些结果清楚地显示，微球菌亚目——包括纤维单胞菌科和原小单孢菌科在内——的细菌菌株具有与69B4蛋白酶同源的基因。在成熟69B4蛋白酶的区域，基因序列同一性在约60％-80％的范围内。这些同源序列的氨基酸序列显示出与成熟69B4蛋白酶蛋白质具有约45％-80％的同一性。与来自链霉菌亚目的成员的大多数链霉蛋白酶不同，这些来自微球菌亚目的69B4(Asp)蛋白酶同源物拥有六个半胱氨酸残基，它们在成熟69B4蛋白酶蛋白质中形成三个二硫桥键。
事实上，尽管有在此提供的序列不完全和有关保真性的问题，但本发明提供了Asp类别的蛋白酶的必要元素和与链霉蛋白酶的比较。Asp以及链霉蛋白酶C独特的特征是具有三个二硫桥键。在下述序列中，Asp氨基酸用粗体打印，充分保守的残基用下划线标出。活性位点的残基用#和双下划线标记。半胱氨酸残基用*和下划线标记。二硫键位于C17和C38、C95和C105以及C131和C158之间。
表7-3(下表)指出了ASP和链霉蛋白酶C有区别的位置

实施例8ASP同源物的质谱测序[604]在该实施例中，描述了确认DNA衍生的序列以及证实/确立成熟ASP同源物的N端和C端序列的实验。用于这些实验的微生物是1.双氮纤维单胞菌DSM 201122.产黄纤维单胞菌DSM 201093.粪便纤维单胞菌DSM 201134.Cellulomonas cellasea DSM 201187.Oerskovia jenensis DSM 460008.特氏厄氏菌DSM 205779.纤维化纤维微细菌DSM 20424[605]对微量纯化的ASP同源物进行以质谱为基础的蛋白质测序程序，该程序由下述主要步骤组成微量纯化，凝胶电泳，胶内蛋白水解消化，毛细管液相色谱电喷雾串联质谱(nanoLC-ESI-MS/MS)，质谱数据的数据库搜索和从头(de novo)测序。这些步骤的细节描述在下文中。如之前在实施例6中描述的，将浓缩的培养物样品(约200ml)加入到500ml 1M CaCl2中，14,000rpm(型号5415C Eppendorf)离心5min。将上清液在冰上冷却，用200ml 1N HCl酸化。5min之后，加入200ml50％三氯乙酸，将样品在14,000rpm(型号5415C Eppendorf)离心4min。弃除上清液，沉淀首先用水清洗，然后用90％丙酮洗涤。在快速真空干燥仪(speed vac)中干燥之后，将沉淀溶解在2X Protein Preparaion(Tris-Glycine Sample Buffer；Novex)缓冲液中，并在应用于SDS-PAGE凝胶之前，以1+1用水稀释。使用NuPAGE MESSDS分离缓冲液，进行SDS-PAGE分离。SDS-PAGE胶(1mm NuPAGE 10％Bis-Tris；Novex)用本领域已知的方法显影和染色。SDS-PAGE之后，切割下对应于ASP同源物的条带，使用本领域的标准实验方案，进行质谱肽测序。
使用毛细管液相色谱电喷雾串联质谱(nanoLC-ESI-MS/MS)，进行肽作图和测序。该分析系统由毛细管HPLC系统(型号CapLC；Waters)和质谱仪(型号QtofUltima API；Waters)组成。将肽上样到前置柱(PepMap100 C18，5um，100A，300umID×1mm；Dionex)，在毛细管柱上(Biobasic C18 75um×10cm；New Objectives)进行层析，使用0至100％溶剂B的梯度，时间为45min，流速为200nL/min(使用静态分流进样器由5uL/min的泵流速产生)。溶剂A由0.1％甲酸水溶液组成；溶剂B是0.1％甲酸乙腈溶液。用如下参数操作质谱仪喷雾电压为3.1kV；desolavationzone在150C；从400至1900m/z获得质谱，分辨率6000，v-模式。串联MS谱在数据依赖模式中获得，两个最强峰被选择，用质量依赖碰撞能(由商家指定)和2.5×10-5torr的碰撞气体(氩气)碎裂。
使用数据库搜索程序(Mascot，Matrix Science)，利用含有由ASP同源物DNA获得的序列的数据库，确定肽的身份。使用下列参数搜索数据库无酶被选定，肽误差2.5Da，MS/MS离子误差0.1Da，羧基氨甲基半胱氨酸的可变修饰(variblemodification)。对于未匹配的MS/MS谱，进行手工从头序列指定。例如，图4显示了来自产黄纤维单胞菌的N-端最大的胰蛋白酶消化肽的序列，其从该串联质谱测定得到。在表8-1中，报告了各种同源物在蛋白质水平被证实的序列的百分比以及N端和C端肽序列。

实施例9在青紫链霉菌中产生蛋白酶[608]该实施例描述了被实施用来开发由青紫链霉菌生产蛋白酶的方法的试验。因此，构建了包含编码具有蛋白水解活性的多肽的多核苷酸的质粒，并使用此质粒转化青紫链霉菌宿主细胞。用于该转化的方法更详细地描述于美国专利6,287,839和WO 02/50245中，这两份专利文献通过参考明确并入本文。
在这些试验中开发出的一种质粒被命名为″pSEG69B4T″。该质粒的构建利用了一种pSEGCT质粒载体(参见WO 02/50245)。被可操作地连接到编码69B4蛋白酶的结构基因上的葡萄糖异构酶(″GI″)启动子被用来驱动蛋白酶的表达。通过融合-PCR技术构建GI启动子和69B4信号序列、N端原序列和成熟序列之间的融合，其作为XbaI-BamHI片段。将该片段连接到用XbaI-BamHI消化的质粒pSEGCT，产生质粒pSEG69B4T(参见图6)。尽管本说明书提供了具体的表达载体，但应该理解的是，利用不同的启动子和/或信号序列与69B4蛋白酶的各种原序列的组合的其他载体，也可以用于本发明。
在这些试验中开发出的另一种质粒被命名为″pSEA469B4CT″(参见图7)。如同pSEG69B4T质粒的情况，pSEGCT质粒被用来构建这种质粒。为了产生pSEA469B4CT，将黑曲霉(调控序列)(″A4″)启动子可操作地连接到编码69B4蛋白酶的结构基因上，被用于驱动蛋白酶的表达。通过融合-PCR技术构建A4启动子和CelA(来自蓝色链霉菌)信号序列、aspN端原序列和asp成熟序列之间的融合，其作为XbaI-BamHI片段。将该片段连接到用XbaI-BamHI消化的质粒pSEA4GCT，产生质粒pSEA469B4CT(参见图7)。A4(黑曲霉)启动子区域的序列是1 TCGAA CTTCAT GTTCGA GTTCTT GTTCAC GTAGAA GCCGGA GATGTG AGAGGTAGCTT GAAGTA CAAGCT CAAGAA CAAGTG CATCTT CGGCCT CTACAC TCTCCA61 GATCTG GAACTG CTCACC CTCGTT GGTGGT GACCTG GAGGTA AAGCAA GTGACC CTTCTGCTAGAC CTTGAC GAGTGG GAGCAA CCACCA CTGGAC CTCCAT TTCGTT CACTGG GAAGAC121 GCGGAG GTGGTA AGGAAC GGGGTT CCACGG GGAGAG AGAGAT GGCCTT GACGGT CTTGGGCGCCTC CACCAT TCCTTG CCCCAA GGTGCC CCTCTC TCTCTA CCGGAA CTGCCA GAACCC181 AAGGGG AGCTTC NGCGCG GGGGAG GATGGT CTTGAG AGAGGG GGAGCT AGTAAT GTCGTATTCCCC TCGAAG NCGCGC CCCCTC CTACCA GAACTC TCTCCC CCTCGA TCATTA CAGCAT241 CTTGGA CAGGGA GTGCTC CTTCTC CGACGC ATCAGC CACCTC AGCGGA GATGGC ATCGTGGAACCT GTCCCT CACGAG GAAGAG GCTGCG TAGTCG GTGGAG TCGCCT CTACCG TAGCAC301 CAGAGA CAGACCGTCTCT GTCTGG (SEQ ID NO130) 在这些试验中，使用本领域已知的原生质体方法，将宿主青紫链霉菌TK23用上述质粒中的任一种质粒转化(参见例如Hopwood等.Genetic Manipulation ofStreptomyces，A Laboratory Manual，The John Innes Foundation，Norwich，UnitedKingdom )。
转化的培养物被放大培养，以提供两份发酵培养物。在各个不同的时间点，移取发酵肉汤的样品用于分析。对于该试验的目的，脱脂奶程序(skimmed milkprocedure)被用于确认成功的克隆。在这些方法中，将30μl的摇瓶上清液点入脱脂奶琼脂板的穿刺孔中，并在37℃温育。温育过夜后，通过视觉检查温育的板上晕圈的存在。对于该试验的目的，还分析了同样的样品的蛋白酶活性和分子量(SDS-PAGE)。在发酵过程的末期，通过SDS-PAGE观察全长蛋白酶。
发酵肉汤的样品按如下被分析取得10μl的稀释的上清液，加入到190μlAAPF底物溶液(浓度1mg/ml，在0.1M Tris/0.005％ TWEEN，pH 8.6中)。监测由于p-硝基苯胺的释放而导致的410nm吸光度的增加的速率(25℃)。使用pSEG69B4T获得的3个克隆(X、Y、W)和使用pSEA469B4T获得的2个克隆的发酵肉汤的分析结果表明，Asp被两种构建物表达。able XXI.两个克隆(pSEA469B4T)的结果。事实上，在这些试验中获得的结果显示，通过使用这两种表达载体，编码具有蛋白水解活性的多肽的多核苷酸在青紫链霉菌中表达。尽管本实施例描述了这两种载体，可以考虑的是，其他表达载体以及其他构建物也可以用于本发明，所述其他表达载体在pSEA4CT骨架(载体)中使用不同的启动子和/或信号序列并结合以69B4蛋白酶+/-N端和C端原序列的不同组合。
实施例10在枯草芽孢杆菌中产生蛋白酶[614]在该实施例中，描述了在枯草芽孢杆菌中产生蛋白酶69B4(在本文中也称为″ASP″、″Asp″和″ASP蛋白酶″和″Asp蛋白酶″)的方法。在该实施例中，描述了将质粒pHPLT-ASP-C1-2(参见表10-1；和图9)转化入枯草芽孢杆菌。转化如本领域所知的那样进行(参见例如WO 02/14490，通过参考并入本文)。为了优化ASP在枯草芽孢杆菌中的表达，通过DNA2.0产生合成的DNA序列，并将它用于这些表达试验中。下面提供的DNA序列(合成的ASP DNA序列)编码野生型ASP前体蛋白质，其中针对芽孢杆菌属种对密码子使用进行了调整
ATGACACCACGAACTGTCACAAGAGCTCTGGCTGTGGCAACAGCAGCTGCTACACTCTTGGCTGGGGGTATGGCAGCACAAGCTAACGAACCGGCTCCTCCAGGATCTGCATCAGCCCCTCCACGATTAGCTGAAAAACTTGACCCTGACTTACTTGAAGCAATGGAACGCGATCTGGGGTTAGATGCAGAGGAAGCAGCTGCAACGTTAGCTTTTCAGCATGACGCAGCTGAAACGGGAGAGGCTCTTGCTGAGGAACTCGACGAAGATTTCGCGGGCACGTGGGTTGAAGATGATGTGCTGTATGTTGCAACCACTGATGAAGATGCTGTTGAAGAAGTCGAAGGCGAAGGAGCAACTGCTGTGACTGTTGAGCATTCTCTTGCTGATTTAGAGGCGTGGAAGACGGTTTTGGATGCTGCGCTGGAGGGTCATGATGATGTGCCTACGTGGTACGTCGACGTGCCTACGAATTCGGTAGTCGTTGCTGTAAAGGCAGGAGCGCAGGATGTAGCTGCAGGACTTGTGGAAGGCGCTGATGTGCCATCAGATGCGGTCACTTTTGTAGAAACGGACGAAACGCCTAGAACGATGTTCGACGTAATTGGAGGCAACGCATATACTATTGGCGGCCGGTCTAGATGTTCTATCGGATTCGCAGTAAACGGTGGCTTCATTACTGCCGGTCACTGCGGAAGAACAGGAGCCACTACTGCCAATCCGACTGGCACATTTGCAGGTAGCTCGTTTCCGGGAAATGATTATGCATTCGTCCGAACAGGGGCAGGAGTAAATTTGCTTGCCCAAGTCAATAACTACTCGGGCGGCAGAGTCCAAGTAGCAGGACATACGGCCGCACCAGTTGGATCTGCTGTATGCCGCTCAGGTAGCACTACAGGTTGGCATTGCGGAACTATCACGGCGCTGAATTCGTCTGTCACGTATCCAGAGGGAACAGTCCGAGGACTTATCCGCACGACGGTTTGTGCCGAACCAGGTGATAGCGGAGGTAGCCTTTTAGCGGGAAATCAAGCCCAAGGTGTCACGTCAGGTGGTTCTGGAAATTGTCGGACGGGGGGAACAACATTCTTTCAACCAGTCAACCCGATTTTGCAGGCTTACGGCCTGAGAATGATTACGACTGACTCTGGAAGTTCCCCTGCTCCAGCACCTACATCATGTACAGGCTACGCAAGAACGTTCACAGGAACCCTCGCAGCAGGAAGAGCAGCAGCTCAACCGAACGGTAGCTATGTTCAGGTCAACCGGAGCGGTACACATTCCGTCTGTCTCAATGGACCTAGCGGTGCGGACTTTGATTTGTATGTGCAGCGATGGAATGGCAGTAGCTGGGTAACCGTCGCTCAATCGACATCGCCGGGAAGCAATGAAACCATTACGTACCGCGGAAATGCTGGATATTATCGCTACGTGGTTAACGCTGCGTCAGGATCAGGAGCTTACACAATGGGACTCACCCTCCCCTGA(SEQ IDNO131)[615]在上述序列中，粗体表示编码成熟蛋白酶的DNA，标准字体表示前导序列，下划线表示N端和C端原序列。
合成ASP基因的表达[616]将Asp表达序列盒构建在pXX-KpnI(参见图15)或p2JM103-DNNDPI(参见图16)载体中，随后克隆入pHPLT载体(参见图17)，以便在枯草芽孢杆菌中表达ASP。pXX-KpnI是基于pUC的载体，携带有驱动表达的aprE启动子(枯草芽孢杆菌)、cat基因、重复的aprE启动子，用于在枯草芽孢杆菌中扩增拷贝数。bla基因使得能够在大肠杆菌中选择性生长。KpnI，引入到核糖体结合位点中，aprE启动子区域的下游，以及HindIII位点使得能够将Asp表达序列盒克隆到pXX-KpnI中。载体p2JM103-DNNDPI含有aprE启动子(枯草芽孢杆菌)，以驱动BCE103纤维素酶核心(来自专性嗜碱芽孢杆菌的内切纤维素酶；参见ShaW等，J.Mol.Biol.，320303-309 )的表达，所述纤维素酶核心与酸不稳定性连接物(DDNDPI[SEQ IDNO132]；参见Segalas等，FEBS Lett.，371171-175 )处于同一阅读框中。将ASP表达序列盒(BamHI和HindIII)与BCE103-DDNDPI融合蛋白融合。当分泌时，ASP从纤维素酶核心上切割下来，变成成熟蛋白酶。
pHPLT(参见图17；和Solingen等，Extremophiles 5333-341 )含有地衣芽孢杆菌的热稳定性淀粉酶LAT启动子(PLAT)，接着是XbaI和HpaI限制性位点，用于克隆ASP表达构建物。下面的序列是带有DNNDPI酸不稳定性连接物的BCE103纤维素酶核心的序列。在该序列中，粗体表示酸不稳定性连接物，而标准字体表示BCE103核心。
V R S K K L W I S L L F A L T L I F T M1 GTGAGA AGCAAA AAATTG TGGATC AGCTTG TTGTTT GCGTTA ACGTTA ATCTTT ACGATGCACTCT TCGTTT TTTAAC ACCTAG TCGAAC AACAAA CGCAAT TGCAAT TAGAAA TGCTACA F S N M S A Q A D D Y S V V E E H G Q61GCGTTC AGCAAC ATGAGC GCGCAG GCTGAT GATTAT TCAGTT GTAGAG GAACAT GGGCAACGCAAG TCGTTG TACTCG CGCGTC CGACTA CTAATA AGTCAA CATCTC CTTGTA CCCGTTL S I S N G E L V N E R G E Q V Q L K G121 CTAAGT ATTAGT AACGGT GAATTA GTCAAT GAACGA GGCGAA CAAGTT CAGTTA AAAGGGGATTCA TAATCA TTGCCA CTTAAT CAGTTA CTTGCT CCGCTT GTTCAA GTCAAT TTTCCCM S S H G L Q W Y G Q F V N Y E S M K W181 ATGAGT TCCCAT GGTTTG CAATGG TACGGT CAATTT GTAAAC TATGAA AGCATG AAATGGTACTCA AGGGTA CCAAAC GTTACC ATGCCA GTTAAA CATTTG ATACTT TCGTAC TTTACCL R D D W G I T V F R A A M Y T S S G G241 CTAAGA GATGAT TGGGGA ATAACT GTATTC CGAGCA GCAATG TATACC TCTTCA GGAGGAGATTCT CTACTA ACCCCT TATTGA CATAAG GCTCGT CGTTAC ATATGG AGAAGT CCTCCTY I D D P S V K E K V K E T V E A A I D301 TATATT GACGAT CCATCA GTAAAG GAAAAA GTAAAA GAGACT GTTGAG GCTGCG ATAGACATATAA CTGCTA GGTAGT CATTTC CTTTTT CATTTT CTCTGA CAACTC CGACGC TATCTGL G I Y V I I D W H I L S D N D P N I Y361 CTTGGC ATATAT GTGATC ATTGAT TGGCAT ATCCTT TCAGAC AATGAC CCGAAT ATATATGAACCG TATATA CACTAG TAACTA ACCGTA TAGGAA AGTCTG TTACTG GGCTTA TATATAK E E A K D F F D E M S E L Y G D Y P N421 AAAGAA GAAGCG AAGGAT TTCTTT GATGAA ATGTCA GAGTTG TATGGA GACTAT CCGAATTTTCTT CTTCGC TTCCTA AAGAAA CTACTT TACAGT CTCAAC ATACCT CTGATA GGCTTAV I Y E I A N E P N G S D V T W D N Q I481 GTGATA TACGAA ATTGCA AATGAA CCGAAT GGTAGT GATGTT ACGTGG GACAAT CAAATACACTAT ATGCTT TAACGT TTACTT GGCTTA CCATCA CTACAA TGCACC CTGTTA GTTTATK P Y A E E V I P V I R D N D P N N I V541 AAACCG TATGCA GAAGAA GTGATT CCGGTT ATTCGT GACAAT GACCCT AATAAC ATTGTTTTTGGC ATACGT CTTCTT CACTAA GGCCAA TAAGCA CTGTTA CTGGGA TTATTG TAACAAI V G T G T W S Q D V H H A A D N Q L A601 ATTGTA GGTACA GGTACA TGGAGT CAGGAT GTCCAT CATGCA GCCGAT AATCAG CTTGCATAACAT CCATGT CCATGT ACCTCA GTCCTA CAGGTA GTACGT CGGCTA TTAGTC GAACGTD P N V M Y A F H F Y A G T H G Q N L R661 GATCCT AACGTC ATGTAT GCATTT CATTTT TATGCA GGAACA CATGGA CAAAAT TTACGACTAGGA TTGCAG TACATA CGTAAA GTAAAA ATACGT CCTTGT GTACCT GTTTTA AATGCTD Q V D Y A L D Q G A A I F V S E W G T721 GACCAA GTAGAT TATGCA TTAGAT CAAGGA GCAGCG ATATTT GTTAGT GAATGG GGGACACTGGTT CATCTA ATACGT AATCTA GTTCCT CGTCGC TATAAA CAATCA CTTACC CCCTGTS A A T G D G G V F L D E A Q V W I D F781 AGTGCA GCTACA GGTGAT GGTGGT GTGTTT TTAGAT GAAGCA CAAGTG TGGATT GACTTT
TCACGT CGATGT CCACTA CCACCA CACAAA AATCTA CTTCGT GTTCAC ACCTAA CTGAAAM D E R N L S W A N W S L T H K D E S S841 ATGGAT GAAAGA AATTTA AGCTGG GCCAAC TGGTCT CTAACG CATAAG GATGAG TCATCTTACCTA CTTTCT TTAAAT TCGACC CGGTTG ACCAGA GATTGC GTATTC CTACTC AGTAGAA A L M P G A N P T G G W T E A E L S P901 GCAGCG TTAATG CCAGGT GCAAAT CCAACT GGTGGT TGGACA GAGGCT GAACTA TCTCCACGTCGC AATTAC GGTCCA CGTTTA GGTTGA CCACCA ACCTGT CTCCGA CTTGAT AGAGGTS G T F V R E K I R E S A S D N N D P I961 TCTGGT ACATTT GTGAGG GAAAAA ATAAGA GAATCA GCATCT GACAAC AATGAT CCCATAAGACCA TGTAAA CACTCC CTTTTT TATTCT CTTAGT CGTAGA CTGTTG TTACTA GGGTAT(DNA；SEQ ID NO133)和(氨基酸；SEQ ID NO134)[618]将Asp表达盒克隆入pXX-KpnI载体，其含有编码下述信号肽的DNA野生型Asp信号肽，或由融合到25个Asp C-端信号肽氨基酸的5个枯草蛋白酶AprEN-端信号肽氨基酸构建的杂合信号肽(MRSKKRTVTRALAVATAAATLLAGGMAAQA(SEQ ID NO135))，或由融合到19个asp C-端信号肽氨基酸的11个枯草蛋白酶AprE N-端信号肽氨基酸构建的杂合信号肽(MRSKKLWISLLLAVATAAATLLAGGMAAQA(SEQ ID NO136))。这些表达盒也与编码asp C-端原序列的DNA构建在同一阅读框中。用于克隆到p2JM103-DNNDPI载体中的另一表达盒编码ASP N-端原序列和成熟序列。
将克隆到pXX-KpnI或p2JM103-DNNDPI载体中的Asp表达盒转化到大肠杆菌(Electromax DH10B，Invitrogen，目录编号12033-015)中。使用的引物和克隆策略在表10-1中给出。然后将表达序列盒从这些载体中克隆出来，并导入到pHPLT表达载体中，以转化入枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR，pxyIA-comK)菌株。将ASP表达盒克隆入pHPLT的引物和克隆策略在表10-2中给出。如WO 02/14490中所描述，转化枯草芽孢杆菌，WO 02/14490通过参考并入本文。图12-21提供了在此描述的各种质粒的质粒图谱。
表10-1.pXX-KpnI和p2JM103-DNNDPI中的ASP

引物从MWG和Invitrogen获得。根据Invitrogen的方案，Initrogen PlatinumTaq DNA高保真聚合酶(目录编号11304-029)被用于PCR扩增(0.2μM引物，25至30个循环)。使用Invitrogen T4 DNA连接酶(目录编号15224-025)，利用Invitrogen推荐用于粘性末端的通用克隆的方案，完成ASP表达盒和主体载体的连接反应。
含有p2JM103-ASP载体或pHPLT-ASP载体之一的枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR，pxyIA-comK)转化子的选择性生长在含有25ml Synthetic Maxatase Medium(SMM)的摇瓶中进行，所述SMM用0.97g/l CaCl2·6H2O代替了0.5g/l CaCl2(参见美国专利5,324,653，该专利通过参考并入本文)，并含有25mg/L氯霉素或20mg/L新霉素。该生长导致产生了具有蛋白水解活性的分泌的ASP蛋白酶。然而。使用NuPage Novex 10％ Bis-Tris胶(Invitrogen，目录编号NP0301BOX)进行凝胶分析。为了制备用于分析的样品，将2体积的上清液与1体积的1M HCI、1体积4×LDS样品缓冲液(Invitrogen，目录编号NP0007)和1％ PMSF(20mg/ml)混合，然后在70℃加热10分钟。然后将25μL的每一样品与10μL的SeeBlue和2个预染色的蛋白质标准(Invitrogen，目录编号LC5925)一起上样到胶上。结果清楚地显示，本实施例中描述的所有asp克隆策略都收获了由枯草芽孢杆菌产生的足够数量的活性Asp。
此外，按下述方法分析了同样的发酵肉汤的样品取得10μl的稀释的上清液，加入到190μl AAPF底物溶液(浓度1mg/ml，在0.1M Tris/0.005％ TWEEN_，pH 8.6中)。监测由于p-硝基苯胺的释放导致的410nm吸光度的增加的速率(25℃)，因为它提供了产生的ASP浓度的量度。这些结果表明，所有构建物都导致产生可测量的ASP蛋白酶。
通过比较带有合成和天然asp基因的pHPLT-ASP-c-1-2构建物在枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR，pxyIA-comK)菌株中的表达水平，研究了合成的asp基因在枯草芽孢杆菌中的影响。用下述引物，使用platinum pfx聚合酶(Invitrogen)，从含有天然的asp基因的质粒扩增天然的基因。
AK04-12.1NheI thru RBS
TTATGCGAGGCTAGCAAAAGGAGAGGGTAAAGAGTGAGAAGCAAAAAACG(SEQ ID NO165)[625]AK04-11RBS thru 5 aa aprE用于ASP天然C1融合在pHPLT中taaagagtgagaagcaaaaaacgcacagtcacgcgggccctg(SEQ ID NO166)[626]AK04-13HpaI天然成熟ASP的3′gtcctctgttaacttacgggctgctgcccgagtcc(SEQ ID NO167)[627]下述条件被用于这些PCR94℃，2分钟；然后进行25个这样的循环94℃，45秒、60℃，30秒和68℃，2分钟30秒；然后68℃，5分钟。所得的PCR产物在E-胶(Invitrogen)上电泳，切割，并用凝胶抽提试剂盒(Qiagen)纯化。通过使用连接酶(T4 DNA Ligase，NEB)，完成含有天然ASP的该片段和pHPLT载体的连接反应，并直接转化入枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR、pxyIA-comK)。向枯草芽孢杆菌的转化如WO 02/14490 A2中描述地进行，WO 02/14490 A2通过参考并入本文。
通过在37℃，在摇瓶中培养来产生Asp蛋白质，所用的培养基含有下述成分0.03g/L MgSO4、0.22g/L K2HPO4、21.3g/L Na2HPO4·7H2O、6.1g/L NaH2PO4·H2O、3.6g/L尿素、7g/L大豆粉、70g/L Maltrin M150和42g/L葡萄糖，最终pH为7.5。在这些试验中，发现携带有合成的基因序列盒的宿主的生产水平，比携带天然基因序列盒的宿主的生长水平高3倍。
在另外的试验中，使用sacB启动子和aprE信号肽，研究了ASP在枯草芽孢杆菌中的表达。使用TGO聚合酶(Roche)和下述引物，从含有合成的asp基因的质粒中扩增基因CF 520(+)融合ASP(pro)到aprE ssGCAACATGTCTGCGCAGGCTAACGAACCGGCTCCTCCAGGA(SEQ ID NO168)CF 525(-)Asp基因的末端HindIIIGACATGACATAAGCTTAAGGGGAACTTCCAGAGTC(SEQ ID NO169)[630]使用TGO聚合酶(Roche)和下述引物，从质粒pJHsacBJ2中扩增sacB启动子(枯草芽孢杆菌)、来自aprE的信使RNA的起始(+1)和aprE信号肽CF 161(+)EcoRI在sacB启动子的起始处GAGCCGAATTCATATACCTGCCGTT(SEQ ID NO170)CF 521(-)CF520的反向互补物TCCTGGAGGAGCCGGTTCGTTAGCCTGCGCAGACATGTTGC(SEQ ID NO171)[631]下述PCR条件被用于扩增这两个片段94℃，2分钟；然后进行30个循环94℃，30秒、50℃，1分钟和66℃，1分钟；然后72℃，7分钟。所得的PCR产物在E-胶(Invitrogen)上电泳，切割，并用凝胶抽提试剂盒(Qiagen)纯化。
另外，PCR重叠延伸融合(PCR overlap extension fusion)(Ho，Gene，1551-59 )被用来将上述基因片段融合到sacB启动子-aprE信号肽片段，其中使用PFX聚合酶(Invitrogen)和下述引物CF 161(+)EcoRI在sacB启动子的起始处GAGCCGAATTCATATACCTGCCGTT(SEQ ID NO170)CF 525(-)Asp基因末端HindIIIGACATGACATAAGCTTAAGGGGAACTTCCAGAGTC(SEQ ID NO169)[633]下述条件被用于这些PCR94℃，2分钟；然后25个循环94℃，45秒、60℃，30秒和68℃，2分钟30秒；然后68℃，5分钟。所得的PCR融合产物在E-胶(Invitrogen)上电泳，切割，并用凝胶抽提试剂盒(Qiagen)纯化。纯化的融合物被切(EcoRI/HindIII)，并连接(T4 DNA连接酶，NEB)到含有强转录终止子的EcoRI/HindIII pJH101(Ferrari等，J.Bacteriol.，152809-814 )载体中。将连接混合物转化入感受态大肠杆菌细胞(Top 10化学感受态细胞，Invitrogen)，进行质粒制备以回收质粒(Qiagen spin-prep)。
将质粒pJHsacB-ASP(1-96 sacB启动子；97-395 aprE+1直至aprE ss的末端；和396-1472原+成熟asp；参见下面提供的序列)转化到枯草芽孢杆菌。向枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR、pxyIA-comK)菌株的转化如WO 02/14490 A2中描述地进行，WO 02/14490 A2通过参考并入本文。从菌株的过夜培养物(生长在LB培养基中)中提取染色体DNA，然后转化到菌株BG 3594，并命名为“CF 202”。该菌株在指示平板(LA+1.6％脱脂奶)上产生清晰的晕圈。
pJHsacB-ASP序列
CATCACATATACCTGCCGTTCACTATTATTTAGTGAAATGAGATATTATGATATTTTCTGAATTGTGATTAAAAAGGCAACTTTATGCCCATGCAACAGAAACTATAAAAAATACAGAGAATGAAAAGAAACAGATAGATTTTTTAGTTCTTTAGGCCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCAAACAAAAGAGGAAAATAGACCAGTTGCAATCCAAACGAGAGTCTAATAGAATGAGGTCacaGAATAGTCTTTTAAGTAAGTCTACTCTGAATTTTTTTAAAAGGAGAGGGTAAAGAgtgAGAAGCAAAAAATTGTGGATCAGCTTGTTGTTTGCGTTAACGTTAATCTTTACGATGGCGTTCAGCAACATGTCTGCGCAGGCTaacgaaccggctcctccaggatctgcatcagcccctccacgattagctgaaaaacttgaccctgacttacttgaagcaatggaacgcgatctggggttagatgcagaggaagcagctgcaacgttagcttttcagcatgacgcagctgaaacgggagaggctcttgctgaggaactcgacgaagatttcgcgggcacgtgggttgaagatgatgtgctgtatgttgcaaccactgatgaagatgctgttgaagaagtcgaaggcgaaggagcaactgctgtgactgttgagcattctcttgctgatttagaggcgtggaagacggttttggatgctgcgctggagggtcatgatgatgtgcctacgtggtacgtcgacgtgcctacgaattcggtagtcgttgctgtaaaggcaggagcgcaggatgtagctgcaggacttgtggaaggcgctgatgtgccatcagatgcggtcacttttgtagaaacggacgaaacgcctagaacgatgttcgacgtaattggaggcaacgcatatactattggcggccggtctagatgttctatcggattcgcagtaaacggtggcttcattactgccggtcactgcggaagaacaggagccactactgccaatccgactggcacatttgcaggtagctcgtttccgggaaatgattatgcattcgtccgaacaggggcaggagtaaatttgcttgcccaagtcaataactactcgggcggcagagtccaagtagcaggacatacggccgcaccagttggatctgctgtatgccgctcaggtagcactacaggttggcattgcggaactatcacggcgctgaattcgtctgtcacgtatccagagggaacagtccgaggacttatccgcacgacggtttgtgccgaaccaggtgatagcggaggtagccttttagcgggaaatcaagcccaaggtgtcacgtcaggtggttctggaaattgtcggacggggggaacaacattctttcaaccagtcaacccgattttgcaggcttacggcctgagaatgattacgactgactctggaagttcccctTAAGCTTAAAAAACCGGCCTTGGCCCCGCCGGTTTTTTATTATTTTTCTTCCTCCGCATGTTCAATCCGCTCCATAATCGACGGATGGCTCCCTCTGAAAATTTTAACGAGAAACGGCGGGTTGACCCGGCTCAGTCCCGTAACGGCCAAGTCCTGAAACGTCTCAATCGCCGCTTCCCGGTTTCCGGTCAGCTCAATGCCGTAACGGTCGGCGGCGTTTTCCTGATACCGGGAGACGGCATTCGTAATCGGATCCCGGACGCATCGTGGCCGGCATCACCGGCGCCACAGGTGCGGTTGCTGGCGCCTATATCGCCGACATCACCGATGGGGAAGATCGGGCTCGCCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTGGGTATGGTGGCAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCGGCGGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATAAGGGAGAGCGTCGACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTCGGCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTGCGGTATTCGGAATCTTGCACGCCCTCGCTCAAGCCTTCGTCACTGGTCCCGCCACCAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCATGGCGGCCGACGCGCTGGGCTACGTCTTGCTGGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATGATTCTTCTCGCTTCCGGCGGCATCGGGATGCCCGCGTTGCAGGCCATGCTGTCCAGGCAGGTAGATGACGACCATCAGGGACAGCTTCAAGGATCGCTCGCGGCTCTTACCAGCCTAACTTCGATCACTGGACCGCTGATCGTCACGGCGATTTATGCCGCCTCGGCGAGCACATGGAACGGGTTGGCATGGATTGAGGCGCCGCCCTATACCTTATTTATGTTACAGTAATATTGACTTTTAAAAAAGGATTGATTCTAATGAAGAAAGCAGACAAGTAAGCCTCCTAAATTCACTTTAGATAAAAATTTAGGAGGCATATCAAATGAACTTTAATAAAATTGATTTAGACAATTGGAAGAGAAAAGAGATATTTAATCATTATTTGAACCAACAAACGACTTTTAGTATAACCACAGAAATTGATATTAGTGTTT
TATACCGAAACATAAAACAAGAAGGATATAAATTTTACCCTGCATTTATTTTCTTAGTGACAAGGGTGATAAACTCAAATACAGCTTTTAGAACTGGTTACAATAGCGACGGAGAGTTAGGTTATTGGGATAAGTTAGAGCCACTTTATACAATTTTTGATGGTGTATCTAAAACATTCTCTGGTATTTGGACTCCTGTAAAGAATGACTTCAAAGAGTTTTATGATTTATACCTTTCTGATGTAGAGAAATATAATGGTTCGGGGAAATTGTTTCCCAAAACACCTATACCTGAAAATGCTTTTTCTCTTTCTATTATTCCATGGACTTCATTTACTGGGTTTAACTTAAATATCAATAATAATAGTAATTACCTTCTACCCATTATTACAGCAGGAAAATTCATTAATAAAGGTAATTCAATATATTTACCGCTATCTTTACAGGTACATCATTCTGTTTGTGATGGTTATCATGCAGGATTGTTTATGAACTCTATTCAGGAATTGTCAGATAGGCCTAATGACTGGCTTTTATAATATGAGATAATGCCGACTGTACTTTTTACAGTCGGTTTTCTAATGTCACTAACCTGCCCCGTTAGTTGAAGAAGGTTTTTATATTACAGCTCCAGATCCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGCGATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAACACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTTCAA(SEQ ID NO172) 研究了asp基因在九种蛋白酶已被剔除的枯草芽孢杆菌宿主中的表达。将质粒pHPLT-ASP-C1-2(参见表10-2和图9)转化入枯草芽孢杆菌(ΔaprE、ΔnprE、Δepr、ΔispA、Δbpr、Δvpr、ΔwprA、Δmpr-ybfJ、ΔnprB)和(degUHy32、oppA、ΔspoIIE3501、amyE(xyIRPxyIAcomK-ermC)。如本领域所知地进行转化(参见例如WO 02/14490，通过参考并入本文)。通过在37℃在摇瓶中进行培养产生Asp蛋白，所用的培养基是MBD培养基，一种基于MOPS的确定成分培养基。MBD培养基基本上如本领域所知地被制备(参见Neidhardt等，J.Bacteriol.，119736-747 )，不同的是从基础培养基中省去了NH4Cl2、FeSO4和CaCl2，使用了3mM K2HPO4，并且该基础培养基补充以60mM尿素、75g/L葡萄糖和1％大豆蛋白胨。而且，微量营养物被配制为100×储液，在1升中含有400mg FeSO4·7H2O、100mg MnSO4·H2O、100mgZnSO4·7H2O、50mg CuCl2·2H2O、100mg CoCl2·6H2O、100mg NaMoO4·2H2O、100mgNa2B4O7·10H2O、10ml 1M CaCl2和10ml 0.5M柠檬酸钠。发现在这些试验中获得的表达水平相当高。
在其他实施方案中，发现“共有(consensus)”启动子诸如那些通过位点饱和诱变开发的“共有”启动子可以用于本发明，那些通过位点饱和诱变开发的启动子与枯草芽孢杆菌的营养“δ A型”启动子在“-10”和“-35”区域确定的共有区域更加相符(参见Voskuil等，Mol.Microbiol.，17271-279 )。然而，本发明不旨在局限于任何特定的共有启动子，因为可考虑的是，在芽孢杆菌细胞中发挥功能的其他启动子也可以用于本发明。
实施例11在克劳氏芽孢杆菌中产生蛋白酶[638]在该实施例中，描述了在克劳氏芽孢杆菌中产生蛋白酶69B4(在此也称为″Asp″)的实验。为了在克劳氏芽孢杆菌中表达Asp蛋白，由于其独特的调节系统的缘故，有必要使用在该嗜碱微生物中起作用的启动子。克劳氏芽孢杆菌PB92的碱性丝氨酸蛋白酶(MAXACAL_蛋白酶)的产生图谱显示，它拥有精密调节的强启动子(此处称为″MXL-prom.″；SEQ ID NOS173、174和175，参见图18)。除了启动子区域，也已知信号序列(前导序列)对于克劳氏芽孢杆菌分泌蛋白质是非常重要的。因此，设计了3个构建物，其携带有MAXACAL_蛋白酶启动子区域以及MAXACAL_蛋白酶前导序列和Asp前导序列的不同融合物，它们位于N-端原序列和成熟Asp蛋白的前面，所述的不同融合物是将MAXACAL_蛋白酶前导序列的3、6和27个氨基酸分别融合到Asp前导序列的25、25和0个氨基酸。
为了制备这些构建物，必须扩增DNA片段以使得能够进行融合。因此，根据制造商的说明，用Phusion高保真聚合酶(Finnzymes)对MAXACAL_蛋白酶和Asp模板DNA进行PCR。
用下述引物进行PCR反应(粗体表示引物的MAXACAL_蛋白酶部分)，引物在MWG-Biotech AG合成1克劳氏芽孢杆菌-3Fagggaaccgaatgaagaaacgaactgtcacaagagctctg(SEQ IDNO176)2克劳氏芽孢杆菌-3Rcagagctcttgtgacagttcgtttcttcattcggttccct(SEQ ID NO177)3克劳氏芽孢杆菌-6Faatgaagaaaccgttggggcgaactgtcacaagagctctg(SEQ IDNO178)4克劳氏芽孢杆菌-6Rcagagctcttgtgacagttcgccccaacggtttcttcatt(SEQ ID NO179)5克劳氏芽孢杆菌-27Fagttcatcgatcgcatcggctaacgaaccggctcctccagga(SEQ IDNO180)6克劳氏芽孢杆菌-27Rtcctggaggagccggttcgttagccgatgcgatcgatgaact(SEQ IDNO181)7克劳氏芽孢杆菌-载体5′tcagggggatcctagattctgttaacttaacgtt.(SEQ ID NO182)该引物含有来自启动子区域的HpaI-位点(GTTAAC)，以及用于帮助克隆的BamHI位点(GGATCC)(都加以下划线)。
8pHPLT-HindIII-Rgtgctgttttatcctttaccttgtctcc(SEQ ID NO183)。该引物的序列位于pHPLT-ASP-C1-2的HindIII位点的上游不远处(参见表10-2)。
表11-1中，″pMAX4″指WO 88/06623中描述的模板，WO 88/06623通过参考并入本文。用BamHI和HindIII消化PCR片段3F3R、6F6R、27F27R。消化的PCR片段用T4连接酶(Invitrogen)连接入由BamHI+HindIII开环的质粒pHPLT-ASP-C1-2中(参见图18)。连接产物被转化入感受态枯草芽孢杆菌细胞(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR、pxyIA-comK；参见例如WO 02/14490，其通过参考并入本文)，并用新霉素(20mg/l)选择。含有新霉素的心浸出液-琼脂板被用于鉴定新霉素抗性菌落。根据制造商的说明，使用Qiagen的质粒分离试剂盒，分离出枯草芽孢杆菌转化子的DNA，并在一个管子中用NcoI+HpaI一起消化之后，通过它们的消化谱型，检测融合的MAXACAL_蛋白酶-Asp片段的出现。用于该实施例的限制性酶(即BamHI、HindIII、NcoI和HpaI)都购自NEB，并根据供应商的说明书使用。用限制性酶(NcoI+HpaI)消化产生2个条带的枯草芽孢杆转化子DNA被用于转化阴性克劳氏芽孢杆菌菌株PBT142原生质体细胞(这些都衍生自PB92)。
根据专利WO 88/06623中针对嗜碱芽孢杆菌(重命名为劳氏芽孢杆菌)菌株PB92的原生质体转化而描述的方案，进行克劳氏芽孢杆菌菌株PBT142的原生质体转化，专利WO 88/06623通过参考并入本文。对该方案所作的修改是，再生平板(regeneration plate)使用了另一种配方，即，替代1.5％琼脂，使用8.0g/l Gelritegellam胶(Kelco)。此外，替代1000mg/l新霉素，使用20mg/l新霉素，如Van derLaan等(Van der Laan等，Appl.Environ.Microbiol.，57901-909 )所述。
使用如上所述的同样的方案，将分离自枯草芽孢杆菌的所有3种构建物(见上)的DNA转化入克劳氏芽孢杆菌PBT142原生质体。通过影印培养在含有20mg/l新霉素的心浸出液琼脂板上，选择克劳氏芽孢杆菌PBT142转化子。携带不同的构建物的克劳氏芽孢杆菌菌株被获得，如表11-2所示。
这3种菌株在含有100ml Synthetic Maxatase Medium(SMM)(参见美国专利5,324,653，该专利通过参考并入本文)的摇瓶中发酵。然而，替代0.97g/lCaCl2·6H2O，使用了0.5g/l CaCl2。而且，使用0.25ml/l Basildon，来替代0.5ml/l防泡剂5693。100ml SSM摇瓶用所述3种含有前导序列构建物的克劳氏芽孢杆菌菌株的0.2ml预培养物接种，所述3种菌株是预培养在含有20mg/l新霉素的10mlTSB(大豆蛋白胨肉汤)。在摇瓶中生长3天后，通过AAPF分析(如上所述)测定蛋白酶产生值。结果显示，这些构建物能够表达具有蛋白水解活性的蛋白酶。
在另外的试验中，研究了具有整个MAXACAL_蛋白酶前导序列长度(27个氨基酸)的前导构建物的整合。然而，本发明不旨在局限于任何特定的机制。
异源DNA在B.alcalophilus(现在为克劳氏芽孢杆菌)染色体中的稳定整合在数份公开物中被描述(参见例如WO 88/06623和Van der Laan等，如上)。在专利WO 88/06623中描述的用于将MAXACAL_蛋白酶基因的1或2个拷贝整合入B.alcalophilus(现在为克劳氏芽孢杆菌)染色体的程序，被用来将asp基因的至少一个拷贝整合入克劳氏芽孢杆菌PBT142的染色体。然而，pE194-neo的衍生物pENM#3(参见图19)被使用以替代整合载体pE194-neo(其用来制备含有MAXACAL_蛋白酶基因的pMAX4)。在整合载体pENM#3中，Asp前导序列PCR产物27F27R被克隆入MAXACAL_蛋白酶基因的5′和3′侧翼区域之间的独特的平末端位点HpaI。因此，按照如下方法将27F27R制成平末端首先它用HpaI(5′端)消化，用QiagenPCR纯化试剂盒纯化，然后用HindIII(3′端)消化。HindIII消化之后，再次纯化被处理的PCR片段27F27R(使用同样的Qiagen试剂盒)，并且使用T4聚合酶(Invitrogen)，用dNTP补齐末端，再次用Qiagen试剂盒纯化。用T4连接酶(Invitrogen)，将由HpaI开环的pENM#3和平末端PCR产物27F27R连接起来。将连接产物直接转化到克劳氏芽孢杆菌PBT142原生质体，并在含有20mg/l新霉素的HI琼脂板上影印培养后，进行选择。在整合载体中具有正确的asp基因定向的两个转化子被鉴定，并进行在WO 88/06623中描述的整合程序。分别用2mg/l和20mg/l新霉素，选择在MAXACAL_蛋白酶位点和在不正常位点的整合。这些结果表明，克劳氏芽孢杆菌作为Asp蛋白酶的表达宿主也是合适的。
实施例12在地衣芽孢杆菌中产生蛋白酶[647]在该实施例中，描述了在地衣芽孢杆菌中产生蛋白酶69B4的试验。在这些试验中，各种表达构建物被制作，以在地衣芽孢杆菌中产生69B4蛋白酶(也称为″ASP蛋白酶″)。构建物被克隆入表达质粒pHPLT(在芽孢杆菌中复制)和/或整合载体pICatH。质粒pHPLT(参见图17和美国专利6,562,612[通过参考并入本文]是pUB110的衍生物，具有用于选择的新霉素抗性标记，并含有地衣芽孢杆菌a-淀粉酶(LAT)启动子(PLAT)、编码LAT信号肽的序列(preLAT)，然后是用于克隆的PstI和HpaI限制性位点和LAT转录终止子。pICatH载体(参见图20)含有温度敏感型复制起点(ori pE194，用于在芽孢杆菌中复制)，ori pBR322(用于在大肠杆菌中扩增)，用于选择的新霉素抗性基因，用于选择、染色体整合和盒式扩增的带有重复序列的天然地衣芽孢杆菌氯霉素抗性基因(cat)。
根据制造商的说明，使用高保真Platinum Taq聚合酶(Invitrogen)和下述引物，通过融合PCR，产生构建物ASPc1，即PstI-HpaI片段pHPLT-BglII_FWAGTTAAGCAATCAGATCTTCTTCAGGTTA(SEQ ID NO184)融合C1_FW(fusionC1_FW)CATTGAAAGGGGAGGAGAATCATGAGAAGCAAGAAGCGAACTGTCAC(SEQID NO185)融合C1_RV(fusionC1_RV)
GTGACAGTTCGCTTCTTGCTTCTCATGATTCTCCTCCCCTTTCAATG(SEQ IDNO186)pHPLT-HindIII_RVCTTTACCTTGTCTCCAAGCTTAAAATAAAAAAACGG(SEQ ID NO187)[649]这些引物从MWG Biotech获得。根据制造商的说明，PCR反应典型地用高保真Platinum Taq聚合酶(Invitrogen)在热循环仪上进行30个循环，退火温度是55℃。PCR-I用引物pHPLT-BgIII_FW和fusionC1_RV，以pHPLT作为模板DNA进行。PCR-II用引物fusionC1 FW和pHPLTHindIII RV，在质粒pHPLT-ASP-C1-2上进行。来自PCR-I和PCR-II的片段在融合PCR中用引物pHPLT-BgIII_FW和pHPLT-HindIII_RV装配起来。该最终PCR片段用Qiagen PCR纯化试剂盒纯化，用BglII和HindIII消化，根据制造商的说明，用T4 DNA连接酶连接到BglII和HindIII消化的pHPLT。按照本领域已知的方法(参见美国专利申请US20020182734和WO 02/14490，两者都通过参考并入本文)，将连接混合物转化入枯草芽孢杆菌菌株OS14。正确的转化子在脱脂奶平板上产生晕圈，选择它们中的一个来分离质粒pHPLT-ASPc1。通过本领域已知的原生质体转化(参见Pragai等，Microbiol.，140305-310 )，将质粒引入地衣芽孢杆菌宿主BML780(BRA7衍生物，cat-、amyL-、spo-、aprL-、endoGluC-)。新霉素抗性转化子在脱脂奶板上形成晕圈，而无pHPLT-ASPc1的亲本菌株则不会。该结果显示，当表达是由LAT启动子驱动以及当它被融合到杂合信号肽(MRSKKRTVTRALAVATAAATLLAGGMAAQA；SEQ ID NO135)时，地衣芽孢杆菌能够表达并分泌ASP蛋白酶。
如上面所述，使用下述引物，通过融合PCR(对于除去合成asp基因中的内部PstI位点是必要的)，产生构建物ASPc3，即PstI-HpaI片段ASPdelPstI_FWGCGCAGGATGTAGCAGCTGGACTTGTGG(SEQ ID NO188)ASPdelPstI_RVCCACAAGTCCAGCTGCTACATCCTGCGC(SEQ ID NO189)AspPstI_FWGCCTCATTCTGCAGCTTCAGCAAACGAACCGGCTCCTCCAGG(SEQ ID NO190)AspHpaI_RVCGTCCTCTGTTAACTCAGTCGTCACTTCCAGAGTCAGTCGTAATC(SEQ ID NO191)[651]纯化之后，PCR产物用PstI-HpaI消化，并连接到PstI和HpaI消化的pHPLT，然后转化入枯草芽孢杆菌菌株OS14。从在脱脂奶平板上形成相对(相比其他转化子)大的晕圈的新霉素抗性转化子，分离质粒pHPLT-ASPc3。使用Qiagen质粒纯化试剂盒分离质粒DNA，并通过BaseClear测序。
测序证实，ASPc3构建物编码成熟ASP，该成熟ASP在C-末端的最后位置具有两个天冬氨酸残基(S188D、P189D)。这些突变是利用PCR特意引入的，以便使ASP的C端对蛋白水解降解不太敏感(参见WO 02055717)。看起来，两个突变也通过PCR方法被引入N-端原区域(pro region)的编码区域。这些突变导致了在N-端原区域中的两个氨基酸变化L42I和Q141P。因为具有这两个原(N)突变的特定菌落产生了比无这些突变的其他菌落大一些的晕圈，所以认为，ASP蛋白酶在芽孢杆菌中的表达和/或分泌受到这些N-端原序列突变的正面影响。然而，本发明不旨在局限于这些具体的突变，考虑其他突变也可用于本发明。
接下来，将pHPLT-ASPc3转化入BML780，如上所述。与无该质粒的亲本菌株不同，BML780(pHLPT-ASPc3)在脱脂奶平板上产生晕圈，这表明该ASPc3构建物也导致了ASP在地衣芽孢杆菌中的表达。为了制备含有ASPc3表达盒的整合和扩增的菌株，使用下述引物，由pHPLT-ASPc3扩增该C3构建物EBS2XhoI_FWATCCTACTCGAGGCTTTTCTTTTGGAAGAAAATATAGGG(SEQ ID NO192)EBS2XhoI_RVTGGAATCTCGAGGTTTTATCCTTTACCTTGTCTCC(SEQ ID NO1 93)[654]PCR产物用XhoI消化，连接到XhoI消化的pICatH(参见图20)，并转化入枯草芽孢杆菌OS14，如上所述。从表达ASP的克隆(通过脱脂奶平板上的晕圈形成来判断)分离出质粒，并命名为pICatH-ASPc3。通过BaseClear进行的DNA测序证明，没有其它的突变引入到pICatH-ASPC3的ASPc3序列盒中。然后在容许性温度(permissive temperature)(37℃)，将质粒转化入BML780，一个新霉素抗性(neoR)和氯霉素抗性(capR)转化子被选择，并命名为BML780(pICatH-ASPc3)。通过在非容许性温度(50℃)将菌株培养在含有氯霉素的培养基中，BML780(pICatH-ASPc3)中的质粒被整合入地衣芽孢杆菌基因组的cat区域。一个capR抗性克隆被选择，并命名为BML780-pICatH-ASPc3。在无抗生素的情况下，再将BML780-pICatH-ASPc3在容许性温度中培养若干代，以环出载体序列，然后选择一个新霉素敏感性(neoS)、capR克隆。在该克隆中，在染色体上的pICatH载体序列(包括新霉素抗性基因)被切除，仅留下了ASPc3-cat盒。注意，cat基因是天然的地衣芽孢杆菌基因，asp基因是引入宿主中的唯一异源DNA片段。接下来，通过使该菌株生长在含有增加浓度的氯霉素的培养基中/培养基上，扩增染色体上的ASPc3-cat盒。多轮扩增之后，一个克隆(对75μg/ml氯霉素具有抗性)被选择，并命名为″BML780-ASPc3″。该克隆在脱脂奶平板上产生清楚的晕圈，而亲本菌株BML780则不产生，这表明ASP蛋白酶由BML780-ASPc3菌株产生并分泌。
构建物ASPc4类似于ASPc3，但是ASPc4表达的ASP蛋白酶在成熟链的C-末端并没有两个天冬氨酸残基。ASPc4通过用下述来自MWG Biotech(Germany)的超纯引物，扩增pHPLT-ASPc3中的asp基因而产生。
XhoPlatPRElat_FWacccccctcgaggcttttcttttggaagaaaatatagggaaaatggtacttgttaaaaattcggaatatttatacaatatcatatgtttcacattgaaaggggaggagaatcatgaaacaacaaaaacggctttac(SEQ ID NO194)ASPendTERMXhoI RVgtcgacctcgaggttttatcctttaccttgtctccaagcttaaaataaaaaaacggatttccttcaggaaatccgtcctctgttaactcaaggggaacttccagagtcagtcgtaatc(SEQ ID NO195)[656]ASPc4 PCR产物被纯化，并用XhoI消化，连接到XhoI消化的pICatH，并转化入枯草芽孢杆菌OS14，如上针对ASPc3所述。质粒分离自neoR、capR克隆，并命名为pICatH-ASPc4。将pICatH-ASPc4转化入BML780，整合入基因组，载体序列被切除，cat-ASPc4序列盒被扩增，如上针对ASPc3构建物所述。携带ASPc4序列盒的菌株并没有比携带AspC3序列盒的菌株在脱脂奶平板上产生更小的晕圈，这表明成熟ASP的C末端极性对于在芽孢杆菌中ASP的产生、分泌和/或稳定性不是非常重要的因素。然而，本发明不旨在局限于任何特定的方法。
为了阐释天然ASP信号肽是否能够在芽孢杆菌中促进分泌，构建了ASPc5。用引物ASPendTERMXhoI_RV(如上)和XhoPlatPREasp_FW，对DNA2.0的合成asp基因进行PCR。
XhoPlatPREasp_FWacccccctcgaggcttttcttttggaagaaaatatagggaaaatggtacttgttaaaaattcggaatatttatacaatatcatatgtttcacattgaaaggggaggagaatcatgacaccacgaactgtcacaag(SEQ ID NO196)[658]ASPc5 PCR产物被纯化，用XhoI消化，连接到XhoI消化的pICatH，并转化入枯草芽孢杆菌OS14，如上针对ASPc3所述。质粒分离自neoR、capR克隆，并命名为“pICatH-ASPc5”。DNA测序证明，PCR没有将不期望的突变引入asp基因。将pICatH-ASPc5转化入BML780，整合入基因组，载体序列被切除，cat-ASPc5序列盒被扩增，如上针对ASPc3构建物所述。观察到，携带ASPc5构建物的地衣芽孢杆菌菌株也在脱脂奶平板上形成晕圈，这证实ASP的天然信号肽在芽孢杆菌种中发挥了分泌信号的作用。
最后，制造了构建物ASPc6。它具有地衣芽孢杆菌枯草蛋白酶(aprL)启动子、RBS和信号肽序列，其在同一阅读框内融合到编码成熟ASP的DNA序列，该DNA序列来自优化的DNA2.0基因。它用引物ASPendTERMXhoI_RV和下述引物，通过融合PCR产生
AprLupXhoI_FW attagtctcgaggatcgaccggaccgcaacctcc(SEQ ID NO197)AprLAsp_FW cgatggcattcagcgattccgcttctgctaacgaaccggctcctccaggatctgc(SEQ IDNO198)AprLAsp_RV gcagatcctggaggagccggttcgttagcagaagcggaatcgctgaatgccatcg(SEQ IDNO199)[660]PCR-I使用引物AprLupXhoI_FW和AprLAsp_RV，以BRA7的染色体DNA为模板DNA进行。PCR-II用引物AprLAsp_FW和ASPendTERMXhoI_RV，在DNA2.0的合成asp基因上进行。将来自PCR-I和PCR-II的片段用引物ASPendTERMXhoI_RV和AprLupXhoI_FW在融合PCR中装配在一起。该最终PCR片段使用Qiagen PCR纯化试剂盒纯化(根据制造商的说明)，用XhoI消化，连接到pICatH，并转化入枯草芽孢杆菌OS14，如上针对ASPc3所述。质粒从neoR、capR克隆分离，并命名为″pICatH-ASPc6″。DNA测序证明，PCR并没有将不期望的突变引入asp基因或aprL区域。将pICatH-ASPc6转化入BML780，整合入基因组，切除载体序列，扩增cat-ASPc6序列盒，如上针对ASPc3构建物所述。携带ASPc6构建物的地衣芽孢杆菌菌株也在脱脂奶平板上形成晕圈，这表明aprL启动子和AprL信号肽联合促成了ASP蛋白酶在地衣芽孢杆菌中的表达/分泌。
实施例13在里氏木霉中产生蛋白酶[661]在该实施例中，描述了在里氏木霉中产生蛋白酶69B4的试验。在这些试验中，开发了三个不同的真菌构建物(包括cbh1融合的真菌表达载体)。一个含有ASP5′原区域(pro region)、成熟基因和3′原区域；第二个含有ASP 5′原区域和成熟基因；第三个仅含有ASP成熟基因。
下述引物对被用于PCR(在存在10％ DMSO的条件下)染色体DNA K25.10上的不同片段，其携带ASP基因和引入SpeI-AscI位点，以便将这些片段克隆入用SpeI和AscI限制酶消化的载体pTREX4(参见图21)。
1.具有ASP 5′原区域、成熟基因和3原区域的CBHI融合AspproF正向引物(SpeI-Kexin位点-ATG-前序列)5′-ACTAGTAAGCGGATGAACGAGCCCGCACCACCCGGGAGCGCGAGC(SEQID NO200)AspproR反向引物(AscI位点；TAA终止密码子至基因末端的C-端原区域)5′-GGCGCGCC TTA GGGGAGGGTGAGCCCCATGGTGTAGGCACCG(SEQ IDNO201)[664]2.ASP 5′原区域和成熟基因
AspproF正向引物(SpeI-Kexin位点-ATG-原序列)5′-ACTAGTAAGCGGATGAACGAGCCCGCACCACCCGGGAGCGCGAGC(SEQID NO202)AspmatR反向引物(AscI位点；TAA终止密码子至成熟基因末端)5′-GGCGCGCC TTA CGGGCTGCTGCCCGAGTCCGTGGTGATCA-3′(SEQ IDNO203)[665]3.仅仅ASP成熟基因AspmatF正向引物SpeI-Kexin位点-ATG-成熟序列5′-ACTAGT AAGCGG ATG TTCGACGTGATCGGCGGCAACGCCTACACCAT(SEQ ID NO204)AspmatR反向引物(AscI位点；TAA终止密码子至成熟序列的末端)5′-GGCGCGCC TTA CGGGCTGCTGCCCGAGTCCGTGGTGATCA-3′(SEQ IDNO205)[666]构建之后，使用本领域已知的生物弹射转化方法，将不同的质粒转化入cbh1、cbh2、egl1和egl2基因已裂断的里氏木霉菌株。基于形态学，筛选稳定的转化子。在摇瓶中，对每一构建物，十个稳定的转化子被筛选。使用的初始接种培养基含有30g/L α-乳糖、6.5g/L(NH4)2SO4、2g/L KH2PO4、0.3g/L MgSO4·7H2O、0.2g/LCaCl2、1ml/L 1000×里氏木霉微量盐、2mL/L 10％ TWEEN_-80、22.5g/L Proflo和0.72g/L CaCO3，转化子在其中生长约48小时。在经过这段时间的温育之后，将培养物的10％转移到含有本领域已知的基本培养基的摇瓶中(参见Foreman等，J.Biol.Chem.，27831988-31997 )，加入16g/L乳糖以诱导表达。将摇瓶置于28℃的摇床中。将4天的样品在NuPAGE 4-12％胶上电泳，用考马斯亮蓝染色。5天后，蛋白酶活性通过将10μl的上清液加入到190μl AAPF底物溶液(浓度1mg/ml，在0.1M Tris/0.005％ TWEEN，pH 8.6中)而被测量。监测由于p-硝基苯胺的释放而导致的在410nm吸光度的增加的速度(25℃)。
活性数据显示，具有高于对照菌株(即亲本菌株)5倍的产量，这表明里氏木霉对于表达ASP蛋白酶是合适的。
实施例14在黑曲霉中产生蛋白酶[668]在该实施例中，描述在黑曲霉泡盛变种(Aspergillus niger var.awamori)(PCTWO 90/00192)中产生蛋白酶69B4的试验。在这些试验中，开发了四个不同的真菌构建物(包括glaA融合的真菌表达载体)。一个含有ASP前区域(pre-region)、5′原区域、成熟基因和3′原区域；第二个含有ASP前区域、5′原区域和成熟基因；第三个含有ASP 5′原区域、成熟基因和3′原区域；第四个含有ASP 5′原区域和成熟基因。
选自下述引物对的引物被用于PCR(在存在10％ DMSO的条件下)染色体DNA 69B4中的不同片段，其携带asp基因和引入Nhe1-BstEII位点，以便将这些片段克隆入用Nhe1和BstEII限制酶消化的载体pSLGAMpR2(参见图22)。
引物Anforward 01和Anforward 02在引物的5’端含有attB1 Gateway克隆序列(Invitrogen)。引物Anreversed 01和Anreversed 02在引物的5’端含有attB2Gateway克隆序列(Invitrogen)。这些引物被用于对携带ASP基因的染色体DNA69B4的不同片段进行PCR(在存在10％ DMSO的条件下)。
将不同的构建物转移到黑曲霉Gateway相容性目的载体pRAXdes2中(参见图23；也参见美国专利申请序列号10/804,785和PCT申请号US04/08520，这两篇专利通过参考并入本文)。
Anforward 01(无attB1序列)5′-ATGACACCACGAACTGTCACAAGAGCTCTG-3′(SEQ ID NO206)Anforward 02(无attB1序列)5′-AACGAACCGGCTCCTCCAGGATCTGCATCA-3′(SEQ ID NO207)Anreversed 01(无attB2序列)5′-AGGGGAACTTCCAGAGTCAGTCGTAATCATTCTCAGGCC-3′(SEQ IDNO208)Anreversed 02(无attB1序列)5′-GGGGAGGGTGAGTCCCATTGTGTAAGCTCCTGA-3′(SEQ ID NO209)pSLGAM-NT_FW5′-ACCGCGACTGCTAGCAACGTCATCTCCAAGCGCGGCGGTGGCAACGAACCGGCTCCTCCAGGATCt-3′(SEQ ID NO210)pSLGAM-MAT_FW5′-ACCGCGACTGCTAGCAACGTCATCTCCAAGCGCGGCGGTGGCAACGAACCGGCTCCTCCAGGATCT-3′(SEQ ID NO211)pSLGAM-MAT_RV5′-CCGCCAGGTGTCGGTCACCTAAGGGGAACTTCCAGAGTCAGTCGTAATCATTCT-3′(SEQ ID NO212) PCR条件描述如下5 μL的10×PCR反应缓冲液(Invitrogen)；20mM MgSO4；dATP、dTTP、dGTP、dCTP各0.2mM(最终浓度)；1μL的10ng/μL基因组DNA；1μL的高保真Taq聚合酶(Invitrogen)，1单位/μL；引物每一种0.2μM(最终浓度)；5μl DMSO，以及水，使体积达到50μL。PCR方案94℃，5min；然后进行30个循环94℃，30sec、55℃，30sec和68℃，3min；然后68℃，10min和15℃，1min。
构建之后，使用本领域已知的原生质体转化方法，将不同的质粒和辅助质粒(HM 396 pAPDI)转化入黑曲霉泡盛变种(δ Ap4菌株)。基于形态学，筛选稳定的转化子。在摇瓶中，对每一构建物，十个稳定的转化子被筛选。这之后，将含有菌株的琼脂片转移到摇瓶中，该摇瓶含有RoboSoy培养基或如下配方12g/l胰蛋白胨、8g/l大豆蛋白胨、15g/l硫酸铵、12.1g/l NaH2PO4·H2O、2.19g/l Na2HPO4、5ml20％ MgSO4·7H2O、10ml 10％ Tween 80、500ml 30％麦芽糖和50ml 1M磷酸缓冲液，pH 5.8以及2g/l尿苷，以诱导表达。将摇瓶置于28℃的摇床中。将4天的样品在NuPAGE 10％ Bis Tris蛋白质凝胶上电泳，用考马斯亮蓝染色。使用AAPF方法，分析5天的样品的蛋白酶活性。
发现表达的ASP的数量低，以至于在考马斯染色的胶中不能被检测到。然而，板上的集落在脱脂奶板琼脂板上显示出清楚的晕圈形成，其明显比对照菌株的大。因此，尽管表达水平低，但这些结果清楚地表明黑曲霉对于ASP蛋白酶表达是合适的。
实施例15Asp位点饱和诱变(SSM)文库的产生[675]在该实施例中，描述了开发asp的位点饱和诱变文库的试验。位点饱和Asp文库中的每一个文库含有96个携有pHPLT-ASP-c1-2表达载体的枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR、pxyIA-comK)克隆。发现含有Asp表达序列盒的这种载体使得下述的蛋白质(信号肽和前体蛋白酶)能够被表达和成熟Asp蛋白酶能够被分泌，所述Asp表达序列盒由编码Asp杂合信号肽以及AspN-端原序列和成熟蛋白质的合成的DNA序列组成(参见实施例10)。
编码合成的Asp杂合信号肽的DNA序列ATGAGAAGCAAGAAGCGAACTGTCACAAGAGCTCTGGCTGTGGCAACAGCAGCTGCTACACTCTTGGCTGGGGGTATGGCAGCACAAGCT(SEQ ID NO213)信号肽和前体蛋白酶在下述序列中提供(SEQ ID NO214)(在该序列中，粗体表示成熟蛋白酶，下划线表示N-端原序列，标准字体表示信号肽)
MRSKKRTVTRALAVATAAATLLAGGMAAQANEPAPPGSASAPPRLAEKLDPDLLEAMERDLGLDAEEAAATLAFQHDAAETGEALAEELDEDFAGTWVEDDVLYVATTDEDAVEEVEGEGATAVTVEHSLADLEAWKTVLDAALEGHDDVPTWYVDVPTNSVVVAVKAGAQDVAAGLVEGADVPSDAVTFVETDETPRTMFDVIGGNAYTIGGRSRCSIGFAVNGGFITAGHCGRTGATTANPTGTFAGSSFPGNDYAFVRTGAGVNLLAQVNNYSGGRVQVAGHTAAPVGSAVCRSGSTTGWHCGTITALNSSVTYPEGTVRGLIRTTVCAEPGDSGGSLLAGNQAQGVTSGGSGNCRTGGTTFFQPVNPILQAYGLRMITTDSGSSP(SEQ ID NO214)[676]通过使用pHPLT-ASP-C1-2表达载体作为模板和表15-1中列出的引物，构建189个asp位点饱和诱变文库。用于这些实验中的诱变引物在对应于Asp成熟序列的待被突变的密码子的位置上，都含有三联DNA序列密码子NNS(N＝A、C、T或G和S＝C或G)，所述待被突变的密码子的那个位置被保证随机插入核苷酸。每一SSM文库的构建以两个PCR扩增起始，它们使用pHPLT-BgIII-FW引物和特定的反向诱变引物，以及pHPLT-BgIII-RV引物和特定的正向诱变引物(诱变引物处于相同位置)。根据Invitrogen提供的实验方案，Platinum高保真Taq DNA聚合酶(目录编号11304-029；Invitrogen)被用于PCR扩增(0.2μM引物，20至30个循环)。简言之，将两个特定PCR混合物(两者以同一密码子为目标)的各1μL扩增DNA片段，以及引物pHPLT-BgIII-FW和pHPLT-BgIII-RV加入到48μL的新鲜PCR反应溶液中。该融合PCR扩增(22循环)产生了线性pHPLT-ASP-c1-2 DNA片段，其中特定的成熟Asp密码子被随机突变，并且在两端上带有独特的BglII限制性位点。对该DNA片段进行纯化(Qiagen PCR纯化试剂盒，目录编号28106)，用BglII将它消化，进行另外的纯化步骤和连接反应(Invitrogen T4 DNA连接酶(目录编号15224-025)，由此产生环状和多聚体DNA，其随后被转化入枯草芽孢杆菌(ΔaprE、ΔnprE、oppA、ΔspoIIE、degUHy32、ΔamyE∷(xyIR、pxyIA-comK)。对于每一文库，在37℃温育过夜之后，从含有20mg/L新霉素的心浸出液琼脂板上挑选96个单克隆，并在37℃在含有20mg/ml新霉素和1.25g/L酵母提取物的MOPS培养基中(参见WO 03/062380，其通过参考并入本文，可以用于获得在此使用的确切的培养基配方)培养4天，以用于序列分析(BaseClear)和筛选目的的蛋白酶表达。文库编号由1直至189，每一个数字代表的是被随机突变的成熟asp序列密码子。选择之后，每一文库包括最多达20个Asp蛋白酶变体。
表15-1.用于产生合成ASP SSM文库的引物pHPLT-BgIII-FW GCAATCAGATCTTCCTTCAGGTTATGACC(SEQ ID NO215)pHPLT-BgIII-RV GCATCGAAGATCTGATTGCTTAACTGCTTC(SEQ ID NO216)
正向诱变引物DNA序列，5′至3 ′GAAACGCCTAGAACGATGNNSGACGTAATTGGAGGCAACasp1F (SEQ ID NO217)ACGCCTAGAACGATGTTCNNSGTAATTGGAGGCAACGCAasp2F (SEQ ID NO218)CCTAGAACGATGTTCGACNNSATTGGAGGCAACGCATATasp3F (SEQ ID NO219)AGAACGATGTTCGACGTANNSGGAGGCAACGCATATACTasp4F (SEQ ID NO220)ACGATGTTCGACGTAATTNNSGGCAACGCATATACTATTasp5F (SEQ ID NO221)ATGTTCGACGTAATTGGANNSAACGCATATACTATTGGCasp6F (SEQ ID NO222)TTCGACGTAATTGGAGGCNNSGCATATACTATTGGCGGCasp7F (SEQ ID NO223)asp8F GACGTAATTGGAGGCAACNNSTATACTATTGGCGGCCGG
(SEQ ID NO224)GTAATTGGAGGCAACGCANNSACTATTGGCGGCCGGTCTasp9F (SEQ ID NO225)ATTGGAGGCAACGCATATNNSATTGGCGGCCGGTCTAGAasp10F (SEQ ID NO226)GGAGGCAACGCATATACTNNSGGCGGCCGGTCTAGATGTasp11F (SEQ ID NO227)GGCAACGCATATACTATTNNSGGCCGGTCTAGATGTTCTasp12F (SEQ ID NO228)AACGCATATACTATTGGCNNSCGGTCTAGATGTTCTATCasp13F (SEQ ID NO229)GCATATACTATTGGCGGCNNSTCTAGATGTTCTATCGGAasp14F (SEQ ID NO230)TATACTATTGGCGGCCGGNNSAGATGTTCTATCGGATTCasp15F (SEQ ID NO231)ACTATTGGCGGCCGGTCTNNSTGTTCTATCGGATTCGCAasp16F (SEQ ID NO232)ATTGGCGGCCGGTCTAGANNSTCTATCGGATTCGCAGTAasp17F (SEQ ID NO233)GGCGGCCGGTCTAGATGTNNSATCGGATTCGCAGTAAACasp18F (SEQ ID NO234)GGCCGGTCTAGATGTTCTNNSGGATTCGCAGTAAACGGTasp19F (SEQ ID NO235)CGGTCTAGATGTTCTATCNNSTTCGCAGTAAACGGTGGCasp20F (SEQ ID NO236)TCTAGATGTTCTATCGGANNSGCAGTAAACGGTGGCTTCasp21F (SEQ ID NO237)AGATGTTCTATCGGATTCNNSGTAAACGGTGGCTTCATTasp22F (SEQ ID NO238)TGTTCTATCGGATTCGCANNSAACGGTGGCTTCATTACTasp23F (SEQ ID NO239)TCTATCGGATTCGCAGTANNSGGTGGCTTCATTACTGCCasp24F (SEQ ID NO240)ATCGGATTCGCAGTAAACNNSGGCTTCATTACTGCCGGTasp25F (SEQ ID NO241)GGATTCGCAGTAAACGGTNNSTTCATTACTGCCGGTCACasp26F (SEQ ID NO242)TTCGCAGTAAACGGTGGCNNSATTACTGCCGGTCACTGCasp27F (SEQ ID NO243)GCAGTAAACGGTGGCTTCNNSACTGCCGGTCACTGCGGAasp28F (SEQ ID NO244)GTAAACGGTGGCTTCATTNNSGCCGGTCACTGCGGAAGAasp29F (SEQ ID NO245)AACGGTGGCTTCATTACTNNSGGTCACTGCGGAAGAACAasp30F (SEQ ID NO246)GGTGGCTTCATTACTGCCNNSCACTGCGGAAGAACAGGAasp31F (SEQ ID NO247)
GGCTTCATTACTGCCGGTNNSTGCGGAAGAACAGGAGCCasp32F (SEQ ID NO248)TTCATTACTGCCGGTCACNNSGGAAGAACAGGAGCCACTasp33F (SEQ ID NO249)ATTACTGCCGGTCACTGCNNSAGAACAGGAGCCACTACTasp34F (SEQ ID NO250)ACTGCCGGTCACTGCGGANNSACAGGAGCCACTACTGCCasp35F (SEQ ID NO251)GCCGGTCACTGCGGAAGANNSGGAGCCACTACTGCCAATasp36F (SEQ ID NO252)GGTCACTGCGGAAGAACANNSGCCACTACTGCCAATCCGasp37F (SEQ ID NO253)CACTGCGGAAGAACAGGANNSACTACTGCCAATCCGACTasp38F (SEQ ID NO254)TGCGGAAGAACAGGAGCCNNSACTGCCAATCCGACTGGCasp39F (SEQ ID NO255)GGAAGAACAGGAGCCACTNNSGCCAATCCGACTGGCACAasp40F (SEQ ID NO256)AGAACAGGAGCCACTACTNNSAATCCGACTGGCACATTTasp41F (SEQ ID NO257)ACAGGAGCCACTACTGCCNNSCCGACTGGCACATTTGCAasp42F (SEQ ID NO258)GGAGCCACTACTGCCAATNNSACTGGCACATTTGCAGGTasp43F (SEQ ID NO259)GCCACTACTGCCAATCCGNNSGGCACATTTGCAGGTAGCasp44F (SEQ ID NO260)ACTACTGCCAATCCGACTNNSACATTTGCAGGTAGCTCGasp45F (SEQ ID NO261)ACTGCCAATCCGACTGGCNNSTTTGCAGGTAGCTCGTTTasp46F (SEQ ID NO262)GCCAATCCGACTGGCACANNSGCAGGTAGCTCGTTTCCGasp47F (SEQ ID NO263)AATCCGACTGGCACATTTNNSGGTAGCTCGTTTCCGGGAasp48F (SEQ ID NO264)CCGACTGGCACATTTGCANNSAGCTCGTTTCCGGGAAATasp49F (SEQ ID NO265)ACTGGCACATTTGCAGGTNNSTCGTTTCCGGGAAATGATasp50F (SEQ ID NO266)GGCACATTTGCAGGTAGCNNSTTTCCGGGAAATGATTATasp51F (SEQ ID NO267)ACATTTGCAGGTAGCTCGNNSCCGGGAAATGATTATGCAasp52F (SEQ ID NO268)TTTGCAGGTAGCTCGTTTNNSGGAAATGATTATGCATTCasp53F (SEQ ID NO269)GCAGGTAGCTCGTTTCCGNNSAATGATTATGCATTCGTCasp54F (SEQ ID NO270)GGTAGCTCGTTTCCGGGANNSGATTATGCATTCGTCCGAasp55F (SEQ ID NO271)AGCTCGTTTCCGGGAAATNNSTATGCATTCGTCCGAACAasp56F (SEQ ID NO272)asp57F TCGTTTCCGGGAAATGATNNSGCATTCGTCCGAACAGGG
(SEQ ID NO273)TTTCCGGGAAATGATTATNNSTTCGTCCGAACAGGGGCAasp58F (SEQ ID NO274)CCGGGAAATGATTATGCANNSGTCCGAACAGGGGCAGGAasp59F (SEQ ID NO275)GGAAATGATTATGCATTCNNSCGAACAGGGGCAGGAGTAasp60F (SEQ ID NO276)AATGATTATGCATTCGTCNNSACAGGGGCAGGAGTAAATasp61F (SEQ ID NO277)GATTATGCATTCGTCCGANNSGGGGCAGGAGTAAATTTGasp62F (SEQ ID NO278)TATGCATTCGTCCGAACANNSGCAGGAGTAAATTTGCTTasp63F (SEQ ID NO279)GCATTCGTCCGAACAGGGNNSGGAGTAAATTTGCTTGCCasp64F (SEQ ID NO280)TTCGTCCGAACAGGGGCANNSGTAAATTTGCTTGCCCAAasp65F (SEQ ID NO281)GTCCGAACAGGGGCAGGANNSAATTTGCTTGCCCAAGTCasp66F (SEQ ID NO282)CGAACAGGGGCAGGAGTANNSTTGCTTGCCCAAGTCAATasp67F (SEQ ID NO283)ACAGGGGCAGGAGTAAATNNSCTTGCCCAAGTCAATAACasp68F (SEQ ID NO284)GGGGCAGGAGTAAATTTGNNSGCCCAAGTCAATAACTACasp69F (SEQ ID NO285)GCAGGAGTAAATTTGCTTNNSCAAGTCAATAACTACTCGasp70F (SEQ ID NO286)GGAGTAAATTTGCTTGCCNNSGTCAATAACTACTCGGGCasp71F (SEQ ID NO287)GTAAATTTGCTTGCCCAANNSAATAACTACTCGGGCGGCasp72F (SEQ ID NO288)AATTTGCTTGCCCAAGTCNNSAACTACTCGGGCGGCAGAasp73F (SEQ ID NO28g)TTGCTTGCCCAAGTCAATNNSTACTCGGGCGGCAGAGTCasp74F (SEQ ID NO290)CTTGCCCAAGTCAATAACNNSTCGGGCGGCAGAGTCCAAasp75F (SEQ ID NO291)GCCCAAGTCAATAACTACNNSGGCGGCAGAGTCCAAGTAasp76F (SEQ ID NO292)CAAGTCAATAACTACTCGNNSGGCAGAGTCCAAGTAGCAasp77F (SEQ ID NO293)GTCAATAACTACTCGGGCNNSAGAGTCCAAGTAGCAGGAasp78F (SEQ ID NO294)AATAACTACTCGGGCGGCNNSGTCCAAGTAGCAGGACATasp79F (SEQ ID NO295)AACTACTCGGGCGGCAGANNSCAAGTAGCAGGACATACGasp80F (SEQ ID NO296)TACTCGGGCGGCAGAGTCNNSGTAGCAGGACATACGGCCasp81F (SEQ ID NO297)TCGGGCGGCAGAGTCCAANNSGCAGGACATACGGCCGCAasp82F (SEQ ID NO298)
GGCGGCAGAGTCCAAGTANNSGGACATACGGCCGCACCAasp83F (SEQ ID NO299)GGCAGAGTCCAAGTAGCANNSCATACGGCCGCACCAGTTasp84F (SEQ ID NO300)AGAGTCCAAGTAGCAGGANNSACGGCCGCACCAGTTGGAasp85F (SEQ ID NO301)GTCCAAGTAGCAGGACATNNSGCCGCACCAGTTGGATCTasp86F (SEQ ID NO302)CAAGTAGCAGGACATACGNNSGCACCAGTTGGATCTGCTasp87F (SEQ ID NO303)GTAGCAGGACATACGGCCNNSCCAGTTGGATCTGCTGTAasp88F (SEQ ID NO304)GCAGGACATACGGCCGCANNSGTTGGATCTGCTGTATGCasp89F (SEQ ID NO305)GGACATACGGCCGCACCANNSGGATCTGCTGTATGGCGCasp90F (SEQ ID NO306)CATACGGCCGCACCAGTTNNSTCTGCTGTATGCCGCTCAasp91F (SEQ ID NO307)ACGGCCGCACCAGTTGGANNSGCTGTATGCCGCTCAGGTasp92F (SEQ ID NO308)GCCGCACCAGTTGGATCTNNSGTATGCCGCTCAGGTAGCasp93F (SEQ ID NO309)GCACCAGTTGGATCTGCTNNSTGCCGCTCAGGTAGCACTasp94F (SEQ ID NO310)CCAGTTGGATCTGCTGTANNSCGCTCAGGTAGCACTACAasp95F (SEQ ID NO311)GTTGGATCTGCTGTATGCNNSTCAGGTAGCACTACAGGTasp96F (SEQ ID NO312)GGATCTGCTGTATGCCGCNNSGGTAGCACTACAGGTTGGasp97F (SEQ ID NO313)TCTGCTGTATGCCGCTCANNSAGCACTACAGGTTGGCATasp98F (SEQ ID NO314)GCTGTATGCCGCTCAGGTNNSACTACAGGTTGGCATTGCasp99F (SEQ ID NO315)GTATGCCGCTCAGGTAGCNNSACAGGTTGGCATTGCGGAasp100F (SEQ ID NO316)TGCCGCTCAGGTAGCACTNNSGGTTGGCATTGCGGAACTasp101F (SEQ ID NO317)CGCTCAGGTAGCACTACANNSTGGCATTGCGGAACTATCasp102F (SEQ ID NO318)TCAGGTAGCACTACAGGTNNSCATTGCGGAACTATCACGasp103F (SEQ ID NO319)GGTAGCACTACAGGTTGGNNSTGCGGAACTATCACGGCGasp104F (SEQ ID NO320)AGCACTACAGGTTGGCATNNSGGAACTATCACGGCGCTGasp105F (SEQ ID NO321)ACTACAGGTTGGCATTGCNNSACTATCACGGCGCTGAATasp106F (SEQ ID NO322)ACAGGTTGGCATTGCGGANNSATCACGGCGCTGAATTCGasp107F (SEQ ID NO323)asp108F GGTTGGCATTGCGGAACTNNSACGGCGCTGAATTCGTCT
(SEQ ID NO324)TGGCATTGCGGAACTATCNNSGCGCTGAATTCGTCTGTCasp109F (SEQ ID NO325)CATTGCGGAACTATCACGNNSCTGAATTCGTCTGTCACGasp110F (SEQ ID NO326)TGCGGAACTATCACGGCGNNSAATTCGTCTGTCACGTATasp111F (SEQ ID NO327)GGAACTATCACGGCGCTGNNSTCGTCTGTCACGTATCCAasp112F (SEQ ID NO328)ACTATCACGGCGCTGAATNNSTCTGTCACGTATCCAGAGasp113F (SEQ ID NO329)ATCACGGCGCTGAATTCGNNSGTCACGTATCCAGAGGGAasp114F (SEQ ID NO330)ACGGCGCTGAATTCGTCTNNSACGTATCCAGAGGGAACAasp115F (SEQ ID NO331)GCGCTGAATTCGTCTGTCNNSTATCCAGAGGGAACAGTCasp116F (SEQ ID NO332)CTGAATTCGTCTGTCACGNNSCCAGAGGGAACAGTCCGAasp117F (SEQ ID NO333)AATTCGTCTGTCACGTATNNSGAGGGAACAGTCCGAGGAasp118F (SEQ ID NO334)TCGTCTGTCACGTATCCANNSGGAACAGTCCGAGGACTTasp119F (SEQ ID NO335)TCTGTCACGTATCCAGAGNNSACAGTCCGAGGACTTATCasp120F (SEQ ID NO336)GTCACGTATCCAGAGGGANNSGTCCGAGGACTTATCCGCasp121F (SEQ ID NO337)ACGTATCCAGAGGGAACANNSCGAGGACTTATCCGCACGasp122F (SEQ ID NO338)TATCCAGAGGGAACAGTCNNSGGACTTATCCGCACGACGasp123F (SEQ ID NO339)CCAGAGGGAACAGTCCGANNSCTTATCCGCACGACGGTTasp124F (SEQ ID NO340)GAGGGAACAGTCCGAGGANNSATCCGCACGACGGTTTGTasp125F (SEQ ID NO341)GGAACAGTCCGAGGACTTNNSCGCACGACGGTTTGTGCCasp126F (SEQ ID NO342)ACAGTCCGAGGACTTATCNNSACGACGGTTTGTGCCGAAasp127F (SEQ ID NO343)GTCCGAGGACTTATCCGCNNSACGGTTTGTGCCGAACCAasp128F (SEQ ID NO344)CGAGGACTTATCCGCACGNNSGTTTGTGCCGAACCAGGTasp129F (SEQ ID NO345)GGACTTATCCGCACGACGNNSTGTGCCGAACCAGGTGATasp130F (SEQ ID NO346)CTTATCCGCACGACGGTTNNSGCCGAACCAGGTGATAGCasp131F (SEQ ID NO347)ATCCGCACGACGGTTTGTNNSGAACCAGGTGATAGCGGAasp132F (SEQ ID NO348)CGCACGACGGTTTGTGCCNNSCCAGGTGATAGCGGAGGTasp133F (SEQ ID NO349)
ACGACGGTTTGTGCCGAANNSGGTGATAGCGGAGGTAGCasp134F (SEQ ID NO350)ACGGTTTGTGCCGAACCANNSGATAGCGGAGGTAGCCTTasp135F (SEQ ID NO351)GTTTGTGCCGAACCAGGTNNSAGCGGAGGTAGCCTTTTAasp136F (SEQ ID NO352)TGTGCCGAACCAGGTGATNNSGGAGGTAGCCTTTTAGCGasp137F (SEQ ID NO353)GCCGAACCAGGTGATAGCNNSGGTAGCCTTTTAGCGGGAasp138F (SEQ ID NO354)GAACCAGGTGATAGCGGANNSAGCCTTTTAGCGGGAAATasp139F (SEQ ID NO355)CCAGGTGATAGCGGAGGTNNSCTTTTAGCGGGAAATCAAasp140F (SEQ ID NO356)GGTGATAGCGGAGGTAGCNNSTTAGCGGGAAATCAAGCCasp141F (SEQ ID NO357)GATAGCGGAGGTAGCCTTNNSGCGGGAAATCAAGCCCAAasp142F (SEQ ID NO358)AGCGGAGGTAGCCTTTTANNSGGAAATCAAGCCCAAGGTasp143F (SEQ ID NO359)GGAGGTAGCCTTTTAGCGNNSAATCAAGCCCAAGGTGTCasp144F (SEQ ID NO360)GGTAGCCTTTTAGCGGGANNSCAAGCCCAAGGTGTCACGasp145F (SEQ ID NO361)AGCCTTTTAGCGGGAAATNNSGCCCAAGGTGTCACGTCAasp146F (SEQ ID NO362)CTTTTAGCGGGAAATCAANNSCAAGGTGTCACGTCAGGTasp147F (SEQ ID NO363)TTAGCGGGAAATCAAGCCNNSGGTGTCACGTCAGGTGGTasp148F (SEQ ID NO364)GCGGGAAATCAAGCCCAANNSGTCACGTCAGGTGGTTCTasp149F (SEQ ID NO365)GGAAATCAAGCCCAAGGTNNSACGTCAGGTGGTTCTGGAasp150F (SEQ ID NO366)AATCAAGCCCAAGGTGTCNNSTCAGGTGGTTCTGGAAATasp151F (SEQ ID NO367)CAAGCCCAAGGTGTCACGNNSGGTGGTTCTGGAAATTGTasp152F (SEQ ID NO368)GCCCAAGGTGTCACGTCANNSGGTTCTGGAAATTGTCGGasp153F (SEQ ID NO369)CAAGGTGTCACGTCAGGTNNSTCTGGAAATTGTCGGACGasp154F (SEQ ID NO370)GGTGTCACGTCAGGTGGTNNSGGAAATTGTCGGACGGGGasp155F (SEQ ID NO371)GTCACGTCAGGTGGTTCTNNSAATTGTCGGACGGGGGGAasp156F (SEQ ID NO372)ACGTCAGGTGGTTCTGGANNSTGTCGGACGGGGGGAACAasp157F (SEQ ID NO373)TCAGGTGGTTCTGGAAATNNSCGGACGGGGGGAACAACAasp158F (SEQ ID NO374)asp159F GGTGGTTCTGGAAATTGTNNSACGGGGGGAACAACATTC
(SEQ ID NO375)GGTTCTGGAAATTGTCGGNNSGGGGGAACAACATTCTTTasp160F (SEQ ID NO376)TCTGGAAATTGTCGGACGNNSGGAACAACATTCTTTCAAasp161F (SEQ ID NO377)GGAAATTGTCGGACGGGGNNSACAACATTCTTTCAACCAasp162F (SEQ ID NO378)AATTGTCGGACGGGGGGANNSACATTCTTTCAACCAGTCasp163F (SEQ ID NO379)TGTCGGACGGGGGGAACANNSTTCTTTCAACCAGTCAACasp164F (SEQ ID NO380)CGGACGGGGGGAACAACANNSTTTCAACCAGTCAACCCGasp165F (SEQ ID NO381)ACGGGGGGAACAACATTCNNSCAACCAGTCAACCCGATTasp166F (SEQ ID NO382)GGGGGAACAACATTCTTTNNSCCAGTCAACCCGATTTTGasp167F (SEQ ID NO383)GGAACAACATTCTTTCAANNSGTCAACCCGATTTTGCAGasp168F (SEQ ID NO384)ACAACATTCTTTCAACCANNSAACCCGATTTTGCAGGCTasp169F (SEQ ID NO385)ACATTCTTTCAACCAGTCNNSCCGATTTTGCAGGCTTACasp170F (SEQ ID NO386)TTCTTTCAACCAGTCAACNNSATTTTGCAGGCTTACGGCasp171F (SEQ ID NO387)TTTCAACCAGTCAACCCGNNSTTGCAGGCTTACGGCCTGasp172F (SEQ ID NO388)CAACCAGTCAACCCGATTNNSCAGGCTTACGGCCTGAGAasp173F (SEQ ID NO389)CCAGTCAACCCGATTTTGNNSGCTTACGGCCTGAGAATGasp174F (SEQ ID NO390)GTCAACCCGATTTTGCAGNNSTACGGCCTGAGAATGATTasp175F (SEQ ID NO391)AACCCGATTTTGCAGGCTNNSGGCCTGAGAATGATTACGasp176F (SEQ ID NO392)CCGATTTTGCAGGCTTACNNSCTGAGAATGATTACGACTasp177F (SEQ ID NO393)ATTTTGCAGGCTTACGGCNNSAGAATGATTACGACTGACasp178F (SEQ ID NO394)TTGCAGGCTTACGGCCTGNNSATGATTACGACTGACTCTasp179F (SEQ ID NO395)CAGGCTTACGGCCTGAGANNSATTACGACTGACTCTGGAasp180F (SEQ ID NO396)GCTTACGGCCTGAGAATGNNSACGACTGACTCTGGAAGTasp181F (SEQ ID NO397)TACGGCCTGAGAATGATTNNSACTGACTCTGGAAGTTCCasp182F (SEQ ID NO398)GGCCTGAGAATGATTACGNNSGACTCTGGAAGTTCCCCTasp183F (SEQ ID NO399)CTGAGAATGATTACGACTNNSTCTGGAAGTTCCCCTTAAasp184F (SEQ ID NO400)
AGAATGATTACGACTGACNNSGGAAGTTCCCCTTAACCCasp185F (SEQ ID NO401)ATGATTACGACTGACTCTNNSAGTTCCCCTTAACCCAACasp186F (SEQ ID NO402)ATTACGACTGACTCTGGANNSTCCCCTTAACCCAACAGAasp187F (SEQ ID NO403)ACGACTGACTCTGGAAGTNNSCCTTAACCCAACAGAGGAasp188F (SEQ ID NO404)ACTGACTCTGGAAGTTCCNNSTAACCCAACAGAGGACGGasp189F (SEQ ID NO405)反向诱变引物DNA序列，5′至3′GTTGCCTCCAATTACGTCSNNCATCGTTCTAGGCGTTTCasp1R (SEQ ID NO406)TGCGTTGCCTCCAATTACSNNGAACATCGTTCTAGGCGTasp2R (SEQ ID NO407)ATATGCGTTGCCTCCAATSNNGTCGAACATCGTTCTAGGasp3R (SEQ ID NO408)AGTATATGCGTTGCCTCCSNNTACGTCGAACATCGTTCTasp4R (SEQ ID NO409)AATAGTATATGCGTTGCCSNNAATTACGTCGAACATCGTasp5R (SEQ ID NO410)GCCAATAGTATATGCGTTSNNTCCAATTACGTCGAACATasp6R (SEQ ID NO411)GCCGCCAATAGTATATGCSNNGCCTCCAATTACGTCGAAasp7R (SEQ ID NO412)CCGGCCGCCAATAGTATASNNGTTGCCTCCAATTACGTCasp8R (SEQ ID NO413)AGACCGGCCGCCAATAGTSNNTGCGTTGCCTCCAATTACasp9R (SEQ ID NO414)TCTAGACCGGCCGCCAATSNNATATGCGTTGCCTCCAATasp10R (SEQ ID NO415)ACATCTAGACCGGCCGCCSNNAGTATATGCGTTGCCTCCasp11R (SEQ ID NO416)AGAACATCTAGACCGGCCSNNAATAGTATATGCGTTGCCasp12R (SEQ ID NO417)GATAGAACATCTAGACCGSNNGCCAATAGTATATGCGTTasp13R (SEQ ID NO418)TCCGATAGAACATCTAGASNNGCCGCCAATAGTATATGCasp14R (SEQ ID NO419)GAATCCGATAGAACATCTSNNCCGGCCGCCAATAGTATAasp15R (SEQ ID NO420)TGCGAATCCGATAGAACASNNAGACCGGCCGCCAATAGTasp16R (SEQ ID NO421)TACTGCGAATCCGATAGASNNTCTAGACCGGCCGCCAATasp17R (SEQ ID NO422)GTTTACTGCGAATCCGATSNNACATCTAGACCGGCCGCCasp18R (SEQ ID NO423)asp19R ACCGTTTACTGCGAATCCSNNAGAACATCTAGACCGGCC
(SEQ ID NO424)GCCACCGTTTACTGCGAASNNGATAGAACATCTAGACCGasp20R (SEQ ID NO425)GAAGCCACCGTTTACTGCSNNTCCGATAGAACATCTAGAasp21R (SEQ ID NO426)AATGAAGCCACCGTTTACSNNGAATCCGATAGAACATCTasp22R (SEQ ID NO427)AGTAATGAAGCCACCGTTSNNTGCGAATCCGATAGAACAasp23R (SEQ ID NO428)GGCAGTAATGAAGCCACCSNNTACTGCGAATCCGATAGAasp24R (SEQ ID NO429)ACCGGCAGTAATGAAGCCSNNGTTTACTGCGAATCCGATasp25R (SEQ ID NO430)GTGACCGGCAGTAATGAASNNACCGTTTACTGCGAATCCasp26R (SEQ ID NO431)GCAGTGACCGGCAGTAATSNNGCCACCGTTTACTGCGAAasp27R (SEQ ID NO432)TCCGCAGTGACCGGCAGTSNNGAAGCCACCGTTTACTGCasp28R (SEQ ID NO433)TCTTCCGCAGTGACCGGCSNNAATGAAGCCACCGTTTACasp29R (SEQ ID NO434)TGTTCTTCCGCAGTGACCSNNAGTAATGAAGCCACCGTTasp30R (SEQ ID NO435)TCCTGTTCTTCCGCAGTGSNNGGCAGTAATGAAGCCACCasp31R (SEQ ID NO436)GGCTCCTGTTCTTCCGCASNNACCGGCAGTAATGAAGCCasp32R (SEQ ID NO437)AGTGGCTCCTGTTCTTCCSNNGTGACCGGCAGTAATGAAasp33R (SEQ ID NO438)AGTAGTGGCTCCTGTTCTSNNGCAGTGACCGGCAGTAATasp34R (SEQ ID NO439)GGCAGTAGTGGCTCCTGTSNNTCCGCAGTGACCGGCAGTasp35R (SEQ ID NO440)ATTGGCAGTAGTGGCTCCSNNTCTTCCGCAGTGACCGGCasp36R (SEQ ID NO441)CGGATTGGCAGTAGTGGCSNNTGTTCTTCCGCAGTGACCasp37R (SEQ ID NO442)AGTCGGATTGGCAGTAGTSNNTCCTGTTCTTCCGCAGTGasp38R (SEQ ID NO443)GCCAGTCGGATTGGCAGTSNNGGCTCCTGTTCTTCCGCAasp39R (SEQ ID NO444)TGTGCCAGTCGGATTGGCSNNAGTGGCTCCTGTTCTTCCasp40R (SEQ ID NO445)AAATGTGCCAGTCGGATTSNNAGTAGTGGCTCCTGTTCTasp41R (SEQ ID NO446)TGCAAATGTGCCAGTCGGSNNGGCAGTAGTGGCTCCTGTasp42R (SEQ ID NO447)ACCTGCAAATGTGCCAGTSNNATTGGCAGTAGTGGCTCCasp43R (SEQ ID NO448)GCTACCTGCAAATGTGCCSNNCGGATTGGCAGTAGTGGCasp44R (SEQ ID NO449)
CGAGCTACCTGCAAATGTSNNAGTCGGATTGGCAGTAGTasp45R (SEQ ID NO450)AAACGAGCTACCTGCAAASNNGCCAGTCGGATTGGCAGTasp46R (SEQ ID NO451)CGGAAACGAGCTACCTGCSNNTGTGCCAGTCGGATTGGCasp47R (SEQ ID NO452)TCCCGGAAACGAGCTACCSNNAAATGTGCCAGTCGGATTasp48R (SEQ ID NO453)ATTTCCCGGAAACGAGCTSNNTGCAAATGTGCCAGTCGGasp49R (SEQ ID NO454)ATCATTTCCCGGAAACGASNNACCTGCAAATGTGCCAGTasp50R (SEQ ID NO455)ATAATCATTTCCCGGAAASNNGCTACCTGCAAATGTGCCasp51R (SEQ ID NO456)TGCATAATCATTTCCCGGSNNCGAGCTACCTGCAAATGTasp52R (SEQ ID NO457)GAATGCATAATCATTTCCSNNAAACGAGCTACCTGCAAAasp53R (SEQ ID NO458)GACGAATGCATAATCATTSNNCGGAAACGAGCTACCTGCasp54R (SEQ ID NO459)TCGGACGAATGCATAATCSNNTCCCGGAAACGAGCTACCasp55R (SEQ ID NO460)TGTTCGGACGAATGCATASNNATTTCCCGGAAACGAGCTasp56R (SEQ ID NO461)CCCTGTTCGGACGAATGCSNNATCATTTCCCGGAAACGAasp57R (SEQ ID NO462)TGCCCCTGTTCGGACGAASNNATAATCATTTCCCGGAAAasp58R (SEQ ID NO463)TCCTGCCCCTGTTCGGACSNNTGCATAATCATTTCCCGGasp59R (SEQ ID NO464)TACTCCTGCCCCTGTTCGSNNGAATGCATAATCATTTCCasp60R (SEQ ID NO465)ATTTACTCCTGCCCCTGTSNNGACGAATGCATAATCATTasp61R (SEQ ID NO466)CAAATTTACTCCTGCCCCSNNTCGGACGAATGCATAATCasp62R (SEQ ID NO467)AAGCAAATTTACTCCTGCSNNTGTTCGGACGAATGCATAasp63R (SEQ ID NO468)GGCAAGCAAATTTACTCCSNNCCCTGTTCGGACGAATGCasp64R (SEQ ID NO469)TTGGGCAAGCAAATTTACSNNTGCCCCTGTTCGGACGAAasp65R (SEQ ID NO470)GACTTGGGCAAGCAAATTSNNTCCTGCCCCTGTTCGGACasp66R (SEQ ID NO471)ATTGACTTGGGCAAGCAASNNTACTCCTGCCCCTGTTCGasp67R (SEQ ID NO472)GTTATTGACTTGGGCAAGSNNATTTACTCCTGCCCCTGTasp68R (SEQ ID NO473)GTAGTTATTGACTTGGGCSNNCAAATTTACTCCTGCCCCasp69R (SEQ ID NO474)asp70R CGAGTAGTTATTGACTTGSNNAAGCAAATTTACTCCTGC
(SEQ ID NO475)GCCCGAGTAGTTATTGACSNNGGCAAGCAAATTTACTCCasp71R (SEQ ID NO476)GCCGCCCGAGTAGTTATTSNNTTGGGCAAGCAAATTTACasp72R (SEQ ID NO477)TCTGCCGCCCGAGTAGTTSNNGACTTGGGCAAGCAAATTasp73R (SEQ ID NO478)GACTCTGCCGCCCGAGTASNNATTGACTTGGGCAAGCAAasp74R (SEQ ID NO479)TTGGACTCTGCCGCCCGASNNGTTATTGACTTGGGCAAGasp75R (SEQ ID NO480)TACTTGGACTCTGCCGCCSNNGTAGTTATTGACTTGGGCasp76R (SEQ ID NO481)TGCTACTTGGACTCTGCCSNNCGAGTAGTTATTGACTTGasp77R (SEQ ID NO482)TCCTGCTACTTGGACTCTSNNGCCCGAGTAGTTATTGACasp78R (SEQ ID NO483)ATGTCCTGCTACTTGGACSNNGCCGCCCGAGTAGTTATTasp79R (SEQ ID NO484)CGTATGTCCTGCTACTTGSNNTCTGCCGCCCGAGTAGTTasp80R (SEQ ID NO485)GGCCGTATGTCCTGCTACSNNGACTCTGCCGCCCGAGTAasp81R (SEQ ID NO486)TGCGGCCGTATGTCCTGCSNNTTGGACTCTGCCGCCCGAasp82R (SEQ ID NO487)TGGTGCGGCCGTATGTCCSNNTACTTGGACTCTGCCGCCasp83R (SEQ ID NO488)AACTGGTGCGGCCGTATGSNNTGCTACTTGGACTCTGCCasp84R (SEQ ID NO489)TCCAACTGGTGCGGCCGTSNNTCCTGCTACTTGGACTCTasp85R (SEQ ID NO490)AGATCCAACTGGTGCGGCSNNATGTCCTGCTACTTGGACasp86R (SEQ ID NO491)AGCAGATCCAACTGGTGCSNNCGTATGTCCTGCTACTTGasp87R (SEQ ID NO492)TACAGCAGATCCAACTGGSNNGGCCGTATGTCCTGCTACasp88R (SEQ ID NO493)GCATACAGCAGATCCAACSNNTGCGGCCGTATGTCCTGCasp89R (SEQ ID NO494)GCGGCATACAGCAGATCCSNNTGGTGCGGCCGTATGTCCasp90R (SEQ ID NO495)TGAGCGGCATACAGCAGASNNAACTGGTGCGGCCGTATGasp91R (SEQ ID NO496)ACCTGAGCGGCATACAGCSNNTCCAACTGGTGCGGCCGTasp92R (SEQ ID NO497)GCTACCTGAGCGGCATACSNNAGATCCAACTGGTGCGGCasp93R (SEQ ID NO498)AGTGCTACCTGAGCGGCASNNAGCAGATCCAACTGGTGCasp94R (SEQ ID NO499)TGTAGTGCTACCTGAGCGSNNTACAGCAGATCCAACTGGasp95R (SEQ ID NO500)
ACCTGTAGTGCTACCTGASNNGCATACAGCAGATCCAACasp96R (SEQ ID NO501)CCAACCTGTAGTGCTACCSNNGCGGCATACAGCAGATCCasp97R (SEQ ID NO502)ATGCCAACCTGTAGTGCTSNNTGAGCGGCATACAGCAGAasp98R (SEQ ID NO503)GCAATGCCAACCTGTAGTSNNACCTGAGCGGCATACAGCasp99R (SEQ ID NO504)TCCGCAATGCCAACCTGTSNNGCTACCTGAGCGGCATACasp100R (SEQ ID NO505)AGTTCCGCAATGCCAACCSNNAGTGCTACCTGAGCGGCAasp101R (SEQ ID NO506)GATAGTTCCGCAATGCCASNNTGTAGTGCTACCTGAGCGasp102R (SEQ ID NO507)CGTGATAGTTCCGCAATGSNNACCTGTAGTGCTACCTGAasp103R (SEQ ID NO508)CGCCGTGATAGTTCCGCASNNCCAACCTGTAGTGCTACCasp104R (SEQ ID NO509)CAGCGCCGTGATAGTTCCSNNATGCCAACCTGTAGTGCTasp105R (SEQ ID NO510)ATTCAGCGCCGTGATAGTSNNGCAATGCCAACCTGTAGTasp106R (SEQ ID NO511)CGAATTCAGCGCCGTGATSNNTCCGCAATGCCAACCTGTasp107R (SEQ ID NO512)AGACGAATTCAGCGCCGTSNNAGTTCCGCAATGCCAACCasp108R (SEQ ID NO513)GACAGACGAATTCAGCGCSNNGATAGTTCCGCAATGCCAasp109R (SEQ ID NO514)CGTGACAGACGAATTCAGSNNCGTGATAGTTCCGCAATGasp110R (SEQ ID NO515)ATACGTGACAGACGAATTSNNCGCCGTGATAGTTCCGCAasp111R (SEQ ID NO516)TGGATACGTGACAGACGASNNCAGCGCCGTGATAGTTCCasp112R (SEQ ID NO517)CTCTGGATACGTGACAGASNNATTCAGCGCCGTGATAGTasp113R (SEQ ID NO518)TCCCTCTGGATACGTGACSNNCGAATTCAGCGCCGTGATasp114R (SEQ ID NO519)TGTTCCCTCTGGATACGTSNNAGACGAATTCAGCGCCGTasp115R (SEQ ID NO520)GACTGTTCCCTCTGGATASNNGACAGACGAATTCAGCGCasp116R (SEQ ID NO521)TCGGACTGTTCCCTCTGGSNNCGTGACAGACGAATTCAGasp117R (SEQ ID NO522)TCCTCGGACTGTTCCCTCSNNATACGTGACAGACGAATTasp118R (SEQ ID NO523)AAGTCCTCGGACTGTTCCSNNTGGATACGTGACAGACGAasp119R (SEQ ID NO524)GATAAGTCCTCGGACTGTSNNCTCTGGATACGTGACAGAasp120R (SEQ ID NO525)asp121R GCGGATAAGTCCTCGGACSNNTCCCTCTGGATACGTGAC
(SEQ ID NO526)CGTGCGGATAAGTCCTCGSNNTGTTCCCTCTGGATACGTasp122R (SEQ ID NO527)CGTCGTGCGGATAAGTCCSNNGACTGTTCCCTCTGGATAasp123R (SEQ ID NO528)AACCGTCGTGCGGATAAGSNNTCGGACTGTTCCCTCTGGasp124R (SEQ ID NO529)ACAAACCGTCGTGCGGATSNNTCCTCGGACTGTTCCCTCasp125R (SEQ ID NO530)GGCACAAACCGTCGTGCGSNNAAGTCCTCGGACTGTTCCasp126R (SEQ ID NO531)TTCGGCACAAACCGTCGTSNNGATAAGTCCTCGGACTGTasp127R (SEQ ID NO532)TGGTTCGGCACAAACCGTSNNGCGGATAAGTCCTCGGACasp128R (SEQ ID NO533)ACCTGGTTCGGCACAAACSNNCGTGCGGATAAGTCCTCGasp129R (SEQ ID NO534)ATCACCTGGTTCGGCACASNNCGTCGTGCGGATAAGTCCasp130R (SEQ ID NO535)GCTATCACCTGGTTCGGCSNNAACCGTCGTGCGGATAAGasp131R (SEQ ID NO536)TCCGCTATCACCTGGTTCSNNACAAACCGTCGTGCGGATasp132R (SEQ ID NO537)ACCTCCGCTATCACCTGGSNNGGCACAAACCGTCGTGCGasp133R (SEQ ID NO538)GCTACCTCCGCTATCACCSNNTTCGGCACAAACCGTCGTasp134R (SEQ ID NO539)AAGGCTACCTCCGCTATCSNNTGGTTCGGCACAAACCGTasp135R (SEQ ID NO540)TAAAAGGCTACCTCCGCTSNNACCTGGTTCGGCACAAACasp136R (SEQ ID NO541)CGCTAAAAGGCTACCTCCSNNATCACCTGGTTCGGCACAasp137R (SEQ ID NO542)TCCCGCTAAAAGGCTACCSNNGCTATCACCTGGTTCGGCasp138R (SEQ ID NO543)ATTTCCCGCTAAAAGGCTSNNTCCGCTATCACCTGGTTCasp139R (SEQ ID NO544)TTGATTTCCCGCTAAAAGSNNACCTCCGCTATCACCTGGasp140R (SEQ ID NO545)GGCTTGATTTCCCGCTAASNNGCTACCTCCGCTATCACCasp141R (SEQ ID NO546)TTGGGCTTGATTTCCCGCSNNAAGGCTACCTCCGCTATCasp142R (SEQ ID NO547)ACCTTGGGCTTGATTTCCSNNTAAAAGGCTACCTCCGCTasp143R (SEQ ID NO548)GACACCTTGGGCTTGATTSNNCGCTAAAAGGCTACCTCCasp144R (SEQ ID NO549)CGTGACACCTTGGGCTTGSNNTCCCGCTAAAAGGCTACCasp145R (SEQ ID NO550)TGACGTGACACCTTGGGCSNNATTTCCCGCTAAAAGGCTasp146R (SEQ ID NO551)
ACCTGACGTGACACCTTGSNNTTGATTTCCCGCTAAAAGasp147R (SEQ ID NO552)ACCACCTGACGTGACACCSNNGGCTTGATTTCCCGCTAAasp148R (SEQ ID NO553)AGAACCACCTGACGTGACSNNTTGGGCTTGATTTCCCGCasp149R (SEQ ID NO554)TCCAGAACCACCTGACGTSNNACCTTGGGCTTGATTTCCasp150R (SEQ ID NO555)ATTTCCAGAACCACCTGASNNGACACCTTGGGCTTGATTasp151R (SEQ ID NO556)ACAATTTCCAGAACCACCSNNCGTGACACCTTGGGCTTGasp152R (SEQ ID NO557)CCGACAATTTCCAGAACCSNNTGACGTGACACCTTGGGCasp153R (SEQ ID NO558)CGTCCGACAATTTCCAGASNNACCTGACGTGACACCTTGasp154R (SEQ ID NO559)CCCCGTCCGACAATTTCCSNNACCACCTGACGTGACACCasp155R (SEQ ID NO560)TCCCCCCGTCCGACAATTSNNAGAACCACCTGACGTGACasp156R (SEQ ID NO561)TGTTCCCCCCGTCCGACASNNTCCAGAACCACCTGACGTasp157R (SEQ ID NO562)TGTTGTTCCCCCCGTCCGSNNATTTCCAGAACCACCTGAasp158R (SEQ ID NO563)GAATGTTGTTCCCCCCGTSNNACAATTTCCAGAACCACCasp159R (SEQ ID NO564)AAAGAATGTTGTTCCCCCSNNCCGACAATTTCCAGAACCasp160R (SEQ ID NO565)TTGAAAGAATGTTGTTCCSNNCGTCCGACAATTTCCAGAasp161R (SEQ ID NO566)TGGTTGAAAGAATGTTGTSNNCCCCGTCCGACAATTTCCasp162R (SEQ ID NO567)GACTGGTTGAAAGAATGTSNNTCCCCCCGTCCGACAATTasp163R (SEQ ID NO568)GTTGACTGGTTGAAAGAASNNTGTTCCCCCCGTCCGACAasp164R (SEQ ID NO569)CGGGTTGACTGGTTGAAASNNTGTTGTTCCCCCCGTCCGasp165R (SEQ ID NO570)AATCGGGTTGACTGGTTGSNNGAATGTTGTTCCCCCCGTasp166R (SEQ ID NO571)CAAAATCGGGTTGACTGGSNNAAAGAATGTTGTTCCCCCasp167R (SEQ ID NO572)CTGCAAAATCGGGTTGACSNNTTGAAAGAATGTTGTTCC(SEQasp168R ID NO573)AGCCTGCAAAATCGGGTTSNNTGGTTGAAAGAATGTTGT(SEQasp169R ID NO574)GTAAGCCTGCAAAATCGGSNNGACTGGTTGAAAGAATGTasp170R (SEQ ID NO575)GCCGTAAGCCTGCAAAATSNNGTTGACTGGTTGAAAGAAasp171R (SEQ ID NO576)asp172R CAGGCCGTAAGCCTGCAASNNCGGGTTGACTGGTTGAAA
(SEQ ID NO577)TCTCAGGCCGTAAGCCTGSNNAATCGGGTTGACTGGTTGasp173R (SEQ ID NO578)CATTCTCAGGCCGTAAGCSNNCAAAATCGGGTTGACTGGasp174R (SEQ ID NO579)AATCATTCTCAGGCCGTASNNCTGCAAAATCGGGTTGACasp175R (SEQ ID NO580)CGTAATCATTCTCAGGCCSNNAGCCTGCAAAATCGGGTTasp176R (SEQ ID NO581)AGTCGTAATCATTCTCAGSNNGTAAGCCTGCAAAATCGGasp177R (SEQ ID NO582)GTCAGTCGTAATCATTCTSNNGCCGTAAGCCTGCAAAATasp178R (SEQ ID NO583)AGAGTCAGTCGTAATCATSNNCAGGCCGTAAGCCTGCAAasp179R (SEQ ID NO584)TCCAGAGTCAGTCGTAATSNNTCTCAGGCCGTAAGCCTGasp180R (SEQ ID NO585)ACTTCCAGAGTCAGTCGTSNNCATTCTCAGGCCGTAAGCasp181R (SEQ ID NO586)GGAACTTCCAGAGTCAGTSNNAATCATTCTCAGGCCGTAasp182R (SEQ ID NO587)AGGGGAACTTCCAGAGTCSNNCGTAATCATTCTCAGGCCasp183R (SEQ ID NO588)TTAAGGGGAACTTCCAGASNNAGTCGTAATCATTCTCAGasp184R (SEQ ID NO589)GGGTTAAGGGGAACTTCCSNNGTCAGTCGTAATCATTCTasp185R (SEQ ID NO590)GTTGGGTTAAGGGGAACTSNNAGAGTCAGTCGTAATCATasp186R (SEQ ID NO591)TCTGTTGGGTTAAGGGGASNNTCCAGAGTCAGTCGTAATasp187R (SEQ ID NO592)TCCTCTGTTGGGTTAAGGSNNACTTCCAGAGTCAGTCGTasp188R (SEQ ID NO593)CCGTCCTCTGTTGGGTTASNNGGAACTTCCAGAGTCAGTasp189R (SEQ ID NO594)
实施例16精氨酸和半胱氨酸组合突变(Combinatorial Mutants)的构建[678]在该实施例中，描述了ASP的多个精氨酸和半胱氨酸突变体的构建。进行这些试验为了确定使用表面精氨酸和半胱氨酸组合文库是否产生具有增加的蛋白质表达水平的突变体。
QuikChange_多重定点诱变(QCMS)试剂盒(Stratagene)被用于构建这两种文库。被用来产生这两种文库的5′磷酸化引物在表16-1中示出。注意，就全长引物的整合以及包含引物的错误的显著减少而言，HPLC、PAGE或任何其他类型的纯化引物给出好得多的结果。然而，在这些试验中，未使用纯化的引物，这可能导致12％的克隆会产生不期望的突变。
表16-1引物和序列引物引物序列

pHPLT-ASP-C1-2质粒制备和体外甲基化[680]为了使用QCMS试剂盒构建半胱氨酸和精氨酸文库，模板质粒pHPLT-ASP-C1-2首先在体外进行甲基化，这是因为它来源于不在GATC位点对DNA进行甲基化的芽孢杆菌菌株。使用该方法的原因是，尽管确保在QCMS方案中所用的质粒被甲基化的更为常用的方法是涉及从dam+大肠杆菌菌株获取DNA，但这种方法并不在这里被选择，这是因为质粒pHPLT-ASP-C1-2不在大肠杆菌中生长。
由含有pHPLT-ASP-C1-2质粒的芽孢杆菌细胞小量制备DNA。具体地，将菌株在含有10ppm新霉素的5mL LB中过夜生长，之后通过旋转离心沉降细胞。Qiagen spin miniprep DNA试剂盒被用来制备质粒DNA，其中增加一个步骤，在该步骤中，在加入250μL试剂盒中的P1缓冲液后，加入100μL的10mg/mL溶菌酶。将该样品在37℃振荡温育15分钟，之后进行Qiagen miniprep试剂盒手册中描述的剩余的步骤。小量制备的DNA用30μL试剂盒中提供的Qiagen缓冲液EB洗脱。
接下来，使用NEB(NEB目录编号M0222S)的dam甲基化酶试剂盒对pHPLT-ASP-C1-2质粒DNA进行甲基化。简言之，25μL的小量制备DNA(约1-2μg)用20μL的10×NEB dam甲基化酶缓冲液、0.5μL的S-腺苷甲硫氨酸(80μM)、4μL的dam甲基化酶和150.5μL无菌蒸馏水温育。反应在37℃温育4小时，之后，使用Qiagen PCR纯化试剂盒纯化DNA。甲基化的DNA用40μL试剂盒中提供的缓冲液EB洗脱。为了确认DNA的甲基化，将4μL纯化的甲基化的DNA在20μL反应中用MboI(NEB；该酶切割未甲基化的GATC位点)或DpnI(Roche；该酶切割甲基化的GATC位点)消化，每一种酶的用量为2μL。将反应在37℃温育2小时，并在1.2％E胶(invitrogen)上分析它们。对于DpnI消化，观察到小分子量的DNA条带拖尾/梯(smear/ladder)，而MboI消化物显示完整的DNA，这表明pHPLT-ASP-C1-2质粒成功地被甲基化。
文库构建[683]按照Stratagene QCMS试剂盒中提供的方案，构建半胱氨酸(cys)和精氨酸(arg)组合文库，不同之处是反应中使用的引物浓度不同。具体地，将4μL甲基化的纯化pHPLT-ASP-C1-2质粒(约25至50ng)与15μL无菌蒸馏水、1.5μL dNTP、2.5μL10×缓冲液、1μL酶混合物和1.0μL精氨酸或半胱氨酸突变引物混合物(即，100ng的总引物量)混合。九种精氨酸引物中的每一种引物各取10μL(100ng/μL)或六种半胱氨酸引物中的每一种引物各取10μL(100ng/μL)，制备所述引物混合物；在之前的一轮诱变中，如Stratagene手册所推荐的，对于arg和cys文库都加入50ng的每一种引物，结果导致少于50％的克隆含有突变。因此，在本轮诱变中对方案进行了修改，以在每一反应中包括100ng的总引物量。循环条件是95℃，1min；然后进行30个循环95℃，1min，55℃，1min和65℃，9min，这在MJ Research热循环仪中进行，使用薄壁0.2mL PCR管。通过在37℃温育过夜，反应产物用QCMS试剂盒中的1μL DpnI消化。加入额外的0.5μL的DpnI，将反应温育1小时。
为了将文库DNA直接转化入枯草芽孢杆菌细胞，而不通过大肠杆菌，文库DNA(单链QCMS产物)用TempliPhi试剂盒(Amersham cat.#25-6400)扩增，这是因为芽孢杆菌转化需要双链多聚体DNA。为了该目的，将1μL精氨酸或半胱氨酸QCMS反应与TempliPhi试剂盒中的5μL样品缓冲液混合，并在95℃加热3分钟，以使DNA变性。将反应置于冰上冷却2分钟，然后短暂旋转沉降。接下来，加入5μL反应缓冲液和TempliPhi试剂盒中的0.2μL phi29聚合酶，并将反应在MJ Research PCR仪中30℃温育4小时。通过在PCR仪中65℃温育10分钟，使反应中phi29酶加热失活。
为了将文库转化入芽孢杆菌，将0.5μL的TempliPhi扩增反应产物与100μL的comK感受态细胞混合，然后在37℃激烈振荡1小时。将转化产物系列稀释直至105倍，将50μL的每一稀释物涂于含有10ppm新霉素和1.6％脱脂奶的LA平板上。从每一文库挑选24个克隆，用于测序。简言之，将克隆重新悬浮于20μL的无菌蒸馏水中，然后将2μL用于PCR，PCR使用ReadyTaq珠(Amersham)，总体积25μL。以0.5μM的浓度加入引物ASPF1和ASPR4。循环条件是94℃，4min一次，然后进行30个循环94℃，1min，55℃，1min和72℃，1min，然后在72℃，7min进行一轮。在每一种情况下都获得1.5kb的片段，产物用Qiagen PCR纯化试剂盒纯化。纯化的PCR产物用ASPF4和ASPR4引物测序。
总共48个克隆(每一文库24个)被测序。诱变进行得很好，因为只有约15％的克隆是WT。但是20％的克隆具有混合的序列，这是因为板上布满了菌落或者是因为TempliPhi扩增导致了非常浓的用于转化的DNA。而且，如上所提到的，约12％的克隆具有额外的突变。剩余的克隆都是突变体，其中约60-80％是独特的突变体。对精氨酸和半胱氨酸文库的测序结果在表16-2和16-3中给出。

在测序中被鉴定的突变体中，下述来自精氨酸文库的突变体(参见表16-4)是令人感兴趣的。参见下面的实施例以获得关于这些突变体特性的额外数据。

重要地，活性结果表明，半胱氨酸残基中的突变产生具有非常低的活性或没有活性的ASP蛋白酶，这揭示了二硫键在分子的稳定性中起重要作用。然而，本发明不旨在局限于任何特定的机制。
实施例17同源特氏厄氏菌蛋白酶在青紫链霉菌中表达[689]在该实施例中，描述了在青紫链霉菌中表达由特氏厄氏菌产生的、与蛋白酶69B4同源的蛋白酶。因此，本实施例描述了包括编码具有蛋白水解活性的多肽的多核苷酸的质粒，并使用此质粒转化青紫链霉菌宿主细胞。本文中使用的转化方法是本领域已知的(参见例如美国专利6,287,839和WO 02/50245，它们通过参考并入本文)。
用于这些试验中的载体(即质粒)包括编码本发明的蛋白酶的多核苷酸，其获自特氏厄氏菌DSM 20577。该质粒被用于转化青紫链霉菌。最终的质粒载体在本文中被称为″pSEA4CT-特氏厄氏菌″。
如前面描述的载体，pSEA4CT-特氏厄氏菌的构建利用了pSEGCT质粒载体(参见上文)。
可操作地连接到编码特氏厄氏菌蛋白酶(Otp)的结构基因上的黑曲霉(″A4″)调控序列被用于促成蛋白酶的表达。利用本领域已知的融合PCR技术构建，A4-调控序列和特氏厄氏菌信号序列、N-端原序列和成熟蛋白酶序列(即，无C-端原序列)之间的融合，该融合物作为XbaI-BamHI片段。用于将特氏厄氏菌蛋白酶(Otp)克隆到pSEA4CT中的多核苷酸引物是基于SEQ ID NO67。使用的引物序列是A4-turb Fw5′-CAGAGACAGACCCCCGGAGGTAACCATGGCACGATCATTCTGGAGGACGC-3′(SEQ ID NO613)A4-turb RV5′-GCGTCCTCCAGAATGATCGTGCCATGGTTACCTCCGGGGGTCTGTCTCTG-3′(SEQ ID NO614)A4-turb Bam Rv
5′-AFCCGCTCGCGGATCCCCATTGTCAGCTCGGGCCCCCACCGTCAGAGGTCACGAG-3′(SEQ ID NO615)A4-Xba1-FW5′-GCAGCCTGAACTAGTTGCGATCCTCTAGAGATCGAACTTCAT-3′(SEQ IDNO616)[693]将片段连接到用XbaI和BamHI消化的质粒pSEA4CT，产生质粒pSEA4CT-特氏厄氏菌。
使用前面实施例中描述的原生质体方法(即，使用Hopwood等，见上的方法)，用质粒载体pSEA4CT-特氏厄氏菌转化宿主青紫链霉菌TK23。
在TS*培养基中，放大培养转化的培养物，以提供两份发酵培养物。TS*培养基的组成(g/L)是胰蛋白胨(Difco)，16；大豆蛋白胨(Difco)，4；酪蛋白水解物(Merck)，20；K2HPO4，10；葡萄糖，15；Basildon消泡剂，0.6；pH 7.0。在各个时间点，移取发酵肉汤的样品用于分析。对于该试验的目的，脱脂奶程序被用于确认成功的克隆。将30μl的摇瓶上清液移取到脱脂奶琼脂板的穿刺孔中，并在37℃温育。
温育过夜后，通过视觉检查温育的板上透明区(晕圈)的存在，透明区(晕圈表明有蛋白水解酶被表达。对于该试验的目的，也分析了样品的蛋白酶活性和分子量(SDS-PAGE)。在发酵的结束时，通过SDS-PAGE观察到全长蛋白酶。
发酵肉汤的样品按如下分析收集10μl的稀释的上清液，用实施例1中描述的二甲基酪蛋白水解分析方法进行分析。2个克隆的发酵肉汤的分析结果清楚地显示，来自特氏厄氏菌的、编码具有蛋白水解活性的多肽的多核苷酸在青紫链霉菌中被表达。
实施例18同源纤维单胞菌和纤维微细菌属蛋白酶在青紫链霉菌中的表达[698]在该实施例中，描述了在青紫链霉菌中表达由Cellulomonas cellasea DSM20118和纤维化纤维微细菌DSM 204244产生的、与蛋白酶69B4同源的蛋白酶。因此，本实施例描述了包括编码具有蛋白水解活性的多肽的多核苷酸的质粒，并使用此质粒转化青紫链霉菌宿主细胞。本文中使用的转化方法是本领域已知的(参见例如美国专利6,287,839和WO 02/50245，它们通过参考并入本文)。
最终的质粒载体在本文中被称为pSEA4CT-C.cellasea和pSEA4CT-Cm.cellulans。pSEA4CT-C.cellasea和pSEA4CT-Cm.cellulans的构建利用了上文描述的pSEGCT质粒载体。
可操作地连接到编码Cellulomonas cellasea成熟蛋白酶(Ccp)的结构基因或者连接到编码纤维化纤维微细菌成熟蛋白酶(Cmcp)的结构基因上的黑曲霉(″A4″)调控序列被用于促成蛋白酶的表达。利用融合PCR技术来构建A4-调控序列和69B4蛋白酶信号序列、69B4蛋白酶基因N-端原序列和天然蛋白酶基因的成熟序列之间的融合，该融合物作为XbaI-BamHI片段，所述天然蛋白酶基因获自微球菌亚目的菌株(在此指Cellulomonas cellasea或纤维化纤维微细菌)的基因组DNA。用于将Cellulomonas cellasea蛋白酶(Ccp)克隆到pSEA4CT的多核苷酸引物是基于SEQ IDNO63，使用的引物序列是Asp-npro fw-cell5′-AGACCGACGAGACCCCGCGGACCATGGTCGACGTCATCGGCGGCAACGCGTACTAC-3′(SEQ ID NO617)Cell-BH1-rv5′-TCAGCCGATCCGCTCGCGGATCCCCATTGTCAGCCCAGGACGAGACGCAGACCGTA-3′(SEQ ID NO618)Asp-npro rv-cell5′-GTAGTACGCGTTGCCGCCGATGACGTCGACCATGGTCCGCGGGGTCTCGTCGGTCT-3′(SEQ ID NO619)Xba-1 fw A45′-GCAGCCTGAACTAGTTGCGATCCTCTAGAGATCGAACTTCATGTTCGA-3′(SEQ ID NO620)用于将纤维化纤维微细菌蛋白酶(Cmcp)克隆到pSEA4CT中的多核苷酸引物是基于SEQ ID NO71，描述如下ASP-npro fw cellu5′-ACCGACGAGACCCCGCGGACCATGCACGGCGACGTGCGCGGCGGCGACCGCTA-3′(SEQ ID NO621)ASP-npro rv cellu5′-TAGCGGTCGCCGCCGCGCACGTCGCCGTGCATGGTCCGCGGGGTCTCGTCGGT-3′(SEQ ID NO622)Cellu-BH1-rv5′-TCAGCCGATCCGCTCGCGGATCCCCATTGTCAGCGAGCCCGACGAGCGCGCTGCCCGAC-3′(SEQ ID NO623)Xba-1 fw A4
5′-GCAGCCFGAACTAGTTGCGATCCTCTAGAGATCGAACTFCATGTTCGA-3′(SEQ ID NO620)[701]使用上面描述的原生质体方法(即，使用Hopwood等，见上的方法)，用质粒载体pSEA4CT转化宿主青紫链霉菌TK23。在TS*培养基中，放大培养转化的培养物，以提供两份发酵培养物。TS*培养基的组成(g/L)是胰蛋白胨(Difco)，16；大豆蛋白胨(Difco)，4；酪蛋白水解物(Merck)，20；K2HPO4，10；葡萄糖，15；Basildon消泡剂，0.6；pH 7.0。在各时间点，移取发酵肉汤的样品用于分析。对于该试验的目的，脱脂奶程序被用于确认成功的克隆。将30μl的摇瓶上清液移取到脱脂奶琼脂板的穿刺孔中，并在37℃温育。
温育过夜后，通过视觉检查温育的板上透明区(晕圈)的存在，透明区(晕圈表明有蛋白水解酶被表达。对于该试验的目的，也分析了样品的蛋白酶活性和分子量(SDS-PAGE)。在发酵结束时，通过SDS-PAGE观察全长蛋白酶。
发酵肉汤的样品按如下分析取得10μl的稀释的上清液，加入到190μl AAPF溶液(浓度1mg/ml，在0.1M Tris/0.005％TWEEN 80，pH 8.6中)。监测由于p-硝基苯胺的释放而导致的在410nm吸光度的增加的速率(25℃)。
如前面实施例中所描述的，获得的结果清楚地表明，来自Cellulomonascellasea或来自纤维化纤维微细菌的多核苷酸——两者都编码具有蛋白水解活性的多肽——在青紫链霉菌中被表达。
实施例19ASP蛋白酶的晶体结构的测定[705]在该实施例中，描述了用于测定ASP蛋白酶的晶体结构的方法。事实上，从纯化的ASP蛋白酶获得了高质量的单晶体。结晶条件如下25％PEG 8000、0.2M硫酸铵和15％甘油。这些结晶条件是防冷冻性，因此不必转移到防冻剂。晶体在液氮中被冻结，并且在使用Xstream(Molecular Structure)采集数据期间保持冻结状态。数据用R-axis IV(Molecular Structure)采集，R-axis IV装备有聚焦镜。获得X-射线反射数据，分辨率达到1.9_。空间群是P212121，晶胞尺寸是a＝35.65_、b＝51.82_和c＝76.86_。每一不对称单元具有一个分子。
使用分子置换方法(molecular replacement method)，解析了晶体结构。使用的程序是X-MR(Accelrys Inc.)。用于分子置换计算的起始分子是链霉蛋白酶。从获自X-MR的电子密度图谱清楚地看出，分子置换方案是正确的。因此，该模型的98％被正确地构建，一些微小的误差通过手工校正。达到1.9_水平的数据的R-因子是0.23。
该结构被发现主要由β-折叠组成，具有2个非常短的α-螺旋，和朝向C-末端的较长的螺旋。有两组β-折叠，在它们之间有相当大的界面。活性位点被发现存在于在该界面形成的隙口中。由His 32、Asp 56和Ser 137形成催化三联体。表19-1提供了ASP的被鉴定的原子坐标。
表19-1 ASP的原子坐标(表中，“ATOM“指“原子”，涉及的氨基酸残基用传统的三字母记法来表示)CRYST135.770 51.730 76.650 90.00 90.00 90.00 P212121ATOM 1 N PHE A 12.421 18.349 15.176 1.00 16.78NATOM 2 CA PHE A 13.695 18.087 15.905 1.00 18.18CATOM 3 CB PHE A 14.875 18.550 15.048 1.00 16.73CATOM 4 C PHE A 13.700 18.810 17.249 1.00 16.36CATOM 5 O PHE A 13.443 20.011 17.315 1.00 17.91OATOM 6 CG PHE A 16.214 18.292 15.664 1.00 17.42CATOM 7 CD2 PHE A 16.955 17.180 15.296 1.00 19.42CATOM 8 CD1 PHE A 16.736 19.160 16.611 1.00 16.13CATOM 9 CE2 PHE A 18.200 16.933 15.863 1.00 18.08CATOM 10 CE1 PHE A 17.977 18.922 17.180 1.00 18.34CATOM 11 CZ PHE A 18.710 17.807 16.806 1.00 19.32CATOM 12 N ASP A 23.984 18.076 18.321 1.00 13.94NATOM 13 CA ASP A 24.015 18.670 19.654 1.00 15.04CATOM 14 CB ASP A 23.527 17.677 20.714 1.00 15.13CATOM 15 C ASP A 25.403 19.149 20.063 1.00 14.43CATOM 16 O ASP A 26.381 18.408 19.966 1.00 11.44OATOM 17 CG ASP A 22.088 17.243 20.502 1.00 18.25CATOM 18 OD2 ASP A 21.721 16.150 20.986 1.00 19.05OATOM 19 OD1 ASP A 21.320 17.996 19.874 1.00 15.33OATOM 20 N VAL A 35.479 20.393 20.523 1.00 12.30NATOM 21 CA VAL A 36.740 20.979 20.959 1.00 11.83CATOM 22 CB VAL A 36.812 22.480 20.603 1.00 11.52CATOM 23 C VAL A 36.766 20.795 22.470 1.00 13.77CATOM 24 O VAL A 35.912 21.321 23.183 1.00 11.14OATOM 25 CG1 VAL A 37.987 23.133 21.309 1.00 15.13CATOM 26 CG2 VAL A 36.968 22.637 19.101 1.00 14.21CATOM 27 CB ILE A 47.561 18.267 24.642 1.00 14.73CATOM 28 CG2 ILE A 47.799 17.929 26.099 1.00 14.20CATOM 29 CG1 ILE A 46.103 17.995 24.267 1.00 16.79CATOM 30 CD1 ILE A 45.774 16.518 24.166 1.00 19.32C
ATOM 31 C ILE A 49.334 20.031 24.816 1.00 14.04CATOM 32 O ILE A 410.289 19.660 24.140 1.00 11.09OATOM 33 N ILE A 47.745 20.033 22.945 1.00 10.83NATOM 34 CA ILE A 47.903 19.750 24.365 1.00 13.46CATOM 35 N GLY A 59.475 20.681 25.965 1.00 11.82NATOM 36 CA GLY A 510.800 20.995 26.467 1.00 9.81 CATOM 37 C GLY A 511.700 19.785 26.644 1.00 11.77CATOM 38 O GLY A 511.256 18.737 27.114 1.00 9.20 OATOM 39 N GLY A 612.966 19.927 26.255 1.00 10.03NATOM 40 CA GLY A 613.917 18.836 26.397 1.00 8.54 CATOM 41 C GLY A 614.070 17.979 25.156 1.00 9.57 CATOM 42 O GLY A 615.020 17.200 25.042 1.00 7.69 OATOM 43 N ASN A 713.131 18.119 24.224 1.00 9.01 NATOM 44 CA ASN A 713.168 17.359 22.985 1.00 10.51CATOM 45 CB ASN A 711.780 17.293 22.349 1.00 14.65CATOM 46 CG ASN A 710.897 16.250 22.981 1.00 10.35CATOM 47 OD1 ASN A 79.715 16.144 22.644 1.00 13.61OATOM 48 ND2 ASN A 711.456 15.470 23.896 1.00 6.66 NATOM 49 C ASN A 714.130 17.952 21.976 1.00 12.30CATOM 50 O ASN A 714.424 19.146 21.991 1.00 15.93OATOM 51 N ALA A 814.608 17.107 21.079 1.00 11.08NATOM 52 CA ALA A 815.532 17.564 20.063 1.00 14.32CATOM 53 CB ALA A 816.336 16.392 19.541 1.00 14.61CATOM 54 C ALA A 814.766 18.202 18.914 1.00 11.23CATOM 55 O ALA A 813.567 17.987 18.747 1.00 12.54OATOM 56 N TYR A 915.468 19.021 18.145 1.00 9.75 MATOM 57 CA TYR A 914.899 19.691 16.988 1.00 12.42CATOM 58 CB TYR A 914.279 21.059 17.334 1.00 12.79CATOM 59 CG TYR A 915.216 22.150 17.790 1.00 14.12CATOM 60 CD2 TYR A 915.485 22.333 19.139 1.00 10.17CATOM 61 CE2 TYR A 916.302 23.366 19.572 1.00 12.49CATOM 62 CD1 TYR A 915.791 23.029 16.877 1.00 9.02 CATOM 63 CE1 TYR A 916.604 24.066 17.294 1.00 10.92CATOM 64 CZ TYR A 916.857 24.230 18.644 1.00 13.93CATOM 65 OH TYR A 917.661 25.261 19.070 1.00 12.50OATOM 66 C TYR A 916.127 19.792 16.101 1.00 12.21CATOM 67 O TYR A 917.247 19.589 16.583 1.00 11.38OATOM 68 N THR A 1015.946 20.055 14.816 1.00 11.44NATOM 69 CA THR A 1017.105 20.144 13.946 1.00 13.35CATOM 70 CB THR A 1017.114 18.998 12.916 1.00 14.07CATOM 71 OG1 THR A 1015.952 19.098 12.086 1.00 13.63OATOM 72 CG2 THR A 1017.121 17.648 13.620 1.00 12.60CATOM 73 C THR A 1017.267 21.452 13.194 1.00 14.66CATOM 74 O THR A 1016.299 22.161 12.907 1.00 12.64OATOM 75 N ILE A 1118.520 21.749 12.881 1.00 14.05NATOM 76 CA ILE A 1118.889 22.954 12.157 1.00 18.00CATOM 77 CB ILE A 1119.649 23.931 13.068 1.00 17.58CATOM 78 CG2 ILE A 1119.919 25.230 12.323 1.00 20.00CATOM 79 CG1 ILE A 1118.825 24.212 14.327 1.00 21.47CATOM 80 CD1 ILE A 1119.560 25.031 15.377 1.00 23.61CATOM 81 C ILE A 1119.802 22.485 11.030 1.00 16.40CATOM 82 O ILE A 1120.913 22.014 11.278 1.00 17.72OATOM 83 N GLY A 1219.330 22.603 9.794 1.00 18.83NATOM 84 CA GLY A 1220.132 22.155 8.673 1.00 17.69CATOM 85 C GLY A 1220.359 20.659 8.791 1.00 18.86CATOM 86 O GLY A 1221.395 20.141 8.376 1.00 19.71OATOM 87 N GLY A 1319.391 19.964 9.380 1.00 17.62NATOM 88 CA GLY A 1319.509 18.525 9.529 1.00 16.37CATOM 89 C GLY A 1320.352 18.060 10.703 1.00 17.10CATOM 90 O GLY A 1320.470 16.861 10.946 1.00 15.94OATOM 91 N ARG A 1420.931 19.002 11.438 1.00 17.27NATOM 92 CA ARG A 1421.772 18.667 12.585 1.00 15.15CATOM 93 CB ARG A 1423.017 19.558 12.586 1.00 19.68CATOM 94 C ARG A 1421.030 18.842 13.908 1.00 16.27CATOM 95 O ARG A 1420.423 19.882 14.159 1.00 12.16OATOM 96 CG ARG A 1424.009 19.273 13.699 1.00 25.94CATOM 97 CD ARG A 1424.879 18.069 13.393 1.00 31.69CATOM 98 NE ARG A 1425.964 17.928 14.360 1.00 40.26NATOM 99 CZ ARG A 1425.802 17.572 15.630 1.00 42.65CATOM100 NH1 ARG A 1426.852 17.483 16.435 1.00 45.09NATOM101 NH2 ARG A 1424.592 17.302 16.091 1.00 41.89NATOM102 N SER A 1521.075 17.821 14.756 1.00 14.36NATOM103 CA SER A 1520.407 17.892 16.047 1.00 18.05CATOM104 CB SER A 1520.033 16.488 16.524 1.00 19.52CATOM105 C SER A 1521.402 18.533 17.011 1.00 18.51CATOM106 O SER A 1521.966 17.870 17.882 1.00 16.89OATOM107 OG SER A 1519.311 16.542 17.742 1.00 24.25OATOM108 N ARG A 1621.625 19.829 16.842 1.00 15.76N
ATOM109 CA ARG A 1622.560 20.544 17.695 1.00 18.30CATOM110 CB ARG A 1623.077 21.795 16.976 1.00 22.82CATOM111 C ARG A 1622.006 20.952 19.050 1.00 17.05CATOM112 O ARG A 1622.760 21.064 20.015 1.00 11.60OATOM113 CG ARG A 1623.892 21.498 15.729 1.00 30.78CATOM114 CD ARG A 1624.503 22.758 15.131 1.00 36.12CATOM115 NE ARG A 1623.494 23.756 14.789 1.00 41.88NATOM116 CZ ARG A 1623.737 24.839 14.058 1.00 44.68CATOM117 NH2 ARG A 1624.954 25.057 13.579 1.00 46.43NATOM118 NH1 ARG A 1622.762 25.698 13.796 1.00 44.09NATOM119 N CYS A 1720.695 21.152 19.130 1.00 12.26NATOM120 CA CYS A 1720.085 21.562 20.388 1.00 11.02CATOM121 CB CYS A 1719.949 23.079 20.394 1.00 11.05CATOM122 C CYS A 1718.744 20.946 20.756 1.00 8.62 CATOM123 O CYS A 1718.178 20.154 20.008 1.00 10.24OATOM124 SG CYS A 1721.542 23.945 20.503 1.00 10.83SATOM125 N SER A 1818.246 21.338 21.926 1.00 9.44 NATOM126 CA SER A 1816.976 20.849 22.441 1.00 10.14CATOM127 CB SER A 1817.226 20.053 23.726 1.00 11.06CATOM128 OG SER A 1818.198 19.042 23.516 1.00 11.13OATOM129 C SER A 1816.019 22.004 22.736 1.00 10.28CATOM130 O SER A 1816.439 23.152 22.882 1.00 12.80OATOM131 N ILE A 1914.731 21.689 22.806 1.00 8.87 NATOM132 CA ILE A 1913.698 22.676 23.087 1.00 9.04 CATOM133 CB ILE A 1912.278 22.070 22.951 1.00 9.94 CATOM134 CG2 ILE A 1911.236 23.126 23.287 1.00 10.60CATOM135 CG1 ILE A 1912.053 21.514 21.543 1.00 12.49CATOM136 CD1 ILE A 1912.083 22.554 20.439 1.00 10.46CATOM137 C ILE A 1913.840 23.154 24.530 1.00 9.36 CATOM138 O ILE A 1914.039 22.346 25.442 1.00 7.81 OATOM139 N GLY A 2013.748 24.466 24.729 1.00 6.59 NATOM140 CA GLY A 2013.827 25.024 26.067 1.00 7.48 CATOM141 C GLY A 2012.424 25.027 26.649 1.00 10.12CATOM142 O GLY A 2012.047 24.128 27.400 1.00 9.28 OATOM143 N PHE A 2111.636 26.037 26.293 1.00 11.70NATOM144 CA PHE A 2110.262 26.132 26.770 1.00 9.99 CATOM145 CB PHE A 2110.182 27.019 28.009 1.00 12.23CATOM146 CG PHE A 2110.891 26.455 29.197 1.00 12.14CATOM147 CD1 PHE A 2110.282 25.493 29.985 1.00 10.45CATOM148 CD2 PHE A 2112.174 26.873 29.517 1.00 11.10CATOM149 CE1 PHE A 2110.943 24.953 31.078 1.00 9.63 CATOM150 CE2 PHE A 2112.841 26.339 30.606 1.00 10.44CATOM151 CZ PHE A 2112.225 25.377 31.390 1.00 5.44 CATOM152 C PHE A 219.378 26.721 25.692 1.00 11.93CATOM153 O PHE A 219.838 27.500 24.861 1.00 11.86OATOM154 N ALA A 228.105 26.346 25.709 1.00 8.59 NATOM155 CA ALA A 227.171 26.861 24.722 1.00 10.98CATOM156 CB ALA A 225.978 25.920 24.580 1.00 9.33 CATOM157 C ALA A 226.708 28.233 25.200 1.00 9.72 CATOM158 O ALA A 226.452 28.431 26.390 1.00 10.20OATOM159 N VAL A 236.621 29.178 24.270 1.00 9.39 NATOM160 CA VAL A 236.186 30.542 24.579 1.00 11.79CATOM161 CB VAL A 237.369 31.545 24.567 1.00 8.77 CATOM162 CG1 VAL A 238.373 31.176 25.644 1.00 12.30CATOM163 CG2 VAL A 238.034 31.557 23.195 1.00 9.56 CATOM164 C VAL A 235.197 30.943 23.496 1.00 12.96CATOM165 O VAL A 235.047 30.234 22.507 1.00 15.51OATOM166 N ASN A 244.509 32.066 23.668 1.00 15.64NATOM167 CA ASN A 243.559 32.472 22.642 1.00 18.48CATOM168 CB ASN A 242.848 33.772 23.048 1.00 23.96CATOM169 C ASN A 244.304 32.661 21.319 1.00 18.42CATOM170 O ASN A 245.277 33.410 21.251 1.00 16.60OATOM171 CG ASN A 243.800 34.949 23.182 1.00 23.94CATOM172 OD1 ASN A 244.697 34.951 24.025 1.00 23.82OATOM173 ND2 ASN A 243.602 35.964 22.345 1.00 25.51NATOM174 N GLY A 253.868 31.956 20.278 1.00 19.39NATOM175 CA GLY A 254.509 32.086 18.978 1.00 18.25CATOM176 C GLY A 255.628 31.106 18.649 1.00 18.73CATOM177 O GLY A 256.103 31.065 17.515 1.00 18.70OATOM178 N GLY A 266.064 30.318 19.624 1.00 14.44NATOM179 CA GLY A 267.123 29.362 19.348 1.00 15.00CATOM180 C GLY A 267.779 28.822 20.602 1.00 11.05CATOM181 O GLY A 267.095 28.457 21.554 1.00 10.68OATOM182 N PHE A 279.107 28.759 20.599 1.00 11.66NATOM183 CA PHE A 279.832 28.268 21.761 1.00 11.72CATOM184 CB PHE A 2710.056 26.748 21.679 1.00 10.14CATOM185 C PHE A 2711.169 28.960 21.934 1.00 10.62CATOM186 O PHE A 2711.727 29.509 20.985 1.00 12.74O
ATOM187 CG PHE A 2711.000 26.309 20.580 1.00 9.74 CATOM188 CD1 PHE A 2710.524 26.006 19.308 1.00 12.75CATOM189 CD2 PHE A 2712.361 26.158 20.832 1.00 11.98CATOM190 CE1 PHE A 2711.384 25.555 18.312 1.00 8.90 CATOM191 CE2 PHE A 2713.228 25.707 19.837 1.00 10.80CATOM192 CZ PHE A 2712.740 25.406 18.580 1.00 9.83 CATOM193 N ILE A 2811.675 28.948 23.162 1.00 12.44NATOM194 CA ILE A 2812.956 29.573 23.442 1.00 10.82CATOM195 CB ILE A 2812.903 30.454 24.707 1.00 10.35CATOM196 C ILE A 2813.992 28.469 23.590 1.00 12.26CATOM197 O ILE A 2813.667 27.335 23.960 1.00 11.25OATOM198 CG2 ILE A 2812.081 31.701 24.434 1.00 7.92 CATOM199 CG1 ILE A 2812.278 29.690 25.873 1.00 12.08CATOM200 CD1 ILE A 2812.175 30.526 27.129 1.00 10.36CATOM201 N THR A 2915.238 28.804 23.283 1.00 11.02NATOM202 CA THR A 2916.327 27.845 23.364 1.00 11.15CATOM203 CB THR A 2916.348 26.988 22.052 1.00 13.72CATOM204 OG1 THR A 2917.364 25.981 22.124 1.00 11.80OATOM205 CG2 THR A 2916.594 27.875 20.841 1.00 9.32 CATOM206 C THR A 2917.630 28.628 23.555 1.00 10.10CATOM207 O THR A 2917.595 29.818 23.888 1.00 8.90 OATOM208 N ALA A 3018.771 27.974 23.353 1.00 8.93 NATOM209 CA ALA A 3020.069 28.630 23.511 1.00 8.72 CATOM210 CB ALA A 3021.135 27.602 23.862 1.00 9.30 CATOM211 C ALA A 3020.476 29.388 22.252 1.00 8.30 CATOM212 O ALA A 3020.243 28.925 21.133 1.00 11.59OATOM213 N GLY A 3121.097 30.547 22.448 1.00 10.82NATOM214 CA GLY A 3121.527 31.366 21.330 1.00 10.68CATOM215 C GLY A 3122.626 30.770 20.469 1.00 12.90CATOM216 O GLY A 3122.656 31.014 19.259 1.00 12.57OATOM217 N HIS A 3223.529 29.991 21.065 1.00 9.76 NATOM218 CA HIS A 3224.615 29.409 20.285 1.00 9.96 CATOM219 CB HIS A 3225.747 28.891 21.194 1.00 11.85CATOM220 CG HIS A 3225.442 27.602 21.896 1.00 9.52 CATOM221 CD2 HIS A 3225.495 26.319 21.464 1.00 11.42CATOM222 ND1 HIS A 3225.093 27.545 23.226 1.00 12.01NATOM223 CE1 HIS A 3224.945 26.281 23.588 1.00 12.23CATOM224 NE2 HIS A 3225.185 25.518 22.538 1.00 12.81NATOM225 C HIS A 3224.138 28.301 19.355 1.00 8.20 CATOM226 O HIS A 3224.917 27.768 18.569 1.00 10.19OATOM227 N CYS A 3322.850 27.977 19.430 1.00 8.42 NATOM228 CA CYS A 3322.270 26.933 18.589 1.00 9.80 CATOM229 CB CYS A 3320.894 26.536 19.117 1.00 11.66CATOM230 SG CYS A 3320.964 25.864 20.798 1.00 13.22SATOM231 C CYS A 3322.131 27.410 17.152 1.00 14.10CATOM232 O CYS A 3322.338 26.649 16.212 1.00 14.43OATOM233 N GLY A 3421.775 28.676 16.982 1.00 14.60NATOM234 CA GLY A 3421.622 29.202 15.643 1.00 13.42CATOM235 C GLY A 3421.365 30.690 15.632 1.00 13.64CATOM236 O GLY A 3420.989 31.278 16.652 1.00 12.12OATOM237 N ARG A 3521.565 31.299 14.467 1.00 12.90NATOM238 CA ARG A 3521.360 32.728 14.301 1.00 15.08CATOM239 CB ARG A 3522.458 33.322 13.416 1.00 14.13CATOM240 C ARG A 3520.003 33.020 13.673 1.00 11.11CATOM241 O ARG A 3519.367 32.144 13.084 1.00 14.43OATOM242 CG ARG A 3522.408 32.854 11.971 1.00 19.31CATOM243 CD ARG A 3523.430 33.597 11.123 1.00 21.41CATOM244 NE ARG A 3524.800 33.232 11.469 1.00 22.20NATOM245 CZ ARG A 3525.410 32.135 11.032 1.00 22.78CATOM246 NH1 ARG A 3526.658 31.875 11.400 1.00 21.47NATOM247 NH2 ARG A 3524.779 31.305 10.215 1.00 23.65NATOM248 N THR A 3619.566 34.265 13.803 1.00 12.06NATOM249 CA THR A 3618.291 34.688 13.251 1.00 10.87CATOM250 CB THR A 3618.123 36.212 13.411 1.00 14.79CATOM251 C THR A 3618.212 34.305 11.774 1.00 11.54CATOM252 O THR A 3619.195 34.414 11.043 1.00 10.69OATOM253 OG1 THR A 3618.002 36.522 14.802 1.00 19.95OATOM254 CG2 THR A 3616.889 36.705 12.679 1.00 17.55CATOM255 N GLY A 3717.047 33.839 11.339 1.00 11.25NATOM256 CA GLY A 3716.896 33.446 9.950 1.00 10.63CATOM257 C GLY A 3717.140 31.965 9.705 1.00 16.44CATOM258 O GLY A 3716.711 31.421 8.688 1.00 13.24OATOM259 N ALA A 3817.837 31.306 10.624 1.00 16.27NATOM260 CA ALA A 3818.101 29.877 10.481 1.00 17.14CATOM261 C ALA A 3816.781 29.118 10.602 1.00 15.01CATOM262 O ALA A 3815.943 29.447 11.442 1.00 14.04OATOM263 CB ALA A 3819.074 29.416 11.559 1.00 16.54CATOM264 N THR A 3916.588 28.107 9.764 1.00 15.44N
ATOM265 CA THR A 3915.355 27.329 9.811 1.00 16.44CATOM266 CB THR A 3914.867 26.956 8.397 1.00 16.50CATOM267 OG1 THR A 3915.848 26.146 7.746 1.00 22.08OATOM268 CG2 THR A 3914.615 28.209 7.578 1.00 17.88CATOM269 C THR A 3915.522 26.052 10.622 1.00 14.04OATOM270 O THR A 3916.603 25.467 10.669 1.00 13.48OATOM271 N THR A 4014.437 25.626 11.256 1.00 14.41NATOM272 CA THR A 4014.445 24.421 12.072 1.00 12.76OATOM273 CB THR A 4014.081 24.735 13.536 1.00 13.70CATOM274 OG1 THR A 4012.745 25.260 13.601 1.00 11.68OATOM275 CG2 THR A 4015.043 25.752 14.118 1.00 10.97CATOM276 C THR A 4013.437 23.399 11.566 1.00 12.70CATOM277 O THR A 4012.554 23.717 10.773 1.00 15.30OATOM278 N ALA A 4113.592 22.164 12.033 1.00 12.69NATOM279 CA ALA A 4112.713 21.062 11.667 1.00 13.39CATOM280 C ALA A 4112.425 20.346 12.986 1.00 13.08CATOM281 O ALA A 4113.234 20.403 13.912 1.00 13.32OATOM282 CB ALA A 4113.403 20.121 10.682 1.00 12.91CATOM283 N ASN A 4211.280 19.680 13.075 1.00 13.98NATOM284 CA ASN A 4210.909 18.966 14.296 1.00 15.22CATOM285 C ASN A 4211.074 19.886 15.507 1.00 15.41CATOM286 O ASN A 4211.835 19.580 16.426 1.00 14.69OATOM287 CB ASN A 4211.792 17.727 14.507 1.00 18.61CATOM288 CG ASN A 4211.862 16.826 13.282 1.00 22.16CATOM289 OD1 ASN A 4210.893 16.685 12.536 1.00 20.39OATOM290 ND2 ASN A 4213.017 16.192 13.085 1.00 21.80NATOM291 N PRO A 4310.319 20.994 15.558 1.00 12.16NATOM292 CA PRO A 439.329 21.449 14.579 1.00 13.99CATOM293 CB PRO A 438.328 22.178 15.454 1.00 14.60CATOM294 C PRO A 439.863 22.387 13.508 1.00 14.85CATOM295 O PRO A 4310.949 22.950 13.633 1.00 12.84OATOM296 CD PRO A 4310.287 21.862 16.751 1.00 11.35CATOM297 CG PRO A 439.259 22.940 16.356 1.00 12.54CATOM298 N THR A 449.074 22.556 12.454 1.00 12.78NATOM299 CA THR A 449.454 23.436 11.370 1.00 13.48CATOM300 CB THR A 448.441 23.349 10.217 1.00 15.07CATOM301 C THR A 449.387 24.818 12.010 1.00 13.36CATOM302 O THR A 448.430 25.127 12.721 1.00 12.32OATOM303 OG1 THR A 448.582 22.082 9.565 1.00 17.67OATOM304 CG2 THR A 448.660 24.473 9.216 1.00 14.97CATOM305 N GLY A 4510.412 25.631 11.787 1.00 12.10NATOM306 CA GLY A 4510.423 26.958 12.369 1.00 13.77CATOM307 C GLY A 4511.557 27.824 11.865 1.00 12.84CATOM308 O GLY A 4512.340 27.412 11.006 1.00 14.31OATOM309 N THR A 4611.648 29.033 12.404 1.00 12.18NATOM310 CA THR A 4612.686 29.970 12.001 1.00 15.03CATOM311 CB THR A 4612.141 30.953 10.952 1.00 15.90CATOM312 OG1 THR A 4611.528 30.219 9.884 1.00 20.72OATOM313 CG2 THR A 4613.257 31.821 10.392 1.00 18.41CATOM314 C THR A 4613.167 30.777 13.203 1.00 13.19CATOM315 O THR A 4612.352 31.331 13.944 1.00 10.72OATOM316 N PHE A 4714.480 30.835 13.407 1.00 11.27NATOM317 CA PHE A 4715.009 31.596 14.527 1.00 10.95CATOM318 CB PHE A 4716.541 31.508 14.596 1.00 11.26CATOM319 CG PHE A 4717.054 30.306 15.346 1.00 12.89CATOM320 CD2 PHE A 4717.559 30.442 16.633 1.00 8.64 CATOM321 CD1 PHE A 4717.036 29.046 14.767 1.00 12.80CATOM322 CE2 PHE A 4718.040 29.342 17.331 1.00 12.73CATOM323 CE1 PHE A 4717.514 27.941 15.457 1.00 12.73CATOM324 CZ PHE A 4718.017 28.088 16.740 1.00 14.16CATOM325 C PHE A 4714.590 33.041 14.291 1.00 12.22CATOM326 O PHE A 4714.737 33.563 13.182 1.00 13.19OATOM327 N ALA A 4814.058 33.673 15.330 1.00 11.62NATOM328 CA ALA A 4813.613 35.059 15.240 1.00 12.91CATOM329 CB ALA A 4812.092 35.126 15.261 1.00 13.93CATOM330 C ALA A 4814.184 35.856 16.400 1.00 15.66CATOM331 O ALA A 4813.470 36.598 17.072 1.00 21.12OATOM332 N GLY A 4915.482 35.700 16.622 1.00 15.68NATOM333 CA GLY A 4916.139 36.407 17.701 1.00 16.25CATOM334 C GLY A 4917.156 35.500 18.352 1.00 15.88CATOM335 O GLY A 4916.820 34.403 18.799 1.00 13.45OATOM336 N SER A 5018.404 35.947 18.405 1.00 13.85NATOM337 CA SER A 5019.454 35.144 19.012 1.00 13.96CATOM338 CB SER A 5020.014 34.156 17.984 1.00 17.08CATOM339 OG SER A 5021.045 33.365 18.541 1.00 14.72OATOM340 C SER A 5020.574 36.026 19.543 1.00 16.90CATOM341 O SER A 5021.082 36.894 18.835 1.00 16.85OATOM342 N SER A 5120.941 35.802 20.801 1.00 15.23N
ATOM343 CA SER A 5122.003 36.561 21.447 1.00 14.67CATOM344 CB SER A 5121.440 37.431 22.570 1.00 15.96CATOM345 OG SER A 5122.474 38.172 23.187 1.00 18.34OATOM346 C SER A 5123.062 35.622 22.017 1.00 11.74CATOM347 O SER A 5122.809 34.888 22.969 1.00 12.45OATOM348 N PHE A 5224.247 35.655 21.419 1.00 8.44 NATOM349 CA PHE A 5225.367 34.822 21.842 1.00 11.84CATOM350 CB PHE A 5225.090 33.344 21.557 1.00 9.85 CATOM351 CG PHE A 5226.264 32.450 21.837 1.00 14.45CATOM352 CD1 PHE A 5226.561 32.056 23.133 1.00 14.77CATOM353 CD2 PHE A 5227.095 32.037 20.808 1.00 14.93CATOM354 CE1 PHE A 5227.665 31.267 23.400 1.00 12.39CATOM355 CE2 PHE A 5228.203 31.250 21.067 1.00 13.03CATOM356 CZ PHE A 5228.489 30.864 22.364 1.00 15.39CATOM357 C PHE A 5226.595 35.245 21.051 1.00 11.09CATOM358 O PHE A 5226.523 35.416 19.830 1.00 10.06OATOM359 N PRO A 5327.737 35.427 21.732 1.00 13.84NATOM360 CD PRO A 5329.034 35.610 21.055 1.00 13.82CATOM361 CA PRO A 5327.919 35.257 23.177 1.00 11.97CATOM362 CB PRO A 5329.433 35.114 23.319 1.00 15.91CATOM363 CG PRO A 5329.953 35.957 22.201 1.00 16.14CATOM364 C PRO A 5327.345 36.429 23.972 1.00 13.65CATOM365 O PRO A 5326.411 37.085 23.516 1.00 12.98OATOM366 N GLY A 5427.909 36.706 25.144 1.00 13.22NATOM367 CA GLY A 5427.385 37.778 25.975 1.00 13.41CATOM368 C GLY A 5426.291 37.112 26.781 1.00 13.11CATOM369 O GLY A 5426.403 36.931 27.995 1.00 12.76OATOM370 N ASN A 5525.223 36.740 26.083 1.00 13.05NATOM371 CA ASN A 5524.110 36.013 26.681 1.00 14.39CATOM372 CB ASN A 5522.761 36.681 26.396 1.00 12.65CATOM373 CG ASN A 5522.758 38.153 26.682 1.00 11.23CATOM374 OD1 ASN A 5522.521 38.967 25.784 1.00 16.09OATOM375 ND2 ASN A 5523.001 38.516 27.933 1.00 11.47NATOM376 C ASN A 5524.141 34.721 25.888 1.00 15.51CATOM377 O ASN A 5525.076 34.485 25.123 1.00 11.36OATOM378 N ASP A 5623.124 33.890 26.072 1.00 14.13NATOM379 CA ASP A 5623.039 32.631 25.346 1.00 11.90CATOM380 CB ASP A 5623.881 31.522 25.993 1.00 9.70 CATOM381 CG ASP A 5624.053 30.320 25.070 1.00 9.97 CATOM382 OD1 ASP A 5624.712 29.330 25.459 1.00 12.57OATOM383 OD2 ASP A 5623.526 30.365 23.938 1.00 8.45 OATOM384 C ASP A 5621.578 32.216 25.279 1.00 9.86 CATOM385 O ASP A 5621.158 31.254 25.920 1.00 11.82OATOM386 N TYR A 5720.798 32.969 24.509 1.00 8.71 NATOM387 CA TYR A 5719.379 32.677 24.351 1.00 10.51CATOM388 CB TYR A 5718.523 33.480 25.348 1.00 12.30CATOM389 CG TYR A 5718.650 34.992 25.271 1.00 12.51CATOM390 CD1 TYR A 5719.275 35.708 26.291 1.00 11.12CATOM391 CE1 TYR A 5719.366 37.094 26.244 1.00 11.36CATOM392 CD2 TYR A 5718.121 35.706 24.197 1.00 13.29CATOM393 CE2 TYR A 5718.209 37.096 24.144 1.00 10.62CATOM394 CZ TYR A 5718.832 37.783 25.169 1.00 13.60CATOM395 OH TYR A 5718.921 39.162 25.122 1.00 12.04OATOM396 C TYR A 5718.912 32.963 22.933 1.00 10.26CATOM397 O TYR A 5719.573 33.674 22.172 1.00 10.59OATOM398 N ALA A 5817.767 32.393 22.578 1.00 9.32 NATOM399 CA ALA A 5817.200 32.583 21.254 1.00 7.41 CATOM400 CB ALA A 5817.943 31.732 20.241 1.00 7.89 CATOM401 C ALA A 5815.727 32.207 21.271 1.00 10.96CATOM402 O ALA A 5815.260 31.510 22.175 1.00 11.10OATOM403 N PHE A 5915.002 32.702 20.277 1.00 11.71NATOM404 CA PHE A 5913.578 32.435 20.136 1.00 12.26CATOM405 CB PHE A 5912.748 33.707 20.333 1.00 10.18CATOM406 CG PHE A 5911.321 33.576 19.859 1.00 11.71CATOM407 CD2 PHE A 5910.871 34.297 18.764 1.00 11.51CATOM408 CD1 PHE A 5910.441 32.709 20.490 1.00 10.35CATOM409 CE2 PHE A 599.566 34.156 18.307 1.00 15.38CATOM410 CE1 PHE A 599.140 32.563 20.044 1.00 14.84CATOM411 CZ PHE A 598.700 33.286 18.949 1.00 13.16CATOM412 C PHE A 5913.361 31.931 18.722 1.00 11.77CATOM413 O PHE A 5913.887 32.507 17.771 1.00 13.80OATOM414 N VAL A 6012.600 30.852 18.590 1.00 10.53NATOM415 CA VAL A 6012.310 30.278 17.285 1.00 11.14CATOM416 CB VAL A 6012.738 28.796 17.209 1.00 15.19CATOM417 CG1 VAL A 6012.337 28.212 15.856 1.00 10.78CATOM418 CG2 VAL A 6014.248 28.670 17.421 1.00 11.44CATOM419 C VAL A 6010.801 30.363 17.082 1.00 11.30CATOM420 O VAL A 6010.034 29.905 17.924 1.00 8.90 O
ATOM421 N ARG A 61 10.372 30.964 15.979 1.00 12.67NATOM422 CA ARG A 618.944 31.083 15.716 1.00 11.18CATOM423 CB ARG A 618.655 32.314 14.844 1.00 12.63CATOM424 CG ARG A 617.194 32.398 14.379 1.00 17.12CATOM425 CD ARG A 616.967 33.527 13.376 1.00 20.85CATOM426 NE ARG A 615.563 33.614 12.971 1.00 24.18NATOM427 CZ ARG A 614.949 32.744 12.171 1.00 24.05CATOM428 NH2 ARG A 613.665 32.904 11.884 1.00 25.34NATOM429 NH1 ARG A 615.609 31.708 11.670 1.00 25.91NATOM430 C ARG A 618.424 29.831 15.011 1.00 12.67CATOM431 O ARG A 619.070 29.316 14.096 1.00 11.46OATOM432 N THR A 627.274 29.333 15.461 1.00 13.58NATOM433 CA THR A 626.666 28.147 14.865 1.00 13.24CATOM434 CB THR A 626.495 26.995 15.884 1.00 11.66CATOM435 OG1 THR A 625.729 27.450 17.007 1.00 13.55OATOM436 CG2 THR A 627.853 26.485 16.349 1.00 13.26CATOM437 C THR A 625.289 28.558 14.335 1.00 13.42CATOM438 O THR A 624.727 29.568 14.770 1.00 16.80OATOM439 N GLY A 634.748 27.778 13.406 1.00 16.51NATOM440 CA GLY A 633.455 28.108 12.834 1.00 15.85CATOM441 C GLY A 632.387 27.033 12.894 1.00 16.64CATOM442 O GLY A 632.137 26.432 13.938 1.00 12.21OATOM443 N ALA A 641.753 26.788 11.753 1.00 15.51NATOM444 CA ALA A 640.678 25.810 11.663 1.00 15.84CATOM445 C ALA A 641.090 24.378 11.977 1.00 15.00CATOM446 O ALA A 642.228 23.977 11.742 1.00 15.60OATOM447 CB ALA A 640.052 25.866 10.279 1.00 16.27CATOM448 N GLY A 650.144 23.614 12.510 1.00 17.17NATOM449 CA GLY A 650.390 22.217 12.828 1.00 19.41CATOM450 C GLY A 651.369 21.946 13.953 1.00 19.21CATOM451 O GLY A 651.691 20.790 14.234 1.00 22.10OATOM452 N VAL A 661.842 23.001 14.603 1.00 15.20NATOM453 CA VAL A 662.788 22.844 15.697 1.00 15.99CATOM454 CB VAL A 664.018 23.746 15.501 1.00 15.02CATOM455 C VAL A 662.116 23.195 17.016 1.00 18.46CATOM456 O VAL A 661.769 24.349 17.257 1.00 16.96OATOM457 CG1 VAL A 664.961 23.602 16.688 1.00 13.36CATOM458 CG2 VAL A 664.725 23.375 14.195 1.00 11.46CATOM459 N ASN A 671.931 22.193 17.866 1.00 15.34NATOM460 CA ASN A 671.294 22.407 19.158 1.00 16.12CATOM461 CB ASN A 670.474 21.177 19.539 1.00 21.O1CATOM462 C ASN A 672.332 22.704 20.228 1.00 17.24CATOM463 O ASN A 673.172 21.862 20.554 1.00 17.97OATOM464 CG ASN A 67-0.465 20.748 18.431 1.00 29.21CATOM465 OD1 ASN A 67-1.308 21.527 17.976 1.00 33.32OATOM466 ND2 ASN A 67-0.323 19.505 17.982 1.00 33.03NATOM467 N LEU A 682.260 23.915 20.767 1.00 13.94NATOM468 CA LEU A 683.175 24.378 21.807 1.00 14.43CATOM469 CB LEU A 683.317 25.896 21.707 1.00 13.70CATOM470 C LEU A 682.638 23.985 23.178 1.00 15.01CATOM471 O LEU A 681.670 24.568 23.664 1.00 16.08OATOM472 CG LEU A 683.835 26.395 20.358 1.00 8.95 CATOM473 CD1 LEU A 683.736 27.910 20.284 1.00 8.47 CATOM474 CD2 LEU A 685.270 25.931 20.179 1.00 12.27CATOM475 N LEU A 693.284 23.005 23.805 1.00 12.99NATOM476 CA LEU A 692.861 22.529 25.119 1.00 12.18CATOM477 CB LEU A 692.888 20.997 25.134 1.00 12.27CATOM478 CG LEU A 692.075 20.310 24.029 1.00 16.54CATOM479 CD1 LEU A 692.251 18.802 24.113 1.00 17.85CATOM480 CD2 LEU A 690.611 20.679 24.170 1.00 19.65CATOM481 C LEU A 693.665 23.050 26.307 1.00 14.39CATOM482 O LEU A 694.879 23.239 26.228 1.00 14.53OATOM483 N ALA A 702.969 23.271 27.416 1.00 12.89NATOM484 CA ALA A 703.594 23.761 28.635 1.00 14.83CATOM485 CB ALA A 702.585 24.547 29.457 1.00 18.71CATOM486 C ALA A 704.042 22.519 29.391 1.00 12.67CATOM487 O ALA A 703.638 22.293 30.523 1.00 11.15OATOM488 N GLN A 714.876 21.711 28.742 1.00 13.59NATOM489 CA GLN A 715.382 20.483 29.334 1.00 14.04CATOM490 CB GLN A 714.591 19.282 28.809 1.00 14.08CATOM491 CG GLN A 713.114 19.283 29.157 1.00 17.65CATOM492 CD GLN A 712.378 18.099 28.560 1.00 19.50CATOM493 OE1 GLN A 711.421 17.592 29.143 1.00 24.87OATOM494 NE2 GLN A 712.815 17.658 27.386 1.00 17.48NATOM495 C GLN A 716.849 20.255 29.011 1.00 16.23CATOM496 O GLN A 717.375 20.786 28.035 1.00 15.48OATOM497 N VAL A 727.501 19.451 29.840 1.00 13.56NATOM498 CA VAL A 728.907 19.133 29.648 1.00 12.57C
ATOM499 CB VAL A 72 9.792 19.754 30.748 1.00 10.81CATOM500 CG1 VAL A 72 11.193 19.162 30.677 1.00 12.46CATOM501 CG2 VAL A 72 9.862 21.271 30.563 1.00 10.56CATOM502 C VAL A 72 9.007 17.610 29.695 1.00 10.65CATOM503 O VAL A 72 8.415 16.968 30.565 1.00 11.44OATOM504 N ASN A 73 9.736 17.036 28.746 1.00 11.79NATOM505 CA ASN A 73 9.913 15.586 28.673 1.00 10.87CATOM506 CB ASN A 73 10.633 15.229 27.369 1.00 12.22CATOM507 CG ASN A 73 10.598 13.743 27.065 1.00 12.04CATOM508 OD1 ASN A 73 10.411 12.916 27.959 1.00 11.92OATOM509 ND2 ASN A 73 10.790 13.397 25.798 1.00 10.15NATOM510 C ASN A 73 10.751 15.098 29.863 1.00 11.93CATOM511 O ASN A 73 11.854 15.597 30.092 1.00 11.67OATOM512 N ASN A 74 10.239 14.137 30.631 1.00 12.17NATOM513 CA ASN A 74 11.010 13.640 31.766 1.00 9.29 CATOM514 CB ASN A 74 10.109 13.275 32.958 1.00 13.70CATOM515 CG ASN A 74 9.162 12.126 32.662 1.00 16.27CATOM516 OD1 ASN A 74 9.432 11.274 31.815 1.00 14.62OATOM517 ND2 ASN A 74 8.048 12.088 33.384 1.00 18.77NATOM518 C ASN A 74 11.853 12.435 31.359 1.00 11.15CATOM519 O ASN A 74 12.528 11.823 32.189 1.00 10.62OATOM520 N TYR A 75 11.813 12.115 30.069 1.00 13.30NATOM521 CA TYR A 75 12.556 10.998 29.495 1.00 13.21CATOM522 CB TYR A 75 14.039 11.363 29.386 1.00 10.04CATOM523 CG TYR A 75 14.313 12.223 28.170 1.00 11.82CATOM524 CD1 TYR A 75 14.424 11.652 26.907 1.00 10.82CATOM525 CE1 TYR A 75 14.591 12.435 25.775 1.00 12.83CATOM526 CD2 TYR A 75 14.381 13.608 28.271 1.00 10.15CATOM527 CE2 TYR A 75 14.545 14.402 27.142 1.00 10.33CATOM528 CZ TYR A 75 14.648 13.805 25.898 1.00 9.45 CATOM529 OH TYR A 75 14.793 14.579 24.770 1.00 10.77OATOM530 C TYR A 75 12.380 9.652 30.188 1.00 16.68CATOM531 O TYR A 75 13.298 8.835 30.228 1.00 18.39OATOM532 N SER A 76 11.185 9.433 30.723 1.00 18.33NATOM533 CA SER A 76 10.846 8.193 31.411 1.00 20.49CATOM534 CB SER A 76 10.811 8.390 32.926 1.00 21.53CATOM535 OG SER A 76 12.121 8.424 33.457 1.00 25.72OATOM536 C SER A 76 9.470 7.775 30.919 1.00 21.06CATOM537 O SER A 76 8.843 6.868 31.473 1.00 20.62OATOM538 N GLY A 77 9.013 8.452 29.870 1.00 17.80NATOM539 CA GLY A 77 7.715 8.156 29.295 1.00 18.95CATOM540 C GLY A 77 6.649 9.128 29.752 1.00 17.33CATOM541 O GLY A 77 5.464 8.942 29.470 1.00 16.270ATOM542 N GLY A 78 7.059 10.173 30.462 1.00 15.79NATOM543 CA GLY A 78 6.088 11.142 30.939 1.00 16.07CATOM544 C GLY A 78 6.499 12.585 30.734 1.00 17.80CATOM545 O GLY A 78 7.481 12.876 30.041 1.00 15.22OATOM546 N ARG A 79 5.742 13.492 31.342 1.00 17.07NATOM547 CA ARG A 79 6.025 14.914 31.226 1.00 19.85CATOM548 CB ARG A 79 5.199 15.528 30.090 1.00 23.00CATOM549 CG ARG A 79 5.711 15.176 28.701 1.00 29.54CATOM550 CD ARG A 79 4.683 14.404 27.910 1.00 35.50CATOM551 NE ARG A 79 5.207 13.941 26.626 1.00 39.02NATOM552 CZ ARG A 79 6.223 13.094 26.493 1.00 41.51CATOM553 NH1 ARG A 79 6.838 12.611 27.566 1.00 38.71NATOM554 NH2 ARG A 79 6.620 12.716 25.285 1.00 43.02NATOM555 C ARG A 79 5.784 15.695 32.510 1.00 18.62CATOM556 O ARG A 79 4.968 15.313 33.353 1.00 16.21OATOM557 N VAL A 80 6.517 16.793 32.646 1.00 15.48NATOM558 CA VAL A 80 6.412 17.660 33.810 1.00 14.56CATOM559 CB VAL A 80 7.806 18.040 34.349 1.00 14.30CATOM560 CG1 VAL A 80 7.666 18.967 35.542 1.00 16.79CATOM561 CG2 VAL A 80 8.580 16.787 34.729 1.00 18.13CATOM562 C VAL A 80 5.690 18.930 33.375 1.00 15.88CATOM563 O VAL A 80 6.106 19.588 32.421 1.00 14.01OATOM564 N GLN A 81 4.602 19.270 34.057 1.00 15.03NATOM565 CA GLN A 81 3.863 20.472 33.698 1.00 18.02CATOM566 CB GLN A 81 2.503 20.512 34.403 1.00 21.88CATOM567 CG GLN A 81 1.422 19.659 33.760 1.00 29.23CATOM568 CD GLN A 81 1.161 20.030 32.311 1.00 29.08CATOM569 OE1 GLN A 81 0.928 21.194 31.984 1.00 31.12OATOM570 NE2 GLN A 81 1.192 19.034 31.434 1.00 32.61NATOM571 C GLN A 81 4.654 21.722 34.067 1.00 17.67CATOM572 O GLN A 81 5.278 21.786 35.128 1.00 18.79OATOM573 N VAL A 82 4.636 22.709 33.179 1.00 15.10NATOM574 CA VAL A 82 5.345 23.960 33.411 1.00 17.88CATOM575 CB VAL A 82 5.973 24.494 32.107 1.00 16.36CATOM576 CG1 VAL A 82 6.710 25.792 32.374 1.00 19.17C
ATOM577 CG2 VAL A 82 6.927 23.454 31.534 1.00 15.85CATOM578 C VAL A 82 4.309 24.952 33.930 1.00 18.78CATOM579 O VAL A 82 3.512 25.494 33.163 1.00 19.15OATOM580 N ALA A 83 4.321 25.175 35.240 1.00 20.30NATOM581 CA ALA A 83 3.382 26.091 35.879 1.00 20.84CATOM582 CB ALA A 83 3.230 25.725 37.348 1.00 20.26CATOM583 C ALA A 83 3.734 27.568 35.751 1.00 20.34CATOM584 O ALA A 83 2.849 28.405 35.594 1.00 21.44OATOM585 N GLY A 84 5.021 27.886 35.826 1.00 18.33NATOM586 CA GLY A 84 5.445 29.267 35.721 1.00 15.96CATOM587 C GLY A 84 6.946 29.381 35.558 1.00 18.35CATOM588 O GLY A 84 7.599 28.433 35.117 1.00 16.24OATOM589 N HIS A 85 7.495 30.534 35.924 1.00 16.53NATOM590 CA HIS A 85 8.931 30.767 35.798 1.00 14.08CATOM591 CB HIS A 85 9.219 31.528 34.498 1.00 14.33CATOM592 C HIS A 85 9.534 31.510 36.988 1.00 14.07CATOM593 O HIS A 8510.349 32.413 36.818 1.00 15.60OATOM594 CG HIS A 85 8.399 32.770 34.323 1.00 18.31CATOM595 ND1 HIS A 85 8.937 34.035 34.404 1.00 21.61NATOM596 CD2 HIS A 85 7.079 32.936 34.064 1.00 19.95CATOM597 NE2 HIS A 85 6.848 34.289 33.994 1.00 18.84NATOM598 CE1 HIS A 85 7.983 34.929 34.202 1.00 22.08CATOM599 N THR A 86 9.128 31.124 38.193 1.00 14.33NATOM600 CA THR A 86 9.640 31.758 39.405 1.00 13.94CATOM601 CB THR A 86 8.754 31.449 40.612 1.00 15.26CATOM602 C THR A 8611.044 31.243 39.690 1.00 14.65CATOM603 O THR A 8611.249 30.042 39.855 1.00 11.10OATOM604 OG1 THR A 86 7.424 31.904 40.347 1.00 16.89OATOM605 CG2 THR A 86 9.289 32.147 41.854 1.00 16.68CATOM606 N ALA A 8712.005 32.157 39.756 1.00 15.86NATOM607 CA ALA A 8713.396 31.801 40.016 1.00 17.16CATOM608 C ALA A 8713.633 31.152 41.375 1.00 19.39CATOM609 O ALA A 8713.113 31.608 42.395 1.00 18.84OATOM610 CB ALA A 8714.272 33.034 39.877 1.00 17.44CATOM611 N ALA A 8814.431 30.088 41.373 1.00 16.82NATOM612 CA ALA A 8814.766 29.352 42.584 1.00 14.95CATOM613 C ALA A 8816.112 29.832 43.119 1.00 15.66CATOM614 O ALA A 8817.004 30.204 42.355 1.00 15.62OATOM615 CB ALA A 8814.827 27.861 42.291 1.00 10.05CATOM616 N PRO A 8916.275 29.822 44.447 1.00 15.05NATOM617 CA PRO A 8917.510 30.259 45.100 1.00 16.15CATOM618 CB PRO A 8917.060 30.498 46.535 1.00 16.59CATOM619 C PRO A 8918.661 29.260 45.022 1.00 17.33CATOM620 O PRO A 8918.461 28.076 44.741 1.00 14.79OATOM621 CD PRO A 8915.236 29.522 45.448 1.00 17.98CATOM622 CG PRO A 8916.040 29.425 46.728 1.00 15.94CATOM623 N VAL A 9019.873 29.751 45.257 1.00 18.24NATOM624 CA VAL A 9021.046 28.894 45.221 1.00 17.32CATOM625 CB VAL A 9022.312 29.658 45.672 1.00 16.39CATOM626 CG1 VAL A 9023.449 28.678 45.932 1.00 19.70CATOM627 CG2 VAL A 9022.711 30.665 44.609 1.00 18.18CATOM628 C VAL A 9020.764 27.770 46.211 1.00 17.15CATOM629 O VAL A 9020.153 28.005 47.254 1.00 17.16OATOM630 N GLY A 9121.192 26.556 45.878 1.00 13.56NATOM631 CA GLY A 9120.971 25.420 46.755 1.00 13.61CATOM632 C GLY A 9119.787 24.583 46.314 1.00 14.54CATOM633 O GLY A 9119.652 23.422 46.695 1.00 13.48OATOM634 N SER A 9218.928 25.175 45.497 1.00 12.12NATOM635 CA SER A 9217.741 24.486 45.014 1.00 13.41CATOM636 CB SER A 9216.846 25.457 44.239 1.00 10.87CATOM637 OG SER A 9216.334 26.463 45.090 1.00 12.36OATOM638 C SER A 9218.040 23.284 44.134 1.00 13.34CATOM639 O SER A 9219.015 23.268 43.383 1.00 9.90 OATOM640 N ALA A 9317.189 22.274 44.252 1.00 11.16NATOM641 CA ALA A 9317.324 21.057 43.475 1.00 14.34CATOM642 CB ALA A 9316.554 19.925 44.136 1.00 14.73CATOM643 C ALA A 9316.713 21.389 42.119 1.00 14.46CATOM644 O ALA A 9315.605 21.920 42.047 1.00 13.83OATOM645 N VAL A 9417.440 21.092 41.048 1.00 14.27NATOM646 CA VAL A 9416.946 21.370 39.707 1.00 9.84 CATOM647 CB VAL A 9417.617 22.629 39.113 1.00 11.32CATOM648 CG1 VAL A 9417.204 23.859 39.904 1.00 9.34 CATOM649 CG2 VAL A 9419.140 22.467 39.126 1.00 10.97CATOM650 C VAL A 9417.216 20.209 38.763 1.00 9.69 CATOM651 O VAL A 9418.139 19.421 38.976 1.00 10.59OATOM652 N CYS A 9516.398 20.094 37.727 1.00 10.10NATOM653 CA CYS A 9516.573 19.027 36.752 1.00 9.94 CATOM654 CB CYS A 9515.468 17.983 36.845 1.00 11.63C
ATOM655 SG CYS A 9515.412 17.059 38.410 1.00 13.27SATOM656 C CYS A 9516.566 19.624 35.359 1.00 10.91CATOM657 O CYS A 9515.808 20.551 35.061 1.00 11.33OATOM658 N ARG A 9617.424 19.070 34.515 1.00 9.30 NATOM659 CA ARG A 9617.570 19.496 33.135 1.00 7.08 CATOM660 CB ARG A 9619.050 19.767 32.827 1.00 9.79 CATOM661 CG ARG A 9619.326 20.069 31.353 1.00 10.80CATOM662 CD ARG A 9620.808 19.966 31.011 1.00 10.58CATOM663 NE ARG A 9621.355 18.643 31.312 1.00 11.86NATOM664 CZ ARG A 9620.957 17.506 30.747 1.00 10.78CATOM665 NH1 ARG A 9619.995 17.500 29.831 1.00 10.18NATOM666 NH2 ARG A 9621.529 16.365 31.103 1.00 12.39NATOM667 C ARG A 9617.068 18.397 32.211 1.00 9.14 CATOM668 O ARG A 9617.237 17.214 32.499 1.00 10.81OATOM669 N SER A 9716.442 18.792 31.104 1.00 8.35 NATOM670 CA SER A 9715.925 17.841 30.134 1.00 8.67 CATOM671 CB SER A 9714.406 17.976 29.984 1.00 10.18CATOM672 OG SER A 9713.893 16.991 29.094 1.00 10.36OATOM673 C SER A 9716.607 18.169 28.810 1.00 9.06 CATOM674 O SER A 9716.564 19.313 28.353 1.00 10.38OATOM675 N GLY A 9817.243 17.168 28.209 1.00 9.45 NATOM676 CA GLY A 9817.939 17.365 26.947 1.00 8.70 CATOM677 C GLY A 9817.853 16.131 26.070 1.00 11.12CATOM678 O GLY A 9817.689 15.021 26.569 1.00 9.32 OATOM679 N SER A 9917.993 16.320 24.762 1.00 13.12NATOM680 CA SER A 9917.884 15.222 23.805 1.00 13.49CATOM681 CB SER A 9917.628 15.784 22.414 1.00 16.87CATOM682 OG SER A 9918.805 16.381 21.906 1.00 16.57OATOM683 C SER A 9919.073 14.272 23.709 1.00 13.85CATOM684 O SER A 9918.972 13.230 23.060 1.00 10.18OATOM685 N THR A 10020.195 14.617 24.331 1.00 9.80 NATOM686 CA THR A 10021.365 13.749 24.266 1.00 12.00CATOM687 CB THR A 10022.645 14.572 24.075 1.00 13.43CATOM688 OG1 THR A 10022.564 15.297 22.844 1.00 15.69OATOM689 CG2 THR A 10023.860 13.667 24.044 1.00 13.71CATOM690 C THR A 10021.547 12.845 25.477 1.00 13.37CATOM691 O THR A 10021.888 11.667 25.332 1.00 9.57 OATOM692 N THR A 10121.319 13.389 26.668 1.00 11.47NATOM693 CA THR A 10121.468 12.613 27.893 1.00 10.42CATOM694 CB THR A 10122.469 13.277 28.851 1.00 12.08CATOM695 OG1 THR A 10122.031 14.607 29.151 1.00 10.91OATOM696 CG2 THR A 10123.847 13.334 28.216 1.00 11.99CATOM697 C THR A 10120.153 12.410 28.633 1.00 13.44CATOM698 O THR A 10120.078 11.617 29.566 1.00 12.54OATOM699 N GLY A 10219.119 13.128 28.217 1.00 10.42NATOM700 CA GLY A 10217.829 12.979 28.860 1.00 9.53 CATOM701 C GLY A 10217.578 13.835 30.087 1.00 10.82CATOM702 O GLY A 10217.846 15.041 30.096 1.00 8.61 OATOM703 N TRP A 10317.067 13.190 31.132 1.00 9.62 NATOM704 CA TRP A 10316.716 13.845 32.383 1.00 11.61CATOM705 CB TRP A 10315.370 13.289 32.865 1.00 11.52CATOM706 CG TRP A 10314.837 13.868 34.145 1.00 13.15CATOM707 CD2 TRP A 10313.964 14.998 34.282 1.00 12.58CATOM708 CE2 TRP A 10313.680 15.147 35.655 1.00 15.29CATOM709 CE3 TRP A 10313.387 15.896 33.375 1.00 11.72CATOM710 CD1 TRP A 10315.050 13.397 35.404 1.00 16.94CATOM711 NE1 TRP A 10314.357 14.156 36.320 1.00 16.85NATOM712 CZ2 TRP A 10312.852 16.155 36.147 1.00 11.23CATOM713 CZ3 TRP A 10312.561 16.900 33.865 1.00 12.19CATOM714 CH2 TRP A 10312.303 17.019 35.240 1.00 13.20CATOM715 C TRP A 10317.790 13.659 33.448 1.00 12.90CATOM716 O TRP A 10318.082 12.539 33.872 1.00 9.69 OATOM717 N HIS A 10418.386 14.768 33.872 1.00 10.38NATOM718 CA HIS A 10419.434 14.724 34.890 1.00 12.11CATOM719 CB HIS A 10420.806 14.734 34.226 1.00 12.14CATOM720 CG HIS A 10421.106 13.474 33.477 1.00 12.45CATOM721 CD2 HIS A 10420.822 13.110 32.204 1.00 14.29CATOM722 ND1 HIS A 10421.684 12.375 34.072 1.00 13.64NATOM723 CE1 HIS A 10421.740 11.384 33.197 1.00 14.53CATOM724 NE2 HIS A 10421.222 11.804 32.058 1.00 12.11NATOM725 C HIS A 10419.283 15.898 35.839 1.00 12.75CATOM726 O HIS A 10418.959 17.014 35.426 1.00 10.16OATOM727 N CYS A 10519.545 15.650 37.114 1.00 10.52NATOM728 CA CYS A 10519.408 16.703 38.102 1.00 13.24CATOM729 CB CYS A 10518.278 16.318 39.049 1.00 13.49CATOM730 SG CYS A 10516.817 15.612 38.216 1.00 14.12SATOM731 C CYS A 10520.657 17.057 38.896 1.00 13.65CATOM732 O CYS A 10521.720 16.465 38.720 1.00 13.71O
ATOM733 N GLY A 10620.511 18.042 39.770 1.00 11.96NATOM734 CA GLY A 10621.619 18.499 40.583 1.00 8.39 CATOM735 C GLY A 10621.112 19.662 41.404 1.00 8.29 CATOM736 O GLY A 10619.919 19.720 41.723 1.00 9.88 OATOM737 N THR A 10721.997 20.587 41.748 1.00 10.00NATOM738 CA THR A 10721.593 21.749 42.529 1.00 10.90CATOM739 CB THR A 10721.979 21.607 44.021 1.00 15.03CATOM740 OG1 THR A 10723.401 21.490 44.138 1.00 19.34OATOM741 CG2 THR A 10721.324 20.379 44.630 1.00 19.07CATOM742 C THR A 10722.230 23.021 42.003 1.00 11.41CATOM743 O THR A 10723.274 22.986 41.349 1.00 10.42OATOM744 N ILE A 10821.590 24.150 42.282 1.00 9.46 NATOM745 CA ILE A 10822.116 25.430 41.835 1.00 8.75 CATOM746 CB ILE A 10821.050 26.533 41.895 1.00 10.61CATOM747 CG2 ILE A 10821.696 27.892 41.613 1.00 8.96 CATOM748 CG1 ILE A 10819.926 26.214 40.905 1.00 11.64CATOM749 CD1 ILE A 10818.797 27.223 40.898 1.00 10.98CATOM750 C ILE A 10823.240 25.788 42.798 1.00 12.89CATOM751 O ILE A 10823.030 25.842 44.010 1.00 12.63OATOM752 N THR A 10924.432 26.026 42.263 1.00 12.30NATOM753 CA THR A 10925.570 26.372 43.109 1.00 12.21CATOM754 CB THR A 10926.814 25.557 42.714 1.00 16.03CATOM755 OG1 THR A 10927.027 25.662 41.304 1.00 16.72OATOM756 CG2 THR A 10926.623 24.097 43.079 1.00 19.29CATOM757 C THR A 10925.916 27.855 43.094 1.00 14.26CATOM758 O THR A 10926.590 28.353 43.994 1.00 15.02OATOM759 N ALA A 11025.440 28.563 42.078 1.00 13.73NATOM760 CA ALA A 11025.708 29.985 41.967 1.00 14.67CATOM761 CB ALA A 11027.186 30.215 41.668 1.00 15.41CATOM762 C ALA A 11024.853 30.611 40.879 1.00 12.70CATOM763 O ALA A 11O24.367 29.924 39.982 1.00 13.13OATOM764 N LEU A 11124.664 31.921 40.982 1.00 13.52NATOM765 CA LEU A 11123.876 32.680 40.019 1.00 11.96CATOM766 CB LEU A 11122.639 33.286 40.689 1.00 15.77CATOM767 CG LEU A 11121.638 32.338 41.357 1.00 19.65CATOM768 CD1 LEU A 11120.593 33.151 42.113 1.00 17.73CATOM769 CD2 LEU A 11120.970 31.462 40.313 1.00 14.60CATOM770 C LEU A 11124.775 33.798 39.501 1.00 15.77CATOM771 O LEU A 11125.753 34.169 40.151 1.00 15.15OATOM772 N ASN A 11224.443 34.330 38.332 1.00 12.74NATOM773 CA ASN A 11225.219 35.409 37.729 1.00 17.38CATOM774 CB ASN A 11225.168 36.663 38.605 1.00 24.14CATOM775 CG ASN A 11223.756 37.053 38.980 1.00 26.37CATOM776 OD1 ASN A 11223.279 36.726 40.067 1.00 33.64OATOM777 ND2 ASN A 11223.072 37.744 38.076 1.00 34.88NATOM778 C ASN A 11226.672 35.023 37.495 1.00 16.99CATOM779 O ASN A 11227.572 35.850 37.643 1.00 14.78OATOM780 N SER A 11326.896 33.766 37.131 1.00 16.31NATOM781 CA SER A 11328.245 33.280 36.872 1.00 19.39CATOM782 CB SER A 11328.315 31.757 37.020 1.00 18.03CATOM783 OG SER A 11328.262 31.349 38.374 1.00 21.23OATOM784 C SER A 11328.637 33.650 35.450 1.00 19.59CATOM785 O SER A 11327.780 33.946 34.620 1.00 20.53OATOM786 N SER A 11429.938 33.634 35.180 1.00 20.43NATOM787 CA SER A 11430.454 33.957 33.857 1.00 21.50CATOM788 CB SER A 11431.256 35.259 33.878 1.00 23.57CATOM789 OG SER A 11430.407 36.384 34.009 1.00 27.72OATOM790 C SER A 11431.356 32.824 33.406 1.00 21.25CATOM791 O SER A 11432.019 32.181 34.222 1.00 21.50OATOM792 N VAL A 11531.364 32.569 32.106 1.00 19.94NATOM793 CA VAL A 11532.188 31.515 31.542 1.00 19.21CATOM794 CB VAL A 11531.394 30.203 31.350 1.00 20.02CATOM795 CG1 VAL A 11530.768 29.782 32.663 1.00 23.26CATOM796 CG2 VAL A 11530.335 30.380 30.276 1.00 19.81CATOM797 C VAL A 11532.675 31.986 30.183 1.00 17.61CATOM798 O VAL A 11532.065 32.857 29.561 1.00 16.06OATOM799 N THR A 11633.783 31.419 29.729 1.00 15.49NATOM800 CA THR A 11634.330 31.791 28.441 1.00 15.82CATOM801 CB THR A 11635.750 32.380 28.569 1.00 16.00CATOM802 OG1 THR A 11635.697 33.577 29.355 1.00 19.34OATOM803 CG2 THR A 11636.312 32.721 27.189 1.00 13.81CATOM804 C THR A 11634.364 30.572 27.535 1.00 16.67CATOM805 O THR A 11635.031 29.576 27.828 1.00 15.27OATOM806 N TYR A 11733.604 30.663 26.451 1.00 14.40NATOM807 CA TYR A 11733.500 29.609 25.453 1.00 18.79CATOM808 CB TYR A 11732.077 29.553 24.886 1.00 16.32CATOM809 CG TYR A 11730.993 29.168 25.871 1.00 19.43CATOM810 CD1 TYR A 11729.875 29.977 26.057 1.00 17.65C
ATOM811 CE1 TYR A 11728.844 29.594 26.911 1.00 19.53CATOM812 CD2 TYR A 11731.053 27.967 26.569 1.00 19.30CATOM813 CE2 TYR A 11730.029 27.577 27.421 1.00 23.56CATOM814 CZ TYR A 11728.926 28.392 27.588 1.00 21.66CATOM815 OH TYR A 11727.898 27.991 28.417 1.00 18.29OATOM816 C TYR A 11734.462 29.985 24.330 1.00 16.91CATOM817 O TYR A 11734.968 31.107 24.288 1.00 18.67OATOM818 N PRO A 11834.727 29.058 23.400 1.00 17.80NATOM819 CA PRO A 11835.644 29.417 22.317 1.00 18.47CATOM820 CB PRO A 11835.655 28.165 21.434 1.00 19.17CATOM821 C PRO A 11835.210 30.679 21.567 1.00 22.88CATOM822 O PRO A 11836.052 31.426 21.064 1.00 22.73OATOM823 CD PRO A 11834.280 27.663 23.277 1.00 19.00CATOM824 CG PRO A 11834.390 27.442 21.799 1.00 22.37CATOM825 N GLU A 11933.900 30.923 21.509 1.00 21.24NATOM826 CA GLU A 11933.375 32.101 20.819 1.00 22.24CATOM827 CB GLU A 11931.888 31.930 20.495 1.00 23.42CATOM828 C GLU A 11933.539 33.356 21.665 1.00 24.28CATOM829 O GLU A 11933.672 34.464 21.142 1.00 24.95OATOM830 CG GLU A 11931.561 30.815 19.522 1.00 25.42CATOM831 CD GLU A 11931.812 29.443 20.104 1.00 29.77CATOM832 OE1 GLU A 11931.546 29.252 21.310 1.00 28.43OATOM833 OE2 GLU A 11932.260 28.552 19.350 1.00 28.50OATOM834 N GLY A 12033.517 33.181 22.979 1.00 21.77NATOM835 CA GLY A 12033.658 34.323 23.857 1.00 21.24CATOM836 C GLY A 12033.028 34.099 25.215 1.00 18.48CATOM837 O GLY A 12032.613 32.991 25.549 1.00 16.77OATOM838 N THR A 12132.944 35.169 25.994 1.00 15.75NATOM839 CA THR A 12132.388 35.098 27.332 1.00 15.58CATOM840 CB THR A 12133.050 36.151 28.242 1.00 20.73CATOM841 OG1 THR A 12134.472 35.973 28.218 1.00 22.66OATOM842 CG2 THR A 12132.548 36.020 29.675 1.00 19.40CATOM843 C THR A 12130.876 35.292 27.393 1.00 13.13CATOM844 O THR A 12130.307 36.105 26.665 1.00 12.67OATOM845 N VAL A 12230.235 34.523 28.263 1.00 10.86NATOM846 CA VAL A 12228.789 34.591 28.460 1.00 11.99CATOM847 CB VAL A 12228.095 33.263 28.093 1.00 10.42CATOM848 CG1 VAL A 12226.641 33.290 28.534 1.00 11.35CATOM849 CG2 VAL A 12228.176 33.044 26.587 1.00 7.40 CATOM850 C VAL A 12228.616 34.875 29.951 1.00 13.37CATOM851 O VAL A 12229.219 34.199 30.786 1.00 13.64OATOM852 N ARG A 12327.801 35.870 30.288 1.00 14.96NATOM853 CA ARG A 12327.581 36.221 31.691 1.00 17.69CATOM854 CB ARG A 12327.936 37.693 31.903 1.00 19.72CATOM855 CG ARG A 12329.309 38.079 31.374 1.00 28.94CATOM856 CD ARG A 12329.620 39.545 31.642 1.00 34.45CATOM857 NE ARG A 12330.913 39.934 31.084 1.00 34.81NATOM858 CZ ARG A 12331.148 40.109 29.787 1.00 37.65CATOM859 NH1 ARG A 12330.175 39.936 28.901 1.00 40.89NATOM860 NH2 ARG A 12332.362 40.450 29.373 1.00 35.27NATOM861 C ARG A 12326.160 35.970 32.188 1.00 15.87CATOM862 O ARG A 12325.297 35.538 31.430 1.00 14.52OATOM863 N GLY A 12425.942 36.231 33.477 1.00 14.67NATOM864 CA GLY A 12424.629 36.064 34.084 1.00 12.41CATOM865 C GLY A 12424.058 34.659 34.085 1.00 13.04CATOM866 O GLY A 12422.841 34.477 34.106 1.00 11.06OATOM867 N LEU A 12524.937 33.666 34.092 1.00 10.63NATOM868 CA LEU A 12524.520 32.270 34.063 1.00 11.37CATOM869 CB LEU A 12525.556 31.455 33.293 1.00 10.04CATOM870 CG LEU A 12525.729 31.810 31.820 1.00 8.76 CATOM871 CD1 LEU A 12526.853 30.973 31.236 1.00 12.07CATOM872 CD2 LEU A 12524.430 31.559 31.072 1.00 10.99CATOM873 C LEU A 12524.290 31.595 35.413 1.00 11.50CATOM874 O LEU A 12524.887 31.958 36.424 1.00 13.58OATOM875 N ILE A 12623.412 30.595 35.398 1.00 9.91 NATOM876 CA ILE A 12623.078 29.829 36.586 1.00 10.95CATOM877 CB ILE A 12621.649 29.253 36.502 1.00 12.17CATOM878 CG2 ILE A 12621.379 28.348 37.704 1.00 11.45CATOM879 CG1 ILE A 12620.631 30.394 36.417 1.00 12.38CATOM880 CD1 ILE A 12619.207 29.931 36.143 1.00 11.96CATOM881 C ILE A 12624.066 28.668 36.579 1.00 11.47CATOM882 O ILE A 12624.109 27.898 35.620 1.00 11.84OATOM883 N ARG A 12724.874 28.557 37.627 1.00 12.21NATOM884 CA ARG A 12725.854 27.478 37.716 1.00 14.56CATOM885 CB ARG A 12727.106 27.969 38.444 1.00 14.59CATOM886 CG ARG A 12728.195 26.921 38.616 1.00 23.58CATOM887 CD ARG A 12729.308 27.473 39.493 1.00 26.48CATOM888 NE ARG A 12730.349 26.489 39.769 1.00 36.15N
ATOM889 CZ ARG A 12731.209 26.033 38.865 1.00 38.33CATOM890 NH2 ARG A 12732.127 25.139 39.211 1.00 41.31NATOM891 NH1 ARG A 12731.156 26.472 37.616 1.00 41.25NATOM892 C ARG A 12725.221 26.324 38.485 1.00 12.51CATOM893 O ARG A 12724.554 26.548 39.495 1.00 10.73OATOM894 N THR A 12825.434 25.098 38.011 1.00 11.75NATOM895 CA THR A 12824.867 23.924 38.667 1.00 11.43CATOM896 CB THR A 12823.547 23.501 37.998 1.00 12.42CATOM897 OG1 THR A 12823.835 22.848 36.751 1.00 11.64OATOM898 CG2 THR A 12822.668 24.719 37.728 1.00 8.69 CATOM899 C THR A 12825.778 22.698 38.622 1.00 13.02CATOM900 O THR A 12826.790 22.680 37.914 1.00 12.78OATOM901 N THR A 12925.391 21.674 39.381 1.00 11.69NATOM902 CA THR A 12926.132 20.419 39.456 1.00 12.47CATOM903 CB THR A 12926.099 19.827 40.878 1.00 12.66CATOM904 OG1 THR A 12924.737 19.612 41.277 1.00 11.15OATOM905 CG2 THR A 12926.782 20.766 41.859 1.00 12.84CATOM906 C THR A 12925.503 19.399 38.506 1.00 15.23CATOM907 O THR A 12925.820 18.211 38.564 1.00 10.87OATOM908 N VAL A 13024.601 19.870 37.646 1.00 14.09NATOM909 CA VAL A 13023.923 19.006 36.680 1.00 12.55CATOM910 CB VAL A 13022.662 19.694 36.103 1.00 13.46CATOM911 CG1 VAL A 13021.913 18.730 35.195 1.00 15.05CATOM912 CG2 VAL A 13021.755 20.178 37.234 1.00 10.45CATOM913 C VAL A 13024.872 18.692 35.521 1.00 13.62CATOM914 O VAL A 13025.655 19.546 35.120 1.00 17.44OATOM915 N CYS A 13124.804 17.468 34.997 1.00 10.87NATOM916 CA CYS A 13125.658 17.047 33.886 1.00 12.09CATOM917 CB CYS A 13125.939 15.541 33.966 1.00 12.10CATOM918 SG CYS A 13124.447 14.512 33.745 1.00 14.96SATOM919 C CYS A 13124.957 17.343 32.568 1.00 12.93CATOM920 O CYS A 13123.739 17.506 32.532 1.00 11.56OATOM921 N ALA A 13225.723 17.403 31.486 1.00 13.76NATOM922 CA ALA A 13225.141 17.676 30.181 1.00 14.09CATOM923 CB ALA A 13224.724 19.141 30.089 1.00 13.62CATOM924 C ALA A 13226.086 17.337 29.042 1.00 17.97CATOM925 O ALA A 13227.294 17.179 29.237 1.00 15.14OATOM926 N GLU A 13325.508 17.215 27.853 1.00 13.21NATOM927 CA GLU A 13326.243 16.900 26.639 1.00 18.49CATOM928 CB GLU A 13325.732 15.592 26.039 1.00 21.95CATOM929 CG GLU A 13326.808 14.614 25.652 1.00 27.91CATOM930 CD GLU A 13327.336 13.850 26.840 1.00 31.31CATOM931 OE1 GLU A 13327.870 14.494 27.767 1.00 28.79OATOM932 OE2 GLU A 13327.214 12.606 26.846 1.00 28.57OATOM933 C GLU A 13325.919 18.051 25.693 1.00 15.23CATOM934 O GLU A 13324.915 18.738 25.866 1.00 16.37OATOM935 N PRO A 13426.761 18.276 24.680 1.00 16.75NATOM936 CA PRO A 13426.527 19.366 23.725 1.00 17.31CATOM937 CB PRO A 13427.558 19.082 22.638 1.00 17.01CATOM938 C PRO A 13425.093 19.449 23.177 1.00 18.87CATOM939 O PRO A 13424.468 20.515 23.204 1.00 21.16OATOM940 CD PRO A 13428.022 17.572 24.385 1.00 14.41CATOM941 CG PRO A 13428.708 18.528 23.429 1.00 15.96CATOM942 N GLY A 13524.577 18.329 22.683 1.00 13.73NATOM943 CA GLY A 13523.228 18.315 22.138 1.00 11.51CATOM944 C GLY A 13522.114 18.674 23.112 1.00 12.22CATOM945 O GLY A 13520.982 18.933 22.696 1.00 10.70OATOM946 N ASP A 13622.425 18.676 24.405 1.00 9.59 NATOM947 CA ASP A 13621.451 19.019 25.441 1.00 10.66CATOM948 CB ASP A 13621.957 18.550 26.808 1.00 9.43 CATOM949 C ASP A 13621.239 20.533 25.485 1.00 9.56 CATOM950 O ASP A 13620.270 21.018 26.076 1.00 7.80 OATOM951 CG ASP A 13621.907 17.044 26.969 1.00 12.00CATOM952 OD2 ASP A 13621.038 16.399 26.348 1.00 14.65OATOM953 OD1 ASP A 13622.732 16.510 27.737 1.00 11.73OATOM954 N SER A 13722.159 21.270 24.867 1.00 11.68NATOM955 CA SER A 13722.089 22.728 24.831 1.00 9.45 CATOM956 CB SER A 13723.167 23.298 23.902 1.00 12.71CATOM957 C SER A 13720.723 23.231 24.381 1.00 12.56CATOM958 O SER A 13720.110 22.671 23.470 1.00 9.42 OATOM959 OG SER A 13724.460 23.160 24.466 1.00 11.89OATOM960 N GLY A 13820.264 24.298 25.027 1.00 12.50NATOM961 CA GLY A 13818.974 24.873 24.698 1.00 10.84CATOM962 C GLY A 13817.863 24.228 25.497 1.00 11.17CATOM963 O GLY A 13816.759 24.774 25.583 1.00 10.27OATOM964 N GLY A 13918.171 23.075 26.090 1.00 9.62 NATOM965 CA GLY A 13917.202 22.326 26.877 1.00 11.99CATOM966 C GLY A 13916.675 22.997 28.135 1.00 9.04 C
ATOM 967 O GLY A 13917.243 23.968 28.632 1.00 11.52OATOM 968 N SER A 14015.588 22.444 28.668 1.00 9.88 NATOM 969 CA SER A 14014.942 22.990 29.858 1.00 10.08CATOM 970 CB SER A 14013.507 22.456 29.977 1.00 9.88 CATOM 971 OG SER A 14012.972 22.057 28.729 1.00 11.61OATOM 972 C SER A 14015.628 22.710 31.187 1.00 9.54 CATOM 973 O SER A 14016.253 21.670 31.369 1.00 8.61 OATOM 974 N LEU A 14115.492 23.660 32.108 1.00 11.67NATOM 975 CA LEU A 14116.057 23.559 33.453 1.00 10.92CATOM 976 CB LEU A 14117.184 24.554 33.718 1.00 10.21CATOM 977 CG LEU A 14117.665 24.342 35.164 1.00 9.58 CATOM 978 CD1 LEU A 14118.252 22.936 35.290 1.00 7.62 CATOM 979 CD2 LEU A 14118.682 25.407 35.575 1.00 8.11 CATOM 980 C LEU A 14114.867 23.916 34.330 1.00 10.82CATOM 981 O LEU A 14114.325 25.021 34.240 1.00 10.91OATOM 982 N LEU A 14214.455 22.972 35.161 1.00 7.99 NATOM 983 CA LEU A 14213.327 23.175 36.046 1.00 11.41CATOM 984 CB LEU A 14212.235 22.140 35.741 1.00 12.37CATOM 985 CG LEU A 14211.432 22.235 34.449 1.00 13.83CATOM 986 CD1 LEU A 14210.710 20.914 34.195 1.00 16.69CATOM 987 CD2 LEU A 14210.443 23.391 34.562 1.00 13.02CATOM 988 C LEU A 14213.675 23.050 37.518 1.00 10.11CATOM 989 O LEU A 14214.631 22.377 37.904 1.00 13.30OATOM 990 N ALA A 14312.875 23.731 38.326 1.00 10.55NATOM 991 CA ALA A 14312.992 23.746 39.775 1.00 12.59CATOM 992 CB ALA A 14313.306 25.141 40.284 1.00 14.58CATOM 993 C ALA A 14311.539 23.388 40.061 1.00 13.64CATOM 994 O ALA A 14310.677 24.258 40.124 1.00 15.86OATOM 995 N GLY A 14411.260 22.098 40.178 1.00 14.54NATOM 996 CA GLY A 1449.890 21.681 40.396 1.00 18.53CATOM 997 C GLY A 1449.156 21.932 39.092 1.00 18.05CATOM 998 O GLY A 1449.570 21.445 38.040 1.00 18.26OATOM 999 N ASN A 1458.071 22.695 39.144 1.00 17.01NATOM1000 CA ASN A 1457.316 23.001 37.940 1.00 17.28CATOM1001 CB ASN A 1455.821 22.829 39.199 1.00 24.24CATOM1002 CG ASN A 1455.380 23.471 39.497 1.00 34.66CATOM1003 OD1 ASN A 1455.502 24.685 39.682 1.00 36.73OATOM1004 ND2 ASN A 1454.868 22.655 40.413 1.00 41.73NATOM1005 C ASN A 1457.589 24.425 37.477 1.00 16.30CATOM1006 O ASN A 1456.844 24.966 36.671 1.00 13.74OATOM1007 N GLN A 1468.667 25.022 37.976 1.00 13.23NATOM1008 CA GLN A 1469.022 26.388 37.609 1.00 13.97CATOM1009 CB GLN A 1469.283 27.205 38.876 1.00 17.49CATOM1010 CG GLN A 1468.116 27.191 39.850 1.00 17.44CATOM1011 CD GLN A 1466.920 27.948 39.324 1.00 19.58CATOM1012 OE1 GLN A 1465.781 27.478 39.412 1.00 18.02OATOM1013 NE2 GLN A 1467.166 29.135 38.781 1.00 13.47NATOM1014 C GLN A 14610.238 26.469 36.692 1.00 13.36CATOM1015 O GLN A 14611.332 26.026 37.052 1.00 9.49 OATOM1016 N ALA A 14710.036 27.037 35.508 1.00 10.85NATOM1017 CA ALA A 14711.107 27.187 34.527 1.00 11.86CATOM1018 CB ALA A 1471O.560 27.790 33.231 1.00 9.60 CATOM1019 C ALA A 14712.212 28.077 35.079 1.00 12.02CATOM1020 O ALA A 14711.947 29.181 35.559 1.00 11.92OATOM1021 N GLN A 14813.450 27.595 34.990 1.00 9.31 NATOM1022 CA GLN A 14814.608 28.334 35.478 1.00 8.96 CATOM1023 CB GLN A 14815.502 27.426 36.317 1.00 9.82 CATOM1024 CG GLN A 14814.814 26.838 37.532 1.00 9.18 CATOM1025 CD GLN A 14814.193 27.914 38.392 1.00 8.87 CATOM1026 OE1 GLN A 14812.974 27.953 38.581 1.00 13.35OATOM1027 NE2 GLN A 14815.024 28.797 38.916 1.00 6.09 NATOM1028 C GLN A 14815.449 28.925 34.353 1.00 9.54 CATOM1029 O GLN A 14815.874 30.073 34.424 1.00 10.41OATOM1030 N GLY A 14915.707 28.130 33.322 1.00 9.02 NATOM1031 CA GLY A 14916.522 28.620 32.226 1.00 11.94CATOM1032 C GLY A 14916.762 27.559 31.172 1.00 10.03CATOM1033 O GLY A 14916.130 26.505 31.198 1.00 11.61OATOM1034 N VAL A 15017.670 27.840 30.241 1.00 8.37 NATOM1035 CA VAL A 15017.977 26.885 29.185 1.00 10.02CATOM1036 CB VAL A 15017.557 27.428 27.796 1.00 8.22 CATOM1037 CG1 VAL A 15016.058 27.733 27.799 1.00 9.61 CATOM1038 CG2 VAL A 15018.343 28.682 27.452 1.00 6.21 CATOM1039 C VAL A 15019.465 26.542 29.211 1.00 11.57CATOM1040 O VAL A 15020.309 27.391 29.504 1.00 9.64 OATOM1041 N THR A 15119.773 25.283 28.925 1.00 11.95NATOM1042 CA THR A 15121.153 24.805 28.923 1.00 11.13CATOM1043 CB THR A 15121.195 23.325 28.552 1.00 9.19 CATOM1044 OG1 THR A 15120.223 22.622 29.340 1.00 6.16 O
ATOM1045 CG2 THR A 15122.578 22.748 28.828 1.00 8.56 CATOM1046 C THR A 15122.086 25.577 27.999 1.00 11.68CATOM1047 O THR A 15121.838 25.677 26.801 1.00 8.62 OATOM1048 N SER A 15223.172 26.107 28.560 1.00 11.36NATOM1049 CA SER A 15224.133 26.869 27.771 1.00 10.56CATOM1050 CB SER A 15224.480 28.183 28.479 1.00 13.70CATOM1051 OG SER A 15225.434 28.928 27.735 1.00 11.67OATOM1052 C SER A 15225.407 26.080 27.503 1.00 12.67CATOM1053 O SER A 15225.873 26.005 26.369 1.00 11.22OATOM1054 N GLY A 15325.967 25.485 28.547 1.00 11.74NATOM1055 CA GLY A 15327.185 24.719 28.374 1.00 13.59CATOM1056 C GLY A 15327.807 24.348 29.699 1.00 13.34CATOM1057 O GLY A 15327.226 24.590 30.758 1.00 11.10OATOM1058 N GLY A 15429.001 23.769 29.644 1.00 12.77NATOM1059 CA GLY A 15429.669 23.370 30.862 1.00 14.55CATOM1060 C GLY A 15430.763 22.360 30.583 1.00 16.81CATOM1061 O GLY A 15431.228 22.235 29.452 1.00 15.66OATOM1062 N SER A 15531.171 21.631 31.615 1.00 16.15NATOM1063 CA SER A 15532.230 20.641 31.472 1.00 16.05CATOM1064 CB SER A 15533.475 21.113 32.214 1.00 16.89CATOM1065 OG SER A 15533.181 21.338 33.582 1.00 23.41OATOM1066 C SER A 15531.799 19.291 32.026 1.00 16.84CATOM1067 O SER A 15530.783 19.187 32.714 1.00 14.62OATOM1068 N GLY A 15632.588 18.262 31.731 1.00 15.26NATOM1069 CA GLY A 15632.279 16.928 32.211 1.00 13.85CATOM1070 C GLY A 15631.211 16.256 31.376 1.00 14.91CATOM1071 O GLY A 15630.935 16.667 30.251 1.00 17.56OATOM1072 N ASN A 15730.613 15.213 31.931 1.00 14.60NATOM1073 CA ASN A 15729.566 14.471 31.248 1.00 16.61CATOM1074 CB ASN A 15730.179 13.445 30.289 1.00 16.79CATOM1075 CG ASN A 15731.168 12.525 30.974 1.00 16.85CATOM1076 OD1 ASN A 15730.808 11.768 31.876 1.00 17.38OATOM1077 ND2 ASN A 15732.429 12.585 30.545 1.00 19.44NATOM1078 C ASN A 15728.694 13.773 32.283 1.00 16.81CATOM1079 O ASN A 15728.936 13.888 33.487 1.00 14.11OATOM1080 N CYS A 15827.679 13.057 31.812 1.00 16.33NATOM1081 CA CYS A 15826.773 12.348 32.704 1.00 17.79CATOM1082 CB CYS A 15825.406 12.202 32.048 1.00 19.95CATOM1083 SG CYS A 15824.578 13.802 31.845 1.00 17.50SATOM1084 C CYS A 15827.257 10.989 33.174 1.00 19.67CATOM1085 O CYS A 15826.591 10.333 33.971 1.00 21.67OATOM1086 N ARG A 15928.403 10.554 32.672 1.00 18.94NATOM1087 CA ARG A 15928.948 9.267 33.070 1.00 19.35CATOM1088 CB ARG A 15929.835 8.700 31.953 1.00 19.37CATOM1089 CG ARG A 15929.074 8.300 30.702 1.00 24.85CATOM1090 CD ARG A 15930.003 7.779 29.615 1.00 25.44CATOM1091 NE ARG A 15930.852 8.831 29.068 1.00 26.55NATOM1092 CZ ARG A 15930.414 9.821 28.296 1.00 28.60CATOM1093 NH1 ARG A 15929.130 9.901 27.971 1.00 28.12NATOM1094 NH2 ARG A 15931.264 10.734 27.848 1.00 25.81NATOM1095 C ARG A 15929.775 9.461 34.345 1.00 19.70CATOM1096 O ARG A 15929.653 8.704 35.309 1.00 20.82OATOM1097 N THR A 16030.608 10.494 34.355 1.00 16.93NATOM1098 CA THR A 16031.445 10.762 35.517 1.00 18.57CATOM1099 CB THR A 16032.937 10.775 35.109 1.00 18.72CATOM1100 OG1 THR A 16033.136 11.696 34.028 1.00 19.41OATOM1101 CG2 THR A 16033.372 9.387 34.654 1.00 23.02CATOM1102 C THR A 16031.097 12.055 36.267 1.00 17.76CATOM1103 O THR A 16031.730 12.391 37.269 1.00 14.64OATOM1104 N GLY A 16130.079 12.767 35.792 1.00 15.51NATOM1105 CA GLY A 16129.666 14.000 36.444 1.00 18.63CATOM1106 C GLY A 16130.199 15.264 35.791 1.00 17.91CATOM1107 O GLY A 16131.178 15.231 35.047 1.00 17.74OATOM1108 N GLY A 16229.556 16.392 36.070 1.00 17.00NATOM1109 CA GLY A 16230.008 17.633 35.475 1.00 15.39CATOM1110 C GLY A 16229.373 18.881 36.048 1.00 14.86CATOM1111 O GLY A 16228.607 18.824 37.013 1.00 12.41OATOM1112 N THR A 16329.716 20.014 35.445 1.00 11.47NATOM1113 CA THR A 16329.203 21.318 35.847 1.00 12.96CATOM1114 CB THR A 16330.343 22.255 36.285 1.00 15.39CATOM1115 OG1 THR A 16331.024 21.685 37.409 1.00 15.28OATOM1116 CG2 THR A 16329.793 23.622 36.664 1.00 11.49CATOM1117 C THR A 16328.532 21.921 34.619 1.00 13.39CATOM1118 O THR A 16329.168 22.081 33.577 1.00 15.12OATOM1119 N THR A 16427.252 22.253 34.741 1.00 10.11NATOM1120 CA THR A 16426.518 22.833 33.624 1.00 10.81CATOM1121 CB THR A 16425.362 21.914 33.192 1.00 8.40 CATOM1122 OG1 THR A 16425.878 20.612 32.891 1.00 6.91 O
ATOM1123 CG2 THR A 16424.675 22.471 31.955 1.00 6.07 CATOM1124 C THR A 16425.950 24.203 33.967 1.00 10.82CATOM1125 O THR A 16425.401 24.402 35.053 1.00 9.66 OATOM1126 N PHE A 16526.092 25.139 33.034 1.00 9.84 NATOM1127 CA PHE A 16525.600 26.502 33.210 1.00 10.47CATOM1128 CB PHE A 16526.669 27.513 32.796 1.00 11.30CATOM1129 CG PHE A 16527.940 27.419 33.597 1.00 14.89CATOM1130 CD1 PHE A 16528.871 26.429 33.335 1.00 15.07CATOM1131 CD2 PHE A 16528.188 28.311 34.626 1.00 16.48CATOM1132 CE1 PHE A 16530.030 26.330 34.085 1.00 16.20CATOM1133 CE2 PHE A 16529.341 28.219 35.379 1.00 16.91CATOM1134 CZ PHE A 16530.264 27.223 35.108 1.00 16.17CATOM1135 C PHE A 16524.344 26.725 32.373 1.00 11.04CATOM1136 O PHE A 16524.224 26.204 31.263 1.00 9.74 OATOM1137 N PHE A 16623.417 27.517 32.901 1.00 7.30 NATOM1138 CA PHE A 16622.177 27.796 32.195 1.00 8.16 CATOM1139 CB PHE A 16620.990 27.127 32.901 1.00 7.36 CATOM1140 CG PHE A 16621.148 25.650 33.093 1.00 7.82 CATOM1141 CD2 PHE A 16620.436 24.758 32.302 1.00 10.08CATOM1142 CD1 PHE A 16622.018 25.148 34.050 1.00 10.99CATOM1143 CE2 PHE A 16620.591 23.383 32.463 1.00 9.63 CATOM1144 CE1 PHE A 16622.179 23.777 34.218 1.00 7.63 CATOM1145 CZ PHE A 16621.464 22.894 33.422 1.00 9.75 CATOM1146 C PHE A 16621.871 29.277 32.077 1.00 9.41 CATOM1147 O PHE A 16622.183 30.070 32.967 1.00 9.92 OATOM1148 N GLN A 16721.247 29.634 30.963 1.00 9.95 NATOM1149 CA GLN A 16720.866 31.010 30.690 1.00 9.14 CATOM1150 CB GLN A 16720.777 31.231 29.176 1.00 8.25 CATOM1151 CG GLN A 16719.911 32.403 28.738 1.00 11.98CATOM1152 CD GLN A 16720.487 33.751 29.110 1.00 13.09CATOM1153 OE1 GLN A 16721.590 34.111 28.690 1.00 12.87OATOM1154 NE2 GLN A 16719.746 34.505 29.905 1.00 10.51NATOM1155 C GLN A 16719.492 31.178 31.337 1.00 10.77CATOM1156 O GLN A 16718.542 30.483 30.977 1.00 7.43 OATOM1157 N PRO A 16819.375 32.085 32.318 1.00 10.69NATOM1158 CD PRO A 16820.431 32.933 32.897 1.00 11.76CATOM1159 CA PRO A 16818.092 32.310 32.996 1.00 11.69CATOM1160 CB PRO A 16818.392 33.482 33.924 1.00 12.25CATOM1161 CG PRO A 16819.837 33.296 34.241 1.00 14.30CATOM1162 C PRO A 16816.988 32.628 31.994 1.00 11.80CATOM1163 O PRO A 16817.222 33.317 31.006 1.00 9.94 OATOM1164 N VAL A 16915.784 32.133 32.261 1.00 10.31NATOM1165 CA VAL A 16914.650 32.358 31.373 1.00 12.92CATOM1166 CB VAL A 16913.528 31.331 31.662 1.00 17.07CATOM1167 CG1 VAL A 16913.026 31.491 33.088 1.00 15.81CATOM1168 CG2 VAL A 16912.394 31.505 30.678 1.00 19.48CATOM1169 C VAL A 16914.028 33.757 31.358 1.00 12.62CATOM1170 O VAL A 16913.648 34.253 30.302 1.00 11.62OATOM1171 N ASN A 17013.927 34.405 32.510 1.00 12.76NATOM1172 CA ASN A 17013.328 35.736 32.537 1.00 15.21CATOM1173 CB ASN A 17013.268 36.249 33.976 1.00 13.89CATOM1174 CG ASN A 17012.353 35.396 34.841 1.00 19.50CATOM1175 OD1 ASN A 17011.367 34.848 34.347 1.00 19.07OATOM1176 ND2 ASN A 17012.667 35.283 36.128 1.00 18.85NATOM1177 C ASN A 17013.948 36.764 31.591 1.00 12.70CATOM1178 O ASN A 17013.235 37.554 30.977 1.00 14.77OATOM1179 N PRO A 17115.278 36.778 31.458 1.00 15.34NATOM1180 CD PRO A 17116.339 36.181 32.282 1.00 16.10CATOM1181 CA PRO A 17115.826 37.772 30.530 1.00 16.08CATOM1182 CB PRO A 17117.336 37.710 30.790 1.00 17.98CATOM1183 CG PRO A 17117.539 36.351 31.399 1.00 23.99CATOM1184 C PRO A 17115.457 37.465 29.077 1.00 15.20CATOM1185 O PRO A 17115.464 38.355 28.228 1.00 10.27OATOM1186 N ILE A 17215.139 36.203 28.794 1.00 11.01NATOM1187 CA ILE A 17214.769 35.813 27.437 1.00 10.79CATOM1188 CB ILE A 17214.784 34.282 27.247 1.00 8.59 CATOM1189 CG2 ILE A 17214.453 33.943 25.792 1.00 10.32CATOM1190 CG1 ILE A 17216.152 33.712 27.617 1.00 7.68 CATOM1191 CD1 ILE A 17216.184 32.189 27.604 1.00 6.34 CATOM1192 C ILE A 17213.355 36.310 27.145 1.00 9.04 CATOM1193 O ILE A 17213.074 36.849 26.070 1.00 9.00 OATOM1194 N LEU A 17312.461 36.112 28.107 1.00 10.13NATOM1195 CA LEU A 17311.080 36.544 27.951 1.00 12.20CATOM1196 CB LEU A 17310.249 36.103 29.157 1.00 9.16 CATOM1197 CG LEU A 17310.233 34.595 29.436 1.00 10.30CATOM1198 CD1 LEU A 1739.469 34.304 30.717 1.00 9.41 CATOM1199 CD2 LEU A 1739.598 33.873 28.268 1.00 11.50CATOM1200 C LEU A 17311.049 38.061 27.824 1.00 13.01C
ATOM1201 O LEU A 173 10.295 38.608 27.026 1.00 17.74OATOM1202 N GLN A 174 11.885 38.733 28.608 1.00 16.26NATOM1203 CA GLN A 174 11.962 40.190 28.592 1.00 14.31CATOM1204 CB GLN A 174 12.817 40.681 29.769 1.00 19.36CATOM1205 CG GLN A 174 12.968 42.198 29.866 1.00 25.15CATOM1206 CD GLN A 174 11.695 42.891 30.315 1.00 30.84CATOM1207 OE1 GLN A 174 10.628 42.684 29.743 1.00 30.46OATOM1208 NE2 GLN A 174 11.805 43.723 31.348 1.00 34.53NATOM1209 C GLN A 174 12.556 40.694 27.282 1.00 15.28CATOM1210 O GLN A 174 12.104 41.694 26.722 1.00 10.15OATOM1211 N ALA A 175 13.567 39.994 26.786 1.00 13.61NATOM1212 CA ALA A 175 14.210 40.393 25.544 1.00 16.01CATOM1213 CB ALA A 175 15.372 39.453 2S.234 1.00 14.76CATOM1214 C ALA A 175 13.245 40.427 24.363 1.00 17.13CATOM1215 O ALA A 175 13.221 41.387 23.598 1.00 14.51OATOM1216 N TYR A 176 12.426 39.391 24.229 1.00 16.19NATOM1217 CA TYR A 176 11.481 39.329 23.124 1.00 17.75CATOM1218 CB TYR A 176 11.595 37.947 22.476 1.00 15.30CATOM1219 CG TYR A 176 13.033 37.599 22.138 1.00 15.11CATOM1220 CD1 TYR A 176 13.818 38.482 21.415 1.00 16.28CATOM1221 CE1 TYR A 176 15.134 38.186 21.101 1.00 13.92CATOM1222 CD2 TYR A 176 13.605 36.395 22.548 1.00 12.95CATOM1223 CE2 TYR A 176 14.925 36.086 22.238 1.00 12.38CATOM1224 CZ TYR A 176 15.682 36.990 21.512 1.00 13.61CATOM1225 OH TYR A 176 16.983 36.705 21.184 1.00 13.98OATOM1226 C TYR A 176 10.030 39.653 23.461 1.00 14.14CATOM1227 O TYR A 176 9.155 39.546 22.604 1.00 16.16OATOM1228 N GLY A 177 9.780 40.057 24.701 1.00 14.82NATOM1229 CA GLY A 177 8.424 40.392 25.105 1.00 16.43CATOM1230 C GLY A 177 7.500 39.207 24.933 1.00 16.44CATOM1231 O GLY A 177 6.376 39.340 24.439 1.00 17.81OATOM1232 N LEU A 178 7.987 38.046 25.361 1.00 14.56NATOM1233 CA LEU A 178 7.261 36.789 25.258 1.00 15.86CATOM1234 CB LEU A 178 8.209 35.686 24.778 1.00 15.44CATOM1235 CG LEU A 178 8.886 35.807 23.415 1.00 19.21CATOM1236 CD1 LEU A 178 10.030 34.805 23.331 1.00 18.33CATOM1237 CD2 LEU A 178 7.870 35.553 22.311 1.00 21.44CATOM1238 C LEU A 178 6.670 36.350 26.586 1.00 16.50CATOM1239 O LEU A 178 7.086 36.808 27.650 1.00 16.26OATOM1240 N ARG A 179 5.700 35.447 26.504 1.00 17.69NATOM1241 CA ARG A 179 5.040 34.911 27.684 1.00 15.79CATOM1242 CB ARG A 179 3.565 35.312 27.729 1.00 21.75CATOM1243 CG ARG A 179 3.321 36.700 28.298 1.00 30.60CATOM1244 CD ARG A 179 1.837 36.960 28.493 1.00 37.51CATOM1245 NE ARG A 179 1.586 38.213 29.199 1.00 47.17NATOM1246 CZ ARG A 179 2.011 39.405 28.790 1.00 49.75CATOM1247 NH1 ARG A 179 2.715 39.516 27.672 1.00 52.12NATOM1248 NH2 ARG A 179 1.731 40.488 29.500 1.00 50.23NATOM1249 C ARG A 179 5.153 33.398 27.640 1.00 15.02CATOM1250 O ARG A 179 5.039 32.787 26.574 1.00 14.80OATOM1251 N MET A 180 5.401 32.800 28.799 1.00 13.59NATOM1252 CA MET A 180 5.529 31.356 28.909 1.00 16.64CATOM1253 CB MET A 180 5.991 30.969 30.316 1.00 17.26CATOM1254 CG MET A 180 7.358 31.449 30.714 1.00 22.61CATOM1255 SD MET A 180 8.603 30.324 30.120 1.00 24.38SATOM1256 CE MET A 180 8.143 28.828 30.998 1.00 21.48CATOM1257 C MET A 180 4.156 30.739 28.706 1.00 16.31CATOM1258 O MET A 180 3.167 31.255 29.225 1.00 17.83OATOM1259 N ILE A 181 4.076 29.656 27.942 1.00 14.71NATOM1260 CA ILE A 181 2.778 29.019 27.740 1.00 13.74CATOM1261 CB ILE A 181 2.794 28.044 26.559 1.00 16.62CATOM1262 CG2 ILE A 181 1.570 27.130 26.622 1.00 15.86CATOM1263 CG1 ILE A 181 2.829 28.835 25.247 1.00 17.95CATOM1264 CD1 ILE A 181 2.732 27.982 24.009 1.00 26.87CATOM1265 C ILE A 181 2.589 28.256 29.049 1.00 15.69CATOM1266 O ILE A 181 3.452 27.469 29.438 1.00 13.45OATOM1267 N THR A 182 1.468 28.483 29.727 1.00 17.74NATOM1268 CA THR A 182 1.210 27.812 30.998 1.00 23.56CATOM1269 C THR A 182 0.141 26.728 31.019 1.00 26.44CATOM1270 O THR A 182 -0.071 26.088 32.052 1.00 29.65OATOM1271 CB THR A 182 0.841 28.841 32.073 1.00 24.55CATOM1272 OG1 THR A 182 -0.378 29.497 31.701 1.00 27.19OATOM1273 CG2 THR A 182 1.940 29.877 32.211 1.00 28.36CATOM1274 N THR A 183 -0.540 26.517 29.901 1.00 27.09NATOM1275 CA THR A 183 -1.573 25.494 29.866 1.00 33.19CATOM1276 C THR A 183 -1.835 25.008 28.447 1.00 33.29CATOM1277 O THR A 183 -1.707 25.765 27.484 1.00 34.57OATOM1278 CB THR A 183 -2.888 26.020 30.477 1.00 33.38C
ATOM1279 OG1 THR A 183-3.822 24.942 30.602 1.00 39.37OATOM1280 CG2 THR A 183-3.486 27.105 29.600 1.00 36.39CATOM1281 N ASP A 184-2.210 23.739 28.330 1.00 33.90NATOM1282 CA ASP A 184-2.489 23.133 27.035 1.00 36.90CATOM1283 C ASP A 184-3.988 23.017 26.769 1.00 36.93CATOM1284 O ASP A 184-4.744 23.965 26.985 1.00 38.19OATOM1285 CB ASP A 184-1.841 21.749 26.980 1.00 36.49CATOM1286 CG ASP A 184-0.497 21.713 27.682 1.00 39.84CATOM1287 OD1 ASP A 184 0.341 22.597 27.400 1.00 40.10OATOM1288 OD2 ASP A 184-0.279 20.804 28.515 1.00 34.43OTER 1289 ASP A 184ATOM1290 O *1 1 13.322 21.904 47.897 1.00 25.15 LIGA OATOM1291 H *1 1 12.748 22.438 47.362 1.00 20.00 LIGA HATOM1292 S *1 1 14.827 22.185 47.500 1.00 22.18 LIGA SATOM1293 O *1 1 15.755 21.317 48.284 1.00 26.48 LIGA OATOM1294 O *1 1 15.030 21.926 46.041 1.00 26.21 LIGA OATOM1295 O *1 1 15.058 23.692 47.860 1.00 25.81 LIGA OATOM1296 H *1 1 15.899 23.969 47.521 1.00 20.00 LIGA HTER 1297 *1 1ATOM1298 O *1 1 8.257 10.233 23.934 1.00 51.93 LIGA OATOM1299 H *1 1 8.965 10.771 24.260 1.00 20.00 LIGA HATOM1300 S *1 1 7.968 9.064 24.968 1.00 52.38 LIGA SATOM1301 O *1 1 6.699 8.342 24.628 1.00 53.41 LIGA OATOM1302 O *1 1 9.106 8.094 25.015 1.00 51.29 LIGA OATOM1303 O *1 1 7.802 9.828 26.339 1.00 52.66 LIGA OATOM1304 H *1 1 7.532 9.218 27.014 1.00 20.00 LIGA HTER 1305 *1 1ATOM1306 O *1 1 31.870 41.807 26.377 1.00 77.97 LIGA OATOM1307 H *1 1 32.101 42.067 27.259 1.00 20.00 LIGA HATOM1308 S *1 1 33.167 41.279 25.641 1.00 81.24 LIGA SATOM1309 O *1 1 33.774 40.123 26.382 1.00 80.04 LIGA OATOM1310 O *1 1 32.867 40.862 24.230 1.00 80.50 LIGA OATOM1311 O *1 1 34.119 42.548 25.670 1.00 79.65 LIGA OATOM1312 H *1 1 34.951 42.330 25.269 1.00 20.00 LIGA HTER 1313 *1 1ATOM1314 O HOH W 1 19.154 20.019 28.345 1.00 14.14 SOATOM1315 O HOH W 2 23.228 15.643 36.576 1.00 16.94 SOATOM1316 O HOH W 3 9.851 19.721 10.708 1.00 13.00 SOATOM1317 O HOH W 4 8.807 18.269 21.008 1.00 14.72 SOATOM1318 O HOH W 5 4.955 20.914 9.889 1.00 26.47 SOATOM1319 O HOH W 6 17.303 10.248 31.329 1.00 20.21 SOATOM1320 O HOH W 7 21.419 36.535 33.815 1.00 20.37 SOATOM1321 O HOH W 8 17.558 29.940 39.867 1.00 20.33 SOATOM1322 O HOH W 9 6.195 26.062 12.062 1.00 15.73 SOATOM1323 O HOH W 10 27.195 16.076 37.425 1.00 23.27 SOATOM1324 O HOH W 11 7.569 24.195 27.699 1.00 15.49 SOATOM1325 O HOH W 12 9.918 10.244 27.897 1.00 14.73 SOATOM1326 O HOH W 13 18.578 40.541 22.823 1.00 17.35 SOATOM1327 O HOH W 14 12.929 31.417 36.841 1.00 14.91 SOATOM1328 O HOH W 15 18.919 21.848 17.030 1.00 16.90 SOATOM1329 O HOH W 16 16.648 20.485 10.072 1.00 19.27 SOATOM1330 O HOH W 17 22.460 33.500 36.980 1.00 16.01 SOATOM1331 O HOH W 18 3.488 17.715 36.292 1.00 27.12 SOATOM1332 O HOH W 19 19.370 14.862 9.712 1.00 13.10 SOATOM1333 O HOH W 20 19.355 40.188 27.351 1.00 20.79 SOATOM1334 O HOH W 21 16.874 12.423 21.691 1.00 24.23 SOATOM1335 O HOH W 22 18.521 38.452 20.251 1.00 22.43 SOATOM1336 O HOH W 23 10.797 19.540 36.865 1.00 27.07 SOATOM1337 O HOH W 24 11.234 19.209 19.064 1.00 21.16 SOATOM1338 O HOH W 25 11.110 10.795 24.566 1.00 21.70 SOATOM1339 O HOH W 26 10.089 25.686 42.195 1.00 27.30 SOATOM1340 O HOH W 27 5.885 26.924 28.544 1.00 17.14 SOATOM1341 O HOH W 28 22.189 13.924 20.647 1.00 19.65 SOATOM1342 O HOH W 29 2.839 15.407 25.779 1.00 24.76 SOATOM1343 O HOH W 30 20.416 36.872 30.702 1.00 22.38 SOATOM1344 O HOH W 31 14.010 25.569 46.267 1.00 20.18 SOATOM1345 O HOH W 32 19.103 14.781 19.716 1.00 25.71 SOATOM1346 O HOH W 33 14.999 33.688 35.037 1.00 17.93 SOATOM1347 O HOH W 35 23.578 36.561 29.922 1.00 21.76 SOATOM1348 O HOH W 36 20.341 32.322 45.950 1.00 21.47 SOATOM1349 O HOH W 37 0.497 25.775 19.401 1.00 26.47 SOATOM1350 O HOH W 38 11.741 34.995 39.424 1.00 22.41 SOATOM1351 O HOH W 39 22.467 9.409 26.630 1.00 15.84 SOATOM1352 O HOH W 40 22.662 11.866 36.367 1.00 45.41 SOATOM1353 O HOH W 41 3.122 26.816 16.542 1.00 23.85 SOATOM1354 O HOH W 42 6.805 20.983 12.758 1.00 24.18 SOATOM1355 O HOH W 43 29.143 24.285 40.975 1.00 26.61 SOATOM1356 O HOH W 44 24.253 18.985 43.742 1.00 21.24 SO
ATOM1357 OHOH W 4516.923 33.119 42.439 1.00 24.24 SOATOM1358 OHOH W 46-0.710 24.821 24.871 1.00 22.41 SOATOM1359 OHOH W 4728.123 37.039 34.996 1.00 23.29 SOATOM1360 OHOH W 4822.509 29.264 12.288 1.00 22.20 SOATOM1361 OHOH W 4918.268 20.963 47.186 1.00 27.23 SOATOM1362 OHOH W 5025.603 33.211 43.598 1.00 26.97 SOATOM1363 OHOH W 5120.065 33.475 8.796 1.00 27.50 SOATOM1364 OHOH W 5227.258 11.820 29.311 1.00 24.08 SOATOM1365 OHOH W 5310.875 28.986 41.865 1.00 23.77 SOATOM1366 OHOH W 545.763 34.393 31.210 1.00 25.54 SOATOM1367 OHOH W 5513.975 14.195 21.784 1.00 27.82 SOATOM1368 OHOH W 5612.541 23.538 8.045 1.00 22.43 SOATOM1369 OHOH W 5724.567 16.480 39.993 1.00 26.58 SOATOM1370 OHOH W 5824.532 38.285 35.829 1.00 57.74 SOATOM1371 OHOH W 5925.710 22.863 22.059 1.00 31.50 SOATOM1372 OHOH W 6012.323 34.306 43.203 1.00 31.10 SOATOM1373 OHOH W 614.395 14.949 17.739 1.00 29.65 SOATOM1374 OHOH W 626.745 20.043 6.966 1.00 84.14 SOATOM1375 OHOH W 635.532 20.170 37.794 1.00 41.49 SOATOM1376 OHOH W 6426.003 16.001 22.248 1.00 29.03 SOATOM1377 OHOH W 655.525 35.401 19.570 1.00 33.21 SOATOM1378 OHOH W 6631.845 33.895 37.644 1.00 34.28 SOATOM1379 OHOH W 6720.183 13.414 38.159 1.00 27.70 SOATOM1380 OHOH W 6820.038 18.219 20.060 1.00 50.13 SOATOM1381 OHOH W 700.763 17.179 17.010 1.00 37.46 SOATOM1382 OHOH W 7124.671 21.255 26.579 1.00 25.15 SOATOM1383 OHOH W 728.061 13.765 23.048 1.00 31.32 SOATOM1384 OHOH W 7321.384 36.182 15.238 1.00 25.91 SOATOM1385 OHOH W 7432.543 19.236 37.104 1.00 32.62 SOATOM1386 OHOH W 753.201 29.276 38.786 1.00 44.04 SOATOM1387 OHOH W 762.482 32.835 31.391 1.00 47.33 SOATOM1388 OHOH W 7722.558 9.563 30.212 1.00 60.39 SOATOM1389 OHOH W 7824.502 25.394 46.538 1.00 35.15 SOATOM1390 OHOH W 797.028 39.862 28.058 1.00 31.57 SOATOM1391 OHOH W 8033.571 14.425 35.307 1.00 26.04 SOATOM1392 OHOH W 812.732 10.198 34.775 1.00 30.67 SOATOM1393 OHOH W 8234.746 11.362 31.655 1.00 34.37 SOATOM1394 OHOH W 8327.003 10.835 24.556 1.00 34.40 SOATOM1395 OHOH W 8411.607 15.263 18.090 1.00 53.18 SOATOM1396 OHOH W 8518.961 26.409 8.948 1.00 30.64 SOATOM1397 OHOH W 868.329 30.456 11.682 1.00 24.79 SOATOM1398 OHOH W 8728.267 25.545 24.816 1.00 34.18 SOATOM1399 OHOH W 8827.826 26.788 46.520 1.00 45.31 SOATOM1400 OHOH W 8913.822 23.152 43.665 1.00 23.81 SOATOM1401 OHOH W 9015.013 32.301 6.825 1.00 36.86 SOATOM1402 OHOH W 917.321 15.444 19.576 1.00 38.03 SOATOM1403 OHOH W 929.274 4.160 30.626 1.00 34.25 SOATOM1404 OHOH W 931.045 23.765 33.021 1.00 29.72 SOATOM1405 OHOH W 940.274 28.435 36.491 1.00 39.40 SOATOM1406 OHOH W 9526.351 23.628 18.493 1.00 37.43 SOATOM1407 OHOH W 9634.940 15.280 30.014 1.00 38.02 SOATOM1408 OHOH W 9720.426 30.014 49.201 1.00 33.87 SOATOM1409 OHOH W 9813.509 20.866 41.132 1.00 41.63 SOATOM1410 OHOH W 9928.366 18.133 31.889 1.00 32.04 SOATOM1411 OHOH W 100 0.422 36.030 31.986 1.00 42.04 SOATOM1412 OHOH W 103 13.872 24.846 4.468 1.00 45.22 SOATOM1413 OHOH W 104 25.742 19.925 19.691 1.00 41.00 SOATOM1414 OHOH W 105 5.894 32.368 37.453 1.00 28.07 SOATOM1415 OHOH W 108 27.692 30.529 45.176 1.00 36.94 SOATOM1416 OHOH W 109 30.999 38.392 25.165 1.00 26.39 SOATOM1417 OHOH W 111 13.400 10.503 34.273 1.00 29.92 SOATOM1418 OHOH W 112 20.748 36.914 39.970 1.00 40.16 SOATOM1419 OHOH W 113 24.634 31.190 17.336 1.00 36.87 SOATOM1420 OHOH W 114 5.642 30.898 42.120 1.00 38.57 SOATOM1421 OHOH W 115 8.972 40.592 30.979 1.00 32.13 SOATOM1422 OHOH W 116 2.047 31.605 35.777 1.00 62.75 SOATOM1423 OHOH W 117 27.060 7.939 28.519 1.00 31.51 SOATOM1424 OHOH W 118 4.134 24.143 10.395 1.00 19.77 SOATOM1425 OHOH W 119 17.406 32.729 38.273 1.00 19.77 SOATOM1426 OHOH W 120 21.370 42.268 22.477 1.00 19.75 SOATOM1427 OHOH W 121 23.854 15.724 43.136 1.00 19.76 SOATOM1428 OHOH W 122 19.654 34.836 37.602 1.00 19.76 SOATOM1429 OHOH W 123 21.170 42.930 27.470 1.00 19.75 SOATOM1430 OHOH W 124 25.304 8.005 25.551 1.00 19.75 SOATOM1431 OHOH W 125 20.739 40.152 30.476 1.00 19.73 SOATOM1432 OHOH W 126 19.238 15.779 6.587 1.00 19.76 SOATOM1433 OHOH W 127 7.151 28.097 9.617 1.00 19.75 SOATOM1434 OHOH W 128 7.122 17.869 11.543 1.00 19.75 SO
ATOM1435 OHOH W 1299.467 35.418 37.012 1.00 19.76 SOATOM1436 OHOH W 1305.720 23.417 6.558 1.00 19.76 SOATOM1437 OHOH W 1313.123 12.568 32.283 1.00 19.76 SOATOM1438 OHOH W 13212.909 18.142 39.232 1.00 19.75 SOATOM1439 OHOH W 13318.190 34.668 45.077 1.00 19.77 SOATOM1440 OHOH W 13416.371 23.490 8.743 1.00 19.77 SOATOM1441 OHOH W 13525.889 26.341 15.721 1.00 19.77 SOATOM1442 OHOH W 13818.831 37.368 35.694 1.00 19.75 SOATOM1443 OHOH W 139-1.837 27.004 34.243 1.00 19.78 SOATOM1444 OHOH W 14029.965 21.328 39.814 1.00 19.75 SOATOM1445 OHOH W 14129.084 22.512 22.380 1.00 19.74 SOATOM1446 OHOH W 14426.825 34.183 16.982 1.00 19.75 SOATOM1447 OHOH W 14628.060 21.125 26.874 1.00 19.76 SOATOM1448 OHOH W 1477.953 28.465 43.320 1.00 19.76 SOATOM1449 OHOH W 14825.139 13.555 38.510 1.00 19.76 SOATOM1450 OHOH W 15427.898 15.263 40.931 1.00 19.75 SOATOM1451 OHOH W 15729.305 18.029 39.665 1.00 19.76 SOATOM1452 OHOH W 15822.038 30.753 9.108 1.00 19.76 SOATOM1453 OHOH W 15918.399 11.163 36.207 1.00 19.76 SOATOM1454 OHOH W 16426.335 11.937 35.945 1.00 19.75 SOATOM1455 OHOH W 1651.758 29.855 17.357 1.00 19.75 SOATOM1456 OHOH W 16624.163 39.471 32.170 1.00 19.76 SOATOM1457 OHOH W 17016.077 17.918 7.749 1.00 19.75 SOATOM1458 OHOH W 17232.921 14.044 27.295 1.00 19.76 SOATOM1459 OHOH W 17732.795 38.969 32.954 1.00 19.77 SOATOM1460 OHOH W 1794.059 6.708 28.892 1.00 19.75 SOATOM1461 OHOH W 18025.397 29.865 14.090 1.00 19.76 SOATOM1462 OHOH W 18211.078 20.731 43.859 1.00 19.77 SOATOM1463 OHOH W 18430.825 30.779 39.402 1.00 19.77 SOATOM1464 OHOH W 18710.289 21.108 7.474 1.00 19.75 SOATOM1465 OHOH W 18927.314 38.906 38.135 1.00 19.76 SOATOM1466 OHOH W 19725.884 26.959 11.320 1.00 19.70 SOATOM1467 OHOH W 2099.364 16.866 38.731 1.00 19.73 SOATOM1468 OHOH W 21932.352 16.134 38.786 1.00 19.73 SOATOM1469 OHOH W 22115.972 35.898 37.609 1.00 19.69 SOATOM1470 OHOH W 2233.319 35.758 13.483 1.00 19.71 SOTER 1471 HOH W 223END 使用程序DS Modeling(Accelrys)，使用默认设置，由上面提供的晶体学坐标，测定了ASP的表面可及(surface accessible)残基。发现ASP总的表面可及性(SA)是8044.777_。表19-2通过了总SA、侧链SA，百分SAS是溶剂可及的氨基酸总表面的百分比。
表19-2.ASP的总表面可及性残基总SA ang2侧链SA ang2百分SASasp 1Phe89.992 66.420 36.954asp 2Asp85.970 68.625 48.199asp 4Ile17.921 12.076 9.714asp 7Asn40.541 40.541 21.246asp 8Ala41.497 24.153 35.259asp 10Thr 35.846 35.846 21.190asp 11Ile 29.424 18.114 17.028asp 12Gly 81.658 30.191 73.513asp 13Gly 75.236 18.114 67.615asp 14Arg 124.289124.289 55.664asp 15Ser 29.424 29.424 19.554asp 16Arg 105.41 188.447 38.127asp 22Ala 11.690 0.0009.932asp 24Asn 71.105 65.067 47.079asp 25Gly 53.190 30.191 43.325asp 32His 34.693 17.728 19.568
asp 34Gly 18.114 12.076 20.656asp 35Arg 177.087171.242 69.918asp 36Thr 87.506 64.886 45.401asp 37Gly 58.465 24.153 55.659asp 38Ala 18.114 12.076 16.195asp 39Thr 99.579 87.889 55.002asp 40Thr 11.310 0.0006.469asp 41Ala 36.229 36.229 38.182asp 42Asn 86.537 74.844 43.919asp 43Pro 6.038 0.0004.599asp 44Thr 111.08299.582 59.375asp 45Gly 6.038 6.0385.436asp 46Thr 52.427 52.427 28.958asp 47Phe 5.655 0.0002.715asp 48Ala 58.848 30.191 52.705asp 49Gly 12.076 12.076 12.937asp 50Ser 51.274 0.00037.049asp 51Ser 17.348 17.348 11.573asp 52Phe 52.040 12.076 25.034asp 53Pro 53.193 36.229 40.511asp 54Gly 30.191 30.191 27.274asp 55Asn 34.499 34.499 18.613asp 57Tyr 28.658 28.658 11.861asp 59Phe 18.114 18.114 9.808asp 61Arg 146.706141.051 59.429asp 62Thr 22.619 5.65512.939asp 63Gly 17.538 6.03817.646asp 64Ala 112.22960.381 90.564asp 65Gly 70.535 30.191 60.226asp 66Val 16.965 0.00010.967asp 67Asn 69.002 62.964 39.692asp 68Leu 34.503 6.03816.536asp 69Leu 42.267 42.267 20.295asp 71Gln 39.774 39.774 18.552asp 73Asn 17.345 17.345 8.760asp 74Asn 41.301 41.301 25.351asp 75Tyr 93.544 47.922 37.830asp 76Ser 97.666 52.044 76.965asp 77Gly 81.275 24.153 73.294asp 78Gly 17.921 12.076 18.067asp 79Arg 139.91194.292 56.632asp 80Val 36.229 30.191 22.621asp 81Gln 82.421 70.921 37.295asp 83Ala 41.117 24.153 33.386asp 84Gly 12.076 12.076 12.151asp 85His 71.298 65.454 36.451asp 86Thr 111.08293.544 65.517asp 87Ala 64.886 42.267 52.523asp 88Ala 12.076 6.03810.760asp 89Pro 90.572 78.496 58.405asp 90Val 94.694 66.420 53.062asp 91Gly 58.082 18.114 49.593asp 92Ser 34.886 23.003 27.450asp 93Ala 83.381 60.381 70.846asp 95Cys 26.565 26.565 15.773asp 99Ser 39.584 0.00029.907asp 100Thr 87.123 47.155 48.121asp 101Thr 34.696 6.03822.060asp 102Gly 12.076 12.076 13.771asp 103Trp 70.728 47.919 27.630asp 104His 47.726 41.687 23.152asp 105Cys 54.609 31.799 33.796asp 106Gly 23.386 12.076 23.531asp 107Thr 47.155 47.155 29.873asp 108Ile 5.655 0.0002.888asp 109Thr 64.503 30.191 35.741asp 110Ala 24.153 24.153 21.668asp 111Leu 71.115 48.305 36.142asp 112Asn 138.770104.841 66.301asp 113Ser 17.731 11.693 12.794asp 114Ser 92.391 52.427 63.967asp 115Val 30.191 24.153 18.166
asp 116Thr 128.23782.618 66.534asp 117Tyr 35.846 24.153 15.603asp 118Pro 159.964102.648 93.188asp 119Glu 132.74587.123 63.766asp 120Gly 18.114 18.114 20.611asp 121Thr 93.924 76.579 48.828asp 123Arg 129.748129.748 59.619asp 124Gly 29.231 12.076 26.315asp 126Ile 6.038 6.0383.084asp 127Arg 99.943 99.943 36.957asp 128Thr 5.655 0.0003.450asp 129Thr 76.579 59.615 45.219asp 130Val 0.000 0.0000.000asp 131Cys 25.568 19.723 18.583asp 132Ala 11.693 6.0389.495asp 133Glu 40.734 29.041 20.057asp 134Pro 114.531102.648 68.994asp 135Gly 11.883 6.03811.979asp 137Ser 5.655 5.6553.915asp 143Ala 17.731 6.03818.763asp 144Gly 59.612 36.229 63.599asp 145Asn 81.832 70.142 44.061asp 146Gln 52.810 52.810 27.510asp 147Ala 5.655 0.0004.797asp 148Gln 11.500 5.8455.335asp 152Ser 5.655 0.0004.092asp 153Gly 24.153 18.114 25.819asp 154Gly 63.927 12.076 64.322asp 155Ser 88.656 70.541 69.864asp 156Gly 52.807 18.114 50.090asp 157Asn 35.263 35.263 20.195asp 158Cys 34.312 6.03821.893asp 159Arg 199.716154.094 79.090asp 160Thr 135.04489.422 85.862asp 161Gly 35.462 24.153 33.699asp 162Gly 23.576 6.03821.225asp 163Thr 46.005 46.005 25.438asp 164Thr 5.655 5.6553.127asp 165Phe 24.153 24.153 10.669asp 167Gln 5.845 5.8453.042asp 168Pro 48.305 48.305 31.227asp 170Asn 59.032 53.377 31.882asp 171Pro 59.615 42.267 42.027asp 173Leu 17.731 12.076 8.274asp 174Gln 145.572122.569 80.497asp 175Ala 52.044 6.03844.291asp 176Tyr 64.886 36.229 29.811asp 177Gly 69.775 24.153 70.340asp 178Leu 11.693 6.0385.788asp 179Arg 182.932182.932 72.390asp 180Met 34.886 12.076 17.253asp 181Ile 36.229 30.191 19.053asp 182Thr 99.389 76.579 60.785asp 183Thr 104.85493.544 68.979asp 184Asp 122.00823.386 52.822 应用MOE(Chemical Computing Group)对ASP坐标以及同源结构的坐标进行分析。水和配体的坐标被移去。应用MOE align，使用实际的二级结构对结构进行对比，使得能够形成结构比对(structural alignment)和能够形成重合链(superposechains)。结果产生了下述的结构比对。列出的数字表示成熟ASP蛋白酶氨基酸序列。
110 20 3040ASPFDVIGGNAYTIG-GRSRCSIGFAVN-----GGFITAGHCGRTGATTAN------PTGTFA1HPG --VLGGGAIYGG-GSR-CSAAFNVTK-GGARYFVTAGHCTNISANWSASS-GGSVVGVRE1SGP --ISGGDAIYSS-TGR-CSLGFNVRS-GSTYYFLTAGHCTDGATTWWANSARTTVLGTTS1TAL ANIVGGIEYSINNASL-CSVGFSVTR-GATKGFVTAGHCGTVNATARIG---GAVVGTFA2SFA --IAGGEAIYAAGGGR-CSLGFNVRSSSGATYALTAGHCTEIASTWYTNSGQTSLLGTRA2SGA --IAGGEAITT-GGSR-CSLGFNVSV-NGVAHALTAGHCTNISASWS--------IGTRTPDB ID50 60 708090100ASPGSSFPGNDYAFVRTGAG-VNLLAQVNNYSGGRVQVAGHTAAPVGSAVCRSGSTTGWHCGT1HPG GTSFPTNDYGIVRYTDG-SSPAGTVDLYNGSTQDISSAANAVVGQAIKKSGSTTKVTSGT1SGP GSSFPNNDYGIVRYTNTTIPKDGTVG-----GQDITSAANATVGMAVTRRGSTTGTHSGS1TAL ARVFPGNDRAWVSLTSA-QTLLPRVANG-SSFVTVRGSTEAAVGAAVCRSGRTTGYQCGT2SFA GTSFPGNDYGLIRHSNA-SAADGRVYLYNGSYRDITGAGNAYVGQTVQRSGSTTGLHSGR2SGA GTSFPNNDYGIIRHSNP-AAADGRVYLYNGSYQDITTAGNAFVGQAVQRSGSTTGLRSGSPDB ID110120 130 140150160ASPITALNSSVTYPE-GTVRGLIRTTVCAEPGDSGGSLLA-GNQAQGVTSGGSG-----NCRT1HPG VTAVNVTVNYGD-GPVYNMVRTTACSAGGDSGGAHFA-GSVALGIHSGSSG------CSG1SGP VTALNATVNYGGGDVVYGMIRTNVCAEPGDSGGPLYS-GTRAIGLTSGGSG-----NCSS1TAL ITAKNVTANYAE-GAVRGLTQGNACMGRGDSGGSWITSAGQAQGVMSGGNVQSNGNNCGI2SFA VTGLNATVNYGGGDIVSGLIQTNVCAEPGDSGGALFA-GSTALGLTSGGSG-----NCRT2SGA VTGLNAIVNYGSSGIVYGMIQTNVCAQPGDSGGSLFA-GSTALGLTSGGSG-----NCRTPDB ID170 180ASPG---GTTFFQPVNPILQAYGLRMITTD(SEQ ID NO624)1HPG TA--GSAIHQPVTEALSAYGVTVY---(SEQ ID NO625)1SGP G---GTTFFQPVTEALVAYGVSVY---(SEQ ID NO626)1TAL PASQRSSLFERLQPILSQYGLSLVTG-(SEQ ID NO627)2SFA G---GTTFFQPVTEALSAYGVSIL---(SEQ ID NO628)2SGA G---GTTFYQPVTEALSAYGATVL---(SEQ ID NO629)[712]在上述的比对中，代码如下1HPG＝灰色链霉菌谷氨酸特异性蛋白酶1SGP＝灰色链霉菌蛋白酶B1SGT＝灰色链霉菌菌株K1胰蛋白酶1TAL＝Lysobcater enzymogenesα-裂解蛋白酶2SFA＝弗氏链霉菌丝氨酸蛋白酶2SGA＝灰色链霉菌蛋白酶A实施例20ASP活性位点的酶底物建模和作图[713]该实施例中，描述ASP活性位点的酶底物建模和作图方法。对活性位点的初步探查揭示了大的P1结合袋(binding pocket)，该结合袋足以容纳大的疏水基团，诸如Trp、Tyr和Phe的侧链。
链霉蛋白酶A连同火鸡卵粘蛋白抑制剂的第三结构域的晶体结构(PDB码为2SGB)已经被测定。使用MOE(Chemical Computing Corp)，将2SGB与ASP进行结构对比，其中将抑制剂置于ASP的活性位点中。所有的2SGB坐标被移去，除了那些对被结合在ASP活性位点中的六肽进行限定的坐标，其对应于在S4至S2′结合位点的结合。原-ASP(Pro-Asp)蛋白质对pro结构域-成熟结构域的连接进行自我切割，从而释放成熟的蛋白酶。Pro结构域的最后四个残基被认为占据了S1-S4位点，成熟蛋白酶的前两个残基占据了S1′和S2′位点。因此，在活性位点中的六肽在计算机上被改变为序列PRTMFD(SEQ ID NO630)。
根据对最初的底物结合模型的结构的探查，Gly135和Asp136的主架酰胺有望形成氧-阴离子洞(oxy-anion hole)。然而，Gly135的酰胺氮似乎指向了错误的方向。与链霉蛋白酶A的比较证实了这一点。因此，认为ASP中的构象变化是形成氧-阴离子洞所必需的。然而，本发明不旨在局限于任何特定的机制或假设。残基134和135之间的肽主架被改变方向，变化后的方向与在链霉蛋白酶A结构中结构上等价的原子的方向类似。然后酶底物模型被能量最小化。
模型底物6_内的残基用程序QUANTA中的邻近分析工具(proximity tool)确定。这些残基被鉴定为Arg14、Ser15、Arg16、Cys17、His32、Cys33、Phe52、Asp56、Thr100、Val115、Thr116、Tyr117、Pro118、Glu119、Ala132、Glu133、Pro134、Gly135、Asp136、Ser137、Thr151、Ser152、Gly153、Gly154、Ser155、Gly156、Asn157、Thr164、Phe165。其中，His32、Asp56和Ser137形成催化三联体。
P1袋由Cys131、Ala132、Glu133、Pro134、Gly135、Thr151、Ser152、Gly153、Gly154、Ser155、Gly156、Asn157和Gly162、Thr163、Thr164形成。P2袋由Phe52、Tyr117、Pro118和Glu119限定。P3袋在Gly154与底物主链之间具有主链-主链氢键。P1′袋由Arg16和His32限定。P2′袋由Thr100和Pro134限定。ASP和模型八肽底物的原子坐标在下面的表20-1中给出。
ASP连同模型八肽底物的原子坐标ATOM1 N PHE A12.452 18.495 15.1650.00N1+ATOM2 CA PHE A13.712 18.208 15.9010.00CATOM3 CB PHE A14.906 18.646 15.0550.00CATOM4 C PHE A13.743 18.914 17.2540.00CATOM5 O PHE A13.539 20.133 17.3400.00OATOM6 CG PHE A16.232 18.405 15.7070.00CATOM7 CD2 PHE A16.963 17.268 15.4110.00C
ATOM 8 CD1 PHE A16.750 19.312 16.6180.00 CATOM 9 CE2 PHE A18.192 17.035 16.0100.00 CATOM10 CE1 PHE A17.981 19.086 17.2220.00 CATOM11 CZ PHE A18.702 17.946 16.9170.00 CATOM12 NASP A24.000 18.148 18.3110.00 NATOM13 CA ASP A24.052 18.708 19.6590.00 CATOM14 CB ASP A23.584 17.678 20.6880.00 CATOM15 CASP A25.422 19.210 20.0660.00 CATOM16 OASP A26.415 18.508 19.9250.00 OATOM17 CG ASP A22.109 17.354 20.5600.00 CATOM18 OD2 ASP A21.597 16.558 21.3790.00 O1-ATOM19 OD1 ASP A21.459 17.889 19.6380.00 OATOM20 NVAL A35.464 20.440 20.5620.00 NATOM21 CA VAL A36.707 21.057 21.0090.00 CATOM22 CB VAL A36.736 22.574 20.7180.00 CATOM23 CVAL A36.737 20.837 22.5130.00 CATOM24 OVAL A35.806 21.233 23.2160.00 OATOM25 CG1 VAL A37.921 23.222 21.4250.00 CATOM26 CG2 VAL A36.840 22.810 19.2200.00 CATOM27 CB ILE A47.602 18.448 24.7300.00 CATOM28 CG2 ILE A47.684 18.189 26.2270.00 CATOM29 CG1 ILE A46.196 18.137 24.2200.00 CATOM30 CD1 ILE A45.768 16.711 24.4560.00 CATOM31 CILE A49.379 20.168 24.9110.00 CATOM32 OILE A4 10.346 19.836 24.2290.00 OATOM33 NILE A47.801 20.200 22.9970.00 NATOM34 CA ILE A47.955 19.916 24.4230.00 CATOM35 NGLY A59.499 20.743 26.1030.00 NATOM36 CA GLY A5 10.807 21.030 26.6530.00 CATOM37 CGLY A5 11.655 19.787 26.8190.00 CATOM38 OGLY A5 11.171 18.750 27.2770.00 OATOM39 NGLY A6 12.927 19.885 26.4430.00 NATOM40 CA GLY A6 13.817 18.747 26.5720.00 CATOM41 CGLY A6 14.007 17.948 25.2940.00 CATOM42 OGLY A6 14.990 17.217 25.1570.00 OATOM43 NASN A7 13.069 18.082 24.3590.00 NATOM44 CA ASN A7 13.155 17.351 23.1000.00 CATOM45 CB ASN A7 11.784 17.247 22.4500.00 CATOM46 CG ASN A7 10.918 16.210 23.1020.00 CATOM47 OD1 ASN A79.741 16.069 22.7600.00 OATOM48 ND2 ASN A7 11.492 15.464 24.0490.00 NATOM49 CASN A7 14.124 17.933 22.0860.00 CATOM50 OASN A7 14.466 19.114 22.1190.00 OATOM51 NALA A8 14.561 17.077 21.1760.00 NATOM52 CA ALA A8 15.486 17.487 20.1380.00 CATOM53 CB ALA A8 16.212 16.271 19.5770.00 CATOM54 CALA A8 14.716 18.174 19.0230.00 CATOM55 OALA A8 13.509 17.988 18.8740.00 OATOM56 NTYR A9 15.423 18.993 18.2620.00 NATOM57 CA TYR A9 14.847 19.714 17.1430.00 CATOM58 CB TYR A9 14.253 21.064 17.5800.00 CATOM59 CG TYR A9 15.221 22.148 17.9630.00 CATOM60 CD2 TYR A9 15.517 22.398 19.3010.00 CATOM61 CE2 TYR A9 16.341 23.443 19.6630.00 CATOM62 CD1 TYR A9 15.785 22.972 16.9930.00 CATOM63 CE1 TYR A9 16.609 24.021 17.3430.00 CATOM64 CZ TYR A9 16.883 24.255 18.6780.00 CATOM65 OH TYR A9 17.688 25.309 19.0290.00 OATOM66 CTYR A9 16.072 19.837 16.2620.00 CATOM67 OTYR A9 17.188 19.678 16.7530.00 OATOM68 NTHR A 10 15.886 20.077 14.9700.00 NATOM69 CA THR A 10 17.034 20.183 14.0820.00 CATOM70 CB THR A 10 17.031 19.031 13.0410.00 CATOM71 OG1 THR A 10 15.822 19.082 12.2690.00 OATOM72 CG2 THR A 10 17.129 17.676 13.7410.00 CATOM73 CTHR A 10 17.205 21.488 13.3290.00 CATOM74 OTHR A 10 16.249 22.243 13.1040.00 OATOM75 NILE A 11 18.453 21.734 12.9380.00 NATOM76 CA ILE A 11 18.828 22.930 12.1970.00 CATOM77 CB ILE A 11 19.609 23.914 13.0930.00 CATOM78 CG2 ILE A 11 19.855 25.221 12.3430.00 CATOM79 CG1 ILE A 11 18.811 24.187 14.3690.00 CATOM80 CD1 ILE A 11 19.546 25.036 15.3850.00 CATOM81 CILE A 11 19.712 22.442 11.0540.00 CATOM82 OILE A 11 20.772 21.856 11.2840.00 OATOM83 NGLY A 12 19.274 22.668 9.8210.00 NATOM84 CA GLY A 12 20.048 22.193 8.6890.00 CATOM85 CGLY A 12 20.344 20.705 8.8450.00 C
ATOM86 OGLY A12 21.439 20.239 8.5230.00 OATOM87 NGLY A13 19.373 19.957 9.3610.00 NATOM88 CA GLY A13 19.564 18.531 9.5450.00 CATOM89 CGLY A13 20.373 18.127 10.7690.00 CATOM90 OGLY A13 20.438 16.945 11.1030.00 OATOM91 NARG A14 20.984 19.091 11.4490.00 NATOM92 CA ARG A14 21.787 18.782 12.6270.00 CATOM93 CB ARG A14 23.036 19.670 12.6690.00 CATOM94 CARG A14 21.018 18.938 13.93S0.00 CATOM95 OARG A14 20.441 19.982 14.2120.00 OATOM96 CG ARG A14 24.251 19.072 11.9640.00 CATOM97 CD ARG A14 24.065 19.084 10.4500.00 CATOM98 NE ARG A14 24.173 17.752 9.8580.00 N1+ATOM99 CZ ARG A14 25.316 17.100 9.6600.00 CATOM 100 NH1 ARG A14 26.474 17.655 10.0040.00 NATOM 101 NH2 ARG A14 25.302 15.886 9.1200.00 NATOM 102 NSER A15 21.016 17.878 14.7330.00 NATOM 103 CA SER A15 20.335 17.870 16.0170.00 CATOM 104 CB SER A15 20.062 16.429 16.4540.00 CATOM 105 CSER A15 21.312 18.525 16.9830.00 CATOM 106 OSER A15 21.933 17.849 17.8030.00 OATOM 107 OG SER A15 19.396 16.382 17.7010.00 OATOM 108 NARG A16 21.454 19.841 16.8670.00 NATOM 109 CA ARG A16 22.362 20.594 17.7240.00 CATOM 110 CB ARG A16 22.741 21.927 17.0730.00 CATOM 111 CARG A16 21.815 20.907 19.1040.00 CATOM 112 OARG A16 22.550 20.867 20.0880.00 OATOM 113 CG ARG A16 23.719 21.851 15.9150.00 CATOM 114 CD ARG A16 24.200 23.253 15.5490.00 CATOM 115 NE ARG A16 24.625 23.984 16.7450.00 N1+ATOM 116 CZ ARG A16 25.242 25.166 16.7390.00 CATOM 117 NH2 ARG A16 25.581 25.735 17.8880.00 NATOM 118 NH1 ARG A16 25.528 25.781 15.5970.00 NATOM 119 NCYS A17 20.526 21.215 19.1780.00 NATOM 120 CA CYS A17 19.928 21.546 20.4550.00 CATOM 121 CB CYS A17 19.800 23.068 20.5530.00 CATOM 122 CCYS A17 18.599 20.911 20.8030.00 CATOM 123 OCYS A17 18.071 20.077 20.0710.00 OATOM 124 SG CYS A17 21.393 23.932 20.6960.00 SATOM 125 NSER A18 18.066 21.348 21.9420.00 NATOM 126 CA SER A18 16.799 20.865 22.4550.00 CATOM 127 CB SER A18 17.042 20.053 23.7230.00 CATOM 128 OG SER A18 18.081 19.111 23.5210.00 OATOM 129 CSER A18 15.871 22.030 22.7690.00 CATOM 130 OSER A18 16.312 23.175 22.8900.00 OATOM 131 NILE A19 14.584 21.728 22.8920.00 NATOM 132 CA ILE A19 13.582 22.737 23.1950.00 CATOM 133 CB ILE A19 12.150 22.152 23.1250.00 CATOM 134 CG2 ILE A19 11.133 23.215 23.5320.00 CATOM 135 CG1 ILE A19 11.852 21.634 21.7150.00 CATOM 136 CD1 ILE A19 11.832 22.709 20.6550.00 CATOM 137 CILE A19 13.794 23.273 24.6140.00 CATOM 138 OILE A19 14.070 22.505 25.5450.00 OATOM 139 NGLY A20 13.670 24.589 24.7740.00 NATOM 140 CA GLY A20 13.818 25.185 26.0880.00 CATOM 141 CGLY A20 12.443 25.203 26.7220.00 CATOM 142 OGLY A20 12.122 24.389 27.5850.00 OATOM 143 NPHE A21 11.616 26.137 26.2740.00 NATOM 144 CA PHE A21 10.253 26.258 26.7630.00 CATOM 145 CB PHE A21 10.196 27.160 27.9920.00 CATOM 146 CG PHE A21 10.855 26.559 29.1950.00 CATOM 147 CD1 PHE A21 10.269 25.491 29.8570.00 CATOM 148 CD2 PHE A21 12.086 27.025 29.6380.00 CATOM 149 CE1 PHE A21 10.898 24.898 30.9360.00 CATOM 150 CE2 PHE A21 12.713 26.435 30.7150.00 CATOM 151 CZ PHE A21 12.122 25.370 31.3660.00 CATOM 152 CPHE A219.391 26.825 25.6640.00 CATOM 153 OPHE A219.865 27.597 24.8300.00 OATOM 154 NALA A228.131 26.413 25.6460.00 NATOM 155 CA ALA A227.194 26.882 24.6470.00 CATOM 156 CB ALA A226.014 25.915 24.5330.00 CATOM 157 CALA A226.719 28.230 25.1380.00 CATOM 158 OALA A226.416 28.388 26.3200.00 OATOM 159 NVAL A236.677 29.202 24.2390.00 NATOM 160 CA VAL A236.233 30.546 24.5820.00 CATOM 161 CB VAL A237.402 31.570 24.5510.00 CATOM 162 CG1 VAL A238.328 31.338 25.7280.00 CATOM 163 CG2 VAL A238.182 31.442 23.2480.00 C
ATOM164 CVAL A23 5.206 30.945 23.5450.00 CATOM165 OVAL A23 5.053 30.267 22.5260.00 OATOM166 NASN A24 4.495 32.036 23.7910.00 NATOM167 CA ASN A24 3.492 32.476 22.8320.00 CATOM168 CB ASN A24 2.807 33.759 23.3280.00 CATOM169 CASN A24 4.177 32.715 21.4840.00 CATOM170 OASN A24 5.050 33.576 21.3650.00 OATOM171 CG ASN A24 3.737 34.963 23.3340.00 CATOM172 OD1 ASN A24 4.697 35.029 24.1070.00 OATOM173 ND2 ASN A24 3.451 35.927 22.4620.00 NATOM174 NGLY A25 3.801 31.929 20.4770.00 NATOM175 CA GLY A25 4.396 32.084 19.1580.00 CATOM176 CGLY A25 5.503 31.104 18.7880.00 CATOM177 OGLY A25 5.925 31.054 17.6350.00 OATOM178 NGLY A26 5.989 30.327 19.7480.00 NATOM179 CA GLY A26 7.043 29.377 19.4330.00 CATOM180 CGLY A26 7.702 28.795 20.6660.00 CATOM181 OGLY A26 7.028 28.328 21.5820.00 OATOM182 NPHE A27 9.028 28.813 20.6880.00 NATOM183 CA PHE A27 9.757 28.294 21.8320.00 CATOM184 CB PHE A27 9.973 26.783 21.7100.00 CATOM185 CPHE A27 11.103 28.975 21.9540.00 CATOM186 OPHE A27 11.660 29.459 20.9630.00 OATOM187 CG PHE A27 10.949 26.376 20.6240.00 CATOM188 CD1 PHE A27 10.504 26.078 19.3360.00 CATOM189 CD2 PHE A27 12.306 26.246 20.9050.00 CATOM190 CE1 PHE A27 11.391 25.650 18.3520.00 CATOM191 CE2 PHE A27 13.202 25.819 19.9260.00 CATOM192 CZ PHE A27 12.742 25.518 18.6480.00 CATOM193 NILE A28 11.615 29.020 23.1800.00 NATOM194 CA ILE A28 12.904 29.640 23.4450.00 CATOM195 CB ILE A28 12.843 30.524 24.7040.00 CATOM196 CILE A28 13.953 28.542 23.6030.00 CATOM197 OILE A28 13.640 27.426 24.0110.00 OATOM198 CG2 ILE A28 11.915 31.688 24.4500.00 CATOM199 CG1 ILE A28 12.350 29.718 25.9040.00 CATOM200 CD1 ILE A28 12.270 30.524 27.1760.00 CATOM201 NTHR A29 15.195 28.866 23.2650.00 NATOM202 CA THR A29 16.293 27.916 23.3530.00 CATOM203 CB THR A29 16.329 27.054 22.0520.00 CATOM204 OG1 THR A29 17.423 26.126 22.0950.00 OATOM205 CG2 THR A29 16.459 27.950 20.8310.00 CATOM206 CTHR A29 17.601 28.695 23.5380.00 CATOM207 OTHR A29 17.565 29.881 23.8420.00 OATOM208 NALA A30 18.743 28.029 23.3620.00 NATOM209 CA ALA A30 20.059 28.662 23.5100.00 CATOM210 CB ALA A30 21.121 27.601 23.7650.00 CATOM211 CALA A30 20.447 29.486 22.2820.00 CATOM212 OALA A30 20.232 29.061 21.1410.00 OATOM213 NGLY A31 21.028 30.659 22.5200.00 NATOM214 CA GLY A31 21.427 31.522 21.4230.00 CATOM215 CGLY A31 22.508 30.942 20.5280.00 CATOM216 OGLY A31 22.527 31.212 19.3220.00 OATOM217 NHIS A32 23.410 30.143 21.0990.00 NATOM218 CA HIS A32 24.490 29.558 20.3100.00 CATOM219 CB HIS A32 25.648 29.091 21.2150.00 CATOM220 CG HIS A32 25.412 27.772 21.8850.00 CATOM221 CD2 HIS A32 24.715 27.451 23.0010.00 CATOM222 ND1 HIS A32 25.946 26.589 21.4190.00 NATOM223 CE1 HIS A32 25.590 25.601 22.2180.00 CATOM224 NE2 HIS A32 24.842 26.098 23.1880.00 NATOM225 CHIS A32 24.029 28.401 19.4130.00 CATOM226 OHIS A32 24.805 27.870 18.6300.00 OATOM227 NCYS A33 22.762 28.025 19.5250.00 NATOM228 CA CYS A33 22.210 26.940 18.7230.00 CATOM229 CB CYS A33 20.836 26.522 19.2510.00 CATOM230 SG CYS A33 20.853 25.876 20.9420.00 SATOM231 CCYS A33 22.062 27.395 17.2830.00 CATOM232 OCYS A33 22.149 26.603 16.3560.00 OATOM233 NGLY A34 21.822 28.680 17.0950.00 NATOM234 CA GLY A34 21.664 29.181 15.7490.00 CATOM235 CGLY A34 21.360 30.656 15.7630.00 CATOM236 OGLY A34 20.984 31.213 16.7940.00 OATOM237 NARG A35 21.523 31.288 14.6080.00 NATOM238 CA ARG A35 21.284 32.716 14.4780.00 CATOM239 CB ARG A35 22.417 33.355 13.6800.00 CATOM240 CARG A35 19.951 33.012 13.7980.00 CATOM241 OARG A35 19.348 32.138 13.1730.00 O
ATOM242 CG ARG A35 22.437 32.937 12.2190.00 CATOM243 CD ARG A35 23.488 33.715 11.4580.00 CATOM244 NE ARG A35 24.832 33.237 11.7550.00 N1+ATOM245 CZ ARG A35 25.406 32.207 11.1390.00 CATOM246 NH1 ARG A35 26.634 31.832 11.4710.00 NATOM247 NH2 ARG A35 24.759 31.559 10.1780.00 NATOM248 NTHR A36 19.513 34.258 13.9180.00 NATOM249 CA THR A36 18.259 34.714 13.3350.00 CATOM250 CB THR A36 18.124 36.242 13.5220.00 CATOM251 CTHR A36 18.161 34.353 11.8560.00 CATOM252 OTHR A36 19.123 34.512 11.0990.00 OATOM253 OG1 THR A36 18.120 36.536 14.9230.00 OATOM254 CG2 THR A36 16.844 36.773 12.8800.00 CATOM255 NGLY A37 16.999 33.855 11.4490.00 NATOM256 CA GLY A37 16.813 33.479 10.0590.00 CATOM257 CGLY A37 17.046 32.001 9.7990.00 CATOM258 OGLY A37 16.521 31.451 8.8390.00 OATOM259 NALA A38 17.842 31.349 10.6400.00 NATOM260 CA ALA A38 18.095 29.924 10.4700.00 CATOM261 CALA A38 16.745 29.222 10.5650.00 CATOM262 OALA A38 15.881 29.657 11.3240.00 OATOM263 CB ALA A38 19.026 29.426 11.5660.00 CATOM264 NTHR A39 16.553 28.151 9.8000.00 NATOM265 CA THR A39 15.281 27.432 9.8420.00 CATOM266 CB THR A39 14.779 27.066 8.4250.00 CATOM267 OG1 THR A39 15.582 26.012 7.8870.00 OATOM268 CG2 THR A39 14.857 28.277 7.5040.00 CATOM269 CTHR A39 15.433 26.157 10.6640.00 CATOM270 OTHR A39 16.533 25.637 10.8210.00 OATOM271 NTHR A40 14.328 25.649 11.1860.00 NATOM272 CA THR A40 14.382 24.437 11.9900.00 CATOM273 CB THR A40 14.143 24.753 13.4730.00 CATOM274 OG1 THR A40 12.807 25.242 13.6360.00 OATOM275 CG2 THR A40 15.124 25.799 13.9620.00 CATOM276 CTHR A40 13.332 23.421 11.5810.00 CATOM277 OTHR A40 12.345 23.760 10.9270.00 OATOM278 NALA A41 13.546 22.178 11.9940.00 NATOM279 CA ALA A41 12.629 21.084 11.6980.00 CATOM280 CALA A41 12.368 20.368 13.0300.00 CATOM281 OALA A41 13.211 20.394 13.9360.00 OATOM282 CB ALA A41 13.247 20.133 10.6840.00 CATOM283 NASN A42 11.206 19.734 13.1490.00 NATOM284 CA ASN A42 10.839 19.022 14.3700.00 CATOM285 CASN A42 11.037 19.959 15.5550.00 CATOM286 OASN A42 11.861 19.693 16.4240.00 OATOM287 CB ASN A42 11.720 17.780 14.5840.00 CATOM288 CG ASN A42 11.686 16.812 13.4080.00 CATOM289 OD1 ASN A42 10.687 16.713 12.6950.00 OATOM290 ND2 ASN A42 12.779 16.076 13.2170.00 NATOM291 NPRO A43 10.258 21.046 15.6350.00 NATOM292 CA PRO A439.206 21.493 14.7180.00 CATOM293 CB PRO A438.274 22.244 15.6490.00 CATOM294 CPRO A439.697 22.416 13.6120.00 CATOM295 OPRO A43 10.816 22.920 13.6600.00 OATOM296 CD PRO A43 10.319 21.934 16.8090.00 CATOM297 CG PRO A439.278 23.008 16.4800.00 CATOM298 NTHR A448.841 22.652 12.6210.00 NATOM299 CA THR A449.208 23.533 11.5220.00 CATOM300 CB THR A448.225 23.421 10.3450.00 CATOM301 CTHR A449.142 24.934 12.1100.00 CATOM302 OTHR A448.162 25.293 12.7720.00 OATOM303 OG1 THR A448.437 22.176 9.6710.00 OATOM304 CG2 THR A448.423 24.566 9.3660.00 CATOM305 NGLY A45 10.196 25.710 11.8930.00 NATOM306 CA GLY A45 10.233 27.057 12.4250.00 CATOM307 CGLY A45 11.421 27.851 11.9200.00 CATOM308 OGLY A45 12.226 27.355 11.1200.00 OATOM309 NTHR A46 11.537 29.084 12.4010.00 NATOM310 CA THR A46 12.615 29.979 11.9980.00 CATOM311 CB THR A46 12.134 30.919 10.8670.00 CATOM312 OG1 THR A46 11.720 30.132 9.7410.00 OATOM313 CG2 THR A46 13.246 31.872 10.4380.00 CATOM314 CTHR A46 13.097 30.831 13.1710.00 CATOM315 OTHR A46 12.287 31.407 13.9090.00 OATOM316 NPHE A47 14.412 30.903 13.3580.00 NATOM317 CA PHE A47 14.954 31.702 14.4510.00 CATOM318 CB PHE A47 16.478 31.585 14.5300.00 CATOM319 CG PHE A47 16.959 30.410 15.3390.00 C
ATOM320 CD2 PHE A47 17.538 30.606 16.5900.00 CATOM321 CD1 PHE A47 16.843 29.115 14.8570.00 CATOM322 CE2 PHE A47 17.996 29.532 17.3450.00 CATOM323 CE1 PHE A47 17.300 28.030 15.6080.00 CATOM324 CZ PHE A47 17.878 28.241 16.8550.00 CATOM325 CPHE A47 14.567 33.160 14.2260.00 CATOM326 OPHE A47 14.665 33.686 13.1110.00 OATOM327 NALA A48 14.102 33.795 15.2910.00 NATOM328 CA ALA A48 13.690 35.184 15.2450.00 CATOM329 CB ALA A48 12.161 35.280 15.1330.00 CATOM330 CALA A48 14.174 35.828 16.5320.00 CATOM331 OALA A48 13.389 36.116 17.4330.00 OATOM332 NGLY A49 15.481 36.038 16.6090.00 NATOM333 CA GLY A49 16.072 36.635 17.7910.00 CATOM334 CGLY A49 17.068 35.674 18.4150.00 CATOM335 OGLY A49 16.698 34.589 18.8670.00 OATOM336 NSER A50 18.333 36.073 18.4380.00 NATOM337 CA SER A50 19.387 35.248 18.9990.00 CATOM338 CB SER A50 19.976 34.360 17.8990.00 CATOM339 OG SER A50 21.019 33.552 18.4060.00 OATOM340 CSER A50 20.484 36.112 19.6330.00 CATOM341 OSER A50 20.999 37.045 19.0120.00 OATOM342 NSER A51 20.832 35.794 20.8770.00 NATOM343 CA SER A51 21.860 36.529 21.6030.00 CATOM344 CB SER A51 21.228 37.337 22.7410.00 CATOM345 OG SER A51 22.179 38.189 23.3590.00 OATOM346 CSER A51 22.938 35.596 22.1620.00 CATOM347 OSER A51 22.700 34.819 23.0890.00 OATOM348 NPHE A52 24.127 35.692 21.5790.00 NATOM349 CA PHE A52 25.277 34.889 21.9700.00 CATOM350 CB PHE A52 25.031 33.414 21.6430.00 CATOM351 CG PHE A52 26.204 32.518 21.9410.00 CATOM352 CD1 PHE A52 26.485 32.124 23.2380.00 CATOM353 CD2 PHE A52 27.034 32.081 20.9220.00 CATOM354 CE1 PHE A52 27.575 31.312 23.5160.00 CATOM355 CE2 PHE A52 28.131 31.266 21.1930.00 CATOM356 CZ PHE A52 28.400 30.883 22.4920.00 CATOM357 CPHE A52 26.468 35.390 21.1670.00 CATOM358 OPHE A52 26.370 35.589 19.9600.00 OATOM359 NPRO A53 27.612 35.603 21.8270.00 NATOM360 CD PRO A53 28.893 35.756 21.1100.00 CATOM361 CA PRO A53 27.831 35.405 23.2660.00 CATOM362 CB PRO A53 29.351 35.249 23.3610.00 CATOM363 CG PRO A53 29.851 36.088 22.2230.00 CATOM364 CPRO A53 27.268 36.543 24.1320.00 CATOM365 OPRO A53 26.346 37.235 23.7130.00 OATOM366 NGLY A54 27.814 36.744 25.3280.00 NATOM367 CA GLY A54 27.288 37.777 26.2110.00 CATOM368 CGLY A54 26.143 37.138 26.9800.00 CATOM369 OGLY A54 26.210 36.964 28.1970.00 OATOM370 NASN A55 25.079 36.806 26.2540.00 NATOM371 CA ASN A55 23.922 36.103 26.8100.00 CATOM372 CB ASN A55 22.579 36.740 26.4040.00 CATOM373 CG ASN A55 22.516 38.240 26.6410.00 CATOM374 OD1 ASN A55 22.161 39.005 25.7340.00 OATOM375 ND2 ASN A55 22.833 38.667 27.8570.00 NATOM376 CASN A55 24.011 34.788 26.0370.00 CATOM377 OASN A55 24.998 34.538 25.3330.00 OATOM378 NASP A56 22.980 33.958 26.1710.00 NATOM379 CA ASP A56 22.917 32.682 25.4730.00 CATOM380 CB ASP A56 23.774 31.595 26.1190.00 CATOM381 CG ASP A56 23.987 30.395 25.1790.00 CATOM382 OD1 ASP A56 24.631 29.408 25.5850.00 OATOM383 OD2 ASP A56 23.504 30.443 24.0240.00 O1-ATOM384 CASP A56 21.470 32.221 25.3790.00 CATOM385 OASP A56 21.078 31.195 25.9300.00 OATOM386 NTYR A57 20.672 33.008 24.6710.00 NATOM387 CA TYR A57 19.266 32.693 24.4850.00 CATOM388 CB TYR A57 18.396 33.484 25.4630.00 CATOM389 CG TYR A57 18.527 34.993 25.3740.00 CATOM390 CD1 TYR A57 19.153 35.711 26.3900.00 CATOM391 CE1 TYR A57 19.231 37.092 26.3520.00 CATOM392 CD2 TYR A57 17.986 35.706 24.3030.00 CATOM393 CE2 TYR A57 18.060 37.093 24.2550.00 CATOM394 CZ TYR A57 18.682 37.781 25.2890.00 CATOM395 OH TYR A57 18.732 39.165 25.2860.00 OATOM396 CTYR A57 18.820 32.998 23.0620.00 CATOM397 OTYR A57 19.438 33.800 22.3550.00 O
ATOM398 NALA A58 17.742 32.344 22.6520.00 NATOM399 CA ALA A58 17.187 32.532 21.3230.00 CATOM400 CB ALA A58 17.899 31.645 20.3120.00 CATOM401 CALA A58 15.706 32.191 21.3600.00 CATOM402 OALA A58 15.228 31.521 22.2840.00 OATOM403 NPHE A59 14.989 32.683 20.3590.00 NATOM404 CA PHE A59 13.564 32.453 20.2250.00 CATOM405 CB PHE A59 12.762 33.735 20.4380.00 CATOM406 CG PHE A59 11.333 33.629 19.9700.00 CATOM407 CD2 PHE A59 10.859 34.437 18.9470.00 CATOM408 CD1 PHE A59 10.475 32.698 20.5310.00 CATOM409 CE2 PHE A599.553 34.316 18.4910.00 CATOM410 CE1 PHE A599.175 32.573 20.0840.00 CATOM411 CZ PHE A598.712 33.382 19.0630.00 CATOM412 CPHE A59 13.294 31.942 18.8160.00 CATOM413 OPHE A59 13.693 32.562 17.8200.00 OATOM414 NVAL A60 12.616 30.809 18.7310.00 NATOM415 CA VAL A60 12.308 30.253 17.4340.00 CATOM416 CB VAL A60 12.702 28.776 17.3400.00 CATOM417 CG1 VAL A60 12.503 28.279 15.9080.00 CATOM418 CG2 VAL A60 14.147 28.593 17.7960.00 CATOM419 CVAL A60 10.816 30.361 17.2360.00 CATOM420 OVAL A60 10.043 29.927 18.0870.00 OATOM421 NARG A61 10.406 30.960 16.1260.00 NATOM422 CA ARG A618.987 31.098 15.8510.00 CATOM423 CB ARG A618.704 32.313 14.9620.00 CATOM424 CG ARG A617.255 32.374 14.4800.00 CATOM425 CD ARG A617.019 33.543 13.5210.00 CATOM426 NE ARG A615.615 33.660 13.1180.00 N1+ATOM427 CZ ARG A614.989 32.815 12.3030.00 CATOM428 NH2 ARG A613.711 33.007 12.0040.00 NATOM429 NH1 ARG A615.636 31.777 11.7870.00 NATOM430 CARG A618.509 29.847 15.1280.00 CATOM431 OARG A619.193 29.338 14.2380.00 OATOM432 NTHR A627.338 29.357 15.5270.00 NATOM433 CA THR A626.740 28.170 14.9230.00 CATOM434 CB THR A626.514 27.046 15.9560.00 CATOM435 OG1 THR A625.808 27.570 17.0890.00 OATOM436 CG2 THR A627.845 26.460 16.3960.00 CATOM437 CTHR A625.391 28.597 14.3520.00 CATOM438 OTHR A624.857 29.645 14.7240.00 OATOM439 NGLY A634.837 27.791 13.4550.00 NATOM440 CA GLY A633.562 28.146 12.8590.00 CATOM441 CGLY A632.522 27.046 12.8800.00 CATOM442 OGLY A632.375 26.326 13.8730.00 OATOM443 NALA A641.806 26.909 11.7670.00 NATOM444 CA ALA A640.744 25.916 11.6430.00 CATOM445 CALA A641.213 24.496 11.8950.00 CATOM446 OALA A642.370 24.154 11.6510.00 OATOM447 CB ALA A640.111 26.009 10.2680.00 CATOM448 NGLY A650.291 23.672 12.3810.00 NATOM449 CA GLY A650.596 22.281 12.6570.00 CATOM450 CGLY A651.469 22.050 13.8770.00 CATOM451 OGLY A651.797 20.908 14.1990.00 OATOM452 NVAL A661.837 23.119 14.5720.00 NATOM453 CA VAL A662.699 22.976 15.7360.00 CATOM454 CB VAL A663.946 23.854 15.5950.00 CATOM455 CVAL A662.031 23.307 17.0630.00 CATOM456 OVAL A661.737 24.467 17.3370.00 OATOM457 CG1 VAL A664.832 23.683 16.8180.00 CATOM458 CG2 VAL A664.698 23.482 14.3240.00 CATOM459 NASN A671.806 22.283 17.8820.00 NATOM460 CA ASN A671.176 22.454 19.1850.00 CATOM461 CB ASN A670.403 21.188 19.5640.00 CATOM462 CASN A672.240 22.745 20.2370.00 CATOM463 OASN A673.120 21.920 20.4910.00 OATOM464 CG ASN A67 -0.405 20.634 18.4040.00 CATOM465 OD1 ASN A67 -1.160 21.361 17.7500.00 OATOM466 ND2 ASN A67 -0.253 19.340 18.1400.00 NATOM467 NLEU A682.148 23.923 20.8450.00 NATOM468 CA LEU A683.087 24.366 21.8760.00 CATOM469 CB LEU A683.279 25.883 21.7590.00 CATOM470 CLEU A682.571 23.996 23.2730.00 CATOM471 OLEU A681.620 24.597 23.7700.00 OATOM472 CG LEU A683.688 26.430 20.3800.00 CATOM473 CD1 LEU A683.724 27.950 20.4060.00 CATOM474 CD2 LEU A685.051 25.888 19.9870.00 CATOM475 NLEU A693.218 23.027 23.9170.00 N
ATOM476 CA LEU A692.803 22.584 25.2500.00 CATOM477 CB LEU A692.769 21.052 25.2860.00 CATOM478 CG LEU A692.045 20.369 24.1160.00 CATOM479 CD1 LEU A692.109 18.857 24.2740.00 CATOM480 CD2 LEU A690.604 20.841 24.0500.00 CATOM481 CLEU A693.612 23.078 26.4490.00 CATOM482 OLEU A694.835 23.216 26.3940.00 OATOM483 NALA A702.907 23.332 27.5440.00 NATOM484 CA ALA A703.534 23.796 28.7730.00 CATOM485 CB ALA A702.507 24.496 29.6460.00 CATOM486 CALA A704.048 22.539 29.4730.00 CATOM487 OALA A703.712 22.273 30.6180.00 OATOM488 NGLN A714.862 21.763 28.7700.00 NATOM489 CA GLN A715.408 20.536 29.3250.00 CATOM490 CB GLN A714.618 19.333 28.8080.00 CATOM491 CG GLN A713.169 19.299 29.2550.00 CATOM492 CD GLN A712.407 18.116 28.6920.00 CATOM493 OE1 GLN A711.460 17.634 29.3080.00 OATOM494 NE2 GLN A712.809 17.646 27.5150.00 NATOM495 CGLN A716.869 20.310 28.9980.00 CATOM496 OGLN A717.395 20.825 28.0090.00 OATOM497 NVAL A727.520 19.529 29.8500.00 NATOM498 CA VAL A728.924 19.199 29.6760.00 CATOM499 CB VAL A729.809 19.799 30.7770.00 CATOM500 CG1 VAL A72 11.240 19.342 30.5800.00 CATOM501 CG2 VAL A729.726 21.309 30.7580.00 CATOM502 CVAL A728.997 17.685 29.7720.00 CATOM503 OVAL A728.419 17.086 30.6800.00 OATOM504 NASN A739.699 17.075 28.8240.00 NATOM505 CA ASN A739.867 15.629 28.7710.00 CATOM506 CB ASN A73 10.543 15.250 27.4520.00 CATOM507 CG ASN A73 10.513 13.756 27.1820.00 CATOM508 OD1 ASN A73 10.470 12.947 28.1060.00 OATOM509 ND2 ASN A73 10.551 13.387 25.9060.00 NATOM510 CASN A73 10.735 15.146 29.9310.00 CATOM511 OASN A73 11.843 15.651 30.1230.00 OATOM512 NASN A74 10.244 14.175 30.7030.00 NATOM513 CA ASN A74 11.028 13.663 31.8230.00 CATOM514 CB ASN A74 10.151 13.368 33.0490.00 CATOM515 CG ASN A749.191 12.217 32.8300.00 CATOM516 OD1 ASN A749.486 11.265 32.1080.00 OATOM517 ND2 ASN A748.032 12.291 33.4770.00 NATOM518 CASN A74 11.791 12.408 31.4170.00 CATOM519 OASN A74 12.332 11.695 32.2660.00 OATOM520 NTYR A75 11.830 12.156 30.1120.00 NATOM521 CA TYR A75 12.514 11.005 29.5280.00 CATOM522 CB TYR A75 14.008 11.321 29.3540.00 CATOM523 CG TYR A75 14.268 12.239 28.1810.00 CATOM524 CD1 TYR A75 14.228 11.756 26.8730.00 CATOM525 CE1 TYR A75 14.371 12.597 25.7920.00 CATOM526 CD2 TYR A75 14.466 13.599 28.3700.00 CATOM527 CE2 TYR A75 14.608 14.451 27.2900.00 CATOM528 CZ TYR A75 14.557 13.945 26.0050.00 CATOM529 OH TYR A75 14.679 14.796 24.9310.00 OATOM530 CTYR A75 12.326 9.680 30.2600.00 CATOM531 OTYR A75 13.253 8.875 30.3780.00 OATOM532 NSER A76 11.112 9.464 30.7470.00 NATOM533 CA SER A76 10.773 8.244 31.4580.00 CATOM534 CB SER A76 10.737 8.471 32.9680.00 CATOM535 OG SER A76 12.053 8.566 33.4750.00 OATOM536 CSER A769.407 7.816 30.9630.00 CATOM537 OSER A768.784 6.905 31.5120.00 OATOM538 NGLY A778.960 8.483 29.9050.00 NATOM539 CA GLY A777.671 8.180 29.3200.00 CATOM540 CGLY A776.610 9.168 29.7550.00 CATOM541 OGLY A775.464 9.090 29.3110.00 OATOM542 NGLY A786.992 10.102 30.6220.00 NATOM543 CA GLY A786.043 11.087 31.1010.00 CATOM544 CGLY A786.492 12.522 30.8870.00 CATOM545 OGLY A787.545 12.775 30.2930.00 OATOM546 NARG A795.687 13.462 31.3750.00 NATOM547 CA ARG A795.986 14.879 31.2400.00 CATOM548 CB ARG A795.099 15.537 30.1660.00 CATOM549 CG ARG A795.396 15.117 28.7320.00 CATOM550 CD ARG A794.770 13.772 28.4320.00 CATOM551 NE ARG A794.975 13.348 27.0480.00 N1+ATOM552 CZ ARG A796.081 12.764 26.5930.00 CATOM553 NH1 ARG A797.095 12.529 27.4120.00 N
ATOM554 NH2 ARG A796.165 12.399 25.3190.00 NATOM555 CARG A795.797 15.627 32.5500.00 CATOM556 OARG A795.129 15.149 33.4660.00 OATOM557 NVAL A806.398 16.809 32.6200.00 NATOM558 CA VAL A806.317 17.656 33.7940.00 CATOM559 CB VAL A807.714 17.891 34.3890.00 CATOM560 CG1 VAL A807.630 18.858 35.5460.00 CATOM561 CG2 VAL A808.300 16.566 34.8530.00 CATOM562 CVAL A805.682 18.989 33.3980.00 CATOM563 OVAL A806.182 19.701 32.5170.00 OATOM564 NGLN A814.561 19.307 34.0360.00 NATOM565 CA GLN A813.846 20.546 33.7600.00 CATOM566 CB GLN A812.518 20.579 34.5270.00 CATOM567 CG GLN A811.415 19.722 33.9300.00 CATOM568 CD GLN A811.138 20.067 32.4730.00 CATOM569 OE1 GLN A811.086 21.239 32.1010.00 OATOM570 NE2 GLN A810.950 19.044 31.6440.00 NATOM571 CGLN A814.650 21.785 34.1260.00 CATOM572 OGLN A815.333 21.817 35.1540.00 OATOM573 NVAL A824.578 22.798 33.2720.00 NATOM574 CA VAL A825.288 24.047 33.5100.00 CATOM575 CB VAL A825.925 24.610 32.2190.00 CATOM576 CG1 VAL A826.695 25.885 32.5350.00 CATOM577 CG2 VAL A826.841 23.580 31.6050.00 CATOM578 CVAL A824.222 25.022 34.0030.00 CATOM579 OVAL A823.399 25.500 33.2210.00 OATOM580 NALA A834.242 25.305 35.3020.00 NATOM581 CA ALA A833.277 26.213 35.9190.00 CATOM582 CB ALA A833.009 25.768 37.3420.00 CATOM583 CALA A833.677 27.688 35.9090.00 CATOM584 OALA A832.820 28.571 35.8860.00 OATOM585 NGLY A844.975 27.960 35.9340.00 NATOM586 CA GLY A845.413 29.339 35.9300.00 CATOM587 CGLY A846.913 29.458 35.7900.00 CATOM588 OGLY A847.601 28.463 35.5360.00 OATOM589 NHIS A857.426 30.673 35.9600.00 NATOM590 CA HIS A858.856 30.903 35.8410.00 CATOM591 CB HIS A859.154 31.684 34.5570.00 CATOM592 CHIS A859.476 31.610 37.0370.00 CATOM593 OHIS A85 10.275 32.530 36.8660.00 OATOM594 CG HIS A858.328 32.920 34.3910.00 CATOM595 ND1 HIS A858.864 34.188 34.4550.00 NATOM596 CD2 HIS A857.006 33.083 34.1470.00 CATOM597 NE2 HIS A856.772 34.434 34.0670.00 NATOM598 CE1 HIS A857.909 35.078 34.2560.00 CATOM599 NTHR A869.115 31.163 38.2430.00 NATOM600 CA THR A869.631 31.738 39.4910.00 CATOM601 CB THR A868.743 31.356 40.6830.00 CATOM602 CTHR A86 11.055 31.244 39.7790.00 CATOM603 OTHR A86 11.289 30.047 39.9080.00 OATOM604 OG1 THR A867.417 31.837 40.4560.00 OATOM605 CG2 THR A869.283 31.957 41.9710.00 CATOM606 NALA A87 11.996 32.175 39.8940.00 NATOM607 CA ALA A87 13.391 31.830 40.1600.00 CATOM608 CALA A87 13.621 31.173 41.5190.00 CATOM609 OALA A87 13.145 31.649 42.5460.00 OATOM610 CB ALA A87 14.265 33.077 40.0320.00 CATOM611 NALA A88 14.360 30.074 41.5170.00 NATOM612 CA ALA A88 14.653 29.360 42.7470.00 CATOM613 CALA A88 16.009 29.831 43.2630.00 CATOM614 OALA A88 16.904 30.156 42.4820.00 OATOM615 CB ALA A88 14.662 27.855 42.4900.00 CATOM616 NPRO A89 16.173 29.877 44.5920.00 NATOM617 CA PRO A89 17.404 30.310 45.2600.00 CATOM618 CB PRO A89 16.939 30.560 46.6900.00 CATOM619 CPRO A89 18.545 29.304 45.2040.00 CATOM620 OPRO A89 18.323 28.106 45.0070.00 OATOM621 CD PRO A89 15.136 29.511 45.5760.00 CATOM622 CG PRO A89 15.917 29.473 46.8860.00 CATOM623 NVAL A90 19.767 29.809 45.3610.00 NATOM624 CA VAL A90 20.960 28.973 45.3430.00 CATOM625 CB VAL A90 22.197 29.747 45.8730.00 CATOM626 CG1 VAL A90 23.347 28.779 46.1620.00 CATOM627 CG2 VAL A90 22.623 30.803 44.8580.00 CATOM628 CVAL A90 20.680 27.810 46.2790.00 CATOM629 OVAL A90 19.988 27.976 47.2870.00 OATOM630 NGLY A91 21.205 26.635 45.9540.00 NATOM631 CA GLY A91 20.976 25.482 46.8060.00 C
ATOM632 CGLY A91 19.734 24.699 46.4250.00 CATOM633 OGLY A91 19.576 23.550 46.8360.00 OATOM634 NSER A92 18.853 25.314 45.6420.00 NATOM635 CA SER A92 17.620 24.659 45.2100.00 CATOM636 CB SER A92 16.720 25.634 44.4380.00 CATOM637 OG SER A92 16.414 26.792 45.1960.00 OATOM638 CSER A92 17.929 23.479 44.3060.00 CATOM639 OSER A92 18.881 23.512 43.5210.00 OATOM640 NALA A93 17.117 22.435 44.4170.00 NATOM641 CA ALA A93 17.301 21.247 43.6000.00 CATOM642 CB ALA A93 16.576 20.054 44.2310.00 CATOM643 CALA A93 16.715 21.559 42.2260.00 CATOM644 OALA A93 15.669 22.202 42.1260.00 OATOM645 NVAL A94 17.396 21.125 41.1700.00 NATOM646 CA VAL A94 16.916 21.371 39.8140.00 CATOM647 CB VAL A94 17.544 22.639 39.2120.00 CATOM648 CG1 VAL A94 17.072 23.872 39.9710.00 CATOM649 CG2 VAL A94 19.050 22.534 39.2410.00 CATOM650 CVAL A94 17.204 20.211 38.8670.00 CATOM651 OVAL A94 18.143 19.432 39.0710.00 OATOM652 NCYS A95 16.378 20.090 37.8340.00 NATOM653 CA CYS A95 16.548 19.030 36.8510.00 CATOM654 CB CYS A95 15.428 17.983 36.9420.00 CATOM655 SG CYS A95 15.344 17.009 38.4700.00 SATOM656 CCYS A95 16.552 19.647 35.4640.00 CATOM657 OCYS A95 15.820 20.598 35.1940.00 OATOM658 NARG A96 17.391 19.092 34.5980.00 NATOM659 CA ARG A96 17.531 19.551 33.2280.00 CATOM660 CB ARG A96 19.003 19.840 32.9350.00 CATOM661 CG ARG A96 19.300 20.110 31.4650.00 CATOM662 CD ARG A96 20.778 19.955 31.1510.00 CATOM663 NE ARG A96 21.272 18.625 31.4990.00 N1+ATOM664 CZ ARG A96 20.875 17.493 30.9270.00 CATOM665 NH1 ARG A96 19.967 17.507 29.9600.00 NATOM666 NH2 ARG A96 21.377 16.341 31.3410.00 NATOM667 CARG A96 17.027 18.487 32.2580.00 CATOM668 OARG A96 17.160 17.288 32.5090.00 OATOM669 NSER A97 16.458 18.924 31.1420.00 NATOM670 CA SER A97 15.950 17.983 30.1570.00 CATOM671 CB SER A97 14.418 18.054 30.0820.00 CATOM672 OG SER A97 13.913 17.133 29.1340.00 OATOM673 CSER A97 16.564 18.272 28.7970.00 CATOM674 OSER A97 16.429 19.378 28.2670.00 OATOM675 NGLY A98 17.246 17.265 28.2510.00 NATOM676 CA GLY A98 17.900 17.390 26.9600.00 CATOM677 CGLY A98 17.767 16.133 26.1150.00 CATOM678 OGLY A98 17.481 15.042 26.6240.00 OATOM679 NSER A99 17.997 16.290 24.8140.00 NATOM680 CA SER A99 17.865 15.196 23.8640.00 CATOM681 CB SER A99 17.547 15.749 22.4780.00 CATOM682 OG SER A99 18.663 16.457 21.9680.00 OATOM683 CSER A99 19.067 14.279 23.7400.00 CATOM684 OSER A99 18.992 13.275 23.0390.00 OATOM685 NTHR A 100 20.174 14.612 24.3960.00 NATOM686 CA THR A 100 21.358 13.766 24.3070.00 CATOM687 CB THR A 100 22.641 14.602 24.1250.00 CATOM688 OG1 THR A 100 22.516 15.417 22.9530.00 OATOM689 CG2 THR A 100 23.860 13.690 23.9670.00 CATOM690 CTHR A 100 21.531 12.872 25.5240.00 CATOM691 OTHR A 100 21.890 11.697 25.3880.00 OATOM692 NTHR A 101 21.269 13.422 26.7070.00 NATOM693 CA THR A 101 21.401 12.662 27.9500.00 CATOM694 CB THR A 101 22.375 13.340 28.9360.00 CATOM695 OG1 THR A 101 21.791 14.549 29.4410.00 OATOM696 CG2 THR A 101 23.692 13.642 28.2440.00 CATOM697 CTHR A 101 20.083 12.442 28.6770.00 CATOM698 OTHR A 101 19.990 11.581 29.5480.00 OATOM699 NGLY A 102 19.068 13.227 28.3420.00 NATOM700 CA GLY A 102 17.784 13.044 28.9850.00 CATOM701 CGLY A 102 17.522 13.868 30.2310.00 CATOM702 OGLY A 102 17.759 15.075 30.2450.00 OATOM703 NTRP A 103 17.023 13.207 31.2740.00 NATOM704 CA TRP A 103 16.681 13.847 32.5400.00 CATOM705 CB TRP A 103 15.339 13.286 33.0270.00 CATOM706 CG TRP A 103 14.790 13.876 34.3110.00 CATOM707 CD2 TRP A 103 13.889 14.989 34.4340.00 CATOM708 CE2 TRP A 103 13.601 15.141 35.8070.00 CATOM709 CE3 TRP A 103 13.293 15.858 33.5170.00 C
ATOM710 CD1 TRP A 103 15.010 13.424 35.5810.00 CATOM711 NE1 TRP A 103 14.295 14.179 36.4830.00 NATOM712 CZ2 TRP A 103 12.749 16.138 36.2840.00 CATOM713 CZ3 TRP A 103 12.444 16.848 33.9910.00 CATOM714 CH2 TRP A 103 12.178 16.977 35.3630.00 CATOM715 CTRP A 103 17.776 13.652 33.5930.00 CATOM716 OTRP A 103 18.112 12.526 33.9550.00 OATOM717 NHIS A 104 18.333 14.762 34.0740.00 NATOM718 CA HIS A 104 19.391 14.731 35.0810.00 CATOM719 CB HIS A 104 20.755 14.780 34.4050.00 CATOM720 CG HIS A 104 21.064 13.554 33.6190.00 CATOM721 CD2 HIS A 104 20.741 13.202 32.3520.00 CATOM722 ND1 HIS A 104 21.704 12.465 34.1670.00 NATOM723 CE1 HIS A 104 21.759 11.496 33.2730.00 CATOM724 NE2 HIS A 104 21.181 11.917 32.1620.00 NATOM725 CHIS A 104 19.229 15.894 36.0380.00 CATOM726 OHIS A 104 18.859 16.995 35.6360.00 OATOM727 NCYS A 105 19.512 15.647 37.3090.00 NATOM728 CA CYS A 105 19.373 16.692 38.3030.00 CATOM729 CB CYS A 105 18.223 16.317 39.2340.00 CATOM730 SG CYS A 105 16.804 15.602 38.3420.00 SATOM731 CCYS A 105 20.635 17.014 39.0990.00 CATOM732 OCYS A 105 21.665 16.361 38.9640.00 OATOM733 NGLY A 106 20.533 18.046 39.9230.00 NATOM734 CA GLY A 106 21.642 18.487 40.7390.00 CATOM735 CGLY A 106 21.125 19.693 41.4900.00 CATOM736 OGLY A 106 19.916 19.805 41.7070.00 OATOM737 NTHR A 107 22.011 20.598 41.8880.00 NATOM738 CA THR A 107 21.572 21.784 42.6030.00 CATOM739 CB THR A 107 21.865 21.681 44.1170.00 CATOM740 OG1 THR A 107 23.250 21.386 44.3280.00 OATOM741 CG2 THR A 107 21.021 20.583 44.7460.00 CATOM742 CTHR A 107 22.215 23.046 42.0580.00 CATOM743 OTHR A 107 23.238 23.001 41.3720.00 OATOM744 NILE A 108 21.588 24.178 42.3440.00 NATOM745 CA ILE A 108 22.103 25.452 41.8860.00 CATOM746 CB ILE A 108 21.039 26.550 41.9820.00 CATOM747 CG2 ILE A 108 21.651 27.904 41.6140.00 CATOM748 CG1 ILE A 108 19.850 26.200 41.0910.00 CATOM749 CD1 ILE A 108 18.691 27.166 41.2280.00 CATOM750 CILE A 108 23.216 25.803 42.8520.00 CATOM751 OILE A 108 23.001 25.774 44.0650.00 OATOM752 NTHR A 109 24.399 26.118 42.3310.00 NATOM753 CA THR A 109 25.516 26.472 43.1970.00 CATOM754 CB THR A 109 26.787 25.662 42.8490.00 CATOM755 OG1 THR A 109 27.055 25.748 41.4430.00 OATOM756 CG2 THR A 109 26.599 24.201 43.2440.00 CATOM757 CTHR A 109 25.827 27.965 43.1280.00 CATOM758 OTHR A 109 26.599 28.481 43.9280.00 OATOM759 NALA A 110 25.214 28.664 42.1810.00 NATOM760 CA ALA A 110 25.457 30.090 42.0530.00 CATOM761 CB ALA A 110 26.949 30.348 41.8460.00 CATOM762 CALA A 110 24.650 30.767 40.9460.00 CATOM763 OALA A 110 24.191 30.132 40.0010.00 OATOM764 NLEU A 111 24.491 32.078 41.0920.00 NATOM765 CA LEU A 111 23.755 32.893 40.1450.00 CATOM766 CB LEU A 111 22.550 33.530 40.8440.00 CATOM767 CG LEU A 111 21.547 32.545 41.4650.00 CATOM768 CD1 LEU A 111 20.462 33.315 42.2270.00 CATOM769 CD2 LEU A 111 20.925 31.681 40.3710.00 CATOM770 CLEU A 111 24.688 33.970 39.5930.00 CATOM771 OLEU A 111 25.661 34.363 40.2430.00 OATOM772 NASN A 112 24.380 34.439 38.3900.00 NATOM773 CA ASN A 112 25.171 35.468 37.7190.00 CATOM774 CB ASN A 112 25.123 36.788 38.4900.00 CATOM775 CG ASN A 112 23.725 37.149 38.9300.00 CATOM776 OD1 ASN A 112 23.244 36.663 39.9500.00 OATOM777 ND2 ASN A 112 23.057 37.994 38.1550.00 NATOM778 CASN A 112 26.629 35.074 37.5070.00 CATOM779 OASN A 112 27.526 35.891 37.6800.00 OATOM780 NSER A 113 26.870 33.820 37.1440.00 NATOM781 CA SER A 113 28.237 33.383 36.9160.00 CATOM782 CB SER A 113 28.375 31.875 37.1260.00 CATOM783 OG SER A 113 28.149 31.522 38.4790.00 OATOM784 CSER A 113 28.604 33.726 35.4800.00 CATOM785 OSER A 113 27.733 34.045 34.6630.00 OATOM786 NSER A 114 29.899 33.691 35.1920.00 NATOM787 CA SER A 114 30.403 33.985 33.8590.00 C
ATOM788 CB SER A 114 31.288 35.234 33.8470.00 CATOM789 OG SER A 114 30.524 36.417 33.9620.00 OATOM790 CSER A 114 31.237 32.795 33.4400.00 CATOM791 OSER A 114 31.708 32.027 34.2770.00 OATOM792 NVAL A 115 31.400 32.631 32.1380.00 NATOM793 CA VAL A 115 32.185 31.535 31.6110.00 CATOM794 CB VAL A 115 31.342 30.241 31.4270.00 CATOM795 CG1 VAL A 115 30.850 29.751 32.7720.00 CATOM796 CG2 VAL A 115 30.174 30.492 30.4850.00 CATOM797 CVAL A 115 32.678 32.010 30.2660.00 CATOM798 OVAL A 115 32.121 32.945 29.6910.00 OATOM799 NTHR A 116 33.735 31.387 29.7680.00 NATOM800 CA THR A 116 34.268 31.779 28.4820.00 CATOM801 CB THR A 116 35.671 32.359 28.6340.00 CATOM802 OG1 THR A 116 35.602 33.538 29.4460.00 OATOM803 CG2 THR A 116 36.247 32.726 27.2770.00 CATOM804 CTHR A 116 34.278 30.589 27.5350.00 CATOM805 OTHR A 116 34.931 29.573 27.7870.00 OATOM806 NTYR A 117 33.512 30.721 26.4590.00 NATOM807 CA TYR A 117 33.397 29.691 25.4430.00 CATOM808 CB TYR A 117 31.972 29.664 24.8850.00 CATOM809 CG TYR A 117 30.892 29.244 25.8740.00 CATOM810 CD1 TYR A 117 29.803 30.072 26.1340.00 CATOM811 CE1 TYR A 117 28.780 29.675 26.9810.00 CATOM812 CD2 TYR A 117 30.930 27.998 26.4990.00 CATOM813 CE2 TYR A 117 29.908 27.589 27.3530.00 CATOM814 CZ TYR A 117 28.834 28.432 27.5900.00 CATOM815 OH TYR A 117 27.814 28.036 28.4310.00 OATOM816 CTYR A 117 34.368 30.064 24.3330.00 CATOM817 OTYR A 117 34.922 31.161 24.3290.00 OATOM818 NPRO A 118 34.609 29.151 23.3840.00 NATOM819 CA PRO A 118 35.541 29.528 22.3180.00 CATOM820 CB PRO A 118 35.655 28.249 21.4720.00 CATOM821 CPRO A 118 35.080 30.751 21.5200.00 CATOM822 OPRO A 118 35.875 31.369 20.8050.00 OATOM823 CD PRO A 118 34.313 27.711 23.3470.00 CATOM824 CG PRO A 118 34.472 27.405 21.8900.00 CATOM825 NGLU A 119 33.804 31.109 21.6510.00 NATOM826 CA GLU A 119 33.266 32.265 20.9350.00 CATOM827 CB GLU A 119 31.785 32.079 20.6120.00 CATOM828 CGLU A 119 33.416 33.514 21.7890.00 CATOM829 OGLU A 119 33.498 34.634 21.2750.00 OATOM830 CG GLU A 119 31.470 30.985 19.6110.00 CATOM831 CD GLU A 119 31.686 29.606 20.1790.00 CATOM832 OE1 GLU A 119 31.593 29.460 21.4150.00 O1-ATOM833 OE2 GLU A 119 31.932 28.667 19.3930.00 OATOM834 NGLY A 120 33.437 33.315 23.1020.00 NATOM835 CA GLY A 120 33.575 34.438 24.0020.00 CATOM836 CGLY A 120 32.984 34.167 25.3680.00 CATOM837 OGLY A 120 32.714 33.020 25.7270.00 OATOM838 NTHR A 121 32.782 35.233 26.1330.00 NATOM839 CA THR A 121 32.233 35.110 27.4710.00 CATOM840 CB THR A 121 32.932 36.084 28.4350.00 CATOM841 OG1 THR A 121 34.319 35.733 28.5270.00 OATOM842 CG2 THR A 121 32.293 36.026 29.8310.00 CATOM843 CTHR A 121 30.739 35.358 27.5260.00 CATOM844 OTHR A 121 30.198 36.160 26.7710.00 OATOM845 NVAL A 122 30.075 34.632 28.4170.00 NATOM846 CA VAL A 122 28.635 34.754 28.6070.00 CATOM847 CB VAL A 122 27.899 33.451 28.1960.00 CATOM848 CG1 VAL A 122 26.412 33.553 28.5190.00 CATOM849 CG2 VAL A 122 28.091 33.207 26.6950.00 CATOM850 CVAL A 122 28.515 35.016 30.1030.00 CATOM851 OVAL A 122 29.182 34.363 30.9020.00 OATOM852 NARG A 123 27.689 35.978 30.4930.00 NATOM853 CA ARG A 123 27.546 36.282 31.9150.00 CATOM854 CB ARG A 123 27.917 37.748 32.1530.00 CATOM855 CG ARG A 123 26.856 38.724 31.6550.00 CATOM856 CD ARG A 123 25.712 38.852 32.6710.00 CATOM857 NE ARG A 123 24.459 39.336 32.0890.00 N1+ATOM858 CZ ARG A 123 24.345 40.426 31.3360.00 CATOM859 NH1 ARG A 123 25.414 41.162 31.0540.00 NATOM860 NH2 ARG A 123 23.156 40.796 30.8770.00 NATOM861 CARG A 123 26.151 36.018 32.4680.00 CATOM862 OARG A 123 25.252 35.605 31.7390.00 OATOM863 NGLY A 124 25.991 36.272 33.7670.00 NATOM864 CA GLY A 124 24.714 36.080 34.4380.00 CATOM865 CGLY A 124 24.094 34.712 34.2380.00 C
ATOM866 OGLY A 124 22.910 34.603 33.9360.00 OATOM867 NLEU A 125 24.891 33.666 34.4150.00 NATOM868 CA LEU A 125 24.412 32.304 34.2380.00 CATOM869 CB LEU A 125 25.411 31.495 33.4060.00 CATOM870 CG LEU A 125 25.597 31.779 31.9130.00 CATOM871 CD1 LEU A 125 26.780 30.977 31.3830.00 CATOM872 CD2 LEU A 125 24.333 31.411 31.1520.00 CATOM873 CLEU A 125 24.189 31.574 35.5540.00 CATOM874 OLEU A 125 24.828 31.869 36.5730.00 OATOM875 NILE A 126 23.270 30.615 35.5160.00 NATOM876 CA ILE A 126 22.949 29.813 36.6850.00 CATOM877 CB ILE A 126 21.506 29.276 36.6000.00 CATOM878 CG2 ILE A 126 21.268 28.230 37.6720.00 CATOM879 CG1 ILE A 126 20.517 30.441 36.7540.00 CATOM880 CD1 ILE A 126 19.074 30.045 36.5780.00 CATOM881 CILE A 126 23.947 28.646 36.6680.00 CATOM882 OILE A 126 24.009 27.881 35.7010.00 OATOM883 NARG A 127 24.746 28.536 37.7230.00 NATOM884 CA ARG A 127 25.738 27.473 37.8310.00 CATOM885 CB ARG A 127 26.989 28.007 38.5280.00 CATOM886 CG ARG A 127 28.129 27.015 38.6790.00 CATOM887 CD ARG A 127 29.261 27.678 39.4410.00 CATOM888 NE ARG A 127 30.312 26.748 39.8300.00 N1+ATOM889 CZ ARG A 127 31.098 26.112 38.9710.00 CATOM890 NH2 ARG A 127 32.033 25.279 39.4170.00 NATOM891 NH1 ARG A 127 30.949 26.310 37.6690.00 NATOM892 CARG A 127 25.132 26.328 38.6330.00 CATOM893 OARG A 127 24.507 26.553 39.6760.00 OATOM894 NTHR A 128 25.325 25.103 38.1510.00 NATOM895 CA THR A 128 24.784 23.929 38.8280.00 CATOM896 CB THR A 128 23.447 23.475 38.1890.00 CATOM897 OG1 THR A 128 23.718 22.755 36.9770.00 OATOM898 CG2 THR A 128 22.568 24.674 37.8630.00 CATOM899 CTHR A 128 25.720 22.729 38.7820.00 CATOM900 OTHR A 128 26.763 22.759 38.1350.00 OATOM901 NTHR A 129 25.317 21.667 39.4720.00 NATOM902 CA THR A 129 26.084 20.429 39.5330.00 CATOM903 CB THR A 129 26.055 19.838 40.9460.00 CATOM904 OG1 THR A 129 24.691 19.639 41.3550.00 OATOM905 CG2 THR A 129 26.758 20.779 41.9240.00 CATOM906 CTHR A 129 25.474 19.411 38.5650.00 CATOM907 OTHR A 129 25.792 18.227 38.6070.00 OATOM908 NVAL A 130 24.589 19.886 37.6960.00 NATOM909 CA VAL A 130 23.930 19.027 36.7220.00 CATOM910 CB VAL A 130 22.663 19.707 36.1640.00 CATOM911 CG1 VAL A 130 21.972 18.790 35.1620.00 CATOM912 CG2 VAL A 130 21.715 20.054 37.3080.00 CATOM913 CVAL A 130 24.857 18.691 35.5610.00 CATOM914 OVAL A 130 25.623 19.536 35.1090.00 OATOM915 NCYS A 131 24.790 17.449 35.0860.00 NATOM916 CA CYS A 131 25.626 17.016 33.9750.00 CATOM917 CB CYS A 131 25.889 15.507 34.0340.00 CATOM918 SG CYS A 131 24.399 14.468 33.8740.00 SATOM919 CCYS A 131 24.893 17.340 32.6900.00 CATOM920 OCYS A 131 23.670 17.436 32.6780.00 OATOM921 NALA A 132 25.636 17.514 31.6070.00 NATOM922 CA ALA A 132 25.020 17.821 30.3290.00 CATOM923 CB ALA A 132 24.707 19.313 30.2370.00 CATOM924 CALA A 132 25.920 17.404 29.1760.00 CATOM925 OALA A 132 27.113 17.139 29.3560.00 OATOM926 NGLU A 133 25.323 17.353 27.9920.00 NATOM927 CA GLU A 133 26.017 16.981 26.7740.00 CATOM928 CB GLU A 133 25.434 15.686 26.2190.00 CATOM929 CG GLU A 133 26.457 14.695 25.7300.00 CATOM930 CD GLU A 133 27.077 13.909 26.8620.00 CATOM931 OE1 GLU A 133 27.702 14.533 27.7410.00 O1-ATOM932 OE2 GLU A 133 26.937 12.667 26.8710.00 OATOM933 CGLU A 133 25.750 18.114 25.7920.00 CATOM934 OGLU A 133 24.778 18.851 25.9460.00 OATOM935 NPRO A 134 26.602 18.268 24.7690.00 NATOM936 CA PRO A 134 26.395 19.343 23.7890.00 CATOM937 CB PRO A 134 27.471 19.059 22.7420.00 CATOM938 CPRO A 134 24.975 19.390 23.1850.00 CATOM939 OPRO A 134 24.331 20.446 23.1590.00 OATOM940 CD PRO A 134 27.856 17.539 24.5010.00 CATOM941 CG PRO A 134 28.586 18.478 23.5720.00 CATOM942 NGLY A 135 24.490 18.250 22.7080.00 NATOM943 CA GLY A 135 23.167 18.218 22.1170.00 C
ATOM944 CGLY A 135 22.074 18.675 23.0630.00 CATOM945 OGLY A 135 20.979 19.053 22.6310.00 OATOM946 NASP A 136 22.369 18.638 24.3590.00 NATOM947 CA ASP A 136 21.414 19.046 25.3870.00 CATOM948 CB ASP A 136 21.914 18.588 26.7700.00 CATOM949 CASP A 136 21.162 20.564 25.4000.00 CATOM950 OASP A 136 20.124 21.024 25.8860.00 OATOM951 CG ASP A 136 21.783 17.075 26.9820.00 CATOM952 OD2 ASP A 136 20.834 16.471 26.4360.00 O1-ATOM953 OD1 ASP A 136 22.618 16.492 27.7140.00 OATOM954 NSER A 137 22.109 21.332 24.8680.00 NATOM955 CA SER A 137 21.989 22.791 24.8230.00 CATOM956 CB SER A 137 23.048 23.390 23.8960.00 CATOM957 CSER A 137 20.610 23.287 24.3880.00 CATOM958 OSER A 137 19.993 22.752 23.4560.00 OATOM959 OG SER A 137 24.352 23.234 24.4270.00 OATOM960 NGLY A 138 20.148 24.332 25.0700.00 NATOM961 CA GLY A 138 18.854 24.904 24.7820.00 CATOM962 CGLY A 138 17.803 24.224 25.6290.00 CATOM963 OGLY A 138 16.706 24.748 25.8090.00 OATOM964 NGLY A 139 18.150 23.057 26.1600.00 NATOM965 CA GLY A 139 17.222 22.297 26.9820.00 CATOM966 CGLY A 139 16.617 23.021 28.1760.00 CATOM967 OGLY A 139 17.104 24.070 28.6040.00 OATOM968 NSER A 140 15.555 22.438 28.7290.00 NATOM969 CA SER A 140 14.858 23.024 29.8700.00 CATOM970 CB SER A 140 13.423 22.500 29.9480.00 CATOM971 OG SER A 140 12.971 22.037 28.6910.00 OATOM972 CSER A 140 15.532 22.736 31.1980.00 CATOM973 OSER A 140 16.162 21.691 31.3890.00 OATOM974 NLEU A 141 15.393 23.683 32.1150.00 NATOM975 CA LEU A 141 15.967 23.558 33.4480.00 CATOM976 CB LEU A 141 17.175 24.482 33.6390.00 CATOM977 CG LEU A 141 17.722 24.420 35.0730.00 CATOM978 CD1 LEU A 141 18.323 23.047 35.3340.00 CATOM979 CD2 LEU A 141 18.749 25.518 35.2970.00 CATOM980 CLEU A 141 14.851 23.945 34.4050.00 CATOM981 OLEU A 141 14.398 25.081 34.4220.00 OATOM982 NLEU A 142 14.409 22.987 35.1990.00 NATOM983 CA LEU A 142 13.341 23.220 36.1500.00 CATOM984 CB LEU A 142 12.230 22.198 35.9130.00 CATOM985 CG LEU A 142 11.289 22.306 34.7190.00 CATOM986 CD1 LEU A 142 10.674 20.933 34.4630.00 CATOM987 CD2 LEU A 142 10.219 23.350 34.9960.00 CATOM988 CLEU A 142 13.702 23.168 37.6290.00 CATOM989 OLEU A 142 14.745 22.671 38.0290.00 OATOM990 NALA A 143 12.788 23.701 38.4240.00 NATOM991 CA ALA A 143 12.880 23.759 39.8750.00 CATOM992 CB ALA A 143 13.159 25.178 40.3450.00 CATOM993 CALA A 143 11.434 23.368 40.1650.00 CATOM994 OALA A 143 10.557 24.221 40.2250.00 OATOM995 NGLY A 144 11.175 22.072 40.2870.00 NATOM996 CA GLY A 1449.810 21.642 40.5130.00 CATOM997 CGLY A 1449.058 21.945 39.2320.00 CATOM998 OGLY A 1449.457 21.487 38.1540.00 OATOM999 NASN A 1457.984 22.723 39.3220.00 NATOM 1000 CA ASN A 1457.241 23.066 38.1220.00 CATOM 1001 CB ASN A 1455.736 22.848 38.3210.00 CATOM 1002 CG ASN A 1455.144 23.751 39.3840.00 CATOM 1003 OD1 ASN A 1455.382 24.962 39.3960.00 OATOM 1004 ND2 ASN A 1454.351 23.166 40.2810.00 NATOM 1005 CASN A 1457.503 24.496 37.6500.00 CATOM 1006 OASN A 1456.716 25.049 36.8860.00 OATOM 1007 NGLN A 1468.613 25.086 38.0930.00 NATOM 1008 CA GLN A 1468.968 26.455 37.7020.00 CATOM 1009 CB GLN A 1469.234 27.314 38.9420.00 CATOM 1010 CG GLN A 1468.080 27.367 39.9160.00 CATOM 1011 CD GLN A 1466.875 28.097 39.3630.00 CATOM 1012 OE1 GLN A 1465.735 27.705 39.6150.00 OATOM 1013 NE2 GLN A 1467.117 29.172 38.6170.00 NATOM 1014 CGLN A 146 10.205 26.492 36.7980.00 CATOM 1015 OGLN A 146 11.277 25.999 37.1690.00 OATOM 1016 NALA A 147 10.055 27.084 35.6180.00 NATOM 1017 CA ALA A 147 11.160 27.188 34.6600.00 CATOM 1018 CB ALA A 147 10.642 27.698 33.3090.00 CATOM 1019 CALA A 147 12.253 28.124 35.1830.00 CATOM 1020 OALA A 147 11.958 29.233 35.6250.00 OATOM 1021 NGLN A 148 13.508 27.679 35.1240.00 N
ATOM1022 CA GLN A 148 14.637 28.481 35.5930.00 CATOM1023 CB GLN A 148 15.576 27.627 36.4350.00 CATOM1024 CG GLN A 148 14.939 27.023 37.6670.00 CATOM1025 CD GLN A 148 14.283 28.062 38.5530.00 CATOM1026 OE1 GLN A 148 13.074 28.016 38.7970.00 OATOM1027 NE2 GLN A 148 15.075 29.005 39.0400.00 NATOM1028 CGLN A 148 15.440 29.128 34.4660.00 CATOM1029 OGLN A 148 15.723 30.325 34.5010.00 OATOM1030 NGLY A 149 15.818 28.330 33.4720.00 NATOM1031 CA GLY A 149 16.578 28.852 32.3490.00 CATOM1032 CGLY A 149 16.762 27.783 31.2900.00 CATOM1033 OGLY A 149 16.104 26.742 31.3480.00 OATOM1034 NVAL A 150 17.628 28.041 30.3110.00 NATOM1035 CA VAL A 150 17.896 27.061 29.2610.00 CATOM1036 CB VAL A 150 17.568 27.604 27.8480.00 CATOM1037 CG1 VAL A 150 16.053 27.737 27.6940.00 CATOM1038 CG2 VAL A 150 18.256 28.936 27.6110.00 CATOM1039 CVAL A 150 19.351 26.630 29.3290.00 CATOM1040 OVAL A 150 20.210 27.368 29.8090.00 OATOM1041 NTHR A 151 19.630 25.431 28.8440.00 NATOM1042 CA THR A 151 20.985 24.914 28.8730.00 CATOM1043 CB THR A 151 20.980 23.429 28.5360.00 CATOM1044 OG1 THR A 151 20.057 22.771 29.4120.00 OATOM1045 CG2 THR A 151 22.361 22.828 28.7480.00 CATOM1046 CTHR A 151 21.954 25.675 27.9840.00 CATOM1047 OTHR A 151 21.756 25.796 26.7790.00 OATOM1048 NSER A 152 23.007 26.192 28.6070.00 NATOM1049 CA SER A 152 24.020 26.956 27.8980.00 CATOM1050 CB SER A 152 24.382 28.193 28.7230.00 CATOM1051 OG SER A 152 25.262 29.047 28.0210.00 OATOM1052 CSER A 152 25.264 26.127 27.6030.00 CATOM1053 OSER A 152 25.673 26.005 26.4500.00 OATOM1054 NGLY A 153 25.859 25.561 28.6480.00 NATOM1055 CA GLY A 153 27.047 24.740 28.4830.00 CATOM1056 CGLY A 153 27.702 24.415 29.8170.00 CATOM1057 OGLY A 153 27.151 24.724 30.8720.00 OATOM1058 NGLY A 154 28.876 23.794 29.7710.00 NATOM1059 CA GLY A 154 29.589 23.443 30.9840.00 CATOM1060 CGLY A 154 30.688 22.439 30.7080.00 CATOM1061 OGLY A 154 31.161 22.322 29.5790.00 OATOM1062 NSER A 155 31.101 21.703 31.7360.00 NATOM1063 CA SER A 155 32.149 20.701 31.5720.00 CATOM1064 CB SER A 155 33.416 21.148 32.2960.00 CATOM1065 OG SER A 155 33.180 21.231 33.6880.00 OATOM1066 CSER A 155 31.700 19.354 32.1280.00 CATOM1067 OSER A 155 30.690 19.268 32.8360.00 OATOM1068 NGLY A 156 32.460 18.307 31.8050.00 NATOM1069 CA GLY A 156 32.142 16.970 32.2830.00 CATOM1070 CGLY A 156 31.101 16.231 31.4580.00 CATOM1071 OGLY A 156 30.856 16.564 30.3020.00 OATOM1072 NASN A 157 30.495 15.211 32.0510.00 NATOM1073 CA ASN A 157 29.470 14.434 31.3690.00 CATOM1074 CB ASN A 157 30.115 13.390 30.4500.00 CATOM1075 CG ASN A 157 31.077 12.472 31.1880.00 CATOM1076 OD1 ASN A 157 30.669 11.681 32.0380.00 OATOM1077 ND2 ASN A 157 32.365 12.575 30.8630.00 NATOM1078 CASN A 157 28.578 13.766 32.4100.00 CATOM1079 OASN A 157 28.788 13.932 33.6100.00 OATOM1080 NCYS A 158 27.580 13.021 31.9480.00 NATOM1081 CA CYS A 158 26.661 12.337 32.8400.00 CATOM1082 CB CYS A 158 25.304 12.169 32.1550.00 CATOM1083 SG CYS A 158 24.426 13.754 31.9730.00 SATOM1084 CCYS A 158 27.181 11.000 33.3500.00 CATOM1085 OCYS A 158 26.592 10.393 34.2440.00 OATOM1086 NARG A 159 28.288 10.538 32.7840.00 NATOM1087 CA ARG A 159 28.862 9.271 33.2150.00 CATOM1088 CB ARG A 159 29.714 8.662 32.0990.00 CATOM1089 CG ARG A 159 28.922 8.198 30.8900.00 CATOM1090 CD ARG A 159 29.852 7.660 29.8170.00 CATOM1091 NE ARG A 159 30.711 8.703 29.2600.00 N1+ATOM1092 CZ ARG A 159 30.273 9.714 28.5170.00 CATOM1093 NH1 ARG A 159 28.980 9.826 28.2370.00 NATOM1094 NH2 ARG A 159 31.128 10.610 28.0490.00 NATOM1095 CARG A 159 29.716 9.462 34.4670.00 CATOM1096 OARG A 159 29.634 8.675 35.4050.00 OATOM1097 NTHR A 160 30.533 10.510 34.4810.00 NATOM1098 CA THR A 160 31.400 10.785 35.6280.00 CATOM1099 CB THR A 160 32.874 10.925 35.1850.00 C
ATOM1100 OG1 THR A 160 32.966 11.897 34.1380.00 OATOM1101 CG2 THR A 160 33.404 9.605 34.6760.00 CATOM1102 CTHR A 160 31.000 12.048 36.3960.00 CATOM1103 OTHR A 160 31.525 12.320 37.4750.00 OATOM1104 NGLY A 161 30.068 12.812 35.8360.00 NATOM1105 CA GLY A 161 29.622 14.028 36.4900.00 CATOM1106 CGLY A 161 30.200 15.295 35.8780.00 CATOM1107 OGLY A 161 31.194 15.262 35.1500.00 OATOM1108 NGLY A 162 29.577 16.426 36.1800.00 NATOM1109 CA GLY A 162 30.061 17.681 35.6460.00 CATOM1110 CGLY A 162 29.414 18.909 36.2500.00 CATOM1111 OGLY A 162 28.785 18.856 37.3180.00 OATOM1112 NTHR A 163 29.592 20.023 35.5470.00 NATOM1113 CA THR A 163 29.057 21.322 35.9340.00 CATOM1114 CB THR A 163 30.179 22.248 36.4400.00 CATOM1115 OG1 THR A 163 30.861 21.621 37.5350.00 OATOM1116 CG2 THR A 163 29.604 23.576 36.8960.00 CATOM1117 CTHR A 163 28.414 21.948 34.6950.00 CATOM1118 OTHR A 163 29.052 22.077 33.6500.00 OATOM1119 NTHR A 164 27.152 22.342 34.8100.00 NATOM1120 CA THR A 164 26.452 22.945 33.6800.00 CATOM1121 CB THR A 164 25.290 22.053 33.2080.00 CATOM1122 OG1 THR A 164 25.744 20.700 33.0750.00 OATOM1123 CG2 THR A 164 24.768 22.536 31.8690.00 CATOM1124 CTHR A 164 25.878 24.298 34.0600.00 CATOM1125 OTHR A 164 25.354 24.466 35.1670.00 OATOM1126 NPHE A 165 25.981 25.256 33.1390.00 NATOM1127 CA PHE A 165 25.470 26.607 33.3690.00 CATOM1128 CB PHE A 165 26.521 27.662 33.0210.00 CATOM1129 CG PHE A 165 27.818 27.507 33.7690.00 CATOM1130 CD1 PHE A 165 28.758 26.554 33.3800.00 CATOM1131 CD2 PHE A 165 28.107 28.319 34.8580.00 CATOM1132 CE1 PHE A 165 29.957 26.427 34.0710.00 CATOM1133 CE2 PHE A 165 29.302 28.187 35.5410.00 CATOM1134 CZ PHE A 165 30.224 27.242 35.1460.00 CATOM1135 CPHE A 165 24.242 26.834 32.5050.00 CATOM1136 OPHE A 165 24.170 26.334 31.3860.00 OATOM1137 NPHE A 166 23.276 27.586 33.0200.00 NATOM1138 CA PHE A 166 22.067 27.854 32.2620.00 CATOM1139 CB PHE A 166 20.860 27.130 32.8800.00 CATOM1140 CG PHE A 166 21.062 25.643 33.0760.00 CATOM1141 CD2 PHE A 166 20.371 24.721 32.2950.00 CATOM1142 CD1 PHE A 166 21.936 25.165 34.0500.00 CATOM1143 CE2 PHE A 166 20.549 23.339 32.4840.00 CATOM1144 CE1 PHE A 166 22.117 23.788 34.2430.00 CATOM1145 CZ PHE A 166 21.423 22.879 33.4600.00 CATOM1146 CPHE A 166 21.765 29.344 32.1730.00 CATOM1147 OPHE A 166 22.066 30.122 33.0860.00 OATOM1148 NGLN A 167 21.187 29.736 31.0460.00 NATOM1149 CA GLN A 167 20.822 31.122 30.8020.00 CATOM1150 CB GLN A 167 20.737 31.366 29.2910.00 CATOM1151 CG GLN A 167 19.786 32.464 28.8750.00 CATOM1152 CD GLN A 167 20.300 33.840 29.2340.00 CATOM1153 OE1 GLN A 167 21.329 34.282 28.7220.00 OATOM1154 NE2 GLN A 167 19.589 34.525 30.1260.00 NATOM1155 CGLN A 167 19.449 31.262 31.4420.00 CATOM1156 OGLN A 167 18.500 30.600 31.0200.00 OATOM1157 NPRO A 168 19.322 32.107 32.4810.00 NATOM1158 CD PRO A 168 20.334 32.973 33.1130.00 CATOM1159 CA PRO A 168 18.013 32.270 33.1320.00 CATOM1160 CB PRO A 168 18.261 33.395 34.1380.00 CATOM1161 CG PRO A 168 19.716 33.237 34.4700.00 CATOM1162 CPRO A 168 16.926 32.611 32.1080.00 CATOM1163 OPRO A 168 17.180 33.288 31.1160.00 OATOM1164 NVAL A 169 15.711 32.149 32.3730.00 NATOM1165 CA VAL A 169 14.578 32.379 31.4870.00 CATOM1166 CB VAL A 169 13.465 31.328 31.8020.00 CATOM1167 CG1 VAL A 169 12.914 31.542 33.2040.00 CATOM1168 CG2 VAL A 169 12.370 31.401 30.7860.00 CATOM1169 CVAL A 169 13.962 33.788 31.4270.00 CATOM1170 OVAL A 169 13.638 34.273 30.3580.00 OATOM1171 NASN A 170 13.802 34.455 32.5600.00 NATOM1172 CA ASN A 170 13.213 35.793 32.5540.00 CATOM1173 CB ASN A 170 13.128 36.329 33.9790.00 CATOM1174 CG ASN A 170 12.215 35.486 34.8430.00 CATOM1175 OD1 ASN A 170 11.177 35.008 34.3730.00 OATOM1176 ND2 ASN A 170 12.587 35.298 36.1070.00 NATOM1177 CASN A 170 13.859 36.822 31.6350.00 C
ATOM1178 OASN A 170 13.166 37.586 30.9750.00 OATOM1179 NPRO A 171 15.192 36.873 31.5900.00 NATOM1180 CD PRO A 171 16.217 36.299 32.4760.00 CATOM1181 CA PRO A 171 15.768 37.872 30.6840.00 CATOM1182 CB PRO A 171 17.258 37.857 31.0430.00 CATOM1183 CG PRO A 171 17.466 36.517 31.6730.00 CATOM1184 CPRO A 171 15.484 37.551 29.2090.00 CATOM1185 OPRO A 171 15.601 38.418 28.3380.00 OATOM1186 NILE A 172 15.101 36.307 28.9350.00 NATOM1187 CA ILE A 172 14.798 35.896 27.5700.00 CATOM1188 CB ILE A 172 14.811 34.374 27.4030.00 CATOM1189 CG2 ILE A 172 14.516 34.018 25.9470.00 CATOM1190 CG1 ILE A 172 16.164 33.801 27.8130.00 CATOM1191 CD1 ILE A 172 16.196 32.269 27.7640.00 CATOM1192 CILE A 172 13.386 36.369 27.2510.00 CATOM1193 OILE A 172 13.113 36.885 26.1660.00 OATOM1194 NLEU A 173 12.488 36.179 28.2100.00 NATOM1195 CA LEU A 173 11.102 36.587 28.0380.00 CATOM1196 CB LEU A 173 10.279 36.158 29.2520.00 CATOM1197 CG LEU A 173 10.263 34.645 29.4860.00 CATOM1198 CD1 LEU A 1739.465 34.308 30.7590.00 CATOM1199 CD2 LEU A 1739.671 33.965 28.2510.00 CATOM1200 CLEU A 173 11.031 38.105 27.8690.00 CATOM1201 OLEU A 173 10.287 38.617 27.0370.00 OATOM1202 NGLN A 174 11.831 38.807 28.6620.00 NATOM1203 CA GLN A 174 11.896 40.259 28.6410.00 CATOM1204 CB GLN A 174 12.665 40.752 29.8700.00 CATOM1205 CG GLN A 174 12.868 42.259 29.9230.00 CATOM1206 CD GLN A 174 11.664 43.006 30.4610.00 CATOM1207 OE1 GLN A 174 10.532 42.811 30.0030.00 OATOM1208 NE2 GLN A 174 11.904 43.876 31.4380.00 NATOM1209 CGLN A 174 12.555 40.817 27.3810.00 CATOM1210 OGLN A 174 12.219 41.909 26.9330.00 OATOM1211 NALA A 175 13.493 40.078 26.8080.00 NATOM1212 CA ALA A 175 14.164 40.552 25.6040.00 CATOM1213 CB ALA A 175 15.378 39.681 25.3060.00 CATOM1214 CALA A 175 13.238 40.580 24.3940.00 CATOM1215 OALA A 175 13.276 41.512 23.5950.00 OATOM1216 NTYR A 176 12.396 39.561 24.2760.00 NATOM1217 CA TYR A 176 11.462 39.458 23.1610.00 CATOM1218 CB TYR A 176 11.571 38.063 22.5350.00 CATOM1219 CG TYR A 176 12.990 37.700 22.1730.00 CATOM1220 CD1 TYR A 176 13.761 38.551 21.3810.00 CATOM1221 CE1 TYR A 176 15.075 38.249 21.0730.00 CATOM1222 CD2 TYR A 176 13.574 36.528 22.6430.00 CATOM1223 CE2 TYR A 176 14.890 36.213 22.3350.00 CATOM1224 CZ TYR A 176 15.636 37.083 21.5530.00 CATOM1225 OH TYR A 176 16.959 36.817 21.2850.00 OATOM1226 CTYR A 176 10.004 39.742 23.5000.00 CATOM1227 OTYR A 1769.135 39.574 22.6460.00 OATOM1228 NGLY A 1779.736 40.165 24.7330.00 NATOM1229 CA GLY A 1778.366 40.457 25.1310.00 CATOM1230 CGLY A 1777.469 39.232 25.0650.00 CATOM1231 OGLY A 1776.295 39.326 24.7110.00 OATOM1232 NLEU A 1788.033 38.080 25.4210.00 NATOM1233 CA LEU A 1787.323 36.807 25.3900.00 CATOM1234 CB LEU A 1788.275 35.694 24.9370.00 CATOM1235 CG LEU A 1788.981 35.724 23.5810.00 CATOM1236 CD1 LEU A 178 10.077 34.688 23.5840.00 CATOM1237 CD2 LEU A 1788.006 35.441 22.4540.00 CATOM1238 CLEU A 1786.737 36.403 26.7410.00 CATOM1239 OLEU A 1787.221 36.821 27.7940.00 OATOM1240 NARG A 1795.698 35.573 26.6880.00 NATOM1241 CA ARG A 1795.008 35.060 27.8750.00 CATOM1242 CB ARG A 1793.519 35.439 27.8720.00 CATOM1243 CG ARG A 1793.193 36.849 28.3560.00 CATOM1244 CD ARG A 1791.760 37.239 27.9890.00 CATOM1245 NE ARG A 1791.401 38.565 28.4900.00 N1+ATOM1246 CZ ARG A 1791.070 38.825 29.7510.00 CATOM1247 NH1 ARG A 1791.044 37.844 30.6460.00 NATOM1248 NH2 ARG A 1790.773 40.066 30.1170.00 NATOM1249 CARG A 1795.118 33.541 27.7940.00 CATOM1250 OARG A 1795.043 32.978 26.7070.00 OATOM1251 NMET A 1805.313 32.882 28.9310.00 NATOM1252 CA MET A 1805.422 31.428 28.9550.00 CATOM1253 CB MET A 1805.866 30.936 30.3290.00 CATOM1254 CG MET A 1807.257 31.311 30.7680.00 CATOM1255 SD MET A 1808.400 30.052 30.2270.00 S
ATOM1256 CE MET A 1807.622 28.610 30.8920.00 CATOM1257 CMET A 1804.034 30.856 28.7120.00 CATOM1258 OMET A 1803.034 31.444 29.1180.00 OATOM1259 NILE A 1813.967 29.715 28.0420.00 NATOM1260 CA ILE A 1812.690 29.085 27.7810.00 CATOM1261 CB ILE A 1812.726 28.266 26.4640.00 CATOM1262 CG2 ILE A 1811.534 27.294 26.3990.00 CATOM1263 CG1 ILE A 1812.711 29.237 25.2700.00 CATOM1264 CD1 ILE A 1812.740 28.556 23.9100.00 CATOM1265 CILE A 1812.613 28.211 29.0230.00 CATOM1266 OILE A 1813.458 27.357 29.2380.00 OATOM1267 NTHR A 1821.598 28.457 29.8450.00 NATOM1268 CA THR A 1821.398 27.724 31.0900.00 CATOM1269 CTHR A 1820.212 26.770 31.1630.00 CATOM1270 OTHR A 182 -0.098 26.231 32.2410.00 OATOM1271 CB THR A 1821.315 28.733 32.2730.00 CATOM1272 OG1 THR A 1820.199 28.407 33.1110.00 OATOM1273 CG2 THR A 1821.137 30.133 31.7390.00 CATOM1274 NTHR A 183 -0.448 26.534 30.0360.00 NATOM1275 CA THR A 183 -1.593 25.623 30.0450.00 CATOM1276 CTHR A 183 -1.754 25.043 28.6470.00 CATOM1277 OTHR A 183 -1.274 25.608 27.6750.00 OATOM1278 CB THR A 183 -2.909 26.342 30.4330.00 CATOM1279 OG1 THR A 183 -3.716 25.460 31.2280.00 OATOM1280 CG2 THR A 183 -3.690 26.738 29.1840.00 CATOM1281 NASP A 184 -2.402 23.896 28.5320.00 NATOM1282 CA ASP A 184 -2.573 23.318 27.2130.00 CATOM1283 CASP A 184 -4.035 23.091 26.9180.00 CATOM1284 OASP A 184 -4.380 22.208 26.1740.00 OATOM1285 CB ASP A 184 -1.810 22.005 27.1130.00 CATOM1286 CG ASP A 184 -0.464 22.056 27.7940.00 CATOM1287 OD1 ASP A 1840.296 23.029 27.5770.00 OATOM1288 OD2 ASP A 184 -0.152 21.080 28.5270.00 O1-TER 1289 ASP A 184ATOM1290 NALA B14 37.553 22.457 29.1940.00 N1+ATOM1291 HALA B14 36.582 22.364 28.9350.00 HATOM1292 HALA B14 37.991 23.157 28.6140.00 HATOM1293 HALA B14 38.021 21.572 29.0650.00 HATOM1294 CA ALA B14 37.649 22.863 30.6160.00 CATOM1295 CALA B14 36.345 22.665 31.4000.00 CATOM1296 OALA B14 36.364 21.816 32.3040.00 OATOM1297 CB ALA B14 38.235 24.270 30.6580.00 CATOM1298 NALA B15 35.261 23.393 31.0940.00 NATOM1299 CA ALA B15 35.165 24.394 30.0260.00 CATOM1300 CALA B15 34.368 23.941 28.7900.00 CATOM1301 OALA B15 34.957 23.330 27.8920.00 OATOM1302 CB ALA B15 34.779 25.773 30.5730.00 CATOM1303 NALA B16 33.028 24.069 28.7630.00 NATOM1304 CA ALA B16 32.304 23.388 27.6830.00 CATOM1305 CALA B16 31.144 24.054 26.9180.00 CATOM1306 OALA B16 30.114 24.490 27.4530.00 OATOM1307 CB ALA B16 32.420 21.850 27.7130.00 CATOM1308 HALA B16 32.544 24.608 29.4520.00 HATOM1309 NHIS B17 31.370 24.111 25.6000.00 NATOM1310 CA HIS B17 30.508 24.676 24.5210.00 CATOM1311 CHIS B17 29.820 23.558 23.7560.00 CATOM1312 OHIS B17 30.487 22.621 23.2910.00 OATOM1313 CB HIS B17 31.473 25.545 23.6830.00 CATOM1314 CG HIS B17 30.806 26.351 22.6010.00 CATOM1315 ND1 HIS B17 30.728 26.028 21.2640.00 NATOM1316 CD2 HIS B17 30.170 27.551 22.7720.00 CATOM1317 CE1 HIS B17 30.054 27.014 20.6480.00 CATOM1318 NE2 HIS B17 29.694 27.965 21.5250.00 NATOM1319 HHIS B17 32.233 23.710 25.2920.00 HATOM1320 NTYR B18 28.491 23.661 23.6130.00 NATOM1321 CA TYR B18 27.651 22.538 23.2440.00 CATOM1322 CTYR B18 26.791 22.741 21.9780.00 CATOM1323 OTYR B18 25.936 21.904 21.7620.00 OATOM1324 CB TYR B18 26.869 22.044 24.4760.00 CATOM1325 CG TYR B18 27.638 21.257 25.5270.00 CATOM1326 CD1 TYR B18 27.073 20.996 26.7930.00 CATOM1327 CD2 TYR B18 28.818 20.596 25.1600.00 CATOM1328 CE1 TYR B18 27.702 20.099 27.6850.00 CATOM1329 CE2 TYR B18 29.420 19.668 26.0200.00 CATOM1330 CZ TYR B18 28.855 19.410 27.2760.00 CATOM1331 OH TYR B18 29.519 18.595 28.1390.00 OATOM1332 HTYR B18 28.022 24.521 23.8720.00 HATOM1333 NASP B19 27.328 23.446 20.9860.00 N
ATOM1334 CA ASP B19 27.252 23.065 19.5730.00 CATOM1335 CASP B19 25.957 22.335 19.1780.00 CATOM1336 OASP B19 24.855 22.851 19.3670.00 OATOM1337 CB ASP B19 27.381 24.271 18.6550.00 CATOM1338 CG ASP B19 28.399 25.369 18.9260.00 CATOM1339 OD1 ASP B19 28.777 25.568 20.1050.00 OATOM1340 OD2 ASP B19 28.588 26.117 17.9410.00 O1-ATOM1341 HASP B19 28.092 24.050 21.2520.00 HATOM1342 NGLU B20 26.024 21.140 18.6220.00 NATOM1343 CA GLU B20 27.219 20.341 18.4510.00 CATOM1344 CGLU B20 27.848 20.634 17.0790.00 CATOM1345 OGLU B20 27.311 20.147 16.0910.00 OATOM1346 CB GLU B20 26.641 18.934 18.5320.00 CATOM1347 CG GLU B20 26.790 18.174 19.8360.00 CATOM1348 CD GLU B20 26.391 16.720 19.6430.00 CATOM1349 OE1 GLU B20 26.614 16.043 20.6730.00 O1-ATOM1350 OE2 GLU B20 26.569 16.221 18.5010.00 OATOM1351 HGLU B20 25.129 20.696 18.4420.00 HATOM1352 NALA B21 29.122 21.069 17.0240.00 NATOM1353 CA ALA B21 29.859 21.221 15.7680.00 CATOM1354 CALA B21 30.422 19.894 15.2080.00 CATOM1355 OALA B21 31.618 19.821 14.8790.00 OATOM1356 CB ALA B21 30.954 22.295 15.9000.00 CATOM1357 OXT ALA B21 29.677 18.897 15.0880.00 O1-ATOM1358 HALA B21 29.585 21.298 17.8800.00 HTER 1359 ALA B21
实施例21ASP的氧化稳定性[719]该实施例描述了测定ASP蛋白酶和突变体蛋白酶的氧化稳定性的试验。将纤维单胞菌69B4蛋白酶的抗氧化性与下述酶的抗氧化性比较BPN′-变体蛋白酶(BPN′-变体1；Genencor；对于该酶的描述参见RE 34,606[通过参考并入本文])；GG36变体蛋白酶(GG36-变体1；Genencor；参见例如美国专利5,955,340和5,700,676，通过参考并入本文)；和PURAFECT蛋白酶(Genencor)。
通过用0.1M H2O2温育蛋白酶样品，实施该分析。将含有0.1M H2O2和100ppm蛋白酶的2.0ml体积的0.1M硼酸盐缓冲液(45.4gm NaB4O7·10H2O)(pH9.45)在25℃温育20分钟，再分析酶活性。
按如下方法测定酶活性将50μl的温育混合物与950μl 0.1M Tris缓冲液，pH8.6混合，取10μl样品，加入到990μl AAPF底物溶液，底物浓度为1mg/ml，在0.1M Tris/0.005％ TWEEN_，pH 8.6中。在410nm，监测由于p-硝基苯胺的释放导致的吸光度的增加的速度(25℃)。对这些蛋白酶获得的结果在图31中给出。如在该图中所示，相比枯草蛋白酶，在氧化条件下，蛋白酶69B4显示出显著增加的稳定性。
实施例22ASP的螯合稳定性[722]在该实施例中，描述了测定ASP的螯合稳定性的试验。通过将等份酶与在50mM Tris，pH 8.2中的10mM EDTA温育，分析了69B4蛋白酶对螯合剂的抗性。在该试验中，使用与实施例21中相同的酶制品。
具体地，将含有10mM EDTA和100ppm蛋白酶的2.0ml体积的50mM Tris缓冲液，pH 8.2在45℃温育100分钟，并如下地分析酶活性将50μl的温育混合物与950μl 0.1M Tris缓冲液，pH 8.6混合，取10μl样品，加入到990μl AAPF底物溶液，底物浓度为1mg/ml，在0.1M Tris/0.005％ TWEEN_，pH 8.6中。
在410nm，监测由于p-硝基苯胺的释放导致的吸光度的增加的速度(25℃)。对这四种蛋白酶获得的结果在图32中给出。如这些结果所示，相比BPN′变体-1、PURAFECT_或GG36变体-1，在存在螯合剂的情况下，蛋白酶69B4显示出显著增加的稳定性。
实施例23ASP的热稳定性[725]在该实施例中，描述了测定ASP蛋白酶的热稳定性的试验。在一组试验中，测试了ASP蛋白酶在溶液中对热失活作用的抗性。如同在实施例21和22中的情况，也测试了BPN′变体(BPN′-变体-1)、PURAFECT_和GG36变体(GG36-变体-1)，并将它们与ASP比较。
通过将含有100ppm蛋白酶的2.0ml体积的50mM Tris缓冲液，pH 8.0在45℃温育300分钟进行热失活，并按如下方法分析酶活性将50μl的温育混合物与950μl 0.1M Tris缓冲液，pH 8.6混合，取10μl样品，加入到990μl AAPF底物溶液，底物浓度为1mg/ml，在0.1M Tris/0.005％ TWEEN_，pH 8.6中。在410nm，监测由于p-硝基苯胺的释放导致的吸光度的增加的速度。对这四种蛋白酶获得的结果在图33给出。如这些结果所示，相比BPN′变体、PURAFECT_或GG36变体，在45℃的温度，蛋白酶69B4显示出增加的或可媲美的热稳定性。
除了上述试验，也试验了用于测定ASP热稳定性的其它方法。在这些试验中，使用在57°-62℃之间的温度梯度。通过将含有1mM CaCl2和5ppm蛋白酶的180μl 100mM Tris缓冲液，pH 8.6温育60分钟，进行热失活(使用Thermocycler-MTP板DNA Engine Tetad；MJ Research)，并按如下方法分析酶活性取10μl，加入到990μl AAPF底物溶液，底物浓度为1mg/ml，在0.1M Tris/0.005％ TWEEN_，pH8.6中。在410nm，监测由于p-硝基苯胺的释放导致的吸光度的增加的速度(25℃)。对这四种蛋白酶获得的结果在图34给出。
实施例24ASP蛋白酶在DMC底物上的pH特性[728]在该实施例中，描述了测定ASP蛋白酶的pH特性(pH profile)的试验。利用本文描述的方法分离和纯化的本发明的纤维单胞菌69B4蛋白酶，以及在实施例21-23中描述的目前使用的三种枯草蛋白酶(PURAFECT_、BPN′-变体1、GG36-变体-1)，在4至12的pH范围内水解商业上合成的底物——二甲基酪蛋白(″DMC″/Sigma C-9801)的能力被分析。
使用描述在实验章节的开始部分的DCM方法，其中作了修改，如下所示。简言之，在合适的缓冲液中制备5mg/ml DMC底物溶液(5mg/ml DMC，0.005％(w/w)TWEEN-80_(聚氧乙烯脱水山梨醇单油酸酯，Sigma P-1754))。合适的DMC缓冲液的组成如下对于pH 4和5，40mM MES；对于pH 6和7，40mMHEPES；对于pH 8和9，40mM TRIS；和对于pH 10、11和12，40mM碳酸盐。
为了该测定，将180μl的每一种pH-底物溶液转移到96孔微量滴定板中，在加入酶之前，在37℃预温热20分钟。制备各酶溶液(BPN′-变体-1；GG36-变体-1；PURAFECT_和69B4蛋白酶)，其中含有约25ppm和20μl的这些酶的溶液。将这些酶溶液用移液管移入含有底物的孔中，以在每一孔中获得2.5ppm的最终酶浓度。在IKS-Multitron培养箱/摇床中，将含有酶-底物混合物的96孔板在37℃和300rpm的条件下温育1小时。
2，4，6-三硝基苯磺酸(″TNBS″)颜色反应方法被用于测定从DMC底物释放的肽和氨基酸的数量。(肽和氨基酸的)自由氨基基团与2，4，6-三硝基-苯磺酸反应形成黄色复合体。用SpectraMax 250 MTP读数器，在405nm处测量吸光度。
按如下所述进行TNBS分析。用试剂缓冲液A(将2.4g NaOH、45.4gNa2B4O7·10H2O加热溶解，1000ml)制备1mg/ml TNBS溶液(5％ 2，4，6三硝基苯磺酸/Sigma-P2297)。然后，以60μl/孔等份加入96孔板中，将10μl的上述温育混合物加入到每一孔中，在室温混合20分钟。然后，将200μl的试剂B(70.4g NaH2PO4·H2O和1.2g Na2SO3，2000ml)加入到每一孔中，混合以终止反应。用SpectraMax 250 MTP读数器中测量在405nm的吸光度。吸光度值用空白(无酶)校正。表24-1中的数据显示，相对于来自已知突变变体(BPN’变体-1和GG36变体-1)的蛋白酶，69B4蛋白酶具有可媲美的水解此类底物的能力。
而且，如图35所示，本发明的丝氨酸蛋白酶显示了可媲美的或增加的DCM底物水解活性，最佳的DMC水解活性发生在7至12的宽pH范围内。

实施例25ASP蛋白酶的pH稳定性[734]在该实施例中，描述了测定ASP蛋白酶的pH稳定性的试验。如同在实施例21-24中的情况，也测试了两个目前使用的枯草蛋白酶(PURAFECT_和BPN′-变体-1)。
在0.1M柠檬酸盐缓冲液，pH 3、4、5和6中，制备含有90ppm蛋白酶的各酶溶液(即，BPN′-变体-1、PURAFECT_和69B4蛋白酶)。然后，将含有1ml缓冲酶溶液的10ml试剂置于GFL 1083水浴中60分钟，温度分别设置为25℃、35℃和45℃。在0和60分钟时间点，测定每一种酶样品的AAPF活性，如上所述。计算剩余酶活性，结果在下面表25-1中给出，并显示在图25-28中。
如表25-1中的数据所示，相比BPN′-变体-1和PURAFECT_，ASP蛋白酶在pH 3、4、5和6，25℃和45℃之间的温度，异常稳定。

实施例26ASP的稳定性和特异性[737]在该实施例中，描述了测定ASP、ASP突变体和FNA之间的稳定性和特异性差异的试验。这些试验通过用甲酸钙(阴离子表面活性剂滴定剂)、硼酸盐(P1粘结剂/抑制剂)和甘油(水的定序(water ordering))配制液体TIDE_洗涤剂(Procter &Gamble)来进行，它们或者单独或者相互组合。在这些条件下测试酶，并且在固定的温度，在一段时间内测定残余酶活性。
试验在下面被更详细地描述。未加以其它配方的(unformulated)液体TIDE_洗涤剂(即，没有加入酶稳定性化学制品)被分为11等份。然后，以表26-1中示出的比例将甘油、硼砂或甲酸钙加入到洗涤剂等份样中。
将每一等份预热到90_，加入FNA、ASP(野生型)或ASP R18变体，到达约1克/升的蛋白酶。充分混合后，移取一部分，并用合成AAPF-pNA底物分析活性，如上所述。分析后，将每一等份放回90_炉中。重复该分析过程一段时间，在T0时的活性的下降被作图，表示为％剩余T0活性。
令人惊讶地，发现ASP没有与FNA一样的甲酸钙或甘油依赖性。而且，确定了硼酸盐(单独)对于稳定ASP具有最强烈的效果。也发现，起稳定作用的化学制品的加入赋予了野生型ASP和ASP R18变体显著的益处，这说明变异位点是与硼酸盐活化位点无关的。
实施例27ASP的LAS稳定性[741]在该实施例中，描述了测定ASP对阴离子表面活性剂的稳定性的试验。LAS(线型烷基磺酸盐)，一种阴离子表面活性剂，是已知会使酶失活的HDL洗涤剂的成分。使用的方法如上所述。
确定了用溶解在Tris HCl pH 8.6中的LAS温育的野生型ASP失去活性(参见下面表27-1)。进一步的研究揭示，失活是迅速的(参见下面表27-2)。因为LAS是带负电的分子，因此作了这样的假设LAS与ASP的带正电的氨基酸侧链之间的静电吸引力是LAS敏感性的原因所在。为了检验该假设，精氨酸残基(野生型ASP不含有赖氨酸残基)被突变为其他氨基酸。
将这些突变体用在Tris HCl pH 8.6中的0.05％(w/v)LAS温育一小时，结果揭示，所有的精氨酸置换突变体比野生型ASP更稳定。相反，也被测试了LAS稳定性的非精氨酸置换突变体相比野生型一般并没有改进(参见表27-3)。随后的多精氨酸置换突变体显示，该酶比野生型酶明显更稳定，并且比单个精氨酸置换突变体更稳定(参见表27-4)。
用于HDL洗涤剂中的另一种阴离子表面活性剂是AES。发现野生型ASP在高浓度的AES中不稳定(参见表27-5)。发现突变体ASP R18在AES中比野生型ASP更稳定(参见表27-5)。而且，对于野生型，由5％AES引起的失活速率比ASPR18突变体高(参见表27-6)。这些结果证实，一般来说，ASP的精氨酸残基的置换改进了ASP在阴离子洗涤剂中的稳定性。本发明不旨在局限于任何具体的阴离子洗涤剂或突变体。事实上，考虑的是各种阴离子洗涤剂(以及其他洗涤剂)都可以用于本发明，同样，各种ASP突变体也都可以用于本发明。

在该表中，R-1＝R16Q/R35F/R159QR-2＝R159QR-3＝R16Q/R123LR-7＝R14L/R127Q/R159QR-10B＝R14L/R179QR-18＝R123L/R127Q/R179QR-21＝R16Q/R79T/R127QR-23＝R16Q/R79T

实施例28在LAS洗涤剂存在和不存在下测定ASP自溶位点[745]在该实施例中，描述了在存在和不存在LAS洗涤剂的情况下测定ASP自溶位点的试验。在含有和不含有LAS(十二烷基苯磺酸盐)的缓冲液中，评价了ASP自溶。基于各个肽的分子量和序列(分别来自MS和MS/MS数据)，对自溶肽进行定位(assignments)。
在含有和不含有0.1％LAS(十二烷基苯磺酸盐)的100mM Tris pH 8.6中，温育(4℃)ASP(浓度0.35ug/uL)。在温育的0至30min时间段中，取等份样品，通过加入TFA(最终浓度1％)，终止自溶。利用与电喷雾串联质谱联接的液相色谱(LC-ESI-MS/MS)，分析等份样品(10μL)。利用使用反相柱(Vydac C4，0.3mmID×150mm)的HPLC系统(型号1100，Agilent Technologies)，分离肽，梯度为0至100％溶剂B(0.1％甲酸，在乙腈中)，时间为60分钟，流速为5μL/min(使用静态分流进样器，由250ul/min的泵流速产生)。溶剂A由含有0.1％甲酸的水组成；溶剂B由含有0.1％甲酸的乙腈组成。
使用离子阱质谱仪(型号LCQ Classic，Thermo)获得质谱。调整质谱议，以获得最佳检测，785的m/z，工作时喷雾电压为2.5kV，使用250℃的加热毛细管。在注射时间为500msec和microscan为5时，获得质谱。在数据依赖模式中获得串联MS谱，选择最强的峰，用35％的标准化碰撞能(normalized collision energy)碎裂。为了进行相关肽定量(relative peptide quantitation)，使用vendor软件测定峰面积。使用数据库搜索程序(TurboSequest，Thermo)，在含有ASP序列的数据库中运行，确认自溶肽的身份。在无酶被选择、阈值10000、dta文件参数(肽m/z误差1.7，组11，最小离子计数15)和数据库参数(肽误差2.2，MS/MS离子误差0.0，B，Y离子)条件下，进行数据库搜索。
在样品缓冲液中无LAS时，主要在分子的末端和中部观察到ASP割裂(位置Y9、F47、Y59、F165、Q174、Y176；参见下表28-1)。在该实验的进程中，观察到的肽和完整ASP的相对定量数据被作图(参见图25，A图)。大多数的ASP保持完整，只有1％是被切割的肽的形式(蛋白质∶肽比率为99∶1)。这些数据表明，大多数的ASP保持完整，折叠，并对进一步的自溶切割有抗性。
在样品缓冲液中有0.1％LAS时，在整个蛋白质中观察到ASP切割(位置Y9、T40、F47、Y57、F59、R61、L69、F165、Q174、Y176)。10分钟之后，大多数的ASP是被切割的肽的形式(参见图25，图B)。60分钟之后，蛋白质∶肽比率＜1∶99。这些数据表明，在LAS洗涤剂存在下，ASP完全去折叠，因此在整个序列中观察到大量的切割。在这两种条件下观察到的自溶切割位点总结在下表中。在该表中，点号之前和之后的氨基酸是紧挨着自溶肽之前和之后的氨基酸。点号之间的序列表示观察到的自溶肽的序列。

实施例29使用可逆抑制剂来减少LAS诱导的ASP降解[750]在该实施例中，描述了评价使用可逆抑制剂来减少LAS诱导的ASP降解的试验。苄脒(BZA)是丝氨酸蛋白酶的已知的可逆抑制剂。使用上述的标准succ-AAPF-pNA分析显示，BZA抑制约2μg/ml ASP的活性，完全的抑制发生在1000mM(1M)，如下面表29-1所示
约200μg/ml ASP然后用0.1％LAS温育多至4天，其中使用和不用1M BZA。通过将10μl温育的培养物加入到990μl的分析溶液中，在不同的时间点，测量酶活性。这样便将BZA降低到10mM，参考上面的表，这个浓度是无抑制性的。因此，任何活性的损失都将归因于酶降解。如下面的结果所示，用0.1％LAS温育但不用BZA温育的酶失去所有活性(即，它被降解)，而用0.1％LAS以及1M BZA温育的酶在4天的研究期间保留了活性，这证明，ASP活性的抑制阻止了LAS导致的降解。

实施例30突变ASP的测试[752]除了上述测试，也对ASP的各种突变体进行了测试。使用描述于上面实施例1中的方法。在下面的表中，“变体代码(variant code)”提供了野生型氨基酸、在氨基酸序列中的位置和置换氨基酸(即“F001A”表示在该特定变体中，在氨基酸序列位置1上的苯丙氨酸已经被丙氨酸置换)。
角蛋白水解[753]下表(表30-1)提供了针对ASP变体获得的角蛋白水解数据，显示了在角蛋白分析中对该底物的活性，角蛋白分析如上所述(“在微量滴定板中用角蛋白进行蛋白酶分析”)。数值是相对于野生型(WT)的比较值，按照在分析方法中的描述来计算。大于1的值表示具有比WT ASP更好的活性。
表30-1.角蛋白水解结果(variant code变体代码；keratin hydrolysis relative角蛋白水解相对值)

DMC分析[754]下表(表30-2)提供了对酪蛋白具有改善的比活性的变体。测定了所有变体对作为底物的酪蛋白的活性，如上所述(“用二甲基酪蛋白进行蛋白酶分析(96孔)，预加热或不预加热蛋白酶以进行活性和热稳定性分析”)。表中的数值提供了每一变体与WT酶活性相比的相对值(即，每一个数值是(变体活性)/(野生型活性)的商值)。具有大于1的值的每一种变体都优于WT。
表30-2.DMC分析结果(Variant code变体代码；Casein specific activity relative to wild type相对于野生型的酪蛋白比活性)

热稳定性分析[755]下表(表30-3)中的数据代表了在这些条件下，ASP变体相对于WT ASP稳定性的相对热稳定性数据。通过在升高的温度中温育之前和之后测定酪蛋白活性，来测量稳定性(参见上面的“热稳定性分析”)。这些表含有在这些条件下与WT相比较的相对稳定性数值。它是(变体剩余活性/WT剩余活性)的商。大于1的值表示具有更高的热稳定性。
表30-3.热稳定性分析结果(Variant code变体代码；Thermo stabilitv relative热稳定性相对值)

BMI-LVJ1性能分析[756]下表(表30-4)提供了被选择的变体在BMI-LVJ1性能分析中获得的数据(参见“用于测试蛋白酶性能的微型样本分析”)。该表显示了性能指数，性能指数按照上面针对相比WT酶显示出改善的性能的变体的描述来计算。性能指数大于1的那些变体具有改善的性能。
表30-4.BMI-LVJ1 性能分析结果(Variant code变体代码；BMI US LVJ-1 liquid detergent[perf.Index]BMI US LVJ-1液体洗涤剂[性能指数])

BMI-低pH性能分析[757]下表(表30-5)提供了ASP变体的数据，其显示了在低pH条件下，微型样本分析中对该底物的活性(参见“用于测试蛋白酶性能的微型样本分析”)，这使用TIDE_进行。该表提供了性能指数，性能指数按照上面针对相比WT酶显示出改善的性能的变体的描述来计算。性能指数大于1的那些变体具有改善的性能。
表30-5.BMI-低pH性能分析(Variant code变体代码；BMI US LVJ-1 liquid detergent[perf Index]BMI US LVJ-1液体洗涤剂[性能指数])

搅拌蛋分析(ADW)性能[758]下表(表30-6)提供了被选择的变体在搅拌蛋性能分析中获得的数据(参见“搅拌蛋分析”)，其中使用洗涤剂组合物I。该表提供了性能指数，性能指数按照上面针对变体的描述来计算，其显示了相比WT酶改善的性能。性能指数大于1的那些变体具有改善的性能。
表30-6.搅拌蛋分析性能结果(Variant code变体代码；ADW[perf.Index]ADW[性能指数])

Las稳定性[759]下表(表30-7)显示了相比WT-ASP具有改善的稳定性的所有变体。测试了所有变体，并根据上述方案测定计算值(参见“LAS稳定性分析”)。该表提供了变体在温育之后的残留活性。在这些条件下，发现WT的平均值是10.59％残留活性。具有更高活性的所有变体都是相对于WT分子有所改善的。
表30-7.Las稳定性分析结果(Variant code变体代码；LAS stability[residual Activity(％)]LAS稳定性[残留活性(％)])

实施例31ASP清洗活性的测定[760]在该实施例中，描述了测定在各种条件下的ASP清洗活性以及各种洗涤条件的特性的试验。
存在许多种洗涤条件，包括变化的洗涤剂配方、清洗水体积、清洗水温度和清洗时间长度。因此，洗涤剂组分诸如蛋白酶必须在不利的环境条件下具有耐受性并发挥功能。例如，用于不同区域的洗涤剂制剂在清洗水中具有不同浓度的相关组分。例如，欧洲洗涤剂在清洗水中一般具有约3000-8000ppm的洗涤剂组分，而日本洗涤剂在清洗水中一般具有少于800ppm(例如667ppm)的洗涤剂组分。在北美，特别是在美国，洗涤剂在清洗水中一般具有约800至2000(例如975ppm)的洗涤剂组分。
拉美洗涤剂通常是高泡沫磷酸盐增效洗涤剂，在拉美使用的洗涤剂的范围可以在中等和高洗涤剂浓度范围内，因为它们在清洗水中的洗涤剂组分的范围为1500ppm至6000ppm。巴西洗涤剂一般在清洗水中具有约1500ppm的洗涤剂组分。然而，其他高泡沫磷酸盐增效洗涤剂地区——不限于其它拉美国家——可能具有高洗涤剂浓度系统，即，高达约6000ppm的洗涤剂组分存在于清洗水中。
根据前面描述，明显地，在全世界典型的清洗溶液中的洗涤剂组合物的浓度在下述范围内变化，即，少于约800ppm的洗涤剂组合物(″低洗涤剂浓度地理″)，例如在日本约667ppm，到约800ppm至约2000ppm之间(″中等洗涤剂浓度地理″)，例如在美国约975ppm和巴西约1500ppm，到高于约2000ppm(″高洗涤剂浓度地理″)，例如在欧洲约3000ppm至约8000ppm，和在高泡沫磷酸盐增效剂地理中的约6000ppm。
典型的清洗溶液的浓度依经验确定。例如，在美国，典型的洗涤机器容纳约64.4L体积的清洗溶液。因此，为了在清洗溶液中获得约975ppm的洗涤剂浓度，必须将约62.79g的洗涤剂组合物加入到64.4L的清洗溶液中。该数量是消费者使用随洗涤剂提供的量杯，量取加入到清洗水中的典型数量。
作为进一步的例子，不同的地理使用不同的清洗温度。在日本，清洗水的温度通常低于在欧洲使用的温度。例如，在北美和日本，清洗水的温度可以在10和30℃之间(例如约20℃)，而在欧洲，清洗水的温度典型地在30和50℃之间(例如约40℃)。
作为进一步的例子，不同的地理可能具有不同的水硬度。水硬度通常用每加仑中的混合Ca2+/Mg2+粒子(grains)来描述。硬度是水中钙(Ca2+)和镁(Mg2+)的数量的量度。在美国，大部分的水是硬的，但是各个地区的硬度有所变化。中度硬度水(60-120ppm)至硬水(121-181ppm)具有百万分之60至181份(百万分之份数转换成美国格令是将ppm#除以17.1即为格令硬度)的硬度矿物质。表31-1提供了水硬度的范围。
欧洲水硬度一般为高于10.5(例如10.5-20.0)格令的混合Ca2+/Mg2+(例如，大约15格令的混合Ca2+/Mg2+)。北美水硬度一般大于日本水硬度，但是小于欧洲水硬度。例如，北美水硬度可在3至10格令之间、3-8格令或约6格令。日本水硬度一般低于北美水硬度，通常小于4，例如3格令的混合Ca2+/Mg2+。
本发明提供了这样的蛋白酶变体，其在至少一组清洗条件下并且通常是在多种清洗条件下具有改善的清洗性能。
如本文中所述，使用微型样本分析方法(参见上文和美国专利申请系列号09/554,992和WO 99/34011，它们通过参考并入本文)测试了蛋白酶变体在不同类型的洗涤剂和清洗条件中的性能。用类似的方式，也测试了蛋白酶变体对其它污渍底物(soil substrates)的性能。
在测定ASP清洗活性的试验中，使用了下述方法。对于“欧洲”条件，温育器(Innova 4330 Model Incubator，New Brunswick)预热至40℃ 60分钟，而对于“日本”条件，预热至20℃。血-奶-墨样本(Blood-Milk-Ink swatches)(EMPA 116)获自瑞士材料测试联合实验室(Swiss Federal Laboratories for Material Testing)和CFTResearch，通过在60℃暴露于0.03％过氧化氢30分钟进行修饰，然后干燥。从干的样本切割下1/4″直径的圆，垂直放置在96孔微板中，每孔一份。
将ASP蛋白酶样品用10mM NaCl，0.005％ TWEEN_-80稀释，以提供10ppm(蛋白质)的期望浓度。为了提供“北美清洗条件”，用去离子水制备1克/升的TIDE_洗衣洗涤剂(Procter&Gamble)，无漂白剂，并加入浓缩的钙和镁储液，以获得6格令的最终水硬度值。为了提供“欧洲清洗条件”，用去离子水中制备7.6克/升的ARIEL_REGULAR洗衣洗涤剂(Procter&Gamble)，无漂白剂，并加入浓缩的钙和镁储液，以获得15格令的最终水硬度值。为了提供“日本清洗条件”，用去离子水制备0.67克/升的PURE CLEAN洗衣洗涤剂(Procter&Gamble)，无漂白剂，并加入浓缩的钙和镁储液，以获得3格令的最终水硬度值。
在又另一种洗涤剂组合物中，为了提供“具有北美洗涤剂配方的日本清洗条件”，用去离子水制备0.66克/升的洗涤剂组合物III，无漂白剂，并加入浓缩的钙和镁储液，以获得3格令的最终水硬度值。
可将洗涤剂溶液混合15分钟，然后通过0.2微米纤维素醋酸盐过滤器过滤。然后将190μl的各种洗涤剂溶液加入到微板的合适的孔中。然后将10μl的酶制备物加入到过滤的洗涤剂中，以获得最终浓度为0.25-3.0ppm(微克/毫升)的酶，总体积为200μl。然后密封微板以防止漏出，并置于温育器/摇床上的支持物中，温育器/摇床设置为20℃和350/400RPM，并被允许摇动1小时。
然后将板从温育器/摇床中取出，从每一个孔移取100μl的等份溶液，放置到新的Costar微量滴定板(Corning)。每一等份在405nm波长的吸光度用微量滴定板读数器(SpectraMax 340，Molecular Devices)读取并报告。在微型样本分析中的洗涤剂组合物和温育条件列于表31-2中。
表31-2.洗涤剂组合物和温育条件

图23-27中提供了PURAFECT_(Genencor)、OPTIMASE_(Genencor)、RELASETM(Genencor；上述GG36-变体)和ASP的剂量响应曲线，该剂量响应曲线描述了作为浓度(ppm，孔中)函数的405nm处吸光度。
如图26所示，相比在同样条件下的PURAFECT_、RELASETM和OPTIMASETM蛋白酶，在北美条件下和在液体TIDE_洗涤剂中，ASP蛋白酶显示出增加的清洗性能。相比在同样条件下的PURAFECT_、RELASETM和OPTIMASETM蛋白酶，在日本条件下和在洗涤剂组合物III粉末(0.66g/l)中，ASP蛋白酶显示出增加的或相同的清洗性能(参见图27)。相比在同样条件下的PURAFECT_、RELASETM和OPTIMASETM蛋白酶，在欧洲条件下和在ARIEL_REGULAR粉末洗涤剂中，ASP蛋白酶显示出增加的清洗性能(参见图28)。在两种测试中，相比PURAFECT_和RELASETM，ASP和OPTIMASETM提供了2至10倍的405nm吸光度的结果。相比在同样条件下的PURAFECT_、RELASETM和OPTIMASETM蛋白酶，在日本条件下和在PURE CLEAN粉末洗涤剂中(参见图29)，ASP蛋白酶显示出增加的或可媲美的清洗性能。相比在同样条件下的PURAFECT_、RELASETM和OPTIMASETM蛋白酶，在北美条件下和在洗涤剂组合物III粉末洗涤剂中(参见图30)，ASP蛋白酶显示出增加的或可媲美的清洗性能。
实施例32液体织物清洗组合物[777]该实施例提供了可用于本发明的液体织物清洗组合物。这些组合物被认为尤其可用于日本机器洗涤条件下，以及用于涉及清洗优良和/或精细织物的应用中。
表32-1提供了合适的组合物。然而，本发明不旨在局限于该具体的制剂，因为许多其他制剂也可以用于本发明。

实施例33液体洗碟组合物[778]该实施例提供了可用于本发明的液体洗碟组合物。这些组合被认为尤其可用于日本洗碟条件下。表33-1提供了合适的组合物。然而，本发明不旨在局限于该具体的制剂，因为发现许多其他制剂也可以用于本发明。

实施例34液体织物清洗组合物本发明的蛋白酶在清洗组合物中特别有用。例如，可以考虑，根据本发明，制备在日本机器洗涤条件下特别有用的液体织物清洗组合物。在一些优选实施方案中，这些组合物包括表34-1中显示的下述组分。

实施例35颗粒织物清洗组合物[780]在该实施例中，提供了可用于本发明的各种颗粒织物清洗组合物。下表提供了合适的组合物。然而，本发明不旨在局限于这些具体的制剂，因为发现许多其他制剂也可以用于本发明。

下述洗衣洗涤剂组合物预期在欧洲机器洗涤条件下特别有用。

实施例36洗涤剂制剂[782]在该实施例中，提供了可与ASP和/或ASP变体一起使用的各种洗涤剂制剂。应该理解，本部分中提供的测试方法必须被用来测定本发明的各个参数值。
在示范性的洗涤剂组合物中，酶水平用总组合物重量中含有的纯酶量表示，除非另外指出，洗涤剂成分基于总组合物的重量来表示。其中缩写的成分标识具有下述含义
表36-1用于本实施例中的定义LAS线性C11-13烷基苯磺酸钠TAS牛脂烷基硫酸钠CxyASC1X-C1y烷基硫酸钠CxyEzC1x-C1y主要为线性的伯醇，与平均为z摩尔的环氧乙烷缩合CxyAEzSC1x-C1y烷基硫酸钠，与平均为z摩尔的环氧乙烷缩合，实施例中增加分子名字非离子混合的乙氧基化/丙氧基脂肪醇，例如Plurafac LF404，为平均乙氧基化程度为3.8和平均丙氧基化程度为4.5的醇QASR2.N+(CH3)2(C2H4OH)，R2＝C12-C14硅酸盐无定型的硅酸钠(SiO2Na2O比＝1.6-3.2∶1)正硅酸盐正硅酸钠(SiO2∶Na2O比＝1.0)沸石A水合铝硅酸盐，分子式为Na12(AlO25iO2)12·27H2OSKS-6晶体分层硅酸盐，分子式为δ-Na2Si2O5硫酸盐无水硫酸钠STPP三聚磷酸钠MA/AA无规共聚物，4∶1丙烯酸酯/马来酸酯，平均分子量约70,000-80,000AA聚丙烯酸钠聚合物，平均分子量4,500聚羧酸盐包括羧化单体诸如丙烯酸、马来酸和甲基丙烯酸的混合物的共聚物，MW在2,000-80,000范围内，诸如通过商业渠道购自BASF的Sokolan，为丙烯酸的共聚物，MW 4,500BB13-(3，4-二氢异喹啉鎓)丙烷硫酸盐BB21-(3，4-二氢异喹啉鎓)-癸烷-2-硫酸盐PB1过硼酸钠一水合物PB4过硼酸钠四水合物，名义分子式NaBO3·4H2O。
过碳酸盐过碳酸钠，名义分子式2Na2CO3·3H2O2TAED四乙酰乙二胺NOBS钠盐形式的壬酰氧杂苯磺酸盐(Nonanoyloxybenzene sulfonate)DTPA二亚乙基三胺五乙酸HEDP1，1-羟乙烷二膦酸(hydroxyethane diphosphonic acid)DETPMP二乙三胺五(亚甲基)膦酸盐，由Monsanto以商品名Dequest2060出售EDDS乙二胺-N，N′-二琥珀酸，其钠盐形式的(S，S)异构体二胺二甲基氨基丙胺；1，6-hezane diamine；1，3-丙二胺；2-甲基-1，5-戊二胺；1，3-戊二胺；1-甲基-二氨基丙烷
DETBCHD5，12-二乙基-1，5，8，12-四氮杂二环[6，6，2]十六烷，二氯化物，Mn(II)盐PAAC五胺醋酸钴(III)盐石蜡石蜡油，由Wintershall以商品名Winog 70出售石蜡磺酸盐石蜡油或蜡，其中一些氢原子已被磺酸基团取代醛糖氧化酶氧化酶，由Novozymes A/S以商品名Aldose Oxidase出售半乳糖氧化酶来自Sigma的半乳糖氧化酶蛋白酶蛋白水解酶，由Novo Nordisk A/S以商品名Savinase、Alcalase、Everlase出售，以及来自Genencor International，Inc的下述酶″ProteaseA″，描述于美国RE 34,606图1A、1B和7，和第11栏第11-37行；″Protease B″描述于美国5,955,340和美国5,700,676，图1A、1B和5以及表1；和″Protease C″，描述于美国6,312,936和美国6,482,628，图1-3[SEQ ID 3]和第25栏第12行；″Protease D″，是变体101G/103A/104I/159D/232V/236H/245R/248D/252K(BPN′编号)，描述于WO 99/20723中淀粉酶淀粉水解酶，由Genencor以描述于WO 94/18314、WO 96/05295中的商品名Purafect_Ox Am出售；Natalase_、Termamyl_、Fungamyl和Duramyl_，都来自Novozymes A/S脂酶脂水解酶，由Novozymes A/S以商品名Lipolase Lipolase Ultra出售，和Gist-Brocades出售的Lipomax纤维素酶纤维素水解酶，由Novozymes A/S以商品名Carezyme、Celluzyme和/或Endolase出售果胶裂解酶来自Novozymes A/S的Pectaway_和Pectawash_PVP聚乙烯吡咯烷酮，平均分子量为60,000PVNO聚乙烯吡啶-N-氧化物，平均分子量为50,000PVPVI乙烯咪唑和乙烯吡咯烷酮的共聚物，平均分子量为20,000增白剂14，4′-二(2-硫苯乙烯基)二苯基二钠(Disodium 4，4′-bis(2-sulphostyryl)biphenyl)有机硅消泡剂聚二甲基硅氧烷泡沫控制剂(foam controller)，用硅氧烷-氧亚烷基共聚物作为分散剂，所述泡沫控制剂与所述分散剂的比率是10∶1至100∶1泡沫抑制剂12％有机硅/硅石、18％十八烷醇、70％淀粉，粒状SRP 1阴离子末端加帽的聚酯(Anionically end capped poly ester)PEG X聚乙二醇，分子量为xPVP K60_乙烯吡咯烷酮均聚物(平均MW 160,000)Jeffamine_ED-2001来自Huntsman的加帽聚乙二醇Isachem_AS来自Enichem的支链醇烷基硫酸盐
MME PEG(2000)来自Fluka Chemie AG的单甲基醚聚乙二醇(MW 2000)DC3225C有机硅泡沫抑制剂，Dow Corning的有机硅油和硅石的混合物TEPAE四亚乙基戊胺乙氧基化合物BTA苯并三唑甜菜碱(CH3)3N+CH2COO-糖工业级D-葡萄糖或食品级糖CFAAC12-C14烷基N-甲基葡糖酰胺(glucamide)TPKFAC12-C14截顶全切脂肪酸(topped whole cut fatty acids)粘土水合硅酸铝，通式Al2O3SiO2·xH2O。类型高岭土、蒙脱石、绿坡缕石、伊利石、膨润土、埃洛石pH在20℃，作为蒸馏水中的1％溶液所得的测量值[784]下表(表36-2)提供了被制备的液体洗衣洗涤剂组合物。

#加入到产品中以调节该产品的净pH至约4.2(对于(I))和约3.8(对于(II))。
下表(表36-3)提供了制备的手工洗碟液体洗涤剂组合物。

这些组合物的pH为约8至约11。
表36-4提供了制备的液体自动洗碟洗涤剂组合物。
表36-5提供了制备的洗衣组合物，其可以以颗粒和片剂形式制备。

*香料、染料、增白剂/SRP1/羧甲基纤维素钠/光漂白剂/MgSO4/PVPVI/泡沫抑制剂/高分子PEG/粘土[789]表36-6提供了制备的液体洗衣洗涤剂制剂。
表36-7提供了制备的压缩高密度洗碟洗涤剂。

*增白剂/染料/SRP1/羧甲基纤维素钠/光漂白剂/MgSO4/PVPVI/泡沫抑制剂/高分于PEG/粘土上述组合物的pH为约9.6至约11.3。
表36-8提供了本发明的片剂洗涤剂组合物，其通过使用标准的12头旋转压机，以13KN/cm2的压力，压缩颗粒状洗碟洗涤剂组合物制备而成。

*增白剂/SRP1/羧甲基纤维素钠/光漂白剂/MgSO4/PVPVI/泡沫抑制剂/高分子PEG/粘土。
这些组合物的pH为约10约11.5。
这些组合物的片剂重量为约20g至约30g。
表36-9提供了制备的本发明的液体硬表面清洗涤剂组合物。

这些组合物的pH为约7.4至约9.5。
实施例37包含ASP的动物饲料[793]本发明也提供了包含ASP和/ASP变体的动物饲料组合物。在该实施例中，提供了一种适合于禽类的这样的饲料。然而，本发明不旨在局限于该具体的制剂，本发明的蛋白酶可用于大量其他的饲料制剂。本发明的饲料适合给予任何动物，包括但是不限于，家畜(例如牛、猪、羊等)以及陪伴动物(例如狗、猫、马、啮齿动物)。下表提供了用于饲料浆(mash)，即，基于玉米的催肥饲料(starter feed)的制剂，该饲料适合被给予大至3周龄的火鸡幼禽。
在一些实施方案中，该饲料制剂被补充以各种浓度的本发明蛋白酶(例如2,000单位/kg、4,000单位/kg和6,000单位/kg)。
本说明书中提及的所有专利和出版物指出了本发明所属技术领域的技术人员的水平。所有专利和出版物通过参考并入本文至这样的程度，每个单独的出版物都表示为明确地分别并入本文，作为参考。然而，对任何出版物的引用，都不意味着承认该出版物相对于本发明是更早的技术。
尽管已经描述了本发明的优选实施方案，对本领域技术人员显而易见的是，可以对公开的实施方案中作各种修改，而且此种修改被包括在本发明的范围内。
本领域技术人员容易认识到，本发明完全可以进行调整以实现目标并获得所提及的以及固有的结果和优势。本文中描述的组合物和方法，代表了优选的实施方案，是示范性的，而不意图成为对本发明范围的限制。对本领域技术人员显而易见的是，可以对本文中公开的发明进行各种置换和修改，而不脱离本发明的精神和范围。
本文中例证性地描述的发明可以在缺少本文中未具体公开的任一元素或许多元素、限定或许多限定的情况下适宜地实施。已被使用的术语和表述，是被用作描述性术语，而不是限定性的，并且本发明的意图不是在使用这些术语和表述时排除显示和描述的特征或其部分的等同物，应认识到在要求保护的发明范围内各种修改是可能的。因此，应该理解，尽管本发明通过优选的实施方案和可选的特征被具体地公开，但本领域技术人员可以对本文公开的概念进行修改和变化，而这些修改和变化被认为包含在本发明的范围之内，如由权利要求限定的。
在本文中，本发明已以宽范的和一般性的方式被描述。落入该概括性公开内容中的每一较窄的种类和亚类也形成本发明的一部分。这包括发明的这样的概括性描述，其带有附加条件或从该类中除去任何主题的负限定，不论删除的该物质是否在本文中被具体地叙述。
权利要求
1.分离的丝氨酸蛋白酶，其获自微球菌亚目(Micrococcineae)的成员。
2.权利要求1的丝氨酸蛋白酶，其中所述蛋白酶是纤维单胞菌蛋白酶。
3.权利要求1的丝氨酸蛋白酶，其中所述蛋白酶获自选自纤维单胞菌属(Cellulomonas)、厄氏菌属(Oerskovia)、纤维微细菌属(Cellulosimicrobium)、木聚糖细菌属(Xylanibacterium)和原小单孢菌属(Promicromonospora)的生物体。
4.权利要求3的丝氨酸蛋白酶，其中所述蛋白酶获自纤维单胞菌69B4。
5.权利要求4的丝氨酸蛋白酶，其中所述蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
6.组合物，其包含分离的丝氨酸蛋白酶，所述分离的丝氨酸蛋白酶与权利要求4所述丝氨酸蛋白酶具有免疫交叉反应性。
7.组合物，其包含分离的丝氨酸蛋白酶，所述分离的丝氨酸蛋白酶与权利要求1所述丝氨酸蛋白酶具有免疫交叉反应性。
8.分离的丝氨酸蛋白酶，其与权利要求5所述丝氨酸蛋白酶具有至少60％的氨基酸同一性。
9.权利要求4的氨基酸序列，其中所述序列包括在至少一个氨基酸位置的置换，所述至少一个氨基酸位置选自2、8、10、11、12、13、14、15、16、24、26、31、33、35、36、38、39、40、43、46、49、51、54、61、64、65、67、70、71、76、78、79、81、83、85、86、90、93、99、100、105、107、109、112、113、116、118、119、121、123、127、145、155、159、160、163、165、170、174、179、183、184、185、186、187和188。
10.权利要求4的氨基酸序列，其中所述序列包括在至少一个氨基酸位置的置换，所述至少一个氨基酸位置选自l、4、22、27、28、30、32、4l、47、48、55、59、63、66、69、75、77、80、84、87、88、89、92、96、110、111、114、115、117、128、134、144、143、146、151、154、156、158、161、166、176、177、l81、182、187和189。
11.分离的蛋白酶变体，该变体具有包括至少一个氨基酸置换的氨基酸序列，所述氨基酸置换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置上，所述纤维单胞菌69B4蛋白酶包括在SEQ ID NO8中阐述的氨基酸序列。
12.权利要求11的分离的蛋白酶，其中所述置换发生在与纤维单胞菌69B4蛋白酶中的位置2、8、10、11、12、13、14、15、16、24、26、31、33、35、36、38、39、40、43、46、49、51、54、61、64、65、67、70、71、76、78、79、81、83、85、86、90、93、99、100、105、107、109、112、113、116、118、119、121、123、127、145、155、159、160、163、165、170、174、179、183、184、185、186、187和188等同的位置上，所述纤维单胞菌69B4蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
13.权利要求11的分离的蛋白酶，其中所述置换发生在与纤维单胞菌69B4蛋白酶中的位置1、4、22、27、28、30、32、41、47、48、55、59、63、66、69、75、77、80、84、87、88、89、92、96、110、111、114、115、117、128、134、144、143、146、151、154、156、158、161、166、176、177、181、182、187和189等同的位置上，所述纤维单胞菌69B4蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
14.分离的蛋白酶，其包括在SEQ ID NO8中阐述的氨基酸序列，其中选自位置14、16、35、36、65、75、76、79、123、127、159和179的至少一个氨基酸位置用另外的氨基酸置换。
15.权利要求14的蛋白酶，其中所述蛋白酶包括选自R14L、R16I、R16L、R16Q、R35F、T36S、G65Q、Y75G、N76L、N76V、R79T、R123L、R123Q、R127A、R127K、R127Q、R159K、R159Q和R179Q的至少一个突变。
16.权利要求15的蛋白酶，其中所述蛋白酶包括选自R16Q/R35F/R159Q、R16Q/R123L、R14L/R127Q/R159Q、R14L/R179Q、R123L/R127Q/R179Q、R16Q/R79T/R127Q和R16Q/R79T的多突变。
17.权利要求15的蛋白酶，其中所述蛋白酶包括下述突变R123L、R127Q和R179Q。
18.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换T36I、A38R、N170Y、N73T、G77T、N24A、T36G、N24E、L69S、T36N、T36S、E119R、N74G、T36W、S76W、N24T、N24Q、T36P、S76Y、T36H、G54D、G78A、S187P、R179V、N24V、V90P、T36D、L69H、G65P、G65R、N7L、W103M、N55F、G186E、A70H、S76V、G186V、R159F、T36Y、T36V、G65V、N24M、S51A、G65Y、Q71I、V66H、P118A、T116F、A38F、N24H、V66D、S76L、G177M、G186I、H85Q、Q71K、Q71G、G65S、A38D、P118F、A38S、G65T、N67G、T36R、P118R、S114G、Y75I、I181H、G65Q、Y75G、T36F、A38H、R179M、T183I、G78S、A64W、Y75F、G77S、N24L、W103I、V3L、Q81V、R179D、G54R、T36L、Q71M、A70S、G49F、G54L、G54H、G78H、R179I、Q81K、V90I、A38L、N67L、T109I、R179N、V66I、G78T、R179Y、S187T、N67K、N73S、E119K、V3I、Q71H、I11Q、A64H、R14E、R179T、L69V、V150L、Q71A、G65L、Q71N、V90S、A64N、I11A、N145I、H85T、A64Y、N145Q、V66L、S92G、S188M、G78D、N67A、N7S、V80H、G54K、A70D、P118H、D2G、G54M、Q81H、D2Q、V66E、R79P、A38N、N145E、R179L、T109H、R179K、V66A、G54A、G78N、T109A、R179A、N7A、R179E、H104K、A64R和V80L。
19.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换H85R、H85L、T62I、N67H、G54I、N24F、T40V、T86A、G63V、G54Q、A64F、G77Y、R35F、T129S、R61M、I126L、S76N、T182V、R79G、T109P、R127F、R123E、P118I、T109R、I71S、T183K、N67T、P89N、F1T、A64K、G78I、T109L、G78V、A64M、A64S、T10G、G77N、A64L、N67D、S76T、N42H、D184F、D184R、S76I、S78R、A38K、V72I、V3T、T107S、A38V、F47I、N55Q、S76E、P118Q、T109G、Q71D、P118K、N67S、Q167N、N145G、I28L、I11T、A64I、G49K、G49A、G65A、N170D、H85K、S185I、I181N、V80F、L69W、S76R、D184H、V150M、T183M、N67Q、S51Q、A38Y、T107V、N145T、Q71F、A83N、S76A、N67R、T151L、T163L、S51F、Q81I、F47M、A41N、P118E、N67Y、T107M、N73H、67V、G63W、T10K、I181G、S187E、T107H、D2A、L142V、A143N、A8G、S187L、V90A、G49L、N170L、G65H、T36C、G12W、S76Q、A143S、F1A、N7H、S185V、A110T、N55K、N67F、N7I、A110S、N170A、Q81D、A64Q、Q71L、A38I、N112I、V90T、N145L、A64T、I11S、A30S、R123I、D2H、V66M、Q71R、V90L、L68W、N24S、R159E、V66N、D184Q、E133Q、A64V、D2N、G13M、T40S、S76K、G177S、G63Q、S15F、A8K、A70G和A38G。
20.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换R35E、R35D、R14E、R14D、Q167E、G49C、S15R、S15H、I11W、S15C、G49Q、R35Q、R35V、G49E、R123D、R123Y、G49H、A38D、R35S、F47R、R123C、T151L、R14T、R35T、R123E、G49A、G49V、D56L、R35N、R35A、G12D、R35C、R123N、T46V、R123H、S155C、T121E、R127E、S113C、R123T、R16E、T46F、T121L、A38C、T46E、R123W、T44E、N55G、A8G、E119G、R35P、R14G、F59W、R127S、R61E、R14S、S155W、R123F、R123S、G49N、R127D、E119Y、A48E、N170D、R159T、S99A、G12Q、P118R、F165W、R127Q、R35H、G12N、A22C、G12V、R16T、Y57G、T100A、T46Y、R159E、E119R、T107R、T151C、G54C、E119T、R61V、I11E、R14I、R61M、S15E、A22S、R16C、T36C、R16V、L125Q、M180L、R123Q、R14A、R14Q、R35M、R127K、R159Q、N112P、G124D、R179E、G49L、A41D、G177D、R123V、E119V、T10L、T109E、R179D、G12S、T10C、G91Q、S15Y、S155Y、R14C、T163D、T121F、R14N、F165E、N24E、A41C、R61T、G12I、P118K、T46C、I11T、R159D、N170C、R159V、S155I、I11Q、D2P、T100R、R159S、S114C、R16D和P134R。
21.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换S99G、T100K、R127A、F1P、S155V、T128A、F165H、G177E、A70M、S140P、A87E、D2I、R159K、T36V、R179C、E119N、T10Y、I172A、A8T、F47V、W103L、R61K、D2V、R179V、D2T、R159N、E119A、G54E、R16Q、G49S、R16I、S51L、S155E、S15M、R179I、T10Q、G12H、R159C、R179T、T163C、R159A、A132S、N157D、G13E、L141M、A41T、R123M、R14M、A8R、Q81P、N24T、T10D、A88F、R61Q、S99K、R179Y、T121A、N112E、S155T、T151V、S99Q、T10E、S92T、T109K、T44C、R123A、A87C、S15F、S155F、D56F、T10F、A83H、R179M、T121D、G13D、P118C、G49F、Q174C、S114E、T86E、F1N、T115C、R127C、R123K、V66N、G12Y、S113A、S15N、A175T、R79T、R123G、R179S、R179N、R123I、P118A、S187E、N112D、A70G、E119L、E119S、R159M、R14H、R179F、A64C、A41S、R179W、N24G、T100Q、P118W、Q81G、G49K、R14L、N55A、R35K、R79V、D2M、T160D、A83D、R179L、S51A、G12P、S99H、N42D、S188E、T10M、L125M、T116N、A70P、Q174S、G65D、S113D、E119Q、A83E、N170L、Q81A、S51C、P118G、Q174T、I28V、S15G和T116G。
22.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换G26I、G26K、G26Q、G26V、G26W、F27V、F27W、I28P、T29E、T129W、T40D、T40Q、R43D、P43H、P43K、P43L、A22C、T40H、P89W、G91L、S18E、F59K、A30M、A30N、G31M、C33M、G161L、G161V、P43N、G26E、N73P、G84C、G84P、G45V、C33L、Y9E、Y9P、A147E、C158H、I28W、A48P、A22S、T62R、S137R、S155P、S155R、G156I、G156L、Q81A、R96C、I4D、I4P、A70P、C105E、C105G、C105K、C105M、C105N、C105S、T128A、T128V、T128G、S140P、G12D、C33N、C33E、T164G、G45A、G156P、S99A、Q167L、S155W、I28T、R96F、A30P、R123W、T40P、T39R、C105P、T100A、C105W、S155K、T46Y、R123F、I4G、S155Y、T46V、A93S、Y57N、Q81S、G186S、G31H、T10Y、G31V、A83H、A38D、R123Y、R79T、C158G、G31Y、Q81P、R96E、A30Y、R159K、A22T、T40N、Y57M、G31N、Q81G、T164L、T121E、T10F、Q146P、R123N、V3R、P43G、Q81H、Q81D、G161I、C158M、N24T、T10W、T128S、T160I、Y176P、S155F、T128C、L125A、P168Y、T62G、F166S、S188A、Q81F、T46W、A70G和A38G。
23.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换S118E、S188V、Y117K、Y117Q、Y117R、Y117V、R127K、R127Q、R123L、T86S、R123I、Q81E、L125M、H32A、S188T、N74F、C33D、F27I、A83M、Q71Y、R123T、V90A、F59W、L141C、N170E、T46F、S51V、G162P、S185R、A41S、R79V、T151C、T107S、T129Y、M180L、F166C、C105T、T160E、P89A、R159T、T183P、S188M、T10L、G25S、N24S、E119L、T107L、T107Q、G161K、G15Q、S15R、G153K、G153V、S188G、A83E、G186P、T121D、G49A、S15C、C105Y、C105A、R127F、Q71A、T10C、Q179K、T86I、W103N、A87S、F166A、A83F、Q123Q、A132C、A143H、T163I、T39V、A93D、V90M、R123K、P134W、G177N、V115I、S155T、T110D、G105L、N170D、T107A、G84V、G84M、L111K、P168I、G154L、T183I、S99G、S15T、A8G、S15N、P189S、S188C、T100Q、A110G、A121A、G12A、R159V、G31A、G154R、T182L、V115L、T160Q、T107F、R159Q、G144A、S92T、T101S、A83R、G12HM S15H、T116Q、T36V、G154、Q81C、V130T、T183A、P118T、A87E、T86M、V150N和N24E。
24.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换T36I、I172T、N24E、N170Y、G77T、G186N、I181L、N73T、A38R、N74G、N24A、G54D、S76D、R123E、I59E、N112E、R35E、R179V、R123D、N24T、R179T、R14L、A38D、V90P、R14Q、R123I、R179D、S76V、R79G、R35L、S76E、S76Y、R79D、R79P、R35Q、R179N、N112D、R179E、G65P、Y75G、V90S、R179M、R35F、R123F、A64I、N24Q、R14I、R179A、R127A、R179I、N170D、R35A、R159F、T109E、R14D、N67D、G49A、N112Q、G78D、T121E、L69S、T116E、V90I、T36S、T36G、N145E、T86D、S51D、R179K、T107E、T129S、L142V、R79A、R79E、A38H、T107S、R123A、N55E、R123L、R159N、G65D、R14N、G65Q、R123Q、N24V、R14G、T116Q、A38N、R159Q、R179Y、A83E、N112L、S99N、G78A、T10N、H85Q、R35Q、N24L、N24H、G49S、R79L、S76T、S76L、G65S、N55F、R79V、G65T、R123N、T86E、Y75F、F1T、S76N、S99V、R79T、N112V、R79M、T107V、R79S、G54E、G65V、R127Q、R159D、T107H、H85T、R35T、T36N、Q81E、R123H、S76I、A38F、V90T和R14T。
25.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换G65L、S99D、T107M、S113T、S99T、G77S、R14M、A64N、R61M、A70D、Q71G、A93D、S92G、N112Y、S15W、R159K、N67G、T10E、R127H、A64Y、R159C、A38L、T160E、T183E、R127S、A8E、S51Q、N7L、G63D、A38S、R35H、R14K、T107I、G12D、A64L、S76W、A41N、R35M、A64V、A38Y、T183I、W103M、A41D、R127K、T36D、R61T、G65Y、G13S、R35Y、R123T、A64H、G49H、A70H、A64F、R127Y、R61E、A64P、T121D、V115A、R123Y、T101S、T182V、H85L、N24M、R127E、N145D、Q71H、S76Q、A64T、G49F、A64Q、T10D、F1D、A70G、R35W、Q71D、N121I、A64M、T36H、A8G、T107N、R35S、N67T、S92A、N170L、N67E、S114A、R14A、R14S、Q81D、S51H、R123S、A93S、R127F、I19V、T40V、S185N、R123G、R179L、S51V、T163D、T109I、A64S、V72I、N67S、R159S、H85M、T109G、Q71S、R61H、T107A、Q81V、V90N、T109A、A38T、N145T、R159A、A110S、Q81H、A48E、S51T、A64W、R159L、N67H、A93E、T116F、R61S、R123V、V3L和R159Y。
26.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换T36I、P89D、A93T、A93S、T36N、N73T、T36G、R159F、T36S、A38R、S99W、S76W、T36P、G77T、G54D、R127A、R159E、H85Q、T36D、S76L、S99N、Y75G、S76Y、R127S、N24E、R127Q、D184F、N170Y、N24A、S76T、H85L、Y75F、S76V、L69S、R159K、R127K、G65P、N74G、R159H、G65Q、G186V、A48Q、T36H、N67L、R14I、R127L、T36Y、S76I、S114G、R127H、S187P、V3L、G78D、R123I、I181Q、R35F、H85R、R127Y、N67S、Q81P、R123F、R159N、S99A、S76D、A132V、R127F、A143N、S92A、N24T、R79P、S76N、R14M、G186E、N24Q、N67A、R127T、H85K、G65T、G65Y、R179V、Y75I、I11Q、A38L、T36L、R159Y、R159D、N24V、G65S、N157D、G186I、G54Q、N67Y、R127G、S76A、A38S、T109E、V66H、T116F、R123L、G49A、A64H、T36W、D184H、S99D、G161K、P134E、A64F、N67G、S99T、D2Q、S76E、R16Q、G54N、N67V、R35L、Q71I、N7L、N112E、L69H、N24H、G54I、R16L、N24M、A64Y、S113A、H85F、R79G、I11A、T121D、R61V和G65L。
27.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换N67Q、S187Q、Q71H、T163D、R61K、R159V、Q71F、V31F、V90I、R79D、T160E、R123Q、A38Y、S113G、A88F、A70G、I11T、G78A、N24L、S92G、R14L、D184R、G54L、N112L、H85Y、R16N、G77S、R179T、V80L、G65V、T121E、Q71D、R16G、P89N、N42H、G49F、I11S、R61M、R159C、G65R、T183I、A93D、L111E、S51Q、G78N、N67T、A38N、T40V、A64W、R159L、T10E、R179K、R123E、V90P、A64N、G161E、H85T、A8G、L142V、A41N、S185I、Q71L、A64T、R16I、A38D、G54M、N112Q、R16A、R14E、V80H、N170D、S99G、R179N、S15E、G49H、A70P、A64S、G54A、S185W、R61H、T10Q、A38F、N170L、T10L、N67F、G12D、D184T、R14N、S187E、R14P、N112D、S140A、N112G、G49S、L111D、N67M、V150L、G12Y、R123K、P89V、V66D、G77N、S51T、A8D、I181H、T86N、R179D、N55F、N24S、D184L、R61S、N67K、G186L、F1T、R159A、I11L、R61T、D184Q、A93E、Q71T、R179E、L69W、T163I、S188Q、L125V、A38V、R35A、P134G、A64V、N145D、V90T和A143S。
28.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换T36I、N170Y、A38R、R79P、G77T、L69S、N73T、S76V、S76Y、R179V、T36N、N55F、R159F、G54D、G65P、L69H、T36G、G177M、N24E、N74G、R159E、T36S、Y75G、S76I、S76D、A8R、A24A、V90P、R159C、G65Q、T121E、A8V、S76L、T109E、R179M、A8T、T107N、G186E、S76W、R123E、A38F、T36P、N67G、Y75F、S76N、R179I、S187P、N67V、V90S、R127A、R179Y、R35F、N145S、G65S、R61M、S51A、R179N、R123D、N24T、N55E、R79C、G186V、R123I、G161E、G65Y、A38S、R14L、V90I、R79G、N145E、N67L、R127S、R150Y、M180D、N67T、A93D、T121D、Q81V、T109I、A93E；T107S、R179T、R179L、R179K、R159D、R179A、R79E、R123F、R79D、T36D、A64N、L142V、T109A、I172V、A83N、T85A、R179D、A38L、I126L、R127Q、R127L、L69W、R127K、G65T、R127H、P134A、N67D、R14M、N24Q、A143N、N55S、N67M.、S51D、S76E、T163D、A38D、R159K、T183I、G63V、A8S、T107M、H85Q、N112E、N67F、N67S、A64H、T86I、P134E、T182V、N67Y、A64S、G78D、V90T、R61T、R16Q、G65R、T86L、V90N、R159Q、G54I、S76C、R179E、V66D、L69V、R127Y、R35L、R14E和T86F。
29.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换G186I、A64Q、T109G、G64L、N24L、A8E、N112D、A38H、R179W、S114G、R123L、A8L、T129S、N170D、R159N、N67C、S92C、T107A、G54E、T107E、T36V、R127T、A8N、H85L、A110S、N170C、A64R、A132V、T36Y、G63D、W103M、T151V、R123P、W103Y、S76T、S187T、R127F、N67A、P171M、A70S、R159H、S76Q、L125V、G54Q、G49L、R14I、R14Q、A83I、V90L、T183E、R159A、T101S、G65D、G54A、T107Q、Q71M、T86E、N24M、N55Q、R61V、P134D、R96K、A88F、N145Q、A64M、A64T、N24V、S140A、A8H、A64I、R123Q、T183Q、N24H、A64W、T62I、T129G、R35A、T40V、I11T、A38N、N145G、A175T、G77Q、T109H、A8P、R35E、T109N、A110T、N67Q、G63P、H85R、S92G、A175V、S51Q、G63Q、T116F、G65A、R79L、N145P、L69Q、Q146D、A83D、F166Y、R123A、T121L、R123H、A70P、T132W、S76A、A64F、T107H、G186L、Q81I、R123K、A64L、A67R、V3L、S187E、S161K、T86M、I4M、G77N、G49A、A41N、G54M、T107V、Q81E、A38I、T109L、T183K、A70G、Q71D、T183L、Q81H、A64V、A93Q、S188E、S51F、G186P、G186T、R159L、P134G、N145T、N55V、V66E、R159V、Y176L和R16L。
30.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括选自下列的至少一个置换T36I、N73T、P134R、G77T、N24E、P134E、P134L、N24T、I59F、L69S、T10G、G186S、S140A、T36S、N112S、N24Q、T36G、P134H、G34A、N24A、A38T、E119R、G186E、R14M、S76W、T10A、A38F、L142V、N170Y、P134V、A22V、S76V、T182V、S76Y、I11A、I11S、S118A、G186V、L69H、I11T、T36N、G65V、G49F、V90I、R179V、R16K、T163I、R127F、R159K、N24L、Q71I、S15G、S15F、R14G、S99N、T10L、S15E、T107R、F166Y、G49A、V90P、P134D、Q167N、S76D、S51A、V80A、V150L、N74G、T107K、S76L、N24V、G12I、S99V和R16N。
31.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸包括Arg14、Ser15、Arg16、Cys17、His32、Cys33、Phe52、Asp56、Thr100、Val115、Thr116、Tyr117、Pro118、Glu119、Ala132、Glu133、Pro134、Gly135、Asp136、Ser137、Thr151、Ser152、Gly153、Gly154、Ser155、Gly156、Asn157、Thr164和Phe165。
32.权利要求31的蛋白酶，其中所述蛋白酶的催化三联体包括His32、Asp56和Ser137。
33.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括Cys131、Ala132、Glu133、Pro134、G1y135、Thr151、Ser152、Gly153、Gly154、Ser155、Gly156、Asn157和Gly162、Thr163和Thr164。
34.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列包括Phe52、Tyr117、Pro118和Glu119。
35.权利要求11的蛋白酶，其中所述蛋白酶的氨基酸序列具有Gly154与底物主链之间的主链-主链氢键。
36.权利要求11的蛋白酶，其中所述蛋白酶包括三个二硫键。
37.权利要求11的蛋白酶，其中所述变体相比野生型纤维单胞菌69B4蛋白酶，具有改变的底物特异性。
38.权利要求11的蛋白酶，其中所述变体相比野生型纤维单胞菌69B4蛋白酶，具有改变的pI。
39.权利要求11的蛋白酶，其中所述变体相比野生型纤维单胞菌69B4蛋白酶，具有改善的稳定性。
40.权利要求11的蛋白酶，其中所述变体显示出改变的表面特性。
41.权利要求40的蛋白酶，其中所述变体包括至少一个置换的突变，所述置换发生在选自1、2、4、7、8、10、11、12、13、14、15、16、22、24、25、32、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、57、59、61、62、63、64、65、66、67、68、69、71、73、74、75、76、77、78、79、80、81、83、84、85、86、87、88、89、90、91、92、93、95、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、123、124、126、127、128、130、131、132、133、134、135、137、143、144、145、146、147、148、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、170、171、173、174、175、176、177、178、179、180、181、182、183和184的位置。
42.权利要求1的蛋白酶，其中所述蛋白酶是相比野生型蛋白酶具有至少一个改进的特性的变体蛋白酶。
43.权利要求42的蛋白酶，其中所述至少一个改进的特性选自酸稳定性、热稳定性、酪蛋白水解、角蛋白水解、清洗性能和LAS稳定性。
44.表达载体，其包含编码权利要求11的蛋白酶变体的多核苷酸序列。
45.宿主细胞，其包含权利要求44所述表达载体。
46.权利要求45的宿主细胞，其中所述宿主选自芽孢杆菌属某种(Bacillus sp.)、链霉菌属某种(Streptomyces sp.)、曲霉属某种(Aspergillus sp.)、木霉属某种(Trichoderma sp.)。
47.丝氨酸蛋白酶，其由权利要求46所述的宿主细胞产生。
48.变体蛋白酶，其包括选自SEQ ID NOS54、56、58、60、62、64、66、68、70、72、74、76和78的氨基酸序列。
49.权利要求42的变体蛋白酶，其中所述氨基酸序列由选自SEQ ID NOS53、55、57、59、61、63、65、67、69、71、73、75和77的多核苷酸序列编码。
50.表达载体，其包含编码权利要求49的蛋白酶变体的多核苷酸序列。
51.宿主细胞，其包含权利要求50所述表达载体。
52.权利要求51的宿主细胞，其中所述宿主选自芽孢杆菌属某种、链霉菌属某种、曲霉属某种和木霉属某种。
53.丝氨酸蛋白酶，其由权利要求52所述的宿主细胞产生。
54.组合物，其包含权利要求1的分离的丝氨酸蛋白酶的至少一部分，其中所述蛋白酶由选自SEQ ID NO1、SEQ ID NO2、SEQ ID NO3和SEQ ID NO4的多核苷酸序列编码。
55.权利要求54的多核苷酸序列，其中所述序列包括SEQ ID NO1的至少一部分。
56.表达载体，其包含权利要求55的多核苷酸序列。
57.宿主细胞，其包含权利要求56所述表达载体。
58.权利要求57的宿主细胞，其中所述宿主选自芽孢杆菌属某种、链霉菌属某种、曲霉属某种和木霉属某种。
59.丝氨酸蛋白酶，其由权利要求58的所述宿主细胞产生。
60.变体丝氨酸蛋白酶，其中所述蛋白酶包括对应于SEQ ID NO8中的氨基酸位置的至少一个置换，并且其中，相比野生型纤维单胞菌69B4蛋白酶，在选自角蛋白水解、热稳定性、酪蛋白活性、LAS稳定性和清洗中的至少一个特性中，所述变体蛋白酶具有更好的性能。
61.分离的多核苷酸，包括下述核苷酸序列(i)与SEQ ID NO4具有至少70％同一性的序列，或(ii)在中度至高严紧型条件下能够与来自SEQ ID NO4中阐述的核苷酸序列的探针杂交的序列；(iii)与SEQ ID NO4中阐述的核苷酸序列互补的序列。
62.载体，其包含权利要求61的多核苷酸。
63.宿主细胞，其用权利要求62的载体转化。
64.多核苷酸，其包括与SEQ ID NO4中阐述的序列的至少一部分互补的序列。
65.产生具有蛋白酶活性的酶的方法，包括(a)用包含多核苷酸的表达载体转化宿主细胞，所述多核苷酸与SEQ ID NO4具有至少70％的序列同一性；(b)在适合于所述宿主细胞产生所述蛋白酶的条件下，培养所述转化的宿主细胞；和(c)回收所述蛋白酶。
66.权利要求65的方法，其中所述宿主细胞是链霉菌属、曲霉属、木霉属或芽孢杆菌属种。
67.探针，其包括与SEQ ID NO4的相应片段基本上相同的4至150个多核苷酸序列，其中所述探针被用于检测编码具有蛋白水解活性的酶的核酸序列，并且其中，所述核酸序列获自微球菌亚目的成员。
68.权利要求67的探针，其中所述微球菌亚目是纤维单胞菌属某些种。
69.权利要求68的探针，其中所述纤维单胞菌属是纤维单胞菌属菌株69B4。
70.清洗组合物，其包含获自微球菌亚目的成员的至少一种丝氨酸蛋白酶。
71.权利要求70的清洗组合物，其中所述蛋白酶是获自选自纤维单胞菌属、厄氏菌属、纤维微细菌属、木聚糖细菌属和原小单孢菌属的生物体的丝氨酸蛋白酶。
72.权利要求71的清洗组合物，其中所述蛋白酶获自纤维单胞菌69B4。
73.权利要求72的清洗组合物，其中所述蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
74.权利要求73的清洗组合物，其中所述丝氨酸蛋白酶与SEQ ID NO8中阐述的氨基酸序列具有至少60％的氨基酸同一性。
75.清洗组合物，其包含丝氨酸蛋白酶，其中所述丝氨酸蛋白酶与权利要求70的丝氨酸蛋白酶具有免疫交叉反应性。
76.清洗组合物，其包含丝氨酸蛋白酶，其中所述丝氨酸蛋白酶与权利要求72的丝氨酸蛋白酶具有免疫交叉反应性。
77.权利要求70的清洗组合物，其中所述蛋白酶是变体蛋白酶，该变体蛋白酶具有包括至少一个氨基酸置换的氨基酸序列，所述置换发生在与纤维单胞菌69B4蛋白酶中的位置等同的位置，所述纤维单胞菌69B4蛋白酶具有SEQ ID NO8中阐述的氨基酸序列。
78.权利要求77的清洗组合物，其中所述置换发生在与纤维单胞菌69B4蛋白酶中的位置2、8、10、11、12、13、14、15、16、24、26、31、33、35、36、38、39、40、43、46、49、51、54、61、64、65、67、70、71、76、78、79、81、83、85、86、90、93、99、100、105、107、109、112、113、116、118、119、121、123、127、145、155、159、160、163、165、170、174、179、183、184、185、186、187和188等同的位置，所述纤维单胞菌69B4蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
79.权利要求77的清洗组合物，其中所述置换发生在与纤维单胞菌69B4蛋白酶中的位置1、4、22、27、28、30、32、41、47、48、55、59、63、66、69、75、77、80、84、87、88、89、92、96、110、111、114、115、117、128、134、144、143、146、151、154、156、158、161、166、176、177、181、182、187和189等同的位置，所述纤维单胞菌69B4蛋白酶包括SEQ ID NO8中阐述的氨基酸序列。
80.权利要求77的清洗组合物，其中所述蛋白酶包括至少一个氨基酸置换，所述置换发生在与SEQ ID NO8中阐述的氨基酸序列等同的氨基酸序列的位置14、16、35、36、65、75、76、79、123、127、159和179。
81.权利要求80的清洗组合物，其中所述蛋白酶包括选自R14L、R16I、R16L、R16Q、R35F、T36S、G65Q、Y75G、N76L、N76V、R79T、R123L、R123Q、R127A、R127K、R127Q、R159K、R159Q和R179Q的至少一个突变。
82.权利要求81的清洗组合物，其中所述蛋白酶包括选自R16Q/R35F/R159Q、R16Q/R123L、R14L/R127Q/R159Q、R14L/R179Q、R123L/R127Q/R179Q、R16Q/R79T/R127Q和R16Q/R79T的一组突变。
83.权利要求81的清洗组合物，其中所述蛋白酶包括下述突变R123L、R127Q和R179Q。
84.权利要求80的清洗组合物，其中所述变体丝氨酸蛋白酶包括对应于SEQ IDNO8中的氨基酸位置的至少一个置换，并且其中，相比野生型纤维单胞菌69B4蛋白酶，在选自角蛋白水解、热稳定性、酪蛋白活性、LAS稳定性和清洗中的至少一种特性中，所述变体蛋白酶具有更好的性能。
85.权利要求70的清洗组合物，其中所述变体蛋白酶包括选自SEQ ID NOS54、56、58、60、62、64、66、68、70、72、74、76和78的氨基酸序列。
86.权利要求70的清洗组合物，其中所述变体蛋白酶氨基酸序列由选自SEQ IDNOS53、55、57、59、61、63、65、67、69、71、73、75和77的多核苷酸序列编码。
87.清洗组合物，其包含清洗有效量的蛋白水解酶和合适的清洗制剂，所述酶包括与SEQ ID NO4具有至少70％序列同一性的氨基酸序列。
88.权利要求87的清洗组合物，还包括选自蛋白酶、淀粉酶、脂酶、甘露聚糖酶、果胶酶、角质酶、氧化还原酶、半纤维素酶和纤维素酶的一种或多种其他的酶或酶衍生物。
89.组合物，其包括权利要求1的丝氨酸蛋白酶和至少一种稳定剂。
90.权利要求89的组合物，其中所述稳定剂选自硼砂、甘油和竞争性抑制剂。
91.权利要求90的组合物，其中所述竞争性抑制剂使得所述丝氨酸蛋白酶对阴离子表面活性剂稳定。
92.权利要求1的组合物，其中所述丝氨酸蛋白酶是自溶稳定性变体。
93.清洗组合物，其包含至少0.0001％重量的权利要求1的丝氨酸蛋白酶，以及可选地，包括辅助成份。
94.权利要求93的清洗组合物，其中所述组合物包括辅助成份。
95.权利要求93的清洗组合物，所述组合物包括足够数量的pH调节剂，以使得所述组合物的净pH在约3至约5之间，所述组合物基本上无在pH为约3至约5时水解的物质。
96.权利要求95的清洗组合物，其中所述水解的物质包括表面活性剂物质。
97.权利要求95的清洗组合物，所述清洗组合物是液体组合物。
98.权利要求96的清洗组合物，其中所述表面活性剂物质包括烷基硫酸钠表面活性剂，其包括环氧乙烷部分。
99.清洗组合物，其包括至少一种酸稳定性酶，所述清洗组合物包括足够数量的pH调节剂，以使得所述组合物的净pH在约3至约5之间，所述组合物基本上无在pH为约3至约5时水解的物质。
100.权利要求99的清洗组合物，其中所述水解的物质包括表面活性剂物质。
101.权利要求99的清洗组合物，所述清洗组合物是液体组合物。
102.权利要求99的清洗组合物，其中所述表面活性剂物质包括烷基硫酸钠表面活性剂，其包括环氧乙烷部分。
103.权利要求95的清洗组合物，所述组合物包括合适的辅助成份。
104.权利要求99的清洗组合物，所述组合物包括合适的辅助成份。
105.权利要求95的组合物，所述组合物包括约0.001％至约0.5％重量的ASP。
106.权利要求105的组合物，所述组合物包括约0.01％至约0.1％重量的ASP。
107.清洗方法，所述方法包括步骤a)将表面和/或包括织物的物品与权利要求94的清洗组合物和/或包括权利要求98的清洗组合物的组合物接触；和b)可选地，洗涤和/或漂洗所述表面或物质。
108.清洗方法，所述方法包括步骤a)将表面和/或包括织物的物品与权利要求99的清洗组合物和/或包括权利要求100的清洗组合物的组合物接触；和b)可选地，洗涤和/或漂洗所述表面或物质。
109.动物饲料，其包含权利要求1的丝氨酸蛋白酶。
全文摘要
本发明提供了新颖的丝氨酸蛋白酶，编码这些酶的新颖遗传物质，和获自微球菌亚目某些种(Micrococcineae spp.)的蛋白水解蛋白质，由此开发的变体蛋白质，其中微球菌亚目某些种包括但不限于纤维单胞菌属某些种(Cellulomonasspp.)。特别地，本发明提供了获自纤维单胞菌属某些种的蛋白酶组合物，编码蛋白酶的DNA，包括编码蛋白酶的DNA的载体，用载体DNA转化的宿主细胞，和由宿主细胞产生的酶。本发明也提供了包括获自微球菌亚目某些种的蛋白酶的清洗组合物(例如洗涤剂组合物)、动物饲料组合物和纺织品和皮革加工组合物，其中微球菌亚目某些种包括但是不限于纤维单胞菌属某些种。在可选择的实施方案中，本发明提供了衍生自本文中描述的野生型蛋白酶的突变体(即，变体)蛋白酶。也发现这些突变体蛋白酶可用于大量应用中。
文档编号C12N9/64GK1906303SQ200480040520
公开日2007年1月31日申请日期2004年11月19日优先权日2003年11月19日
发明者B·E·约翰斯, M·科尔克曼, C·莱夫朗, H·吴, A·J·波洛斯, E·S·薛德洛斯基, A·肖, W·A·H·范德克雷杰, L·范马雷维杰克申请人:金克克国际有限公司, 宝洁公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：B.E.约翰斯;M.科尔克曼;C.莱夫朗;H.吴;A.J.波洛斯;E.S.薛德洛斯基;A.肖;W.A.H.范德克雷杰;L.范马雷维杰克
技术所有人：金克克国际有限公司;宝洁公司
我是此专利的发明人

上一篇：用于生产重组蛋白的翻译融合伙伴的快速筛选方法和由此筛选的翻译融合伙伴的制作方法
上一篇：脱水焙烤方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。