纤维素酶、编码它们的核酸及其制备和应用的方法

文档序号:432077阅读:786来源:国知局

专利名称::纤维素酶、编码它们的核酸及其制备和应用的方法纤维素酶、编码它们的核酸及其制备和应用的方法5政府资助本发明涉及分子和细胞生物学和生物化学。一方面,本发明提供具有纤维素酶活性——例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽、编码这些多肽的多核苷酸,以及制备和使用这些多核苷酸和多肽的方法。一方面,本发明涉及具有纤维素酶活性例如内切葡聚糖酶、纤维二15糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——包括热稳定的和耐热的活性——的多肽,和编码这些酶的多核苷酸,以及制备和使用这些多核苷酸和多肽。本发明的多肽可用于各种制药、农业和工业环境中。
背景技术
:20纤维素是地球上最丰富的可再生资源。它由重复单元是纤维二糖的P-l,4葡萄糖单元的线性链组成,纤维二糖是具有如图5所示结构的葡萄糖二聚体。该高分子通过一组酶进行降解,包括随机水解纤维素高分子的内切葡聚糖酶(EG)以及从纤维素除去末端纤维二糖残基的纤维二糖水解酶(CBH)。纤维二糖和纤维寡糖被P-葡糖苷酶(BG)水解成葡萄糖。所有这三种酶对于纤维素完全分解成葡萄糖是25必需的。对于这三种酶的每一种,存在行使相同功能的不同结构的变体。此外,除了不同结构变体外,已知真菌和细菌还产生多种形式的相同结构变体。已知一些厌氧细菌和真菌以多酶复合物的形式产生这些酶,这一事实进一步使该系统复杂化,所述多酶复合物含有都附着于酶支架上的多种酶,分子量在2百万道尔顿以上。为什么这样的酶复合系统对于这样的简单分子是必需的?一些30研究者认为该复杂性原因在于底物的顽拗性质。纤维素链形成微纤维,其通过相邻链的氢键键合堆积成晶体基质。该结构对于化学降解或酶促降解是高度耐受的。由于它们对纤维素的酶促攻击性质,CBH被认为是该晶体纤维素降解中的关键酶。与CBH不同,EG具有开放的裂缝,其以垂直角度攻击纤维素链。CBH通过含有活性位点的坑道直接攻击所述链。目前认为,纤维素链进入所述坑道,35同时,相邻的氢键键合被破坏。一旦纤维二糖水解酶在该底物上建立起"立足点",然后,EG可以进来,并更容易攻击底物。已知的CBH的一个主要缺陷是其低的催化活性。一些观点认为,低活性是源于如下事实来自水解的能量被转化成动能,以破坏氢键并使酶能够沿着底物移动。CBH是外切作用酶并在90个糖基水解酶家族中的6个家族中发现。它们5包括家族5、6、7、9、10和48。家族5含有许多不同类型的糖基水解酶,包括纤维素酶、甘露聚糖酶和木聚糖酶。尽管在该家族中大部分纤维素酶是内切葡聚糖酶,仍存在纤维二糖水解酶的例子,最为人知的是来自热纤梭菌(C7o^^/"/mAeAvOCe//Mw)的CdO。家族6仅含有内切葡聚糖酶或纤维二糖水解酶,其中纤维二糖水解酶成员比内切葡聚糖酶更多。该酶具有反向机制(invertingmechanism),10并且晶体学研究表明,所述酶具有扭曲的a/l3桶结构,其含有七个而非八个平行的J3链。家族7酶也由内切葡聚糖酶和纤维二糖水解酶组成,其中纤维二糖水解酶更多,并且已知的成员仅来自真菌。该酶具有保持机构(retainingmechanism),并且晶体结构示出了P-胶冻巻结构。家族9含有内切葡聚糖酶、纤维二糖水解酶和卩-葡糖苷酶,其中内切葡聚糖酶占优势。然而,嗜热放线菌(77jeAvno6i/Wfl/^OJ)产15生内切/外切-l,4-葡聚糖酶,其晶体结构显示出(a/a)6桶状折叠。该酶具有内切和外切葡聚糖酶CBH的特征。家族10仅含有2个成员,被描述为纤维二糖水解酶,其余主要被描述为木聚糖酶。家族10的纤维二糖水解酶和木聚糖酶具有对甲基-伞形基纤维二糖苷的活性。家族48主要含有细菌和厌氧真菌纤维二糖水解酶和内切葡聚糖酶。结构是类似于家族9的(a/a)6桶状折叠。20存在对用于公路车辆的较不昂贵和可再生的燃料来源的需求。如果新的燃料来源在燃烧之后产生无害的终产物,则它们将更加有吸引力。乙醇提供了石油基燃料的有吸引力的可替代选择,并且可以通过衍生自淀粉或木质纤维素的单体糖发酵获得。然而,目前的经济学不支持乙醇的广泛使用,原因在于生产乙醇的高成本。一个目标在于降低成本的研究领域是增加用于从木质纤维素产生可发酵25糖类的酶的技术效率。更有效地消化原料的酶的开发将转变成降低的乙醇生产成本。更有效的工艺将降低美国对进口油的依赖以及与该依赖性相关的价格波动。使用更清洁的运输燃料例如生物乙醇还可以降低净C02排放,其被认为是造成全球变暖的部分原因。30发明概述本发明提供了纤维素酶,例如,内切葡聚糖酶、纤维二糖水解酶和/或P-葡糖苷酶(多种P-葡糖苷酶),以及制备和使用它们的方法。一方面,本发明的酶具有增加的催化速率,以改善底物水解过程。在催化速率上这种增加的效率导致在生产糖类上增加的效率,这可用于工业应用中,例如,如此产生的糖可被微生35物用于乙醇生产。一方面,本发明提供了高活性(例如,具有增加的催化速率)的纤维二糖水解酶、内切葡聚糖酶和P-葡糖苷酶。本发明提供了工业应用(例如,生物物质(biomass)转化为乙醇),其利用了本发明的具有降低的酶成本的酶,例如,在生物物质转化为乙醇的过程中降低的成本。因此,本发明提供了由任何生物质生产生物乙醇和含生物乙醇的组合物的有效率的工艺,所述含生物乙醇的组合物包括含有生物乙醇的燃料。5—方面,本发明的酶具有葡聚糖酶例如内切葡聚糖酶活性,例如催化内部内-(3-l,4-和域P-l,3-葡聚糖键的水解。一方面,内切葡聚糖酶活性(例如,内切1,4-P-D-葡聚糖4-葡聚糖水解酶活性)包括水解纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)地衣聚糖(lichenin)中的1,4-和域P-l,3-P-D-糖苷键、混合的P-l,3葡聚糖中的P-l,4键,例如谷类P-D-葡聚糖或木葡聚糖以及含有纤维10质部分的其它植物材料。—方面,本发明的酶具有内切葡聚糖酶(例如,内切-(3-l,4-葡聚糖酶,EC3.2丄4;内切-p-l,3(l)-葡聚糖酶,EC3.2丄6;内切-p-l,3-葡聚糖酶,EC3.2丄39)活性并且可以水解纤维素和葡聚糖中的内部p-l,4-和/或P-l,3-糖苷键,以产生较小分子量的葡萄糖和葡萄糖寡聚体。本发明提供了使用本发明的这些酶产生更小分子量15的葡萄糖和葡萄糖寡聚体的方法。—方面,本发明的酶用于产生葡聚糖,例如,由1,4-p-和/或1,3-糖苷键接的D-吡喃葡糖形成的多糖。一方面,本发明的内切葡聚糖酶被用在食品工业中如烘焙及水果和蔬菜加工、农业废物的分解、动物饲料的生产、纸浆和纸的生产、纺织物生产以及家用和工业清洁剂。一方面,通过微生物如真菌和/或细菌,生产20本发明的酶,例如内切葡聚糖酶。—方面,本发明的酶如内切葡聚糖酶被用于水解|3-葡聚糖,p-葡聚糖是谷物主要的非淀粉多糖。根据品种和生长条件,多糖的葡聚糖含量可显著变化。该多糖的物理化学性质是在氧化条件下产生粘性溶液或者甚至是凝胶。此外,葡聚糖具有高的水结合能力。所有这些特征给几个行业带来了问题,包括酿造、烘焙、25动物营养。在酿造应用中,葡聚糖的存在导致麦芽汁过滤性和形成浑浊的问题。在烘焙应用中(尤其对于曲奇和脆饼),葡聚糖可产生发粘面团,其难以进行机械加工和减小饼干尺寸。因此,本发明的酶如内切葡聚糖酶被用于降低含P-葡聚糖的组合物中P-葡聚糖的量,例如,本发明的酶被用在降低溶液或凝胶的粘度的工艺中;用于降低组合物例如含P-葡聚糖的组合物的水结合能力;在酿造工艺中(例30如,用于增加麦芽汁过滤性和降低混浊),用于降低面团的粘性,例如,用于制作曲奇、面包、饼干等等的面团。此外,碳水化合物(例如,P-葡聚糖)参与烘焙产品的快速再水化,导致松脆性损失和縮短的货架期。因此,本发明的酶,例如内切葡聚糖酶,被用于保持松脆性、增加松脆性或降低松脆性的损失速率,以及增加任何含碳水化合物食35品、饲料或饮料的货架期,例如含p-葡聚糖的食品、饲料或饮料。本发明的酶,例如内切葡聚糖酶,被用于降低消化道内容物(例如,在动物中,如反刍动物或人中)的粘性,例如,含有谷物膳食的那些。因此,在可选的方面,本发明的酶,例如内切葡聚糖酶,被用于正面影响食品或饲料的可消化性以及动物(例如,人或家畜)生长速率,以及在一方面,被用于产生更高的饲料转化效率。对于谷物食物的单胃动物饲料应用,p-葡聚糖是消化道内容物的粘性5的促成因素,并且从而负面影响饲料的可消化性和动物生长速率。对于反刍动物,这些P-葡聚糖代表纤维摄入的基本成分,而葡聚糖的更完全的消化将促进更高的饲料转化效率。因此,本发明提供了含有本发明的内切葡聚糖酶的动物饲料和食品,并且在一方面,这些酶在动物消化道中是有活性的,例如在胃和/或肠中是有活性的。10本发明的酶,例如内切葡聚糖酶,被用于消化纤维素或任何含P-l,4-连接葡聚糖的合成或天然的材料,包括在任何植物材料中发现的那些。本发明的酶,例如内切葡聚糖酶,被用作例如在木材加工、纸桨和/或纸工业中、在纺织品制造中以及在家用和工业清洁剂中和/或在生物物质废物处理中消化纤维素的商业酶。—方面,本发明提供了含有本发明的酶、多肽或多核苷酸的组合物(例如,15药物组合物、食物、饲料、药物、饮食补充物)。这些组合物可以以各种形式加以配制,例如片剂、凝胶、丸剂、植入物、液体、喷剂、粉末、食物、饲料小丸或任何类型的胶囊化形式。本发明提供了分离的或重组的核酸,包括在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、20600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多残基的区域内,与本发明的示例性核酸具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、2567%、68°/。、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的核酸序列,本发明的示例性核酸包括SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,30SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,SEQIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDNO:31,SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:41,SEQIDNO:43,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,SEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQEDNO:61,SEQIDNO:63,SEQIDNO:65,35SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQEDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQ5IDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163和SEQIDNO:165;也参见下面的表l、2和3、实施例101和4,以及序列表;以及在可选的方面,这些核酸编码至少一个具有纤维素酶活性例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,或者编码能够产生可特异性结合本发明多肽的抗体的多肽,或者,这些核酸可用作鉴别或分离编码纤维素酶的核酸的探针,或用于抑制表达纤维素酶的核酸的表达(所有这些方面都称为"本发明的核酸")。一方面,所述序列同一性通过运用15了序列比较算法的分析或通过视觉观察来确定。本发明的核酸也包括,编码本发明的示例性酶的分离的或重组的核酸,本发明的示例性酶包括具有如下所示序列的多肽SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQID20NO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQID25NO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQID30NO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166,也参见下面的表1、352和3、实施例1和4,和序列表,及其子序列和其变体。一方面,该多肽具有纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。—方面,本发明提供了编码纤维素酶的核酸,例如编码内切葡聚糖酶、纤维二糖水解酶和/或P-葡糖苷酶的核酸,其共同的新颖性在于它们来源于混合培养物。本发明提供了从混合培养物分离的编码纤维素降解酶的核酸,其包括本发明5的多核苷酸,例如在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、卯0、950、1000、1050、1100、1150或更多残基的区域内,与本发明的示例性核酸具有至少大约10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、1072%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的序列,本发明的示例性核酸例如SEQIDNO:l,SEQIDN0:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,15SEOIDNO:21,SEOIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQ25IDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163和30SEQIDNO:165;也参见下面的表1、2和3、实施例1和4,以及序列表。—方面,本发明提供了编码纤维素酶的核酸,例如编码内切葡聚糖酶、纤维二糖水解酶和/或P-葡糖苷酶的核酸,包括本发明的示例性多核苷酸序列,也参见下面的表l、2和3、实施例1和4,和序列表,以及由它们编码的多肽,包括本发明的酶,诸如本发明的示例性多肽,如SEQIDNO:2,SEQIDNO:4,SEQID35NO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQID20SEQIDNO:21,SEC)IDNO:31'SEQIDNO:41,SEQIDNO:51,SEQIDNO:61,SEQIDNO:71,SEQIDNO:81,SEQIDNO:91:SEQIDNO:23,SEQIDNO:33,SEQIDNO:43,SEQIDNO:53,SEQIDNO:63,SEQIDNO:73,SEQIDNO:83,SEQIDNO:93,NO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQID5NO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:llO,SEQIDNO:112,SEQIDNO:114,10SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQID15NO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166,也参见表1和序列表,其共同的新颖性在于它们来源于共同的来源,例如环境来源。一方面,本发明也提供了编码纤维素酶的核酸,例如编码内切葡聚糖酶、纤维二糖水解酶和/或卩-葡糖苷酶的核酸,其共同的新颖性在于它们来源于环境来源,例如混合的环境来源。20—方面,序列比较算法是BLAST2.2.2版本算法,其中过滤设置(filteringsetting)被设置为blastall-pblastp~d"nrpataa"-FF,所有其它选项被设置为缺省。本发明的另一方面是分离的或重组的核酸,包括本发明的核酸序列的至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、251100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个连续碱基、与其基本相同的序列、以及与其互补的序列。—方面,所述分离的或重组的核酸编码具有纤维素酶活性的多肽,例如,30具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,其是热稳定的。该多肽在包括如下温度范围的条件下可以保持纤维素酶活性大约37。C到大约95'C之间;大约55'C到大约85'C之间;大约70'C到大约95'C之间;或大约9(TC到大约95'C之间。该多肽在如下范围内的温度下可以保持纤维素酶活性在大约rC到大约5'C之间,大约5'C到大约15'C之间,大约15'C到大约2535。C之间,大约25'C到大约37'C之间,大约37'C到大约95'C、96'C、97'C、98'C或99。C之间,大约55'C到大约85'C之间,大约70'C到大约75'C之间,或大约90。C到大约99。C,或95'C、96°C、97°C、98'C或99。C,或更高温度。另一方面,所述分离的或重组的核酸编码具有纤维素酶活性的多肽,例如,具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,其是耐热的。该多肽在暴露于如下范围内的温度后可以保持纤维素酶活性37'C5以上到大约95'C,或55'C以上到大约85'C的范围之内的任何温度。该多肽在暴露于如下范围内的温度后可以保持纤维素酶活性在大约1'C到大约5'C之间,大约5'C到大约15'C之间,大约15'C到大约25'C之间,大约25'C到大约37t:之间,大约37'C到大约95°C、96°C、97'C、98'C或99'C之间,大约55。C到大约85'C之间,大约70'C到大约75'C之间,或大约90'C到大约95'C之间,或更高温度。一方面,10该多肽在暴露于如下范围内的温度后保持纤维素酶活性9(TC以上到大约99°C,或95。C、96°C、97°C、98'C或99'C,在大约pH4.5,或更高。本发明提供了分离的或重组的核酸,包括在严紧条件下与本发明的核酸杂交的序列,所述本发明的核酸包括本发明的示例性序列,例如如下所示的序列SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQID15NO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDSEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDSEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDSEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDSEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQIDSEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDSEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDSEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDSEQIDNO:95,SEQIDNO:97,SEQIDNO:99'SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,25SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115'SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153'SEQIDNO:155'30SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163或SEQIDNO:165(也参见下面的表l、2和3、实施例1和4),或其片段或其子序列。一方面,该核酸编码具有纤维素酶活性的多肽,例如,具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。该核酸的长度可以是至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、35500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多残基,或基因的全长或转录物的全长。一方面,严紧条件包括洗涤步20NO:21NO:31NO:41NO:51NO:61NO:71NO:81NO:91SEQIDNO:23'SEQIDNO:33,SEQIDNO:43,SEQIDNO:53,SEQIDNO:63,SEQIDNO:73,SEQIDNO:83,SEQIDNO:93,骤,包括在0.2XSSC中在大约65'C的温度洗涤大约15分钟。本发明提供了核酸探针,其用于鉴定或分离编码具有纤维素酶活性——例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸,其中所述探针含有核酸序列的至少大约10、15、20、25、30、35、40、545、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多个连续碱基,所述核酸序列包括本发明的序列或其片段或其子序列,其中所述探针通过结合或杂交来鉴定核酸。该探针可以包括寡核苷酸,该寡核苷酸含有核酸序列的至少大约10到50、大约20到60、大约30到70、大约40到80或大约6010至ljl00个连续碱基,所述核酸序列包括本发明的序列或其片段或其子序列。本发明提供了核酸探针,其用于鉴定或分离编码具有纤维素酶活性——例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——的多肽的核酸,其中所述探针包括含有本发明核酸的至少大约10、15、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、15650、700、750、800、850、900、950、1000或更多残基所示的序列的核酸,所述本发明核酸例如与本发明的示例性核酸具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、2094%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的多核苷酸。一方面,序列同一性通过运用序列比较算法的分析或通过视觉观察来确定。在可选的方面中,该探针可以包括寡核苷酸,该寡核苷酸含有本发明的核酸序列或其子序列的至少大约10到50、大约20到60、大约30到70、大约40到80或大约60到IOO个连续碱基。25本发明提供了扩增引物序列对,其用于扩增(例如,通过PCR)编码具有纤维素酶活性——例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸,其中该引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个或每一个成员可以包括寡核苷酸,该寡核苷酸包括该序列的至少大约10到50个或更多个连续碱基,或者包括该序列30的大约10、U、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个连续碱基。本发明提供了扩增引物对,其中所述引物对包括第一成员和第二成员,第一成员具有本发明核酸的大约前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个残基所示的序列,第二35成员含有第一成员的互补链的大约前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个残基所示的序列。本发明提供了通过扩增产生的编码纤维素酶的核酸,例如编码内切葡聚糖酶、纤维二糖水解酶和/或p-葡糖苷酶的核酸,所述扩增例如聚合酶链反应(PCR),其中使用本发明的扩增引物对。本发明提供了通过扩增产生的编码纤维素酶的核5酸,例如编码内切葡聚糖酶、纤维二糖水解酶和/或P-葡糖苷酶的核酸,所述扩增例如聚合酶链反应(PCR),其中使用本发明的扩增引物对。本发明提供了通过扩增制备纤维素酶——例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶一一的方法,所述扩增例如聚合酶链反应(PCR),其中使用本发明的扩增引物对。一方面,所述扩增引物对从文库例如基因文库诸如环境文库扩增核酸。10本发明提供了扩增核酸的方法,所述核酸编码具有纤维素酶活性的多肽,例如具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,所述方法包括用能扩增本发明的核酸序列或其片段或子序列的扩增引物序列对扩增模板核酸。本发明提供了包含本发明的核酸或其子序列的表达序列盒。一方面,表达15序列盒可以包含可操作地连接到启动子上的核酸。启动子可以是病毒、细菌、哺乳动物或植物启动子。一方面,植物启动子可以是马铃薯、稻、玉米、小麦、烟草或大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面,启动子可以是诱导型启动子。一方面,启动子可以是组织特异性启动子或环境调节型或发育调节型启动于。因此,启动子可以是,例如种子特异性、20叶特异性、根特异性、茎特异性或脱落诱导启动子。一方面,表达序列盒可以进一步包括植物或植物病毒表达载体。本发明提供了克隆载体,包括本发明的表达序列盒(例如载体)或本发明的核酸。克隆载体可以是病毒载体、质粒、噬菌体(phage)、噬粒、粘粒(cosmid)、fos-质粒(fosmid)、细菌噬菌体(bacteriophage)或人工染色体。病毒载体可以包25括腺病毒载体、逆转录病毒载体或腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。本发明提供了包含本发明的核酸或本发明的表达序列盒(例如载体)或本发明的克隆载体的转化细胞。一方面,转化细胞可以是细菌细胞、哺乳动物细胞、30真菌细胞、酵母细胞、昆虫细胞或植物细胞。一方面,植物细胞可以是大豆、油菜籽、含油种子、番茄、甘蔗、谷类、马铃薯、小麦、稻、玉米、烟草或大麦细胞。本发明提供了包含本发明核酸或本发明表达序列盒(例如载体)的转基因非人动物。一方面,该动物是小鼠、大鼠、猪、山羊或绵羊。35本发明提供了包含本发明核酸或本发明表达序列盒(例如载体)的转基因植物。转基因植物可以是谷类植物、玉米植物、马铃薯植物、番茄植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。本发明提供了包含本发明核酸或本发明表达序列盒(例如载体)的转基因种子。转基因种子可以是谷类种子、玉米种子、小麦粒、含油种子、油菜籽、大豆种子、棕榈核、向日葵种子、芝麻种子、花生或烟草植物种子。5本发明提供了包含与本发明的核酸互补的核酸序列或能与本发明的核酸在严紧条件下杂交的核酸序列的反义寡核苷酸。本发明提供了抑制纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶信息在细胞中翻译的方法,该方法包括给细胞施用反义寡核苷酸或在细胞中表达反义寡核苷酸,所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严紧10条件下杂交的核酸序列。一方面,所述反义寡核苷酸的长度在大约10到50、大约20到60、大约30到70、大约40到80或大约60到100个碱基之间,例如长度为10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、IOO或更多个碱基。本发明提供了抑制纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶信息在细胞中翻译的方法,该方法包括给细胞施15用反义寡核苷酸或在细胞中表达反义寡核苷酸,所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严紧条件下杂交的核酸序列。本发明提供了含有本发明的序列的子序列的双链抑制RNA(RNAi或RNA干扰)分子(包括小干扰性RNA,或siRNA,用于抑制转录,以及微RNA或miRNA,用于抑制翻译)。在一个方面,siRNA的长度为大约21至24个残基之间,或大约20至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个双链核苷酸。本发明提供了抑制纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶在细胞中的表达,所述方法包括向所述细胞施用双链抑制RNA(siRNA或miRNA)或在所述细胞中表达双链抑制RNA(siRNA25或miRNA),其中所述RNA含有本发明的序列的子序列。本发明提供了分离的或重组的多肽,包括在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350或更多个残基的区域内或者在多肽的全长区域内,与本发明的示例性多肽或肽具有至少大约50%、51%、52%、53%、54%、3055%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的氨基酸序列。一方面,序列同一性通过运用序列比较算法的分析或通过视觉观察来确35定。本发明的示例性多肽或肽序列包括SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQDDNO:8,SEQIDNO:IO,SEQIDNO:12,SEQIDNO:14,SEQIDN0:16,SEQIDNO:I8,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQIDNO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,5SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104'SEQIDNO:106'10SEQIDNO:108'SEQIDNO:llO,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:m,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126'SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,15SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166(也参见下面的表1、2禾Q3、实施例l和4,和序列表)及其子序列和其变体。示例性多肽还包括长度为至少大约10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600或更多个残基的片段,或者为酶的全长区域20内的片段。本发明的多肽或肽序列包括由本发明的核酸编码的序列。本发明的多肽或肽序列包括由本发明的抗体特异性结合的多肽或肽(例如,表位),或可产生本发明的抗体的多肽或肽(例如,免疫原)。—方面,本发明的多肽具有至少一种纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。在可选的方面,本发明的多25核苷酸编码具有至少一种纤维素酶活性的多肽,例如具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽。—方面,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,是热稳定的。多肽在包括如下温度范围的条件下可以保持纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖30苷酶活性大约rC到大约5'C之间,大约5'C到大约15'C之间,大约15'C到大约25'C之间,大约25。C到大约37。C之间,大约37X:到大约95。C之间,大约55'C到大约85。C之间,大约7(TC到大约75。C之间,或大约90'C到大约95'C之间,或更高温度。在另一方面,纤维素酶活性,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,可以是耐热的。该多肽在暴露于如下范围内的35温度后可以保持纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性37'C以上到大约95'C,或55'C以上到大约85'C的范围内。一方面,该多肽在pH4.5时暴露于90'C以上到大约95'C的温度后可以保持纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。本发明的另一方面提供了分离的或重组的多肽或肽,包括本发明的多肽或5肽序列、与其基本上相同的序列、与其互补的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150或更多个连续碱基。该肽可以是例如免疫原性片段、基序(例如结合位点)、信号序列、前原序歹'J(preprosequence)或活性位点。本发明提供了分离的或重组的核酸,包括编码具有纤维素酶活性例如,内]0切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽和信号序列的序列,其中所述核酸包括本发明的序列。信号序列可以来源于另一种纤维素酶,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或者非纤维素酶,例如非内切葡聚糖酶、非纤维二糖水解酶和/或非p-葡糖苷酶(异源)。本发明提供了分离的或重组的核酸,包括编码具有纤维素酶活性,例如内切葡聚15糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的多肽的序列,其中所述序列不含有信号序列,所述核酸包括本发明的序列。一方面,本发明提供了分离的或重组的多肽,包括本发明的多肽,其缺少信号序列的全部或部分。一方面,所述分离的或重组的多肽可以包括本发明的多肽,其含有异源信号序列,例如异源纤维素酶信号序列如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖20苷酶信号序列,或非纤维素酶信号序列如非内切葡聚糖酶、非纤维二糖水解酶和/或非P-葡糖苷酶信号序列。—方面,本发明提供了嵌合蛋白,其包括含有本发明的信号序列的第一结构域和至少第二结构域。该蛋白可以是融合蛋白。第二结构域可以包括酶。该酶可以是非酶(non-enzym(S)。25本发明提供了嵌合多肽,包括含有本发明的信号肽(SP)、前原序列和/或催化结构域(CD)的至少第一结构域以及含有异源多肽或肽的第二结构域,其中所述异源多肽或肽不与所述信号肽(SP)、前原序列和/或催化结构域(CD)天然相关。一方面,所述异源多肽或肽不是纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。所述异源多肽或肽可以在所述信号肽(SP)、30前原序列和/或催化结构域(CD)的氨基端、羧基端或两端。本发明提供了编码嵌合多肽的分离的或重组的核酸,其中所述嵌合多肽包括含有本发明的信号肽(SP)、前原结构域和/或催化结构域(CD)的至少第一结构域以及含有异源多肽或肽的第二结构域,其中所述异源多肽或肽不与所述信号肽(SP)、前原结构域和/或催化结构域(CD)天然相关。35本发明提供了分离的或重组的信号序列(例如,信号肽),其包括本发明的多肽的残基1至14、1至15、1至16、1至17、1至18、1至19、1至20、115NO:26NO:36NO:46NO:56NO:66NO:76NO:86NO:96SEQIDNO:28,SEQIDNO:38,SEQIDNO:48,SEQIDNO:58,SEQIDNO:68,SEQIDNO:78'SEQIDNO:88,SEQIDNO:98,SEQIDNO:24,SEQIDSEQIDNO:34,SEQIDSEQIDNO:44,SEQIDSEQIDNO:54,SEQIDSEQIDNO:64,SEQIDSEQIDNO:74,SEQIDSEQIDNO:84,SEQIDSEQIDNO:94,SEQID至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47所示的序列或由本发明的多肽的残基1至14、1至15、1至16、1至17、1至18、1至19、51至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47所示的序列组成,本发明的多肽例如示例性的SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12'SEQIDNO:14,SEQID10NO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:30,SEQIDNO:32,SEQIDNO:40,SEQIDNO:42,SEQIDNO:50,SEQIDNO:52,SEQIDNO:60,SEQIDNO:62,SEQIDNO:70,SEQIDNO:72,SEQIDNO:80,SEQIDNO:82,SEQIDNO:90,SEQIDNO:92,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,20SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:I26,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQID25NO:160,SEQIDNO:162,SEQIDNO:164或SEQIDNO:166(也参见下面的表1、2和3、实施例1和4,以及序列表)。一方面,本发明提供了信号序列,其包括本发明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、3064、65、66、67、68、69、70或更多个氨基端残基。—方面,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,包括在大约37i:每毫克蛋白大约1到大约1200单位,或每毫克蛋白大约100到大约1000单位的范围内的比活性。另一方面,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性,35包括每毫克蛋白从大约100到大约1000单位,或从大约500到大约750单位的比活性。可以选择地,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37'C每毫克蛋白从大约1到大约750单位,或每毫克蛋白大约500到大约1200单位的范围内的比活性。一方面,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37'C每毫克蛋白从大约1到大约500单位,或每毫克蛋白大约750到大约10005单位的范围内的比活性。另一方面,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37。C每毫克蛋白从大约1到大约250单位的范围内的比活性。可选地,纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性,包括在37'C每毫克蛋白从大约1到大约100单位的范围内的比活性。10另一方面,耐热性包括在被加热到高温后,保持在37'C时纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的比活性的至少一半。可以选择地,耐热性可以包括在被加热到高温后,保持在37'C每毫克蛋白从大约1到大约1200单位,或每毫克蛋白大约500到大约1000单位的范围内的比活性。另一方面,耐热性可以包括在被加热到高温后,保持在37'C每毫克蛋白从大约115到大约500单位的范围内的比活性。本发明提供了本发明的分离的或重组的多肽,其中所述多肽包括至少一个糖基化位点。一方面,糖基化可以是N-连接糖基化。一方面,多肽可以在毕赤酵母(i^mton'"或裂变酵母(S./w&)中被表达后被糖基化。—方面,多肽可以在包括大约pH6.5、pH6、pH5.5、pH5、pH4.5或pH204的更酸性的条件下保持纤维素酶活性,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。另一方面,多肽可以在包括大约pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5或pH11或更碱性的条件下保持纤维素酶活性,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性。一方面,多肽可以在暴露于包括大约pH6.5、pH6、pH5.5、pH5、pH254.5或pH4的更酸性pH的条件下保持纤维素酶活性,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性。另一方面,多肽可以在暴露于包括大约pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5或pH11或更碱性pH的条件下保持纤维素酶活性,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。30—方面,本发明的纤维素酶,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,在碱性条件下,例如在肠道如小肠的碱性条件下,具有活性。一方面,多肽在暴露于胃的酸性pH后保持活性。本发明提供了含有本发明的多肽(包括肽)的蛋白制剂,其中该蛋白制剂包括液体、固体或凝胶。本发明提供了包含本发明的多肽和第二蛋白或结构域的35异二聚体。该异二聚体的第二成员可以是不同的纤为素酶,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,不同的酶或另一种蛋白。一方面,第二域结构可以是多肽,异源二聚体可以是融合蛋白。一方面,第二结构域可以是表位(epitope)或标记物(tag)。一方面,本发明提供了包含本发明的多肽的同型二聚体。本发明提供了具有纤维素酶活性例如内切葡聚糖酶、纤维二糖水解酶、甘5露聚糖酶和/或P-葡糖苷酶活性的固定化多肽(包括肽),其中所述固定化多肽包括本发明的多肽、由本发明的核酸编码的多肽、或含有本发明的多肽和第二结构域的多肽。一方面,多肽可以被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、平板、阵列或毛细管上。本发明还提供了包含本发明的固定化核酸的阵列,包括,例如本发明的探10针。本发明还提供了包含本发明的抗体的阵列。本发明提供了分离的或重组的抗体,其与本发明的多肽或与由本发明的核酸编码的多肽特异性结合。本发明的这些抗体可以是单克隆或多克隆抗体。本发明提供了包含本发明的抗体的杂交瘤,所述抗体例如,与本发明的多肽或与由本发明的核酸编码的多肽特异性结合的抗体。本发明提供了编码这些抗体的核酸。15本发明提供了分离或鉴定具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的方法,该方法包括如下步骤(a)提供本发明的抗体;(b)提供包含多肽的样品;和(c)将步骤(b)的样品与步骤(a)的抗体在所述抗体能与所述多肽特异性结合的条件下接触,从而分离或鉴定具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖20苷酶活性的多肽。本发明提供了制备抗纤维素酶抗体——例如抗内切葡聚糖酶抗体、抗纤维二糖水解酶抗体和/或抗P-葡糖苷酶抗体——的方法,该方法包括以足够的量向非人动物施用本发明的核酸或本发明的多肽或其子序列,所述的量足以产生体液免疫应答,由此制备抗纤维素酶抗体,例如,—抗内切葡聚糖酶抗体V杭纤餘二糖水25解酶抗体和/或抗P-葡糖苷酶抗体。本发明提供了产生抗纤维素酶免疫应答(细胞应答或体液应答)——例如抗内切葡聚糖酶免疫应答、抗纤维二糖水解酶免疫应答和/或抗P-葡糖苷酶免疫应答——的方法,该方法包括以足以产生免疫应答(细胞应答或体液应答)的量向非人动物施用本发明的核酸或本发明的多肽或其子序列。30本发明提供了产生重组多肽的方法,包括如下步骤(a)提供与启动子可操作地连接的本发明的核酸;和(b)在允许多肽表达的条件下表达步骤(a)的核酸,从而产生重组多肽。一方面,该方法可进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,从而在转化细胞中产生重组多肽。本发明提供了用于鉴定具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解35酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的方法,该方法包括如下步骤(a)提供本发明的多肽;或由本发明的核酸编码的多肽;(b)提供纤维素酶底物,例如内切葡聚糖酶底物、纤维二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物;和(c)用步骤(b)的底物接触步骤(a)的多肽或其片段或其变体,并且检测底物量的降低或反应产物量的增加,其中底物量的降低或反应产物量的增加检测出具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡5糖苷酶活性的多肽。一方面,底物可以是含纤维素的化合物。本发明提供了用于鉴定纤维素酶底物的方法,如内切葡聚糖酶底物、纤维二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物,包括如下步骤(a)提供本发明的多肽;或由本发明的核酸编码的多肽;(b)提供测试底物;和(C)用步骤(b)的测试底物接触步骤(a)的多肽,并且检测底物量的降低或反应产物10量的增加,其中底物量的降低或反应产物量的增加检测出作为纤维素酶底物如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的测试底物。本发明提供了确定测试化合物是否与多肽特异性结合的方法,包括如下步骤(a)在允许核酸翻译为多肽的条件下表达核酸或包含核酸的载体,其中所述核酸包括本发明的核酸,或提供本发明的多肽;(b)提供测试化合物;(c)用测15试化合物接触多肽;和(d)确定步骤(b)的测试化合物是否与多肽特异性结合。本发明提供了用于鉴定纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的调节剂的方法,包括如下步骤(a)提供本发明的多肽,或由本发明的核酸编码的多肽;(b)提供测试化合物;和(C)用步骤(b)的测试化合物接触步骤(a)的多肽,并测定纤维素酶如内切葡聚糖酶、纤20维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的活性,其中在存在测试化合物的情况下测定的纤维素酶活性——如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——与不存在测试化合物的情况下测定的活性相比的变化,确定了该测试化合物调节纤维素酶活性,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶莉或p-葡糖苷酶活性。一方面T纤维素酶活性,例扭内切葡聚糖酶、纤雒25二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,可以通过提供纤维素酶底物,例如内切葡聚糖酶底物、纤维二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物,并检测底物量的降低或反应产物量的增加,或底物量的增加或反应产物量的降低来测量。与没有测试化合物时底物或反应产物的量相比,有测试化合物时底物量的降低或反应产物量的增加鉴定出作为纤维素酶如内切葡聚糖酶、纤维二糖30水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的激活剂的测试化合物。与没有测试化合物时底物或反应产物量相比,有测试化合物时底物量的增加或反应产物量的降低鉴定出作为纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的活性的抑制剂的测试化合物。本发明提供了计算机系统,该系统包括处理器和数据存储设备,其中所述35数据存储设备上已经存储了本发明的多肽序列或核酸序列(例如由本发明的核酸编码的多肽或肽)。一方面,计算机系统可以进一步包括序列比较算法和数据存储设备,其中数据存储设备上已经存储了至少一个参考序列。另一方面,序列比较算法包括可指出多态现象(多态性)的计算机程序。一方面,计算机系统可以进一步包括在所述序列中鉴定一个或多个特征的鉴定器(标识符,identifiers本发明提供了计算机可读介质,其上已经存储了本发明的多肽序列或核酸序列。本发5明提供了用于鉴定序列中的特征的方法,包括如下步骤(a)使用可鉴定序列中的一个或多个特征的计算机程序读取序列,其中所述序列包括本发明的多肽序列或核酸序列;和(b)用所述计算机程序鉴定序列中的一个或多个特征。本发明提供了将第一序列与第二序列进行比较的方法,包括如下步骤(a)通过使用可比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括本发明的多肽10序列或核酸序列;和(b)用所述计算机程序确定第一序列和第二序列之间的差异。确定第一序列和第二序列之间差异的步骤可以进一步包括鉴定多态性的步骤。一方面,该方法可以进一步包括可鉴定序列中的一个或多个特征的鉴定器。另一方面,该方法可以包括使用计算机程序读取第一序列,并鉴定该序列中的一个或多个特征。15本发明提供了从环境样品中分离或回收核酸的方法,所述核酸编码具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,该方法包括如下步骤(a)提供用于扩增编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的核酸的扩增引物序列对,其中所述引物对能扩增本发明的核酸;(b)从环境样品中分离核酸,20或处理环境样品,以便样品中的核酸可实现与扩增引物对杂交;和(c)将步骤(a)的扩增引物对与步骤(b)的核酸结合,并从环境样品中扩增核酸,从而从环境样品中分离或回收编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的核酸。扩增引物序列对的一个或每一成员可以包括寡核苷酸,该寡核苷酸包括本发明的扩增引物序列对,例如,具有本发朋的序25列的至少大约10到50个连续碱基。本发明提供了从环境样品中分离或回收核酸的方法,所述核酸编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,该方法包括如下步骤(a)提供包含本发明的核酸或其子序列的多核苷酸探针;(b)从环境样品分离核酸,或处理环境样品,以便样品中的核酸可实现与步30骤(a)的多核苷酸探针杂交;(c)将步骤(a)的多核苷酸探针与步骤(b)的分离的核酸或处理的环境样品结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,从而从环境样品中分离或回收编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的核酸。环境样品可以包括水样品、液体样品、土壤样品、空气样品或生物样品。一方面,生物样品可35以来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。本发明提供了产生编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或)3-葡糖苷酶活性的多肽的核酸变体的方法,该方法包括如下步骤(a)提供包括本发明的核酸的模板核酸;和(b)在模板序列中修饰、删除或添加一个或多个核苷酸,或进行修饰、删除和添加的组合,以产生模板核酸的变体。5—方面,该方法可以进一步包括表达变体核酸,以产生变体纤维素酶多肽,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽。修饰、添加或删除通过包括如下方法中的方法来引入,包括易错PCR、改组(重排,shuffling)、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变(recursiveensemblemutagenesis)、指数整体诱变、位点特异性诱变、10基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、染色体饱和诱变(CSM)或其组合。另一方面,修饰、添加或删除通过如下方法的方法引入包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变(gappedduplexmutagenesis)、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因15合成、整体诱变、嵌合核酸多聚体生成及其组合。—方面,该方法可以被反复重复,直到产生与模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳定性的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。一方面,变体纤维素酶多肽,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽,是耐热的,20在暴露于升高的温度之后可以保持一些活性。另一方面,与模板核酸编码的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶相比,变体纤维素酶多肽,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶多肽,具有增加的糖基化。可以选择地,变体纤维素酶多肽,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽,在高温下具有纤维素酶话性,25例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,其中由模板核酸编码的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,在高温下没有活性。一方面,该方法可以被反复重复,直到产生具有与模板核酸的密码子使用有所不同的密码子使用的纤维素酶编码序列,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶编码序列。另一方面,该30方法可以被反复重复,直到产生具有比模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的纤维素酶基因,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶基因。本发明提供了在编码具有纤维素酶活性——如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——的多肽的核酸中修饰密码子以增加其35在宿主细胞中的表达的方法,该方法包括如下步骤(a)提供编码具有纤维素酶活性——如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性一一的多肽的本发明的核酸;和(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子,用优选的或中度使用(neutrallyused)的密码子来代替,所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸,其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子,非优选或较不优选密码子是在宿主细5胞的基因的编码序列中表现不足的密码子,从而修饰核酸以增加其在宿主细胞中的表达。本发明提供了在编码具有纤维素酶活性——如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修饰密码子的方法,该方法包括如下步骤(a)提供本发明的核酸;和(b)鉴定歩骤(a)的核酸中的10密码子,并用不同的密码子来代替,所述不同的密码子编码与被取代的密码子相同的氨基酸,从而修饰在编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸中的密码子。本发明提供了在编码具有纤维素酶活性——如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修饰密码子以增加其15在宿主细胞中的表达的方法,该方法包括如下步骤(a)提供编码纤维素酶多肽如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽的本发明核酸;和(b)鉴定步骤(a)的核酸中的非优选或较不优选密码子,并用优选的或中度使用的密码子来代替,所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸,其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密20码子,非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子,从而修饰核酸以增加其在宿主细胞中的表达。本发明提供了在编码具有纤维素酶活性——如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修饰密码子以降低其在宿主细胞中的表达的方法,该方法包括如下步骤(a)提供本发明的核酸;和25(b)鉴定步骤(a)的核酸中的至少一个优选密码子,并用非优选的或较不优选的密码子来代替,所述非优选或较不优选的密码子编码与被取代的密码子相同的氨基酸,其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子,非优选或较不优选的密码子是在宿主细胞的基因的编码序列中表现不足的密码子,从而修饰核酸以降低其在宿主细胞中的表达。一方面,宿主细胞可以是细菌30细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。本发明提供了用于产生核酸文库的方法,所述核酸编码一系列的被修饰的纤维素酶——例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶——活性位点或底物结合位点,其中被修饰的活性位点或底物结合位点来源于第一核酸,所述第一核酸包含编码第一活性位点或第一底物结合位点的序列,该方35法包括如下步骤(a)提供第一核酸,其编码第一活性位点或第一底物结合位点,其中所述第一核酸序列包括在严紧条件下与本发明的核酸杂交的序列,所述核酸编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位点或纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶底物结合位点;(b)提供一组诱变寡核苷酸,其在第一核酸的多个目标密码子处编码天然发生的氨基酸变体;和(C)使用该组诱变寡核苷酸,产生一组编码活5性位点或编码底物结合位点的变体核酸,其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变化,从而产生编码多个被修饰的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位点或底物结合位点的核酸文库。一方面,该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸优化的定向进化系统、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、易10错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配及其组合。另一方面,该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸或变体重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、15缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。本发明提供了产生小分子的方法,包括如下步骤(a)提供多个能合成或修饰小分子的生物合成酶,其中这些酶中的一种酶包括由本发明的核酸编码的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶;(b)20为步骤(a)的至少一种酶提供底物;和(c)将步骤(b)的底物与这些酶在能促进多个生物催化反应的条件下通过一系列生物催化反应进行反应,以产生小分子。本发明提供了修饰小分子的方法,包括如下步骤(a)提供纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,其中该酶包括本发明的多肽,或由本发明的核酸编码的多肽,或其子序列;(b)提供小分子;和(c)将25步骤(b)的小分子与步骤(a)的酶在能促进由纤维素酶如内切葡聚糖酶、纤维一.糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶催化的酶促反应的条件下进行反应,从而通过纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶酶促反应修饰小分子。一方面,该方法可以包括为步骤(a)的酶提供多个小分子底物,从而产生通过由纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶30和/或卩-葡糖苷酶催化的至少一种酶促反应产生的被修饰小分子的文库。一方面,该方法可以包括多个其它的酶,在有助于这些酶介导的多个生物催化反应的条件下使用这些酶,以形成由多个酶促反应产生的被修饰小分子的文库。另一方面,该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保35留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应,方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子,鉴定出产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。本发明提供了确定纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的功能片段的方法,包括如下步骤(a)提供纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其中该酶包括本发明5的多肽或由本发明的核酸编码的多肽、或其子序列;和(b)从步骤(a)的序列删除多个氨基酸残基,并测试剩余的子序列的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,从而确定纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的功能片段。一方面,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性通过提供纤维10素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶底物并检测底物量的减少或反应产物量的增加来测量。本发明提供了通过使用实时代谢流(real-timemetabolicflux)分析进行新的或修饰的表型的全细胞工程改造的方法,该方法包括如下步骤(a)通过修饰细胞的遗传组成产生修饰的细胞,其中所述遗传组成通过将本发明的核酸加入到15细胞来修饰(b)培养修饰的细胞以产生多个修饰的细胞;(c)通过实时监控步骤(b)的细胞培养物来测量该细胞的至少一个代谢参数;和(d)分析步骤(c)的数据,以确定被测量的参数是否与在类似条件下未修饰细胞中的参照测量值不同,从而使用实时代谢流量分析鉴定细胞中的工程表型。一方面,细胞的遗传组成可以通过包括在细胞中序列的删除或序列的修饰,或敲除基因的表达的方法来20修饰。一方面,该方法可以进一步包括选择含有新的工程表现型的细胞。另一方面,该方法可以包括培养被选择的细胞,从而产生包含新的工程表型的新细胞株。本发明提供了增加纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的多肽的耐热性或热稳定性的方法,该方法包括糖基化纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的多肽,其中25该多肽包括本发明的多肽或由本发明的核酸序列编码的多肽的至少三十个连续氨基酸,从而增加纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的多肽的耐热性或热稳定性。一方面,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的比活性可以在大于大约37'C到大约95'C的温度范围内是热稳定的或耐热的。30本发明提供了在细胞中过量表达重组纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多肽的方法,该方法包括表达含有核酸的载体,该核酸包括本发明的核酸或本发明的核酸序列,其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定,其中过量表达通过使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。35本发明提供了产生转基因植物的方法,该方法包括如下步骤(a)将异源核酸序列引入细胞中,其中异源核酸序列包括本发明的核酸序列,从而产生转化的植物细胞;和(b)从转化的细胞产生转基因植物。一方面,歩骤(a)可以进一步包括通过植物细胞原生质体的电穿孔或显微注射引入异源核酸序列。另一方面,歩骤(a)可以进一歩包括通过DNA微粒轰击(DNAparticlebombardment)将异源核酸序列直接引入植物组织中。可以选择地,歩骤(a)可以进一歩包括使5用根瘤农杆菌(Jgra6ac/m'ww/M膨/adms)宿主将异源核酸序列引入植物细胞DNA中。一方面,植物细胞可以是甘蔗、甜菜、大豆、番茄、马铃薯、玉米、稻、小麦、烟草或大麦细胞。本发明提供了在植物细胞中表达异源核酸序列的方法,该方法包括如下步骤(a)用与启动子可操作地连接的的异源核酸序列转化植物细胞,其中异源核10酸序列包括本发明的核酸;(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。本发明提供了在植物细胞中表达异源核酸序列的方法,该方法包括如下步骤(a)用与启动子可操作地连接的的异源核酸序列转化植物细胞,其中异源核酸序列包括本发明的序列;(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。15本发明提供了饲料或食物,其含有本发明的多肽或本发明的核酸编码的多肽。一方面,本发明提供了食品、饲料、液体如饮料(如果汁或啤酒)、面包或面团或面包产品、或饮料前体(例如,麦芽汁),其含有本发明的多肽。本发明提供了动物的食物或营养补充剂,其含有本发明的多肽,例如,由本发明的核酸编码的多肽。20—方面,食物或营养补充剂中的多肽可以被糖基化。本发明提供了可食用的酶输送基质,其含有本发明的多肽,例如,由本发明的核酸编码的多肽。一方面,该输送基质包括丸剂。一方面,多肽可被糖基化。一方面,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性是耐热的。另一方面,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶25的活性是热稳定的。本发明提供了含有本发明的多肽的食物、饲料或营养补充剂。本发明提供了将纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶用作动物饮食中的营养补充剂的方法,所述方法包括制备含有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的营养添加物,所述纤维30素酶包含本发明的多肽的至少三十个连续氨基酸;以及向动物施用所述营养添加物。动物可以是人、反刍动物或单胃动物。通过在选自细菌、酵母、植物、昆虫、真菌和动物的生物体中表达编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多核苷酸,可以制备纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶。所述生物体可选自裂变酵母(Spow6e)、35酿酒酵母(S.cem^/ae)、毕赤酵母(尸/cWa,网加^)、大肠杆菌(£.co//.)、链霉菌属某种(&re^o/^cwsp.)、杆菌属某种(£flc///Wlysp.)和乳酸杆菌属某种"ac/o6ac///2^sp.)。本发明提供了可食用的酶输送基质,其含有热稳定的重组纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,如本发明的多肽。本发明提供了向动物输送纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖5酶和/或(3-葡糖苷酶补充剂的方法,所述方法包括制备丸剂形式的可食用的酶输送基质,其含有粒状可食用载体以及热稳定的重组纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶,其中所述丸剂容易将包含在其中的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶分散入含水介质中,以及向所述动物施用该可食用酶输送基质。重组纤维素酶,例如10内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,可以包括本发明的多肽。纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,可被糖基化,以在压丸条件下提供热稳定性。该输送基质可以通过对含有谷物胚芽和纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的混合物进行压丸而形成。压丸条件可包括蒸汽的应用。压丸条件可包括15应用超过约8(TC的温度约5分钟,而该酶保持每毫克蛋白至少大约350到大约900单位的比活性。—方面,本发明提供了药物组合物,其含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或者本发明的核酸编码的多肽。一方面,药物组合物作为助消化剂。20在某些方面,含纤维素化合物与具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的本发明多肽在约pH3.0至9.0、10.0、ll.O或更高的范围的pH下接触。在其它方面,含纤维素化合物与纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶在约55'C、60°C、65°C、70°C、75°C、80°C、85°C、90。C或更高的温度下接触。25本发明的一个或多个方面的细节如附图和下面的描述所示。本发明的其它特征、目标和优点将通过说明书和附图以及权利要求而更加清楚。此处引述的所有出版物、专利、专利申请、GenBank序列和ATCC保藏物均被特意地引入,以作为参考,用于所有目的。30下面的附图是本发明的方面的例证性说明,而不意图限制权利要求书所包括的本发明的范围。图l是一个计算机系统的框图。图2是一个流程图,该图示意性说明了用于将新核苷酸或蛋白序列与序列35数据库进行比较以确定该新序列与数据库中序列之间的同源性水平的过程的一个方面。图3是一个流程图,该图示意性说明了在计算机中确定两个序列是否同源的过程的一个方面。图4是一个流程图,该图示意性说明了检测序列中特征的存在的鉴定过程300的一个方面。5图5是纤维二搪结构的示意图。图6和7示意性说明了来自纤维己糖的反应产物的TLC分析结果,如在下面的实施例1中所详细讨论的。图8以图形数据进行例证性说明,显示了通过本发明的示例性酶22/22a(CBH)从PASC释放纤维二糖,如在下面的实施例2所详细讨论的。10图9以图形数据进行例证性说明,显示了通过本发明的示例性酶22/22a(CBH)从AVICELMCC释放纤维二糖,如在下面的实施例2所详细讨论的。图10以图表数据进行了例证性说明,显示了典型的GIGAMATRIXbreakout,其中表达能够水解甲基伞形基纤维二糖苷的活性克隆被鉴定,如下面的实施例4所详细讨论的。15图11以图表数据进行了例证性说明,通过毛细管电泳(CE)分析显示了所选择的酶对磷酸溶胀纤维素(phosphoricacid-swollencellulose,PASC)的活性,如下面的实施例4所详细讨论的。图12以图表数据进行了例证性说明,数据来自本发明的示例性酶和亚克隆变体在AVICELMicrocrystallineCellulose(MCC)中的分析,其中通过BCA还原20糖测定来分析反应产物,如下面的实施例4所详细讨论的。图13以图表数据进行了例证性说明,数据来自一级GSSM筛选分析,如下面的实施例4所详细讨论的。图14以图表数据进行了例证性说明,数据来自二级GSSM筛选分析,如下面的实施例4所详细讨论的。25图15以图表数据进行了例证性说明,数据来自混合的或"掺合的"GSSM筛选分析,如下面的实施例4所详细讨论的。在不同的附图中同样的标记符号表示同样的要素。发明详述30本发明提供了具有纤维素酶活性例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽、编码它们的多核苷酸、以及制备和使用这些多核苷酸和多肽的方法。本发明还提供了纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,编码这些酶的多核苷酸、这类多核苷酸和多肽的应用。35—方面,本发明提供了纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其具有增强的催化速率,改善了底物水解过程。在催化速率上的这种增加的效率导致在生产糖类上增加的效率,所述糖类随后可被微生物用于乙醇生产。一方面,产生本发明的酶的微生物与产乙醇微生物一起使用。因此,本发明提供了生产乙醇和制备基于乙醇的"清洁燃料"的方法,例如,用于利用生物乙醇进行的运输。5—方面,本发明提供了组合物(例如,酶制剂、饲料、药物、饮食补充物),其包括本发明的酶、多肽或多核苷酸。这些组合物可以以各种形式加以配制,例如液体、凝胶、丸剂、片剂、喷剂、粉末、食物、饲料小丸或包括纳米胶囊剂型在内的胶囊剂型。测量纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-10葡糖苷酶活性的分析试验,例如用于确定多肽是否具有纤维素酶活性,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性的分析试验,在本领域中是熟知的,并且在本发明的范围内;参见,例如BakerWL,PanowA,Estimationofcellulaseactivityusingaglucose-oxidase-Cu(II)reducingassayforglucose,JBiochemBiophysMethods.1991Dec,23(4):265-73jSharrockKR,Cellulaseassay15methods:areview,JBiochemBiophysMethods.1988Oct,17(2):81-105;CarderJH,DetectionandquantitationofcellulasebyCongoredstainingofsubstratesinacup-platediffusionassay,AnalBiochem.1986Feb15,153(l):75-9;CanevasciniG.,Acellulaseassaycoupledtocellobiosedehydrogenase,AnalBiochem.1985Jun,147(2):419-27;HuangJS,TangJ,Sensitiveassayforcellulaseanddextranase.Anal20Biochem.1976Jun,73(2):369隱77。本发明使用的反应条件的pH是本发明提供的另一个可变参数。在某些方面,反应的pH在约3.0至约9.0的范围内。在其它方面,pH为约4.5,或pH为约7.5或pH为约9。在碱性条件下进行的反应条件也可能是有利的,例如,在本发明的酶的一些工业应用或制药应用中。25本发明提供了各种形式和配方的本发明的纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽。在本发明的方法中,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶多肽以各种形式和配方使用。例如,纯化的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽可以用在酶制剂中,该酶制剂在生物乙醇的30生产中或制药或饮食助剂应用中使用。可选地,本发明的酶可直接用在生产生物乙醇、制备清洁燃料、处理生物废物、加工食物、液体或词料等等的各种工艺中。可选地,本发明的纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽,可使用本领域已知的方法在微生物中表达。在其它方面,本发明的纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/35或P-葡糖苷酶多肽,可在用于本发明的方法之前固定在固体支持物上。将酶固定在固体支持物上的方法在本领域中广为人知,例如J.Mol.Cat.B:Enzymatic6(1999)29-39;Chivataetal.Biocatalysis:Immobilizedcellsandenzymes,JMol-Cat.37(1986)1-24:Sharmaetal.,ImmobilizedBiomaterialsTechniquesandApplications,Angew.Chem.Int.Ed.Engl.21(1982)837-54:Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnolog。5核酸、探针和抑制分子(InhibitorvMolecules)本发明提供了分离的和重组的核酸,例如参见下面的表l、2和3,实施例l和4,以及序列表;编码多肽的核酸,包括本发明的示例性多核苷酸序列,例如,参见表1和序列表;包括表达序列盒,例如含有本发明的核酸的表达载体和各种克隆载体。本发明还包括使用本发明的核酸发现、鉴定或分离新的纤维素酶如内10切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶多肽序列的方法。本发明还包括使用本发明的核酸抑制编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的基因和转录物的表达的方法。还提供了修饰本发明的核酸的方法,包括通过例如合成连接重装配、优化的定向进化系统和/或饱和诱变例如基因位点饱和诱变(GSSM)产生本发明的核15酸变体的方法。术语"饱和诱变"、基因位点饱和诱变或"GSSM"包括使用简并寡核苷酸引物将点突变引入多核苷酸的方法,如在下面所详细描述的。术语"优化的定向进化系统"或"优化的定向进化"包括用于重新装配相关的核酸序列的片段的方法,所述的相关核酸序列例如相关的基因,下面对其进行了详细解释。术语"合成连接重装配"或"SLR"包括以非随机方式连接寡核苷酸片段的方法,20下面进行了详细解释。术语"变体"是指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处被(分别地)修饰的本发明的多核苷酸或多肽,然而它们仍然保持本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶生物学活性。变体可以通过许多种方法产生,包括的方法诸如,例如易错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、25盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、GSSM及其任意组合。本发明的核酸可以通过,例如cDNA文库的克隆和表达、通过PCR进行的信息或基因组DNA扩增以及类似的技术来制造、分离和/或操纵。例如,本发明的示例性核酸最初来源于环境来源。因此,一方面,本发明提供了编码纤维素30酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸,以及由它们编码的多肽,其共同的新颖性在于它们来源于共同的来源,例如环境来源、混合的培养物或细菌来源。在本发明方法的实践中,同源基因可以通过操纵模板核酸加以修饰,如同在文中所描述的。本发明可以与本
技术领域
已知的任何方法或程序或设备一起实35践,这些方法、程序或设备在科学和专利文献中有很好的描述。如本文所使用,短语"核酸"或"核酸序列"是指寡核苷酸、核苷酸、多核苷酸,或者寡核苷酸、核苷酸、多核苷酸中任意一种的片段,或者基因组的或合成来源的DNA或RNA,它们可以是单链或双链,并且可以代表正义链或反义(互补)链,或者是指肽核酸(PNA)或者天然或合成来源的任何DNA样或RNA样的物质。短语"核酸"或"核酸序列"包括寡核苷酸、核苷酸、多核苷酸,或5者寡核苷酸、核苷酸、多核苷酸中任意一种的片段,或者基因组的或合成来源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA),它们可以是单链或双链,并且可以代表正义链或反义链,还包括肽核酸(PNA)或者天然或合成来源的任何DNA样或RNA样的物质,例如包括iRNA、核糖核蛋白(例如双链iRNA,例如iRNPs)。该术语包括含有天然核苷酸的己知类似物的核酸,例如寡核苷酸。该术10语也包括具有合成骨架的核酸样结构,例如参见Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。"寡核苷酸"或者包括单链的多脱氧核苷酸,或者包括两个互补的多脱氧核苷酸链,它们可以是化学合成的。这样的合成的寡核苷酸没有5'磷酸,因此如果不在存在激酶的情况下采用15ATP添加磷酸,该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡核苷酸可以连接到没有被去磷酸化的片段上。特定多肽或蛋白的"编码序列"或编码特定多肽或蛋白的"核苷酸序列"是这样的核酸序列,其当置于合适的调节序列的调控下时被转录和翻译成多肽或蛋白质。术语"基因"意指在产生多肽链中所涉及的DNA片段;其包括编码区之20前的区域和之后的区域(前导区(leader)和尾区(trailer)),以及在适用的情况下,可以包括各个编码片段(外显子)之间的间插序列(内含子)。启动子序列"可操作地连接到"编码序列上,此时RNA聚合酶可以在启动子处起始转录,将编码序列转录成mRNA。正如此处所用,"可操作地连接(operablylinked)"是指两个或更多个核酸(例如DNA)片段之间的功能关系。"可操作地连接"可以指转录调控25序列与被转录序列的功能关系。例如,如果启动子刺激或调节编码序列例如本发明的核酸在适当的宿主细胞或其它表达系统中的转录,那么该启动子便是可操作地连接到编码序列。通常,可操作地连接到被转录序列的启动子转录调控序列与被转录序列是物理上相邻的,即它们是顺式作用。然而,一些转录调控序列,如增强子,不需要与编码序列物理相邻或者位于与编码序列接近的位置,但这些转30录调控序列仍能增强编码序列的转录。正如本文所用,术语"表达序列盒(expressioncassette)"指能影响结构基因(即蛋白编码序列,例如,编码本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的序列)在与这样的序列相容的宿主中的表达的核苷酸序列。表达序列盒包括至少一个与多肽编码序列可操作地连接的启动35子;并且任选地,可以与其它序列例如转录终止信号序列可操作地连接。也可以使用其它的在实现表达的方面必需的或有用的因子,例如增强子、a-因子。因此,表达序列盒也包括质粒、表达载体、重组病毒、任何形式的重组"裸DNA"载体,以及类似物。"载体"包括可以感染、转染、短暂或永久地转导细胞的核酸。应该认识到,载体可以是裸核酸、或与蛋白或脂质复合的核酸。该载体任选地包含病毒或细菌核酸和/或蛋白,和/或膜(例如细胞膜、病毒脂质包被等等)。载体包括5但不限于复制子(例如RNA复制子、细菌噬菌体),DNA片段可以连接到这些复制子上从而可被复制。因此,载体包括但不限于RNA、自主复制环状或线状DNA或RNA(例如质粒、病毒以及类似物,例如参见美国专利5,217,879),并且包括表达质粒和非表达质粒。在重组微生物或细胞培养物被描述为"表达载体"的宿主的情况下,该载体包括染色体外环状和线状DNA,它们可以已经被整合到宿主10染色体中。在载体通过宿主细胞来维持的情况下,该载体或者可以作为自主结构在有丝分裂过程中被细胞稳定地复制,或者被整合进宿主的基因组中。正如此处所用,术语"重组的"包括与"骨架"核酸相邻的核酸,这些核酸在其天然环境中与该"骨架"核酸是不相邻的。一方面,为了被富集,核酸表现为在核酸骨架分子群体中有大约5%或更多数量的核酸插入物。本发明的"骨架15分子"包括核酸,如表达载体、自主复制核酸、病毒、整合核酸,以及用于维持或操纵感兴趣的核酸插入物的其它载体或核酸。一方面,富集的核酸表现为在重组的骨架分子群体中有大约15%或更多数量的核酸插入物。一方面,富集的核酸表现为在重组的骨架分子群体中有大约50%或更多数量的核酸插入物。一方面,富集的核酸表现为在重组的骨架分子群体中有大约90%或更多数量的核酸插入20物o本发明的一方面是分离的或重组的核酸,包括本发明的序列之一,或者含有本发明的核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多个连续碱基的片段。该分离的或重组的核酸可以包含DNA,包括cDNA、基因组DNA和合成DNA。DNA可以是双链或单链,并且如果是单25链,可以是编码链或非编码(反义)链。可选地,该分离的或重组的核酸包含RNA。本发明的分离的或重组的核酸可用于制备本发明的多肽之一,或者含有本发明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段。因此,本发明的另一方面是分离的或重组的核酸,其编码本发明的多肽的一种,或者含有本发明的多肽之一的至少5、10、15、20、25、3030、35、40、50、75、100或150或更多个连续氨基酸的片段。这些核酸的编码序列可以与本发明的核酸之一的编码序列之一相同或者可以是不同的编码本发明的多肽之一的编码序列,所述的多肽具有本发明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸,这是遗传密码子的冗余性或简并性的结果。遗传密码子对于本领域技术人员是熟知的,并可以例如在35B.Lewin,GenesVI,OxfordUniversityPress,1997的第214页上得到。—方面,使用常规技术,例如定点诱变或本领域技术人员熟悉的其它技术,本发明的核酸序列被诱变,以将沉默改变引入本发明的多核苷酸。如本文所使用,"沉默改变(silentchanges)"包括,例如不改变由所述多核苷酸编码的氨基酸序列的改变。这样的改变可能是期望的,以通过引入在宿主微生物中频繁发生的密码子或密码子对而增加由宿主产生多肽的水平,该宿主含有编码所述多肽的10载体。本发明还涉及具有核苷酸改变的多核苷酸,所述核苷酸改变在本发明的多肽中导致氨基酸取代、添加、缺失、融合和截短。使用技术例如定点诱变、随机化学诱变、外切核酸酶III删除和其它重组DNA技术,可以导入这样的核苷酸改变。可选地,这样的核苷酸改变可以是天然存在的等位基因变体,其通过鉴定在15本文所提供的高严紧条件、中度严紧条件或低严紧条件下特异性杂交到探针的核酸而分离出,所述探针含有本发明的序列(或其互补序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多个连续碱基。用于实践本发明的核酸,不管是RNA、siRNA、miRNA、反义核酸、cDNA、基因组DNA、载体、病毒或其杂合体,都可以从多种来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)可以被单独地分离25或克隆,并且可测试其期望活性。可以使用任何重组表达系统,包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。可以选择地,这些核酸可以通过熟知的化学合成技术体外合成,正如例如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)30Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中所描述的。用于操纵核酸的技术,例如亚克隆、标记探针(例如使用Klenow聚合酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文35献中有很好的描述,例如参见Sambrook编著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。5获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组样品中克隆,并且如果期望的话,筛选和再克隆插入物,插入物可以分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA文库,所述文库可以包含在例如哺乳动物人工染色体(MACs),例如参见美国专利5,721,118;6,025,155;人类人工染色体,例如参见Rosenfeld(1997)10Nat.Genet.15:333-335:酵母人工染色体(YAC);细菌人工染色体(BAC);PI人工染色体,例如参见Woon(1998)Genomics50:306-316;PI来源的载体(PACs),例如参见Kern(1997)Biotechniques23:120-124;粘粒、重组病毒、噬菌体或质粒中。—方面,编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌15的前导序列以适当的位置关系进行装配。本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上,如N-末端鉴定肽,其给予了期望的特性,如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达,其中所述融合蛋白中连接有一个或多个额外的结构域,例如用于产生免疫原性更强20的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞,等等。有利于检测和纯化的结构域包括,例如金属螯合肽,如多组氨酸标记和组氨酸-色氨酸模块,其允许在固定的金属上纯化,还包括蛋白A结构域,其允许在固定的免疫球蛋白上纯化,还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(ImmunexCorp,SeattleWA)。在纯化结构域和含有基序的肽或多肽之间包含25可切裂的连接子序列有助于纯化,这样的连接子序列例如Xa因子或肠激酶(Iiwitrogen,SanDiegoCA)。例如,表达载体可以包括编码表位的核酸序列,其连接到六组氨酸残基上,还连接有硫氧还蛋白和肠激酶切割位点(例如参见Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。组氨酸残基有助于检测和纯化,而肠激酶切割位点提供了将表位与融合30蛋白的剩余部分纯化分离开的手段。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了很好的描述,例如参见Kroll(1993)DNACd1.Biol.,12:441-53。存录湖體虔,35本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制序列上的本发明的核酸(例如DNA)序列,所述控制序列例如启动子或增强子,它们可以指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacl、lacZ、T3、T7、gpt、XPR、PL和trp。示例性的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及鼠金属硫蛋白I启动子。如本文所使用,术语"启动子"包括能够驱动编码序列在细胞中如植物或5动物细胞中转录的所有序列。因此,在本发明的构建物中所用的启动子包括顺式作用转录控制元件和调节序列,它们涉及调节或调控基因转录的时间和/或速率。例如,启动子可以是顺式作用转录控制元件,包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5'和3'非翻译区或内含子序列,它们均涉及转录的调节。这些顺式作用序列通常与蛋白或其它生物分子互相作用来执行(打开/关闭、10调节、调控等等)转录。"组成型"启动子是那些在大部分环境条件和发育状态或细胞分化状态下持续地驱动表达的启动子。"诱导型"或"可调控型"启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以通过诱导型启动子影响转录的环境条件的实例包括无氧条件、增高的温度、干旱或光的存在。"组织特异性"启动子是仅仅在特定细胞或组织或器官中有活性的转录控15制元件,例如在植物或动物的特定细胞或组织或器官中有活性。组织特异性调节可以通过某些内在因子来实现,这些内在因子确保对给定组织特异的蛋白编码基因被表达。这样的因子己知存在于哺乳动物和植物中,以便允许特异性组织的发育。适合于在细菌中表达多肽的启动子包括大肠杆菌lac或trp启动子、lacl启20动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、XPR启动子和XPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达25的其它启动子。适合于在细菌中表达多肽或其片段的启动子包括大肠杆菌/ac或&p启动子、/ac/启动子、/acZ启动子、n启动子、T7启动子、g内启动子、义尸R启动子和/LPi启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真菌启动子包括a-因子启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、30来自逆转录病毒的LTRs以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。^织待,性擅欽启动子本发明提供了可以以组织特异性方式表达的表达序列盒,例如可以以组织35特异性方式表达本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表达序列盒。本发明也提供了以组织特异性方式表达本发明纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的植物或种子。组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的方式。术语"植物"包括全植物、植物部分(例如叶、茎、花、根等等)、植物5原生质体、种子和植物细胞以及它们的后代。可以用于本发明的方法中的植物的种类很广泛,广泛至能用转化技术进行处理的高等植物,包括被子植物(单子叶植物和双子叶植物),以及裸子植物。它们包括各种倍数性水平的植物,包括多倍体、二倍体、单倍体和半合子植物。正如此处所用,术语"转基因植物"包括异源核酸序列已经被插入到其中的植物或植物细胞,所述异源核酸序列例如本发明10的核酸和各种重组构建物(例如表达序列盒)。—方面,组成型启动子如CaMV35S启动子可以被用于在植物或种子的特定部分或在整个植物中的表达。例如,为了过度表达,可以使用植物启动子片段,其将指导核酸在植物例如再生植物的一些或所有组织中表达。此处,这样的启动子被称作"组成型"启动子,它们在大部分环境条件和发育或细胞分化状态下是15有活性的。组成型启动子的实例包括花椰菜花叶病毒(CaMV)35S转录起始区、来自根瘤农杆菌的T-DNA的l'或2'启动子、以及来自本
技术领域
已知的多种植物基因的其它转录起始区。这样的基因包括,例如来自拟南芥"ra6Wo/w/s)的ZC77/(Huang(19%)PlantMol.Biol.33:125-139);来自拟南芥的Ca"(GenbankNo.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);来自甘蓝型油菜(&owi'o720"a/7M)的编码硬酯酰基-酰基载体蛋白去饱和酶的基因(GenbankNo.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);来自玉米的G尸c/(GenbankNo.X15596;Martinez(1989)J.Mol.Biol.208:551-565);来自玉米的G/c2(GenbankNo.U45855;Manjunath(1997)Plant.Mol.Biol.33:97-112);在美国专利4,962,028;5,633,440中描述的植物启动子。25本发明使用来自病毒的组织特异性或组成型启动子,这些启动子可以包括,例如烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683;稻米东格鲁杆状病毒(RTBV),该病毒仅在受感染稻米植物中的韧皮细胞中复制,它的启动子驱动强的韧皮特异性报道基因的表达;木薯脉带花叶病毒(CVMV)启动子,其在导管、叶中轴细胞、根尖中具有最高活性(Verdaguer30(1996)PlantMol.Biol.31:1129-1139)。—方面,植物启动子指导表达纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸表达于特定组织、器官或细胞类型中(即,组织特异启动子),或者可以在更加精确的环境或发育控制下或在诱导型启动子的控制下指导表达纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡35糖苷酶的核酸的表达。可以影响转录的环境条件的例子包括厌氧条件、提高温度、有光或喷撒化学品/激素。例如,本发明包括玉米的干旱诱导型启动子(Busk(1997)如上),马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)PlantMol.Biol.33:897909)。—方面,组织特异性启动子只在该组织的发育阶段的某个时间段内促进转录。参见,例如描述拟南芥LEAFY基因启动子的Blazquez(1998)PlantCell510:79卜800。也见,描述转录因子SPL3的Cardon(1997)PlantJ12:367-77,SPL3识别拟南芥(A//w//a"a)的调节植物分生组织形成的基因(meristemidentitygene)API的启动子区域的保守序列基序;和描述分生组织启动子elF4的Mandel(1995)PlantMolecularBiology,29巻,995-1004页。可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。一方面,本发明的核酸与主要在棉花纤维细胞10中有活性的启动子可操作地连接。一方面,本发明的核酸与主要在棉花纤维细胞伸长的阶段具有活性的启动子可操作地连接,例如,Rinehart(1996)supra所描述的。核酸可以与Fbl2A基因启动子可操作地连接,这样它将偏好在棉花纤维细胞(Ibid)中表达。也见John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美国专利5,608,148和5,602,321,描述了用于构建转基因棉花植物的棉花纤维15特异性启动子和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括乙醇脱氢酶基因中的启动子(DeLisle(19%)Int.Rey.Cytol.123:39-60)。也可以使用别的启动子来表达本发明的核酸,包括,例如,胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的组合;叶特异的启动子(见,例如,Busk(1997)PlantJ.11:12851295,描述玉米的叶特20异的启动子);发根农杆菌C4gra/jfl"eWMW^'zoge"M)的ORF13启动子(ORF13启动子在根部表现出高活性,见,例如Hansen(1997)如上);玉米花粉特异性启动子(见,例如Guerrero(1990)Mol.Gen.Genet.224:161168);番茄启动子,其在果实成熟、变老、从叶上脱落的过程中有活性,在花中具有低一些的活性(见,例如,Blume(1997)PlantJ.12:731746);马铃薯SK2基因的雌蕊特异性启动子25(见,例如Ficker(1997)PlantMol.Biol.35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性,这使它成为使外源基因靶向表达于活跃地生长的芽或纤维的表皮层的有用工具;胚珠特异的BEL1基因(见,例如,Reiser(1995)Cell83:735-742,GenBank号U39944);和/或Klee,美国专利5,589,583中的启动子,描述了一种植物启动子区域,其可导致在分生组30织和/或快速分裂细胞中的高水平转录。—方面,经由对植物激素例如植物生长素的暴露便能被诱导的植物启动子可用于表达本发明的核酸。例如,本发明可以使用大豆(G(ydne/muL.)的植物生长素响应元件E1启动子片段(AuxREs)(Liu(1997)PlantPhysiol.115:397-407);植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen35(1996)PlantJ.10:955-966);烟草的植物生长素诱导的parC启动子(Sakai(1996)37:906-913);植物生物素响应元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937);和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science274:1900-1902)。本发明的核酸也可以与植物启动子可操作地连接,所述植物启动子暴露于施用于植物的化学试剂例如除草剂或抗生素,便能够被诱导。例如,可以使用由5苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(DeVeylder(1997)PlantCellPhysiol.38:568-577);不同的除草剂安全剂的应用诱导不同的基因表达模式,包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下,例如,针对含有燕麦Uve"flsa"wL.)(oat)精氨酸脱羧酶基因的转基因烟草植物所描述的(Masgrau(1997)PlantJ.11:465-473);或者处于水10杨酸响应元件的控制之下(Stange(1997)PlantJ.11:1315-1324)。使用化学(例如,激素或杀虫剂)诱导的启动子,即,对施用于田间的转基因植物的化学剂发生响应的启动子,本发明的多肽的表达可以在植物发育的特定阶段被诱导。所以,本发明也提供含有可诱导基因的转基因植物,所述可诱导基因编码本发明的多肽,其宿主范围局限于靶向植物种类,例如玉米、稻、大麦、大豆、番茄、小麦、马15铃薯或别的作物,并且所述可诱导基因在作物发育的任何阶段都可被诱导。本领域技术人员会认识到,组织特异性的植物启动子可能驱动可操作地连接的序列在不是耙组织的组织中表达。因此,一方面,组织特异性启动子是驱动在耙组织或细胞类型中产生优势表达的启动子,但是也可以导致在别的组织中的一些表达。20本发明的核酸也可以与在暴露于化学试剂时被诱导的植物启动子可操作地连接。这些试剂包括例如,除草剂、合成的植物生长激素或抗生素,它们可以通过例如喷雾施用于转基因植物。本发明的产生纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的核酸的诱导型表达将允许栽培者对具有最佳的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷25酶表达和/或活性的植物进行选择。植物部分的发育也可以因此被控制。这样,本发明提供了促进植物和植物部分的收获的方法。例如,在许多实施方式中,玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(DeVeylder(1997)PlantCellPhysiol.38:568-577);应用不同的除草剂安全剂诱导出不同的基因表达模式,包括在根中、排水器中、芽尖分生组织中的表达。本发明的编码序列也可30以处于四环素诱导的启动子的控制之下,例如,对含有燕麦Uvem^fl"vaL.)(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)PlantJ.11:465-473);或者,可以由水杨酸响应元件控制(Stange(1997)PlantJ.11:1315-1324)。在一些方面,适当的多肽表达可能要求在该编码区域的3'端具有多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、各种类别的其它植物(或者动35物或其它)基因或者农杆菌T-DNA中的基因。表这载,克虔载体本发明提供包括本发明的核酸例如编码本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬5菌粒(phagemids)、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、Pl衍生的人工染色体、酵母质粒、酵母人工染色体和任何别的对感兴趣的特定宿主(例如,杆状菌、曲霉和酵母)有特异性的载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大量的合适的载体对于本领域技术人员都是已知的,并且可以10商业获得。典型的载体包括细菌pQE载体(Qiagen)、pBLUESCRIPTTM质粒、pNH载体、入-ZAP载体(Stratagene);ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia);真核细胞的PXT1、pSG5(S驗gene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以使用任何别的质粒或别的载体,只要它们可以在宿主中复制和维持下去。可以在本发明中使用低拷贝数或高拷贝数的载体。15"质粒"可以商购得到,在不受限制的基础上可以公开获得,或可以根据已公开的程序用可获得的质粒来构建。与本文描述的那些质粒等价的质粒在本
技术领域
是已知的,并且对于普通技术人员是显而易见的。表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制20原点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5,侧翼非转录序列。在一些方面,衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录基因元件。在一个方面,表达载体含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因25和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(£.co//)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.TRP1基因。启动子区域可以从任何期望的基因中选择出来,使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体。在一个发明,用于在真核细胞中表达多肽或其片段的载体含有增强子,以30增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp。它们作用于启动子,增强其转录。示例性增强子包括在复制原点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制原点下游侧的多瘤增强子,和腺病毒增强子。核酸序列可以通过各种程序插入载体中。一般而言,将插入物和载体用合35适的限制性内切酶消化后,序列可以连接到载体中的所希望的位置。可选择地,插入物和载体的平末端可以被连接。在本领域己知多种克隆技术,例如在Ausubel和Sambrook中描述的。这样的程序和别的程序被认为在本领域技术人员的范围内。载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、5腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。可以使用的特定的细菌载体包括商业上可获得的质粒,其包括以下已知的克隆载体的遗传元件pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、10pQE-9(Qiagen)、pD10、psiX174pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233隱3、DR540、pRIT5(Pharmacia)、pKK232-8禾QpCM7。特定的真核载体包括pSV2CAT、pOG44、pXTl、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何别的载体,只要它可以在宿主细胞中复制和维持。15本发明的核酸可以在表达序列盒、载体或病毒中表达,在植物细胞和种子中短暂地或稳定地表达。一个示例性的短暂表达系统应用了附加体(episomal)表达系统,例如,通过含有超螺旋DNA的附加小染色体的转录而在核中产生的花椰菜花叶病毒(CaMV)病毒RNA,见,例如,Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。作为选择,编码序列,即本发明的序列的全部或子片段,可以插入20到植物宿主细胞基因组中,而成为该宿主染色体DNA的整合部分。正义和反义转录子可以以这种方式被表达。包含本发明的核酸的序列(例如,启动子或编码区域)的载体可以包含赋予植物细胞或种子选择性表型的标记基因。例如,所述标记可以编码生物杀灭剂抗性,特别是抗生素抗性,例如对卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性,例如对氯磺隆或Basta的抗性。25可以在植物中表达核酸和蛋白的表达载体在本领域中是熟知的,可以包括,例如,根瘤农杆菌的载体、马铃薯病毒X(见,例如,Angell(1997)EMBOJ.16:3675-3684)、烟草花叶病病毒(见,例如,Casper(1996)Gene173:69-73)、番茄丛矮病毒(见,例如,Hillman(1989)Virology169:42-50)、烟草蚀纹病毒(见,例如,Dolja(1997)Virology234:243-252)、菜豆金色花叶病毒(见,例如,Morinaga30(1993)Microbiolinhnunol.37:471-476)、花椰菜花叶病毒(见,例如,Cecchini(1997)Mol.PlantMicrobeInteract.10:1094-1101)、玉米Ac/Ds转座元件(见,例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194),和玉米抑制基因-突变基因(Spm)转座元件(见,例如Schlappi(1996)PlantMol.Biol.32:717-725);和它们的衍生物。35在一个方面,表达载体可以有两套复制系统,使其可以在两种生物中保持,例如在哺乳动物或昆虫细胞中表达,在原核宿主中克隆和扩增。进一步,对于整合表达载体,该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在该表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列,可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建在本领域是已知的。5本发明的表达载体也可以包括选择性的标记基因,以便对已经转化的细菌株进行选择,例如,使细菌对药物,例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成基因,例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。表达载体中的DNA序列被可操纵连接到合适的表达控制序列(一种或多10禾中)(启动子),以指导RNA合成。具体命名的细菌启动子包括/flc/、/acZ、r3、T7、砂f、义/V义&和印。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs以及小鼠金属硫蛋白-I启动子。选择合适的载体和启动子在本领域技术人员的水平之内。表达载体还可以包括用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增15表达的合适序列。启动子区域可以从任何期望的基因中选择出来,使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体。此外,在一个方面,表达载体含有一个或多个选择性标记基因,以提供用于选择被转化的宿主细胞的表型特征,例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性,或例如大肠杆菌中的四环素或氨苄青霉素抗性。20哺乳动物表达载体还可以包括复制原点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5'侧翼非转录序列。在一些方面,衍生于SV40剪接子的DNA序列和聚腺苷酸化位点可以用于提供所需要的非转录基因元件。用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表25达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,其作用于启动子,增强其转录。示例性增强子包括在复制起点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子,和腺病毒增强子。此外,表达载体含有一个或多个选择性标记基因,使得可以对含有该载体30的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S,c^e他^)7TP;基因。在一些方面中,编码本发明的多肽之一或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段的核酸与能指导35翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。一方面,该核酸可以编码融合蛋白,其中本发明的多肽之一或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段被融合到异源肽或多肽,例如N-末端鉴定肽,其给予了期望的特性,如增加的稳定性或简化的纯化特性。合适的DNA序列可以通过各种程序插入载体中。一般而言,将插入物和5载体用合适的限制性内切酶消化后,DNA序列可以连接到载体中的所希望的位置。可选择地,插入物和载体的平末端可以被连接。多种克隆技术被公开于Ausubeetal.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.1997禾卩Sambrooketal,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。这样的程序和别的程序被认为在本领域技术人员的范围10内。载体可以是例如质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和15表达载体在Sambrook,etal,MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y.,(1989)中描述。涼主雄辦飾應本发明也提供了包含本发明的核酸序列的转化细胞,所述核酸序列例如编20码本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的序列,或本发明的载体。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核细胞,真核细胞,例如,细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示例性的细菌细胞包括链霉菌属、葡萄球菌属或杆菌属的任何种,或者示例性种大肠杆菌、枯草芽孢杆菌(Bac,7/Mss"6"to)、蜡25状芽孢杆菌(5a"7/wcewiw)、鼠伤寒沙门氏菌(Sa/mow//a0^Wwwn'wm)。示例性的昆虫细胞包括草地夜蛾属(S/wcfo/^ra)或果蝇属(Z>0TO//7a)的任何种,包括果蝇和草地夜蛾(S;x/o;^ra)S/9。示例性的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是已知的,在技术和科学文献中有描30述,见,例如,Weising(1988)Ann.Rey.Genet.22:42卜477;美国专利5,750,870。载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。35—方面,本发明的核酸或载体导入细胞是为了筛选,所以,所述核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。示例性的方法包括CaPCV沉淀法、脂质体融合、脂转染法(例如,LIPOFECTINTM)、电穿孔法、病毒感染法,等等。候选的核酸可以稳定,整合到宿主细胞基因组中(例如,用反转录病毒导入)或者可以短暂的或稳定的存在于细胞质中(即,通过使用传统的质粒,利用标准的调控序列、选择标记,等等)。因为许多药学上重5要的筛选要求人或模型哺乳动物靶细胞,所以可以使用能够转染这些靶的反转录病毒载体。在适当的情况下,工程宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度10变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解试剂。这些方法15为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。20宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。取决于重组生产方法中所用的宿主,由含有载体的宿主细胞产生的多肽可以糖基化或者非糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或25其片段的核酸可操作地连接的启动子。在一些方面,该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。表达载体可以含有一个或多个选择性标记基因,为选择转化宿主细胞提供表型特征,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者例如大肠30杆菌的四环素或氨苄青霉素抗性。含有感兴趣多核苷酸如本发明的核酸的宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增基因。培养条件例如温度、pH和类似条件是先前选择宿主细胞用于表达所使用的培养条件,对于普通技术人员是明显的。然后,被鉴定为具有指定的酶活性的克隆被测35序,以鉴定编码具有增强活性的酶的多核苷酸序列。本发明提供了在细胞中过度表达重组纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的方法,该方法包括表达含有本发明的核酸的载体,本发明的核酸例如包含在至少约100个残基的区域内与本发明的示例性序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、573%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核酸序列的核酸,其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定;或者在严紧条件下与本发明的核酸序列杂交的核酸。过度表达通过任何方式例如使用高活性启动子、双顺反子(dicistronic)载10体或通过该载体的基因扩增来实现。本发明的核酸可以在任何体外或体内表达系统中被表达或过度表达。任何细胞培养系统可被用于表达或过度表达重组蛋白,包括细菌、昆虫、酵母、真菌或哺乳动物培养物。通过启动子、增强子、载体(例如,复制子载体、双顺反子载体的使用(见,例如Gurtu(19%)Biochem.Biophys.Res.Commun.229:295-8))、15培养基、培养系统等等的合适选择,可以实现过度表达。一方面,使用选择标记如谷氨酰胺合酶(见,例如Sanders(1987)Dev.Bio1.Stand.66:55-63)在细胞系统中进行的基因扩增被用于过度表达本发明的多肽。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核细胞,真核细胞,例如,细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。合适的宿主的选择在本领域技20术人员的能力范围内。载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。25在适当的情况下,工程宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。30细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解试剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏35水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化歩骤中可以采用高效液相色谱(HPLC)。各种哺乳动物细胞培养系统也可以被用于表达重组蛋白。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系(由Gluzman,Cell,21:175,1981描述),以及能从相容载体表达蛋白的其它细胞系,如C127、3T3、CHO、HeLa和BHK5细胞系。宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。根据重组产生方法中所用的宿主,由含有载体的宿主细胞产生的多肽可以糖基化或者非糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。可选地,本发明的多肽,或者含有其至少大约5、10、15、20、25、30、1035、40、50、75、100或150或更多个连续氨基酸的片段,可以通过常规肽合成仪合成产生,例如,如下面所讨论。在其它方面,通过肽合成,所述多肽的片段或部分可以被用于产生相应的全长多肽;因此,所述片段可用作产生全长多肽的中间物。也可以采用无细胞的翻译系统来产生本发明的多肽之一或含有其至少大15约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段,其应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面,该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。20在本发明的实践中,本发明的核酸和编码本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸,或本发明的修饰的核酸,可以通过扩增来增殖,例如,通过PCR。扩增也可以被用于克隆或修饰本发25明的核酸。因此,本发明提供了用于扩增本发明核酸的扩增引物序列对。本
技术领域
技术人员能设计用于这些序列的任何部分或全长的扩增引物序列对。—方面,本发明提供了通过本发明的扩增引物对扩增的核酸,所述扩增引物对例如本发明的核酸的大约前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个残基以及互补链的大约前(5')15、16、17、18、19、20、3021、22、23、24或25或更多个残基所示的引物对。本发明提供了用于扩增核酸的扩增引物序列对,所述核酸编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多肽,其中所述引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个成员或每一成员可以包含寡核苷酸,该寡核苷酸包含所述序列的至少约10至50个或更多个连续碱基,或所述35序列的约12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个连续残基。本发明提供了扩增引物对,其中所述引物对包括第一成员和第二成员,第一成员具有本发明核酸的大约前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个碱基所示的序列,第二成员具有第一成员的互补链的大约前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个碱基所示的序列。5本发明提供了通过扩增产生的纤维素酶,例如编码内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,所述扩增例如聚合酶链反应(PCR),使用本发明的扩增引物对。本发明提供了通过扩增制备纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的方法,所述扩增例如PCR,使用本发明的扩增引物对。一方面,所述扩增引物对从文库例如基因文库诸如环10境文库扩增核酸。扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸,或量化样品中特异性核酸的量。在本发明的一个方面,扩增从细胞或cDNA文库分离出的信息。技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本技术领15域也是己知的,包括,例如聚合酶链式反应PCR(例如参见PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,连接酶链式反应(LCR)(例如参见Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);转录扩增(例如参见Kwoh(1989)Proc.Natl.Acad.20Sci.USA86:1173);和自主维持序列复制(例如参见Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);QP复制酶扩增(例如参见Smith(1997)J.Clin.Microbiol.35:1477_1491),自动Q_p复制酶扩增测定法(例如参见Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介导技术(例如NASBA,Cangene,Mississauga,Ontario);也参见Berger(1987)MethodsEnzymol,152:307-316;Sambrook;Ausubel;25美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。确定核酸和多肽的序列同一性本发明提供了核酸,所述核酸包括与本发明的示例性核酸(参见表1、2和3,下面的实施例1和4,以及序列表)在至少大约50、75、100、150、200、30250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、7P/。、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、3583%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的序列。本发明提供了多肽,该多肽包括与本发明的示例性多肽(参见表l、2和3,下面的实施例1和4,以及序列表)具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、582%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的序列。序列同一性(同源性)的程度可以使用任何计算机程序和相关参数来确定,包括本文描述的那些,如BLAST2.2.2或FASTA3.0t78版本,参数为默认值。本发明的核酸序列可以包括本发明的示例性序列和与其基本上相同的序10列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多个连续核苷酸。本发明的核酸序列的同源序列和片段可以指与这些序列具有至少约50°/。、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、1587%、88%、89%、90%、91%、92%、93%、94%、95°/。、96%、97%、98%、99%或更高的序列同一性(同源性)的序列。同源性(序列同一性)可以使用本文所描述的任何计算机程序和参数来确定,包括FASTA3.0t78版本,参数为默认值。同源序列还包括RNA序列,其中尿嘧啶取代本发明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一种方法获得,或者从对测序错误的纠正中产生。20应该意识到,本发明的核酸序列可以以传统的单字母格式表示(例如参见Stryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork),或以在序列中记录核苷酸的身份的任何其它格式表示。在各个方面,本文描述的序列比较程序被用于本发明的该方面,即,确定核酸或多肽序列是否在本发明的范围之内。然而,蛋白和/或核酸序列同一性(同25源性)可以使用本
技术领域
已知的任何序列比较算法或程序来评价。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(参见,例如PearsonandLipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Thompson等人,NucleicAcidsRes.22(2):4673-4680,1994;Higgins等人,MethodsEnzymol.266:383-402,1996;Altschul30等人,j.Mol.Biol.215(3):403-410,1990;Altschul等人,NatureGenetics3:266-272,1993)。一方面,同源性或同一性可以使用序列分析软件来测量(例如,地址为1710UniversityAvenue,Madison,WI53705的威斯康星大学生物技术中心遗传学计算机组(GeneticsComputerGroup)的序列分析软件包)。这样的软件通过对各种缺失、35取代和其它的修饰赋予同源性度数来匹配相似的序列。一方面,用于表示两个或者更多个核酸或者多肽序列之间的关系的术语"同源性"和"同一性",是指当两个或更多个序列或子序列在某一比较窗口(comparisonwindow)或者指定区域内被比较和联配以确定最大一致性时,这些序列是相同的,或者具有特定百分比例的相同氨基酸残基或核苷酸,其可以应用各种序列比较算法或者通过人工联配和视觉观察来确定。一方面,对于序列比较,将一个序列作为参考序列,而将测试5序列与之进行比较。当使用序列比较算法时,将测试序列和参考序列输入到计算机中,指定子序列坐标,如果必要,也指定序列算法程序参数。可以使用默认的程序参数,或者可以指定别的参数。然后基于程序参数,序列比较算法计算出测试序列相对于参考序列的序列同一性百分比。—方面,BLAST和BLAST2.0算法被使用,其分别被描述于Altschul(1997)Nuc.AcidsRes.25:3389-3402,1997和Altschul(1990)J.Mol.Biol.215:403-410,19卯。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(querys叫uence)中长度为W的短的字串来确定高分序列对(highscoringsequencepairs,HSPs),所述高分序列对在与数据库15序列中同样长度的字串联配时,匹配或者满足某个正值的阈值T。T是指邻近字串(neighborhoodword)的分数阈值(Altschul等,如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸,只要累积的联配分数在增加。对于核苷酸序列,使用参数M(—对匹配的残基的奖励分数;总是大于0)来计算累积分数。对于氨基酸序列,使用记分20矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两25条链进行比较。对于氨基酸序列,BLASTP程序默认字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,30Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallestsumprobability,P(N)),其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在测试核酸和参考核酸的比较中,如果最小合计概率小于大约0.2,更优选的是在一方面中小于0.01,最优选的是在一方面中小于大约0.001,就认为该核酸与参考序列相似。35—方面,应用基本局域联配搜索工具("BLAST")来评价蛋白和核酸序列同源性。具体而言,五个特定的BLAST程序可以用来进行以下的任务(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较;(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较;(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的5翻译产物与蛋白序列数据库进行比较;(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;和(5)TBLASTX把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。10BLAST程序通过确定相似片段来确定同源序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的"高分片段对(high-scoringsegmentpairs)",该受测序列一方面从蛋白或者核酸序列数据库得到。高分片段对一方面利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。一方面,应用的记分矩阵为BLOSUM62矩阵(Gonnet(1992),Science256:1443-1445;15Henikoff和Henikoff(1993),Proteins17:49-61)。较不优选地,在一方面,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和Dayhoff,eds.,1978,Afafn'cesWashingion:NationalBiomedicalResearchFoundation)。BLAST程序通过美国国家医学图书馆(U.S.NationalLibraryofMedicine)可以获得。20根据所研究的序列长度和同源性程度,上述算法使用的参数可以被调整。在一些方面,在无用户的指示的情况下,所述参数使用算法所采用的默认参数。计算机系统和计算机程序产品本发明提供了计算机、计算机系统、计算机可读取的介质、计算机程序产25品以及其上记录或存储了本发明的核酸和多肽序列的类似设备。此外,在实践本发明的方法中,例如,为了确定和鉴定序列同一性(为了确定核酸是否在本发明的范围之内)、结构同源性、基序等等,本发明的核酸或多肽序列可以在可通过计算机读取和访问的任何介质上存储、记录和操作。正如此处所用,词语"记录"和"存储"指在计算机介质上存储信息的过30程。熟练技术人员能容易地采用任何已知方法,在计算机可读取的介质上存储信息,以产生包括本发明的一个或多个核酸和/或多肽序列的产品。正如本文所用,术语"计算机"、"计算机程序"和"处理器"以它们在最广的普通语境中的含义被使用,包括了所有这样的设备,例如下面所详细描述的。特定多肽或蛋白的"编码序列"或"编码特定多肽或蛋白的序列"是指当被置于适当的调控序列的控制35下时可被转录和翻译成多肽或蛋白的核酸序列。本发明的多肽包括本发明的示例性序列和与其基本上相同的序列以及前述序列的任一个的子序列(片段)。一方面,基本上相同的、或同源的多肽序列是指与本发明的示例性序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、583%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93Q/o、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的多肽序列。同源性(序列同一性)可以使用本文所描述的计算机程序和参数的任一种进行确定。本发明的核酸或多肽序列可以在可通过计算机读取和访问的任何介质10上存储、记录和操作。正如此处所用,词语"记录"和"存储"指在计算机介质上存储信息的过程。熟练技术人员能容易地采用任何目前已知的方法,在计算机可读取的介质上存储信息,以产生包括本发明的一个或多个核酸序列、本发明的一个或多个多肽序列的产品。本发明的另一方面是其上记录有至少2、5、10、15或20或更多个本发明的核酸或多肽序列的计算机可读取介质。15本发明的另一方面是其上记录有本发明的一个或多个核酸序列的计算机可读取介质。本发明的另一方面是其上记录有本发明的一个或多个多肽序列的计算机可读取介质。本发明的另一方面是其上记录有至少2、5、10、15或20或更多个如上面所述的核酸或多肽序列的计算机可读取介质。计算机可读取介质包括磁性可读取介质、光学可读取介质、电子可读取介20质和磁/光学介质。例如,计算机可读取的介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存取存储器(RAM)或只读存储器(ROM)以及本领域的技术人员己知的其它类型的其它介质。本发明的方面包括系统(例如基于因特网的系统),例如计算机系统,它们存储和操纵本文描述的序列信息。计算机系统100的一个实例以框图形式示意25性地描述在图1中。正如此处所用,"计算机系统"指硬件部分、软件部分以及数据存储部分,它们用于分析本发明的核酸序列的核苷酸序列或本发明的多肽序列。一方面,计算机系统100包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知类型的中央处理单元,如来自英特尔公司的奔腾III,或来自Sun、Motorola、Compag、AMD或IBM公司的类似处理器。30—方面,计算机系统100是一个通用的系统,该系统包括处理器105和用于存储数据的一个或多个内部数据存储部件110,以及用于检索数据存储部件上存储的数据的一个或多个数据检索设备。技术人员能容易地意识到,任何一种当前可获得的计算机系统都是合适的。在一个特定的方面,计算机系统100包括连接到总线上的处理器105,总35线连接到主存储器115(在一方面,以RAM来实现)和一个或多个内部数据存储设备110,例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。在一些方面,计算机系统100进一歩包括一个或多个数据检索设备118,用于读取在内部数据存储设备110上存储的数据。数据检索设备118可以是,例如软盘驱动器、压縮磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些5方面中,内部数据存储设备110是可移动的计算机可读介质,例如含有控制逻辑和/或其上记录的数据的软盘、压縮磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程,用于当数据存储部件被插入到数据检索设备中时从数据存储部件读取控制逻辑和/或数据。计算机系统100包括显示器120,用于给计算机用户显示输出。也应用注10意到,计算机系统100可以被连接到网络或广域网中的其它计算机系统125a-c,以便给计算机100提供集中访问。用于访问和处理本发明的核酸序列的核苷酸或本发明的多肽序列的软件(例如,检索工具、比较工具和建模工具等等)在执行过程中可驻留于主存储器115中。15在一些方面,计算机系统100可以进一步包括序列比较算法,其用于比较存储于计算机可读介质上的本发明核酸序列或本发明多肽序列与存储于计算机可读介质上的参考核苷酸或多肽序列。"序列比较算法"指在计算机系统100上执行(本地或远程)的一种或多种程序,以比较核苷酸序列和数据存储设备中存储的其它核苷酸序列和/或化合物。例如,序列比较算法可以将计算机可读介质上存储20的本发明的核酸序列的核苷酸序列或本发明的多肽序列与计算机可读介质上存储的参考序列进行比较,以鉴定同源性或结构基序。图2是示意性说明过程200的一个方面的流程图,该过程用于将新的核苷酸或蛋白序列与序列数据库进行比较,以便确定新序列和数据库中的序列之间的同源性水平。序列数据库可以是存储于计算机系统100上的个人数据库,或可以25通过因特网获得的公共数据库如GENBANK。过程200在起始状态201开始,然后转到状态202,其中要被比较的新序列被存储于计算机系统100的存储器上。正如上面所讨论的,该存储器可以是任何类型的存储器,包括RAM或内部存储设备。然后过程200转到状态204,其中打开序列数据库以进行分析和比较。然30后过程200转到状态206,其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较,以确定第一个序列是否与第二个序列相同。重要的是应该注意到,该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本
技术领域
的普通技术人员是己知的,即使所述两个核苷酸或蛋白序列不完全相同。例如,可以在一个35序列中引入空位,以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。—旦已经在状态210进行两个序列的比较,在决策状态210就要作出两个序列是否相同的判断。当然,术语"相同的"不限于绝对相同的序列。在过程200中,在由用户输入的同源性参数范围内的序列都将被标记为"相同的"。如果作出两个序列相同的判断,过程200转到状态214,其中来自数据库5的序列的名称被显示给用户。该状态通知用户,具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户,过程200转到决策状态218,其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序歹lj,那么过程200在结束状态220终止。然而,如果数据库中确实存在更多的序歹廿,那么过程200转到状态224,其中指针被指向数据库中的下一个序列,以便与10新序列进行比较。以这种方式,将新序列与数据库中的每一序列联配并进行比较。应该注意到,如果已经在决策状态212已经作出了序列不同源的判断,那么过程200将立即转到决策状态218,以便确定用于比较的数据库中的任何其它序列是否可利用。因此,本发明的一个方面是计算机系统,该系统包括处理器、其上已经存15储了本发明核酸序列或本发明的多肽序列的数据存储设备、其上以可检索方式存储了待与本发明的核酸序列或本发明的多肽序列比较的参考核苷酸序列或多肽序列的数据存储设备、以及用于进行比较的序列比较器。该序列比较器可以指出被比较的序列之间的同源性水平,或鉴定上述的本发明的核酸序列的核酸密码或者本发明的多肽序列中的结构基序,或者该比较器可以鉴定与这些核酸密码和多肽20密码进行比较的序列中的结构基序。在一些方面中,数据存储设备可以在其上已经存储了至少2、5、10、15、20、25、30或40个或更多个本发明的核酸序列或本发明的多肽序列的序列。本发明的另一方面是确定本发明的核酸序列或本发明的多肽序列和参考核苷酸序列之间的同源性水平的方法。所述方法包括通过使用确定同源性水平的25计算机程序读取核酸密码或多肽密码以及参考核苷酸或多肽序列,以及用该计算机程序确定核酸密码或多肽密码与参考核苷酸或多肽序列之间的同源性水平。所述计算机程序可以是确定同源性水平的许多计算机程序的任何一种,包括本文中具体罗列的那些程序(例如,BLAST2N,具有默认参数或任何调整的参数)。所述方法可以使用上述的计算机系统执行。所述方法还可以如下进行通过使用所述30计算机程序读取至少2、5、10、15、20、25、30或40个或更多个上述的本发明的核酸序列或本发明的多肽序列,以及确定核酸密码或多肽密码与参考核苷酸或多肽序列之间的同源性水平。图3是示意性说明计算机中实施的过程250的一个方面的流程图,该过程用于确定两个序列是否同源。过程250在起始状态252开始,然后转到状态254,35其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态256被存储到存储器上。然后过程250转到状态260,其中读取第一个序列中的第一个字符,然后转到状态262,其中读取第二个序列的第一个字符。应该理解到,如果序列是核苷酸序列,那么字符将通常是A、T、C、G或U。如果序列是蛋白序列,那么字符一方面可以是单字母氨基酸密码,以便第一个序列和第二个序列可以被容易地比较。5然后在决策状态264作出两个字符是否相同的判断。如果它们相同,那么过程250转到状态268,其中第一个和第二个序列中的下一个字符被读取。然后作出该下一个字符是否相同的判断。如果它们相同,那么过程250继续循环,直到两个字符不相同。如果作出的判断是这两个字母不相符,那么过程250转到决策状态274,以确定是否有更多的字符或者序列可以读取。10如果没有可读取的任何更多的字符,那么过程250转到状态276,其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此,如果第一个100个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配,那么同源性水平将是100%。15可以选择地,计算机程序可以是这样的计算机程序,其将本发明所示的核酸序列的核苷酸序列与一个或多个参考核苷酸序列进行比较,以确定本发明的核酸密码是否在一个或多个位置上与参考核酸序列不同。任选地,这样的程序记录,相对于参考多核苷酸序列或者本发明的核酸序列,被插入、删除或取代的核苷酸的长度和身份。一方面,计算机程序可以是确定本发明的核酸序列是否相对于参20考核苷酸序列含有单核苷酸多态性(SNP)的程序。因此,本发明的另一方面是确定本发明的核酸序列是否在一个或多个核苷酸处与参考核苷酸序列不同的方法,所述方法包括通过使用鉴定核酸序列之间的差异的计算机程序读取核酸密码和参考核苷酸序列,并用该计算机程序鉴定核酸密码和参考核苷酸序列之间的差异。在一些方面,计算机程序是鉴定单核苷酸多25态性的程序。该方法可以通过上面描述的计算机程序和图3所示意性说明的方法执行。所述方法还可以如下进行通过使用所述计算机程序读取至少2、5、10、15、20、25、30或40个或更多个本发明核酸序列和参考核苷酸序列,以及用该计算机程序鉴定核酸密码与参考核苷酸序列之间的差异。在其它方面,基于计算机的系统可以进一步包括鉴定器,其用于鉴定本发30明的核酸序列或本发明的多肽序列中的特征。"鉴定器"指在本发明的核酸序列或本发明的多肽序列中鉴定某些特征的一个或多个程序。一方面,鉴定器可以包括在本发明的核酸序列中鉴定开放阅读框(ORF)的程序。图4是示意性说明鉴定器过程300的一个方面的流程图,即用于检测序列中特征的存在。过程300在起始状态302开始,然后转到状态304,其中将被检査35特征的第一个序列存储在计算机系统100的存储器115上。然后过程300转到状态306,其中打开序列特征数据库。这样的数据库包括每一特征的属性以及该特征的名称的列表。例如,特征名称是"起始密码子",属性是"ATG"。另一个实例是特征名称"TAATAA序列盒",特征属性是"TAATAA"。这样的数据库的实例由威斯康星大学遗传学计算机组(UniversityofWisconsinGeneticsComputerGroup)开发。可以选择地,这些特征可以是结构多肽基序如a螺旋、J3折叠,或功能多肽5基序如酶活性位点、螺旋-转角-螺旋基序或本
技术领域
技术人员已知的其它基序。—旦在状态306打开特征数据库,过程300就转到状态308,其中从数据库读取第一个特征。然后在状态310将第一个特征的属性与第一个序列进行比较。接着在决策状态316作出在第一个序列中是否发现该特征的属性的判断。如果发现了属性,那么过程300转到状态318,其中所发现的特征的名称被显示给用户。10然后,过程300转到决策状态320,其中作出数据库中是否存在更多特征的判断。如果不存在更多特征,那么过程300在结束状态324终止。然而,如果数据库中确实存在更多的特征,那么过程300在状态326读取下一个序列特征,循环回到状态310,其中将下一个特征的属性与第一个序列进行比较。应当注意,如果在决策状态316在第一个序列中没有发现特征属性,那么过程300直接转到15决策状态320,以便确定数据库中是否存在更多特征。因此,本发明的另一方面是鉴定本发明的核酸序列或本发明的多肽序列中的特征的方法,所述方法包括通过使用鉴定其中特征的计算机程序读取核酸密码或多肽密码,并用该计算机程序鉴定核酸密码中的特征。一方面,计算机程序包括鉴定开放阅读框(ORF)的计算机程序。所述方法可以如下进行通过使用所20述计算机程序读取本发明的核酸序列或本发明的多肽序列中的一个序列或至少2、5、10、15、20、25、30或40个或更多个序列,以及用该计算机程序鉴定核酸密码或多肽密码中的特征。本发明的核酸序列或本发明的多肽序列可以以多种格式在各种数据处理器程序中存储和操作。例如,本发明的核酸序列或本发明的多肽序列可以以文本25文件存储在字处理文件中,如MicrosoftWORD顶或WORDPERFECT,或以ASCII文件存储在本领域技术人员熟悉的各种数据库程序中,例如DB2TM、SYBASE或ORACLE。此外,许多计算机程序和数据库可以被用作序列比较算法、鉴定器或与本发明的核酸序列或本发明的多肽序列进行比较的参考核苷酸序列或多肽序列的来源。下面的罗列不意图限制本发明,而是提供对本发明的核30酸序列或本发明的多肽序列有用的程序和数据库的指导。可以使用的程序和数据库,包括但不限于MACPATTERN(EMBL)、DISCOVERYBASE(MolecularApplicationGroup)、GENEMINE(MolecularApplicationGroup)、LOOK(MolecularApplicationGroup)、MACLOOK(MolecularApplicationGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX35(Altschul等人,J.Mol.Biol.215:403,1990)、FASTA(PearsonandLipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等人,Comp.App.Biosci.6:237-245,1990)、CATALYST(MolecularSimulationsInc.)、Catalyst/SHAPE(MolecularSimulationsInc.)、Cerius2.DBAccessTM(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、INSIGHTIITM(MolecularSimulationsInc.)、DISCOVER(MolecularSimulationsInc.)、CHARMm(Molecular5SimulationsInc.)、FELIXTM(MolecularSimulationsInc.)、DELPHI(MolecularSimulationsInc.)、QuanteMMTM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、MODELER(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulations10Inc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDLAvailableChemicalsDirectory数据库、MDLDrugDataReport数据库、ComprehensiveMedicinalChemistry数据库、Derwent'sWorldDrugIndex数据库、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。基于本发明的公开内容,许多其它程序和数据库对于本
技术领域
的技术人员是显而易见的。15可以用上述程序检测的基序包括编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、ct螺旋和P折叠、编码指导被编码的蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶活性位点、底物结合位点和酶切割位点。20核酸的杂交本发明提供了分离的或重组的核酸,这些核酸与本发明的示例性序列(例如SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,SEQIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQ25IDNO:31,SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:41,SEQIDNO:43,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,SEQIDNO:55,SEQIDNO:57'SEQIDNO:59,SEQIDNO:61,SEQIDNO:63,SEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQIDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQ30IDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQ35IDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145'SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163或SEQIDNO:165(也参见表1、2和3、下面的实施例1和4,以及序列表))在严紧条件下杂交。严紧条件可以是高度严紧性条件、中度严紧性条件和/或低度严紧性条件,5包括本文描述的高的和降低的严紧性的条件。一方面,正如下面所讨论的,洗涤条件的严紧性提供了决定核酸是否在本发明范围内的条件。"杂交"指这样一个过程,g卩,通过该过程核酸链与互补链通过碱基配对而结合。杂交反应可以是灵敏的并且是选择性的,以便感兴趣的特定序列可以被鉴定,甚至在其以低浓度存在的样品中也可以被鉴定。适度的严紧条件(stringent10conditions)可以通过,例如预杂交和杂交溶液中盐或甲酰胺的浓度来定义,或者通过杂交温度来定义,这些严紧条件在本
技术领域
是已知的。在可选的方面,严紧性可以通过降低盐的浓度、增加甲酰胺的浓度或升高杂交温度来增加。在可选择的方面,本发明的核酸通过它们在各种严紧条件(例如强、中等和低严紧条件)下杂交的能力来定义,正如本文所示。15—方面,高度严紧性下的杂交包括在大约37'C到42'C的温度下大约50%的甲酰胺。一方面,杂交条件包括在大约301:到35'(:下在大约35%至25%的甲酰胺中降低的严紧性条件。一方面,杂交条件包括高度严紧性条件,例如,在42'C、在50%甲酰胺、5XSSPE、0.3%SDS中,和200n/ml的剪切和变性鲑精DNA。一方面,杂交条件包括这些降低的严紧性条件,但在降低的温度35匸在35%甲酰胺20中。相应于特定的严紧性水平的温度范围可以通过计算目标核酸中的嘌呤嘧啶比并相应调节温度而进一步縮小。上述范围和条件的变化在本领域中是熟知的。在可以选择的方面中,本发明的核酸,正如通过它们在严紧条件下杂交的能力所定义的,可以在本发明的核酸的大约五个残基到全长之间;例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、25卯、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多残基。也包括小于全长的核酸。这些核酸可以用作,例如杂交探针、标记探针、PCR寡核苷酸探针、siRNA或miRNA(单链或双链)、反义或编码抗体结合肽(表位)、基序、活性位点的序列以及类似序列。—方面,本发明的核酸通过它们在高度严紧性下杂交的能力定义,高度严30紧性包括在大约37'C到42'C的温度下大约50。/。的甲酰胺的条件。一方面,本发明的核酸通过它们在降低的严紧性下杂交的能力定义,降低的严紧性包括在大约30'C到35'C在大约35%至25%的甲酰胺中的条件。可以选择地,本发明的核酸通过它们在高度严紧性下杂交的能力定义,高度严紧性包括的条件为在42'C、在50%甲酰胺、5XSSPE、0.3。/。SDS中,和封35闭核酸的重复序列,如cot-l或鲑精DNA(例如200n/ml的剪切和变性鲑精DNA)。一方面,本发明的核酸通过它们在降低的严紧性条件下杂交的能力定义,降低的严紧性条件包括在35'C或42°C的降低温度下的35%或40%甲酰胺中。在核酸杂交反应中,用于得到特定严紧性水平的条件将根据杂交中的核酸的性质变化。例如,所述核酸的杂交区域的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)可以在选择杂交条件时加以5考虑。另外的考虑因素是核酸之一是否被固定,例如固定在滤膜上。杂交可以在低度严紧性、中度严紧性或高度严紧性的条件下进行。作为核酸杂交的一个实例,含有固定化的变性核酸的聚合物膜首先在45'C在含有如下成分的溶液中预杂交30分钟0.9MNaCl、50mMNaH2P04,pH7.0、5.0mMNa2EDTA、0.5%SDS、10XDenhardt,s和0.5mg/ml多核糖腺苷酸。然后在该溶液中加入大约102X107cpm(比活性为4-9X108cpm/ug)的32P末端标记的寡核苷酸探针。在温育12-16小时后,在室温下在含有0.5%SDS的IXSET"50mMNaCl、20mMTris盐酸,pH7.8、lmMNa2EDTA)中将膜洗涤30分钟,随后,在该寡核苷酸探针的Tm-l(TC的温度,在新鲜的1XSET中洗涤30分钟。然后将膜暴露于放射自显影胶片,以检测杂交信号。所有的前述杂交将被认为在高严紧性条件下。15杂交后,洗涤滤膜以除去任何非特异性结合的可检测探针。用于洗涤滤膜的严紧性也可以根据如下方面进行变化被杂交的核酸的性质、被杂交的核酸的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)。逐步增高的严紧性条件洗涤的实例如下2XSSC,0.1%SDS,室温下洗涤15分钟(低度严紧性);O.IXSSC,0.5%SDS,室温下洗涤30分钟到1小时20(中度严紧性);O.IXSSC,0.5%SDS,杂交温度和68'C之间洗涤15到30分钟(高度严紧性);和0.15MNaCl,72'C洗涤15分钟(极高严紧性)。最终的低严紧性洗涤可以在0.1XSSC在室温下进行。上述的实例仅仅是可用于洗涤滤膜的一组条件的示例性说明。本领域技术人员将知道,对于不同严紧性的洗涤,可以有多种方案。下面给出了一些其它实例。25—方面,杂交条件包括洗涤步骤,其包括在室温下在含有IX150mMNaCl、20mMTris盐酸,pH7.8、lmMNa2EDTA、0.5%SDS的溶液中洗涤30分钟,然后在新鲜溶液中洗涤30分钟。通过放射自显影或其它常规技术,鉴定已杂交至探针的核酸。可以对上述方法进行修饰,以鉴定与探针序列具有降低水平的序列同一性30(同源性)的核酸。例如,为了获得与可检测的探针具有降低的序列同一性(同源性)的核酸,可以使用较低严紧性的条件。例如,杂交温度可以以5'C的梯度变化从68。C降低到42。C,杂交缓冲液的Na+浓度为大约1M。在杂交后,用2XSSC、0.5y。SDs在杂交温度下洗涤滤膜。这些条件在高于5crc被认为是"中度"条件,在低于50'C被认为是"低度"条件。特定实例的"中度"杂交条件是当上述杂交35在55。C进行。特定实例的"低度严格性"杂交条件是当上述杂交在45'C进行。可以选择地,杂交可以在含有甲酰胺的缓冲液如6XSSC中在42'C的温度下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的梯度变化从50%降低到0%,以鉴定与探针具有降低水平的同源性的克隆。在杂交后,用6XSSC、0.5%SDS在5(TC洗涤滤膜。这些条件在高于25%的甲酰胺被认为是"中度"条件,在低于25%甲酰胺被认为是"低度"条件。特定实例的"中度"杂交条件是当上5述杂交在30%甲酰胺中进行。特定实例的"低度严格性"杂交条件是当上述杂交在10%甲酰胺中进行。然而,杂交形式的选择不是关键性的——洗涤条件的严紧性是决定核酸是否在本发明范围内的条件。用于鉴定本发明范围内的核酸的洗涤条件包括,例如在pH7大约0.02M的盐浓度,至少大约50'C或大约55'C到大约60'C的温度;或10者在72'C大约0.15MNaCi的盐浓度下大约15分钟;或者在至少大约50'C或大约55'C到大约6(TC的温度下大约0.2XSSC的盐浓度下大约15到大约20分钟;或者用溶液将杂交复合物洗涤两次,所述溶液的盐浓度为含有0.1%SDS的大约2XSSC,在室温下洗漆15分钟,然后用含有0.1%SDS的0.1XSSC在68。C洗涤15分钟,洗涤两次;或者等同的条件。参见Sambrook,Tijssen和Ausubel对于SSC15缓冲液和等同条件的描述。这些方法可以被用于分离或鉴定本发明的核酸。例如,前述方法可用于分离或鉴定核酸,所述核酸具有与选自本发明的序列或含有其至少大约IO、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500个连续碱基的片段以及其互补序列之一的核酸序列具有至少大约50%、51%、52%、53%、2054%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性(同源性)的序歹l」。序列同一性(同源性)可以使用联配算法来测量。例如,同源多核苷酸可以25具有编码序列,该编码序列是本文描述的编码序列之一的天然发生的等位基因变体。当与本发明的核酸比较时,这样的等位基因变体可以具有一个或多个核苷酸的取代、删除或添加。另外,上述的方法可用于分离编码多肽的核酸,所述多肽与本发明的多肽或者包含其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少大约99%、至少大约95%、至少大约90%、30至少大约85%、至少大约80%、至少大约75%、至少大约70%、至少大约65%、至少大约60%、至少大约55%或至少大约50%的序列同一性(同源性),正如使用序列联配算法(例如FASTA3.0t78版本算法,参数为默认值)所确定的。寡核苷酸探针及使用这些寡核苷酸探针的方法35本发明也提供了核酸探针,例如可以用于鉴定、扩增或分离编码具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的核酸或其片段,或用于鉴定纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因。一方面,该探针包括本发明核酸中的至少大约10个连续碱基。可以选择地,本发明的探针可以是如本发明核酸中所示序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、523、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或大约10到50、大约20到60或大约30到70个连续碱基。这些探针通过结合和/或杂交来鉴定核酸。这些探针可以在本发明的阵列中使用,参见下面的讨论,包括例如毛细管阵列。本发明的探针也可以用于分离其它核酸或多肽。可以选择地,多于一种的探针(其中至少一种探针能与核酸样品中存在的任何互补序列特异性杂交)可以在扩增反应中使用,以确定样品是否包含含有本发明的核酸的生物体(例如从中可分离出所述核酸的生物体)。一方面,这些探针包括寡核苷酸。一方面,扩增反应可以包括PCR反应。PCR实验方案在在Ausubel和Sambrook,supra中有所描述。可选地,扩增可以包括连接酶链式反应、3SR或35链置换反应(见Barany,R,"TheLigaseChainReactioninaPCRWorld",_PC/M"/iocfecr"d^f//cof//(ms丄:5-16,1991;E.Fahyetah,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",PC/Me/Zwtfe^^//oW/ow丄:25國33,1991;以及WalkerG.T.etah,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch22:1691-1696,1992)。在这样的方法中,将样品5中的核酸与探针接触,进行扩增反应,检测所得到的扩增产物。扩增产物可以通过在反应产物上进行凝胶电泳并用嵌入剂如溴化乙啶染色凝胶来检测。可以选择地,可以用放射性同位素标记一种或多种探针,放射性扩增产物的存在在凝胶电泳后通过放射自显影术来检测。衍生自本发明核酸的末端附近的序列的探针也可以在染色体步移10(chromosomewalking)方法中使用,以鉴定含有临近本发明的序列的基因组序列的克隆。这样的方法允许从宿主生物中分离编码额外蛋白的基因。—方面,本发明的分离或重组的核酸、与其互补的序列、或含有本发明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500个连续碱基的片段、或与其互补的序列,被用作探针,以鉴15定和分离相关的核酸。在一些方面,该相关的核酸可以是来自生物体的cDNA或基因组DNA,这些生物体并不是最初从中分离出所述核酸的生物体。例如,其它生物体可以是相关生物体。在这样的方法中,核酸样品在允许探针与相关序列特异性杂交的条件下与探针接触。然后用上面描述的任意一种方法检测探针与来自相关生物体的核酸的杂交。20通过改变用于鉴定与可检测探针杂交的核酸例如cDNA或基因组DNA的杂交条件的严紧性,可以鉴定并分离与探针具有不同同源性水平的核酸。严紧性通过在低于探针的解链温度的变化温度下进行杂交来改变。解链温度Tm是50%的耙序列与完全互补的探针杂交时的温度(在确定的离子强度和pH下)。选择非常严紧的条件,使其与特定探针的Tm相等,或比Tm低大约5'C。可以使用下述25公式计算探针的解链温度对于长度在14到70个核苷酸的探针,使用如下公式计算解链温度(Tm):Tm=81.5+16.6(1og[Na+])+0.41(G+C的比例分数)—(600/N),其中N是探针的长度。如果杂交在含有甲酰胺的溶液中进行,解链温度使用如下等式计算Tm=81.530+16.6(1og[Na+])+0.41(G+C的比例分数)—(0.63%甲酰胺)一(600/N),其中N是探针的长度。预杂交在6XSSC、5XDenhardt,s试剂、0.5%SDS、100吗变性的片段化鲑精DNA或6XSSC、5XDenhardt,s试剂、0.5%SDS、100吗变性的片段化鲑精DNA、50%甲酰胺中进行。SSC和Denhardt,s溶液的配方已在Sambrook等,supra35中列出。—方面,杂交通过将可检测探针加入到上面所列出的预杂交溶液中来进行。在探针包括双链DNA的情况下,在加入到杂交溶液之前对探针变性。一方面,将滤膜与杂交溶液接触充足的时间,以允许探针与含有与其互补的序列或与其同源的序列的cDNA或基因组DNA杂交。对于长度超过200个核苷酸的探针,杂交可以在比Tm低15-25-C的温度进行。对于更短的探针,如寡核苷酸探针,杂交在5比Tm低5-10'C的温度进行。一方面,6XSSC中的杂交在大约68t:进行。通常,在含有50%甲酰胺的溶液中的杂交是在大约42'C进行的。抑制纤维素酶的表达本发明提供了与本发明的核酸例如编码纤维素酶的核酸互补的核酸(例如10本发明的核酸的反义序列),例如包括反义序列、siRNA、miRNA、核酶的核酸。含有反义序列的本分明核酸能抑制编码纤维素酶的基因的转运、剪接或转录。抑制可通过将基因组DNA或信使RNA作为靶标来实现。作为靶标的核酸的转录或功能可以被抑制,例如通过杂交和/或切割。本发明提供的一组示例性的抑制剂包括寡核苷酸,这些寡核苷酸能结合纤维素酶如内切葡聚糖酶、纤维二糖水解酶、15甘露聚糖酶和/或|3-葡糖苷酶基因或信息,在两种情况下都阻止或抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的产生或功能。结合可通过序列特异性杂交来完成。另一类有用的抑制剂包括引起纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的信息失活或切割的寡核苷酸。该寡核苷酸可具有引起此类切割的酶活性,如核酶。可以对寡核苷酸进20行化学修饰,或与能切割互补核酸的酶或组分偶联。可以对许多不同的这样的寡核苷酸的库进行筛选来寻找那些具有期望活性的寡核苷酸。因此,本发明提供了在核酸和/或蛋白水平抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶表达的各种组合物,例如,含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列的反义序列、siRNA、25miRNA和核酶,以及抗纤维素酶抗体,如本发明的抗内切葡聚糖酶抗体、抗纤维二糖水解酶抗体、抗甘露聚糖酶抗体和/或抗P-葡糖苷酶抗体。纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶表达的抑制可以具有各种工业应用。例如,抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表达可以减慢或防止变坏。一方面,30本发明的抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的表达和/或活性的组合物的使用,例如抗体、反义寡核苷酸、核酶、siRNA和miRNA的使用,被用于减慢或防止变坏。因此,一方面,本发明提供了方法和组合物,包括将本发明的抗体、反义寡核苷酸、核酶、siRNA和miRNA应用于植物或者植物产品(如,谷物、谷粒、果实、种籽、根、叶等),以阻止或者延缓变35坏。这些组分也可以由植物(如,转基因植物)或者其它生物(如,用本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因转化的细菌或者其它微生物)表达。用于抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶表达的本发明的组分(例如,反义序列、iRNA、核酶、抗体)可用作药物组合物,例如,抗病原剂,或用在其它治疗中,例如用作抗微生物剂,如用于5沙门氏菌属。友义寡拔微本发明提供了能结合纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶信息的反义寡核苷酸,一方面,其能通过以mRNA作为靶标10来抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。设计反义寡核苷酸的策略在科学和专利文献中有很好的描述,技术人员能使用本发明的新试剂设计这样的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶寡核苷酸。例如,筛选有效的反义寡核苷酸的基因步移/RNA作图方法在本
技术领域
是熟知的,例如参见Ho(2000)MethodsEnzymol.314:15168-183,该文献描述了RNA作图分析法,该分析法是基于标准的分子技术,以提供用于有效的反义序列选择的一种简单且可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。自然发生的核酸被用作反义寡核苷酸。该反义寡核苷酸可以是任意长度;例如,在可选择的方面,该反义寡核苷酸在大约5到100之间,大约10到80之20间,大约15到60之间,大约18到40之间。最适长度可以通过常规筛选来决定。这些反义寡核苷酸可以以任意浓度存在。最适浓度可通过常规筛选来决定。广泛种类的合成的、非天然发生的核苷酸和核酸类似物是已知的,它们可以解决这一潜在的问题。例如,可以使用含有非离子骨架的肽核酸(PNAs),如含有N-(2-氨基乙基)甘氨酸单元。也可以使用具有硫代磷酸酯键的反义寡核苷酸,正如在如下25文献中所描述的WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N丄,1996)。正如上面所描述的,本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、垸基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亚甲基(甲基亚氨)、3'-N-氨基甲酸酯和吗啉代氨基甲酸酯核30酸。组合化学方法学可用于产生大量能被快速筛选特异性寡核苷酸的寡核苷酸,所述特异性寡核苷酸对任何靶标具有适当的结合亲和性和特异性,例如本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶正义和反义序列(例如参见Gold(1995)J.,Biol.Chem.270:13581-13584)。35浙縱樣腾本发明提供了能结合纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的信息的核酶。这些核酶能抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性,例如通过以mRNA作为耙标。设计核酶和选择用于靶向的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘5露聚糖酶和/或f3-葡糖苷酶特异性反义序列的策略在科学和专利文献中有很好的描述,熟练技术人员能使用本发明的新试剂来设计这样的核酶。核酶通过核酶的耙RNA结合部分来与靶RNA结合,从而发挥作用,核酶的靶RNA结合部分与该RNA上切割靶RNA的酶促部分非常接近。这样,通过互补的碱基配对,核酶识别和结合靶RNA,而且一旦结合于正确的位置,便以酶促活性作用来切割靶RNA10和使其失活。如果切割发生在编码序列中,以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后,它可以从结合的RNA上释放出来并且重复切割新的靶。在一些情况下,核酶的酶促性质会优于其它的技术,如反义技术(其中核酸分子仅结合于核酸靶来阻止其转录、翻译或者与其它分子的联系),因为实现治15疗效果所必要的核酶有效浓度可能低于反义寡聚核苷酸的浓度。这一潜在的优点反映出核酶可以以酶促方式进行作用的能力。因此,单个核酶分子可以切割靶RNA的多个分子。一方面,核酶是高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机制。艮P,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA的切割率与非20靶RNA的切割率的比值。除了涉及碱基配对的那些因素,这种切割机制还依赖于另外的因素。这样,核酶作用的特异性比结合于同样的RNA位点的反义寡聚核苷酸强。本发明的核酶,例如,具有酶活的核酶RNA分子,可以形成锤头状基序、发夹基序,如肝炎S病毒基序、I类内含子基序和/或与RNA引导序列(guide25sequence)相联系的RNaseP样RNA。锤头状基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有说明;发夹基序在H咖pel(1989)Biochemistry28:4929和H咖pel(1990)Nuc.AcidsRes.18:299中有说明;肝炎S病毒基序在Perrotta(1992)Biochemistry31:16中有说明;RNaseP基序在Guetrier-Takada(1983)Cell35:849中有说明;I类内含子在Cech美国专利4,987,07130中有说明。这些特定基序的引述并不是限制性的。本领域技术人员将认识到本发明的核酶,如,本发明的有酶活的RNA分子,可以有与一个或者多个靶基因的RNA区域互补的特异性底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。35扁f拔f薦"在一个方面,本发明提供了被称为"RNAi"分子的RNA抑制性分子,其含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列。RNAi分子可以包括双链RNA(dsRNA)分子,例如siRNA和/或miRNA。RNAi分子,例如siRNA和/或miRNA,可抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶基因的表达。在一个方面,RNAi5分子如siRNA禾口/或miRNA的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个核苷酸的双链。本发明不限于任何特殊的作用机制,RNAi可进入细胞中,弓I起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。当细胞暴露于双链RNA(dsRNA)时,来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因10序列匹配的双链RNA(dsRNA)打断成为称为短的干扰RNA的短的碎片,它可触发与其序列匹配的mRNA的降解。在一个方面,本发明的RNAi可用于基因沉默(gene陽silencing)疗法中,见,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一个方面,本发明提供了使用本发明的RNAi如siRNA和/或miRNA选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面,本发明的RNAi15分子可用来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子如siRNA和/或miRNA的方法在本领域中是为人所熟知的,见,例如美国专利6,506,559;6,5U,824;6,515,109;6,489,127。核酸的修饰——制备本发明的酶变体20本发明提供了产生本发明的核酸的变体的方法,所述本发明的核酸例如那些编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸。这些方法可以被重复或者以多种组合使用,以产生具有与模板核酸编码的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶有所改变的或不同的活性或有所改变的或不同的稳定性的纤维素酶如内切葡聚糖酶、25纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶。这些方法也可以被重复或以多种组合使用,从而例如在基因/信息表达、信息翻译或信息稳定性方面产生变化。另一方面,细胞的遗传组成可以被改变,例如通过同源基因的离体修饰,随后再将其插入到细胞中。例如,一方面,本发明提供了分离的或重组的核酸,其具有包含SEQID30NO:163的至少一个核苷酸碱基残基修饰的序列,其中所述修饰包括下列改变的一个或多个位置265至267的任何一处的核苷酸被修饰为CGT、CGC、CGA、CGG、AGA或AGG;位置307至309的任何一处的核苷酸被修饰为GGT、GGC、GGA或GGG;位置328至330的任何一处的核苷酸被修饰为GGT、GGC、GGA或GGG;位置340至342的任何一处的核苷酸被修饰为TTA、TTG、CTT、CTC、CTA或35CTG;位置469至471的任何一处的核苷酸被修饰为TCT、TCC、TCA、TCG、AGT或AGC;位置1441至1443的任何一处的核苷酸被修饰为TTT或TTC;位置1648至1650的任何一处的核苷酸被修饰为AAT或AAC;或者,位置1768至1770的任何一处的核苷酸被修饰为CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本发明提供了分离的或重组的多肽,其具有包含SEQIDNO:164的至少一个氨基酸残基修饰的序列,其中所述修饰包括下列改变的一个或多个氨基酸5位置89的甲硫氨酸被修饰为精氨酸;氨基酸位置103的苯丙氨酸被修饰为甘氨酸;氨基酸位置110的脯氨酸被修饰为甘氨酸;氨基酸位置114的酪氨酸被修饰为亮氨酸;氨基酸位置157的丙氨酸被修饰为丝氨酸;氨基酸位置481的色氨酸被修饰为苯丙氨酸;氨基酸位置550的脯氨酸被修饰为天冬酰胺;或者,氨基酸位置590的甘氨酸被修饰为精氨酸。10另一方面,本发明提供了分离的或重组的核酸,其具有包含本发明的示例性序列(例如,SEQIDNO:l、SEQIDNO:3、SEQIDN0:5、SEQIDN0:7、SEQIDNO:9、SEQIDNO:U等等)的核苷酸残基序列修饰的序列,其中所述修饰包括下列改变的一个或多个SEQIDNO:163的位置265至267的任何一处的相当位置的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位15置307至309的任何一处的相当位置的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一处的相当位置的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一处的相当位置的核苷酸变为TTA、TTG、CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一处的相当位置的核苷酸变为TCT、TCC、TCA、TCG、AGT或AGC;20SEQIDNO:163的位置1441至1443的相当位置的核苷酸变为TTT或TTC;SEQIDNO:163的位置1648至1650的任何一处的相当位置的核苷酸变为AAT或AAC;或者,SEQIDNO:163的位置1768至1770的任何一处的相当位置的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本发明提供了分离的或重组的核酸,其具有包含本发明的任何核酸的核苷酸残基序列修饰的序列,其中所25述修饰包括下列改变的一个或多个SEQIDNO:163的位置265至267的任何一处的相当位置的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位置307至309的任何一处的相当位置的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一处的相当位置的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一处的相当位置的30核苷酸变为TTA、TTG、CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一处的相当位置的核苷酸变为TCT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的相当位置的核苷酸变为TTT或TTC;SEQIDNO:163的位置1648至1650的任何一处的相当位置的核苷酸变为AAT或AAC;或者,SEQIDNO:163的位置1768至1770的任何一处的相当位置的核苷酸变为35CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本发明提供了分离的或重组的多肽,其具有包含本发明的示例性序列(例如,SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10等等)的氨基酸残基修饰的序列,其中所述修饰包括下列改变的一个或多个SEQIDNO:164的氨基酸位置89的甲硫氨酸相当的氨基酸变为精氨酸;SEQIDNO:164的氨基酸位置103的苯丙氨酸相当的氨基酸变为甘氨酸SEQID5NO:164的氨基酸位置110的脯氨酸相当的氨基酸变为甘氨酸;SEQIDNO:164的氨基酸位置114的酪氨酸相当的氨基酸变为亮氨酸;SEQIDNO:164的氨基酸位置157的丙氨酸相当的氨基酸变为丝氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相当的氨基酸变为苯丙氨酸;SEQIDNO:164的氨基酸位置550的脯氨酸相当的氨基酸变为天冬酰胺;或者,SEQIDNO:164的氨基酸位置590的甘氨酸相当的氨10基酸变为精氨酸。另一方面,本发明提供了分离的或重组的多肽,其具有包含本发明的任何多肽的氨基酸残基修饰的序列,其中所述修饰包括下列改变的一个或多个SEQIDNO:164的氨基酸位置89的甲硫氨酸相当的氨基酸变为精氨酸;SEQIDNO:164的氨基酸位置103的苯丙氨酸相当的氨基酸变为甘氨酸;SEQIDNO:164的氨基酸15位置110的脯氨酸相当的氨基酸变为甘氨酸;SEQIDNO:164的氨基酸位置114的酪氨酸相当的氨基酸变为亮氨酸;SEQIDNO:164的氨基酸位置157的丙氨酸相当的氨基酸变为丝氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相当的氨基酸变为苯丙氨酸;SEQIDNO:164的氨基酸位置550的脯氨酸相当的氨基酸变为天冬酰胺;或者,SEQIDNO:164的氨基酸位置590的甘氨酸相当的氨基酸变为精氨酸。20本发明的核酸可以通过任何方法来改变。例如,随机(random或stochastic)方法、或者非随机、或者"定向进化"的方法,参见如,美国专利6,361,974。基因的随机突变方法在本领域是已知的,参见如,美国专利5,830,696。例如,可以应用突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者Y辐射,或者化学诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者25组合使用来诱导DNA的断裂,其可以通过重组被修复。另外的化学诱变剂包括,如,亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物,如,亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。30可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques18:194-196。可选择地,核酸,如基因,可以在随机片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可选择的方面,修饰、35增加或者删除可以通过易错PCR、改组、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursives叫uencerecombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口双重诱变(gappedduplexmutagenesis),点错配修复诱变(pointmismatchrepairmutagenesis),修复缺陷型宿主株诱变、化学诱变、5放射诱变、缺失诱变、限制选择诱变(restriction-selectionmutagenesis)、限制纯化诱变(restriction-purificationmutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成、染色体饱和诱变(CSM)和/或者这些方法和其它方法的组合产生。以下的出版物描述了可以整入到本发明的方法中的各种递归重组程序和/或方法Stemmer(1999)"Molecularbreedingofvirusesfortargetingandotherclinical10properties"TumorTargeting4:1-4;Ness(1999)NatureBiotechnology17:893-896;Chang(1999)"EvolutionofacytokineusingDNAfamilyshuffling"NatureBiotechnology17:793-797;Minshull(1999)"Proteinevolutionbymolecularbreeding"CurrentOpinioninChemicalBiology3:284-290;Christians(1999)"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling"Nature15Biotechnology17:259-264;Crameri(1998)"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution"Nature391:288-291;Crameri(1997)"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling"NatureBiotechnology15:436-438;Zhang(1997)"Directed-evolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening"Proc.Natl.Acad.Sci.20USA94:4504-4509;Patten等(1997)"ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines"CurrentOpinioninBiotechnology8:724-733;Crameri等(1996)"Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling"NatureMedicine2:100-103;Gates等(1996)"Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonalacrepressor'headpiecedimer'"Journalof25MolecularBiology255:373-386;Stemmer(1996)"SexualPCRandAssemblyPCR"In:TheEncyclopediaofMolecularBiology.VCHPublishers,NewYork.447-457页;Crameri禾卩Stemmer(1995)"Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes"BioTechniques18:194-195;Stemmer等(1995)"Single-stepassemblyofageneandentireplasmidformlargenumbersof30oligodeoxyribonucleotides,,Gene,164:49-53;Stemmer(1995)"TheEvolutionofMolecularComputation"Science270:1510;Stemmer(1995)"SearchingSequenceSpace"Bio/Technology13:549-553;Stemmer(1994)"RapidevolutionofaproteininvitrobyDNAshuffling"Nature370:389-391;和Stemmer(1994)"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecular35evolution"Proc.Natl.Acad.Sci.USA91:10747-10751。产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997)"ApproachestoDNAmutagenesis:anoverview"AnalBiochem.254(2):157-178;Dale等(1996)"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod"MethodsMol.Biol.57:369-374;Smith(1985)"Invitromutagenesis"Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)"Strategiesandapplicationsofinvitro5mutagenesis"Science229:1193-1201;Carter(1986)"Site-directedmutagenesis',Biochem.J.237:1-7;禾口Kunkel(1987)"Theefficiencyofoligonucleotidedirectedmutagenesis"在NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J.eds.,SpringerVerlag,Berlin));使用含有尿嘧啶的模板的诱变(KunkeK1985)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"Proc.Natl.Acad.10Sci.USA82:488-492;Kunkel等(1987)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"MethodsinEnzymol.154,367-382;和Bass等(1988)"MutantTiprepressorswithnewDNA-bindingspecificities"Science242:240-245);寡核苷酸诱导的定点诱变(MethodsinEnzymol.100:468-500(1983);MethodsinEnzymol.154:329-350(1987);Zoller(1982)"Oligonucleotide-directedmutagenesis15usingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment"NucleicAcidsRes.10:6487-6500;Zoller&Smith(1983)"Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoM13vectors"MethodsinEnzymol.100:468-500和Zoller(1987)Oligonucleotide-directedmutagenesis:asimplemethodusingtwooUgonucleotide20primersandasingle-strandedDNAtemplate"MethodsinEnzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor(1985)"Theuseofphosphorothioate-modifiedDNAinrestrictionenzymereactionstopreparenickedDNA"Nucl.AcidsRes.13:8749-8764;Taylor(1985)"Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA"Nucl.AcidsRes.2513:8765-8787(1985);Nakamaye(1986)"InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis"Nucl.AcidsRes.14:9679-9698;Sayers(1988)"Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis,,Nucl.AsidsRes.16:791-802;和Sayers等(1988)"Strandspecificcleavageof30phosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide"Nucl.AcidsRes.16:803-814);使用缺口双链体DNA的诱变(Kramer等(1984)"ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction"Nucl.AcidsRes.12:9441-9456;Kramer&Fritz(1987)MethodsinEnzymol."Oligonucleotide-directedconstructionof35mutationsviagappedduplexDNA"154:350-367;Kramer(1988)"ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations"Nucl.AcidsRes.16:7207;禾口Fritz(1988)"Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsinvitro"Nucl.AcidsRes.16:6987-6999)。可以用于实践本发明的另外的实验方案包括点错配修复(Kramer(1984)"PointMismatchRepair"Cell38:879-887),应用修复缺陷型宿主株的诱变(Carter5等(1985)"Improvedoligonucleotidesite-directedmutagenesisusingMl3vectors"Nucl.AcidsRes.13:4431-4443禾口Carter(1987)"Improvedoligonucleotide-directedmutagenesisusingM13vectors"MethodsinEnzymol.154:382-403),缺失i秀变(Eghtedarzadeh(1986)"Useofoligonucleotidestogeneratelargedeletions"Nucl.AcidsRes.14:5115),限制-选择和限制-纯化(Wells等(1986)"Importanceof10hydrogen-bondformationinstabilizingthetransitionstateofsubtilisin"Phil.Trans.R.Soc.Lond.A317:415-423),通过全基因合成的诱变(Nambiar等(1984)"TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein"Science223:1299-1301;Sakamar禾卩Khorana(1988)"Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein15(transducin)"Nucl.AcidsRes.14:6361-6372;Wells等(1985)"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites"Gene34:315-323禾口Grundstrom等(1985)"Oligonucleotide-directedmutagenesisbymicroscale'shot-gun'genesynthesis"Nucl.AcidsRes.13:3305-3316),双链断裂修复(Mandecki(1986),Arnold(1993)"Proteinengineeringforunusualenvironments"20CurrentOpinioninBiotechnology4:450-455."Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite邻eciflcmutagenesis"Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节在MethodsinEnzymology的154巻中有说明,其中也描述了用于解决各种诱变方法中所会遇到的问题的有用策略。25在例如下列的文件中描述了可以用于实践本发明的实验方案,如Stemmer的美国专利5,605,793(1997.2.25),"MethodsforInVitroRecombination";Stemmer等的美国专利5,811,238(1998.9.22)"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination";Stemmer等的美国专利5,830,721(1998.11.3),"DNAMutagenesisbyRandomFragmentationand30Reassembly";Stemmer等的美国专利5,834,252(1998,11.10),"End-ComplementaryPolymeraseReaction";Minshull等的美国专利5,837,458(1998.11.17)"MethodsandCompositionsforCellularandMetabolicEngineering";WO95/22625,Stemmer禾口Crameri,"MutagenesisbyRandomFragmentationandReassembly,';WO96/33207,Stemmer禾卩Lipschutz,"EndComplementaryPolymeraseChainReaction";WO3597/20078,Stemmer禾口Crameri的"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination";WO97/35966,Minshull禾口Stemmer,"MethodsandCompositionsforCellularandMetabolicEngineerin";WO99/41402,Punnonen等,"TargetingofGeneticVaccineVectors";WO99/41383,Punnonen等,"AntigenLibraryImmunization";WO99/41369,Punnonen等,"GeneticVaccineVectorEngineering,,;WO99/41368,Punnonen等,5"OptimizationofImmunomodulatoryPropertiesofGeneticVaccines";EP752008,Stemmer禾BCrameri,"DNAMutagenesisbyRandomFragmentationandReassembly";EP0932670,Stemmer,"EvolvingCellularDNAUptakebyRecursiveSequenceRecombination";WO99/23107,Stemmer等,"ModificationofVirusTropismandHostRangebyViralGenomeShuffling";WO99/21979,Apt等,"Human10PapillomavirusVectors";WO98/31837,delCardayre等,"EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination";WO98/27230,Patten禾卩Stemmer,"MethodsandCompositionsforPolypeptideEngineering";WO98/27230,Stemmer等,"MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection";WO00/00632,"MethodsforGeneratingHighlyDiverse15Libraries";WO00/09679,"MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences";WO98/42832,Arnold等,"PolynucleotideSequencesUsingRandomorDefinedPrimers";WO99/29902,Arnold等,"MethodforCreatingPolynucleotideandPolypeptideSequences";WO98/41653,Vind,"AninVitroMethodforConstructionofaDNALibrary";WO2098/41622,Borchert等,"MethodforConstructingaLibraryUsingDNAShuffling";以及WO98/42727,Pati和Zarling,"S叫uenceAlterationsusingHomologousRecombination"。非随机或"定向进化"方法包括,例如饱和诱变如基因位点饱和诱变(GSSM)、合成连接重装配(SLR)或其组合,它们被用于修饰本发明的核酸,以产生具有新的或改变的特性(例如在高度酸性或碱性条件下的活性,在高温或10低温的活性,等等)的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。由修饰的核酸编码的多肽可以在测试葡聚糖水解或其它活性之前被筛选活性。可以使用任何形式或实验方案,例如使用毛细管阵列平台。例如参见美国专利6,361,974;6,280,926;5,939,250。15基微点靜赦或G淑本发明提供了使用基因位点饱和诱变或GSSM制备酶的方法,如在本文中以及美国专利6,171,820和6,579,258所述的。一方面,含有简并N,N,G/T序列的密码子引物被用于将点突变引入多核苷酸中,例如纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或本发明的抗体,以便产生一组子代20多肽,其中在每一氨基酸位置上可表现出全范围的单氨基酸取代,取代发生的位置例如酶活性位点中的氨基酸残基,或将要被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列,简并N,N,G/T序列,和任选地第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并性包括了所有20个氨25基酸的密码子。一方面,一个这样的简并寡核苷酸(例如包括一个简并N,N,G/T序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子取代。另一方面,使用至少两个简并序列盒,或在相同的寡核苷酸中或不同的寡核苷酸中,用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子取代。例如,一个寡核苷酸中可以包含一个以上N,N,G/T序列,以便在多于30—个的位点上引入氨基酸突变。这些多个N,N,G/T序列可以直接相邻,或由一个或多个额外的核苷酸序列分隔开。另一方面,用于引入插入和删除的寡核苷酸可以单独使用,或者与含有N,N,G/T序列的密码子组合使用,以便引入氨基酸插入、删除和/或取代的任何排列组合。—方面,两个或更多个连续氨基酸位置的同时诱变是使用含有相邻35N,N,G/T三联体的寡核苷酸进行的,即简并(N,N,G/T)序列。另一方面,使用与N,N,G/T序列相比具有较低简并性的简并序列盒。例如,在一些情况下,可能期望(例如,在寡核苷酸中)使用仅包括一个N的简并三联体序列,其中所述的N可以在三联体的第一、第二或第三位置上。在该三联体的剩余两个位置上,可以使用包括任意排列组合的任何其它碱基。可以选择地,在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列。5—方面,使用简并三联体(例如N,N,G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)(在可以选择的方面,这些方法也包括在每一氨基酸残基或密码子、位置产生低于所有可能种类的取代)。例如,对于100个氨基酸的多肽,可以产生2000个不同种类(即每个位置上的20种可能氨基酸X100个氨基酸位置)。通过使用含10有简并N,N,G/T三联体的寡核苷酸或一组寡核苷酸,32种不同序列可编码所有20种可能的天然氨基酸。因此,在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中,产生了编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷酸可以任选地与所公开的简并引物组合使用;例15如,非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。—方面,每一饱和诱变反应容器含有编码至少20种子代多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶)分子的20多核苷酸,以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置(其它方面使用了少于20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的宿主中,例如大肠杆菌宿主中),并进行表达筛选。当单个子代多肽通过筛选鉴定,显示出有利的特性变化时(当与亲本多肽相比时,如在碱性25或酸性条件下增高的葡聚糖水解活性),可以对其测序以鉴定其中所含的相应的有利氨基酸取代。—方面,如本文所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后,可以在超过一个的氨基酸位置确定出的有利的氨基酸变化。可以产生一个或多个新的子代分子,其含有所有或部分这些有利的氨基酸取代的30组合。例如,如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化,那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性,以及两个有利变化中的每一个的可能性)和3个位置。因此,总共有3X3X3或27种可能性,其中包括了先前被检验的7种可能性,即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的35点突变。另一方面,位点饱和诱变可以与改组、嵌合、重组和其它诱变方法以及筛选一起使用。本发明提供了以反复的方式使用任何诱变方法,包括饱和诱变。在一个实例中,任何诱变方法的反复使用结合筛选使用。本发明还提供了使用专有密码子引物(含有简并N,N,N序列)将点突变引入多核苷酸中,以便产生一组子代多肽,其中在每一氨基酸位置上可表现出全范5围的单氨基酸取代(基因位点饱和诱变(GSSM))。这些寡聚体包括相邻的第一同源序列,简并N,N,N序列,以及一方面不必须包括第二同源序列。由使用这些寡聚体而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化,这是由于N,N,N序列的简并性包括了所有20个氨基酸的密码子。—方面,一个这样的简并寡聚体(包括一个简并N,N,N序列盒)被用于使10亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子取代。另一方面,使用至少两个简并N,N,N序列盒,或在相同的寡聚体中或不同的寡聚体中,用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子取代。因此,一个寡聚体中可以包含一个以上N,N,N序列,以便在多于一个的位点上引入氨基酸突变。这些多个N,N,N序列可以直接相邻,或由一个或多个额外的核苷酸序列15分隔开。另一方面,用于引入插入和删除的寡聚体可以单独使用,或者与含有N,N,N序列的密码子组合使用,以便引入氨基酸插入、删除和/或取代的任何排列组合。—方面,使用含有相邻N,N,N三联体的寡聚体,即简并(N,N,N)n序列,进行两个或更多个连续氨基酸位置的同时诱变是可能的。另一方面,本发明提供了使用与N,N,N序列相比具有较低简并性的简并序列盒。例如,在一些情况下可20能期望使用(例如在寡聚体中)仅包括一个N的简并三联体序列,其中所述的N可以在三联体的第一、第二或第三位置上。在三联体的剩余两个位置上,可以使用包括任意排列组合的任何其它碱基。可以选择地,在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列、N,N,G/T或N,N,G/C三联体序列。—方面,由于若干个原因,使用简并三联体(例如N,N,G/T或N,N,G/C三25联体序列)是有利的。一方面,本发明提供了在多肽中的每一和每个氨基酸位置上系统且相对容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)的取代的方法。因此,对于100个氨基酸的多肽,本发明提供了系统且相对容易地产生产生2000个不同种类(即每个位置上的20种可能氨基酸X100个氨基酸位置)的方法。可以理解,通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡聚体,3032种不同序列可编码所有20种可能的天然氨基酸。因此,在其中使用至少一种这样的寡聚体对亲本多核苷酸序列进行饱和诱变的反应容器中,产生了编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点诱变中使用非简并寡聚体在每个反应容器中仅仅导致一种子代多肽。本发明还提供了非简并寡聚体的使用,其可以任选地与所公开的简并引物35组合使用。可以理解,在一些情况中,使用非简并寡聚体在工作多核苷酸中产生特异性点突变是有利的。本发明提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。因此,在本发明的一方面,每一饱和诱变反应容器含有编码至少20种子代多肽分子的多核苷酸,以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置。从每一饱和诱变反应容器产生的532倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的大肠杆菌宿主中),并进行表达筛选。当单个子代多肽通过筛选鉴定,显示出有利的特性变化时(当与亲本多肽相比时),可以对其测序以鉴定其中所含的相应的有利氨基酸取代。—方面,如本文所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基10酸位置进行诱变后,可以在超过一个的氨基酸位置确定出的有利的氨基酸变化。可以产生一个或多个新的子代分子,其含有所有或部分这些有利的氨基酸取代的组合。例如,如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化,那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性,以及两个有利变化中的每一个的可能性)和3个位15置。因此,总共有3X3X3或27种可能性,其中包括了先前被检验的7种可能性,即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。除了沿着基因的全序列进行诱变之外,本发明提供了诱变可用于取代多核苷酸序列中任意数量的碱基的每一个,其中待被诱变的碱基的数量在一个方面为从15至100,000中的每一个整数。因此,并不是沿着分子诱变每一个位置,可以对每一个或独立数目的碱基(在一个方面为总共15至100,000的亚组)进行诱25变。一方面,单独的核苷酸被用于沿着多核苷酸序列诱变每一个位置或一组位置。待被诱变的3个位置可以是密码子。使用诱变引物可以引入突变,该诱变引物含有异源序列盒,也称为诱变序列盒。示例性的序列盒可以具有1至500个碱基。在这样的异源序列盒中每一个核苷酸位置可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E,其中E是非A、C、30G或T的任何碱基(E可以被称为设计寡聚体(designeroligo))。—方面,饱和诱变包括诱变有待诱变的限定多核苷酸序列(其中待诱变的序列长度一方面为约15至100,000个碱基)中的一整组诱变序列盒(其中每一个序列盒的长度一方面为约1-500个碱基)。因此,一组突变(从1至100个突变)被引入每一个待诱变的序列盒。在应用一轮饱和诱变的过程中,一组待被引入到35—个序列盒的突变可以与第二组待被引入到第二个序列盒的突变不同或相同。这样的分组通过缺失、插入、特定密码子的分组以及特定核苷酸序列盒的分组加以例示。—方面,待被诱变的限定序列包括全基因、通路、cDNA、整个开放阅读框(ORF)以及整个启动子、增强子、阻抑物/反式激活蛋白、复制原点、内含子、操纵子或任何多核苷酸功能组。通常,为了此目的,"限定序列(definedsequence)"5可以是15碱基多核苷酸序列的任何多核苷酸以及长度在15个碱基和15,000个碱基的多核苷酸序列(本发明特别指出中间的每一个整数)。选择密码子分组时的考虑因素包括由简并诱变序列盒编码的氨基酸类型。—方面,可被引入到诱变序列盒中的突变分组,本发明特别提供了在每一个位置编码2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、1019和20种氨基酸的简并密码子取代(使用简并寡聚体)以及由此编码的多肽文库。*成遂體微说"本发明提供了非随机的基因修饰系统,命名为"合成连接重装配"或简单地称作"SLR",这是一种"定向进化方法",可以产生具有新的或改变的特性的多15肽,例如本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶或本发明的抗体。SLR是将寡核苷酸片段非随机地连接在一起的一种方法。该方法与随机寡核苷酸改组不同的地方在于,核酸构件(buildingblocks)没有被随意地改组、连接或嵌合,而是被非随机地装配。例如参见美国专利6,773,900;6,740,506;6,713,282;206,635,449;6,605,449;6,537,776。一方面,SLR包括下述步骤(a)提供模板多核苷酸,其中模板多核苷酸包含编码同源基因的序列;(b)提供多个构件多核苷酸,其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-overreassemble),所述构件多核苷酸包含作为同源基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列;(c)将构件多核苷酸与模板多核苷酸组25合在一起,以便构件多核苷酸与模板多核苷酸交换重装配,以产生包含同源基因序列变异体的多核苷酸。SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此,该方法可以被用于非随机地产生包括超过101()<)个不同嵌合体的子代分子的文库(或集合)。SLR可以被用于产生包括超过10^o个不同子代嵌合体的文库。因此,本发30明的一些方面包括产生一组最终嵌合的核酸分子的非随机方法,所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤,以及装配这些核酸构件的步骤,这样可获得依设计而定的整个装配次序,所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有35序装配是"有用的",如果它们能使这些构件以预定次序结合。因此,核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定。如果使用多于一个的装配步骤,那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面,用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段,以实现结构片段的共价结合。—方面,寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得,所5述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源,它们在将被诱变例如被嵌合或改组的核酸构件的设计中有用。在该方法的一个方面,多个亲本核酸模板的序列被联配,以便选择一个或多个分界点。这些分界点可以位于同源区域,由一个或多个核苷酸构成。这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描10绘将要产生的寡核苷酸构件的边界,以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地,分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域,或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地,15有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域,或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。一方面,分界点是由所有亲本多核苷酸序列分享的同源区域。—方面,连接再装配过程被彻底地进行,以便产生含有尽量可能多的子代嵌合多核苷酸的文库。换句话说,核酸构件的所有可能的有序组合都呈现在最终20嵌合的核酸分子集合中。同时,另一方面,在每一组合中的装配次序(即各个最终嵌合核酸的5,到3序列中每一构件的装配次序)是如上所述地遵循预先的设计(或非随机地)。由于本发明的非随机特性,大大地降低了不需要的副产品的可能性。另一方面,连接再装配方法被系统地进行。例如,实施该方法,以便产生25子代分子的系统区分化的文库,该文库分成能被系统地筛选的数个部分,例如可以逐个地筛选。换句话说,通过选择性的和审慎的应用特定的核酸构件,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检査和筛选步骤。因此,这些方法允许很可能非常大量的子代分30子以更小的组被系统地检査。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性,所产生的子代分子一方面包含有最终嵌合核酸分子的文库,这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产35生不同的子代分子种类。应该意识到,本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步,应该意识到,就本发明的可操作性而言,对分子间同源性的要求大大地放宽了。事实上,甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如,由于密码子的摆动,即密码子的简并性,可以将核苷酸取代引入核酸构件,同时又不会改变在相应的祖先模板中最初编码的氨基酸。可以选择地,可5以改变密码子,从而改变对原始氨基酸的编码。在本发明中,这样的取代可以被引入到核酸构件中,以便增加分子间同源分界点的发生率,从而使得在构件之间可获得的偶联的数量增加,而这又允许产生更多数量的子代嵌合分子。合成基茵棘配10—方面,本发明提供了非随机的方法,命名为合成基因重装配,其在一定程度上与随机改组相关,只是核酸构件不随机改组、连接或嵌合,而是被非随机地装配。例如参见美国专利6,537,776。合成基因重装配法不依赖于将被改组的多核苷酸之间存在高度同源性。本发明可以被用于非随机地产生包括超过101()()个不同嵌合体的子代分子的文库(或15集合)。可以想象地,合成基因重装配可以被用于产生包括超过101()()()个不同子代嵌合体的文库。因此,一方面,本发明提供了产生一组最终嵌合的核酸分子的非随机方法,所述最终嵌合的核酸分子具有按设计所选择的整个装配次序,该方法包括按设计产生多个特异性核酸构件的步骤,以及装配这些核酸构件的步骤,这样可获得依20设计而定的整个装配次序,所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是"有用的",如果它们能使这些构件以预定次序结合。因此,一方面,核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定,并且如果使用25多于一个的装配步骤,那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。在本发明的一方面,用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段,以实现结构片段的共价结合。另一方面,核酸构件的设计通过分析一组祖先核酸模板的序列来获得,所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些祖先核酸30模板因此作为序列信息的来源,它们在将被诱变例如被嵌合或改组的核酸构件的设计中有用。在一个示例中,本发明提供了相关基因的家族和它们编码的相关产物的家族之间的嵌合。在具体的示例中,编码的产物是酶。根据本文描述的方法,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可35以被诱变。因此,根据本发明的一个方面,多个祖先核酸模板序列(例如本发明的多核苷酸)被联配,以便选择一个或多个分界点,这些分界点可以位于同源区域。这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界。因此,在祖先分子中鉴定和选择的分界点作为子代分子的装配中的潜在嵌合点。—方面,有用的分界点是由至少两个祖先模板分享的同源区域(包括至少5—个同源核苷酸碱基),但分界点可以是由至少一半的祖先模板、至少三分之二的祖先模板、至少四分之三的祖先模板以及一方面可以是由几乎所有的祖先模板分享的同源区域。甚至仍在一方面,有用的分界点是由所有祖先模板分享的同源区域。—方面,基因再装配过程被彻底地进行,以便产生含有尽量可能多的文库。10换句话说,核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时,另一方面,在每一组合中的装配次序(即各个最终嵌合核酸的5'到3序列中每一构件的装配次序)是设计的(或非随机地)。由于本发明的非随机特性,大大地降低了不需要的副产品的可能性。另一方面,基因再装配过程在所述方法中被系统地进行,以便例如产生子15代分子的系统区分化的文库,该文库分成能被系统地筛选的数个部分,例如可以逐个地筛选。换句话说,通过选择性的和审慎的应用特定的核酸构件,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检査和筛选步骤。因此,这些方法允许很可能非常大量的子代分子20以更小的组被系统地检査。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,本发明可以产生包含大量子代分子的文库(或集合)。由于本发明的基因再装配的非随机特性,所产生的子代分子一方面包含有最终嵌合核酸分子的文库,这些核酸分子具有按设计而选择的总装配25次序。在特别的方面,这样的所产生的文库包括大于103至101()00种不同的子代分子种类。—方面,如所述产生的一组最终嵌合的核酸分子包括编码多肽的多核苷酸。根据一方面,该多核苷酸是基因,其可以是人造基因。根据另一方面,该多核苷酸可以是基因通路,其可以是人造基因通路。本发明产生的一种或更多种人30造基因在本发明中可以掺入人造基因途径,例如在真核生物体(包括植物)中可操纵的途径。在另一个示例中,产生构件的步骤的合成属性允许设计和引入核苷酸(例如一个或多个核苷酸,例如可以是密码子或内含子或调控序列),这些核苷酸随后可以在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物35体的基因剪接能力)被任选地去除。应该意识到,在许多情况下,除了产生有用的分界点的好处之外,还有许多其它原因也使得可能期望引入这些核苷酸。因此,根据另一方面,核酸构件在本发明中被用于引入内含子。这样,功能性内含子在本发明中被引入到本发明的人造基因中。功能性内含子在本发明中还可以被引入本发明的人造基因通路中。因此,本发明提供了嵌合多核苷酸的产生,该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因。5本发明还提供了嵌合多核苷酸的产生,该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因通路。一方面,人工引入的内含子在一种或多种宿主细胞的基因剪接中发挥作用,其发挥作用的方式与天然发生的内含子在基因剪接中发挥作用的方式在很大程度上是相同的。本发明提供了产生含人造内含子的多核苷酸的方法,该多核苷酸将被引入宿主生物体中,用于重组和/或剪接。10使用本发明产生的人造基因也可作为底物发挥作用,用于与另一核酸重组。同样,使用本发明产生的人造基因途径也可作为底物发挥作用,用于与另一核酸重组。一方面,重组由人造的含内含子基因和作为重组伙伴的核酸之间的同源区域促进,或发生在人造的含内含子基因和作为重组伙伴的核酸之间的同源区域。一方面,重组伙伴也可以是本发明产生的核酸,包括人造基因或人造基因途15径。重组可以由人造基中一个(或多个)人工引入的内含子上存在的同源区域促进,或发生在由人造基中一个(或多个)人工引入的内含子上存在的同源区域。—方面,本发明的合成基因再装配方法使用多种核酸构件,其每一种一方面具有两个可连接末端。在每一个核酸构件上的两个可连接末端可以是两个平端(即,每一个末端具有零个核苷酸的突出),或者一方面可以是一个平端和一个突20出端,或者一方面可以是两个突出端。一方面,用于该目的的一个有用的突出端可以是3'突出端或5'突出端。因此,核酸构件可以具有一个3'突出端或可选地具有一个5'突出端或可选地具有两个3'突出端或可选地具有两个5'突出端。核酸构件被装配来形成最终嵌合的核酸分子的整个装配次序通过有目的试验设计确定并且是非随机的。25因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套具有确定数目的亲本变异体、对20应于每种变体的寡核苷酸、以及在连接反应的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡聚25核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体到另一个亲本变异体的序列转30换发生。这样的点一般是在两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。此外,这些方法与其他系统相比,提供了一种用于探究大数量的可能蛋白35变异体的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一歩分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件,所以造成嵌合分子之间的功能多样性的界线减少。当计算出在最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,便提供了更加可控制的变量。5—方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸,产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡核苷酸片段的新的变异体。也可参见美国专利6,773,900;6,740,506;6,713,282;6,635,449;6,605,449;6,537,776;6,361,974。10線定爻换事伴本发明的任何过程可以被迭代重复,例如,可以鉴定出编码本发明的改变的或者新的纤维素酶表型如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的核酸,再分离,再修饰,再测试活性。这一过程可以重复直到工程化得到所需的表型。例如,完整的生物化学合成代谢或分解代谢途径可以被工程化到细胞中,例如包括纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/25或P-葡糖苷酶活性的细胞。类似地,如果确定了某特定寡核苷酸对于所期望的特性(例如新的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶表型)不会造成任何影响,则可以合成包括这段待除去的序列在内的更大的亲本寡核苷酸,从而将这段序列从变量中除去。由于将这段序列合并到更大的序列中,可以避免任30何遗传交换事件,所以在子代多核苷酸中,这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的具有特定性质或者活性的蛋白变异体。沐力微35在各个方面,分子的体内改组在本发明的方法中使用,提供本发明的多肽的变体,例如本发明的抗体、本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶以及类似物。体内改组可以利用细胞重组多聚体的天然特性进行。尽管体内重组是提供分子多样性的主要天然途径,但遗传重组仍然是一种相对复杂的过程,该过程涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombinationchiasma)的代谢歩骤;和最后3)交叉消除,5得到分离的重组分子。交叉的形成需要同源序列的识别。另一方面,本发明包括一种方法,用于由至少第一多核苷酸和第二多核苷酸获得杂合多核苷酸。本发明也用于产生杂合多核苷酸,通过将共享至少一个部分序列同源的区域的至少第一多核苷酸和第二多核苷酸(例如,一个或两者都是示例性的纤维素酶,例如本发明的内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶10和/或(3-葡糖苷酶)引入到合适的宿主细胞中实现。部分序列同源的区域促进了导致产生杂合多核苷酸的序列再组织过程。正如此处所用,术语"杂合多核苷酸"是从本发明的方法产生的任何核苷酸序列,其含有来自至少两个原始多核苷酸序列的序列。这样的杂合多核苷酸可以来自可促进DNA分子间序列整合的分子间重组事件。此外,这样的杂合多核苷酸可以来自于分子内还原重配过程,该过程利15用重复序列来改变DNA分子内的核苷酸序列。—方面,体内重装配集中在"分子间,,的过程上,统称为"重组";在细菌中,它一般被视为是"RecA-依軟'的现象。本发明可以依赖于宿主细胞的重组过程来重组和重装配序列,或者依赖于细胞介导还原过程的能力,通过缺失来减少细胞中的准-重复序列的复杂性。该"还原性重配"过程通过"分子内的"、RecA-依赖过程20而发生。在本发明的另一方面,通过还原性重装配过程,产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物,它们插入到合适的载体中,并且然后将它们引入到合适的宿主细胞。单个分子同一性的重装配通过在构建物中具有同源性区域的连续序列间的组合过程,或者准-重复单位间的组合过25程而发生。重装配过程重组和/或降低重复序列的复杂性和程度,并且导致产生新型的分子种类。可以应用各种处理来提高重装配效率。这些处理包括用紫外光,或者损坏DNA的化学试剂处理,和/或使用表现增高水平的"遗传不稳定性"的宿主细胞系。因此,这样的重装配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。30重复或者"准重复(quasi-repeated)"序列在遗传不稳定性中起作用。一方面,"准重复"是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变得基本上无形,并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重35复单位提供了一个实际上没有限制的模板内容,在模板上可以发生滑移事件。一方面,含有准重复的构建物有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,例如,当所述单元以头对头存在,而不是头对尾,相邻单元的头尾倒置,这样缺失的形成5将有利于不连续单元的失去。因此,优选地,待重装配序列是处于相同的方向。准重复序列的随机定向将会导致重装配效率的损失,而序列的一致定向将会为序列的定向提供最高的效率。然而,虽然具有较少的相同方向的连续序列会降低效率,但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。10应用各种方法中的任何一种,可以将序列装配成头对尾的定向,包括以下方法a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。15b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。c)引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。—方面,重装配序列的回收依赖于具有下降的重复指数(RI)的克隆载体20的确定。被重装配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成,艮口1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。2)通过物理程序对縮短的载体进行物理回收。在这一情况下,克隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或25者柱子上利用标准程序进行大小分离。3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。4)应用表达载体以及适当的选择,使用定向选择技术。相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明30中。然而,尽管下面所描述的例子证明了几乎相同的起始编码序列(准-重复)的再装配,这一过程并不限于这种几乎相同的重复。下面的例子展示了本发明的示例性方法。描述了来自三个(3)独特种的编码性核酸序列(准-重复)。每一序列编码具有一套不同特征的蛋白质。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共35同被扩增并且被连接到随机的装配体中,以便所有可能的排列和组合可以在连接的分子群体中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中,准-重复单位的平均数目通过重复指数(RI)来定义。—旦形成,构建物可以,或不必按照出版的方法通过琼脂糖凝胶来按大小分离,插入到克隆载体,并且转染到合适的宿主细胞中。然后细胞进行繁殖,并且进行"还原性重装配"。如果需要,还原性重装配过程的速率可以通过引入DNA5损伤来刺激。RI的降低是通过一种"分子内"的机制在重复序列间形成缺失来介导,还是通过"分子间"的机制由类似重组的事件来介导是不重要的。最终的结果是分子被重装配,得到所有可能的组合。任选地,本方法包括一个额外的步骤,即对改组的文库成员进行筛选,以确定个别的改组文库成员,其具有与一种预定的大分子如蛋白质受体、寡糖、病10毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用,或者催化特定的反应(如,酶的催化结构域)的能力。从这样的文库所鉴定得到的多肽可以用于治疗、诊断、研究和相关目的(例如,催化剂,用于增加水溶液的渗透性的溶质等等)和/或可以进行改组和/或选择的一个或者多个另外的循环。15在另一方面,可以预见,在重组或重装配之前,或者在重组或重装配的过程中,通过本发明的方法产生的多核苷酸可以用试剂处理或进行加工,这些处理或加工促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的试剂和过程可以包括,但不限于(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和20Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4'-氟-4-氨基联苯加合物(见,例如,vandePoll等(1992)),或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见,vandePoll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽("BMA")、三(2,3-二溴丙基)磷酸盐("Tris-BP")、1,2-二溴-3-25氯丙烷("DBCP")、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物("BPDE")、铀(II)卣素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-q-喹啉("N-羟基-IQ")、和N-羟基-2-氨基-l-甲基-6-苯基咪唑[4,5-f]-吡啶("N-羟基-PhIP")。用于减慢或者停止PCR扩增的示例性方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别包含的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA30加合物的多核苷酸,在进一步的处理前,其可以通过包括加热含有所述多核苷酸的溶液的过程进行释放或者去除。另一方面,本发明涉及产生具有生物活性的重组蛋白,其通过在根据本发明产生杂合或再装配多核苷酸的条件下处理含有编码野生型蛋白的双链模板多核苷酸的样品。35产生,舰辦本发明也提供了用于产生本发明核酸(例如纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶)序列的序列变异体的其它方法。本发明也提供了使用本发明的核酸和多肽分离纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的其它方法。一方面,本发明提供了本发明5的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶编码序列(例如基因、cDNA或信息)的变异体,这些变异体可以通过任何方法来产生,如上所描述,例如包括随意或随机方法、或非随机或"定向进化"方法。被分离的变异体可以是天然发生的。变异体也可以在体外产生。变异体也可以应用基因工程技术来产生,如定点诱变、随机的化学诱变、核酸外切酶III缺10失方法和标准的克隆技术。可选择地,可以应用化学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变异体的其它方法。这些方法包括这样的程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸,所述的特征使这些多肽在工业或者实验室应用中具有更高的价值。在这样的程序中,大量的变异体序列被获得和表15征,这些变异体序列与从天然分离物中得到的序列相比,有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离得到的核酸序列编码的多肽的氨基酸变化。例如,变异体可以通过易错PCR产生。在易错PCR的一个方面中,PCR在DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产物中得20到较高的点突变率。易错PCR在例如,Leung,D.W.,等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.R,PCRMethodsApplic.,2:28-33,1992中描述。简要地说,在这样的程序中,待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适当浓度的dNTP混合,在全长的PCR产物中得到高的点突变率。例如,反应可以使用20fino1待诱变的核酸进行,每种PCR引物30pmol,反应缓25冲液包括50mMKCl、lOmMTrisHCl(pH8.3)和0.01%明胶、7mM的MgCl2、0.5mMMnCl2、5units的Taq聚合酶、0.2mMdGTP、0.2mMdATP、ImMdCTP和lmMdTTP。PCR可以进行30个循环,每个循环为94°C1分钟;45'C1分钟;和72°C1分钟。然而,应该意识到,这些参数可以适当地变化。诱变的核酸克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。30—方面,变异体也可以用寡核苷酸诱导的定向突变产生,在任何感兴趣的克隆DNA中产生位点特异性的突变。寡核苷酸诱变在,例如,Reidhaar-01son(1988)Science241:53-57中描述。简要地说,在这样的程序中,合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡聚核苷酸,将这些寡聚核苷酸插入到待诱变的克隆DNA中。一方面,回收含有诱变DNA的克隆,表达,并评估它们35编码的多肽的活性。另一种产生变异体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生,一个反应的产物引发另一个反应的产物。装配PCR已经被描述,例如在美国专利5,965,408中。—方面,有性PCR诱变是产生本发明的变异体的示例性方法。在有性PCR5诱变的一个方面中,由于基于序列同源性的DNA分子随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,遗传交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。10纯化具有所需的平均大小的片段,重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如,PCR可以这样进行将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mMMgCl2、50mMKC1、10mM的Tris-HCl,pH9.0以及0.1%的TritonX-100的溶液中,其浓度为10-30ng/pl。以100:1的比例在反应混合物中加入2.5Units的Taq聚合酶,用以下的条件进行PCR:94'C60秒,94°C3015秒,50-55'C30秒,72'C30秒(30-45次),然后72'C进行5分钟。然而,可以意识到,这些参数可以进行适当的变化。在一些方面,寡聚核苷酸可以被包括在该PCR反应中。在其它方面,DNA聚合酶I的Klenow片段可以用于第一轮PCR反应,而Taq聚合酶可以用于后续的PCR反应。重组序列被分离,并评估它们编码的多肽的活性。20—方面,变异体也可以通过体内诱变产生。在一些方面,感兴趣的序列中的随机突变通过在细菌菌株中增殖该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的"突变"菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖,最终可产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公25开号WO91/16427中有描述,其在1991年10月31日公开,题目为"MethodsforPhenotypeCreationfromMultipleGenePopulations"。变异体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸"盒"替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。30递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白诱变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815中有描述。35在一些方面,用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中少部分的残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体诱变在如,Delegrave(1993)BiotechnologyRes.11:1548-1552中有描述。随机和定点诱变在如,Arnold(1993)CurrentOpinioninBiotechnology4:450-455中有描述。5在一些方面,变异体利用改组方法产生,其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,其描述见美国专利5,965,408,其提交于1996年7月9日,题为"MethodofDNAReassemblybyInterruptingSynthesis";以及美国专利5,939,250,其提交于1996年5月22日,题为"ProductionofEnzymesHavingDesiredActivitiesbyMutagenesis。10本发明的多肽的变异体可以是这样的变异体,其中本发明的多肽的一个或多个氨基酸残基被保守或非保守氨基酸残基(一方面,保守氨基酸残基)取代,这样取代的氨基酸残基可以是由遗传密码编码或不被其编码的氨基酸。—方面,保守取代是那些在多肽中一个给定的氨基酸被另一个具有类似特性的氨基酸取代的取代。一方面,本发明的保守取代包括下列的取代脂肪族氨15基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸用另一个脂肪族氨基酸取代;丝氨酸用苏氨酸取代,或苏氨酸用丝氨酸取代;酸性残基如天冬氨酸和谷氨酸用另一个酸性残基取代;具有酰胺基因的残基,如天冬酰胺和谷氨酰胺用另一个具有酰胺基因的残基取代;碱性残基如赖氨酸和精氨酸用另一个碱性残基来交换;芳香族残基如苯丙氨酸、酪氨酸用另一个芳香族残基取代。20其它变异体是那些在本发明的多肽的一个或多个氨基酸残基中包含有取代基团的变异体。一方面,其它变异体是那些在其中多肽与别的化合物联接的变异体,所述化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)。其它变异体是那些在其中额外的氨基酸被融合到多肽上的变异体,额外的氨基酸例如前导序歹ij、分泌序列、蛋白原序列(proproteinsequence)或有助于多肽的纯化、富集或25稳定的序列。在一些方面,片段、衍生物和类似物保持了与本发明的多肽的相同的生物功能或活性。在其它方面,片段、衍生物或类似物包括蛋白原,这样,变异体、片段、衍生物或类似物可以通过蛋白原部分的切割来激活,以产生活性多肽。优化密码子以便在宿主细胞中获得高水平的蛋白表达本发明提供了修饰编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸来改变(例如,优化)密码子使用的方法。一方面,本发明提供了修饰编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸中的密码子来增加或者降低其在宿主细胞中的表达的方35法。本发明也提供了编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸,该核酸经过修饰从而其在宿主细胞中的表达增加,例如,经过这样的修饰的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶,以及制备修饰的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的方法。该方法包括鉴定编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸中的"非优选的"或"较5不优选的"密码子,并且用编码相同氨基酸的"优选密码子"作为替换密码子替换一个或者多个这些非优选或者较不优选的密码子,并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基因的编码序列中被较多使用的密码子,而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。10用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞(参见上面的讨论)。因此,本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核酸编码的多肽。示例性的宿主细胞包括革兰氏阴性细菌,如大肠杆菌(£sc;iehcWaco);革兰氏阳性细菌,如链霉菌属(S/repto/w_ycM)、15加氏乳酸杆菌(丄a"o^c///1^gawe〃')、乳酸乳球菌(£ac/ocoaw/ac似)、乳脂乳球菌(Zactococczwcre加o/7's)、枯草芽胞杆菌(5arcv7/"jsi/6""51)、4山人掌杆菌(5a"7/"sceww)。示例性的宿主细胞也包括真核生物体,如,各种酵母,如酵母菌属(Sacc/jaram;ycessp.),包括酉良酒酵母(Sacc/wromycescerevisz'cre)、粟酒裂殖酵母(ScWmsflccWom少ces戶附&e)、毕赤酵母(尸認"戸,or&)和乳酸克鲁维酵母20(A7M严eram[yc^/acto)、多形汉森酵母(//1myeww/flpo(y附or//fl)、黑曲霉(J5perg〃/uym'ger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和物种中表达被优化的核酸和多肽。例如,从细菌细胞中分离出的编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸的密码子被修饰,以便该核酸在不同于25获得该纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的细菌的细胞,如酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中被最优化地表达。优化密码子的方法在本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)ProteinExpr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.3069:7250-7253,描述了在小鼠系统中优化密码子;Outchkourov(2002)ProteinExpr.Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry39:15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)ProteinExpr.Purif20:252-264,描述了大肠杆菌中影响分泌的优化的密码子使用。35转基因非人动物本发明提供了转基因非人动物,其包含本发明的核酸、多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)、表达序列盒或载体或转染细胞或转化细胞。本发明也提供了产生和应用这些转基因非人动物的方法。转基因非人类动物可以是,例如包含本发明的核酸的狗、山羊、兔、绵羊、5猪(包括所有的猪(swine)、公猪和相关动物)、牛、大鼠和小鼠。这些动物可以用作例如体内模型来研究纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或J3-葡糖苷酶的活性,或者作为模型来在体内筛选改变纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性的试剂。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的,或者在组织特异性、发10育特异性或者可诱导的转录调控因子的控制之下。转基因非人动物可以应用本领域任何已知的方法设计和产生;参见,如,美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,它们描述了制造和应用转化的细胞和卵以及转基因小鼠、15大鼠、兔、羊、猪和牛。也参见,如,Pollock(1999)J.Immunol.Methods231:147-157,描述了在转基因奶牛动物的乳汁中生产重组蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述了转基因山羊的产生。美国专利6,211,428,描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至小鼠受精卵中,移20植注射的卵至假孕的雌鼠中,并生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因小鼠。"基因敲除动物"也可以被用于实践本发明的方法。例如,一方面,本发明的转基因或修饰动物包括"基因敲除动物",例如"基因敲除小鼠",其被进行了遗传工程以至于不表达内源基因,该基因被表达本发明纤维素酶如内切葡聚糖25酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因或包含有本发明纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的融合蛋白的基因代替。转基因植物和种子30本发明提供了转基因植物和种子,其包含本发明的核酸、多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)、表达序列盒或载体或转染或转化的细胞。本发明也提供了包含本发明的核酸和/或多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)的植物产品,例如油、种子、叶、提取物和类似物。转基因植物可以是双子叶(双35子叶植物)或单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利6,309,872。本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或者表达构建物可以导入到所希望的植物宿主的基因组中,或者,核酸或表达构建物可以是附加体。可以导入到所希望的植物的基因组中,这样,宿主的纤5维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了"基因敲除植物",其中例如同源重组导致的基因序列插入破坏了内源性基因的表达。产生"基因敲除"植物的方法在本领域是属知的,参见,如,Strepp(1998)ProcNatl.Acad.Sci.USA95:4368-4373;Miao(1995)PlantJ7:359-365。参见下面的转基因植物的讨论。10本发明的核酸可以用来将所需的性质赋予基本上任何植物,例如产淀粉的植物,如马铃薯、番茄、小麦、大豆、甜菜、玉米、稻、大麦以及类似的植物。本发明的核酸可以用于操作植物的代谢途径,以优化或者改变宿主的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表达。这可以改变植物中的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖15苷酶的活性。可以选择地,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶可以在转基因植物的生产中被应用,以产生该植物不能天然产生的化合物。这可以降低生产成本或者产生一种新的产物。—方面,生产转基因植物的第一步涉及制备用于在植物细胞中表达的表达构建物。这些技术在本领域是熟知的。它们可以包括选择和克隆启动子、便于核20糖体有效结合mRNA的编码序列,以及选择适当的基因终止子序列。一个示例性的组成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的启动子是更特异的,并且对植物内部或者外部环境中的暗示有反应。一个示例性的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。25—方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率,而一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变氨基酸序列,从而可以增加基因产物在植物细胞中的生产。为了鉴定已经成功整合了转基因的植物细胞或者组织,可以将选择性标记30基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,35标记基因也需要启动子和终止序列。—方面,制备转基因植物或种子包括将本发明的序列以及任选的标记基因整合到目标表达构建物(如,质粒)中,同时设置启动子和终止子序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如,构建物可以应用如电击转化和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构建物可以应用弹道方法(ballisticmethods),如,DNA微粒轰击(DNAparticle5bombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)PlantMol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature327:70-73;Talcumi(1997)GenesGenetSyst.72:63-69,讨论了应用微粒轰击引入转基因到小麦中;以及Adam(1997)如上,应用微粒轰击引入YAC至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。10用于加速微粒的设备在美国专利5,015,580中有说明;而且,可以商购得到BioRad(Biolistics)PDS-2000微粒加速设备;也参见,John,美国专利5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。—方面,原生质体可以被固定,并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来15源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化,其中,DNA被包裹于钨微射弹(tungstenmicroprojectiles)上,射出物的大小为细胞大小的1/100,它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。20核酸,例如表达构建物,也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)PlantMol.Biol.33:989-999),参见Porta(1996)"Useofviralrepliconsfortheexpressionofgenesinplants",Mol.Biotechnol.5:209-221。可选择地,核酸,如表达构建物,可以与合适的T-DNA侧翼区组合,并25导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导的转化技术,包括disarming和应用二元载体,在科学文献中有详细的说明。参见,如,Horsch(1984)S"e"ce233:496-498;Fraley(1983)/VocA^Z.JcadSW.80:4803(1983);7hww/e〃o尸/a"",Potrykus,ed.(Springer-Veriag,Berlin301995)。根瘤农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(20kb长)和一系列毒力(毒性)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根瘤农杆菌可以通过伤口感染植物当一种植物的根或者茎受伤时,它释放某种化学信号,作为对这种信号的响应,根瘤农杆菌的35毒力基因被激活,并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA—直等到植物DNA复制或者转录,然后将自身插入到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。5本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化,参见Hiei(1997)PlantMol.Biol.35:205-218。也参见如,Horsch,Science(1984)233:496;Fraley(1983)Proc.NatlAcad.SciUSA80:4803;Thykjaer(1997)如上;Park(1996)PlantMol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组DNA中。也参见D'Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子10叶植物的细胞中的具有功能的基因的DNA的稳定整合过程。—方面,第三步可能涉及完整植物的选择和再生,所述植物能够将整合的靶基因传递至下一代。这样的再生技术依赖于在组织培养生长培养基中对某些植物激素的操作。一方面,该方法利用与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,15Pra鄉/a加/so/加'omaweCW&re,Z/aw必ooA:o/iV"WO//Cw/ft^e,124-176页,MacMillilanPublishingCompany,NewYork,1983;禾qBinding,iegenen3n'owo/尸/aw",尸/aWiVorop/a^y,21-73页,CRCPress,BocaRaton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplantPhys.38:467-486中有总体的说明。为了从转基因组织如未成熟的胚胎20获得整个植物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评测其子代。—方面,在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依25赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)时,所需的效应(例如,表达本30发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。—方面,本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草,如牧草(蓝草,早熟禾属尸oa),饲料草如羊茅属,黑麦草属,35温带草,如翦股颖属C4gra幼'",和谷类,如,小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草,豆类如羽扇豆,马铃薯,甜菜,豌豆,蚕豆和大豆,以及十字花科植物(5row/caceae科),如花椰菜,油菜籽,和紧密相关的模式生物拟南芥"ra6Wo/w/1yf/ia//flmj)。因此,本发明的转基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的物种-腰果属""acaW/ww)、落花生属"rac/H^)、天冬属(Asparag^)、茄属Ufra;a)、5燕麦属"ve"a)、芸苔属(5raw/ca)、柑桔属(C!7nw)、Cz>m//us、辣椒属"7a/wi'cwm)、CaW/7am"s、椰子(Coaw)、咖啡(Co#ea)、香瓜属(Ci/cw/m's)、南瓜属(CwcM/^!7a)、胡萝卜属(Dawcws)、油棕属草莓属(fVagm7'fl)、大豆属(Gfya、e)、棉属(Gowy;^ww)、向日葵属(//e//a"f/n)、//e/ewca〃&、大麦属(Z/orJeM/n)、天仙子属(/fyosc戸/mw)、莴苣属(Za"Mca)、亚麻属("""w)、黑麦草属ao//wm)、10羽扇豆属(丄w//mw)、番茄属(Z^copery/cow)、苹果属(Ma/ws)、木薯属(Mflm'Ao/)、Mq/oma、苜蓿属(A/eAcago)、烟草属(Mco"awa)、木樨榄属(OZea)、稻属(Ojza)、稷属(户a"/e"m)、狼尾草属(尸a""&"謂)、鳄梨属(Perwa)、菜豆属(尸/jawoto)、P&acWa、豌豆属(尸&"附)、梨属(尸,MS)、李属(Pn/mw)、萝卡属(ia;^am^)、蓖麻属(i!'c/"m)、黑麦属(Seca/e)、千里光属(Se"edo)、S/wa;^、茄属(So/o"mw)、15高粱属(5brg/i"m)、7Tieo6rowM"葫芦巴属(7Wgowe//a)、小麦属(rn'"ami)、野豌豆属(Wc/")、葡糖属(Wto)、豇豆属(P7g"a)和玉蜀黍属(Zea)。在可选择的实施方式中,本发明的核酸在含有纤维细胞的植物中表达,包括,如,棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、轻木(balsa)、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可供选择的20实施方式中,本发明的转基因植物可以是棉属(Gw^^'M/n)的成员,包括任何棉禾中(Go,/wm)的成员,如,亚洲棉(G。rZw画)、草棉(G/^6ac画)、海岛棉(G6aAa&Awe)和陆地棉(G)。本发明也提供了用于产生大量本发明多肽(例如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)的转基因植物。例如,参见25Palingren(1997)TrendsGenet.13:348;Chong(1997)TransgenicRes.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(masl',2')启动子,应用根瘤农杆菌介导的叶片圆盘(leafdisc)转化方法在转基因马铃薯植物中生产人乳汁蛋白P-酪蛋白)。应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA30或蛋白的增加或减少来筛选本发明的植物。检测和定量mRNA或蛋白的方法在本领域是熟知的。多肽和肽—方面,本发明提供了分离的或重组的多肽,其与本发明的示例性序列具35有序列同一性(例如至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性),本发明的示例性序列例如具有SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:IO,5SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQIDNO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,10SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQID15NO:110,SEQIDNO:m,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQID20NO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164或SEQIDNO:166中所示的序列的蛋白(也参见表l、2和3,下面的实施例1和4,以及序列表)。序列同一性百分比可以在多肽的全长的区域内,或同一性可以在至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多残基的区域内。25[391a]本发明的多肽也可以比所述的示例性多肽的全长短。在可以选择的方面,本发明提供了大小范围在大约5到多肽全长的多肽(肽、片段),例如酶,如纤维素酶,诸如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶;示例性的大小为大约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、30600、650、700或更多残基,这些残基例如是本发明的示例性纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的相邻残基。本发明的肽(例如,本发明的示例性多肽的子序列)可以用作,例如标记探针,抗原(免疫原),耐受原,基序,纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位点(例如,"催化结构域"),信号序列和/或前原结构域(prepro35domains)。在可选的方面,本发明的具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽,是一类多肽的成员,该类多肽共享与纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性相关的特定结构元件,例如氨基酸残基。这些共享的结构元件可用于常规产生纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶变体。本5发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的这些共享结构元件可用于指导本发明的多肽种类范围内的纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶变体的常规产生。如本文所使用,术语"纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶"包括能够催化纤维素的完全或部分分解和/或水解的任10何多肽或酶(例如,本发明的示例性多肽,也参见下面的表1、2和3,实施例1和4),或者能够进行纤维素或木素纤维素材料如含有木素纤维素的生物材料的任何修饰的任何多肽或酶。在一些方面,本发明可以具有可选的酶促活性,例如,如在下面的表3中所示。例如,具有如SEQIDNO:164中所示的序列的多肽,由例如SEQIDNO:16315编码,可以具有碱性内切葡聚糖酶/纤维素酶活性;具有如SEQIDNO:110中所示的序列的多肽,由例如SEQIDNO:109编码,可以具有木聚糖酶活性;具有如SEQIDNO:12中所示的序列的多肽,由例如SEQIDNO:11编码,可以具有NAD结合氧化还原酶活性;具有如SEQIDNO:118中所示的序列的多肽,由例如SEQIDNO:117编码,可以具有短链脱氢酶活性;具有如SEQIDNO:14中所示的序列的20多肽,由例如SEQIDNO:13编码,可以具有NADH依赖性脱氢酶活性;具有如SEQIDNO:138中所示的序列的多肽,由例如SEQIDNO:137编码,可以具有肽酶活性;具有如SEQIDNO:162中所示的序列的多肽,由例如SEQIDNO:161编码,除了纤维素酶活性外还可以具有碱性内切葡聚糖酶活性;具有如SEQIDNO:42中所示的序列的多肽,由例如SEQIDNO:41编码,可以具有半胱氨酰tRNA25合成酶活性;具有如SEQIDNO:32中所示的序列的多肽,由例如SEQIDNO:31编码,可以具有纤维糊精磷酸化酶活性;具有如SEQIDNO:50中所示的序列的多肽,由例如SEQIDNO:49编码,可以具有fdhd/narq氧化还原酶活性;具有如SEQIDNO:54中所示的序列的多肽,由例如SEQIDNO:53编码,可以具有自由基S-腺苷蛋氨酸(SAM)活性;具有如SEQIDNO:58中所示的序列的多肽,由例如30SEQIDNO:57编码,可以具有类似枯草蛋白酶的蛋白酶活性(枯草蛋白酶样蛋白酶活性);等等,如下所示表3:<formula>formulaseeoriginaldocumentpage127</formula><table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table>ORF011-家族37,38葡糖苷瞎)ORP004-椎定的氧化还原酶39.40ORF004-半胱氨酰tRM合成酶41,4243,44ORF011—ORF006—家族1(&-葡糖苷酶)ORF00Z-家族1(a"47,48蕭耱苷籌)49,60氧化还原酶5,6ORF312-家族6(纤维素酶)1-29MTRRS,VRSSSNKWLVLAGAALLACTALG51,52ORF001-家族5(纤维素酶)1-20MSRGHJLVMLSVLSGAALA53,54ORF002—自由基SAI^族ORF004-家族1(ft"55,58葡糖苷瞎)57,58ORF加1-类似枯直蛋白酶的蛋白酶59,60家族5(纤维亲酶)61,62家族5(纤维素酶)ORF114263,64家族5(纤维素鹏)ORF4,-2465,66家族10(木聚糖酶)1"3967.68家族5(纤维亲鹏VORF21-23MVWTPARSTLAGSSEIPLMTMNIFPNRKDSRMSL州KLG'LCMMAGTVMVHQMKRREFMU3GAGVAALASTLGVSAMNTLLPR亂WSSTAIRTLMGALMGMVLAPVSAANAMKYIFSYIIMMlUOFIPVYGR34.1.1.6,1-1.163,2.1.213.2."1...3.2.1.2112.1.43.2.1.43.2.1.43.2.1.4200680016175.5势溢齿被98/148JB;nwnx口口nw口口头头知知.w.,*K知未未未未未未未w知w知知^f^知知未未未未未未未未未未<table>tableseeoriginaldocumentpage131</column></row><table>未如本文所使用,"氨基酸"或"氨基酸序列"是指寡肽、肽、多肽或蛋白序列,或寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基,以及天然发生的或合成的分子。"氨基酸"或"氨基酸序列"包括寡肽、肽、多肽或蛋白序列,或寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基,以及天然发5生的或合成的分子。如本文所使用,术语"多肽"是指通过肽键或修饰的肽键即肽等排体(peptideisosteres)彼此结合在一起的氨基酸,可以含有除20个由基因编码的氨基酸之外的修饰的氨基酸。所述多肽可以通过天然过程,如,翻译后加工或者通过本领域所熟知的化学修饰技术修饰所述多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同10类型的修饰可以在给定的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形15成焦谷氨酸、甲酰基化作用、"羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、葡聚体水解酶处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。(参见,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman和Company,New20York(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed"AcademicPress,NewYork,11-12页(1983〉)。本发明的肽和多肽也包括所有"模拟物"和"肽模拟物"形式,正如下面进一步详细描述的。如本文所使用,术语"分离的"意指从其原始环境(例如天然环境,如果该环境是天然存在的话)中分离出的物质(本发明的蛋白或核酸)。例如,在活的25动物中存在的天然发生的多核苷酸或多肽不是分离的,但与该天然系统中的一些或所有的共存物质分离开的同一多核苷酸或多肽是分离的。这样的多核苷酸可以成为载体的一部分,和/或这样的多核苷酸或多肽可以是组合物的一部分,但它们仍然是分离的,因为这样的载体或组合物不是其天然环境的组成部分。正如本文所用,术语"纯化的"并不要求绝对的纯度;它更确切的说,这意味着是一个相30对定义。从文库获得的各核酸可以按惯例纯化为电泳同质。从这些克隆获得的序列不能够从所述文库或从总人DNA直接获得。本发明的纯化的核酸已经以至少10、10M咅从该生物体的基因组DNA的剩余物中纯化出来。一方面,术语"纯化的"包括核酸,这些核酸已经以至少一个数量级,例如一方面,以两个或三个,或者,四个或五个数量级的程度从基因组DNA的剩余物或从文库或其它序列中被纯化出35来。"重组的"多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白;艮P,由用编码期望多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。"合成的"多肽或蛋白是那些通过化学合成制备的多肽或蛋白。固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Memfield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)5(也参见Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12页),并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearchBiochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Prac.Wa".Aad5W.,t/S4,M:3998(1984)的方法,它们让肽合成在多个"杆(rods)"或者"钉10(pins)"的顶端进行,而所有的"杆"或者"钉"都被连接到一块板上。短语"基本上相同(substantiallyidentical)"在用于两个核酸或多肽时,是指当两个或更多个序列被比较和联配(aligned)以寻找最大一致性(maximuncorrespondence)时,它们具有例如至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、1569%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸或氨基酸残基(序列)同一性,所述同一性可以使用任意一种已知的序列比较算法测量,或者通过视觉观察。在可选择的方面,基本上相同存在于至少大约100或更多个残基的区域内,最经常地,20在至少大约150至200或更多残基的区域内所述序列是基本上相同的。在一些方面,本发明的核酸序列可以在多肽编码区的整个长度范围内是基本上相同的。此外,"基本上相同的"氨基酸序列可以是通过一个或多个保守或非保守氨基酸的取代、缺失或插入而与参考序列有所不同的序列。在一个方面,取代发生在不是分子的活性位点的位置,或者可选地,取代发生在分子的活性位点的位25置,前提是该多肽基本上保持其功能(酶促)特性。保守的氨基酸取代,例如用一个氨基酸取代另一个相同类别的氨基酸(例如用一个疏水氨基酸,如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸,取代另一个疏水氨基酸,或用一个极性氨基酸取代另一个极性氨基酸,例如用精氨酸取代赖氨酸、用谷氨酸取代天冬氨酸,或用谷氨酰胺取代天冬酰胺)。可以从例如纤维素酶如内切葡聚糖酶、纤维二糖水解酶、30甘露聚糖酶和/或P-葡糖苷酶多肽中删除一个或多个氨基酸,从而形成对多肽结构的修饰,而又不会显著地改变其生物活性。例如,对纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的生物活性来说不需要的氨基或羧基末端氨基酸可以被去除。可以通过任何方法测定本发明的修饰的多肽序列的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶生物活性,35所述方法包括将所述修饰的多肽序列和底物接触,确定所述修饰的多肽是否在该测定中减少特定底物的量或者增加功能性纤维素酶如内切葡聚糖酶、纤维二糖水解酷、甘露聚糖酶和/或p-葡糖苷酶与底物的酶促反应的生物产物。如本文所使用,"片段"是天然存在的蛋白质的一部分,其可以以至少两种不同的构象存在。片段可以具有与天然发生的蛋白质相同或基本上相同的氨基酸序列。具有与天然存在的蛋白质有所不同的三维结构的片段也被包括在内。这5样的一个例子是"原-形式(pro-form)"分子,例如,低活性的蛋白原,其可以通过切割而被修饰,产生具有显著更高的活性的成熟酶。—方面,本发明提供了本发明的蛋白和肽例如纤维素酶的晶体(三维)结构;其可以使用本领域中熟知的常规方案进行制备并加以分析,例如,在下列文献中有所描述MacKenzie(1998)Crystalstructureofthefamily7endoglucanaseI10(Cel7B)fromif應/co/flf'/wo/e/wat2.2Aresolutionandidentificationofthecatalyticnucleophilebytrappingofthecovalentglycosyl-enzymeintermediate,Biochem.J.335:409-416;Sakon(1997)Structureandmechanismofendo/exocellulaseE4from77jermoMonos/ora/wsca,Nat.Struct.Biol4:810-818;Vaxrot(1999)Crystalstructureofthecatalyticcoredomainofthefamily6cellobiohydrolaseII,Cel6A,ftom/f謂/co/。15/;wo/em,at1.92Aresolution,Biochem.J.337:297-304;举例说明并鉴定了特定的结构元件,其可用于指导本发明的纤维素酶变体的常规产生,并用于指导鉴别本发明的范围内的酶种类。本发明的多肽和肽可以分离自天然来源,可以是合成的,或者可以是重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用20本
技术领域
已知的任何方法产生和分离。本发明的多肽和肽也可以使用本
技术领域
熟知的化学方法全部或部分合成。例如参见Caruthers(1980)NucleicAcidsRes.Symp.Ser.215-223;Horn(1980)NucleicAcidsRes.Symp.Ser.225-232;Banga,A.K.,TherapeuticPeptidesandProteins,Formulation,ProcessingandDeliverySystems(1995)TechnomicPublishingCo.,Lancaster,PA。例如,肽合成可以使25用各种固相技术进行(例如参见Roberge(1995)Science269:202;Memfield(1997)MethodsEnzymol.289:3-13),自动合成可以根据制造商提供的说明书来实施,例如使用ABI431A肽合成仪(PerkinElmer)。本发明的肽和多肽也可以是糖基化的,所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上,其中后者包括应用已知的糖基化作用30基序,所述糖基化作用基序可以对于所述序列是天然的,或者是作为肽段而被加入的,或者是在核酸编码序列中加入的。糖基化作用可以是O-连接的或者是N-连接的。〖0404]本发明的肽和多肽,如以上所定义的,包括所有的"模拟物(mimetic)"和"肽模拟物(peptidomimetic)"形式。术语"模拟物"和"肽模拟物"是指具有35与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成,或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守取代,只要这样的取代本质上不改变该模拟物的结构和/或活性。对于作为保守性变异体的本发明的多肽或一类本发明的多肽的成员(例如,具有与本发明的示例性序列具有大约50%或更高的序列同一性的成员),常规实验将可以确定一种模拟物是否在本发明的范围内,艮P,其结构和/或功能并没有实质上的5改变。因此,一方面,如果一种模拟组合物具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性,那么它在本发明的范围内。本发明的多肽模拟组合物可以包含非天然结构成分的任何组合。在可供选择的方面,本发明的模拟组合物包括以下三种结构基团中的一种或所有a)不是天然酰胺键("肽键")连接的残基连接基团;b)取代天然发生的氨基酸残基的非10天然残基;或者c)诱导二级结构拟态(mimicry)的残基,B卩,可以诱导或者稳定二级结构,如P转角、y转角、卩折叠、a螺旋构象,以及类似的结构。例如,当本发明的多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时,该多肽可以作为模拟物来表征。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接,如,通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、15N,N'-二环己基碳二亚胺(DCC)或者N,N'-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键("肽键")连接的连接基团包括,如,酮基亚甲基(如,-<:(=0)-0^-代替-C(-O)-NH-)、氨基亚甲基(CH2-NH)、次乙基、烯烃(CH=CH)、醚(CH2-0)、硫醚(CH2-S)、四唑(CN4-)、噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(参见女口,Spatola(1983)在ChemistryandBiochemistryofAminoAcids,Peptidesand20Proteins,第7巻,267-357页,"P印tideBackboneModifications"MarcellDekker,NY)。本发明的多肽也可以通过含有全部或者部分替代了天然发生的氨基酸残基的非天然氨基酸残基而被表征为模拟物。在科学和专利文献中描述了非天然的残基;作为天然氨基酸残基的模拟物的一些典型的非天然化合物及指导在下面有25描述。芳香族氨基酸的模拟物可以通过用以下的取代来产生,如,D-或L-萘基丙氨酸;D-或L-苯基甘氨基,D-或L-2thieneyl丙氨酸;D-或L-l,-2,3-或4-芘基丙氨酸;D-或L-3thieneyl丙氨酸;D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸,D-或L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯30基丙氨酸;D-者L-p-甲氧基-二苯基苯基丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和,D-或L-烷基丙氨酸,其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括,如噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。35酸性氨基酸的模拟物可以通过用以下的取代来产生,如,保持有负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链(如,天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R'-N-C-N-R')反应进行选择性的修饰,所述碳二亚胺如l-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者l-乙基-3(4-氮镜4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和5精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂一方面在碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、102,3-丁二酮、1,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲垸反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如a-离素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半15胱氨酰残基与例如溴代-三氟丙酮、a-溴-l3-(5-imidozoyl)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯荥-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-l,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有a-氨基的残基模拟物也可以通过与亚氨酸酯20例如methylpicolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基25原碳酸酯或对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的a氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的酰胺化而产生的30模拟物。—方面,本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。一方面,任何天然发生的L-构型(也可以被称为R或者S,取决于化学实体的结构)的任何氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称35R-或者S-型。本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以及类似作用)或者通过化学修饰技术来修饰本发明的多肽的方法,以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。一5方面,修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、,羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化10作用、氧化作用、聚乙二醇化、蛋白水解处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman禾口Company,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,11-12页15(1983)。固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12页),并且这些方20法近来已经可以通过商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearchBiochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它们让肽合成在多个"杆(rods)"或者"钉(pins)"的顶端进行,而所有的"杆"或者"钉"都被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到25另一个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的可利用的FMOC肽合成系统是可利用的。例如,应用AppliedBiosystems,Inc.的Model431A自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备30使得本发明的肽容易获得,或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。本发明的多肽包括活性或非活性形式的纤维素酶,例如,内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶。例如,本发明的多肽包括在"成熟"或例如通过蛋白原加工酶如蛋白原转化酶来产生"活性"的成熟蛋白来加工35前原序列之前的蛋白原。本发明的多肽包括由于其它原因而不具有活性的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,所述其它原因例如在通过翻译后加工事件诸如内切或外切肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化或二聚化事件等等进行"活化"之前。本发明的多肽包括所有的活性形式,包括酶的活性子序列,例如,催化结构域或活性位点。本发明包括固定化的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚5糖酶和/或P-葡糖苷酶,抗纤维素酶抗体如抗内切葡聚糖酶抗体、抗纤维二糖水解酶抗体、抗甘露聚糖酶抗体和/或抗P-葡糖苷酶抗体及其片段。本发明提供了抑制纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的方法,例如使用本发明的显性负突变体或抗纤维素酶抗体,如抗内切葡聚糖酶抗体、抗纤维二糖水解酶抗体、抗甘露聚糖酶抗体和/或抗卩-葡糖苷酶抗体。本发明10包括含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的杂合物(异源复合物),例如融合蛋白、异二聚体等等。本发明的多肽可以在多种不同的条件下具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,例如极端pH和/或温度、氧化剂以及类似的条件。本发明提供了产生可供选择的纤维素酶如内切葡聚糖酶、纤15维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶制剂的方法,所述制剂具有不同的催化效率和稳定性,例如针对温度、氧化剂和改变洗涤条件。一方面,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶变异体可以使用定点诱变和/或随机诱变的技术来产生。一方面,定向进化可以被用来产生大量不同的具有可供选择的特异性和稳定性的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、20甘露聚糖酶和/或P-葡糖苷酶变异体。本发明的蛋白也可用作研究试剂,以鉴定纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的调节物,例如纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的激活剂或抑制剂。简单的说,将测试样品(化合物、培养液、提取物和类似物)加入到纤维素酶如内切25葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶测定中,以确定它们抑制底物切割的能力。用该方式鉴定的抑制剂可用于工业和研究中,以减少或阻止不期望的蛋白水解。如同纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的情况,抑制剂可以被组合以增加活性谱。本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例如,为30了使用例如自动测序仪进行测序,可以使用纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶将多肽破碎成更小的片段。本发明的另一个方面是用于鉴定本发明的片段或变异体的分析方法,所述本发明的片段或变异体保留了本发明的的多肽的酶功能。例如,所述多肽的片段20或变异体可用来催化生物化学反应,这样的反应表明所述片段或变异体保留了本发明的多肽的酶活性。确定变体或片段是否保留本发明的多肽的酶活性的示例性测定方法包括下面的步骤将多肽片段或变异体与底物分子在允许该多肽片段或变异体发挥作用的条件下接触,并检测底物水平的降低或该多肽和底物之间反应的特异反应产物水平的增加。25本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物如小分子中的功能基团具有特异性的。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有30这一功能基团的许多起始化合物反应。生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。酶可以在起始化合物的特定位点发生反应而不影响分子的其它部分,该过35程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列生物催化反应来表征,这也称为"生物合成历史"。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序,并确认合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法,并不需要固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和5测试。重要的是,注意到酶反应在功能基团上的高度特异性允许"追踪"特定的酶促反应,由所述酶促反应制备出了生物催化产生的文库。—方面,许多程序化的步骤可使用自动化机器人来实施,这使得每天可执行数千个生物催化反应和筛选分析,并保证高水平的准确性和可重复性。自动化机器人也可用于筛选纤维素酶活性,以确定多肽是否在本发明的范围内。结果,10—方面,在几周内便产生了衍生化合物的文库,而采用"传统"的化学或酶促筛选方法则需要几年的时间。在一个特定的方面,本发明提供了修饰小分子的方法,包括将在此所述的由多核苷酸编码的多肽或其酶活性片段与小分子接触,产生修饰的小分子。检测被修饰的小分子的文库以确定显示出所需活性的修饰小分子是否存在于文库内。15产生具有所需活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地去除用来产生一部分文库的每个生物催化反应,然后检测在这一部分文库中产生的小分子是否存在具有所需活性的修饰小分子。产生具有所需活性的修饰小分子的特异生物催化反应可任选地被重复。生物催化反应可用一组生物催化剂来进行,它们可与在小分子的结构中发现的各种不同结构部分反应,每个生物催化剂对一20个结构部分或一组相关的结构部分是特异的;每个生物催化剂可与含有各种不同的结构部分的许多不同的小分子反应。勞録艨射娜覆総雜二蘑蕭麟/雞薪薪雜虔号舰歸翁鄉雌众薪雌25本发明提供了纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信号序列(例如信号肽(SPs))、前原(prepro)结构域和催化结构域(CDs)。本发明的SPs、前原结构域和/或CDs可以是分离的或重组的肽或可以是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)、前原结构域和信号序列(SPs,例如具有包括本发明的多肽30的氨基末端残基或由本发明的多肽的氨基末端残基组成的序列的肽)的核酸。本发明提供了分离或重组的信号序列(例如,信号肽),该信号序列包括下列序列或由下列序列组成,所述序列如本发明的多肽的残基1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、l至lj26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、135到34、1到35、1到36、1到37、1到38、1到39、1到40、1到41、1到42、1到43、1到44、1到45、1到46或1到47或更多残基所示的序列,本发明多肽例如,本发明的示例性多肽,也参见表3、下面的实施例1和4以及序列表。例如,上面的表3示出了本发明的示例性信号(前导)序列,例如,对于具有如SEQIDNO:164所示序列的多肽——其例如由SEQIDNO:163编码,具有的信号序列含有氨基末端30个残基(或由氨基末端30个残基组成)或者具有下列序列或由下列5序列组成MSCRTLMSRRVGWGLLLWGGLFLRTGSVTG。其它的信号序列同样列在表3中。—方面,本发明提供了信号序列,其包括本发明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、1053、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基末端残基。本发明包括具有和没有信号序列和/或前原序列的多肽。本发明包括具有异源信号序列和/或原前序列的多肽。前原序列(包括用作异源前原结构域的本发明序列)可以位于蛋白质的氨基末端或羧基末端。本发明还包括分离或重组的含有15本发明序列的信号序列、前原序列和催化结构域(例如,活性位点)。所述含有本发明的信号序列的多肽可以是本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,或另一种纤维素酶,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或另一种或其它多肽。鉴定"前原"结构域和信号序列的方法在本领域是熟知的,例如VandeVen(1993)Crit.Rev.20Oncog.4(2):115-136。例如,为了鉴定前原序列,从胞外空间纯化出蛋白质,确定其N末端蛋白序列,并将其与未加工的形式进行比较。本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶信号序列(SP)和/或前原序列可以是分离的或重组的肽,或与另一种纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或非纤维25素酶如非内切葡聚糖酶、非纤维二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶多肽连接的序列,例如形成融合(嵌合)蛋白。在一个方面,本发明提供了含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信号序列的多肽。在一个方面,含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶信号序列SP和/或前原序列的多肽包含与30本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶异源的序列(例如,含有本发明的SP和/或前原序列和来自另一种纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或非纤维素酶如非内切葡聚糖酶、非纤维二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶蛋白的序列的融合蛋白)。在一个方面,本发明提供了具有异源SP和/或前原序列的本发明的纤35维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,例如具有酵母信号序列的序列。本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可以含有存在于载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中的异源SP和/或前原序列。在一个方面,本发明的SP和/或前原序列在鉴定出新的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶之后被鉴定出来。蛋白被5分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路(proteintargetingpathways)。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置,并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列,这些信号序列标示着它们10将转位至内质网腔内。信号序列的长度可以为从10至65或更多个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如,在一个方面,新的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的信号肽可通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽,又可识别其裂解位点的组合神经网络。(Nielsen(l997),"Indentificationofprokaryoticand15eukaryoticsignalpeptidesandpredictionoftheircleavagesites"ProteinEngineering,巻10,1,1-6页)。在一些方面,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶没有SP和/或前原序列,或"结构域"。在一个方面,本发明提供了缺少所有或部分的SP和/或前原结构域的本发明的纤维素酶如内切葡聚20糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶。在一个方面,本发明提供了编码来自一种纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的信号序列(SP)和/或前原序列的核酸序列,其可操作地连接于一种不同的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸序列,或者,可选择地,来自非纤维素酶如非内切葡聚糖酶、非纤维二糖水25解酶、非甘露聚糖酶和/或非J3-葡糖苷酶蛋白的信号序列(SP)和/或前原结构域可以是期望的。本发明也提供了分离出的或重组的多肽,其含有本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)和异源序列。所述异源序列是与SP、前原结构域和/或CD天然不相关的序列。与SP、前原结构域和/或CD天然不相关的序列30可以在SP、前原结构域和/或CD的氨基末端、羧基末端,和/或SP和/或CD的两个末端上。在一个方面,本发明提供了分离出的或重组的多肽,其包括(或构成于)含有本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的多肽,条件是它同与其天然相关的任何序列(例如,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列)是不连接的。同样,在一个方面,35本发明提供了编码这些多肽的分离出的或重组的核酸。因此,在一个方面,本发明的分离出的或重组的核酸包括本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的编码序列和异源序列(即,与信号序列(SP)、前原结构域和/或催化结构域(CD)天然不相关的序列)。异源序列可在SP、前原结构域和/或CD编码序列的3'末端、5'末端和/或两个末端上。5染爻f诙^)^T^牵^^fii7^坊薪Jlg^艨、好键二薪j麻錄浙/或A-薪凝存艨浙嚴文库—方面,本发明提供了包含本发明的序列的杂合纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶和融合蛋白,包括肽库。本发明的肽库可以用于分离目标的肽调节物(如,激活物或者抑制物),如纤维素酶如10内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶底物、受体、酶。本发明的肽库可以用于鉴定目标的结合配偶,如,配体,例如,细胞因子、激素以及类似物。一方面,本发明提供了含有本发明的信号序列(SP)、前原序列和/或催化结构域(CD)或其组合以及异源序列的嵌合蛋白质(见上)。—方面,本发明的融合蛋白(如,肽部分)是构象稳定的(相对于线形肽),15对靶标具有更高的结合亲和性。本发明提供了本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶与其它肽的融合,所述其它肽包括已知的肽和随机的肽。它们可以以这样一种方式融合,使得所述纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的结构没有明显地被扰舌L,并且该肽在代谢上或者结构构象上是稳定的。这样便允许获得这样的肽库,20其在细胞内的存在及其数量都是容易监测的。本发明的氨基酸序列变异体可以通过该变异的预先确定的性质来表征,所述的预先确定的性质也就是将它们与天然发生的形式区分开的特征,所述的天然发生的形式例如纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶序列的等位基因的或者种间的变异。一方面,本发明的变异体表现出与25天然发生的类似物相同性质的生物活性。可选择地,可以选择具有改变的特征的变异体。一方面,尽管引入氨基酸序列变化的位点或区域是预先决定的,但突变本身并不需要预先决定。例如,为了优化在一个给定位点出现的突变所带来的性能,可以在目标密码子或者区域进行随机诱变,并筛选被表达的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶变异体,以寻找所需活30性的优化组合。在具有已知序列的DNA的预先决定的位点产生取代突变的技术是己熟知的,正如在此讨论的,例如,M13引物诱变和PCR诱变。突变体的筛选可以通过应用例如葡聚糖水解分析来进行。在可供选择的方面,氨基酸取代可以是单个残基;插入可以是大约1到20个氨基酸的水平,尽管可以插入相当大的片段。缺失的范围可以是大约1到大约20、30、40、50、60、70个残基或者更多。为了35得到具有优化性质的最终衍生物,替代、缺失、插入或者它们的任何组合都可以被应用。一般地,这些变化是在为数不多的氨基酸上进行,以使分子的改变最小化。然而,在某些情况下,可以容忍更大的改变。本发明提供了纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其中多肽骨架的结构、二级结构或三级结构,例如,a螺旋或P折叠结构,已被修饰。一方面,电荷或疏水性已被修饰。一方面,侧链基团已被5修饰。通过选择较不保守的取代来产生功能或免疫性的实质变化。例如,可以进行这样的取代,它们将更加显著地影响发生变化的区域的多肽骨架的结构,例如a螺旋或(3折叠结构;分子的电荷或疏水位点,其可以是活性位点;或側链。本发明提供在本发明的多肽中的取代,其中(a)亲水残基,例如丝氨酰或苏氨酰,被疏水残基例如亮氨酰、异亮氨酰、苯基丙氨酰、缬氨酰或丙氨酰取代,或者相10反;(b)半胱氨酸或脯氨酸被任何别的残基取代,或者相反;(C)具有正电性侧链的残基,例如赖氨酰、精氨酰或组氨酰被带负电的残基例如谷氨酰或天冬氨酰取代,或者相反;或者(d)具有大体积侧链的基团,例如苯丙氨酸,被不具侧链的氨基酸例如甘氨酸取代,或者相反。所述变异体可以表现出相同性质的生物学活性(即,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖15苷酶活性),尽管变异体可经选择来按需改变纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的特征。—方面,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或j3-葡糖苷酶包括表位(epitopes)或者纯化标记、信号序列或其它的融合序歹ij,等。在一方面,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露20聚糖酶和/或p-葡糖苷酶可以与随机的肽融合,形成融合多肽。"融合"或者"可操作地连接"在此是指随机肽和纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶连接在一起,其连接方式最小化了对纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的结构的稳定性的破坏,例如,其仍保持纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡25糖苷酶活性。所述的融合多肽(或者编码该融合多肽的融合多核苷酸)还可以包含进一歩的成分,包括在多个环(multipleloops)处的多个肽。—方面,所述肽和编码它们的核酸被随机化,或者是被完全随机化的,或者是在它们的随机化中有偏向,例如,在核苷酸/残基的总的频率或者每个位置处的频率方面有偏向。"随机化"是指每一核酸和肽分别由实质上随机的核苷酸和氨30基酸组成。一方面,产生所述肽的所述核酸可以化学合成,从而可以在任何位置整合进任何核苷酸。因此,当所述核酸被表达而形成肽时,任何氨基酸残基可以整合进任何位置。可以设计合成过程来产生随机化的核酸,从而允许在所述核酸的长度范围内形成所有的或大多数的可能组合,由此形成随机核酸文库。该文库可以提供足量的结构多样的随机化表达产物群体,可以获得概率上充分的细胞响35应范围,从而可以提供一种或多种表现出所需响应的细胞。因此,本发明提供了一个足够大的相互作用文库,这样,其成员中的至少一个将具有使其对于一些分子、蛋白或者其他因子具有亲和性的结构。—方面,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶是多结构域的酶,其包括信号肽、糖类结合模块(module)、纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶催化结构5域、连接子(linker)和/或另一个催化结构域。本发明提供了产生可以编码生物学活性杂合多肽(例如,杂合纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酵)的嵌合多肽的方法和序列。在一个方面,原始的多核苷酸(例如,本发明的示例性核酸)编码生物学活性的多肽。一方面,本发明的方法通过利用细胞内过程产生了新的杂合多10肽,所述的细胞内过程可整合原始多核苷酸序列,这样,得到的杂合多核苷酸编码证明具有源自但不同于原始生物学活性多肽的活性的多肽(例如,本发明的纤维素酶或抗体)。例如,原始的多核苷酸可以编码来自或发现于不同微生物的特定酶(例如,纤维素酶)。由来自一个生物体或变异体的第一多核苷酸编码的酶可以,例如,在特殊的环境条件下,例如,高盐条件下,有效地发挥功能。来自不同生15物体或变异体的第二多核苷酸编码的酶可在不同的环境条件下,如超高温条件下,有效地发挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸编码的酶可以显示了原始多核苷酸编码的两种酶的特性。因此,本发明的杂合多核苷酸编码的酶可在第一和第二多核苷酸编码的酶所共有的环境条件下,例如高盐和极端温度下,有效地发挥功能。20—方面,由本发明的方法得到的杂合多肽可显示出在原始酶中不具有的特殊酶活性。例如,在编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多核苷酸重组和/或进行还原性重配后,从得到的由杂合多核苷酸编码的杂合多肽中可筛选出由各个原始酶获得的特异非纤维素酶例如非内切葡聚糖酶、非纤维二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶活性,例如,水25解酶、肽酶、磷酸化酶等活性。一方面,杂合多肽被筛选以确定那些可区分杂合多肽和原始亲本多肽的化学功能性,如杂合多肽发挥作用的温度、pH或盐浓度。—方面,本发明涉及一种用于产生具有生物活性的杂合多肽以及筛选具有更高活性的多肽的方法,通过1)以可操纵的连接导入至少第一多聚核苷酸和以可操纵的连接导入至少第二30多聚核苷酸到合适的宿主细胞,所述的至少第一多聚核苷酸和第二多聚核苷酸共有具有部分的序列同源性的至少一个区域;2)在促进序列再组织的条件下培养宿主细胞,得到可操纵连接的杂合多核苷酸;3)表达由所述杂合多核苷酸编码的杂合多肽;354)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽;和5)分离编码该杂合多肽的多核苷酸。分离和发现纤维素酶本发明提供了分离和发现纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶以及编码它们的核酸的方法。多核苷酸或酶可以分离5自个体生物体("分离物")、己经生长在成分确定的培养基中的生物体收集物("富集培养物"),或者未经培养的生物体("环境样品")。生物体可以通过例如体内生物淘选进行分离(参见下面的讨论)。应用不依赖于培养物的方法从环境样品获得编码新的生物活性的多核苷酸是最优选的,因为这样便可接触到具有生物多样性的原始来源。多核苷酸或酶也可以分离自许多生物体的任何一种,例如细菌。除10了全细胞之外,多核苷酸或酶也可以分离自来源于这些生物体例如细菌的培养物的粗酶制剂。"环境文库"可以从环境样品中获得,其代表天然发生的生物体的基因组集合,这些"环境文库"可以用克隆载体完成,所述克隆载体可以在适合的原核宿主中扩增繁殖。因为被克隆的DNA起初是直接从环境样品中提取的,所以所述15文库并不限于可以在纯培养物中生长的小部分原核生物。另外,存在于这些样品中的来自环境的DNA的标准化使其可以更加公正地代表存在于原始样品的所有物种的DNA。这可以大大增加从所述样品的次要组成中发现令人感兴趣的基因的效率,所述次要组成与优势种相比,其所占的量可能小几个数量级。—方面,从一个或者多个未经培养的微生物中获得的基因文库被筛选以发20现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以基因表达文库的形式捕获。一方面,编码令人感兴趣的活性的多核苷酸从这样的文库中分离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长,产生潜在的具有新的或者增强的活性的生物分子。可利用基于FACS和基于非光学(例如,磁性)的仪器进行体内生物淘选。25—方面,用载体构建复杂基因文库,所述载体含有稳定转录的RNA的元件。例如,含有这样的序列将用于增强RNA的稳定性,从而增加它们在细胞中的半衰期,所述序列形成二级结构,例如发夹结构,其被设计来位于转录的RNA区的侧翼。用于生物淘选过程中的探针分子由用报告分子标记的寡核苷酸组成,所述报告分子仅在探针与靶分子结合后发荧光。使用几种转化技术的一种,这些探针被引入文30库中的重组细胞。所述探针分子结合到转录的靶mRNA,得到DNA/RNA异源双链体分子。探针与靶标结合将产生荧光信号,该信号在筛选过程期间用FACS仪器检测和分选。—方面,可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中,DNA的一部分被扩增、消化——通常是通过限制性酶——以剪切所需的序列,所需的35序列被连接进接受载体中,并被扩增。在亚克隆的每个步骤中,该部分被检测感兴趣的活性,以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被纯化,例如在连接入载体之前通过凝胶电泳,或在含有接受载体的细胞和不含有接受载体的细胞被置于选择性培养基中时,所述培养基含有例如抗生素,其可杀死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中是为人所熟知的(Sambrook等人,MolecularCloning:ALaboratory5Mannual,第二版,ColdSpringHarborLaboratoryPress(1989))。在另一个方面,本发明的酶是亚克隆。这种亚克隆与亲代克隆的差别在于,例如,长度、突变、标志物(tag)或标记(label)。可以发现、分离或制备所述多核苷酸的微生物包括原核微生物如真细菌和古细菌,低等真核微生物如真菌、一些藻和原生动物。多核苷酸可以是发现于、10分离自或制备于环境样品,在这种情况下,核酸被回收而不需培养某一种生物体,或者是从一种或者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的酶的多核苷酸可以被应用。本发明的酶可以超过100'C的温度有作用,例如在地表温泉和深海的热火山口发现的那些,或者在低于O'C的15温度有作用,例如在北极水域中发现的那些,在饱和的盐环境下有作用,例如在死海中发现的那些,在pH值在0附近起作用,例如在煤层沉积物和地热富硫矿泉中发现的那些,或者在pH值超过11下起作用,例如在污水污泥中发现的那些。一方面,本发明的酶在很宽的温度和pH范围内表现出高活性。如上所述的选择和分离的多核苷酸被导入进合适的宿主细胞中。合适的宿20主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸一方面已经在包括有合适的控制序列的载体中。宿主细胞可以是高等的真核细胞,如哺乳动物细胞,或低等真核细胞,如酵母细胞,或一方面,宿主细胞可以是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔来实现。25示例性的宿主包括细菌细胞,如大肠杆菌、链霉菌、鼠伤寒沙门氏菌;真菌细胞,如酵母;昆虫细胞如果蝇S2和草地夜蛾Sy9;动物细胞如CHO、COS或者黑色素瘤细胞;腺病毒和植物细胞;参见上面的讨论。通过本文的教导,选择适合的宿主被认为是在本领域技术人员已知的范围内。各种哺乳动物细胞培养系统可以用于表达重组蛋白;哺乳动物表达系统的30例子包括猴肾纤维原细胞的COS-7细胞系,其在"SV40-transformedsimiancellss叩portthereplicationofearlySV40mutants"(Gluzman,1981)中有说明,禾卩其它的可以表达相容性载体的细胞系,例如,C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子,以及任何必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,35以及5'侧翼的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。另一方面,本发明的核酸、多肽和方法可以用于生物化学途径中,或用于产生编码来自一个或者多个操纵子或者基因簇或者其中的部分的生物化学途径的新的多核苷酸。例如,细菌和很多真核生物具有用于调控基因的协作机制,所述基因的产物涉及相关的过程。基因成簇排列在单一染色体上,在结构上称为"基5因簇",它们在单个调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因(通过基因簇编码的生物化学途径的一个例子是聚酮化合物(polyketides))。—方面,基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,10尤其是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于外源DNA引入具有非常大的容量的载体特别适合用于这样的基因簇的情况,在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,15如来自混合的微生物样品的基因簇是理想的。一个发明是使用被称作"fos-质粒"的克隆载体,或者细菌人工染色体(BAC)载体。它们是源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的"环境DNA文库"形式存在的大的基因组片段。用于本发明的另一类型的载体是黏粒载体。黏粒载体最初是设计用来克隆20和扩增基因组DNA的大片段。应用黏粒载体的克隆在Sambrook等,MolecularCloning:ALaboratoryMannual,第二版,ColdSpringHarborLaboratoryPress(1989)中有详细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者更多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对25新的杂合基因簇进行筛选,以寻找在起初的基因簇没有发现的活性。筛选各种酶活性的方法对于本领域技术人员是已知的,并在本说明书中通篇进行讨论,参见,例如下面的实施例l、2和3。当分离本发明的多肽和多核苷酸时,可以使用这样的方法。—方面,本发明提供了发现和分离纤维素酶如内切葡聚糖酶、纤维二糖水30解酶、甘露聚糖酶和/或P-葡糖苷酶的方法,或者使用全细胞方法修饰这些酶的活性的化合物(参见下面的讨论)。可以从基因组DNA文库筛选编码纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的推定克隆。筛选方法和"在线"监控设备35在实践本发明的方法时,多种仪器和方法可以与本发明的多肽和核酸一起使用,例如,用来筛选多肽的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,用来筛选作为纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的潜在调节剂的化合物,诸如激活剂或抑制剂,还可以用来筛选与本发明的多肽结合的抗体、与本发明的核酸杂交的核酸,用来筛选表达本发明的多肽的细胞,等等。除了下面详细描述的用于筛选样5品的阵列形式以外,也可使用别的形式来实施本发明的方法。这样的形式包括,例如质谱仪、色谱仪,例如,高通量HPLC和其它形式的液相色谱,和更小的形式,如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明的方法,见,例如美国专利申请20020001809;20050272044。10毛潘,厍^本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或监测组合物(例如,小分子、抗体、核酸等)的文库,以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列,如GIGAMATRIXTM,戴弗萨公司(DiversaCorporation),SanDiego,CA;和描述在例如美国专利申请1520020080350Al;WO0231203A;WO0244336A中的阵列,提供了容纳和筛选样品的可供选择的装置。在一个方面,毛细管阵列包括多个毛细管,它们形成具有相互邻接的毛细管的阵列,其中所述的每个毛细管含有至少一个壁,其限定了一个用以保留样品的内腔。这个内腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状,只要其壁能够形成内腔以保留液体或样品。毛细管阵列的毛细管20可相互靠近联合在一起形成一个面状的构造。毛细管可通过融合(例如,当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。此外,毛细管阵列可以包括在阵列中相邻毛细管之间放置的间质材料(interstitialmaterial),从而形成含有多个穿通孔(through-holes)的固体平面装置。毛细管阵列可由任何数量的毛细管形成,例如,100至4,000,000个毛细管。25进一步,具有大约IOO,OOO或更多个单个毛细管的毛细管阵列可形成标准大小和形状的Microtiter⑧板,其适合于标准的实验室设备。通过毛细作用或使用细针的微注射,人工或自动地将腔充满。随后可以从毛细管中移出感兴趣的样品以进行进一步的分析或定性。例如,安置细针样的探头,使其与选择的毛细管能够液体连通,从而可以向腔内加入材料或移走材料。30在单区筛选分析(single-potscreeningassay)中,分析组分在插入到毛细管阵列中之前被混合在一起,产生目的溶液。当至少一部分阵列被浸入目标溶液中时,通过毛细作用充满内腔。在每个毛细管中的化学或生物学反应和/或活性被监测,以发现可检测事件。所述的可检测事件常常被称为"命中事件(hit)",其常常可以通过光学检测与产生"非命中事件(non-hit)"的毛细管区分开来。因此,35毛细管阵列可整体地并行检测"命中事件"。在多区筛选分析(multi-potscreeningassay)中,多肽或核酸,例如,配体可被导入进第一组分中,该组分被导入进毛细管阵列的至少一部分毛细管中。然后将气泡导入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内,其中所述的第二组分与第一组分通过气泡相隔。通过在毛细管阵列的两侧施加静水压挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的5反应或非反应而发生的可检测事件。在结合筛选分析(bindingscreeningassay)中,目标样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中,其中为了使可检测颗粒与内腔结合,毛细管的内腔包被了一种结合材料。然后第一液体可从毛细管中移去,其中结合的可检测颗粒仍保留在毛细管内,可以将第二液体导入进毛细管内。然10后监测毛细管中由颗粒与第二液体的反应或非反应而发生的可检测事件。舰或"生激芯/f"本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如,小分子、抗体、核酸等等)的文库,所述筛选或者监测15是针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例如,在本发明的一方面,一个被监测的参数是纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶基因的转录表达。细胞的一种或多种或所有的转录物可以通过阵列或"生物芯片"上的固定化核酸与包含细胞转录物、或代表细胞转录物的核酸、或与细胞转录物互补的核酸的样品的杂交来测定。20通过在微型芯片上应用核酸"阵列",细胞的一些或所有的转录物可以同时被定量。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新的工程菌株的基因型。"多肽阵列"也可以用于同时定量多种蛋白。本发明可以用任何已知的"阵列"进行实践,所述"阵列"也指"微阵列"或"核酸阵列"或"多肽阵列"或"抗体阵列"或"生物芯片",或者它们的变体。阵列一般是多个"点"25或者"靶元素",每一个靶元素包括确定数量的一种或多种生物分子,例如,固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录物的寡核苷酸。在此使用的术语"阵列"或"微阵列"或"生物芯片"或"芯片"是多个靶元素,每个靶元素包括固定在基材表面的确定区域上的确定量的一种或多种多肽(包括抗体)或核酸,以下进一步详细讨论。30在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地并入,或者引入它们的变体,例如在下列文献中说明的美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,9%;6,022,963;6,013,440;5,%5,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;355,556,752;5,434,049;还参见,例如,WO99/51773:WO99/09217;WO97/46313;WO96/17958;还参见,例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes&Cancer20:399-407;Bowtell(1999)NatureGeneticsSupp.21:25-32。也参见公布的美国专利申请20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;520010008765。抗体和基于抗体的筛选方法术语"抗体"包括来源于(derivedfrom)、出自于(modeledafter)或大体20上编码于(substantiallyencodedby)—个免疫球蛋白基因或多个免疫球蛋白基因的肽或多肽或者其片段,它们能特异地结合于抗原或表位,见例如,FundamentalImmunology,第三版,W.E.Paul,ed.,RavenPress,N.Y.(1993);Wilson(1994)J.Immunol.Methods175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods25:85-97。术语抗体包括结合抗原的部分,即,具有与抗原结合的能力的"抗原结25合位点"(例如,片段、子序列、互补决定区(CDRs)),包括(i)Fab片段,由VL、VH、CL和CHI结构域组成的单价片段;(ii)F(ab')2片段,包括在铰链区由二硫键连接的两个Fab片段的二价片段;(iii)由VH和CHI结构域组成的Fd片段;(iv)由抗体单臂(asinglearm)的VL和VH结构域组成的Fv片段;(v)由VH结构域组成的dAb片段(Ward等,(1989)Nature341:544-546),和(vi)30分离出的互补决定区(CDR)。单链抗体也被包括在术语"抗体"中。本发明提供了本发明的酶(例如肽)的片段,包括本发明的多肽的免疫原性片段(例如,子序列)。本发明提供了含有本发明的多肽或肽和佐剂或载体以及类似物的组合物。所述抗体可以在免疫沉淀、染色、免疫亲合柱等等中被应用。如果需要的35话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。可供选择的,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法设计细胞表型。免疫、产生和分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的,并且在科学和专利文献中有描述,参见,如,Coligan,CURRENT5PROTOCOLSINIMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASICANDCLINICALIMMUNOLOGY(第7版)LangeMedicalPublications,LosAltos,CA("Stites");Goding,MONOCLONALANTIBODIES:PRINCIPLESANDPRACTICE(第2版)AcademicPress,NewYork,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,ALABORATORYMANUAL,ColdSpring10HarborPublications,NewYork。除了使用动物的传统的体内方法外,抗体也可以在体外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997)TrendsBiotechnol.15:62-70;Katz(1997)A皿u.Rev.Biophys.Biomol.Struct.26:27-45。本发明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、15100或150个连续氨基酸的片段,也可用来产生与所述多肽或片段特异结合的抗体。得到的抗体可应用于免疫亲和层析程序,以分离或纯化多肽,或确定多肽是否存在于生物样品中。在这样的程序中,蛋白制备物,如提取物,或生物样品与能够同本发明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段特异结合的抗体接触。20在免疫亲和程序中,所述抗体附着于固体支持物上,如珠子或者其它的柱基质。在所述抗体可以特异地与本发明的多肽或其片段结合的条件下,将所述蛋白制备物与所述抗体接触。当通过清洗去除非特异结合的蛋白后,特异性结合的多肽被洗脱下来。在生物样品中蛋白结合所述抗体的能力可以通过使用本领域技术人员所25熟悉的各种方法来确定。例如,结合可以通过用例如荧光试剂、酶标记或者放射性同位素的可检测标记物来标记所述抗体来确定。可选择地,所述抗体与所述样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及Western印迹。针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、3075、100或150个连续氨基酸的片段产生的多克隆抗体可通过直接将多肽注射进动物中或通过将多肽给予动物,例如非人动物而获得。这样获得的抗体可与多肽本身结合。以这种方式,甚至仅编码多肽的一个片段的序列也可用来产生可与整个天然多肽结合的抗体。这种抗体然后可用来从表达所述多肽的细胞中分离多肽。为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何技35术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975)、三体瘤技术、人B-细胞杂交瘤技术(Kozbor等人,ImmunologyToday4:72,1983)和EBV-杂交瘤技术(Cole等人,1985,inMonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,pp.77-96)。用于产生单链抗体的技术(美国专利4,946,778)可被改动,以使之适于产生本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或5150个连续氨基酸的片段的单链抗体。可选择地是,转基因小鼠可用来表达这些多肽或其片段的人源化抗体。产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的抗体可用于筛选来自其它生物体和样品的类似多肽。在这些技术中,来自生物体的多肽与抗体接触,检测可与抗体特异10结合的多肽。上述的任何程序可用来检测抗体的结合。一种这样的筛选分析描述在"MethodsforMeasuringCellulaseActivities",M"/iocfa&£"2>wo/ogy,Vol160,87-116页中。试剂盒15本发明提供了试剂盒,其包括组合物,例如本发明的核酸、表达序列盒、载体、细胞、转基因种子或者植物或者植物的一部分、多肽(如纤维素酶)和/或者抗体。所述试剂盒也可以包括如在此所述的用于教导本发明的方法学以及工业、医疗和饮食应用的指导性材料。20全细胞工程和测定代谢参数本发明的方法提供了细胞的全细胞进化或全细胞工程,其通过修饰细胞的遗传组成开发出具有新的表型,例如,新的或修饰的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的新细胞株。参见美国专利申请20040033975。25可以通过向细胞中加入本发明的核酸,例如本发明的酶的编码序列而修饰遗传组成。见,例如,WO022卯32;WO0196551。为了探测新的表型,在"实时"或者"在线"的时间范围内监测被修饰的细胞的至少一种代谢参数。一发面,多个细胞,如培养细胞物被"实时"或者"在线"监测。一方面,"实时"或者"在线"监测多个代谢参数。代谢参数可以应用30本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶进行监测。代谢流分析(MFA)是以已知的生物化学框架为基础。以质量守恒定律和细胞内代谢的假稳态假说(PSSH)为基础,构建线性独立代谢矩阵。在实践本发明的方法时,建立代谢网络,包括35所有途径底物、产物和中间代谢物的特性,使途径代谢物互变的所有化学反应的特性,途径反应的化学计量学,催化反应的所有酶的特性,酶反应动力学,途径组分之间的调控性相互作用;如变构效应相互作用,酶-酶相互作用等,酶或者酶的任何其它超大分子组织在细胞内的区室化,以及,任何浓度梯度的代谢物、酶或者效应分子的存在,或者它们运动的扩散障碍。5—旦针对给定的细胞株建立了代谢网络,如果在线代谢数据可用,那么可以通过矩阵概念引入数学表达来评估细胞内的代谢流。代谢表型依赖于细胞内整个代谢网络的变化。代谢表型依赖于途径利用对环境条件、遗传调控、发育状态和基因型等等作出的变化。在本发明方法的一个方面,当计算了在线MFA之后,通过研究所述的途径利用来分析细胞的动力学行为、它们的表型和其它性质。例10如,在酵母发酵中,如果葡萄糖供应增加,氧气减少,呼吸途径的利用将会降低和/或者停止,而发酵途径的利用将占优势。在所述的途径分析之后,细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态朝着所需的方向进行,本发明的方法可以有助于确定如何操纵发酵。在实践本发明的方法时,MFA的结果也可以与转录物组15(transcriptome)和蛋白质组(proteome)的数据比较,设计实验和方案用于代谢工程或者基因重排等等。在实践本发明的方法时,可以产生和检测到任何经修饰改变的或者新的表型,包括在细胞中新的或者改进的特征。可以监测代谢或者生长的任何方面。20蕭w腦録赫教在本发明的一方面,工程化的表型包括增加或者降低mRNA转录物(如,纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信息)的表达或者在细胞中产生新的(如,纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)转录物。这一增加或者减少的表达可以通过测25定本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的存在,或者通过纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性分析来跟踪。mRNA转录物或者信息也可以通过本领域已知的任何方法来检测或者定量,包括,例如,Northern印迹、定量扩增反应、阵列杂交以及类似的方法。定量扩增反应包括,如,定量PCR,包括,如,定量反转录30聚合酶链式反应,或者RT-PCR;定量实时RT-PCR,或者"实时动力学RT-PCR"(参见,如,Kreuzer(2001)Br.J.Haematol.114:313-318;Xia(2001)Transplantation72:907-914)。在本发明的一方面,工程化的表型是通过敲除同源基因的表达产生。可以敲除所述基因的编码序列或者一个或多个转录控制元件,如启动子或者增强子。35这样,转录物的表达可以完全去除或者仅被降低。在本发明的一方面,所述工程化的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现,负调控元件包括以顺式或者反式起作用的转录调控元件。细胞的一种或者多种或者所有的转录物可以通过阵列上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。層微、靡錢廳表这在本发明的一方面,工程化的表型包括增加或者降低多肽(如纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶)的表达或者在细胞内产生新的多肽。这一增加或者减少的表达可以通过确定存在的纤维素酶如10内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的量或者通过纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性分析来跟踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸,所述方法包括,如,核磁共振(NMR)、分光光度测定法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色15谱,各种免疫学方法,如,免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIAs)、酶联免疫吸附分析(ELISAs)、免疫荧光分析,凝胶电泳(如,SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热分解质谱、傅立叶变换红外光谱测定、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联-电喷质谱,已经类似的方法。应用这些方法或者它们的变体也可以筛选新的生物活性,在美国专利6,057,103中有20说明。而且,正如以下详细讨论的,可以应用蛋白阵列测定细胞的一种或者多种或者所有的多肽。工业、能源、药物和其它应用本发明的多肽(例如,具有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、25甘露聚糖酶和/或(3-葡糖苷酶活性的多肽)可以催化纤维素的降解。本发明的酶是高度选择性的催化剂。本发明提供了利用本发明的酶的工业方法,例如,在制药或营养(饮食)补充剂行业、能源工业(例如,制造"清洁"生物燃料)中,在食品和饲料工业中,例如在制造食品和词料产品以及食品和饲料添加剂的方法中利用本发明的酶。一方面,本发明提供了在医药工业中利用本发明的酶的工艺,30例如,以制备药物或饮食助剂或补充物,或食物补充物和添加剂。此外,本发明提供了在生物乙醇——包括"清洁"燃料——的生产中使用本发明的酶的方法。本发明的酶可以催化具有强烈的立体选择性、区域选择性和化学选择性的反应。本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶可被工程化,以在各种溶剂中发挥功能,可在极端pH(例如,高pH和35低pH)和极端温度(例如,高温和低温)、极端的盐度水平(例如,高盐度和低盐度)下工作,并可催化同与其天然的生理底物结构上不相关的化合物的反应。生激激處靴赠措生娜備主产本发明提供了生物质(biomass)(例如,木质纤维素材料)转化成燃料(例如生物醇)和化学品的酶和方法。因此,本发明的组合物和方法提供了使用基于5石油的产品的有效的和持续的可替代选择。本发明提供了表达本发明的酶的生物体,可用于参与涉及天然生物质转化的化学循环。一方面,用于转化的酶和方法可用在酶整体(enzymeensembles)中,用于将纤维素和半纤维素聚合物解聚成可代谢的碳部分。如上所讨论,本发明提供了发现和实施最有效的酶的方法,使这些重要的新的"生物质转化"和可选择的能源工艺可行。10—方面,本发明的多肽,例如,具有纤维素酶活性,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的蛋白质,被用在将木质纤维素生物质转化成醇例如乙醇的方法中。本发明还提供了由含有木质纤维素生物质的组合物生产醇("生物醇")的方法。木质纤维素生物质材料可以从农作物获得,以食品或饲料生产的副产物获得,或以木质纤维素废品获得,例如植物残余和废15纸。用本发明的多肽处理的合适的植物残余的例子包括茎、叶、壳、皮、穗轴(cob)和类似物,以及木材、木屑、木质纸浆和锯屑。适合用本发明的多肽处理的纸废品的例子包括废弃的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸等等,以及报纸、杂志、纸板和基于纸的包装材料。—方面,本发明的酶和方法可与从生物质制备醇的更"传统的"方法一起20使用,例如,这样的方法,包括通过使干燥过的木质纤维素材料在反应器中与由强酸和金属盐的稀释溶液组成的催化剂接触而水解木质纤维素材料;这可以降低纤维素水解的活化能或温度,以获得更高的糖产率;参见,例如,美国专利6,660,506;6,423,145。使用本发明的酶的另一种示例性方法包括通过使木质素纤维素材料在一25定的温度和压力下在含水介质中经受第一阶段的水解步骤而水解含有半纤维素、纤维素和木素的木质纤维素材料,所述温度和压力被选择来实现半纤维素的初步解聚而不将纤维素大部分解聚成葡萄糖。该步骤得到一种浆,其中含水液相含有从半纤维素解聚得到的溶解的单糖,而固相含有纤维素和木素。第二阶段水解步骤可以包括使得至少大部分纤维素被解聚的条件,该步骤产生含有溶解的/可溶的30纤维素解聚产物的含水液相。参见,例如,美国专利5,536,325。本发明的酶可以在该示例性方法中的任何阶段加入。使用本发明的酶的另一种示例性方法包括通过一个或多个用大约0.4%至2%的强酸进行稀释酸水解的阶段来处理含木质纤维素的生物质材料;以及通过碱性去木质作用来处理酸水解的生物质材料的未反应的固体木质纤维素成分,以35产生可生物降解的热塑塑料和衍生产品的前体。参见,例如,美国专利6,409,841。本发明的酶可以在该示例性方法中的任何阶段加入。使用本发明的酶的另一种示例性方法包括在预水解反应器中预水解木质纤维素材料;向该固体木质纤维素材料加入酸性液体,制备混合物;将该混合物加热至反应温度;维持反应足够的时间,以将木质纤维素材料分馏成含有至少大约20%的来自木质纤维素材料的木质素的溶解部分以及含有纤维素的固体部分;5当处于或接近其中固体部分中的纤维素变得更易于进行酶促降解的反应温度时,从固体部分除去溶解部分;以及回收溶解部分。参见,例如,美国专利5,705,369。本发明的酶可以在该示例性方法中的任何阶段加入。本发明提供了制备基于液体烃的发动机燃料组合物(例如,用于火花点火发动机)的方法,所述液体烃掺混有利用本发明的酶或方法制备的燃料级醇。一10方面,利用本发明的酶生产的燃料包括,例如液体煤气-醇混合物或液体天然气-醇混合物。一方面,共溶剂是生物质衍生的2-甲基四氢呋喃(MTHF)。参见,例如,美国专利6,712,866。用于木质纤维素的酶促降解的方法,例如,用于从木质纤维素材料生产乙醇的方法,还可以包括生物质材料的超声处理;参见,例如,美国专利6,333,181。15使用本发明的酶制备含有乙醇的生物燃料的另一个示例性方法包括预处理含有木质纤维素给料的原材料,所述木质纤维素给料至少包括半纤维素和纤维素。一方面,所述原材料包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗或成分或废物或食物或饲料生产副产物。原材料("给料")在破坏植物纤维结构的条件下发生反应,以实现半纤维素和纤维素的至少部分水解。20破坏性条件可以包括,例如使原材料在pH0.5至2.5经受18(TC至27(TC的平均温度大约5秒至60分钟的时间;或,在pH0.5至2.5经受22(TC至270'C的温度大约5秒至120秒的时间,或同等条件。这增加了的给料的可利用性,该给料有待本发明的酶例如纤维素酶消化。美国专利6,090,595。用于木质纤维素材料的纤维素酶水解的示例性条件包括在大约30'C至4825'C之间的温度下和/或大约4.0和6.0之间的pH下反应。其它示例性条件包括在大约30'C至6(TC之间的温度下和/或大约4.0和8.0之间的pH。动激銜柳會激或麟添雄除了提供用于人类使用的饮食助剂或添加剂、或食物补充物和添加剂,本30发明还提供了使用本发明的多肽和/或本发明的抗体处理动物饲料和食物和食物或饲料添加剂的方法,所述多肽例如具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的蛋白质。本发明提供了含有本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶和/或本发明的抗体的动物饲料、食物和添加剂。动物可以是任何农场动物或任何动物。35本发明的动物饲料添加剂可以是颗粒状的酶产品,其可以很容易与饲料成分混合。可选择地是,本发明的饲料添加剂可形成一种预混合组分。本发明的颗粒状酶产品可被包被或不包被。酶颗粒的粒径可与饲料和预混合组分的大小相容。这为将酶整合进饲料中提供了一种安全和方便的手段。可选择地,本发明的动物饲料添加剂可以是一种稳定过的液体组合物。它可以是水基或油基的浆液。见,例如美国专利6,245,546。5在动物饲料或食物的改善(或者修饰)中,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可以在体外(通过改变饲料或食物的成分)或在体内加工食物或饲料。本发明的多肽可被加入动物饲料或食物组合物中。—方面,本发明的酶与另一种酶一起加入,例如,P-半乳糖苷酶、过氧化10氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-p-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、卩-漆酶、内切-(3-1,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯15酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。这些酶消化产物更容易被动物消化。因此,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶有助于饲料或食物的能量的有效利用,或者通过降解纤维素,有助于食物或饲料的消化性。20在另一个方面,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶通过直接在转基因饲料作物(如,例如转基因植物、种子以及类似物)中表达酶而被供给,所述转基因作物如谷粒、谷类、玉米、大豆、油菜籽、羽扇豆以及类似物。如在上面所讨论的,本发明提供了转基因的植物、植物部分和植物细胞,其含有编码本发明多肽的核酸序列。在一个方面,核酸被25表达,这样,本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶以可回收的量被产生。纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶可从任何植物或植物部分中被回收。可选择的是,含有重组多肽的植物或植物部分可用来改善食物或饲料的性质,例如,改善营养价值、可口性等等。30—方面,本发明的酶输送基质是以分散的多个微粒、小丸或颗粒形式存在。"颗粒"的含义是被压扁或压紧的微粒,如通过制丸、挤压或类似的压制过程从基质中去除水分。微粒的这种压縮或压紧也可促进微粒的微粒内粘聚性。例如,通过在制丸机中将基于谷物的基质制丸来制备颗粒。由此制备的丸被研磨或粉碎成适合用作动物饲料辅料的颗粒大小。由于基质本身被批准用于动物饲料,所以35在动物饲料中它可用作输送酶的稀释剂。—方面,包含在本发明酶输送基质和方法中的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶是热稳定的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,如在本文中所述,以便在升高的温度和/或蒸汽可能用来制备丸化的酶输送基质的生产期间抵抗纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的灭活。在消化含有5本发明的酶输送基质的饲料的过程中,水相消化液将引起活性酶的释放。其它类型的热稳定酶和热稳定的营养添加剂也可被掺入输送基质中,其可在任何类型的含水条件下释放。—方面,出于许多不同的目的,可以对本发明的酶基质微粒应用包衣,如为了向动物词料中添加调味剂或营养补充剂,为了在胃内条件下延缓动物饲料补10充剂和酶的释放,以及类似的目的。一方面,可应用包衣来实现功能性的目的,例如在需要延缓酶从基质微粒中释放或控制酶将被释放的条件时。包衣材料的组分可以是这样的,其可选择性地被其敏感的试剂(如热、酸或碱、酶或其它化学物质)分解。可选择地是,对不同的这样的分解剂敏感的两种或更多种包衣可被连续地应用于基质微粒。15本发明也涉及制备酶释放基质的方法。根据本发明,该过程包括提供基于谷粒的基材的多个分散颗粒,其颗粒大小适合用作酶释放基质,其中所述的颗粒包括由本发明的氨基酸序列编码的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶。一方面,该方法包括将酶释放基质的颗粒压制或压縮成微粒,在一个方面是通过制丸来完成。防霉剂和粘聚剂,当被应用时,可在20任何适合的时间被加入,并且在一方面,与基于谷粒的基材以所需的比例在将基于谷粒的基材制丸之前混合。制丸机进料中的含水量在一个方面是上面所示的与最终产物含水量对应的范围,在一个方面是大约14-15%。一方面,水分以酶的含水制剂形式加入至给料中,使该给料达到此含水量。在制丸机中的温度在一个方面用蒸汽达到大约82°C。制丸机可在任何条件下进行操作,对给料进行足够的操25作以提供小丸。对于从含酶组合物中去除水分来说,制丸方法本身是一个很经济的方法。本发明的组合物和方法可以结合施用益生素进行实践,益生素是高分子量糖类,如低聚果糖(FOS);低聚半乳糖(GOS)、GRAS(通常认为安全的(GenerallyRecognizedAsSafe))材料。这些益生素可以通过一些益生乳酸菌(LAB)进行代谢。30它们对于大多数小肠微生物是不可消化的。必潘會激微工本发明提供了包含本发明的酶的食物和饲料以及使用本发明的酶处理食物和饲料的方法。本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚35糖酶和/或p-葡糖苷酶在食品加工工业中具有大量的应用。本发明提供了水解含纤维素的组合物的方法,所述含纤维素的组合物包括植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物细胞、或任何植物或植物部分、或任何食物或饲料、废品等等。例如,本发明提供了含有纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的饲料或食物,例如,在饲料、液体诸如饮料(如果汁5或啤酒)、面包、面团或面包产品、或饮品(如啤酒)或饮料前体(如,麦芽汁)中。本发明的食物处理工艺还可以包括使用其它酶的任何组合,其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂10酶、磷脂酶、脂氧化酶、p-漆酶、内切-p-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、15果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。—方面,本发明提供了用于水解液体(液化的)和颗粒淀粉的酶和方法。这样的淀粉可以来源于任何来源,例如甜菜、甘蔗、马铃薯、玉米、小麦、蜀黍、高梁、黑麦或bulgher。本发明适合于在液化(例如,为了生产生物乙醇)中有用的任何植物淀粉来源如谷物淀粉来源,包括己知可产生适合于液化的淀粉的任何20其它谷物或蔬菜来源。本发明的方法包括液化来自任何天然材料的淀粉(例如,制造生物乙醇),所述的天然材料例如稻、发芽水稻、玉米、大麦、蜀黍、小麦、高梁、马铃薯、甜菜、甘蔗和甘薯。液化过程可以充分地水解淀粉以产生糖浆。液化的温度范围可以是已知在液化淀粉中有效的任何液化温度。例如,淀粉的温度可以在大约8(TC到大约115'C之间,在大约100'C到大约110'C之间,以及大约25105。C到大约108'C之间。除了用于(或用于生产)食物和饲料包括酒精饮料,使用本发明的酶和方法生产的生物乙醇可用作燃料或用于燃料中(例如,汽车燃料),例如,如下所讨论。废欽必潘30本发明提供了用在废物处理中的酶。本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶可用于各种废物处理或相关的工业应用中,例如用在与生物质转化产生燃料相关的废物处理中。例如,在一个方面,本发明提供了使用本发明的纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的固体和/或液体废物消化方法。该法可以包括减少基本上未35处理的固体废物的量和体积。固体废物可在酶溶液(包括本发明的纤维素酶,如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)存在的情况下用酶促消化过程在控制的温度下进行处理。这种反应不需要添加微生物形成明显的细菌发酵。固体废物被转变为液化的废物和任何残余的固体废物。得到的液化废物可与所述的任何残余的固化废物分离。见,例如美国专利5,709,796。—方面,本发明的组合物和方法被用于去除、预防或减少例如动物废物池5如养猪农场的动物废物池中、其它动物废物管理系统中或任何工业或食品加工应用中的气味。用于生物质(例如,木质纤维素材料)转化成燃料(例如,生物乙醇)的酶和方法可以结合城市固体废物材料的处理/再循环,所述城市固体废物材料包括从城市直接获得的废物或者先前填埋随后回收的城市固体废物,或者下水道淤泥,10例如含有明显量的纤维素材料的下水道淤泥块形式的下水道淤泥。由于下水道淤泥块通常不含有明显量的可再循环材料(铝、玻璃、塑料等等),它们可以用浓硫酸直接处理(以降低废物的纤维素成分的重金属含量),并在乙醇生产系统中进行处理。参见,美国专利6,267,309;5,975,439。使用本发明的酶从废物材料回收有机物质和无机物质的另一种示例性方15法包括通过使之经受热和压来对固体有机物质进行灭菌并使之软化。该示例性方法可以通过首先搅拌废物材料,然后使之经受热和压而进行,热和压对其进行灭菌并使其中包含的有机物质软化。一方面,在压力下加热之后,压力可以从多孔室突然释放,以向外推动经软化的有机物质通过容器的孔,从而从固体无机物质分离出有机物质。然后,经软化的无菌有机物质在发酵室中进行发酵,例如使用20本发明的酶,例如,以形成发酵浆。该发酵桨可通过离心、蒸馏柱和/或厌氧蒸煮器进行进一步加工,以回收燃料如乙醇和甲烷、以及动物饲料补充物。参见,例如美国专利6,251,643。本发明的酶还可以用于降低工业废物或从畜牧业设备产生的废物以及类似废物的气味的工艺,例如预处理。例如,本发明的酶可用于处理废物存储设备25中的动物废物,以增强大量的有机物质的有效降解,同时气味减少。该方法还可以包括接种利用硫化物的细菌和消化有机物的细菌以及裂解酶(除了本发明的酶之外)。参见,例如美国专利5,958,758。本发明的酶还可用在移动系统(mobilesystem)例如间歇式反应器(batchtypereactors)中,用于含水有害废物的生物再补救,例如,如在美国专利5,833,85730中所描述的。间歇式反应器可以是具有循环能力的大的容器,其中通过将营养物输入反应器中将细菌(例如,表达本发明的酶的细菌)维持在有效的状态。当流出物可以被输入反应器中或者反应器被建成为废水处理系统时,可以采用这样的系统。本发明的酶还可以用在这样的处理系统中,该处理系统在小的或临时的遥远场所使用,例如,移动式的、大容量、高效的多功能废水处理系统。35本发明的废物处理方法可以包括使用其它酶的任何组合,其它酶例如其它纤维素酶如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-p-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、内切-(3-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、肌醇六磷酸酶、阿拉伯聚5糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。10去薪微合激本发明提供了含有本发明的一种或多种多肽(例如,具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)的去垢剂组合物,以及制备和使用这些组合物的方法。本发明包括了制备和使用去垢剂组合物的所有方法,见,例如美国专利6,413,928;6,399,561;6,365,561;6,380,147。去垢15剂组合物可以是一个部分和两个部分的含水组合物、不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压縮片剂、凝胶和/或糊剂和浆液的形式。本发明还提供了能够使用这些去垢剂组合物快速除去总食物类污垢、或食物残留的膜以及其它少量食物组分的方法。本发明的酶通过淀粉多糖的催化水解可以促进淀粉染污的去除。本发明的酶可用于洗碟用去垢剂、纺织品洗涤去垢剂中。20实际的活性酶含量依赖于制造去垢剂组合物的方法,这不是很严格的,只要去垢剂溶液具有所需的酶活性。在一个方面,存在于最终溶液中的葡糖苷酶的量的范围为每克去垢剂组合物大约0.001mg至0.5mg。选择用于本发明的方法和产品中的特定酶依赖于最终应用的条件,包括产品的物理形式、应用时的pH、应用时的温度和要被降解或改变的污垢类型。对于指定的任何一组应用条件,可以25选择酶以提供最佳的活性和稳定性。在一个方面,本发明的多肽在大约4至大约12的pH范围内,大约20。C至大约95。C的温度范围内是有活性的。本发明的去垢剂可以包括阳离子表面活性剂、半极性的非离子表面活性剂或两性离子表面活性剂;或其混合物。本发明的酶(例如,具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘30露聚糖酶和/或P-葡糖苷酶活性的酶)可被制成粉末状和液体的去垢剂,具有的pH在4.0和12.0之间,按重量计为大约0.01%至大约5%(优选0.1%至0.5%)的水平。这些去垢剂组合物也可以包括其它的酶如己知的蛋白水解酶、纤维素酶、脂酶或糖苷内切酶,以及助洗剂和稳定剂。向传统的洗涤组合物中添加本发明的酶不会造成任何特殊的应用限制。换句话说,适合去垢剂的任何温度和pH也适用于35本发明的组合物,只要pH在上述范围内,而温度在所描述的酶变性温度之下。另夕卜,本发明的多肽可用于不需要去垢剂的洗涤组合物中,再单独应用或与助洗剂和稳定剂联合应用。本发明提供了清洁组合物,包括清洁硬表面的去垢剂组合物、清洁织物的去垢剂组合物、洗碟用组合物、口腔清洁组合物、假牙清洁组合物和隐形眼镜清洁液。5在一个方面,本发明提供了清洗物体的方法,包括将物体与本发明的多肽在可充分清洗的条件下接触。本发明的多肽可以作为去垢剂添加剂而被加入。本发明的去垢剂组合物,例如可被配制为含有本发明多肽的手工或机器洗衣的去垢剂组合物。适合用于预处理污染织物的洗衣添加剂可含有本发明的多肽。织物柔软剂组合物可含有本发明的多肽。可选择的是,本发明的多肽可被制成去垢剂组10合物,用于通常的家庭硬表面清洗工作中。在可选择的方面,本发明的去垢剂添加剂和去垢剂组合物可以包含一种或多种其它的酶,例如蛋白水解酶、脂酶、角质酶、另一种葡糖苷酵、糖酶、另一种纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如,乳糖酶和/或过氧化物酶。所选择的本发明的酶的特性可与所选择的去垢剂相容(即,最佳pH,与其它的酶或非酶15成分相容,等),并且,酶是以有效量存在。在一个方面,本发明的酶用来从织物中去掉有恶臭的材料。在实施本发明中可使用的各种去垢剂组合物和制备它们的方法描述在,例如美国专利6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。本发明的去垢剂和相关的方法还可以包括使用其它酶的任何组合,其它酶20例如色氨酸酶或酪氨酸脱羧酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、(3-漆酶、内切-P-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果25胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。必鄉激微鄉30本发明提供了使用本发明的一种或多种多肽处理织物和纺织品的方法,所述多肽例如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶。本发明的多ftk可以在任何织物处理方法中使用,这些方法在本
技术领域
是已知的,例如参见美国专利6,077,316。例如,一方面,织物的手感和外观通过包括用本发明的酶在溶液中接触织物的方法得到改进。一方面,用溶35液在压力下处理织物。—方面,本发明的酶在织物的编织过程中或之后应用,或在脱浆阶段应用,或在一个或多个其它的织物处理歩骤中应用。在织物的编织过程中,线被施加相当大的机械张力。在机械织布机上进行编织之前,经纱通常用上浆淀粉或淀粉衍生物涂覆,以便提高它们的拉伸强度并防止断裂。本发明的酶可用于去除这些上浆淀粉或淀粉衍生物。在纺织品已经编织好之后,织物可以继续进行到脱浆阶段。5随后可以是一个或多个额外的织物加工步骤。脱浆是从纺织品中去除"浆料"的作用过程。在编织之后和进一步加工织物之前,必须去除浆料涂层,以便确保均匀且耐水的效果。本发明提供了一种脱浆方法,包括通过本发明酶的作用对"浆料"进行酶促水解。本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚10糖酶和/或卩-葡糖苷酶活性的酶)可作为去污剂添加剂对织物进行脱浆,所述织物包括含棉织物,所述酶可以例如在含水组合物中。本发明提供了在靛类染色的粗斜纹棉布织物和衣服上产生砂洗外观的方法。对于服装制造,织物可以被剪裁并缝纫为衣料或服装,这些在后来被整理。尤其是,对于粗斜纹布牛仔裤的制造,已经开发了不同的酶促加工方法。粗斜纹棉布服装的整理(finishing)通常从酶脱15浆步骤开始,在该步骤中服装经受淀粉分解酶的作用,以便给织物提供柔软性,使得棉织物更易于进行后面的酶促整理步骤。本发明提供了使用本发明的酶加工(finishing)粗斜纹棉布服装(例如"生物-石磨方法(bio-stoningprocess)")、酶促脱浆并给织物提供柔软性的方法。本发明提供了在脱浆和/或整理过程中快速软化粗斜纹棉布服装的方法。20本发明还提供了含有本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)的消毒剂。本发明的织物或纺织品处理方法还可以包括使用其它酶的任何组合,其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基25转移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、内切-P-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转30谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。一銜或一欲炎必湮本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)可以在纸或纸浆处理或纸脱墨中使用。例如,一35方面,本发明提供了使用本发明的酶的纸处理方法。一方面,本发明的酶可以被用来修饰纸中的淀粉,从而将其转化为液化形式。另一方面,在化学和酶促脱墨过程中处理再循环影印纸的纸成分。一方面,本发明的酶可以与其它酶一起使用,包括其它纤维素酶(包括其它内切葡聚糖酶、纤维二糖水解酶和/或(3-葡糖苷酶)。木材、纸、纸产品或纸浆可以通过如下三种方法来处理1)在存在本发明的酶的情况下进行离解;2)用脱墨化学品和本发明的酶进行离解,和/或3)在用本发明5的酶浸透后进行离解。与仅仅用纤维素酶处理的纸相比,用本发明的酶处理的循环纸可以具有更高的亮度,这是由于去除了墨粉颗粒。尽管本发明不受任何特定机理的限制,但本发明的酶的效果可能是由于其在纸浆悬浮物中作为表面活性剂的结果。本发明提供了使用本发明的一种或多种多肽处理纸和纸浆的方法。本发明10的多肽可以在任何纸处理或纸浆处理方法中使用,这些方法在本
技术领域
是熟知的,例如参见美国专利6,241,849;6,066,233;5,582,681。例如,一方面,本发明提供了对含有染料的印刷过的纸进行脱墨和脱色的方法,包括使印刷过的纸变成浆状物,以得到纸浆,并在存在本发明的酶(也可以加入其它酶)的情况下从纸浆中移去油墨。另一方面,本发明提供了增加纸浆的打浆度的方法,所述纸浆例15如由再生纤维制成的纸浆,这可以通过将含有本发明的酶的酶促混合物(也可以含有其它酶,例如果胶酶)加入到纸浆中,在可引起反应的条件下进行处理,以产生酶促处理的纸浆。酶促处理的纸浆的打浆度相对于再生纤维纸浆的初始打浆度有所增加,光度没有损失。本发明的纸、木材或纸浆处理或再循环工艺还可以包括使用其它酶的任何20组合,其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、内切-p-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、25xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。30微総.术质纤绝素柳舰湮本发明也提供了用于处理木质纤维素纤维的方法,其中所述纤维用本发明的多肽(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性的酶)处理,所述多肽以足以改进纤维特性的量被使用。本发明的酶也可以在由淀粉强化废纸和纸板生产或再循环木质纤维素材料如纸浆、纸和纸35板的过程中被使用,尤其是在再次制浆或再循环发生在pH高于7的场合,以及本发明的酶可以通过降解强化淀粉来促进废品离解的场合。本发明的酶可以在由淀粉涂覆的印刷过的纸制备造纸纸桨的过程中有用。该过程可以按照例如WO95/14807中的描述进行。一个示例性的方法包括分解纸以产生纸浆,在所述分解之前、分解过程中或分解之后用淀粉降解酶进行处理,并在分解和酶处理之后从纸浆中分离出油墨颗粒。也参见美国专利6,309,871和本文引述的其它美国专利。5因此,本发明包括用于再循环纸浆的酶促脱墨的方法,其中多肽以足以有效地对纤维表面进行脱墨的量使用。游造微辭本发明提供了包含本发明的酶的啤酒酿造(例如发酵)方法,所述酶例如10具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶。在一个示例性的方法中,含淀粉的原料被离解,并被加工以形成麦芽。本发明的酶可以在发酵过程中的任意阶段使用。例如,本发明的酶可以在大麦麦芽的加工中使用。啤酒酿造的主要原料是大麦麦芽。这可以是一个三阶段过程。首先,大麦谷物被浸渍以增加水含量,例如增加到大约40%左右。第二,所述谷15物可以在15-25'C的温度孵育3到6天以便发芽,此时酶合成在赤霉素的控制下被刺激。酶水平在此期间显著上升。一方面,本发明的酶在该过程的这个(或任意其它)阶段加入。酶的作用导致可发酵的还原糖有所增加。这可以被表示为糖化力(diastaticpower),DP,在12'C糖化力可以在5天内从大约80上升到190。本发明的酶可以在任何啤酒生产方法中使用,例如美国专利5,762,991;205,536,650;5,405,624;5,021,246;4,788,066中所描述的。潜》/7来房邀7"形成欽游主产流沐游流动本发明也包括使用本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶)的方法,其中所述方法通过除25去在生产作业过程中形成的粘性的、含淀粉的、破坏性流体来增加来自地下形成物(subterraneanformation)的生产流体(productionfluids)的流动;这些流体可以在地下形成物中找到,所述地下形成物包围着整个井孔。因此,本发明的方法导致生产液体可以从井孔流出。本发明的方法还着眼于破坏性流体的问题,该破坏性流体将来自形成物的生产流体的流动降低到预期流速之下。一方面,本发明30通过将含水流体和本发明的多肽混合在一起配制成酶处理物(使用本发明的酶);将酶处理物泵入到井孔内的期望位置;允许酶处理物降解粘性、含淀粉的、破坏性流体,从而将流体从地下形成物中移出至井筒的表面;以及其中酶处理物可以有效地攻击含淀粉流体中的ct葡糖苷键。本发明的地下形成物酶处理方法还可以包括使用其它酶的任何组合,其它35酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-(3-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、(3-漆酶、内切-(3-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋5白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。1#^组合#^7汰貪#充欽本发明还提供了含有本发明的纤维素酶(例如,具有纤维素酶、内切葡聚10糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶)的药物组合物和饮食补充物(例如,膳食助剂)。纤维素酶活性包括内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性。一方面,药物组合物和饮食补充物(例如,饮食助剂)被配制用于经口摄取,例如,可以提高具有高纤维素或木质纤维素成分的食物和饲料的可消化性。15牙周治疗化合物可以包括本发明的酶,例如,如在美国专利6,776,979所述。用于治疗或预防酸性肠道综合症的组合物和方法可以包括本发明的酶,例如,如美国专利6,468,964所述。另一方面,创伤敷料、植入物和类似物包括抗微生物(如,抗生素-作用)酶,包括本发明的酶(包括,例如,本发明的示例性序列)。本发明的酶也可用于20藻酸盐敷料、抗菌防护敷料、烧伤敷料、压迫绷带、诊断工具、凝胶敷料、透水性敷料(hydro-selectivedressings)、吸水(泡沫)敷料(hydrocellular(foam)dressings)、水胶敷料、I.V敷料、开刀防护巾(incisedrapes)、低附着敷料(lowadherentdressings)、气味吸收敷料、石膏绷带(pastebandages)、术后敷料、伤疤控制、皮肤护理、透明膜敷料和/或伤口闭合。本发明的酶可用于伤口清洁、创面床准备,25以治疗压迫性溃疡、腿部溃疡、烧伤、糖尿病足溃疡、伤疤、IV固定、手术创伤和微创。本发明的酶可用于无菌酶促清创组合物如软膏中。在各个方面,纤维素酶被配制成片剂、凝胶、药丸、植入物、液体、喷剂、粉末、食物、饲料球或配制成胶囊化的制剂。30生激欽激鄉在其它方面,本发明的纤维素酶(例如,具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的酶)可用于生物防御(例如,破坏含有木质纤维素材料的孢子或细菌)。在生物防御应用中使用本发明的纤维素酶提供了显著的益处,因为它们可以被非常迅速地开发,对抗任何目前未知的或未来的生35物战剂。此外,本发明的纤维素酶可用于受侵袭环境的净化。一方面,本发明提供了含有具有纤维素酶活性的多肽的生物防御剂或生物解毒剂,其中所述多肽包括本发明的序列(包括,例如,本发明的示例性序列),或者由本发明的核酸(包括,例如,本发明的示例性序列)编码的多肽,其中,任选地,所述多肽具有活性,包括切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性。5参考资料列表1.S咖brook^J.andRu幼ell,D.W.2001.MolecularCloning:ALaboratoryManual.ThirdEdition.CoWSpringHaiborLaboratoryPress,NewYork,2.Benhar,I.Biotechnologicalapplicationsofphageandcelldisplay.BiotechnologyAdvances19,1-13.篇.3.Coutinho,P,NLandHends賊B.Caiboliydrate-AcUveEnzymesserveratURL:http:〃afinb.cnrs-mra.fi/~cazy/CAZY/iiKiex.html.l卿,4.Felix;C.R.andLG.LjungdahL1993.Thecellulosome:the欲ocelMarorga加neofClostridium.Annu.Rov.M咖bioI47:791-819.:79l-819.5.Gray,A.,T.H.Ridhatds041CKrete,J.M.Short,F.Bartoefc^KnowlesIL,LKan>Sw助sonP.E,,andRdwrtsonD.B.2001.Rapidevolutionof.reveisibladenaturationandelevatedmeltingtenqwratureinamicrobialhkoalkanedehalogenase.AdvancedSynthesisandCatalysis343:607-617.6.Guttm旭,A.,F.T.Chen,ItA.Evangelist^andN.Cooke.1996,High-resolutioncapillarygelelectrophoresisofreducingoligosaccharideslabeledwith1-aminopyrene-3,6,8-trisulfonate.Anal.Biochem233:234-242.7.Haijunpaa,V.,A.Telema^A.Koivu^L.Ruohonen,T.T,Teeri,O.Te咖an,andT.Drafc幼be塔1996.Cdlo-oligosaccharidehydrolysisbyceUobiohydrolaseIIfromTridiodermareesei.Associationandrateconstantsderivedfiimananalysisofprogresscurves.Eur.JBiochem240:584-591.8.Himmel,M.E.,M.F.Ruth^andC.E.Wyman.1999.Cellukseforcommodityproductsfro迈cellulosicbiomass.Curr.Opin.Biotechnol10:358-364.9.Kerr,R.A.1998.GEOLOGY:TheNextOilCrisisLoomsLarge—andPerhapsClose.Science28i:1128.10.Kerr,R.A.2000.OILOUTLOOK:USGSOptimisticonWorldOilProspects.Science289:237.11.'King,R.W.,K.D.Lustig,P.T.SUikenberg,T.J.McGany,andM.W.Kirschner.1997.Expressioncloninginthetesttube.Science277:973-974.12.Kuritz,T.l卿.Aneasycolorimetricas幼yforscreeningandqualitativea站essmentofdeiodinationandddialogenationbybacterialcultures,Lett.ApplMicrobiol28:445-447.13.L加dberg,KL.S.,P.L,Krete>G.S.ProvostandJ.M.Short.1993.Theuseofselectioninrecoveryoftransgenictargetsformutationanalysis.Mutat.Res.301:99-105.14.MacBCenzic,L.F.,<3.Sukenbacher,C.Divne,T.A.Jtones,汰F.Woldike,M.Schu!eHS.G.Withers,andG.J.Davi饥l卿.CrystalstrucUireofthefamily7endoglucanaseI(Cel7B)fiotnH咖icolainsolensat2.5Aresolutionandidentificationofthecatalyticnucleophilebytrappingofthecovalentglycosyl-enzymeintermediate.Bioch咖J335:409掘.15.Richardson,T.H.,X.Tan,G.Frey,W.Callen,M.Cabell,D.LamJ.Maoomber,J.M.Short,D,E.Robertson^andC.Miller.2002.A加vel,highperformanceenzymeforstarchliquefactiottDiscoveryandoptimizationofalowpH,thermostablealpha-amylase.JBiolChan277:26501-26507.16.SakoAJ"D.Irwin,D.B.Wil幼n,andP.A.Kaiplus.1997.Structureandmechanismofendo/exocellulaseE4fromThermomonosporafGsca.Nat.Struct.Biol4:810-818.17.Short,J.M.,J,M.Fernandez,J.A.Sorge,andW.D.H咖.1988.LambdaZAP:abacteriophagelambdaexpressionvectorwilhinvivoexcisionproperties.NucleicAcidsRes,16:7583-7600.18.Snustad,D.P.,J.P.Hun^perger,B.MChereskinandJ.Messing.1988.MaizegiutaminesynthetasecDNAs:isolatio"ydirectgeneticselectioninBK:heiichiacoli.Genetics120:1111-1123.19.Varrot,A,,S,Hastrup,MSclmlein,andG.J.Davies.1999.Crystalstructureofthecatalyticcoredomainofthefemily6ceUobiohydrolaseH,CeWAfromHumicolainsol咖,at1.92Aresolution.BiochemJf337:297-304.20.Yano,T.,S.Ouc,and凡Kagamiyama.1998.Directedevolutionofanaspartateaminotransferasewithnewsubstratespecificities.Proc.Natl.Acad.SciU.S.A95:5511-5515.21.Zveriov,V.V.,G.A.Velikodvorskaya,andW,H.Schwann2002.Anowlydescribedceilulosomalcellobiohydrolase,CelO,fiomClostridiumtbennoceUum:inv加tigationoftheexo-modeofhydrolysis,andbindingcapacitytocrystaUinecellulose.Microbiology148:247-255.下面的实施例被提供来进行举例说明,但并不限制所要求保护的发明。实施例5实施例l:GIGAMATRIXTM筛选—方面,本发明的方法使用Diversa公司专有的GIGAMATRIxTM平台;参见PCT专利公布WO01/38583;美国专利申请20050046833;20020080350;美国专利6,918,738;设计专利D480,814。例如,一方面,GIGAMATRIX被用于确定多肽是否具有纤维素酶活性以及是否在本发明范围内的方法中、或者鉴定和分10离具有纤维素酶活性的多肽的方法中。GIGAMATRIX平台可以包括基于100,000孔的微板的超高通量筛选,该微板具有常规96孔板的尺寸。在本实施例中,基于先前通过CBH示出的活性,使用2种底物,进行GIGAMATRIX筛选。测试了甲基-伞形酮酰纤维二糖苷(MUC)和甲基伞形酮酰乳糖苷(MUL)。筛选了噬粒形式的不同克隆,因为底15物扩散入细胞,并且荧光被认为更容易检测到。使用缺乏p-半乳糖苷酶的宿主株,以降低对乳糖苷底物的活性。乳糖苷底物产生更少的命中(hit),并且被认为比纤维素底物更具有专一性。此外,乳糖苷底物产生更少的P-葡糖苷酶命中。为了测试在筛选中使用这些底物的可行性,选择14个文库,基于下列事实进行筛选这些文库通过先前的筛选程序产生了内切葡聚糖酶命中。在受筛选的文库中,存在20来自11个筛选文库的共50个初步命中。二次筛选由在琼脂板上植入克隆以及然后将菌落挑选入含有培养基和MUL的384孔板中组成。针对MUL有活性的克隆从非活性克隆的背景中区分开来。然后,各个单独的克隆过夜生长,测量荧光,并挑选最具活性的命中物用于测序。对命中物的所有的基因组克隆插入物进行测序。总的来说,命中来自几个25不同的糖基水解酶家族,包括家族l、2、5、6、10和16。发现了几个其它命中,其中开放的阅读框不同源于任何已知的糖基水解酶家族。此外,所述命中物的一些编码GTP环化水解酶基因。表1.GIGAMATRIX侖中的概述<table>tableseeoriginaldocumentpage170</column></row><table><table>tableseeoriginaldocumentpage171</column></row><table><table>tableseeoriginaldocumentpage172</column></row><table>縮写CBM—糖结合模块(carbohydratebindingmodule)表征酶和底物活性在GIGAMATRIXTM筛选中发现的39个命中物(参见上面的表1)首先针5对纤维六糖进行筛选,确定对纤维素寡聚体的作用模式。基因组克隆被定义为具有完整的DNA插入物的片段,所述DNA插入潜在地含有多个开放阅读框。例如,在上面的表1,一个这样的基因组克隆含有标号为酶22和22a的两个开放阅读框,其中所述阅读框分别具有如SEQIDNO:37和SEQIDNO:35所描述的序列。另一个这样的基因组克隆含有三个开放阅读框,其被标号为酶27、27a和27b。亚克10隆衍生自基因组克隆并可以仅含有单个开放阅读框。基因组克隆在含有抗生素的TB培养基中过夜生长,裂解细胞,通过离心澄清裂解液。用合适的诱导剂诱导,使亚克隆生长至OD600=0.5,然后在裂解细胞并澄清裂解液之前生长额外的3小时。基因组克隆通常比亚克隆具有更低的活性,却是在大范围的克隆中评价活性的更方便的途径。使用薄层色谱(TLC)进行终点反应的初步研究,通常进行24h。还用磷酸溶胀纤维素(PASC)测试酶,磷酸溶胀纤维素是晶体纤维素,其通过酸处理来溶胀而更加不定形。许多从环境文库克隆出的纤维素酶对PASC是具有活性的,但是释放纤维5二糖以及纤维三糖和/或葡萄糖。来自GIGAMATRIX发现尝试的基因组克隆也针对PASC以及针对纤维素底物例如纤维六糖(Seikagaku,Japan)进行了测试。薄层色谱试验表明,一些基因组克隆能够水解纤维六糖,如在图6和7中所阐述。在这些克隆中,许多克隆能够产生葡萄糖作为最终产物,这与这样的事实一致它们与包括P-葡糖苷酶在内的糖基水解家族1具有序列同一性。几种酶产生纤维10二糖和/或更大的片段,但是产物模式的确切性质还不能通过TLC试验认识清楚,所以,开发了毛细管电泳(CE)方法。实施例2:毛细管电泳在一些方面,毛细管电泳(CE)被用在筛选酶活性的测定中,例如,CE15被用于确定多肽是否具有纤维素酶活性以及是否在本发明的范围内的方法中,或者用于鉴定和分离具有纤维素酶活性的多肽的方法中。毛细管电泳(CE)提供了快速的运行时间和更高的测定灵敏度的优势。CE法使用l-氨基芘-3,6,8-三磺酸盐(APTS)作为荧光团,并针对与糖类和糖寡聚体的应用进行优化(Guttman(1996)High-resolutioncapillarygelelectrophoresisofreducingoligosaccharideslabeledwith20l-amino[rho]yrene-3,6,8-trisulfonate.Anal.Biochem233:234-242)。对纤维六糖显示出活性的酶经受对磷酸溶胀纤维素以及纤维六糖的测试。基因被亚克隆、表达和使用镍-螯合柱进行纯化。酶与底物温育lh,并使用10cm或48cm毛细管来分析产物。对于10cm或48cm的毛细管,纤维六糖分别在第2和9分钟洗脱出。在存在低含量的糖的情况下或者如果在混合物中存在污染,48cm毛细管能够更好地25分离产物。实施CE法,对来自GIGAMATRIX发现的酶进行研究,所述酶在TLC检测下对纤维六糖显示出良好的活性。酶22/22a(参见上面的表1)显示出对PASC的良好性能(数据总结于图8图中),主要释放纤维二糖。此外,酶22/22a能够从AVICELMicrocrystallineCellulose(MCC)(FMCCorporation,Philadelphia,PA)释放纤维二糖(数据概述于图309图中)。序列分析显示,酶22和酶21具有~92%的同一性,并且属于糖基水解酶家族5。家族5主要含有内切葡聚糖酶,但存在纤维二糖水解酶的例子。来自热纤梭菌的CdO已经基于从无定形和晶形纤维素仅释放纤维二糖的活性被表征为纤维二糖水解酶(Zverlov(2002)Anewlydescribedcellulosomalcellobiohydrolase,CeIO,fromClostridiumthermocellum:investigationoftheexo-modeofhydrolysis,and35bindingcapacitytocrystallinecellulose.Microbiology148:247-255)。当与来自解纤维素嗜酸耐热菌UcWo/ZjmnMSce〃i//o/_y"cws)的内切葡聚糖酶比较时,所有这三种酶都具有紧邻底物结合位点的插入。该插入能够形成环,其包住底物结合位点,从而将该酶从内切葡聚糖酶转变为纤维二糖水解酶。当这些酶针对纤维六糖进行测试时,它们主要产生纤维二糖,伴随更少量的纤维三糖。这些结果通过如下事实加以解释纤维二糖水解酶具有从纤维六糖底物产生纤维5二糖和纤维三糖的能力(Harju叩aa(1996)Cello-oligosaccharidehydrolysisbycellobiohydrolaseIIfrom7WcAocfer附areese/.Associationandrateconstantsderivedfromananalysisofprogresscurves.Eur.JBiochem240:584-591)。实施例3:基于发现的序列10本发明提供了使用本发明的序列鉴定和分离纤维素酶例如纤维二糖水解酶的方法。在一个示例性的方法中,与含有纤维二糖水解酶的三个糖基水解酶家族的保守区同源的引物被用来筛选衍生自真菌样品的多核苷酸文库或DNA。针对家族48保守区设计引物,并筛选96个文库,得到l个确认的命中。此外,针对家族6和家族7设计引物。用这些引物筛选真菌文库,对于家族6得到1个命中,15对于家族7得到56个命中。家族7的命中之一被选择来进行研究,以提取出全长序列。全长序列被成功获得,并显示出与微紫青霉素(i^"/a7/!'柳ya"/W"eZ/謂)的外切纤维二糖水解酶I具有73%的同一性。实施例4:具有纤维二糖水解酶活性的酶的遗传工程化20本实施例描述了本发明的示例性酶的遗传工程化。该酶可用于生物质向燃料和化学品的转化中,以及用于制造基于石油的产品的有效和可持续的可替代选择。该酶可以在生物体(例如,微生物,如细菌)中表达,以参与涉及天然生物质转化的化学循环。一方面,该酶以"酶装配体"使用,用于将纤维素和半纤维素聚合物有效解聚成可代谢的碳部分。如上所讨论,本发明提供了发现和执行最25有效的酶的方法,以使这些重要的新的"生物质转化"和可选择的能源工业工艺可行。使用宏基因组发现法(metagenomicdiscovery)和定向进化的非随机法(称为DIRECTEVOLUTION,如在例如美国专利6,939,689所述,其包括基因位点饱和诱变(GSSM)(如上所讨论,也参见美国专利6,171,820和6,579,258)以及可调基30因再装配(TunableGeneReassembly(TGR)(参见,例如美国专利6,537,776)技术。该工作集中于发现和优化用于将纤维素还原成葡萄糖的重要的酶成分——纤维二糖水解酶。使用Diversa公司的GIGAMATRIX高通量表达筛选平台(如上讨论),执行酶发现筛选,以使用甲基伞形酮酰纤维二糖苷作为底物来鉴定纤维二糖水解35酶。总共筛选100个复杂的(复合)环境文库,得到25个验证的纤维二糖水解酶命中,其主要来自糖基水解酶家族5和10。这些命中的活性通过AVICELMicrocrystallineCellulose(MCC)(FMCCorporation,Philadelphia,PA)力Q以表征。基于其性能特征,一个酶,SEQIDNO:162(由例如SEQIDNO:161编码)被选择作为候选,用于利用基于位点饱和诱变(GSSM)技术进行优化。然而,在进行GSSM进化之前,从SEQIDNO:162除去信号序列(氨基酸1到30),并且加入起始甲硫5氨酸。该无信号的序列——下文称为"野生型"并由SEQIDNO:164(由例如SEQIDNO:163编码)表示,是亲本序列,对其使用GSSM技术进行优化。如上所讨论,GSSM技术可以快速将蛋白质中的所有氨基酸以顺序方式突变成其它19种氨基酸。使用基于纤维的测定来筛选突变体,并鉴定出表现出单个氨基酸变化的潜在的上游突变型(upmutants)。这些上游突变型被组合成新的文库,该新文库代表10着上游突变型的组合。筛选该文库,结果鉴定出几种候选酶,可以用于商业化。研究总结GIGAMATRIX筛选GIGAMATRIX(GMx)筛选平台是基于100,000孔的微板的超高通量方15法,该微板具有常规96孔板的尺寸(详见阶段II应用)。该筛选采用荧光底物。基于先前示出的纤维素酶活性,使用2种底物,进行GMx筛选。甲基-伞形酮酰纤维二糖苷(MUC)用作筛选底物。此外,试卤灵-(3-吡喃葡萄糖苷也被包括在该筛选内,以消除对两种底物都具有活性并假定为P-葡糖苷酶的克隆。筛选扩增的噬菌体或噬粒形式的目标文库。使用两种缺乏P-半乳糖苷酶基20因的宿主株(CEH6&GAL631),以降低对所述底物的内源性宿主活性。选择100个文库,基于如下事实进行筛选这些文库通过以前的筛选程序产生了纤维素酶命中。在筛选的文库中,在筛选文库的69个文库中总共有355个初步命中。二次筛选由在琼脂板上铺入克隆以及然后将菌落挑选入含有培养基和甲基伞形酮酰纤维二糖苷(MUC)的384孔板中组成,称为"breakout"。图10以显25示典型的GIGAMATRIX(GMx)breakout的图形数据加以举例说明。为得到该数据,针对MUC有活性的克隆(即,能够水解甲基伞形酮酰纤维二糖苷)从非活性克隆的背景中区分开来。然后,各个单独的克隆过夜生长,测量荧光,并挑选最具活性的命中物用于测序。在图10中,X轴表示样品名称;Y轴是相对荧光单位。阳性"命中物"被铺入琼脂板上,然后将菌落挑选入含有LB+抗生素和50nM30MUC的384孔板中,并过夜生长。表2.GIGAMATRIX(GMx)命中概述酶编开放阅读框SEOIDNO:克隆家族特征40SEQIDNO:104(由例如SEQIDNO:103编码)家族5(纤维素酶)41SEQIDNO:108(由例如SEQIDNO:107编码)家族5(纤维素酶)42SEQIDNO:112(由例如SEQIDNO:lll编码)H7SEQIDNO:60(由例如SEQIDNO:59编码)43SEQIDNO:82(由例如SEQIDNO:81编码)44SEQIDNO:78(由例如SEQIDNO:77编码)45SEQIDNO:68(由例如SEQIDNO:67编码)45aSEQIDNO:70(由例如SEQIDNO:69编码)46SEQIDNO:74(由例如SEQIDNO:73编码)47SEQIDNO:110(由例如SEQIDNO:109编码)48SEQIDNO:106(由例如SEQIDNO:106编码)49SEQIDNO:66(由例如SEQIDNO:65编码)50SEQIDNO:72(由例如SEQIDNO:71编码)51SEQIDNO:80(由例如SEQIDNO:79编码)H8SEQIDNO:62(由例如SEQIDNO:61编码)H8aSEQIDNO:64(由例如SEQIDNO:63编码)52SEQIDNO:76(由例如SEQIDNO:75编码)53SEQIDNO:160(由例如SEQIDNO:159编码)54SEQIDNO:88(由例如SEQIDNO:87编码)55SEQIDNO:148(由例如SEQIDNO:147编码)56SEQIDNO:90(由例如SEQIDNO:89编码)57SEQIDNO:152(由例如SEQIDNO:151编码)58SEQIDNO:150(由例如SEQIDNO:149编码)59SEQIDNO:154(由例如SEQIDNO:153编码)H6SEQIDNO:158(由例如SEQIDNO:157编码)60SEQIDNO:156(由例如SEQIDNO:155编码)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)-ORF2家族26(甘露聚糖酶)-ORF4家族10(木聚糖酶)家族10(木聚糖酶)家族5(纤维素酶)家族10(木聚糖酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)-ORF1家族5(纤维素酶)-ORF4家族5(纤维素酶)家族10(木聚糖酶)家族5(纤维素酶)家族10(木聚糖酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)家族5(纤维素酶)对来自命中物的所有基因组克隆插入进行测序。如同上面的表1,一些基因组克隆含有一个以上的开放阅读框。例如,一个这样的基因组克隆含有两个开放阅读框,其编号为酶H8和H8a,其中所述阅读框分别具有如SEQIDNO:67和5SEQIDNO:69所描述的序列。总共存在来自筛选文库的17文库个中的25个糖基水解酶命中。总的来说,命中来自几个不同的糖基水解酶家族,包括家族5和10。表2(上面)列出了所述命中和它们的身份。发现了几个其它命中,其中开放阅读框不同源于任何已知的糖基水解酶家族。此外,所述命中的一些编码GTP环化水解酶基因,它们在该系统中已知为假阳性,因为无论底物是否降解它们都产生荧光。总体上,该筛选在鉴定对于MUC具有活性的酶中是成功的。魏对在GIGAMATRIXTM筛选中发现的基因进行测序,并分析数据。使用软5件系统标注开放阅读框(ORF)。ORF被亚克隆入合适的载体,其中导入有编码C末端His标签的DNA。构建物DNA被转化入合适的大肠杆菌宿主中并表达,用于特征研究。针对磷酸溶胀纤维素(PASC)筛选基因产物。PASC是通过酸处理溶胀而更加不定形的晶体纤维素。PASC由AVICELMicrocrystallineCellulose(MCC)制备。培养亚克隆,表达并裂解。裂解液与PASC—起温育,使用二辛可宁10酸(bicinchoninicacid,BCA)还原糖测定法,分析反应产物。选择最具活性的亚克隆,用于大规模培养和纯化。测定这些亚克隆对PASC的比活性。还通过毛细管电泳(CE)分析亚克隆。裂解液与底物温育30小时。用荧光团l-氨基芘-3,6,8-三磺酸盐(APTS)衍生化反应产物。使用48cm毛细管分析产物。在第6分钟洗脱出纤维二糖。图11以图形数据进行举例说明,该数据示出15了通过毛细管电泳(CE)分析得到的所选择的酶针对PASC的活性。样品H9至Hl是单独的克隆。在图11中,许多样品具有代表加工酶(processiveenzymes)的反应产物特征。加工酶被定义为纤维二糖/(葡萄糖+纤维三糖)的比率为IO的酶。两种最具活性的潜在加工酶对PASC分别具有0.35和0.04U/mg的比活性。20毕赤酵母中的真菌CBH〖0563]新发现的家族6&7真菌纤维二糖水解酶的基因被转化入毕赤酵母中,并且在固体琼脂板上铺展转化。对于每一个构建物,选择160个克隆。样品被培养和诱导,上清与PASC在存在p-葡糖苷酶的情况下一起温育。使用葡萄糖-氧化酶测定法分析反应产物。糖基水解酶家族6纤维二糖水解酶在毕赤酵母中成功地异源25表达。内切-外切作用纤维素酶野生型酶,在酶筛选中发现的家族9糖基水解酶,是褐色热单孢菌(7T^mo附o"o^ora/^ca)E4的同源物。E4已经表现出具有内切和外切活性。该30野生型酶的初步测试表明其对于PASC和AVICELMicrocrystallineCellulose(MCC)都具有活性。反应产物的HPLC分析表明主要产物是葡萄糖和纤维二糖。该野生型酶是多结构域蛋白,其包括糖基水解酶家族9催化结构域、家族3纤维素结合结构域以及被认为参与细胞黏附的三个细菌Ig样结构域。测试该野生型酶的三个另外的亚克隆变体,以确定所述结构域对活性的影响。该野生型酶用下列35结构域进行亚克隆l)单独的催化结构域(CD);2)催化和糖结构域(catalyticandcarbohydratedomain,CCD);和3)催化和糖结合结构域加上11个下游氨基酸(CCD+11)。用AVICELMicrocrystallineCellulose(MCC)分析全长蛋白和3个亚克隆变体,反应产物通过BCA还原糖测定法进行分析,数据概述于图12中的图形中。图12阐述的数据是通过野生型酶和截短突变体与AVICELMicrocrystallineCellulose(MCC)在37°C、pH5下温育74小时的BCA而获得。CBH1是阳性对照。5阴性对照是无插入物的宿主。该野生型酶,即全长蛋白(SEQIDNO:164,由例如SEQIDNO:163编码),是最具活性的。该全长蛋白被选择,用于GSSM进化。催化域和糖结合域被进化。GSSM筛选10GSSM技术(如上讨论)被用于快速和顺序地将靶蛋白的催化域和糖结合域的氨基酸突变成19种其它的氨基酸。GSSM筛选的目标是鉴定增加对不溶微晶纤维素的水解程度的突变体。开发出机器人筛选方法,从而促进GSSM筛选法。来自突变构建物的DNA被转化入DH10b宿主细胞。使用自动菌落挑选系统,将各个克隆挑选入含有150pLLB/氨苄青霉素的96孔(浅)板中。在37'C、15400rpm下温育板24小时。从每个孔转移出15的培养物到诱导板中。诱导板的每个孔含有135^LLB/氨苄青霉素,其中含有UmMIPTG。诱导板在37'C、400rpm下温育24小时。离心该板,并丢弃上清。该测定法的自动化部分在此时开始。细胞被机器人裂解和重悬。150nL的裂解缓冲液(125nL水加上25nL含有0.2mg/ml溶菌酶和20单位/mlDNaseI的20BPER)被加入到每一个孔中。从每个孔转移出15^L裂解物到反应板。反应板的每个孔含有185nL反应混合物(1%AVICELMicrocrystallineCellulose(MCC),50mM乙酸钠缓冲液,pH5.0)。反应板在37。C、95%的湿度下温育30小时。在温育后,离心该板,15nL的上清被转移到BCA板。BCA板含有50nL试剂A、50^L试剂B和80nL400mM碳酸盐缓冲液,每孔pH10。用橡胶封条覆盖该板,25并在8(TC下温育30分钟,然后,通过离心冷却,在A560处读取吸光值。鐽至少80个随机突变克隆针对每个氨基酸位点进行筛选。初步GSSMTM筛选数据的例子在图13中加以图示阐述。栏6含有野生型样品,而栏12含有宿主/30载体阴性对照。在与AVICELMicrocrystallineCellulose(MCC)温育30小时后,从野生型样品产生的信号为大约0.53,标准偏差为0.07。阴性对照具有0.29的平均信号。具有比阳性对照的平均值加上2倍标准偏差更高的信号的样品被认为是初步命中。通过该筛选板,大约十个初步命中被选择用于二次确认筛选。初步命中在二次测定法中被再确认。该测定法与初步筛选相同。然而,样35品以四份进行试验。二次GSSM筛选的例子在图14中图示阐述。孔E3-H3、A4-D4、A7-D7中的样品平均而言具有比野生型更高的活性。这12个孔相应于3个命中,因为所述样品以四份进行试验。这些样品是图13中孔E4、G2和H3中所示的初步命中(板2980-AA89BCA板)。从二次筛选得到77个命中。这些样品被测序。所述样品的三十五个具有氨基酸变化,22个具有转座子插入,而其余是野生型或具有缺失。5进一歩分析来自二次筛选的命中。将GSSM上游突变体(upmutants)作图于褐色热单孢菌E4的晶体结构上。基于氨基酸位置、氨基酸变化和折叠改善分数(foldimprovementscore),区分样品的优先次序。从GSSM筛选选出八个上游突变体,它们被选择来进行基因再装配进化,即可调基因再装配(TGR),如上所讨论的,也参见例如美国专利6,537,776。10表2.选择用于点定诱变再装配的上游突变型<table>tableseeoriginaldocumentpage179</column></row><table>上游突变型的掺混使用基因再装配(可调基因再装配(TGR))技术,在上面的表2中示出15的上游突变型被掺混,以鉴定具有最佳活性的候选。活性测定与GSSM筛选中的相同,只是反应物被进一步稀释,以考虑到上游突变型相对于野生型酶具有增加的活性。图15以图形数据进行举例说明,该数据来自混合的或"掺混(blended)"的GSSMTM筛选测定。总之,本发明提供了具有纤维素酶活性的酶,其具有下面的基于SEQID20NO:164(由例如SEQIDNO:163编码)的序列<table>tableseeoriginaldocumentpage180</column></row><table>已经描述了本发明的许多方面。然而,应该理解到可以进行多种变化,而它们并不背离本发明的精神和范围。因此,其它方面在权利要求的范围内。权利要求1.分离的或重组的核酸,其包括(a)与如下序列在至少大约20、30、40、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多个残基的区域内,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的序列同一性的核酸序列SEQIDNO1、SEQIDNO3、SEQIDNO5、SEQIDNO7、SEQIDNO9、SEQIDNO11、SEQIDNO13、SEQIDNO15、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO29、SEQIDNO31、SEQIDNO33、SEQIDNO35、SEQIDNO37、SEQIDNO39、SEQIDNO41、SEQIDNO43、SEQIDNO45、SEQIDNO47、SEQIDNO49、SEQIDNO51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO59、SEQIDNO61、SEQIDNO63、SEQIDNO65、SEQIDNO67、SEQIDNO69、SEQIDNO71、SEQIDNO73、SEQIDNO75、SEQIDNO77、SEQIDNO79、SEQIDNO81、SEQIDNO83、SEQIDNO85、SEQIDNO87、SEQIDNO89、SEQIDNO91、SEQIDNO93、SEQIDNO95、SEQIDNO97、SEQIDNO99、SEQIDNO101、SEQIDNO103、SEQIDNO105、SEQIDNO107、SEQIDNO109、SEQIDNO111、SEQIDNO113、SEQIDNO115、SEQIDNO117、SEQIDNO119、SEQIDNO121、SEQIDNO.123、SEQIDNO125、SEQIDNO127、SEQIDNO129、SEQIDNO131、SEQIDNO133、SEQIDNO135、SEQIDNO137、SEQIDNO139、SEQIDNO141、SEQIDNO143、SEQIDNO145、SEQIDNO147、SEQIDNO149、SEQIDNO151、SEQIDNO153、SEQIDNO155、SEQIDNO157、SEQIDNO159、SEQIDNO161、SEQIDNO163或SEQIDNO165,其中所述核酸编码至少一个具有纤维素酶活性的多肽,并且可选地,所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定;或(b)在严紧条件下与包含下列序列的核酸杂交的核酸序列SEQIDNO1、SEQIDNO3、SEQIDNO5、SEQIDNO7、SEQIDNO9、SEQIDNO11、SEQIDNO13、SEQIDNO15、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO29、SEQIDNO31、SEQIDNO33、SEQIDNO35、SEQIDNO37、SEQIDNO39、SEQIDNO41、SEQIDNO43、SEQIDNO45、SEQIDNO47、SEQIDNO49、SEQIDNO51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO59、SEQIDNO61、SEQIDNO63、SEQIDNO65、SEQIDNO67、SEQIDNO69、SEQIDNO71、SEQIDNO73、SEQIDNO75、SEQIDNO77、SEQIDNO79、SEQIDNO81、SEQIDNO83、SEQIDNO85、SEQIDNO87、SEQIDNO89、SEQIDNO91、SEQIDNO93、SEQIDNO95、SEQIDNO97、SEQIDNO99、SEQIDNO101、SEQIDNO103、SEQIDNO105、SEQIDNO107、SEQIDNO109、SEQIDNO111、SEQIDNO113、SEQIDNO115、SEQIDNO117、SEQIDNO119、SEQIDNO121、SEQIDNO.123、SEQIDNO125、SEQIDNO127、SEQIDNO129、SEQIDNO131、SEQIDNO133、SEQIDNO135、SEQIDNO137、SEQIDNO139、SEQIDNO141、SEQIDNO143、SEQIDNO145、SEQIDNO147、SEQIDNO149、SEQIDNO151、SEQIDNO153、SEQIDNO155、SEQIDNO157、SEQIDNO159、SEQIDNO161、SEQIDNO163或SEQIDNO165,其中所述核酸编码具有纤维素酶活性的多肽,并且所述严紧条件包括洗涤步骤,所述洗涤步骤包括在0.2XSSC中在大约65℃的温度洗涤大约15分钟,并且可选地,所述核酸的长度是至少大约20、30、40、50、60、75、100、150、200、300、400、500、600、700、800、900、1000或更多个残基,或基因的全长或转录物的全长;(c)编码具有如下所示序列的多肽的核酸序列SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、SEQIDNO10、SEQIDNO12、SEQIDNO14、SEQIDNO16、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、SEQIDNO34、SEQIDNO36、SEQIDNO38、SEQIDNO40、SEQIDNO42、SEQIDNO44、SEQIDNO46、SEQIDNO48、SEQIDNO50、SEQIDNO52、SEQIDNO54、SEQIDNO56、SEQIDNO58、SEQIDNO60、SEQIDNO62、SEQIDNO64、SEQIDNO66、SEQIDNO68、SEQIDNO70、SEQIDNO72、SEQIDNO74、SEQIDNO76、SEQIDNO78、SEQIDNO80、SEQIDNO82、SEQIDNO84、SEQIDNO86、SEQIDNO88、SEQIDNO90、SEQIDNO92、SEQIDNO94、SEQIDNO96、SEQIDNO98、SEQIDNO100、SEQIDNO102、SEQIDNO104、SEQIDNO106、SEQIDNO108、SEQIDNO110、SEQIDNO112、SEQIDNO114、SEQIDNO116、SEQIDNO118、SEQIDNO120、SEQIDNO122、SEQIDNO124、SEQIDNO126、SEQIDNO128、SEQIDNO130、SEQIDNO132、SEQIDNO134、SEQIDNO136、SEQIDNO138、SEQIDNO140、SEQIDNO142、SEQIDNO144、SEQIDNO146、SEQIDNO148、SEQIDNO150、SEQIDNO152、SEQIDNO154、SEQIDNO156、SEQIDNO158、SEQIDNO160、SEQIDNO162、SEQIDNO164或SEQIDNO166;或(d)与(a)、(b)或(c)互补的核酸序列。2.权利要求1所述的分离的或重组的核酸,其中所述核酸序列包括如下所示的序列SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165。3.权利要求1所述的分离的或重组的核酸,其中所述序列比较算法是BLAST2.2.2版本算法,其中过滤设置被设置为blastall-pblastp^i"nrpataa"-FF,所有其它选项被设置为缺省。4.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括内切葡25聚糖酶活性。5.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括纤维二糖水解酶活性。6.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括p-葡糖苷酶或甘露聚糖酶活性。7.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括内切纤维素酶活性。8.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括水解葡聚糖,产生更小分子量的多糖或寡聚体。9.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化1,4-P-D-糖苷键的水解。10.权利要求9所述的分离的或重组的核酸,其中所述内切纤维素酶活性包括内切-l,4-P-内纤维素酶活性。11.权利要求IO所述的分离的或重组的核酸,其中所述1,4-P-D-糖苷键活性包括10纤维素、纤维素衍生物、地衣聚糖或谷物中1,4-p-D-糖苷键的水解。12.权利要求11所述的分离的或重组的核酸,其中所述纤维素衍生物包括羧甲基纤维素或羟乙基纤维素。13.权利要求11所述的分离的或重组的核酸,其中所述谷物包含P-D-葡聚糖或木糖葡聚糖。14.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化葡聚糖酶键的水解。15.权利要求14所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化(3-l,4-和/或P-l,3-葡聚糖酶键的水解。16.权利要求14所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化25内切-葡聚糖键的水解。17.权利要求16所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化水解内-l,4-卩-D-葡聚糖4-葡聚糖水解酶活性。18.权利要求16所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化内部的内-p-l,4-葡聚糖酶键和/或P-l,3-葡聚糖酶键的水解。19.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化内部卩-l,3-葡糖苷键的水解。20.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括水解含吡喃型葡萄糖的多糖。21.权利要求20所述的分离的或重组的核酸,其中纤维素酶活性包括水解含1,4-P-糖苷键连接的D-吡喃型葡萄糖的多糖。22.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括水解纤维素、纤维素衍生物或半纤维素。23.权利要求22所述的分离的或重组的核酸,其中所述纤维素酶活性包括水解10木材或纸浆或木材制品或纸制品中的纤维素或半纤维素。24.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化饲料、食品或饮料中葡聚糖的水解。25.权利要求24所述的分离的或重组的核酸,其中所述饲料、食品或饮料包括基于谷物的动物饲料、麦芽汁或啤酒、面团、水果或蔬菜。26.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性包括催化微生物细胞、真菌细胞、哺乳动物细胞、植物细胞或任何含有纤维素部分的植物材料中葡聚糖的水解。27.权利要求l所述的分离的或重组的核酸,其中所述纤维素酶活性是热稳定的。28.权利要求27所述的分离的或重组的核酸,其中所述多肽在包括如下的温度25范围的条件下保持纤维素酶活性大约37'C到大约95'C之间;或大约55'C到大约85'C之间;或大约70'C到大约75'C之间;或大约70'C到大约95'C之间;或大约90°C到大约95t之间,或者在如下范围内的温度下保持纤维素酶活性在大约rc到大约5'C之间,大约5'C到大约15'C之间,大约15'C到大约25'C之间,大约25'C到大约37。C之间,或大约37。C到大约95。C、96'C、97°C、98。C或99'C之间。29.权利要求1所述的分离的或重组的核酸,其中所述纤维素酶活性是耐热的。30.权利要求29所述的分离的或重组的核酸,其中所述多肽在暴露于如下范围内的温度后保持纤维素酶活性37'C以上到大约95'C,55'C以上到大约85'C,或大约70'C到大约75'C之间,或90°C以上到大约95°C,或在暴露于如下范围内的温度后保持纤维素酶活性在大约1'C到大约5'C之间,大约5'C到大约15'C之间,大约15'C到大约25'C之间,大约25'C到大约37"之间,或大约37。C到大约95°C、96'C、97°C、98。C或99。C之间。31.核酸探针,其用于鉴定编码具有纤维素酶活性的多肽的核酸,其中所述探针包含权利要求1所述的序列的至少20、30、40、50、60、75、100或150或更多个连续碱基,其中所述探针通过结合或杂交鉴定所述核酸,其中,可选地,所述探针包括寡核苷酸,所述寡核苷酸含有至少大约10到50、大约20到60、大约30到70、大约40到80、大约60到100或大约50到150个连续碱基,其中,可选地,所述探针包括SEQIDNO:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15中所示的序列的连续碱基。32.扩增引物对,其用于扩增编码具有纤维素酶活性的多肽的核酸,其中所述扩15增引物对(a)能够扩增包含权利要求l所述的序列或其子序列的核酸;或(b)包括第一成员和第二成员,所述第一成员具有SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:lOl、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165的大约前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基所示的序列,所述第二成员具有所述第一成员的互补链的大约前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基所示的序列,其中,可选地,所述扩增引物对的成员包括寡核苷酸,所述寡核苷酸包括所述序列的至少大约10到50个连续碱基,或者包括所述序列的大约12、13、14、15、16、517、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个连续碱基。33.编码纤维素酶的核酸,其通过使用权利要求32所示的扩增引物对扩增多核苷酸而产生,其中可选地,所述扩增通过聚合酶链反应(PCR)进行。34.权利要求33所述的编码纤维素酶的核酸,其中所述核酸通过扩增基因文库产生,并且可选地,所述基因文库是环境文库。35.分离的或重组的纤维素酶,其由权利要求33所述的编码纤维素酶的核酸编码。36.扩增编码具有纤维素酶活性的多肽的核酸的方法,包括用权利要求32所述的扩增引物对扩增模板核酸。37.表达序列盒,其包含含有权利要求l所述序列的核酸。38.载体,所述载体包含含有权利要求1所述序列的核酸,其中可选地,所述载体包括表达载体。39.克隆载体,其包含含有权利要求l所述序列的核酸,其中,可选地,所述克隆载体包括病毒载体、质粒、噬菌体、噬粒、黏粒、fos-质粒、细菌噬菌体或人工染色体,并且可选地,所述病毒载体包括腺病毒载体、逆转录病毒载体或腺相关病毒载体,并且可选地,所述克隆载体包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。40.转化细胞,其包括含有权利要求1所述序列的核酸、或者权利要求37所述表达序列盒、权利要求38所述载体或权利要求39所述克隆载体,其中可选地,所述细胞是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。41.转基因非人动物,其含有权利要求l所述序列,其中可选地,所述转基因非人动物是小鼠或大鼠。42.转基因植物,其含有权利要求l所述序列,其中可选地,所述植物是玉米植物、高粱植物、马铃薯植物、番茄植物、小麦植5物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物、草或烟草植物。43.转基因种子,其含有权利要求1所述序列,其中可选地,所述种子是玉米种子、小麦粒、含油种子、油菜籽、大豆种子、棕榈核、向日葵种子、芝麻种子、水稻、大麦、花生或烟草植物种子。44.反义寡核苷酸,其包括与权利要求1所述序列或其子序列互补的核酸序列或能与权利要求1所述序列或其子序列在严紧条件下杂交的核酸序列,其中可选地,所述反义寡核苷酸的长度在大约10到50、大约20到60、大约30到70、大约40到80或大约60到100个碱基之间。45.抑制纤维素酶信息在细胞中翻译的方法,包括向所述细胞施用反义寡核苷酸或在所述细胞中表达反义寡核苷酸,所述反义寡核苷酸包括与权利要求1所述序列互补的核酸序列或能与权利要求1所述序列在严紧条件下杂交的核酸序列。46.双链干扰RNA(RNAi)分子,其含有权利要求1所述序列的子序列,其中,可选地,所述RNAi包括siRNA或miRNA,并且可选地,所述RNAi分子的长度为大约ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26或更多个双链核苷酸。47.抑制纤维素酶在细胞中表达的方法,包括向所述细胞施用权利要求46所述的双链干扰RNA(RNAi)分子或在所述细胞中表达权利要求46所述的双链干扰RNA(RNAi)分子。48.分离的或重组的多肽,(i)具有在至少大约20、25、30、35、40、45、50、55、60、75、100、150、200、250、300或更多个残基的区域内,与SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:亂SEQID5NO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、1592%、93%、94%、95%、96%、97%、98%、99%或更高或100%的序列同一性的氨基酸序列,其中,可选地,所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定,以及可选地,所述序列比较算法是BLAST2.2.2版本算法,其中过滤设置被设置为blastall-pblastp"d"nrpataa"-FF,所有其它选项被设置为缺省;(ii)具有由权利要求1所述的核酸编码的氨基酸序列,其中所述多肽具有纤维素酶活性或具有免疫原性活性,这在于它能够产生特异性结合具有下列序列的多肽的抗体SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQDDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQID30NO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166;或(iii)具有(i)或(ii)所示氨基酸序列,或者由权利要求1所示核酸编码的多肽,并且包含至少一个氨基酸残基保守取代,其中,可选地,保守取代包括脂肪族氨基酸用另一个脂肪族氨基酸取代;丝氨酸用苏氨酸取代,或苏氨酸用丝氨酸取代;酸性残基用另一个酸性残基取代;具有酰胺基团的残基用另一个具有酰胺基团的残基取代;碱性残基用另一个碱性残基来交换;或芳香族残基用另一个芳香族残基取代,或其组合,并且可选地,所述脂肪族残基包括丙氨酸、纈氨酸、亮氨酸、异亮氨酸或其合成等价物;所述酸性残基包括天冬氨酸、谷氨酸或其合成等价物;所述包含酰胺基团的残基包括天冬酰胺、谷氨酰胺或其合成等价物所述碱性残基包括赖氨酸、精氨酸或其合成等价物;或者,所述芳香族残基包括苯丙氨酸、酪氨酸或其合成等价物。49.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括内切葡聚糖酶活性。50.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括纤维二糖水解酶活性。51.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括(3-葡糖苷酶或甘露聚糖酶活性。52.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括内切25纤维素酶活性。53.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括水解葡聚糖,产生更小分子量的多糖或寡聚体。54.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化1,4-P-D-糖苷键的水解。55.权利要求54所述的分离的或重组的多肽,其中所述内切纤维素酶活性包括内切-l,4-P-内纤维素酶活性。56.权利要求54所述的分离的或重组的多肽,其中所述1,4-P-D-糖苷键活性包括纤维素、纤维素衍生物、地衣聚糖或谷物中1,4-P-D-糖苷键的水解。57.权利要求56所述的分离的或重组的多肽,其中所述纤维素衍生物包括羧甲基纤维素或羟乙基纤维素。58.权利要求56所述的分离的或重组的多肽,其中所述谷物包括j3-D-葡聚糖或木糖葡聚糖。59.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化0葡聚糖酶键的水解。60.权利要求59所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化p-l,4-和/或P-l,3-葡聚糖酶键的水解。61.权利要求59所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化内切葡聚糖酶键的水解。62.权利要求61所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化水解内-l,4-l3-D-葡聚糖4-葡聚糖水解酶活性。63.权利要求61所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化内部的内-P-l,4-葡聚糖酶键和/或P-l,3-葡聚糖酶键的水解。64.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化25内部的P-l,3-葡糖苷键的水解。65.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括水解含吡喃型葡萄糖的多糖。66.权利要求65所述的分离的或重组的多肽,其中所述纤维素酶活性包括水解含1,4-|3-糖苷键连接的D-吡喃型葡萄糖的多糖。67.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括水解纤维素、纤维素衍生物或半纤维素。68.权利要求67所述的分离的或重组的多肽,其中所述纤维素酶活性包括水解木材或纸浆或木材制品或纸制品中的纤维素或半纤维素。69.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化饲料、食品或饮料中葡聚糖的水解。70.权利要求69所述的分离的或重组的多肽,其中所述饲料、食品或饮料包括基于谷物的动物饲料、麦芽汁或啤酒、面团、水果或蔬菜。71.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括催化10微生物细胞、真菌细胞、哺乳动物细胞、植物细胞或任何含有纤维素部分的植物材料中葡聚糖的水解。72.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性是热稳定的。73.权利要求72所述的分离的或重组的多肽,其中所述多肽在包括如下的温度范围的条件下保持纤维素酶活性大约37'C到大约95'C之间;或大约55'C到大约85'C之间;或大约70'C到大约75。C之间;或大约7(TC到大约95'C之间;或大约到大约95'C之间,或者在如下范围内的温度下保持纤维素酶活性在大约1'C到大约205'C之间,大约5'C到大约15。C之间,大约15。C到大约25'C之间,大约25'C到大约37'C之间,或大约37'C到大约95t:、96°C、97°C、98'C或99。C之间。74.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性是耐热的。75.权利要求74所述的分离的或重组的多肽,其中所述多肽在暴露于如下范围内的温度后保持纤维素酶活性37。C以上到大约95'C,或55'C以上到大约85。C,或大约7(TC到大约75'C,或90'C以上到大约95。C,或在暴露于如下范围的温度后保持纤维素酶活性在大约rC到大约5t:之间,大约5'C到大约15'C之间,大约15'C到大约25'C之间,大约25。C到大约37'C之间,或大约37'C到大约95°C、96'C、97°C、3098。C或99'C之间。76.分离的或重组的多肽,所述多肽包括在权利要求48中所述的多肽并且缺乏信号或前导序列或前原序列。77.分离的或重组的多肽,所述多肽包括在权利要求48中所述的多肽并且具有异源信号或前导序列或异源前原序列。78.权利要求48所述的分离的或重组的多肽,其中所述纤维素酶活性包括,在大约37'C的比活性为每毫克蛋白大约100到大约1000单位,每毫克蛋白大约500到大约750单位,每毫克蛋白大约500到大约1200单位,或每亳克蛋白大约750到大约1000单位。79.权利要求48所述的分离的或重组的多肽,其中所述耐热性包括在被加热到升高的温度后保留在37'C时纤维素酶比活性的至少一半的比活性,或者其中所述耐热性包括在被加热到升高的温度后,保持在37'C的每毫克蛋白大约500到大约1200单位的范围内的比活性。80.权利要求48所述的的分离的或重组的多肽,其中所述多肽包括至少一个糖基化位点,并且可选地,所述糖基化是N连接糖基化,并且可选地,所述多肽在毕赤酵母或裂变酵母中表达后被糖基化。81.权利要求48所述的的分离的或重组的多肽,其中所述多肽在包括大约pH6.5、pH6.0、pH5.5、5.0、pH4.5或4.0或更酸性的条件下或在暴露于包括大约pH6.5、pH6.0、pH5.5、5.0、pH4.5或4.0或更酸性的条件下保持纤维素酶活性。82.权利要求48所述的的分离的或重组的多肽,其中所述多肽在包括大约pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10或pH10.5或更碱性的条件下或在暴露于包括大约pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10或pH10.5或更碱性的条件下保持纤维素酶活性。83.蛋白制剂,所述蛋白制剂包含在权利要求48中所述的多肽,其中所述蛋白制剂包括液体、固体或凝胶。84.异源二聚体,所述异源二聚体包括在权利要求48中所述的多肽和第二结构域,其中,可选地,所述第二结构域是多肽,所述异源二聚体是融合蛋白,以及可选30地,所述第二结构域包括表位、免疫原性肽或标记物。85.同源二聚体,包括在权利要求48中所述的多肽。86.固定化多肽或固定化核酸,其中所述多肽包括在权利要求48中所述的序列,35或其子序列,或者,所述核酸包括权利要求1所述的核酸,或其子序列,或者权利要求31所述的探针,其中可选地,所述多肽或核酸被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、平板、阵列或毛细管上。87.阵列,包括在权利要求86中所述的固定化多肽或者权利要求86中所述的固定化核酸。88.分离的或重组的抗体,其与权利要求48中所述的多肽特异性结合,其中可选地,所述抗体是单克隆或多克隆抗体。89.杂交瘤,含有与权利要求48中所述的多肽特异性结合的抗体。90.分离或鉴定具有纤维素酶活性的多肽的方法,包括如下步骤-(a)提供权利要求88中所述的抗体;(b)提供包含多肽的样品;和(c)将步骤(b)的样品与步骤(a)的抗体在所述抗体能与所述多肽特异性结15合的条件下接触,从而分离或鉴定具有纤维素酶活性的多肽。91.制备抗纤维素酶抗体的方法,包括(a)以足够的量向非人动物施用在权利要求1中所述的核酸或其子序列,所述的量足以产生体液免疫应答,从而产生抗纤维素酶抗体,或20(b)以足够的量向非人动物施用在权利要求48中所述的多肽或其子序列,所述的量足以产生体液免疫应答,从而产生抗纤维素酶抗体。92.产生重组多肽的方法,包括如下步骤(a)提供与启动子可操纵地连接的核酸,其中所述核酸包含权利要求1所述的序列;和(b)在允许多肽表达的条件下表25达步骤(a)的核酸,从而产生重组多肽,其中可选地,所述方法进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,从而在转化细胞中产生重组多肽。93.用于鉴定具有纤维素酶活性的多肽的方法,所述方法包括如下步骤30(a)提供在权利要求48中所述的多肽;(b)提供纤维素酶底物;和(c)用步骤(b)的底物接触所述多肽,并检测底物量的减少或反应产物量的增加,其中所述底物量的减少或所述反应产物量的增加检测出具有纤维素酶活性的多肽。94.用于鉴定纤维素酶底物的方法,包括如下步骤-(a)提供在权利要求48中所述的多肽;(b)提供测试底物;和(c)用步骤(b)的测试底物接触步骤(a)的多肽,并检测底物量的减少或反应产物量的增加,其中所述底物量的减少或所述反应产物量的增加鉴定出作为纤维素酶底物的测试底物。95.确定测试化合物是否与多肽特异性结合的方法,所述方法包括如下步骤(a)在允许核酸翻译为多肽的条件下表达所述核酸或包含所述核酸的载体,其中所述核酸具有在权利要求1中所述的序列;(b)提供测试化合物;(C)用所述测试化合物接触所述多肽;和(d)确定步骤(b)的测试化合物是否与所述多肽特异性结合。96.确定测试化合物是否与多肽特异性结合的方法,所述方法包括如下步骤15(a)提供在权利要求48中所述的多肽;(b)提供测试化合物;(C)用所述测试化合物接触所述多肽;和(d)确定步骤(b)的测试化合物是否与所述多肽特异性结合。97.鉴定纤维素酶活性的调节剂的方法,所述方法包括如下步骤(a)提供在权利要求48中所述的多肽;(b)提供测试化合物;(c)用步骤(b)的测试化合物接触步骤(a)的多肽,并测定该葡聚糖酶的活性,其中在存在测试化合物的情况下测定的纤维素酶活性与不存在测试化合物的情25况下的活性相比的变化,提供了该测试化合物调节纤维素酶活性的确定方法。98.权利要求97所述的方法,其中所述纤维素酶活性通过提供纤维素酶底物并检测所述底物量的减少或反应产物量的增加,或所述底物量的增加或反应产物量的减少来测量,30其中,可选地,与没有所述测试化合物时底物或反应产物的量相比,有测试化合物时所述底物量的减少或所述反应产物量的增加鉴定出作为纤维素酶活性的激活剂的测试化合物,并且可选地,与没有所述测试化合物时底物或反应产物的量相比,有测试化合物时所述底物量的增加或所述反应产物量的减少鉴定出作为纤维素酶活性的抑制剂的35测试化合物。99.计算机系统,包括处理器和数据存储设备,其中所述数据存储设备上己经存储了多肽序列或核酸序列,其中所述多肽序列包括在权利要求48中所述的序列,由在权利要求1中所述的核酸编码的多肽,5其中可选地,所述计算机系统进一步包括序列比较算法和数据存储设备,其中所述数据存储设备上已经存储了至少一个参考序列,或者进一步包括在所述序列中鉴定一个或多个特征的鉴定器,并且可选地,所述序列比较算法包括指明多态性的计算机程序。100.计算机可读介质,其上已经存储了多肽序列或核酸序列,其中所述多肽序列包括在权利要求48中所述的多肽,或者由在权利要求1中所述的核酸编码的多肽。101.用于鉴定序列中的特征的方法,所述方法包括如下步骤(a)使用可鉴定序列中的一个或多个特征的计算机程序读取所述序列,其中所述序列包括多肽序列或15核酸序列,其中所述多肽序列包括在权利要求48中所述的多肽;由在权利要求l中所述的核酸编码的多肽;和(b)用所述计算机程序鉴定序列中的一个或多个特征。102.用于将第一序列与第二序列进行比较的方法,所述方法包括如下步骤(a)通过使用比较序列的计算机程序读取所述第一序列和所述第二序列,其中所述第一序20列包括多肽序列或核酸序列,其中所述多肽序列包括在权利要求48中所述的多肽或由权利要求1中所述的核酸编码的多肽;和(b)用所述计算机程序确定所述第一序列和所述第二序列之间的差异,其中可选地,所述方法进一步包括确定所述第一序列和所述第二序列之间的差异的步骤,或者可选地,所述方法进一步包括鉴定多态性的步骤,或者可选地,所述方25法进一步包括使用鉴定序列中的一个或多个特征的鉴定器,或者可选地,所述方法包括使用计算机程序读取所述第一序列,并鉴定该序列的一个或多个特征。103.用于从环境样品中分离或回收核酸的方法,所述核酸编码具有纤维素酶活30性的多肽,该方法包括如下步骤(a)提供了在权利要求32中所述的扩增引物对;(b)从所述环境样品中分离核酸,或处理所述环境样品以便所述样品中的核酸易于与所述扩增引物对杂交;和(c)将步骤(b)的核酸与步骤(a)的扩增引物对结合,从所述环境样品中35扩增出核酸,从而从环境样品中分离或回收编码具有纤维素酶活性的多肽的核酸。104.从环境样品中分离或回收核酸的方法,所述核酸编码具有纤维素酶活性的多肽,该方法包括如下步骤(a)提供包含权利要求1所述的序列或其子序列的多核苷酸探针,或者权利要求31所述的探针;5(b)从所述环境样品分离核酸,或处理所述环境样品,以便所述样品中的核酸易于与步骤(a)的多核苷酸探针杂交;(c)将步骤(a)的多核苷酸探针与步骤(b)的分离的核酸或处理的环境样品结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,从而从所述环境样品10中分离或回收编码具有纤维素酶活性的多肽的核酸。105.权利要求103或权利要求104所述的方法,其中所述环境样品包括水样品、液体样品、土壤样品、空气样品或生物样品,并且可选地,所述生物样品来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。15106.产生编码具有纤维素酶活性的多肽的核酸变体的方法,包括如下步骤(a)提供包含权利要求l所述的序列的模板核酸;和(b)在所述模板序列中修饰、删除或添加一个或多个核苷酸,或进行修饰、删除和添加的组合,以产生所述模板核酸的变体,20其中可选地,所述方法进一步包括表达所述变体核酸,以产生变体纤维素酶多肽,以及可选地,所述的修饰、添加或删除通过包括如下方法中的方法来引入易错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯修饰25的DNA诱变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合,以及可选地,所述方法被迭代重复,直到产生与所述模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳定性的纤维素酶。30107.权利要求106所述的方法,其中所述变体纤维素酶多肽(a)是耐热的,在暴露于增高的温度之后仍保持一些活性;(b)与模板核酸编码的纤维素酶相比,具有增加的糖基化;或(c)在高温下具有纤维素酶活性,其中由所述模板核酸编码的纤维素酶在所述高温下没有活性。108.权利要求106所述的方法,其中所述方法被迭代重复,直到(a)产生具有与所述模板核酸的密码子使用有所不同的密码子使用的纤维素酶编码序列,或(b)产生具有比所述模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的纤维素酶基因。109.在编码具有纤维素酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法,所述方法包括如下步骤(a)提供编码具有纤维素酶活性的多肽的核酸,所述核酸包含权利要求1中所述的序列;和10(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子,用优选的或中度使用的密码子来代替它,所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸,其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子,非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子,从而修饰所述核酸以增加其在宿主细胞中的表达。110.在编码纤维素酶多肽的核酸中修饰密码子的方法,所述方法包括如下步骤(a)提供编码具有纤维素酶活性的多肽的核酸,所述核酸包含权利要求1中所述的序列;和(b)鉴定步骤(a)的核酸中的密码子,并用不同的密码子来代替它,所述不20同的密码子编码与被取代的密码子相同的氨基酸,从而修饰在编码纤维素酶的核酸中的密码子。111.在编码纤维素酶多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法,该方法包括如下步骤25(a)提供编码纤维素酶多肽的核酸,所述核酸包含权利要求1中所述的序列;和(b)鉴定步骤(a)的核酸中的非优选或较不优选的密码子,并用优选的或中度使用的密码子来代替它,所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸,其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子,非优30选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子,从而修饰所述核酸以增加其在宿主细胞中的表达。112.在编码具有纤维素酶活性的多肽的核酸中修饰密码子以降低其在宿主细胞中的表达的方法,该方法包括如下步骤-35(a)提供编码纤维素酶多肽的的核酸,所述核酸包含在权利要求1中所述的序列;禾口(b)鉴定步骤(a)的核酸中的至少一个优选密码子,并用非优选的或较不优选的密码子来代替它,所述非优选或较不优选的密码子编码与被取代的密码子相同的氨基酸,其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子,非优选5或较不优选的密码子是在宿主细胞的基因的编码序列中表现不足的密码子,从而修饰所述核酸以降低其在宿主细胞中的表达,其中可选地,所述宿主细胞是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。113.用于产生核酸文库的方法,所述核酸编码多个被修饰的纤维素酶活性位点或底物结合位点,其中所述被修饰的活性位点或底物结合位点来源于第一核酸,所述第一核酸包含编码第一活性位点或第一底物结合位点的序列,该方法包括如下步骤-(a)提供第一核酸,其编码第一活性位点或第一底物结合位点,其中所述第一核酸序列包括在严紧条件下与如下所示序列杂交的序列SEQIDNO:l、SEQID15NO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQ20IDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQ翻0:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQID25NO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、30SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165或其子序列,并且所述核酸编码纤维素酶活性位点或纤维素酶底物结合位点;(b)提供一组诱变寡核苷酸,其在所述第一核酸的多个目标密码子处编码天然发生的氨基酸变体;和(c)使用该组诱变寡核苷酸,产生一组编码活性位点或编码底物结合位点的变35体核酸,其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变化,从而产生编码多个被修饰的纤维素酶活性位点或底物结合位点的核酸文库,其中可选地,诱变寡核苷酸或变体核酸通过如下方法中的方法产生优化的定向进化系统、基因位点饱和诱变(GSSM)或合成连接重装配(SLR)、易错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、5递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。114.用于产生小分子的方法,包括如下步骤(a)提供多个能合成或修饰小分子的生物合成酶,其中所述酶中的一种酶包括由包含权利要求1所述序列的核酸编码的纤维素酶;(b)为步骤(a)的至少一种酶提供底物;和(c)将步骤(b)的底物与所述酶在能促进多个生物催化反应的条件下通过一系15列生物催化反应进行反应,以产生小分子。115.用于修饰小分子的方法,所述方法包括如下步骤(a)提供纤维素酶,其中所述酶包括在权利要求48中所述的多肽,或由包含权利要求1所述核酸序列的核酸编码的多肽;20(b)提供小分子;和(c)将步骤(b)的小分子与步骤(a)的酶在能促进由所述纤维素酶催化的酶促反应的条件下进行反应,从而通过纤维素酶酶促反应修饰小分子,其中可选地,步骤(b)包括为步骤(a)的酶提供多个小分子底物,从而产生由所述纤维素酶催化的至少一种酶促反应产生的被修饰小分子的文库;25并且可选地,所述方法进一步包括提供多个其它的酶,在有助于所述酶介导的多个生物催化反应的条件下使用这些酶,以形成由多个酶促反应产生的被修饰小分子的文库;并且可选地,所述方法进一步包括测试所述文库的步骤,以确定所述文库中是否存在表现出期望活性的特定被修饰小分子,其中可选地,测试所述文库的步骤进一步30包括系统性地去除所有但保留一个用于产生在所述文库中的多个被修饰小分子中的一部分小分子的生物催化反应,方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子,鉴定产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。116.用于确定纤维素酶的功能片段的方法,包括如下步骤(a)提供纤维素酶,其中该酶包括在权利要求48中所述的多肽、或由权利要求l所述的核酸编码的多肽;和(b)从步骤(a)的序列删除多个氨基酸残基,并测试剩余的子序列的纤维素酶活性,从而确定纤维素酶的功能片段,5其中可选地,所述纤维素酶活性通过提供纤维素酶底物并检测所述底物量的减少或反应产物量的增加来测量。117.通过使用实时代谢流分析来获得新的或修饰的表型的全细胞工程的方法,该方法包括如下步骤10(a)通过修饰细胞的遗传组成来制备修饰的细胞,其中所述的遗传组成通过将包含权利要求1所述序列的核酸加入到所述细胞中来修饰;(b)培养所述修饰的细胞以产生多个修饰细胞;(c)通过实时监控步骤(b)的细胞培养物测量所述细胞的至少一个代谢参数;和15(d)分析步骤(c)的数据,以确定测量的参数是否与在类似条件下未修饰细胞中的参照测量值不同,从而使用实时代谢流分析鉴定细胞中的工程表现型,其中可选地,所述细胞的遗传组成通过包括在所述细胞中删除序列或修饰序列,或敲除基因的表达的方法来修饰,以及可选地,所述方法进一步包括选择含有新的工程表现型的细胞,20以及可选地,所述方法进一步包括培养所选择的细胞,从而产生包含新的工程表型的新细胞株。118.分离出的或重组的信号或前导序列,其由(a)权利要求48所述的氨基酸序列或(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、25SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQID30NO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQ35IDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:1645或SEQIDNO:166所述的氨基酸序列的氨基末端残基1至14、1至15、1至16、I至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43或1至44所示的氨基酸序列组成。119.嵌合多肽,其含有至少第一结构域和至少第二结构域,所述至少第一结构域含有具有权利要求118所示氨基酸序列的信号肽(SP)或前导序列,所述至少第二结构域含有异源的多肽或肽,其中所述异源多肽或肽与所述信号肽(SP)或前导序列不是天然相关的,15并且可选地,所述异源多肽或肽不是纤维素酶,以及可选地,所述异源多肽或肽是在所述信号肽(SP)或前导序列的氨基末端、羧基末端或两个末端上。120.编码嵌合多肽的分离出的或重组的核酸,其中所述嵌合多肽含有至少第一结构域和至少第二结构域,所述至少第一结构域含有具有权利要求118所示氨基酸序20列的信号肽(SP)或前导序列,所述至少第二结构域含有异源的多肽或肽,其中所述异源多肽或肽与所述信号肽(SP)或前导序列不是天然相关的。121.分离的或重组的核酸,其包含编码具有纤维素酶活性的多肽和信号序列的序列,其中所述核酸包含权利要求l所述的序列。122.权利要求121所述的分离的或重组的核酸,其中所述信号序列来源于另一种纤维素酶或非纤维素酶。123.分离的或重组的核酸,其包含编码具有纤维素酶活性的多肽的序列,其中30所述序列不含有信号序列,并且所述核酸包含权利要求l所述的序列。124.增加纤维素酶多肽的耐热性或热稳定性的方法,所述方法包括对纤维素酶进行糖基化,其中所述多肽包括在权利要求48中所示的多肽或由权利要求1所示核酸编码的多肽的至少30个连续氨基酸,从而增加所述纤维素酶的耐热性或热稳定性。125.在细胞中过表达重组纤维素酶的方法,包括表达含有权利要求1所示核酸序列的载体,其中所述过表达通过使用高活性的启动子、双顺反子载体或通过所述载体的基因扩增来完成。126.制备转基因植物的方法,所述方法包括如下步骤-5(a)将异源核酸序列导入细胞中,其中所述异源核酸序列包括权利要求1所述的序列,从而产生转化的植物细胞;(b)从所述转化的细胞产生转基因植物,其中可选地,步骤(a)进一步包括通过植物细胞原生质体的电穿孔或显微注射导入所述异源核酸序列,10以及可选地,步骤(a)包括通过DNA微粒轰击或通过使用根瘤农杆菌宿主将所述异源核酸序列直接导入植物组织中。127.在植物细胞中表达异源核酸序列的方法,所述方法包括如下步骤(a)用与启动子可操纵地连接的异源核酸序列转化所述植物细胞,其中所述异15源核酸序列包括权利要求I所述的序列(b)在其中所述异源核酸序列在所述植物细胞中表达的条件下培养所述植物。128.水解、分解或破坏含葡聚糖或纤维素的组合物的方法,包括下面的步骤(a)提供权利要求48中所示的具有纤维素酶活性的多肽,或由权利要求1所示的20核酸编码的多肽;(b)提供含有纤维素或葡聚糖的组合物;和(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,其中所述纤维素酶水解、分解或破坏所述含葡聚糖或纤维素的组合物,其中可选地,所述组合物包括植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物25细胞,以及可选地,所述多肽具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性。129.面团或面包产品,其含有权利要求48所示的多肽或权利要求1所示的核酸30编码的多肽,其中可选地,所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。130.改进面团的方法,包括将面团或面包产品与权利要求48中所示的至少一种多肽或权利要求1所示的核酸编码的多肽在足以改进所述面团的条件下接触。131.饮料,其含有权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。132.生产饮料的方法,其包括向饮料或饮料前体在足以降低所述饮料粘度的条5件下施用至少一种权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述饮料或饮料前体是麦芽汁或啤酒。133.食物、词料或营养补充剂,其含有权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。134.利用纤维素酶作为动物饮食中的营养补充剂的方法,所述方法包括制备含有纤维素酶的营养补充剂,所述纤维素酶包含权利要求48所示多肽或者由权利要求1所示核酸编码的多肽的至少三十个连续氨基酸;和15向动物施用所述营养补充剂,以增加包含在被所述动物消化的饲料或食物中的木聚糖的利用,其中,可选地,所述动物是人,或者所述动物是反刍动物或单胃动物,以及可选地,所述纤维素酶通过在选自细菌、酵母、植物、昆虫、真菌和动物的生物体中表达编码所述纤维素酶的多核苷酸而制备出来,以及可选地,所述生物体选20自裂变酵母、酿酒酵母、毕赤酵母、大肠杆菌、链霉菌属某种、杆菌属某种和乳酸杆菌属某种。135.可食用的酶输送基质或丸,其含有热稳定的重组纤维素酶,所述重组纤维素酶含有权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。136.将纤维素酶补充物输送至动物的方法,所述方法包括制备可食用的酶输送基质或丸,所述基质或丸包括颗粒状的可食用载体和热稳定的重组纤维素酶,其中所述的丸容易将包含在其中的纤维素酶分散至含水介质中,并且所述重组的纤维素酶含有权利要求48所示的多肽或权利要求1所示的核酸编码的多肽;以及将所述可食用的酶输送基质或丸给予所述动物,其中可选地,所述颗粒状的可食用载体包括选自谷物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉和小麦粗粉的载体,以及可选地,所述可食用载剂包括去油的谷物胚芽,以及可选地,所述纤维素酶被糖基化以便提供在制丸条件下的热稳定性,以及可选地,所述输送基质通过将含有谷物胚芽和纤维素酶的混合物制丸而形成,以及可选地,所述制丸条件包括应用蒸汽,以及可选地,所述的制丸条件包括应5用超过大约80°C的温度大约5分钟,所述酶保留每毫克酶至少350至大约900单位的比活性。137.纤维素组合物或纤维素衍生的组合物,其包含权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。138.木材、纸浆或木制品,其含有权利要求48所示的纤维素酶或权利要求1所示的核酸编码的纤维素酶,其中可选地,所述纤维素酶的活性包括内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。139.纸、纸浆或纸产品,其包含权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。140.降低纸、木材或木制品中纤维素含量的方法,包括使所述纸、木材或木制品与权利要求48所示的纤维素酶或权利要求1所示的核酸编码的纤维素酶接触,其中可选地,所述纤维素酶的活性包括内切葡聚糖酶;纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。141.去街剂组合物,其含有权利要求48所示的纤维素酶或权利要求1所示的核酸编码的纤维素酶,其中可选地,所述多肽被配制成不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压縮片剂、凝胶、糊剂或浆液的形式,以及可选地,所述纤维素酶的活性包括内切葡聚糖酶、纤维二糖水解酶、甘露聚30糖酶和/或(3-葡糖苷酶活性。142.药物组合物或饮食补充物,其含有权利要求48所示的纤维素酶或权利要求1所示的核酸编码的纤维素酶,其中可选地,所述纤维素酶被配制成片剂、凝胶、药丸、植入物、液体、喷剂、35粉末、食物、饲料球或配制成胶囊化的制剂,以及可选地,所述纤维素酶的活性包括内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。143.燃料,其含有权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、5甘露聚糖酶和/或P-葡糖苷酶活性,其中可选地,所述燃料来源于植物材料,其任选地包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗,以及可选地,所述燃料包括生物乙醇或汽油-乙醇混合物。144.制备燃料的方法,包括使含有纤维素或可发酵糖类的组合物与权利要求48所示的多肽或权利要求1所示的核酸编码的多肽接触,其中可选地,所述含有纤维素或可发酵糖类的组合物包括植物、植物产品或植物衍生物,以及可选地,所述植物或植物产品包括甘蔗植物或植物产品、甜菜或糖用甜菜、小麦、玉米、大豆、马铃薯、水稻或大麦,15其中可任选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,以及可选地,所述燃料包括生物乙醇或汽油-乙醇混合物。145.制备生物乙醇的方法,包括使含有纤维素或可发酵糖类的组合物与权利要20求48所示的多肽或权利要求1所示的核酸编码的多肽接触,其中可选地,所述含有纤维素或可发酵糖类的组合物包括植物、植物产品或植物衍生物,以及可选地,所述植物或植物产品包括甘蔗植物或植物产品、甜菜或糖用甜菜、小麦、玉米、大豆、马铃薯、水稻或大麦,其中可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解25酶、甘露聚糖酶和/或P-葡糖苷酶活性。146.酶装配体,其用于将纤维素和半纤维素聚合物解聚成可代谢的碳部分,包括权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解30酶、甘露聚糖酶和/或|3-葡糖苷酶活性。147.加工含有木质纤维素的生物质材料的方法,包括使含有纤维素或可发酵糖类的组合物与权利要求48所示的多肽或权利要求1所示的核酸编码的多肽接触,其中可选地,所述含有木质纤维素的生物质材料是来源于农作物,是食品或饲料35生产的副产物,是木素纤维素废品,或者是植物残余或废纸或废纸品,并且可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,以及可选地,所述植物残余包括茎、叶、壳、皮、穗轴、木材、木屑、木浆和锯屑,以及可选地,所述废纸品包括废弃的或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸、报纸、杂质、硬纸和基于纸的包装材料,以及可选地,所述生物质材料的加工产生生物乙醇。148.饮食产品,其含有权利要求48所示的多肽或权利要求1所示的核酸编码的10多肽,其中可选地,所述饮食产品包括牛奶、冰淇淋、奶酪或酸酪,以及可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。149.改善饮食产品的质地和风味的方法,其包括下列步骤(a)提供权利要求1548所示的多肽或权利要求1所示的核酸编码的多肽;(b)提供饮食产品;和(c)使步骤(a)的多肽和步骤(b)的饮食产品在其中所述纤维素酶可以改善所述饮食产品的质地和风味的条件下接触。150.纺织品或织物,其含有权利要求48所示的多肽或权利要求1所示的核酸编20码的多肽,其中可选地,所述纺织品或织物包括含纤维素的纤维,以及可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性。151.处理固体或液体动物废物的方法,包括下面的步骤(a)提供权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性;(b)提供固体或液体动物废物;和(c)使步骤(a)的多肽和步骤(b)的固体或液体废物在其中所述酶可以处理30所述废物的条件下接触。152.加工过的废品,其包含权利要求48所示的多肽或权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有活性,包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。153.消毒剂,其含有具有纤维素酶活性的多肽,其中所述多肽包括权利要求48所示的序列,或者权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有活性,包括内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。154.生物防御剂或生物解毒剂,其含有具有纤维素酶活性的多肽,其中所述多5肽包括权利要求48所示的序列,或者权利要求1所示的核酸编码的多肽,其中可选地,所述多肽具有活性,包括内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。155.分离的或重组的核酸,其具有包含对SEQIDNO:163的至少一个核苷酸碱10基残基修饰的序列,其中所述修饰包括下列改变的一个或多个位置265至267的任何一处的核苷酸被修饰,变为CGT、CGC、CGA、CGG、AGA或AGG;位置307至309的任何一处的核苷酸被修饰,变为GGT、GGC、GGA或GGG;位置328至330的任何一处的核苷酸被修饰,变为GGT、GGC、GGA或GGG;15位置340至342的任何一处的核苷酸被修饰,变为TTA、TTG、CTT、CTC、CTA或CTG;位置469至471的任何一处的核苷酸被修饰,变为TCT、TCC、TCA、TCG、AGT或AGC;位置1441至1443的任何一处的核苷酸被修饰,变为TTT或TTC;20位置1648至1650的任何一处的核苷酸被修饰,变为AAT或AAC;或者位置1768至1770的任何一处的核苷酸被修饰,变为CGT、CGC、CGA、CGG、AGA或AGG。156.分离的或重组的多肽,其具有包含对SEQIDNO:164的至少一个氨基酸残25基修饰的序列,其中所述修饰包括下列改变的一个或多个氨基酸位置89的甲硫氨酸被修饰为精氨酸;氨基酸位置103的苯丙氨酸被修饰为甘氨酸;氨基酸位置110的脯氨酸被修饰为甘氨酸;氨基酸位置114的酪氨酸被修饰为亮氨酸;30氨基酸位置157的丙氨酸被修饰为丝氨酸;氨基酸位置481的色氨酸被修饰为苯丙氨酸;氨基酸位置550的脯氨酸被修饰为天冬酰胺;或氨基酸位置590的甘氨酸被修饰为精氨酸。157.分离的或重组的核酸,其具有包含对下列序列的核苷酸残基序列修饰的序歹!j:SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、10SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDN0.123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165,其中所述修饰包括下列改变的一个或多个-SEQIDNO:163的位置265至267的任何一处的相当的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG;20SEQIDNO:163的位置307至309的任何一处的相当的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一处的相当的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一处的相当的核苷酸变为TTA、TTG、25CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一处的相当的核苷酸变为TCT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的任何一处的相当的核苷酸变为TTT或TTC;SEQIDNO:163的位置1648至1650的任何一处的相当的核苷酸变为AAT或AAC;或者SEQIDNO:163的位置1768至1770的任何一处的相当的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG。158.分离的或重组的核酸,其具有包含对权利要求1所示核酸的核苷酸残基序列修饰的序列,其中所述修饰包括下列改变的一个或多个SEQIDNO:163的位置265至267的任何一处的相当的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位置307至309的任何一处的相当的核苷酸变为GGT、GGC、5GGA或GGG;SEQIDNO:163的位置328至330的任何一处的相当的核苷酸变为GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一处的相当的核苷酸变为TTA、TTG、CTT、CTC、CTA或CTG;10SEQIDNO:163的位置469至471的任何一处的相当的核苷酸变为TCT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的任何一处的相当的核苷酸变为TTT或TTC;SEQIDNO:163的位置1648至1650的任何一处的相当的核苷酸变为AAT或AAC;或者SEQIDNO:163的位置1768至1770的任何一处的相当的核苷酸变为CGT、CGC、CGA、CGG、AGA或AGG。159.分离的或重组的多肽,其具有包含对下列序列的氨基酸残基修饰的序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:IOO、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQEDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166,其中所述修饰包括下列改变的一个或多个-SEQIDNO:164的氨基酸位置89的甲硫氨酸相当的氨基酸变为精氨酸;SEQIDNO:164的氨基酸位置103的苯丙氨酸相当的氨基酸变为甘氨酸;SEQIDNO:164的氨基酸位置110的脯氨酸相当的氨基酸变为甘氨酸;5SEQIDNO:164的氨基酸位置114的酪氨酸相当的氨基酸变为亮氨酸;SEQIDNO:164的氨基酸位置157的丙氨酸相当的氨基酸变为丝氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相当的氨基酸变为苯丙氨酸;SEQIDNO:164的氨基酸位置550的脯氨酸相当的氨基酸变为天冬酰胺;或SEQIDNO:164的氨基酸位置590的甘氨酸相当的氨基酸变为精氨酸。160.分离的或重组的多肽,其具有包含对权利要求48所示多肽的氨基酸残基修饰的序列,其中所述修饰包括下列改变的一个或多个-SEQIDNO:164的氨基酸位置89的甲硫氨酸相当的氨基酸变为精氨酸;SEQIDNO:164的氨基酸位置103的苯丙氨酸相当的氨基酸变为甘氨酸;SEQIDNOa64的氨基酸位置110的脯氨酸相当的氨基酸变为甘氨酸;SEQIDNO:164的氨基酸位置114的酪氨酸相当的氨基酸变为亮氨酸;SEQIDNO:164的氨基酸位置157的丙氨酸相当的氨基酸变为丝氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相当的氨基酸变为苯丙氨酸;SEQIDNO:164的氨基酸位置550的脯氨酸相当的氨基酸变为天冬酰胺;或SEQIDNO:164的氨基酸位置590的甘氨酸相当的氨基酸变为精氨酸。161.权利要求48所述的分离的或重组的多肽,其中所述多肽具有如下所示的序列(i)SEQIDNO:164,具有碱性内切葡聚糖酶/纤维素酶活性;25(ii)SEQIDNO:110,具有木聚糖酶活性;(iii)SEQIDNO:12,具有NAD结合氧化还原酶活性;(iv)SEQIDNO:118,具有短链脱氢酶活性;(v)SEQIDNO:14,具有NADH依赖性脱氢酶活性;(vi)SEQIDNO:138,具有肽酶活性;(vii)SEQIDNO:162,具有碱性内切葡聚糖酶活性;(viii)SEQIDNO:42,具有半胱氨酰tRNA合成酶活性;(viii)SEQIDNO:32,具有纤维糊精磷酸化酶活性;(ix)SEQIDNO:50,具有fdhd/narq氧化还原酶活性;(x)SEQIDNO:54,具有自由基S-腺苷蛋氨酸(SAM)甲基转移酶活性;或35(xi)SEQIDNO:58,具有枯草蛋白酶样蛋白酶活性。全文摘要本发明涉及分子和细胞生物学和生物化学。一方面,本发明提供具有纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性的多肽,编码这些多肽的多核苷酸,以及制备和使用这些多核苷酸和多肽的方法。一方面,本发明涉及多肽纤维素酶活性,例如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性,包括热稳定和耐热的活性,以及编码这些酶的多核苷酸,以及制备和使用这些多核苷酸和多肽的方法。本发明的多肽可以被用于各种药物、农业、食物和饲料加工和工业环境中。文档编号C12P21/06GK101175860SQ200680016175公开日2008年5月7日申请日期2006年1月13日优先权日2005年3月15日发明者D·百隆,J·耿斯奇,M·迪凯科申请人:维莱尼姆公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1