磷脂酶、编码它们的核酸及其制备和应用方法

文档序号:439156阅读:744来源:国知局

专利名称::磷脂酶、编码它们的核酸及其制备和应用方法
技术领域
:0002总体上说,本发明涉及磷脂酶、编码磷脂酶的多核苷酸、制备以及使用这些多核苷酸和多肽的方法。特别地,本发明提供了具有磷脂酶活性的新颖多肽、编码它们的核酸以及与它们结合的抗体。也提供了包括应用这些磷脂酶的工业方法和产
背景技术
:0003磷脂酶是水解磷脂中的酯键的酶。与它们在磷脂代谢中的重要性相对应,这些酶广泛存在于真核和原核细胞中。磷脂酶影响生物膜的代谢、形成和再组织,并且磷脂酶也参与信号的级联作用。已经知道了几种类型的磷脂酶,按照磷脂分子中受到攻击的键的位置,它们在特异性上有所不同。磷脂酶A1(PLA1)除去l-位的脂肪酸,产生游离的脂肪酸和l-溶血-2-酰基磷脂(l-lyso-2-acylphospholipid)。磷脂酶A2(PLA2)去除2-位的脂肪酸,产生游离的脂肪酸和l-酰基-2-溶血磷脂(l-acyl-2-lysophospholipid)。PLA1和PLA2酶可以是胞内酶或胞外酶,是膜结合的酶或者可溶性酶。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC)去除磷酸部分,产生1,2二酰基甘油和磷酸酯。磷脂酶D(PLD)产生1,2-二酰基甘油磷酸和碱性基团(basegroup)。PLC和PLD对于细胞功能和信号传导是重要的。PLD是生物催化中主要的磷脂酶(参见,如,Godfrey,T.禾BWestS.(1996)Industrialenzymology,299-300,StocktonPress,NewYork)。马铃薯块茎储藏蛋白(Patatins)是另一类磷脂酶,据认为其作用如同PLA(参见例如,HirschbergHJ,等,(2001),EurJBiochem268(19):5037-44)。0004常见的含油种子,如大豆、油菜籽、向日葵籽、米糠油、芝麻和花生被用作油的来源和原料。在搾油过程中,种子被机械和热处理。用溶剂从粗粉(meal)中分离和分开油。然后应用蒸馏法,从油中分离出溶剂并回收。油经过"脱胶(degummed)"并且进行精炼。粗粉中的溶剂组分可以通过"脱溶剂烤炉(desolventizertoaster)"的热处理而蒸发掉,随后,粗粉干燥和冷却。当溶剂通过蒸馏分离掉以后,产生的粗油利用特殊的脱胶程序和物理精炼的方法加工成为食用油。它也可以作为原料用于产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animalrations)。0005脱胶是植物油精炼的第一步,脱胶的目的是去除与油一起被抽提、但干扰随后的油加工的污染磷脂。这些磷脂仅仅以无水形式溶于植物油中,如果简单地被水合,磷脂可以被沉淀并去除。水合作用一般通过小比例的水与充分干燥的油连续混合来完成。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1至lj1.5%。虽然在5(TC到80'C的范围内,油的粘度降低,水合胶的分离效果更好,但是温度条件并不非常严格。0006很多油脱胶(oildegumming)的方法目前都在使用。油脱胶的过程可以通过使用磷脂酶酶法协助进行。磷脂酶Al和A2已经在各种商业方法中用于油脱胶,如"ENZYMAXTM脱胶"(LurgiLifeScienceTechnologiesGmbH,Germany)。也已经考虑将磷脂酶C(PLC)应用于油的脱胶作用,因为磷脂酶C在磷脂上作用产生的磷酸盐部分是极易溶于水的,并且容易去除,而且甘油二酯会与油在一起,降低了损失;参见,如Godfrey,T.禾卩WestS.(1996)IndustrialEnzymology第299-300页,StocktonPress,NewYork;Dahlke(1998)"Anenzymaticprocessforthephysicalrefiningofseedoils,"Chem.Eng.Technol.21:278-281;Clausen(2001)"Enzymaticoildeg腿mingbyanovelmicrobialphospholipase,"Eur.J.LipidSci.Technol.103:333-340。0007高磷脂油,例如黄豆、油菜和向日葵油的处理方法不同于别的油如棕榈的处理方法。不像低磷脂油的蒸气或"物理精炼"处理,这些高磷油需要特别的化学和机械处理,以去除含磷的磷脂。这些油一般在这样的过程中化学精炼,该过程必需中和游离脂肪酸,以形成皂和不溶性的胶成分。中和过程对于去除游离脂肪酸和磷脂非常有效,但是该过程也导致产率和质量显著降低。在一些情况下,高磷脂的粗制油在碱中和之前的步骤中进行脱胶。用于卵磷脂的大豆油就是这种情况,其中的油首先用水或者酸来脱胶。0008植物固醇(phytosterols)(植物甾醇(plantsterols))是天然产物三萜家族的成员,其包括100种以上不同的植物固醇和4000种以上其它种类的三萜。一般而言,据认为,植物甾醇是由于甾醇/磷脂配给量增加导致膜硬化,从而稳定植物膜。在化学上,植物甾醇在结构上非常类似于胆固醇,并被认为调节植物膜的膜流动性,如胆固醇在动物膜中所做的那样。主要的植物甾醇是P-谷甾醇、菜油甾醇和豆留醇。其它的植物甾醇包括豆甾烯醇(二氢(3-谷甾醇)、二氢谷甾醇、24-脱氢胆固醇、二氢菜油甾醇、海绵甾醇(chalinasterol)、多孔甾醇、,谷甾醇和菜籽甾醇。0009植物留醇是健康和营养行业中的重要的农产品。它们是用于制造化妆品的有用乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和类似物以及它们的酯己经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物甾醇通过在肠腔中抑制胆固醇的吸收来降低血清胆固醇水平,并且植物甾醇在极低的浓度时便具有免疫调节特性,包括T淋巴细胞的增强的细胞应答和抗癌细胞系的天然杀伤细胞的细胞毒性能力。此外,它们的治疗效应已在治疗肺结核、风湿性关节炎、控制HIV感染的病人和抑制马拉松选手的免疫压力的临床研究中已经得到证明。0010植物甾醇的酯类,也指植物甾醇酯,由美国食品药品管理局(FDA)批准为GRAS(—般认为安全,GenerallyRecognizedAsSafe),用于人造黄油,并在1999年得到推广。2000年9月,FDA也提出一个试行规定,该规定准许了含有植物甾醇酯类的食品使用健康声明标记(hea他-claiminglabeling)。因此,用植物甾醇酯类强化的食品非常有望受到消费者的青睐。0011大豆油被广泛使用,是重要的粮食,占来自种子和水果的油产量的约30%。大豆仅含有20%的油,在商业规模上通常通过使用溶剂诸如己垸来提取。其油公认的质量和粗粉蛋白的营养价值使得大豆成为首要的含油种子。在提取之前,大豆必需清洗,破碎并去皮,这是因为对油来说有效的溶剂提取需要破碎每一个油细胞以提高物质转移水平。细胞壁主要由纤维素——其与半纤维素相关、果胶物质和木质素组成,细胞壁也可以用酶破碎,以显著提高提取产量和速度。0012二酰甘油(DAG)油是食用油,比天然脂肪酸含有80%或更多的DAG。已经显示,在人中,消化DAG油乳剂之后,相比具有类似的脂肪酸组成的TAG油,餐后乳糜微粒中的甘油三脂的升高水平明显较低。在以日本男子和美国男子和女子为对象的研究中,长期食用DAG油促进体重减轻和身体脂肪减少。一项研究显示,用DAG油取代普通的烹饪油降低肥胖和其它危险因素的发生率。发明概述0013本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多个的残基范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77Q/o、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的、合成的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一种多肽,所述磷脂酶活性例如磷脂酶A(PLA)、磷脂酶C(PLC)或磷脂酶D(PLD)活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。一方面,所述序列同一性通过用序列比较算法分析或者通过目测检查来确定。0014本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850更多个连续残基范围内具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的、合成的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一种多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。一方面,所述序列同一性通过用序列比较算法分析或者通过目测检查来确定。0015在可选的方面,分离的、合成的或者重组的核酸编码这样的多肽,其包括具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中列出的序列。一方面,这些多肽具有磷脂酶,例如磷脂酶A、B、C或D的活性,或磷脂酶活性的任何组合,例如PLA、PLC禾口/或PLD活性-作为多功能活性。0016在一方面,序列比较算法是BLAST算法,如BLAST2.2.2版算法。一方面,过滤设置(filteringsetting)设为blastall-p,blastp-d"nrpataa"-FF,所有其它选项设为默认值。0017在可选的方面,分离的、合成的或者重组的核酸编码这样的多肽,其具有磷脂酶活性,但缺少;信号序列或原蛋白序列(proproteinsequences),或者同源启动子序列;或者本发明的核酸(多核苷酸)编码具有磷脂酶活性以及进一步包括异源28氨基酸序列的多肽,或者本发明的核酸(多核苷酸)包括异源核苷酸序列;或者本发明的核酸(多核苷酸)包括由编码异源(前导)信号序列、或标记或表位的序列,或由编码异源(前导)信号序列、或标记或表位的序列组成,或者异源核苷酸序列包括异源启动子序列;或者本发明的核酸(多核苷酸)包括编码异源(前导)信号序列的异源核苷酸序列,其包括N-末端和/或C-末端延伸或由N-末端和/或C-末端延伸组成,用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者该异源序列编码限制性位点;或者本发明的核酸(多核苷酸)包括异源启动子序列,其包括组成型或诱导型启动子、或者细胞类型特异性启动子、或者植物特异性启动子或者细菌特异性启动子,或由这些启动子组成。0018一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽(anoilseed)的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性;或马铃薯块茎蛋白(patatin)活性,或其组合。磷脂酶活性可以包括水解糖蛋白,例如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。一方面,本发明的磷脂酶可以具有多功能的活性,例如本文中描述的一种或多种酶活性的组合,例如本发明的磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB禾Qpatatin活性;PLC禾npatatin活性;PLD禾BPLA;PLD、PLA、PLB禾口PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。0019例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘油三酯)部分的任何酶活性。在特定的方法中使用这种多肽可能是有利的,例如在脱胶方法中,中性油部分不受损(不减少,例如不水解)是重要的。因此,一方面,本发明提供了脱胶方法,该方法包括使用本发明的具有磷脂酶活性但不具有脂酶活性的多肽。0020一方面,分离的、合成的或重组的核酸编码具有磷脂酶活性的多肽,其是热稳定性的。例如本发明的多肽,举例来说——例如本发明的变体或者进化的酶,例如SEQIDN0:2、SEQIDNO:175、SEQIDNO:176、SEQIDNO:177和SEQIDNO:178的具体变异,如表5和实施例4所述一一可以是热稳定性的。根据本发明的热稳定性多肽可在包括温度范围为约-100'C至约-8(TC、约-80。C至约-4(TC、约-4(TC至约-20。C、约-20。C至约0。C、约(TC至约37。C、约0。C至约5'C、约5。C至约15。C、约15。C至约25。C、约25。C至约37。C、约37。C至约45。C、约45。C至约55°C、约55°C至约7fTC、约70"C至约75°C、约75。C至约85°C、约85。C至约卯。C、约90。C至约95°C、约95。C至约IO(TC、约IO(TC至约105°C、约105。C至约IIO'C、约110。C至约120°C、或者95。C、96°C、97°C、98°C、99。C、100。C、101°C、102°C、103°C、104°C、105。C、106°C、107°C、108°C、109。C、ll(TC、111°C、112°C、113。C、114°C、115°C或更高温度的条件下,保持结合和/或酶活性,例如磷脂酶活性。根据本发明的热稳定性多肽可在范围为约-10(TC至约-8(rC、约-80。C至约-4(TC、约-40。C至约-2(TC、约-20"至约0°C、约(TC至约5°C、约5。C至约15°C、约15。C至约25°C、约25。C至约37°C、约37。C至约45"C、约45。C至约55。C、约55。C至约7(TC、约70。C至约75。C、约75。C至约85°C、约85。C至约90°C、约90。C至约95°C、约95。C至约IO(TC、约IOO'C至约105。C、约105。C至约11(TC、约110。C至约120。C的温度、或者95。C、96。C、97。C、98。C、99°C、IOO'C、101°C、102。C、103。C、104。C、105°C、106°C、107。C、108。C、109°C、IIO'C、lirC、112。C、113°C、114°C、115。C或更高的温度中,保持活性,例如磷脂酶活性。在一些实施方式中,根据本发明的热稳定性多肽在上述温度范围,在约pH3.0、约pH3.5、约pH4.0、约pH4.5、约pH5.0、约pH5.5、约pH6.0、约pH6.5、约pH7.0、约pH7.5、约pH8.0、约pH8.5、约pH9.0、约pH9.5、约pH10.0、约pH10.5、约pHll.O、约pH11.5、约pH12.0或更高pH下,保持活性,例如磷脂酶活性。0021在另一个方面,分离的、合成的或重组的核酸编码具有磷脂酶活性的多肽,其是耐热的。例如本发明的多肽,举例来说——例如本发明的变体或者进化的酶,例如SEQIDN0:2、SEQIDNO:175、SEQIDNO:176、SEQIDNO:177和SEQIDNO:178的具体变异,如表5和实施例4和7所述——是耐热的或热活性的。根据本发明的耐热多肽可在暴露于包括温度范围为约-10(TC至约-8(rC、约-8(TC至约-4(TC、约-40。C至约-2(TC、约-20。C至约(TC、约(TC至约5。C、约5'C至约15°C、约15。C至约25°C、约25°。至约37°C、约37。C至约45°C、约45°〇至约55°C、约55°〇至约70°C、约70。C至约75°C、约75。C至约85°C、约85。C至约90°C、约9(TC至约95°C、约95°C至约IOO'C、约IO(TC至约105°C、约105。C至约110。C、约ll(TC至约120°C、或95。C、96。C、97°C、98°C、99°C、100°C、101°C、102°C、103°C、104。C、105°C、106°C、107°C、108°C、109°C、110°C、111。C、112°C、113°C、114。C、115。C或更高温度的条件后,保持结合和/或酶活性,例如磷脂酶活性。根据本发明的耐热多肽可在暴露于范围约-100。C至约-8(rC、约-8(TC至约-40。C、约-4(rC至约-2(TC、约-20。C至约0。C、约(TC至约5'C、约5'C至约15°C、约15。C至约25°C、约25。C至约37°C、约37'C至约45°C、约45。C至约55°C、约55。C至约70°C、约7(TC至约75°C、约75。C至约85°C、约85。C至约90。C、约90。C至约95°C、约95。C至约IO(TC、约100。C至约105。C、约105。C至约U0。C、约110。C至约120。C的温度、或95。C、96°C、97°C、98°C、99°C、100°C、101。C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、ll(TC、nrc、ii2°c、ii3°c、i"°c、115r或更高的温度后,保持活性,例如磷脂酶活性。一方面,该多肽在pH4.5下暴露于高于9(TC至约95'C范围的温度后,保持磷脂酶或其它活性。0022一方面,分离的、合成的或重组的核酸包括在严格条件下,与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、謂0F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示序列杂交的序列,其中该核酸编码具有磷脂酶活性的多肽。如本文所述,核酸的长度上可以为至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或更多残基或者是基因或者转录体的全长,具有或者不具有信号序列。如此处所述,严格条件可以是高度严格、中度严格或者低严格性。严格条件可以包括洗涤步骤,如,包括在0.2xSSC,大约65'C的温度下洗涤大约15分钟的洗涤步骤。0023本发明提供用于鉴定编码具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探针,其中该探针包括本发明的序列,例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示序列的至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或者更多的连续碱基,并且该探针通过结合或者杂交鉴定核酸。该探针可包括寡核苷酸,该寡核苷酸包括根据本发明序列的约10-100个之间的连续碱基,或者是其片段或子序列,例如在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示序列的10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基或者更多碱基,或任何所期望的长度。0024本发明提供了用于鉴定编码具有磷脂酶,如磷脂酶活性多肽的核酸的核酸探针,其中该探针包括本发明的核酸,例如在至少大约10、20、30、40、50、60、70、80、卯、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多连续残基的范围内,与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、31D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示的序列或者它们的子序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)的序列同一性的核酸,并且一方面,序列同一性通过序列比较算法分析或者通过目测检查确定。0025本发明提供用于扩增编码具有磷脂酶活性多肽的核酸的扩增引物序列对,其中该引物对能够扩增包括本发明的序列或者片段或者其子序列的核酸。一个或每一个扩增引物序列对的成员可以包括含有该序列至少大约10到50个连续碱基,或者该序列大约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个或更多个连续碱基的寡核苷酸。0026本发明提供扩增引物对,其中该引物对包括第一成员和第二成员,其中第一成员具有本发明核酸的大约前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个或更多个残基所示的序列,第二成员具有第一成员互补链的大约前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或者25个或更多个残基所示的序列。0027本发明提供了使用本发明的扩增引物对通过扩增,例如聚合酶链式反应(PCR)产生的磷脂酶。本发明提供了应用发明的扩增引物对通过扩增,例如聚合酶链式反应(PCR)制备磷脂酶的方法。一方面,扩增引物对扩增来自文库的核酸,例如基因文库,如环境文库。0028本发明提供了扩增编码具有磷脂酶活性的多肽的核酸的方法,包括用能够扩增本发明核酸序列或者片段或者其子序列的扩增引物序列对来扩增模板核酸序列。该扩增引物对可以是本发明的扩增引物对。0029本发明提供包括本发明的核酸或者其子序列的表达盒(expressioncassettes)。一方面,表达盒可以包括可操作性地连接于启动子的核酸。启动子可以是病毒的、细菌的、哺乳动物的或者植物的启动子。一方面,植物启动子可以是马铃薯、水稻、玉米、小麦、烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面,启动子可以是诱导型启动子。一方面,启动子可以是组织特异性启动子或者环境调控或者发育调控的启动子。因此,启动子可以是,例如种子特异性、叶特异性、根特异性、茎特异性或者脱落诱导启动子。一方面,表达盒可以进一步包括植物表达载体或者植物病毒表达载体。0030本发明提供包括本发明的表达盒(如载体)或者本发明的核酸的克隆载体。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒(phagemid)、粘粒、F粘粒(fosmid)、细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体,逆转录病毒载体或者腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体Pl衍生载体(PAC)、酵母人工染色体(YAC)、或者哺乳动物人工染色体(MAC)。0031本发明提供含有本发明核酸或者本发明表达盒(如,载体)或者本发明克隆载体的转化细胞。一方面,转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。一方面,植物细胞可以是马铃薯、小麦、水稻、玉米、烟草或者大麦细胞。0032本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基因非-人类动物。在一方面,动物是小鼠、大鼠、兔、羊、猪或奶牛或其它哺乳动物。0033本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基因植物。转基因植物可以是玉米植物、马铃薯植物、番茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。本发明提供包括本发明的核酸或本发明的表达盒(例如,载体)的转基因种子。转基因种子可以是玉米种子、小麦仁、油籽、油菜籽(油菜植物)、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生、水稻或烟草植物种子。0034本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。0035本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。反义寡核苷酸的长度可以是大约10到50、大约20到60、大约30到70、大约40到80、大约60到100、大约70到110或者大约80到120个碱基。0036本发明提供抑制磷脂酶如细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供包括本发明序列的子序列的双链抑制性RNA(RNAi)分子。在一方面,RNAi长度是大约15、16、17、18、19、20、21、22、23、24、25或者更多的双链核苷酸。本发明提供抑制磷脂酶如细胞内磷脂酶表达的方法,该方法包括向细胞施用或者在细胞中表达双链抑制性RNA(RNAi),其中该RNA包括本发明序列的子序列。0037本发明提供了分离的、合成的或重组的多肽,该多肽包含与本发明示例性的多肽或肽(例如具有一个或多个E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D訓L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R突变的SEQIDNO:175或SEQIDNO:176)在多肽的至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、225、250、275、300、325、350、400、450、500、550或600或更多残基,或多肽的全长范围内,具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,或更大,或完全的(100%)序列同一性的氨基酸序列;并且,一方面,序列同一性通过序列比较算法分析或者通过目测观察来确定。0038一方面,本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176具有至少大约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的、合成的或者重组的多肽。0039本发明提供由本发明的核酸编码的分离的、合成的或者重组的多肽。在可选的方面,多肽可以具有如在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176中所示的序列。多肽可以具有磷脂酶活性,如磷脂酶A、B、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘油三酯)部分的任何酶活性。一方面,本发明提供了脱胶方法,该方法包括使用具有磷脂酶活性但不具有脂酶活性的本发明的多肽,这样在脱胶方法中,任何中性油部分不受损害(减少、改变、降解,例如水解)。0040在可选的方面,本发明的多肽具有磷脂酶活性,但缺乏信号序列或原蛋白序列;或者,具有磷脂酶活性以及进一步包括异源氨基酸序列,或者本发明的核酸(多核苷酸)包括异源核苷酸序列。一方面,异源氨基酸序列包括编码异源(前导)信号序列、或标记或表位的序列、或由之组成,或者异源核苷酸序列包括异源启动子序列;一方面,异源(前导)信号序列包括N-末端和/或C-末端延伸或由之组成,其用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者该异源序列编码限制性位点。0041本发明提供了含有缺乏信号序列的本发明多肽的分离的、合成的或者重组的多肽。一方面,缺乏信号肽的多肽与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176的残基30到287具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多序列同一性。序列同一性通过序列比较算法分析或者通过目测观察确定。0042本发明的另一方面提供分离的、合成的或者重组的多肽或者肽,该分离的、合成的或者重组的多肽或者肽包括本发明的多肽或肽序列、与之基本相同的序列,和与之互补的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或者100或者更多的连续碱基。该肽可以是,例如,免疫源性的片段、基序(如结合位点)或者活性位点。0043一方面,本发明分离的、合成的或重组的多肽(有或无信号序列)具有磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性,或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性;或patatin活性,或其组合。例如,一方面,磷脂酶活性包括本文中描述的一种或多种酶活性的组合,例如磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin活性;PLD禾BPLA;PLD、PLA、PLB禾卩PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。0044磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。0045一方面,分离的、合成的或者重组的多肽可以包括缺乏信号序列的本发明的多肽。一方面,分离的、合成的或者重组的多肽可以包括含有异源信号序列,如异源磷脂酶或者非-磷脂酶信号序列的本发明多肽。0046一方面,本发明提供包括第一结构域和至少第二结构域的嵌合蛋白,第一结构域包括本发明的信号序列。该蛋白可以是融合蛋白。第二结构域可以包括酶。酶可以是磷脂酶。0047本发明提供包括至少第一结构域和至少第二结构域的嵌合多肽,第一结构域包括发明的信号肽(SP)或本发明磷脂酶的催化结构域(CD),或活性位点,第二结构域包括异源多肽或肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。一方面,异源多肽或者肽不是磷脂酶。异源多肽或者肽可以在信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者羧基和氨基末端。0048本发明提供编码嵌合多肽的分离的、合成的或者重组的核酸,其中嵌合多肽包括至少第一结构域和至少第二结构域,第一结构域含有本发明多肽的信号肽(SP)或者催化结构域(CD)或者活性位点,第二结构域包括异源多肽或者肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。0049一方面,磷脂酶活性包括在大约37i:下,每毫克蛋白大约IO到大约100单位范围的比活性。另一方面,磷脂酶活性包括每毫克蛋白大约100到大约1000单位,大约500到大约750单位范围的比活性。可选地,磷脂酶活性包括在37'C下每毫克蛋白大约100到大约500单位的比活性。在一方面,磷脂酶活性包括在37。C下每毫克蛋白大约500到大约1200单位的比活性。另一方面,磷脂酶活性包括在37'C下每毫克蛋白大约750到大约1000单位的比活性。另一方面,耐热性包含经加热至升高的温度以后,在37"C下仍保持磷脂酶至少一半的比活性。可选地,耐热性包含经加热至升高的温度——例如约(TC至约20°C、约20'C至约37°C、约37。C至约50°C、约50。C至约70°C、约70。C至约75°C、约75。C至约80°C、约80。C至约85°C、约85°C至约90°C、约卯。C至约95°C、约95。C至约100°C、约IO(TC至约110。C或更高的温度以后,在37。C下仍保持每毫克蛋白大约500到大约1200单位的比活性。可选地,耐热性可包括经加热至升高的温度以后,在37。C下仍保持每毫克蛋白大约1至大约1200单位、或每毫克蛋白大约500至大约1000单位的比活性。另一方面,耐热性可包括经加热至如上所述的升高的温度以后,在37。C下仍保持每毫克蛋白大约1至大约500单位的比活性。0050本发明提供本发明分离的、合成的或者重组的多肽,其中多肽包括至少一个糖基化位点。一方面,糖基化可以是N-连接糖基化。一方面,多肽可以是在巴斯德毕赤酵母(PpaWw^)或者粟酒裂殖酵母(S.pow&)中表达后进行糖基化。0051本发明提供了磷脂酶和编码它们的核酸,该磷脂酶具有本发明任何示例性磷脂酶的序列,其中一个或多个或所有糖基化位点被改变,如上所述。因此,本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法,其中该方法包括修饰本发明的磷脂酶编码序列,这样,一个、多个或所有N-连接的糖基化位点编码基序被修改为非糖基化基序。本发明也提供了由该方法制得的磷脂酶编码序列,和它们编码的酶。0052本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有增加的耐受性的磷脂酶,该方法包括将等同于具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176的位置131的氨基酸修改成一个、多个或所有下述残基赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);蛋氨酸(M);亮氨酸(L)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。0053本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有减少的耐受性的磷脂酶,该方法包括将等同于具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171、VE41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176的位置131的氨基酸修改成一个、多个或所有下述残基色氨酸(W);谷氨酸(E);酪氨酸(Y)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。0054本发明提供包括本发明多肽的蛋白制备物,其中蛋白制备物包括液体、固体或者凝胶制备物。0055本发明提供包括本发明多肽和第二种蛋白或者结构域的异源二聚体。异源二聚体的第二个成员可以是不同的磷脂酶、不同的酶或者另一种蛋白。在一方面,第二个结构域可以是多肽,且异源二聚体可以是融合蛋白。在一方面,第二个结构域可以是表位(抗原决定簇)或者标记。在一方面,本发明提供包括本发明多肽的同源二聚体。0056本发明提供具有磷脂酶活性的固定化多肽,其中多肽包含本发明的多肽,本发明核酸编码的多肽,或者包括本发明多肽和第二个结构域的多肽(例如融合蛋白)。在一方面,本发明多肽固定在细胞、细胞小泡、脂质体、薄膜(film)、膜(membrane)、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、晶体、片剂、丸、胶囊、粉末、附聚物、表面、多孔结构、阵列或者毛细管上。一方面,本发明的多肽固定在物质诸如谷物、果壳、树皮、皮、毛发、釉质、骨、壳和由它们衍生的物质,或动物词料物质,或其组合上。0057本发明的多肽(例如磷脂酶)也可以单独存在或以磷脂酶混合物或磷脂酶与其它水解酶混合物的形式存在,其它水解酶诸如纤维素酶、木聚糖酶、蛋白酶、脂酶、淀粉酶、或氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶。它们可以配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸、丸粒,或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、胶囊、小泡或胶束悬浮液。一方面,本发明的这些制剂可以包括任何下述组分或它们的组合-多元醇如聚乙二醇、聚乙烯醇、丙三醇,糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麦芽糖;胶凝剂如瓜尔树胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶;盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及其衍生物的盐;金属螯合剂如EDTA、EGTA、柠檬酸钠;抗微生物剂如脂肪酸、其衍生物、对羟基苯甲酸酯、山梨酸酯、苯甲酸盐;抑制蛋白酶作用的其它化合物如大体积蛋白质(bulkprotein),诸如BSA;小麦水解产物;硼酸盐化合物;乳化剂如非离子型和离子型洗涤剂可以单独或组合使用;植物甾醇;维生素;氨基酸;还原剂如半胱氨酸或抗氧化化合物如抗坏血酸可以包括在内以及分散剂。0058一方面,交联和蛋白质修饰作用如聚乙二醇化、脂肪酸修饰和糖基化被用于提高本发明多肽的稳定性(例如酶稳定性)。一方面,多元醇和/或糖占制剂的约5%至约60%,或更多,制剂的约10%至约50%、制剂的约20%至约40%、或制剂的约5%至约20%。另一方面,胶凝剂占制剂的约0.5%至约10%、制剂的约1%至约8%、制剂的约2%至约5%、或制剂的约0.5%至约3%。另一方面,盐如氯化钠、硫酸钠、硫酸铵、氯化钙和/或氯化镁占制剂的约1%至约30%、制剂的约2%至约20%、制剂的约5%至约15%、或制剂的约1%至约10%。另一方面,氯化锌以包括约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。又在另一个方面,硫酸锌以包括约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。在另一个方面,脂肪酸和/或其衍生物的盐占制剂的约5%至约40%、制剂的约10%至约30%、制剂的约15%至约25%、或制剂的约5%至约20%。另一方面,金属螯合剂如EDTA、EGTA和/或柠檬酸钠以包括0.1mM至约10mM、约0.5mM至约8mM、约1mM至约5mM或约0.1mM至约1mM的浓度存在于制剂中。另一方面,抗微生物剂如对羟基苯甲酸酯类、山梨酸酯和/或苯甲酸盐占制剂的约0.01%至约10%、制剂的约0.05%至约5%、制剂的约0.1%至约1%、或制剂的约0.05%至约0.5%。又在另一个方面,大体积蛋白质如BSA和/或小麦水解产物占制剂的约1%至约20%、制剂的约5%至约15%、制剂的约2.5%至约7.5%、或制剂的约1%至约5%。另一方面,乳化剂如非离子型和/或离子型洗涤剂以一定浓度存在于制剂中,该浓度包括约lx临界胶束浓度(CMC)至约10xCMC,约2.5xCMC至约7.5xCMC,约lxCMC至约5xCMC,或约3x至约6xCMC。在另一个方面,维生素、氨基酸、还原剂和/或抗氧化化合物占制剂的约0.1%至约5%、制剂的约0.5%至约4%、制剂的约1%至约2.5%、制剂的约0.1%至约1%。0059本发明提供包含固定化多肽的阵列,其中多肽是本发明的磷脂酶或者本发明核酸编码的多肽。本发明提供含有本发明的固定化核酸的阵列。本发明提供含有本发明的固定化抗体的阵列。0060本发明提供特异性地结合于本发明多肽或者本发明的核酸编码的多肽的分离的、合成的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。本发明提供含有本发明抗体的杂交瘤。0061本发明提供分离和鉴定具有磷脂酶活性的多肽的方法,包括以下歩骤(a)提供本发明的抗体;(b)提供含有多肽的样品;以及(c)在抗体能够特异性地结合于该多肽的条件下,将步骤(b)的样品与步骤(a)的抗体接触,从而分离和鉴定磷脂酶。本发明提供制备抗-磷脂酶抗体的方法,包括向非人类动物施用足以产生体液免疫应答的量的本发明核酸或者本发明多肽,从而制备抗磷脂酶抗体。0062本发明提供生产重组多肽的方法,包含以下的步骤(a)提供可操作地连接于启动子的本发明的核酸,以及(b)在允许多肽表达的条件下表达步骤(a)的核酸,从而生产重组多肽。该核酸可以包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176在至少大约100个残基的区域内具有至少85%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。核酸可以包括在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、所示的核酸杂交的核酸。该方法可以进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,从而在转化细胞中生产重组多肽。该方法可以进一步包括把步骤(a)的核酸插入到非人类动物宿主中,随后表达步骤(a)的核酸,从而在非人动物宿主中生产重组多肽。0063本发明提供鉴定具有磷脂酶活性的多肽的方法,包括以下的步骤(a)提供本发明的多肽或由本发明核酸编码的多肽,或其片段或变体,(b)提供磷脂酶底物;和(c)将步骤(a)的多肽或其片段或变体与步骤(b)的底物接触,并检测底物量的增加或者反应产物量的减少,其中底物量的减少或者反应产物量的增加说明检测到了具有磷脂酶活性的多肽。在可选的方面,核酸包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D71V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约100个残基的范围内具有至少85%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选的方面,核酸可以在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列杂交。0064本发明提供确定磷脂酶底物的方法,包括以下步骤(a)提供本发明的多肽或者本发明核酸编码的多肽;(b)提供测试底物;以及(c)将步骤(a)的多肽与步骤(b)的测试底物接触,检测底物量的增加或者反应产物量的减少,其中底物量的减少或者反应产物量的增加确定测试底物为磷脂酶底物。在可选的方面,核酸可以与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选的方面,核酸在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D00F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列杂交。0065本发明提供确定化合物是否特异性地与磷脂酶结合的方法,包括以下步骤(a)在允许核酸翻译成多肽的条件下,表达核酸或者包含该核酸的载体,其中该核酸和载体包括本发明的核酸或者载体;或者,提供本发明的多肽,(b)使多肽与测试化合物接触;和(c)确定测试化合物是否特异性地与多肽结合,从而确定该化合物是否特异地与磷脂酶结合。在可选的方面,核酸序列与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。在可选的方面,核酸在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列或其子序列杂交。0066本发明提供鉴定磷脂酶活性的调节物的方法,包括以下步骤(a)提供本发明的多肽或者本发明核酸编码的多肽;(b)提供测试化合物;以及(c)将歩骤(a)的多肽与步骤(b)的测试化合物接触;并测定磷脂酶的活性,其中在测试化合物存在的条件下测得的磷脂酶活性与在无测试化合物存在的条件下测得的磷脂酶活性相比的变化证明测试化合物调节磷脂酶的活性。在可选的方面,核酸可以与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约100个残基的范围内,具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。在可选的方面,核酸可以在严格的条件下与选自具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、EI25K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列或其子序列的核酸序列杂交。0067一方面,磷脂酶活性通过提供磷脂酶底物并且检测底物量的增加或者反应产物量的减少来测定。与不存在测试化合物的条件下底物或者反应产物的量相比,在存在测试化合物的条件下,底物量的减少或者反应产物量的增加证明测试化合物是磷脂酶活性的激活剂。与不存在测试化合物的条件下底物或者反应产物的量相比,在存在测试化合物的条件下,底物量的增加或者反应产物量的减少证明测试化合物是磷脂酶活性的抑制剂。0068本发明提供包含处理器和数据存储设备的计算机系统,其中所述的数据存储设备上己存储了本发明的多肽序列或者本发明的核酸序列。0069一方面,计算机系统可以进一步包括序列比较算法,和其上己经存储了至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的鉴定器(anidentifier)。0070本发明提供其上已储存了包括本发明多肽序列或本发明核酸序列的序列的计算机可读介质。0071本发明提供了鉴定序列中的特征的方法,包括以下步骤(a)应用鉴定序列的一个或者多个特征的计算机程序来读取序列,其中该序列包括本发明的多肽序列或者本发明的核酸序列;和(b)用计算机程序鉴定序列中的一个或者多个特征。0072本发明提供比较第一序列和第二序列的方法,该方法包括以下步骤(a)应用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括本发明的多肽序列或者本发明的核酸序列;并且(b)用计算机程序确定第一序列和第二序列间的差异。一方面,确定第一序列和第二序列间差异的步骤进一步包括鉴定多态性的步骤。一方面,该方法进一步包括鉴定序列中一个或者多个特征的鉴定器(以及鉴定器的应用)。一方面,该方法包括用计算机程序读取第一序列,并鉴定该序列中的一个或者多个特征。0073本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对能够扩增本发明的核酸(如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178或其子序列,等等);(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与扩增引物对杂交;和(c)将步骤(b)的核酸和步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,从而从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在一方面,扩增引物序列对的每一个成员包括含有本发明的核酸序列的至少大约10到50个连续碱基的寡核苷酸。在一方面,扩增引物序列对是本发明的扩增对。0074本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤(a)提供包含本发明的核酸序列或其子序列的多核苷酸探针;(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)将步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选的方面,环境样品包括水样品、液体样品、土壤样品、空气样品或者生物样品。在可选的方面,生物样品来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞、藻类细胞、地衣细胞或者哺乳动物细胞。0075本发明提供产生编码磷脂酶的核酸的变体的方法,包括以下步骤(a)提供包括本发明核酸的模板核酸;(b)在模板序列中修饰、缺失或者添加一个或者多个核苷酸,或其组合,从而产生模板核酸的变体。0076在一方面,该方法进一步包括表达变异核酸,以产生变体磷脂酶多肽。在可选的方面,修饰、添加或者缺失由易错PCR(error-pronePCR)、重排(shuffling)、寡核苷酸定向诱变(oligonucleotide-directedmutagenesis)、装酉己PCR(assemblyPCR)、有性PCR诱变(sexualPCRmutagenesis)、体内诱变(invivomutagenesis)、盒式诱变(cassettemutagenesis)、回归整体诱变(recursiveensemblemutagenesis)、指数整体诱变(exponentialensemblemutagenesis)、位点特异性诱变(site-specificmutagenesis)、基因重装酉己(genereassembly)、基因{立点饱禾卩诱变(GeneSiteSaturationMutagenesis,GSSM)、合成连接重装配(syntheticligationreassembly,SLR)和/或其组合的方法来引入。在可选的方面,修饰、添加或者缺失通过选自下述的方法引入重组、回归序列重组(recursivesequencerecombination)、硫代磷酸酉旨-修饰的DNA诱变(phosphothioate-modifiedDNAmutagenesis)、含尿卩密卩定的t莫板i秀变(uracil陽containingtemplatemutagenesis)、缺口二重诱变(gappedduplexmutagenesis)、点错酉己修复诱变(pointmismatchrepairmutagenesis)、修复-缺陷型宿主株诱变(repair-deficienthoststrainmutagenesis)、化学诱变、放射诱变、缺失诱变、限制-选择诱变(restriction-selectionmutagenesis)、限帝U-纯化诱变(restriction-purificationmutagenesis)、人工基因合成(artificialgenesynthesis)、整体诱变(ensemblemutagenesis)、嵌合核酸多聚体生成(chimericnucleicacidmultimercreation)禾口/或其组合。0077在一方面,该方法被反复重复,直到产生与模板核酸编码的磷脂酶相比,具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。在一方面,改变的或不同的活性是在酸性条件下的磷脂酶活性,其中模板核酸编码的磷脂酶在酸性条件下没有活性。一方面,改变的或不同的活性是在高温下的磷脂酶活性,其中模板核酸编码的磷脂酶在高温的条件下没有活性。一方面,该方法反复重复,直到产生与模板核酸的密码子选择相比具有改变的密码子选择的磷脂酶编码序列。该方法反复重复,直到产生与模板核酸的信使表达或者信使稳定性相比具有更高或更低水平的信使表达或者信使稳定性的磷脂酶基因。0078本发明提供修饰编码磷脂酶的核酸中密码子以增强其在宿主细胞中表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;(b)鉴定步骤(a)的核酸中的非偏爱(non-preferrd)或者不太偏爱(lesspreferred)的密码子,并且用编码相同氨基酸的偏爱的(或优选的)或者中度使用(neutrallyused)的密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现(出现频率较多,over-represent)的密码子,而非偏爱(或非优选的)或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足(出现频率较少,under-represent)的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。0079本发明提供修饰编码磷脂酶的核酸中的密码子的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;并且(b)确定步骤(a)的核酸中的密码子,并用编码相同氨基酸的不同的密码子作为替代密码子来替换之,从而修饰编码磷脂酶的核酸中的密码子。0080本发明提供修饰编码磷脂酶的核酸中的密码子以增强其在宿主细胞中的表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸,和(b)鉴定步骤(a)的核酸中的非偏爱的或者不太偏爱的密码子,并用编码相同氨基酸的偏爱的或者中度使用的密码子作为替代密码子来替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现的密码子,非-偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。0081本发明提供修饰编码磷脂酶的核酸中的密码子以降低其在宿主细胞的表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;和(b)鉴别步骤(a)的核酸中的至少一个偏爱的密码子,并用编码相同氨基酸的非偏爱的或者不太偏爱的密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现的密码子,非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足的密码子,由此修饰该核酸以减少其在宿主细胞中的表达。在可选的方面,宿主细胞是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞、藻类细胞、地衣细胞或哺乳动物细胞。0082本发明提供产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位点或者第一底物结合位点的序列的第一核酸,该方法包括(a)提供编码第一个活性位点或者第一个底物结合位点的第一核酸,其中第一核酸序列包括本发明的核酸,(b)提供一组在第一核酸的多个靶密码子处编码天然产生的氨基酸变体的诱变寡核苷酸;和(c)应用该组诱变寡核苷酸产生一组编码活性位点或者编码底物结合位点的变体核酸,在每一个被诱变的氨基酸密码子处,变体核酸编码一定范围的氨基酸变异,从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选的方面,本方法包括通过下列的方法诱变步骤(a)的第一核酸,所述方法包括优化的定向进化系统(optimizeddirectedevolutionsystem)、基因位点饱和诱变(GeneSite-SaturationMutagenesis)(GSSM)、合成连接重装配(SLR)。该方法可以进一步包括通过下列方法诱变步骤(a)的第一核酸或变体,所述方法包括易错PCR、重排、寡核苷酸定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点特异性诱变、基因重装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)及其组合。本方法可以进一步包括通过以下的方法诱变步骤(a)的第一核酸或变体,所述方法包括重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。0083本发明提供制备小分子的方法,包括以下步骤(a)提供可以合成或者修饰小分子的多种生物合成酶,其中一种酶包括由本发明核酸编码的磷脂酶;(b)提供步骤(a)的至少一种酶的底物,并且(c)在利于许多生物催化反应进行的条件下,将歩骤(b)的底物和酶反应,通过一系列生物催化反应产生小分子。0084本发明提供修饰小分子的方法,包括以下步骤(a)提供由本发明核酸编码的磷脂酶;(b)提供小分子;和(c)在利于磷脂酶催化的酶反应进行的条件下,将歩骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶酶促反应修饰小分子。一方面,该方法包括提供多种用于步骤(a)的酶的小分子底物,从而产生经修饰的小分子文库,该小分子文库由磷脂酶催化的至少一种酶促反应产生。一方面,该方法可以包括多种其它的酶,在有助于这些酶的多个生物催化反应的条件下使用,以形成由多个酶促反应产生的被修饰小分子的文库。另一方面,该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应,方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子,并鉴定出产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。0085本发明提供用于确定磷脂酶的功能性片段方法,包括以下步骤(a)提供包括本发明氨基酸序列的磷脂酶;和(b)删除步骤(a)序列中的多个氨基酸残基,并且测定剩余子序列的磷脂酶活性,从而确定磷脂酶的功能性片段。一方面,磷脂酶活性通过提供磷脂酶底物,并检测底物量的增加或者反应产物量的减少来测定。一方面,与不存在测试化合物条件下确定的底物或者反应产物的量相比较,在测试化合物存在的条件下,酶底物量的减少或者反应产物量的增加表明测试化合物是磷脂酶活性的激活剂。0086本发明提供切割甘油磷酸酯键的方法,包括以下步骤(a)提供具有磷脂酶活性的多肽,其中该多肽包括本发明的氨基酸序列,或者该多肽由本发明的核酸编码;(b)提供包含甘油磷酸酯键的组合物;和(c)在该多肽切割甘油磷酸酯键的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。一方面,该条件包括大约pH5到大约8.5之间,或者大约pH4.5(或酸性更大,即pH<4.5)到大约9.0(或碱性更大,即pH〉9)之间。一方面,该条件包括大约4(TC到大约7(TC之间的温度。一方面,该组合物包括植物油。一方面,该组合物包括油籽磷脂。一方面,切割反应可以产生水可抽提的磷酸化的碱和甘油二酯。0087本发明提供了水解、分解或破坏含磷脂组合物(或组分)的方法,该方法包括提供具有磷脂酶活性的至少一种本发明的多肽,或由本发明的至少一种核酸编码的具有磷脂酶活性的多肽;提供包含磷脂的组合物;以及在磷脂酶水解、分解或破坏含磷脂组合物的条件下将所述多肽与所述组合物接触。一方面,该方法包括使用高剪切,然后不使用低剪切或使用低剪切,将组合物与至少一种具有磷脂酶活性的本发明的多肽混合,以使磷脂底物与磷脂酶充分"接触"。具有磷脂酶活性的至少一种多肽也可以存在于高剪切混合步骤中。该方法可以以任何规模实施,例如以包括约1克(g)至约500、1000、2000、2500、5000g或更多,或该范围内的任何数量的规模实施。0088本发明提供油脱胶(oildegumming)方法,包括以下步骤(a)提供具有磷脂酶活性的至少一种多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发明的核酸序列编码;(b)提供包括植物油的组合物;和(c)在多肽可以切割植物油中的酯键的条件下,将步骤(a)的多肽与步骤(b)的植物油接触,从而进行油的脱胶。在一方面,植物油包括油籽。植物油可以包括米糠油(ricebranoil)、棕榈油、油菜籽油、玉米油、大豆油、油菜油(canolaoil)、芝麻油、花生油、或者葵花油。在一方面,该方法进一步包括加入本发明的磷脂酶、其它磷脂酶或其组合。一方面,将一种以上具有磷脂酶活性的多肽加入到该方法中,其中至少一种多肽是本发明的酶。一方面,酶以特定顺序加入,例如,具有不同特性的PLC以特定顺序加入,例如具有PC和PE活性的酶被首先加入(或者两种酶同时加入,一种具有PC活性,另一种具有PE活性),然后加入具有PIPLC活性的酶,或其任意组合。0089在油脱胶方法的一个方面,含油组合物包括植物、动物、藻类或鱼的油或脂肪。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、来自棕榈仁的油、油菜油、向日葵油、芝麻油或花生油。多肽可以水解含油组合物中来自水合和/或非水合磷脂的磷脂。一方面,多肽在甘油磷酯键处水解磷脂从而产生甘油二酯和水溶性磷酸盐化合物。一方面,多肽具有磷脂酶C的活性。一方面,多肽是磷脂酶D,且也可以加入磷酸酶。0090在油脱胶方法的一个方面,接触步骤包括水解油中的水合磷脂。水解条件可以包括碱性条件,例如一方面,该条件包括在碱性pH条件下约20r至4(TC的温度。碱性条件可以包括约pH8至pH10,或更大的pH。在该方法的任何时刻,水解条件都可以被变为碱性,例如一方面,在该条件变成碱性之前,加入磷脂酶诸如PLC(例如,含酸诸如磷脂酸的油的"碱中和")。0091在油脱胶方法的一个方面,在PLC的作用下,碱将使1,2-DAG异构成1,3-DAG,1,3-DAG的营养健康价值超过1,2-DAG,例如1,3-DAG作为能源被燃烧掉,而不是作为脂肪储存起来(如1,2-DAG似的)。因此,本发明提供了碱性油精炼方法,其中磷脂酶例如本发明的酶——包括PLC,"在前端"加入,即在加入任何酸和碱之前加入,例如,如图13的示例性方法中所示。在本发明的碱性精炼方法的前端加入PLC(参见下面进一步的论述)以及随后加入酸和碱的结果之一就是产生了提高水平的1,3-DAG(不是l,2-DAG)。这可能是酸或碱催化的酰基转移的结果。从营养角度讲,1,3-DAG胜于1,2-DAG。因此,本发明包括使用本发明的PLC进行的油脱胶方法,因而最终的脱胶油产物含有不少于约0.5%、1.0%、2.0%、3.0%、4.0%或5.0%的1,3-DAG。0092在油脱胶方法的一个方面,水解条件可以包括反应时间约3至10分钟或更多时间。水解条件可以包括在约5(TC至6(TC的温度下,在约pH5至pH6.5,或约pH5至pH7.5,或约pH5至pH8.0的pH,水解油中的水合或非水合的磷脂,反应时间是约30至60分钟。0093在油脱胶方法的一个方面,多肽被结合到过滤器上,并使含磷脂的脂肪或油通过过滤器。该多肽可以被加入到包括含磷脂脂肪或油的溶液中,然后使该溶液通过过滤器。0094在油脱胶方法的一个方面,该方法还包括通过物理的方法除去脱胶方法产生的胶,这是通过加入硬化物质例如云母或等同物进行的。一方面,这增加了油产0095本发明还提供将非水合磷脂转化成水合形式的磷脂的方法,包括以下步骤(a)提供具有磷脂酶活性的多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发明的核酸编码;(b)提供包括非水合磷脂的组合物;和(c)在多肽能够切割非水合磷脂中的酯键的条件下,将步骤(a)的多肽与步骤(b)的非水合磷脂接触,从而将非水合磷脂转化为水合形式。0096本发明提供使油脱胶的方法,包括以下步骤(a)提供包括具有磷脂酶活性的本发明的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含有磷脂的脂肪或者油的组合物;(c)在多肽能够对含磷脂的组合物进行脱胶的条件下(在本发明的多肽能够催化磷脂水解的条件下),将步骤(a)的多肽与步骤(b)的组合物接触。在一方面,含油的组合物包括植物、动物、藻或者鱼的油。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、棕榈仁的油、油菜油、葵花子油、芝麻油或者花生油。多肽可以水解含油组合物中水合和/或非水合磷脂中的磷脂。多肽可以在甘油磷脂键处水解磷脂,产生甘油二酯和水溶性的磷酸盐化合物。多肽可以具有磷脂酶C,B,A或者D的活性。在一方面,加入了磷脂酶D活性和磷酸酶活性。接触可以包括油中的水合磷脂的水解。水解条件可以包括在碱性pH下,温度为大约2(TC到4CTC。碱性条件可以包括大约pH8到pH10的pH。水解条件可以包括反应时间为3到10分钟。水解条件可以包括在温度为大约5(TC到60°C,pH大约为pH5到pH6.5,反应时间为大约30到60分钟,水解油中水合的或者非水合的磷脂。多肽可以结合于过滤器,并使含有磷脂的脂肪或者油通过过滤器。多肽可以加入到包含含磷脂的脂肪或者油的溶液中,然后使溶液通过过滤器。0097本发明提供将非水合的磷脂转化为水合形式的方法,包括以下的步骤(a)提供包括具有本发明磷脂酶活性的多肽,或者由本发明的核酸序列编码的多肽的组合物;(b)提供包括非水合的磷脂的组合物;和(C)在多肽将非水合磷脂转化为水合形式的条件下,将步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性,并且也加入磷酸酶。0098本发明提供碱法精炼含磷脂的组合物的方法,包括以下步骤(a)提供包含磷脂酶的组合物,磷脂酶可以是本发明的具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽;(b)提供包含磷脂的组合物;和(c)在碱法精炼之前,碱法精炼期间或者之后,将步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶活性,例如PLC、PLB、PLD禾n/或PLA活性。多肽可以在碱性精炼之前即在该方法的"前端",在加入酸或碱之前加入,如图13所示。0099多肽(其可以是本发明的酶,例如PLC)可以在碱性精炼期间加入,并根据磷水平和游离脂肪酸的水平,可以加入变化水平的酸或碱。多肽(其可以是本发明的酶)可以在碱性精炼之前或之后加入分离以前,在强力混合器(intensemixer)或恒定混合器(retentionmixer)中;加热步骤之后;在离心机中;在皂脚中;在洗涤水中;和/或在漂白或除臭步骤中。该方法可以包括使用浓的碱溶液,例如浓度比11%的工业标准更高,以降低胶的质量。在可选的方面,浓的碱溶液浓度在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。0100含磷脂的组合物可以包括植物。多肽可以通过转基因的方式在该植物中表达。具有磷脂酶活性的多肽可以在破碎种子或植物其它部分期间加入,或者具有磷脂酶活性的多肽在破碎之后或精炼之前加入。0101还提供了使用本发明的多肽水解油(例如植物油)中的磷脂,以产生二酰甘油(DAG)和水溶性磷酸酯的碱法精炼方法。一方面,本发明的酶必须在碱法精炼方法中,包括任选地低含量水和/或在约55t:至约7(rC的温度范围内操作。在该温度范围内,以低水含量条件使用碱法精炼方法,将通过增加DAG和减少夹带油(entrainedoil)而使产量最大化。一方面,在本发明的碱法精炼方法中使用的酶对磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE)具有非常好的活性,在约pH6至pH9具有活性,在高达75'C下具有活性,在油中的低含量水例如约2%至5%水中具有活性,例如由具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178的序列编码的酶。在本发明用于水解油中磷脂的碱法精炼方法的另一方面,使用了两种酶PI-特异性PLC(水解PI)和水解PC、PE及PA的PC-PLC。该实施方式产生适合于化学或物理精炼的油,并使DAG的产量增加最大化,并减少夹带的油。0102本发明提供纯化植物甾醇或者三萜的方法,包括以下的步骤(a)提供包括本发明的具有磷脂酶活性的多肽或者由本发明核酸编码的多肽的组合物;(b)提供含有植物甾醇或者三萜的组合物;和(c)在多肽可以催化组合物中磷脂的水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇(plantsterol)。该植物甾醇可以来源于植物油。植物油可以包括米糠油、椰子油、油菜油、可可黄油、玉米油、棉籽油、亚麻油、橄榄油、棕榈油、花生油、来自米糠的油、红花油、芝麻油、大豆油或者葵花油。该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇脂肪酸酯。植物甾醇或者三萜可以包括l3-谷甾醇、菜油甾醇、豆甾醇、豆甾垸醇、P-谷留垸醇、谷甾烷醇、链甾醇、海绵甾醇、多孔甾醇、穿贝海绵甾醇或者菜籽甾醇。0103本发明提供精炼粗制油的方法,包括以下步骤(a)提供包括本发明的具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含磷脂的油的组合物;和(c)在多肽催化组合物中的磷脂水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。多肽可以在加入到组合物的水溶液中具有磷脂酶活性。水的水平可以是在0.5到5%之间。处理时间可以大约2小时以下,大约60分钟以下,大约30分钟以下,大约15分钟以下,或者5分钟以下。水解条件可以包括温度范围在大约25。C到7(TC之间。水解条件可以包括使用苛性碱。可以使用碱的浓溶液,例如比11%的工业标准更浓的浓度,以减少胶的质量。在可选的方面,碱的浓溶液是在约12%至50%之间的浓度,例如约20%、30%、40%、50%或60%或更浓的浓度。0104水解条件可以包括pH在大约pH3到pH10之间、在大约pH4到pH9之间、或者在大约pH5到pH8之间。水解条件可以包括在接触步骤(c)后加入乳化剂和/或进行混合。该方法可以包括加入乳化剂破乳剂(emulsifiers-breaker)禾口/或加热或冷却(例如在约(C至约-2(TC之间,或更低温度),来促进水相的分离。该方法可以包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后再加入PLC,PLC和/或PLA以去除非水合的磷脂。该方法可以包括水脱胶粗制油至少于10ppm的磷以获得食用油,以及接着物理精炼至少于大约50ppm的磷以获得生物柴油。该方法可以包括加入酸来增强非水合磷脂的水合作用。一方面,加入酸来促进钙镁金属含量的降低。0105本发明提供了改善、处理或防止脂多糖(LPS)-介导的毒性的方法,该方法包括给予患者包含本发明多肽的药物组合物。本发明提供了内毒素的解毒方法,包括使内毒素与本发明的多肽接触。本发明提供了从类脂A上脱去2'或3'脂肪酸链的脱酰基方法,包括将类脂A与本发明的多肽接触。0106本发明提供了使用本发明的多肽来制造药物组合物一例如来制造用于防止、处理或改善脂多糖(LPS)-介导的毒性的药物组合物,或用来解毒内毒素,或者从类脂A上脱去2'或3'脂肪酸链的脱酰基。本发明提供用于内毒素的解毒的方法,包括将内毒素与本发明的多肽接触。0107本发明提供了精炼润滑剂的方法,包括以下步骤(a)提供包括本发明的酶的组合物;(b)提供润滑剂;和(c)在酶可以选择性地水解润滑剂中的油的条件下,用酶处理润滑剂,从而精炼该润滑剂。该润滑剂可以是液压油。0108本发明提供了处理织物的方法,包括下述步骤(a)提供包括本发明的酶的组合物;(b)提供织物;和(C)用该酶处理织物。织物的处理可以包括最终织物的手感与悬垂的改善、染色、获得阻燃性、获得防水性、获得光学亮度或者获得树脂整理。该织物可以包括棉、粘胶纤维、人造纤维、莱塞尔纤维(lyocell)、亚麻(flax)、亚麻(linen)、苎麻、其所有的混合物,或者它们与聚酯、羊毛、聚酰胺丙烯酸或聚丙烯酸的混合物。本发明提供了包含本发明的酶的织物、纱线或纤维。该酶可以被吸附,吸收或固定在织物、纱或纤维的表面。0109本发明提供了表达磷脂酶C方法,该方法包括提供具有Mut+表型的毕赤酵母菌株;将异源的磷脂酶C-编码核酸插入毕赤酵母菌株;并将毕赤酵母菌株培养在表达磷脂酶C的条件下。该方法还可以包括用锌补充培养条件。本发明也提供了用于表达磷脂酶C的细胞体系,分离的细胞和细胞系,包括Mut+表型毕赤酵母菌株,其含有可操作性地连接于毕赤酵母菌株中可以操作的启动子的异源的磷脂酶C-编码核酸。0110本发明提供了用于表达异源蛋白的耐zeocin的酵母细胞体系(例如酵母细胞、细胞系、单细胞),包括步骤提供含有能够表达异源蛋白的异源核酸的毕赤酵母某种(P/c/z,'a(例如巴斯德毕赤酵母(尸.p"Wo/10)细胞;在含某一初始浓度zeodn的条件下培养该细胞;挑选对初始浓度的zeocin有抗性的细胞,并在含有较高浓度zeocin的条件下再培养;并挑选出步骤(C)中培养的耐较高浓度zeocin的细胞。一方面,异源蛋白是酶,或任选地是磷脂酶,或任选地是磷脂酶C(PLC),例如本发明的任何酶。0111本发明提供制造生物燃料的方法,其包括(A)(a)提供本发明的具有磷脂酶,或者由本发明核酸(多核苷酸)编码的磷脂酶,或者由本发明的方法制造的磷脂酶;(b)提供包括脂或垸基酯的生物质组合物;(c)将(a)的磷脂酶与(b)的生物质组合物接触,以产生生物燃料或对脂或垸基酯进行酯交换;(B)(A)的方法,其中所述生物燃料是或包括生物柴油;(C)(A)或(B)的方法,其中所述包括脂或垸基酯的生物质组合物是或包括植物油和/或动物脂肪;(D)(A)至(C)的任何方法,其中所述包括脂或垸基酯的生物质组合物是或包括藻类、植物油、直链植物油、oil)、废植物油(wastevegetableoil)、动物脂肪、动物脂(grease)、牛脂(tallow)、猪脂(lard)或黄油(yellowgrease);或(E)(A)至(D)的任何方法,其中所述磷脂酶是或包括具有SEQIDNO:l至SEQIDNO:178的任何一个所示的序列的多肽,或其任何组合。0112本发明提供生物燃料(a)其根据权利要求68所述的方法制备;(b)其包括(i)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或根据本发明方法制备的磷脂酶。0113本发明提供可溶性干酒糟(distillersdriedsoluble,DDS)、谷物干酒糟(distillersdriedgrain,DDS)、可溶性浓縮酒糟(acondenseddistillerssoluble,CDS)、谷物湿酒糟(adistillerswetgrain,DWG)或含可溶物的谷物干酒糟(distillersdriedgrainw他solubles,DDGS):其包括(i)具有SEQIDNO:l至SEQIDNO:178任何一个所示序列的所述磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶。0114本发明提供生物质,包括(a)(i)具有SEQIDNO:l至SEQIDNO:178任何一个所示序列的磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶;或(b)(a)的生物质,其中所述生物质是或包括动物、藻类和/或植物生物质,或含脂类的生物质或木质纤维生物质,或者废物材料;(c)(a)的生物质,其中所述生物质是或包括生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇或其任何组合。0115本发明提供基于石油的产品,其包括(a)(i)具有SEQIDNO:l至SEQIDNO:178任何一个所示的序列的磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶;或(b)(a)的基于石油的产品,其包括油、生物柴油或汽油、或生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇;或者生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇和/或生物柴油或汽油的混合物。0116本发明的一个或者多个实施方式的细节在附图和以下的说明书中进行阐明。本发明的其它特征、目标以及优势将通过阅读说明书和附图以及权利要求得变得显而易见。0117出于各种目的,本文所引用的所有出版物、专利、专利申请、GenBank序列以及美国典型培养物保藏中心(ATCC)保藏物,通过引用特意并入本文。附图简述0118下图是本发明的实施方式的示例性说明,并非为了限制权利要求所包含的发明范围。0119图l是计算机系统的框图,具体细节如下所述。0120图2是图解过程200的一个方面的流程图,为确定新序列与数据库中序列间的同源性水平,将新的核苷酸或蛋白质序列与序列数据库相比较,具体细节如下所述。0121图3是图解在计算机中确定两个序列是否是同源的过程的一种实施方式的流程图,具体细节如下所述。0122图4是图解鉴定器过程的一个方面的流程图,该鉴定器过程用于检测序列中特征的存在与否,具体细节如下所述。0123图5A、5B和5C示意性说明用于模拟PLC-介导的脱胶的典型两相系统,具体细节如下文实施例2中所述。0124图6示意性说明了应用本发明磷脂酶的示例性植物油精炼过程。0125图7示意性说明了用于物理精炼油的本发明的示例性脱胶过程,具体细节如下所述。0126图8示意性说明了用本发明的磷脂酶C进行的磷脂水解,具体细节如下所述。0127图9示意性说明了本发明的示例性碱炼方法,并图解了用本发明的磷脂酶C作为"碱炼助剂"(长混合碱炼,LongMixCausticRefining)的一个可选择的实施方式,具体细节如下所述。0128图IO示意性说明了应用本发明的磷脂酶C作为脱胶助剂,具体细节如下所述。0129图11是描述本发明的示例性核酸和多肽的选择特征的表,如在下面所进一步详细描述的。0130图12示意性说明了来自本发明的两个酶系统的数据,如在下面实施例3中所述。0131图13示意性说明了本发明的示例性碱炼方法,并图解了一个可选的实施方式,包括应用本发明的磷脂酶C作为"碱炼助剂"(长混合碱炼),如下面所详细描述的。0132图14图解了本发明方法的另一种变化,其中在方法中使用了两个离心歩骤,如下面所详细描述的。0133图15说明了本发明方法的另一种变化,其中在方法中使用了三个离心步骤,如下面所详细描述的。0134图16示出了本方法的另一种示例性变化,其使用酸处理并在脱胶步骤前有离心步骤,如下面所详细描述的。0135图17图解了体外消化实验的结果,其中本发明的磷脂酶C变体,如下面实施例4中所详细描述的。0136图18图解了使用本发明的示例性酶进行的分批发酵罐培养的结果,如下面实施例5中所详细描述的。0137图19图解了本发明的巴斯德毕赤酵母MutS菌株培养物的氧吸收速率(OxygenUptakeRate,"OUR")比较结果,如下面实施例5中所详细描述的。0138图20图解了本发明的巴斯德毕赤酵母MutS菌株的甲醇消耗图比较,如下面实施例5中所详细描述的。0139图21图解了本发明SEQIDNO:2的示例性PLC酶的重组形式的培养物的"OUR"图,如下面实施例5中所详细描述的。0140图22图解了SDS-PAGE的结果,显示了在培养物中产生的PLC蛋白的质量,及与之相对应的本发明SEQIDNO:2的示例性PLC酶的重组形式的培养物的"OUR"图,如下面实施例5中所详细描述的。0141图23说明了SDS-PAGE的结果,显示了活性PLC的数量,该活性PLC位于本发明SEQIDNO:2的示例性PLC酶的重组形式的培养物的细胞内,如下面实施例5中所详细描述的。0142图24说明了与活性PLC——本发明SEQIDNO:2的示例性PLC酶的重组形式相关的酵母细胞形态学变化的可视化图,如下面实施例5中所详细描述的。0143图25用图概述了数据,显示了在95hTFT(总发酵时间),在毕赤酵母中使用本发明SEQIDNO:2的示例性PLC酶进行的PLC生产性能的状态,如下面实施例5中所详细描述的。0144图26是数据简表,这些数据来自对本发明的示例性zeocin-适应的细胞菌落的表达筛选,如下面实施例5中所详细描述的。0145图27说明了数据,这些数据显示在含有本发明的示例性zeocin-适应的细胞菌落的培养物中,PLC蛋白水平是较高的,如下面实施例5中详细描述地。0146图28说明了数据,这些数据显示了本发明的zeocin-适应的菌落与对照的生长比较,如下面实施例5中所详细描述的。0147图29说明了加热实验的结果,显示了本发明SEQIDNO:2的示例性酶的热稳定性,图中指出了实验条件,如下面实施例6中所详细描述的。0148图30说明了总结加热实验的NMR数据,证明了本发明SEQIDNO:2的示例性酶的热稳定性,如下面实施例6中所详细描述的。0149图31、32和33说明了数据,使用p-NPPC,这些数据证明了SEQIDNO:2的热稳定性,实验条件为图中所示的条件,如下面实施例6中所详细描述的。0150图34说明了数据,使用DSC分析,这些数据证明了SEQIDNO:2的热稳定性,如下面实施例6中所详细描述的。0151图35说明了在用本发明突变体磷脂酶处理后,单独磷脂(PL)种类(PA、PE、PI和PC)相对于剩余的总PL的重量分数。0152图36说明了选择包含在基因重装配文库(GeneReassemblyLibrary)中的GSSM高表达突变型(upmutant),其包括本发明示例性的磷脂酶。0153图37说明了示例性的醇方法,其可包括本发明酶的使用。0154在不同的附图中同样的标记符号表示同样的要素。发明详述0155本发明提供了磷脂酶,如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽,编码它们的核酸,以及制备和应用它们的方法。本发明提供了有效地切割油,如植物油,例如油籽磷脂中的甘油磷酸酯键,产生水可提取的磷酸化的碱和甘油二酯的酶。一方面,本发明的磷脂酶具有脂酰水解酶(LAH)的活性。在可选的方面,本发明的磷脂酶可以切割磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸和/或鞘磷脂或它们的组合中的甘油磷酸酯键。例如,一方面,本发明的磷脂酶对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS禾口PE;PS禾口PI;PI禾口PE;PS、PI禾口PC;PE、PI禾口PC;或PE、PS、PI和PC具有特异性作用。0156本发明的磷脂酶(如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脱胶,这是因为磷酸部分可溶于水,并且容易去除。甘油二酯产物将仍存留在油中,从而降低损失。在商业油脱胶中,诸如ENZYMAX⑧方法中,本发明的PLC可以用于加入到PLA1和PLA2或者替换PLA1和PLA2,其中磷脂是由PLA1和PLA2水解的。0157在一方面,本发明的磷脂酶在高温和/或低温下,或者在较宽的温度范围内,具有活性,例如,它们可以在2(TC到9(TC,3(TC到80。C,或者在40'C到7(TC的温度范围内具有活性。本发明也提供在碱性pH或者酸性pH下,例如低的水酸度具有活性的本发明的磷脂酶。可选择的方面,本发明的磷脂酶可以在酸性pH低至pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0、和pH3.5或酸性更大(即pH〈3.5)的条件下具有活性。在可选的方面,本发明的磷脂酶可以在碱性pH高至pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10或碱性更大(即pH〉10)的条件下具有活性。一方面,本发明的磷脂酶在低水活度(低的水含量)条件下,在约40到约7(TC、75'C或8(TC或更大温度的温度范围内具有活性。0158本发明也提供了进一步修饰本发明的示例性磷脂酶,以便产生具有期望特性的酶的方法。例如,由本发明方法产生的磷脂酶可以具有改变的底物特异性、底物结合特异性、底物切割形式、热稳定性、pH/活性曲线、pH/稳定性曲线(如在低pH值,例如pI"K6或者pPK5,或者高的pH值,如pH〉9的情况下热稳定性提高)、对于氧化作用的稳定性、012+的依赖性、比活性和类似特性。本发明提供对于任何感兴趣特性的改变。例如,这些改变可以产生与亲本磷脂酶相比,具有改变的pH和温度活性曲线的变体。0159在一方面,本发明的磷脂酶被用于各种植物油处理步骤中,如植物油提取中,特别地,用于在称为"油脱胶"的过程中去除"磷脂胶",如在此所述。本发明提供了组合物(例如包含本发明酶的组合物)和由各种来源生产植物油的方法,所述各种来源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本发明的磷脂酶可以在任何植物油加工步骤中用于替代PLA,例如磷脂酶A2。0160术语"磷脂酶"包括具有任何磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。本发明的磷脂酶活性可以产生水可提取的磷酸化的碱以及甘油二酯。本发明的磷脂酶活性也包括在高温、低温、碱性pH和酸性pH条件下水解甘油磷酸酯键。术语"磷脂酶活性"也包括切割甘油磷酸酯,产生水可提取的磷酸化的碱以及甘油二酯。术语"磷脂酶活性"也包括切割磷脂中甘油和磷酸的酯键。术语"磷脂酶活性"也包括其它的活性,如结合并水解底物,如油,例如植物油的能力,底物也包括植物和动物的卵磷脂、磷脂酰乙醇胺、磷脂酰丝氨酸和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性;磷脂酶A(PLA)的活性,如磷脂酶A1或者磷脂酶A2的活性;磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2的活性,包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-转酰基酶(LPTA)活性;磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性;和/或patatin活性或它们的任何组合。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属(So/a"ww)植物,如马铃薯(So/"層w中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog.18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE禾口PS;PS禾口PE;PS禾口PI;PI禾口PE;PS、PI禾口PC;PE、PI禾口PC;或PE、PS、PI和PC,或它们的任何组合具有特异性作用。0161一方面,本发明的磷脂酶可以具有多功能活性,例如一种或多种本文中描述的酶活性的组合。例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,或缺少影响中性油(甘油三脂)部分的任何酶活性。在特定的方法中,例如在脱胶方法中使用这样的多肽可能是有利的,在脱胶方法中,中性油部分不受损害(减少、降解例如水解)是重要的。因此,一方面,本发明提供了脱胶方法,该方法包括使用具有磷脂酶活性但是缺少脂酶活性的本发明的多肽。0162一方面,本发明的PLC磷脂酶利用(例如催化水解)各种磷脂底物,包括磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)和/或磷脂酸或它们的组合。此外,这些酶对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的PLC酶可以对磷脂酰胆碱和磷脂酰乙醇胺底物显示出优选性。0163一方面,本发明的磷脂酰肌醇PLC磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的磷脂酰肌醇PLC酶可以对磷脂酰肌醇底物显示出优选性。0164一方面,本发明的patatin酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的patatin酶可以基于氨基序列相似性的保守性。在不同的方面,这些酶展示出多组不同的生物化学活性,并可以发挥PLA1、PLA2、PLC或PLD酶类的反应特征。0165一方面,本发明的PLD磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。一方面,这些酶可用于进行酯交换反应,以产生有结构的磷脂。0166如在此所用的,术语"阵列(array)"或者"微阵列(microarray)"或者"生物芯片(biochip)"或者"芯片(chip)"是许多靶元素,每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面的确定区域上的核酸,如下面进一步详细讨论的。0167如在此所用的,术语"计算机","计算机程序"和"处理器"以其最广义的一般语境使用,并整合所有这样的设备,如以下详细描述的。0168特定的多肽或者蛋白的"编码序列"或者"编码特定的多肽或者蛋白的序列",是指当置于合适的调控序列的控制下时可以转录和翻译成多肽或者蛋白的核酸序列。0169在此使用的术语"表达盒(expressioncassette)"是指在宿主中可以影响结构基因(即,编码蛋白质,如本发明的磷脂酶的序列)表达的核苷酸序列,所述宿主与所述序列相容。表达盒包括至少一个与编码多肽的序列可操作地连接的启动子;并且,任选地,与其它的序列例如转录终止信号可操作地连接。也可以应用进行表达所必要的或有帮助的额外的因子,例如增强子。如在此所应用的"可操作地连接(operablylinked)"是指连接DNA序列上游的启动子,这样该启动子能够介导该DNA序列的转录。因此,表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的"裸露DNA"载体,和类似物。"载体"包括可以感染、转染、瞬间或者永久转导细胞的核酸。将被认识到,载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体任选地包括病毒或者细菌的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂包膜,等等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),DNA片段可以与其连接,并被复制。载体因此包括,但不限于是RNA,自主复制的环状或者线性的DNA或者RNA(如质粒、病毒以及类似物,参见,如美国专利第5,217,879号),并且也包括表达质粒和非表达质粒。当重组微生物或者细胞培养物被描述为容纳"表达载体"时,其包括染色体外的环状和线性DNA,和己经整合进入宿主染色体的DNA。当载体由宿主细胞维持时,该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定地复制,或者整合入宿主基因组中。0170"质粒"命名为在大写字母和/或数字之前和/或之后加上小写字母"p"。在此使用的起始质粒(startingplasmid)可以通过商业渠道获得,通过公共渠道自由获得,或者按照公开的程序从可利用的质粒构建得到。此外,与那些在此描述的质粒等价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。0171术语"基因"是指参与产生多肽链的DNA片段,包括在编码区的前面和后面的区域,如头部和尾部,启动子和增强子,以及适当情况下,单个编码片段(外显子)之间的插入序列(内含子),等等。0172如本文所用,短语"核酸"或者"核酸序列"是指寡核苷酸、核苷酸、多核苷酸、或者是指它们中的任何之一的片段,是指基因组或者合成来源的DNA或者RNA(如,mRNA、rRNA、tRNA、iRNA),其可以是单链的或者双链的,并且可以代表有义链或者无义链,是指肽核酸(PNA),或者是指任何DNA样或RNA样的物质,天然的或者合成来源的,包括如iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。该术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。该术语也包括具有合成骨架的核酸样结构,参见如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。0173如本文所用,"氨基酸"或者"氨基酸序列"是指寡肽、肽、多肽或者蛋白序列,或者是指这些序列中的任何序列的片段、部分或亚基,并且是指天然产生的或者合成的分子。0174如本文所用,术语"多肽"和"蛋白"是指通过肽键或者修饰的肽键相互连接在一起的氨基酸,即,肽等排体(peptideisosteres),可以含有除了20个基因编码的氨基酸外的修饰氨基酸。术语"多肽"也指肽或者多肽片段,基序和类似物。该术语也包括糖基化的多肽。本发明的肽或者多肽也包括所有"模拟"和"肽模拟"形式,正如下面进一步详细描述的。0175如本文所用,术语"分离的"是指从原始的环境(例如天然环境,如果该环境是天然存在的话)中移取的物质。例如,存在于活动物中的天然发生的多核苷酸或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些或者所有的共存物分离,那么就是分离的。这样的多核昔酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是组合物的一部分,并且仍然是分离,这是因为这样的载体或者组合物不是其天然环境的一部分。如本文所用,分离的物质或者组合物也可以是"纯化"的组合物,S卩,它并不需要绝对的纯度;相反,这意味着是一个相对定义。从文库中得到的单个核酸可以经过常规纯化为具有电泳均一性。在可选择的方面,本发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中以至少一个、两个、三个、四个、五个或者更多数量级纯化得到的核酸。0176如本文所用,术语"重组子"是邻接于"骨架"核酸的核酸,而在天然环境下它们并不邻接。在一方面,核酸代表了核酸"骨架分子"群体中5%或者更多数目的核酸插入物。本发明的"骨架分子"包括核酸,如表达载体、自主复制核酸、病毒、整合性核酸,和用于维持或者操作感兴趣的核酸插入物的其它的载体或者核酸。在一方面,富集的核酸代表了重组骨架分子群体中的15%、20%、30%、40%、50%、60%、70%、80%、90%或者更多数目的核酸插入物。"重组"多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白,如,从用编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。"合成的"多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白,如下面进一步详细描述地。0177如下面进一步讨论地,当在启动子处启动转录的RNA聚合酶将编码序列转录成为mRNA时,启动子序列被"可操作地连接于"编码序列。0178"寡核苷酸"是指单链多聚脱氧核苷酸或者可以被化学合成的两个互补的多聚脱氧核苷酸链。这样的合成的寡核苷酸没有5'磷酸,因此如果不在存在激酶的情况下采用ATP添加磷酸,该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡核苷酸可以连接到没有被去磷酸化的片段上。0179在两个核酸或者多肽的上下文中,短语"实质上相同(substantiallyidentical)",是指当比较和比对最大对应性(correspondence)时,具有至少50%、60%、70%、75%、80%、85%、90%、95%、98%或者99%的核苷酸或者氨基酸残基(序列)的同一性的两个或者多个序列,所述最大对应性用一个任何已知的序列比较算法测量,如以下详细讨论的,或者通过目测的方法测量。在可选的方面,本发明提供与本发明的示例性序列,例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176等等,在核酸或者多肽的至少大约100个残基、150个残基、200个残基、300个残基、400个残基或者从约50个残基到全长的区域范围内,具有实质上同一性的核酸和多肽序列。本发明的核酸序列可以在多肽编码区域的整个长度上实质一致。0180另外,"实质上相同"的氨基酸序列是与参考序列差异一个或者多个保守性或者非保守性氨基酸置换、缺失或者插入的序列,特别地,当这样的置换发生在分子的非活性位点的位置上,并且前提是多肽基本上保留其功能特性。保守氨基酸置换,例如,用一个氨基酸置换另一个同类的氨基酸(如,将一个疏水性氨基酸,如异亮氨酸、缬氨酸、亮氨酸或者甲硫氨酸置换为另一个疏水性氨基酸,或者将一个极性氨基酸置换为另一个极性氨基酸,诸如用精氨酸置换赖氨酸,用谷氨酸置换天冬氨酸,或者用谷酰胺置换天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中缺失一个或者多个氨基酸,从而对多肽结构进行修饰,而并不显著改变其生物活性。例如,可以去除对于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸。可以通过很多方法中的任何方法分析本发明修饰的多肽序列的磷脂酶生物活性,包括将修饰的多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如下面进一步论述地。0181"杂交"是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性,这样可以鉴定在样品中以低浓度存在的感兴趣的特定的序列。合适的严格条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂交温度来确定,并且在本领域是熟知的。例如,严格性可以通过降低盐浓度,增加甲酰胺的浓度,或者提高杂交温度,改变杂交时间而增加,如下面所详细描述地。在可选的方面,本发明的核酸通过它们在各种严格条件下(如,高、中和低严格条件)的杂交能力来定义,如在此所阐明地。0182术语"变体"是指在一个或者多个碱基对、密码子、内含子、外显子、或者氨基酸残基(分别地)被修饰,但仍保持本发明的磷脂酶生物活性的本发明的多核苷酸或者多肽。变体可以通过很多种方法中的任何方法产生,例如易错PCR、重排、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体外诱变、盒式诱变、递归整体诱变、指数整体诱变、定点诱变、基因重装配、GSSM和它们的任何组合。在此包括了产生在一定的pH或温度下具有活性的变体磷脂酶,例如不同于野生型磷脂酶的变体磷脂酶的技术。0183术语"饱和诱变"、基因位点饱和诱变TM(GSSM)或者"GSSM",包括应用简并性寡核苷酸引物将点突变引入多核苷酸中的方法,如下详细描述地。0184术语"优化的定向进化系统"或者"优化的定向进化"包括对相关核酸序列,例如相关基因的片段重新进行装配的方法,并在下面进行了详细解释。0185术语"合成连接重装配"或者"SLR"包括以非随机的方式连接寡核苷酸片段的方法,并在下面进行了详细解释。核酸的产生和操作0186本发明提供分离的和重组的核酸(例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的示例性SEQIDNO:177或SEQIDNO:178),包括编码本发明的多肽和磷脂酶的表达盒,如表达载体。本发明也包括应用本发明的核酸发现新的磷脂酶序列的方法。也提供用于修饰本发明核酸的方法,例如通过合成连接重装配、优化的定向进化系统和/或饱和诱变。0187通过,例如克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA,和类似方法,可以制备、合成和/或操作本发明的核酸。在实践本发明的方法中,通过操作模板核酸,可以修饰同源基因,如本文所述的。可以与本领域已知的其它任何方法或者方案或者装置结合来实践本发明,这些方法或者方案或者装置在科学和专利文献中得到充分描述。一麽财0188用于实践本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或者它们的杂合体,都可以从不同的来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌、哺乳动物、酵母、昆虫或者植物细胞表达系统。0189可选地,这些核酸可以通过已知的化学合成技术在体外合成,如在例如Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述的。0190用于操纵核酸的技术,例如亚克隆、标记探针(例如使用Klenow聚合酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文献中有充分的描述,例如参见Sambrook编著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel编著,JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y,(1993)。0191获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组样品中克隆,并且如果期望的话,筛选和再克隆插入物,插入物可以分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA文库,所述文库可以包含在例如哺乳动物人工染色体(MACs),例如参见美国专利5,721,118;6,025,155;人类人工染色体,例如参见Rosenfeld(1997)Nat.Genet,15:333-335;酵母人工染色体(YAC);细菌人工染色体(BAC);PI人工染色体,例如参见Woon(1998)Genomics50:306-316;PI来源的载体(PACs),例如参见Kern(1997)Biotechniques23:120-124;粘粒、重组病毒、噬菌体或质粒中。0192在一方面,编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。0193本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上,如N-末端鉴定肽,其给予了期望的特性,如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达,其中所述融合蛋白中连接有一个或多个额外的结构域,例如用于产生免疫原性更强的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞,等等。有利于检测和纯化的结构域包括,例如金属螯合肽,如多组氨酸标记和组氨酸-色氨酸模块,其允许在固定的金属上纯化,还包括蛋白A结构域,其允许在固定的免疫球蛋白上纯化,还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(ImmunexCorp,SeattleWA)。在纯化结构域和含有基序的肽或多肽之间包含可切裂的连接子序列有助于纯化,这样的连接子序列例如Xa因子或肠激酶(Invitrogen,SanDiegoCA)。例如,表达载体可以包括编码表位的核酸序列,其连接到六组氨酸残基上,还连接有硫氧还蛋白和肠激酶切割位点(例如参见Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。组氨酸残基有助于检测和纯化,而肠激酶切割位点提供了从融合蛋白的剩余部分纯化表位的手段。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了充分的描述,例如参见Kroll(1993)DNACell.Biol.,12:441-53。録禱鞭劍謂0194本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制序列上的本发明的核酸(例如DNA)序列,所述控制序列例如启动子或增强子,它们指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacl、lacZ、T3、T7、gpt、人PR、PL和trp。示例性的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及鼠金属硫蛋白I启动子。0195适合于在细菌中表达多肽的启动子包括大肠杆菌(£.^//)^1(;或1。启动子、lacl启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、人PR启动子和XPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。表达载嫌藩载银0196本发明提供包括本发明的核酸,如,编码本发明的磷脂酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(如,牛痘、腺病毒、禽痘病毒、伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色体、酵母质粒、酵母人工染色体以及对感兴趣的特定宿主(如杆菌属(5a"7/"s)、曲霉属U^wg///^)和酵母)特异的任何其它载体。本发明的载体可以包括染色体的,非染色体的和合成的DNA序列。很多合适的载体为本领域技术人员所知的,并且可以商业获得。典型的载体包括细菌的pQE载体(Qiagen)、pBluescript质粒、pNH载体、(X-ZAP载体(Stratagene);ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia);真核的PXT1、pSG5(Stmtagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以应用任何其它的质粒或其它的载体,只要它们可以在宿主中复制并且可存活。可以在本发明中使用低拷贝数或高拷贝数的载体。0197表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5'侧翼非转录序列。在一些方面,衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录遗传元件。0198在一个方面,表达载体含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因或使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(五.co//)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.ce^Ww'^)TRP1基因。启动子区域可以从任何期望的基因中选择出来,使用氯霉素转移酶(CAT)载体或具有选择标记的其它载体。0199用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,其作用于启动子,增强其转录。例子包括在复制起点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子,和腺病毒增强子。0200DNA序列可以通过各种方法插入载体中。一般而言,将插入物和载体用合适的限制性内切酶消化后,DNA序列可以连接到载体中的所希望的位置。可选择地,插入物和载体的平末端可以被连接。多种克隆技术在本领域己知,例如在Ausubel禾QSambrook中描述的。这样的方法和其它方法被认为在本领域技术人员的范围内。0201载体可以是质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。0202可以使用的具体细菌载体包括商业上可获得的质粒,其包括以下熟知的克隆载体的遗传元件pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、p加99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。具体的真核载体包括pSV2CAT、pOG44、pXTl、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其它载体,只要它可以在宿主细胞中复制和存活。凉主潘扉存歸謝應0203本发明也提供包括发明核酸序列,如编码本发明磷脂酶的序列、本发明的载体的转化的细胞。宿主细胞可以是本领域技术熟练人员所熟悉的任何宿主细胞,包括原核细胞,真核细胞,如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或者植物细胞。本发明的酶可以在任何宿主细胞中表达,例如任何细菌细胞、任何酵母细胞,例如巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(&^zo抑cc/aramj;c^p謹6e)。示例性的细菌细胞包括埃希氏菌属(&c/zm'c/n'")、杆菌属d"7/船)、链霉菌属(&r印to附^m)、沙门氏菌属(&/mo"e〃a)、假单胞菌属(PwMtfom朋氾)和葡萄球菌属(Stop/^/ococc船)内的任何种,包括例如大肠杆菌(£.co//)、乳酸乳球菌(丄actococc^/acto)、枯草芽包杆菌(5"c/〃rara6"fc)、錯状芽抱杆菌(Sw7/mceret^)、鼠伤寒沙门菌(5"a/wo"e〃a(y;/z/wi^7't/m)禾卩荧光假单胞菌(i^eMtfo附o"(ZS1y/卵re"era)。示例性真菌细胞包括曲霉菌属(A/^gz7/M)内的任何种。示例性酵母细胞包括毕赤酵母属(A'c/z/a)、酵母属(&cc/zaramyc")、裂殖酵母属(&/H'mracc/7"ram_ycM)或许旺酵母属(Sc/wa"m'om_ycM)的种,包括巴斯德毕赤酵母(尸/c/n'a戸tor/s)、酿酒酵母(Sacc/wram戸scere由'oe)或粟酒裂殖酵母(5"c/^asacc/z"ra附yces;wm6e)。示例性昆虫细胞包括灰翅夜蛾属(S/wfifc^era)或果蝇属("ras印M")内的任何禾中,包括果蝇S2(£ro^/n7aS2)和草地夜蛾Sf9(S;wcfo/^ra5/9)。示例性的动物细胞包括CHO、COS或者Bowesmelanoma或者任何小鼠或者人类细胞系。适当的宿主的选择是在本领域技术人员的能力之内。0204载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextnm介导的转染、脂转染法(lipofection)或电穿孑L(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。0205在适当的情况下,工程化宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。0206细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相层析(HPLC)。0207各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括猴肾成纤维细胞COS-7细胞系和能够从相容性载体中表达蛋白的其它的细胞系,如C127、3T3、CHO、Hela和BHK细胞系。0208宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。取决于重组生产方法中所用的宿主,由含有载体的宿主细胞产生的多肽可以糖基化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。0209也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面,该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。0210表达载体可以含有一个或多个选择性标记基因,为选择转化的宿主细胞提供表型特征,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者例如大肠杆菌的四环素或氨苄青霉素抗性。0211示例性磷脂酶C酶(具有SEQIDNO:2中所示的序列)已在各种宿主系统中以活性形式被过量表达,这些系统包括革兰氏阴性细菌,诸如大肠杆菌,革兰氏阳性细菌,诸如任何杆菌属的种(例如枯草芽孢杆菌、蜡状芽孢杆菌)、酵母宿主细胞(包括例如巴斯德毕赤酵母、酵母属某种(Sflcc/rarow;;c"w.),诸如酿酒酵母和粟酒裂殖酵母)和乳酸乳球菌或哺乳动物、真菌、植物或昆虫细胞。在每一宿主系统中,由各种构建物表达活性酶。这些核酸表达构建物可以包含编码全长开放阅读框(由信号序列、前序列和成熟蛋白编码序列组成)的核苷酸,或它们可以包含这些遗传元件的亚组,单独或者与异源遗传元件组合,异源遗传元件充当信号序列和/或成熟开放阅读框的前序列。这些系统中的每一个可以充当表达PLC的商用生产性宿主,PLC用于之前描述的酶法油脱胶方法中。核酸的扩增0212在实践本发明时,编码本发明多肽的核酸,或者修饰的核酸可以如通过扩增复制。本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。在一方面,引物对能够扩增本发明的核酸序列。本领域技术人员可以设计用于扩增这些序列的任何部分或全长的扩增引物序列对。0213本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括本发明序列,或者其片段或子序列的核酸。扩增引物序列对的其中一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡核苷酸,或者包括含有该序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或者25个连续碱基的寡核苷酸。0214本发明提供扩增引物对,其中引物对包括具有在本发明核酸的大约前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第一成员,和具有在第一成员的互补链的大约前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第二成员。本发明提供应用本发明的扩增引物对,通过扩增如聚合酶链式反应(PCR)产生的磷脂酶。本发明提供使用本发明的扩增引物对,通过扩增例如聚合酶链式反应(PCR)制备发明磷脂酶的方法。在一方面,扩增引物对从文库,例如基因文库,如环境文库中扩增核酸。0215扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸,或量化样品中特异性核酸的量。在本发明的一个方面,扩增从细胞或cDNA文库分离出的信息。技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本
技术领域
也是熟知的,包括,例如聚合酶链式反应PCR(例如参见PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.I皿is,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,连接酶链式反应(LCR)(例如参见Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);转录扩增(例如参见Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);和自主维持序列复制(例如参见Guatelli(1990)Proc,Natl.Acad.Sci.USA87:1874);Qp复制酶扩增(例如参见Smith(1997)J.Clin.Microbiol.35:1477-1491),自动Q-p复制酶扩增测定法(例如参见Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介导的技术(例如NASBA,Cangene,Mississauga,Ontario);也参见Berger(1987)MethodsEnzymol.152:307-316;Sambrook;A醫bel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。确定序列同一性程度0216本发明提供包括与本发明的示例性核酸(例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178,以及编码具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178的核酸),在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或者更多的残基范围内,具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(IO()%)的序列同一性的序列的分离的和重组的核酸。本发明提供包括与本发明的示例性多肽具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、卯%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)的序列同一性的序列的多肽。序列同一性(同源性)的程度可以应用任何计算机程序和相关参数来确定,包括那些在此所描述的,如用默认参数的BLAST2.2.2.或者FASTA3.0t78版。在可选择的实施方式中,序列同一性可以在核酸或者多肽的至少大约5、10、20、30、40、50、100、150、200、250、300、350、400个连续的残基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定,包括那些在此所说明的,如使用默认参数的BLAST2.2.2.或者FASTA3.0t78版。0217图11用图表描述了本发明的示例性核酸和多肽的选择的特征,包括示例性序列与公共数据库的序列同一性比较。图11中描述的所有序列对两组数据库进行BLAST搜索(如在下面详细描述地)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库搜索所获得的所有结果参见名称为"NR描述(NRDescription)"、"NR登录号(NRAccessionCode)"、"NR评价(NREvalue)"或"NR生物(NROrganism)"的各栏。"NR,,指由NCBI维护的非-冗余(Non-Redundant)核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏"NR描述(NRDescription)"中的条目指任何给定的NCBI记录中的定义行(definitionline),其包括了对序列的描述,诸如来源生物、基因名称/蛋白质名称,或对序列的一些功能描述。"NR登录号(NRAccessionCode)"—栏中的条目指给予序列记录的独特的标识符(identifier)。"NR评价(NREvalue)"—栏中的条目指期望值(评价),其代表了这样的可能性同询问序列(querysequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值,发现在随机序列之间具有相同的数量的比较,如在当前的BLAST搜索中所进行的。"NR生物(NROrganism)"—栏中的条目指被鉴定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为GeneseqTM数据库,其可从ThomsonDerwent(Philadelphia,PA)获得。对该数据库所作搜索的所有结果参见名称为"Genes叫蛋白质描述(GeneseqProteinDescription)"、"Geneseq蛋白质登录号(GeneseqProteinAccessionCode)"、"Geneseq蛋白质评价(GeneseqProteinEvalue)"、"GeneseqDNA描述(GeneseqDNADescription)"、"GeneseqDNA登录号(GeneseqDNAAccessionCode)"、"GeneseqDNA评价(GeneseqDNAEvalue)"各栏中。这些栏中发现的信息与上述NR各栏中发现的信息具有可比性,除了它来自对GeneseqTM数据库而不是对NCBI数据库进行的BLAST搜索。此外,该表包括栏"预测的EC编号(PredictedECNo.)"—栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号,该命名法是由国际生物化学和分子生物学联合会(IUBMB)的命名委员会的酶分组(EnzymeCommissionoftheNomenclature测的EC编号',栏中的结果由对Kegg(KyotoEncyclopediaofGenesandGenomes)数据库的BLAST搜索结果测定。如果最高BLAST匹配(topBLASTmatch)的评价值等于或小于e—6,那么赋予最高匹配的EC编号进入表中。最高命中(tophit)的EC编号用作向导,用于指出本发明序列的EC编号可能是什么。"询问DNA长度(QueryDNALength)"和"询问蛋白质程度(QueryProteinLength)"这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目,本发明的序列被用于对NCBI或Geneseq数据库进行搜索或查询。"Geneseq或NRDNA长度(GeneseqorNRDNALength)"、"Geneseq或NR蛋白质长度(GeneseqorNRProteinLength)"这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果来自搜索,其将较低的评价——或者来自NCBI数据库或者来自Geneseq数据库的较低的评价返回(return)。"Geneseq或NR%10蛋白质(Geneseq或NR%IDProtein),,禾口"Geneseq或NR%IDDNA(GeneseqorNR%IDDNA)"指本发明序列与最高BLAST匹配的序列之间的百分序列同一性。这些栏中给出的结果来自搜索,其将较低的评价一或者来自NCBI数据库或者来自Geneseq数据库的较低的评价返回。0218同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧啶。同源序列可以应用在此说明的任何程序得到或者可以由校正测序错误得到。应该理解到的是,在此所示核酸序列可以以传统的单字母形式表示(见,如,Stryer,Lubert.Biochemistry3rdEd.,W.H.Freeman&Co.,NewYork)或者以记录序列中的核苷酸的同一性的任何其它形式来表示。0219在本发明的这一方面,可以使用在此指明的各种序列比较程序。蛋白和/或核酸序列同一性(同源性)可以应用本领域已知的任何序列比较算法和程序评估。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lip腿n,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等,J.Mol.Biol.215(3):403-410,1990;Thompson等,NucleicAcidsRes.22(2):4673-4680'1994;Higgins等,MethodsEnzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,NatureGenetics3:266-272,1993)。0220同源性或者同一性可以应用序列分析软件来测定(例如,位于1710UniversityAvenue,Madison,WI53705的威斯康星大学生物技术中心遗传学计算机组(GeneticsComputerGroup)的序列分析软件包)。这样的软件通过对各种缺失、置换和其它的修饰指定同源性程度来匹配相似的序列。在两个或者多个核酸或者多肽序列的情况下,术语"同源性"和"同一性"是指两个或者多个序列或者子序列,当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动比对和目测来测定,通过比较和比对以便获得最大的一致性时,它们是相同的或者具有相同的氨基酸残基或者核苷酸的特异百分比。对于序列比较,一个序列可以作为参照序列与待测序列进行比较。当应用序列比较算法,待测序列和参照序列被输入到计算机中,指定子序列坐标,如果必要,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。依据程序参数,序列比较算法计算待测序列和参照序列同一性的百分比。0221如本文所用,"比较窗口(comparisonwindow)",包括涉及任一数目的连续残基的片段。例如,在本发明可选择的方面,当两个序列优化比对后,将范围从20到本发明的示例性序列的全长的连续残基,与相同数目的连续位置的参照序列进行比较。如果参照序列与本发明的示例性序列具有必要的序列同一性,如50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的序列同一性,那么该序列是属于本发明的范围。在可选择的实施方式中,当两个序列优化地比对后,将范围从大约20到600、大约50到200、和大约100到150的序列,与同样数目的连续位置的参照序列进行比较。用于比较的联配方法在本
技术领域
是熟知的。可以通过如下方法进行用于比较的序列的最优化联配:例如Smith和Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.站:443,1970的同源性联配算法,person和Lipman,Proc.Nat'l.Acad.Sci.USA2444,1988的査找相似性的方法,这些算法的计算机化实施(WisconsinGeneticsSoftwarePackage中的GAP、BESTFIT、FASTA禾卩TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI),或者手工联配和观察检验。除了BLAST程序(国家生物信息中心的基本局域联配搜索工具(BasicLocalAlignmentSearchTool))夕卜,用于确定同源性或者同一性的其它的算法包括,例如,ALIGN、AMAS(多重联配序列分析(AnalysisofMultiplyAlignedSequences))、AMPS(蛋白多重序列联配(ProteinMultipleSequenceAlignment))、ASSET(联配片段统计评估工具(AlignedSegmentStatisticalEvaluationTool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(BLocksIMProvedSearcher)、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smhh-Waterman算法、DARWIN、LasVegas算法、FNAT(强迫核苷酸联配工具(ForcedNucleotideAlignmentTool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(SensitiveSequenceComparison))、LALIGN(局部序列联配(LocalSequenceAlignment))、LCP(局部内容程序(LocalContentProgram))、MACAW(多重联配构建和分析工作台(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(多重联配程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-InducedMulti-sequenceAlignment))、SAGA(通过遗传算法的序列联配(SequenceAlignmentbyGeneticAlgorithm))禾nWHAT-IF。这样的联配程序也可以用于筛查基因组数据库,以鉴定具有大体上相同的序列的多核苷酸序列。大量的基因组数据库是可利用的,例如,作为人类基因组测序工程的一部分的人类基因组的实质部分可以被利用(Gibbs,1995)。若干基因组已经被测序,如生殖器支原体(M.ge"/to/z'画)(Fraser等,1995)、甲垸球菌(Mya朋a"to')(Bult等,1996)、流行性感冒杆菌(/£/"/固認)(Fleischmann等,1995)、大肠杆菌(£.co/O(Blattner等,1997)和酵母(酿酒酵母(S.cwevi"'ae))(Mewes等,1997)和黑腹果蝇(".me/a"oga舰r)(Adams等,2000)。在模式生物的基因组序列的测序上已经取得了很大的进展,如小鼠,线虫(Ce/eg"m)和拟南芥Ur^a^;z^,)。含有基因组信息并且注释有一些功能性信息的数据库由不同组织维护,可以通过互联网登录。0222BLAST、BLAST2.0和BLAST2.2.2算法也用于实践本发明。这些算法在,如Altschul(1977)Nuc.AcidsRes.25:3389-3402;Altschul(1990)J,Mol.Biol,215:403-410中有描述。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(querysequence)中长度为W的短的字串来确定高分序列对(highscoringsequencepairs,HSPs),所述高分序列对在与数据库序列中同样长度的字串联配吋,匹配或者满足某些正值的阈值T。T是指邻近字串(neighborhoodword)的分数阈值(Altschul(1990),如上)。这些初始的邻近字串作为种子(seed)用来启动搜索以发现包含有它们的更长的HSPs。只要累积的联配分数能够被增加,所述字串一直沿着每一个序列向两个方向延伸。对于核苷酸序列,使用参数M(—对匹配的残基的奖励分数;总是大于0)来计算累积分数。对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)使用的默认值的是字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序使用的默认值的是字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989),Proc.Natl.Acad.Sci.USA89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallestsumprobability,P(N)),其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在测试核酸和参考核酸的比较中,如果最小合计概率小于约0.2,在一方面中更优选的是小于约0.01,在一方面中最优选的是小于约0.001,就认为该核酸与参考序列相似。一方面,应用基本局域联配搜索工具("BLAST")来评价蛋白和核酸序列同源性。具体而言,五个特定的BLAST程序可以用来进行以下的任务(1)BLASTP和BLAST3将氨基酸待询序列与蛋白质序列数据库进行比较;(2)BLASTN将核苷酸待询序列与核苷酸序列数据库进行比较;(3)BLASTX将待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较;(4)TBLASTN将待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;和(5)TBLASTX将核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相似片段来确定同源序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的"高分片段对(high-scoringsegmentpairs)",该受测序列优选从蛋白或者核酸序列数据库得到。高分片段对优选利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是巳知的。优选地,应用的记分矩阵为BLOSUM62矩阵(Go誕t等,Science256:1443-1445,1992);Henikoff和Henikoff,Proteins12:49-61,1993)。较不优选地,也可以应用PAM或者PAM250矩阵(参见如,Schwartz禾卩Dayhoff,eds.,1978,MatricesforDetectingDistanceRelationships:AtlasofproteinSequenceandStructure,Washingion:NationalBiomedicalResearchFoundation)。0223本发明的一方面,为了确定是否核酸具有本发明范围内的必需的序列同一性,应用NCBIBLAST2.2.2程序,默认值的选择是blastp。在BLAST2.2.2程序中,有大约38个设置选择。在本发明的该示例性方面,除了默认的过滤设置外,应用所有的默认值(即除了过滤设置为关闭(OFF)夕卜,所有的参数设定为默认值),在该位置上应用"-FF"设置,其使得不能进行过滤。由于短的序列的长度的缘故,默认过滤的使用经常导致与Karlin-Altschul不同。0224如上所述,用于本发明该示例性方面,并用于测定图11中值的默认值包括"低复杂性过滤器(Filterforlowcomplexity):开启(ON)〉字长3>矢巨卩车Blosum62>空位成本存在值11>延伸1"其它的默认值设置为低复杂性过滤器关闭(OFF),蛋白质字长为3,BLOSUM62矩阵,空位存在罚值-11,并且空位延伸罚值一1。0225示例性的NCBIBLAST2.2.2程序设置在下面的实施例1中阐明。注意,"-W"选项默认值为0。这是指,如果没有设置,对于蛋白,字长默认值为3,对于核苷酸字长默认值为11。计算机系统和计算机程序产品0226为了确定和鉴定序列同一性、结构同源性、基序和在计算机芯片上的类似物,本发明的多肽或核酸序列可以在可被计算机读取和访问的任何介质上存储、记录和操作。因此,本发明提供了计算机、计算机系统、计算机可读取的介质、计算机程序产品以及其上记录或存储了本发明的核酸和多肽序列,例如本发明的示例性序列的类似设备。如本文所用,词语"记录"和"存储"指在计算机介质上存储信息的过程。熟练的技术人员能容易地采用任何己知方法,在计算机可读取的介质上存储信息,以产生包括本发明的一个或多个核酸和/或多肽序列的产品。0227本发明的另一方面是其上已记录有本发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质、闪存。例如,计算机可读介质可以是硬盘、软盘、磁带、闪存、CD-ROM、数码多功能光盘(DVD)、随机存储器(RAM)、或只读存储器(ROM)或本领域技术人员知道的任何类型的介质。0228本发明的方面包括系统(如,以因特网为基础的系统),特别地计算机系统,其存储和操作在此描述的序列和序列信息。计算机系统100的一个例子描述在图1的方块图中。正如此处所用,"计算机系统"指硬件部分、软件部分以及数据存储部分,它们用于分析本发明的核酸序列的核苷酸序列或本发明的多肽序列。计算机系统100可包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知类型的中央处理单元,如来自英特尔公司的奔腾III,或来自Sun、Motorola.Compag、AMD或IBM公司的类似处理器。计算机系统100是一个通用的系统,该系统包括处理器105和用于存储数据的一个或多个内部数据存储部件110,以及用于检索数据存储部件上存储的数据的一个或多个数据检索设备。技术人员能容易地意识到,任何一种当前可获得的计算机系统都是合适的。0229在一个特定的方面,计算机系统100包括连接到总线上的处理器105,总线连接到主存储器115(优选地,以RAM来实现),和一个或多个内部数据存储设备110,例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。计算机系统100进一步包括一个或多个数据检索设备118,用于读取在内部数据存储设备110上存储的数据。0230数据检索设备118可以是,例如软盘驱动器、压縮磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些实施方式中,内部数据存储设备110是可移动的计算机可读介质,例如含有控制逻辑和/或其上记录的数据的软盘、压縮磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程,用于当数据存储部件被插入到数据检索设备中时从数据存储部件读取控制逻辑和/或数据。0231计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联,以便给计算机100提供集中访问。访问和处理本发明的核苷酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。0232在一些方面,计算机系统100可以进一步包括比较发明的本核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。"序列比较算法"是指一个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计算机可读介质上的示例性序列的核苷酸序列与储存在计算机可读介质上的参考序列比较,以鉴定同源性或结构基序。0233以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以调整。在一些方面,在使用者没有给出指令的情况下,算法使用的参数可以应用默认参数。图2是说明过程200的一个方面的流程图,这个处理过程是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统ioo的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。过程200开始于起始状态201,然后转到状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储设备。0234然后过程200转到状态204,其中打开序列数据库以进行分析和比较。然后过程200转到状态206,其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较,以确定第一个序列是否与第二个序列相同。重要的是应该注意到,该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本
技术领域
的普通技术人员是已知的,即使所述两个核苷酸或蛋白序列不相同。例如,可以在一个序列中引入空位,以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。0235一旦已经在状态210进行两个序列的比较,在决策状态210就要作出两个序列是否相同的判断。当然,术语"相同的"不限于绝对相同的序列。在过程200中,在由用户输入的同源性参数范围内的序列都将被标记为"相同的"。如果作出两个序列相同的判断,过程200转到状态214,其中来自数据库的序列的名称被显示给用户。该状态通知用户,具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户,过程200转到决策状态218,其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序列,那么过程200在结束状态220终止。然而,如果数据库中确实存在更多的序列,那么过程200转到状态224,其中指针被指向数据库中的下一个序列,以便与新序列进行比较。以这种方式,将新序列与数据库中的每一序列联配并进行比较。0236应该注意到,如果已经在决策状态212已经作出了序列不同源的判断,那么过程200将立即转到决策状态218,以便确定用于比较的数据库中的任何其它序列是否可利用。因此,发明的一方面是包括处理器,其上储存有本发明的核酸序列的数据存储设备以及用于进行比较的序列比较器的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基序,或者可以确定与这些核酸代码和多肽代码相比较的序列中的结构基序。0237图3是示意性说明计算机中的过程250的一个实施方式的流程图,该过程用于确定两个序列是否同源。过程250在起始状态252开始,然后转到状态254,其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态256被存储到存储器上。然后过程250转到状态260,其中读取第一个序列中的第一个字符,然后转到状态262,其中读取第二个序列的第一个字符。应该理解到,如果序列是核苷酸序列,那么字符将通常是A、T、C、G或U。如果序列是蛋白序列,那么字符可以是单字母氨基酸代码,以便第一个序列和第二个序列可以被容易地比较。然后在决策状态264作出两个字符是否相同的判断。如果它们相同,那么过程250转到状态268,其中第一个和第二个序列中的下一个字符被读取。然后作出该下一个字符是否相同的判断。如果它们相同,那么过程250继续循环,直到两个字符不相同。如果作出的判断是这两个字母不相符,那么过程250转到决策状态274,以确定是否有更多的字符或者序列可以读取。如果没有可读取的任何更多的字符,那么过程250转到状态276,其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此,如果前IOO个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配,那么同源性水平将是100%。0238可选地,计算机程序可以比较参照序列与本发明的序列,以确定是否序列在一个或者多个位置上不同。程序可以记录本发明序列或参照序列中插入、缺失或者替换的核苷酸或者氨基酸残基的长度和同一性。计算机程序可以是确定是否参照序列与本发明的序列相比,含有单核苷酸多态性(SNP),或者是否本发明的序列含有已知序列的SNP的程序。因此,在一些方面,计算机程序是鉴定SNPs的程序。该方法可以通过以上描述的计算机系统来完成并且该方法描述在图3中。该方法可以通过应用计算机程序读取本发明序列和参照序列,并且用计算机程序来鉴定差异来进行。0239在其它方面,以计算机为基础的系统包括鉴定本发明的核酸或者多肽中的特征的鉴定器。"鉴定器"是指鉴定核酸序列中的某些特征的一个或者多个程序。例如,鉴定器可以包括鉴定核酸序列中的开放阅读框架(ORF)的程序。图4是说明用于检测序列中特征存在与否的鉴定器程序300的一个方面的流程图。过程300起始于起始状态302,然后转到状态304,其中待检测特征的第一序列存储于计算机系统100的存储器115上。过程300然后转到状态306,在该状态下,打开具有序列特征的数据库。这样数据库将包括一系列每一个特征的属性和特征的名称。例如,特征名称可以是"起始密码子",属性为"ATG"。另一个例子是特征名称为"TAATAA盒",特征属性为"TAATAA"。这样的数据库的例子是由烕斯康辛大学遗传学计算机组(UniversityofWisconsinGeneticsComputerGroup)制作。可选地,特征可以是结构多肽基序,如ct螺旋、卩折叠,或者功能性多肽基序,如酶的活性位点、螺旋-转角-螺旋基序或者本领域技术知道的其它基序。一旦在状态306打开特征数据库,过程300转到状态308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在决定状态316下作出决定,确定是否在第一序列发现所述特征的属性。如果发现该属性,过程300转到状态318,其中所发现的特征的名称显示给使用者。过程300然后转到决定状态320,在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库中确实存在有更多的特征,那么过程300在状态326读取下一个序列特征,并且循环回到状态310,其中该下一个特征的属性与第一序列进行比较。如果在决定状态316在第一个序列中没有发现特征属性,那么过程300直接转到决定状态320,以便确定数据库中是否存在更多特征。因此,在一方面,本发明提供了鉴定开放阅读框架(ORFs)的计算机程序。0240本发明的多肽或核酸序列可在各种数据处理程序中以多种格式被储存和进行操作。例如,序列可以以文本形式储存在字处理文件如MicrosoftWORD或WORDPERFECT中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2、SYBAS或ORACL中。另外,许多计算机程序和数据库都可用作序列比较算法、鉴定器、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽序列要与本发明的核酸序列进行比较。用于实践本发明的程序和数据库包括,但不限于MacPattern(EMBL)、DiscoveryBase(MolecularApplicationsGroup)、GeneMine(MolecularApplicationsGroup)、Look(MolecularApplicationsGroup)、MacLook(MolecularApplicationsGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,19卯)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(MolecularSimulationsInc.)、Catalyst/SHAPE(MolecularSimulationsInc.)、Cerius2.DBAccess(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、InsightII(MolecularSimulationsInc.)、Discover(MolecularSimulationsInc.)、CHARMm(MolecularSimulationsInc.)、Felix(MolecularSimulationsInc.)、DelPhi(MolecularSimulationsInc.)、QuanteMM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、Modeler(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDL可用化学制品目录数据库(AvailableChemicalsDirectorydatabase)、MDL药品数据报告数据库(DragDataReportdatabase)、综合医药化学数据库(ComprehensiveMedicinalChemistrydatabase)、德温特世界药物索引数据库(WorldDragIndexdatabase)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。其它的程序和数据库对于本公开内容的所述
技术领域
内的技术人员是显而易见的。0241可以用上述程序检测的基序包括编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、ct螺旋和(3折叠、编码指导被编码的蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidicstretohes)、酶活性位点、底物结合位点和酶切割位点。核酸的杂交0242本发明提供了可在严格性条件下与本发明的示例性序列,例如在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所提及的序列,或者编码包括在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所提及的序列的多肽的核酸杂交的分离的、合成的或者重组的核酸。严格条件可以是高度严格条件、中度严格条件、低度严格条件,包括在此描述的高度的和降低的严格性条件。在可选的方面,本发明的核酸根据它们在严格条件下杂交的能力来定义,它们可以在大约5个残基到某分子,例如本发明的示例性核酸全长之间。例如,它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、亂150、200、250、300、350、400个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用作例如杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(表位)的反义序列或序列、基序、活性位点、结合结构域、调控结构域以及类似物。0243一方面,本发明的核酸通过它们在高度严格性下杂交的能力定义,高度严格性包括在大约37'C到42"C的温度下大约50M的甲酰胺的条件。一方面,本发明的核酸通过它们在降低的严格性下杂交的能力定义,降低的严格性包括在大约30°C到35'C在大约35%至25%的甲酰胺中的条件。可以选择地,本发明的核酸通过它们在高度严格性下杂交的能力定义,高度严格性包括的条件为在42'C、在50%甲酰胺、5xSSPE、0.3%SDS中,和封闭核酸的重复序列,如cot-l或鲑精DNA(例如200pg/ml的剪切和变性鲑精DNA)。一方面,本发明的核酸通过它们在降低的严格性条件下杂交的能力定义,降低的严格性条件包括在35'C的降低温度下的35%甲酰胺中。0244杂交以后,滤膜可以在50°C,用6xSSC,0.5%的SDS洗涤。超过25%的甲酰胺,这些条件认为是"中度"条件,低于25%的甲酰胺,这些条件认为是"低度"条件。"中度"杂交条件的一个特定例子是当上面的杂交在甲酰胺为30%进行时。"低严格性"杂交条件的特定例子是当上面的杂交在甲酰胺为10%进行时。0245与特定水平的严格性相对应的温度范围可以进一步通过计算感兴趣的核酸中嘌呤与嘧啶的比例,并且相应地调节温度来縮小。本发明的核酸也通过其可以在Ausubel和Sambrook中所述的高度、中度、低度严格性条件下杂交的能力来定义。对上面的范围和条件所作的变化可以用于实施本发明,并且是本领域技术人员所熟知的。下面进一步描述了杂交条件。76寡核苷酸探针和应用方法0246本发明也提供了用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面,探针包括在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所阐明的序列的至少IO个连续的碱基。可选地,本发明的探针可以是本发明的序列中所阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、50、55、60、65、70、75、80、90、100或150,或更多,或大约10到50、大约20到60、大约30到70个连续碱基。这些探针通过结合或者杂交来鉴定核酸。这些探针可以用于本发明的阵列中,见下面的讨论,包括例如毛细管阵列。本发明的探针也可以用于分离其它的核酸或多肽。0247本发明的探针可以用于确定是否生物样品,如土壤样品,含有具有本发明的核酸序列的生物或者可以从其获得该核酸的生物。在这一程序中,获得了潜在地隐藏了从其分离得到核酸的生物体的生物样品,并且从该生物样品获得核酸。在允许探针与样品中存在的任何互补序列特异性杂交的条件下,将核酸与探针接触。在必要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行变化以确定允许所述探针特异地与互补的核酸杂交的条件(参见有关特异性杂交条件的论述)。0248如果该样品含有从中可分离出核酸的生物体,那么探针的特异性杂交被检测到。杂交可以通过用可检测的试剂标记探针来检测,所述可检测的试剂如放射性同位素、荧光染料或能催化可检测产物形成的酶。使用标记探针来检测样品中互补核酸的存在的许多方法对于本领域技术人员是熟知的。这些方法包括DNA印迹法、RNA印迹法、集落杂交方法和斑点印迹法。这些方法中的每一种方法的方案在Ansubel和Sambrook中给出。0249可选地,可以在一个扩增反应中使用一种以上的探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。在一方面,所述探针包括寡核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubd和Sambrook的如上的所述(参见有关扩增反应的讨论)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所述扩增反应,检测任何得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检测。可选地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在与否。0250源自位于本发明序列的3'或者5'末端附近的序列的探针也可以用于染色体步移(chromosomewalking)程序中,以鉴定含有另外的,如基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码其它感兴趣的蛋白的基因。0251在一方面,本发明的核酸被用作探针来鉴定和分离相关的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,而不是本发明的核酸起初被分离出来的那些生物体。在这样的程序中,核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交然后采用以上描述的任何方法来检测。0252在核酸杂交反应中,用于达到特定严格性水平的条件可以根据待杂交核酸的性质来进行改变。例如,在选择杂交条件时可以考虑核酸杂交区域的长度、互补程度、核苷酸序列组成(如,GC对AT含量的比率)、以及核酸类型(如,RNA对DNA)。另外考虑是否其中一个核酸固定于,如滤膜上。杂交可以在低严格性,中度严格性或者高严格性的条件下进行。作为核酸杂交的例子,含有固定化变性核酸的多聚膜首先在45。C下,在由0.9MNaCl、50mMNaH2P04,PH7,0、5.0mMNa2EDTA、0.5%SDS、10xDenhardt's和0.5mg/ml多核腺苷酸组成的溶液中预杂交30分钟。然后将大约2x107cpm(比活性4-9x108cpm/ug)的32P末端标记的寡核苷酸探针加入到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5XSDS的1xSET(150mMNaCl、20mMTris盐酸,PH7.8、1mMNa2EDTA)中洗涤30分钟,然后在新鲜配制的lxSET,在Tm-l(TC下,再洗涤寡核苷酸探针30分钟。然后将膜暴露于自显影膜上来检测杂交信号。0253通过改变用于鉴定核酸,如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严格性,可以鉴定和分离与探针具有不同同源性水平的核酸。可以通过在低于探针的解链温度下的不同温度中进行杂交而使严格性变化。解链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非常严格的条件被选择为与特定的探针的Tm值相等或比其低大约5'C。探针的解链温度可以通过应用以下的示例性公式计算。对于在14到70个核苷酸长度的探针,应用此公式计算解链温度Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的公式来计算Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的N是探针的长度。预杂交可以在6xSSC、5xDenhardt's试齐U、0.5%SDS、100叱/ml变性的鲑鱼精DNA片段或者6xSSC、5xDenhardt's试剂、0.5%SDS、100吗/ml变性的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt's和其它溶液的配方列于例如Sambrook中。0254通过在以上所示预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交可以是在低于Tm温度15-25°C进行。对于较短的探针,如寡核苷酸探针,杂交可以是在低于Tm温度5-l(TC下进行。一方面,在6xSSC溶液中的杂交在大约68t:进行。一方面,在含有50%甲酰胺的溶液中的杂交在大约42t:进行。考虑所有前述的杂交在高严格性条件下进行。0255杂交以后,洗涤滤膜以去除任何非特异结合的可以检测到的探针。洗涤滤膜所用的严格性也可以根据正被杂交的核酸的性质、正被杂交的核酸的长度、互补的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对DNA)来进行变化。逐渐增高的严格性条件洗涤的例子如下2xSSC,0.1%SDS,室温下15分钟,(低严格性);O.lxSSC,0.5%SDS,室温下30分钟到1小时(中度严格性);O.lxSSC,0.5%SDS,杂交温度和68匸之间,15到30分钟(高严格性);0.15MNaCl,在72i:下15分钟(极高严格性)。最后低严格性洗涤可以在O.lxSSC,室温下进行。以上的例子仅仅示出了可以用于实施本发明,例如洗涤滤膜的一组条件。本领域技术人员将知道,对于不同严格性洗涤有无数方案,所有这些方案都可以用于实施本发明。0256己经与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定与探针序列具有降低水平的同源性的核酸。例如为了获得与可检测探针具有降低水平的同源性的核酸,可以应用不太严格的条件。例如,在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以以5。C的幅度从68'C降低到42。C。杂交后,滤膜用2xSSC,0.5%SDS,在杂交温度下洗膜。超过50°C,这些条件认为是"中度"条件,低于5(TC,这些条件认为是"低度"条件。"中度"杂交条件的例子是上面的杂交在55'C进行时。"低严格性"杂交条件的特定例子是上面的杂交在45'C进行时。0257可选地,杂交在缓冲液,如含有甲酰胺的6xSSC中,在42'C下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%,来确定与探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6xSSC,0.5%SDS在5(TC下洗涤。当甲酰胺浓度大于25%时,这些条件认为是"中度"条件,而低于25%时为"低度"条件。"中度"杂交条件的特定例子是当以上的杂交在30%的甲酰胺中进行时。"低严格性"杂交条件的特定例子是当以上的杂交在10%的甲酰胺中进行时。02580本发明的这些探针和方法可以用于分离具有与本发明的核酸序列有至少大约99%、至少98%、至少97%、至少96%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50%的同源性的序列的核酸,该本发明的核酸序列包括其的至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或者500个连续的碱基,和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多核苷酸可以具有在此说明的其中一个编码序列的天然发生的等位基因突变体的编码序列。当与本发明的核酸比较时,这样的等位基因突变体可以具有置换,缺失或者插入一个或者多个核苷酸。0259此外,本发明的探针和方法可以用于分离编码与本发明多肽具有至少大约99%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50%的序列同一性(同源性)的多肽的核酸,如应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具有在此提及的示例性设置的BLAST2.2.2程序)确定的,所述本发明多肽含有其至少5、10、15、20、25、30、35、40、50、75、100或者150个连续的氨基酸。抑制磷脂酶的表达0260本发明进一步提供与本发明的核酸序列如磷脂酶编码核酸互补的核酸(如,本发明的核酸序列的反义序列)。反义序列可以抑制磷脂酶编码基因的转运,剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA而起作用。例如,通过杂交和/或切割,可以抑制被靶向的核酸的转录或者功能。本发明提供的特别有效的一套抑制物包括能够结合磷脂酶基因或者信使的寡核苷酸,在每一种情况下,阻止或者抑制磷脂酶的产生或者发挥功能。结合可以通过序列特异性的杂交实现。另一类有用的抑制物包括引起磷脂酶信使物失活或者切割的寡核苷酸。寡核苷酸可以具有引起此种切割的酶活性,如核酶。寡核苷酸可以进行化学修饰,或者接合到能够切割互补核酸的酶或组合物上。操作人员可以筛选具有许多不同的此类寡核苷酸的文库,以获得那些具有期望的活性的寡核苷酸。0261磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶降解时,可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂酶的表达和/或活性的本发明的组分,例如,抗体、反义寡核苷酸、核酶和RNAi,可以用于减缓或者阻止酸败。因此,在一方面,本发明提供方法和组分,包括将本发明的抗体、反义寡核苷酸、核酶和RNAi应用于植物或者植物产品(如,水果、种籽、根、叶等),以阻止或者延缓酸败。这些组分也可以由植物(如,转基因植物)或者其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)表达。0262用于抑制磷脂酶表达的本发明的组分(如反义物、iRNA、核酶、抗体)可以用作药物组分。0263本发明提供能够结合磷脂酶信使的反义寡核苷酸,该反义寡核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡核苷酸的策略在科学和专利文献中己经充分说明,并且技术熟练人员可以应用本发明的新型试剂来设计这样的磷脂酶寡核苷酸。例如,用于筛选有效的反义寡核苷酸的基因步行/RNA作图试验方案是本领域所熟知的参见,如Ho(2000)MethodsEnzymol.314:168-183,该文献描述了RNA作图分析方法,作图分析方法以标准的分子技术为基础,为有效的反义序列选择提供了简单而可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。0264也可以应用天然存在的核酸作为反义寡核苷酸。反义寡核苷酸可以是任何长度;例如,在可选的方面,反义寡核苷酸在大约5到100、大约10到80、大约15到60、大约18到40之间。最佳长度可以通过常规的筛选方法来确定。反义寡核苷酸可以以任何浓度存在。最佳浓度可以通过常规的筛选方法来确定。巳经知道有许多能够解决该潜在的问题的合成的,非天然存在的核苷酸和核酸类似物。例如,可以应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸连接的反义寡核苷酸,如WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N丄,1996)所述。正如上面所描述的,本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亚甲基(甲基亚氨)、3'-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸。0265可以应用组合化学方法产生大量的寡核苷酸,可以对这些寡核苷酸快速筛选,以获得对任何靶,如本发明的有义和反义的磷脂酶序列,具有适当的结合亲和性和特异性的特定的寡核苷酸(见,如Gold(1995)J.ofBiol.Chem.270:13581-13584)。層丝提艨0266本发明提供能够结合磷脂酶信使的核酶,其可以通过耙向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向作用的对磷脂酶具特异性的反义序列在科学和专利文献中已经充分说明,并且技术熟练人员可以应用本发明的新型试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分结合耙RNA而起作用,该核酶的靶RNA结合部分与切割靶RNA的RNA酶活部分非常接近。因此,核酶通过互补的碱基配对作用,识别并且结合靶RNA,并且一旦结合于正确的位点,将酶法切割靶RNA并且使靶RNA失活。如果切割发生在编码序列中,以这种方式进行的耙RNA的切割将破坏其指导编码蛋白合成的能力。当核酶结合并且切割其耙RNA后,一般情况下,将从RNA上释放,因此能够反复地结合和切割新的耙标。0267在一些情况下,核酶的酶促性质会优于其它的技术,如反义技术(其中核酸分子仅结合于核酸靶来阻止其转录、翻译或者与其它分子的结合),因为实现治疗效果所必要的核酶有效浓度可能低于反义寡核苷酸的浓度。这一潜在的优点反映出核酶可以以酶促方式进行作用的能力。因此,单个核酶分子可以切割靶RNA的多个分子。另外,核酶典型地是高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机制。即,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素,这种切割机制还依赖于另外的因素。这样,核酶作用的特异性比结合于同样的RNA位点的反义寡核苷酸高。0268具有酶活的核酶RNA分子可以以锤头状基序(hammerheadmotif)形成,但也可以以发夹、肝炎S病毒、I类内含子或者RnaseP样的RNA(与RNA的引导序列有关)基序形成。这样的锤头状基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有描述;发夹基序在Hampel(1989)Biochemistry28:4929和Hampel(1990)Nuc.AcidsRes.18:299中有描述;肝炎S病毒基序在Perrotta(1992)Biochemistry31:16中有描述;RNaseP基序在Guetrier陽Takada(1983)Cell35:849中有描述;I类内含子在Cech美国专利4,987,071中有描述。描述这些特异基序的目的不是限制性的;本领域技术人员将认识到,本发明的酶RNA分子具有与一个或者多个耙基因RNA区域互补的特异性底物结合位点,并且具有在底物结合位点内或者周围赋予该分子以RNA切割活性的核苷酸序列。m4f涉譜A0269一方面,本发明提供包括本发明的磷脂酶序列的RNA抑制分子,所谓的"RNAi"分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。在一个方面,RNAi的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。虽然本发明不限于任何特殊的作用机制,但RNAi可进入细胞中,引起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。当细胞暴露于双链RNA(dsRNA)时,来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为短的干扰RNA的短碎片,它可触发与其序列匹配的mRNA的降解。在一个方面,本发明的RNAi可用于基因沉默(gene-silencing)疗法中,见,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一个方面,本发明提供了使用本发明的RNAi选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面,本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子的方法在本领域中是熟知的,见,例如美国专利6,506,559;6,511,82;6,515,109;6,489,127。核酸修饰0270本发明提供产生本发明的核酸,例如那些编码磷脂酶的核酸的变体的方法。在可选择的实施方式中,本发明提供了修饰本发明的酶的方法,例如通过随意或随机方法,或非随机方法或"定向进化"方法,诸如基因位点饱和诱变TM(GSSM)对其编码序列进行突变,以改变酶的活性pH范围或最佳活性pH范围,活性温度范围或最佳活性温度范围、特异性、活性(动力学);酶对糖基化、磷酸化或金属(例如Ca、Mg、Zn、Fe、Na)的应用,例如以影响pH/温度稳定性。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,以增加它对蛋白酶活性的抗性。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,以改变酶对Ca、Mg、Na的特异性金属螯合剂的应用,其不会螯合Zn。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,其将具有期望的活性组合,例如PI、PA和PC/PE特异性PLCs。0271这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷脂酶相比具有改变的或不同活性或者改变的或不同稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用,例如,产生基因/信息表达,信息翻译或者信息稳定性上的变异。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后再插入细胞中而加以改变。0272本发明的核酸可以通过任何方法改变。例如,无规则或随机方法,或者,非随机方法,或者"定向进化"方法。0273基因的随机突变方法在本领域是已知的,参见如,美国专利5,830,696。例如,可以应用突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者Y辐射,或者化学诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者组合使用来诱导DNA的断裂,其可以通过重组被修复。其它的化学诱变剂包括,女口,亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物,如,亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。0274可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques18:194-196。可选择地,核酸,如基因,可以在随机片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793。在可选择的方面,修饰、增加或者删除可以通过易错PCR、改组、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursivesequencerecombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口只又重i秀变(gappedduplexmutagenesis)、点错酉己4彦复i秀变(pointmismatchrepairnmtagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变(restriction-selectionmutagenesis)、限制纯化诱变(restriction-purificationmutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成和/或者这些方法和其它方法的组合产生。0275以下的出版物描述了各种递归重组程序和/或可以并入到本发明的方法中的方法Stemmer(1999)"Molecularbreedingofvirusesfortargetingandotherclinicalproperties"TumorTargeting4:1-4;Ness(1999)NatureBiotechnology17:893-896;Chang(1999)"EvolutionofacytokineusingDNAfamilyshuffling"NatureBiotechnology17:793-797;Minshull(1999)"Proteinevolutionbymolecularbreeding"CurrentOpinioninChemicalBiology3:284-290;Christians(1999"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling"NatureBiotechnology17:259-264;Crameri(1998)"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution"Nature391:288-291;Crameri(1997)"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling"NatureBiotechnology15:436-438;Zhang(1997)"DirectedevolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening"Proc.Natl.Acad.Sci.USA94:4504-4509;Patten等(1997)"ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines"CurrentOpinioninBiotechnology8:724-733;Crameri等(1996)"Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling"NatureMedicine2:100-103;Crameri等(1996)"ImprovedgreenfluorescentproteinbymolecularevolutionusingDNAshuffling"NatureBiotechnology14:315-319;Gates等(1996)"Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonaiacrepressor'headpiecedimer"JournalofMolecularBiology255:373-386;Stemmer(1996)"SexualPCRandAssemblyPCR"In:TheEncyclopediaofMolecularBiology.VCHPublishers,NewYork.447-457页;Crameri禾口Stemmer(1995)"Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes"BioTechniques18:194-195;Stemmer等(1995)"Single-stepassemblyofageneandentireplasmidformlargenumbersofoligodeoxyribonucleotides"Gene,164:49-53;Stemmer(1995)"TheEvolutionofMolecularComputation''Science270:1510;Stemmer(1995)"SearchingSequenceSpace,,Bio/Technology13:549-553;Stemmer(1994)"RapidevolutionofaproteininvitrobyDNAshuffling"Nature370:389-391;禾口Stemmer(1994〉"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution"Proc.NatLAcad.Sci,USA91:10747-10751。0276产生多样性的突变方法包括,例如,定点诱变(Ling等(1997"ApproachestoDNAmutagenesis:anoverview"AnalBiochem.254(2):157-178;Dale等(1996)"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod"MethodsMol.Biol.57:369-374;Smith(1985)"Invitromutagenesis"Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)"Strategiesandapplicationsofinvitromutagenesis"Science229:1193-1201;Carter(1986)"Site-directedmutagenesis,,Biochem.J.237:1-7;Kunkel(1987)"Theefficiencyofoligonucleotidedirectedmutagenesis"在NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J.eds.,SpringerVerlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"Proc.Natl.Acad.Sci.USA82:488-492;Kunkel等(1987)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"MethodsinEnzymol.154,367-382;禾卩Bass等(1988)"MutantTrprepressorswithnewDNA-bindingspecificities"Science242:240-245);寡核苷酸诱导的定点诱变(MethodsinEnzymol.100:468-500(1983);MethodsinEnzymol.154:329-350(1987);Zoller&Smith(1982)"Oligonucleotide-directedmutagenesisusingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment"NucleicAcidsRes.10:6487-6500;Zoller&Smith(1983)"Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoMl3vectors"MethodsinEnzymol.100:468-500;禾口Zoller&Smith(1987)"Oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotideprimersandasingle-strandedDNAtemplate"MethodsinEnzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985)"Theuseofphosphorothioate陽modifiedDNAinrestrictionenzymereactionstopreparenickedDNA"Nucl.AcidsRes,13:8749-8764;Taylor等(1985)"Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA"Nucl.AcidsRes.13:8765-8787(1985);Nakamaye(1986)"InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis"Nud,AcidsRes,14:9679-9698;Sayers等(1988)"Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis"Nucl.AsidsRes.16:791-802;禾口Sayers等(1988)"Strandspecificcleavageofphosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide"Nucl.AcidsRes.16:803-814);使用缺口二倍DNA的诱变(Kramer等(1984)"ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction"Nucl.AcidsRes.12:9441-9456;Kramer&Fritz(1987)MethodsinEnzymol."Oligonucleotide-directedconstructionofmutationsviagappedduplexDNA"154:350-367;Kramer等(1988)"ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations"Nucl.AcidsRes,16:7207;禾口Fritz等(1988)"Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsin85vitro"Nucl.AcidsRes.16:6987-6999)。0277可以用于实践本发明方法的另外的实验方案包括点错配修复(Kramer(1984)"PointMismatchRepair"Cell38:879-887),应用修复缺陷型宿主株的诱变(Carter等(1985)"Improvedoligonucleotidesite-directedmutagenesisusingMl3vectors"Nucl.AcidsRes.13:4431-4443;禾口Carter(1987)"Improvedoligonucleotide-directedmutagenesisusingMl3vectors"MethodsinEnzymol.154:382-403),缺失诱变(Eghtedarzadeh(1986)"Useofoligonucleotidestogeneratelargedeletions"Nucl,AcidsRes.14:5115),限帝U-选择和限制陽选择和限制-纯化(Wells等(1986)"Importanceofhydrogen-bondformationinstabilizingthetransitionstateofsubtilisin"Phil.Trans.R,Soc.Lond.A317:415-423),通过全基因合成的诱变(Nambiar等(1984)"TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein"Science223:1299-1301;Sakamar禾口Khorana(1988)"Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein(transducin)"Nucl.AcidsRes,14:6361-6372;Wells等(1985)"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites"Gene34:315-323;禾口Gmndstrom等(1985)"Oligonucleotide-directedmutagenesisbymicroscale'shot-gun'genesynthesis"Nucl.AcidsRes,13:3305-3316),双链断裂修复(Mandecki(1986);Arnold(1993)"Proteinengineeringforunusualenvironments"CurrentOpinioninBiotechnology4:450-455。"Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite-specificmutagenesis"Proc.Natl,Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节可在MethodsinEnzymology第154巻中发现,其中也描述了用于解决各种诱变方法中所遇到的问题的有用策略。0278也参见Stemmer的美国专利5,605,793(1997年2月25日),"MethodsforInVitroRecombination;"Stemmer等人的美国专利5,811,238(1998年9月22日)"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination;"Stemmer等人的美国专利5,830,721(1998年11月3日),"DNAMutagenesisbyRandomFragmentationandReassembly;"Stemmer等人的美国专利5,834,252(1998年11月10日)"End-ComplementaryPolymeraseReaction;"Minshull等人的美国专利5,837,458(1998年11月17日),"MethodsandCompositionsforCellularandMetabolicEngineering;"WO95/22625,Stemmer禾卩Cramen,"MutagenesisbyRandomFragmentationandReassembly;"Stemmer禾卩Lipschutz的WO96/33207"EndComplementaryPolymeraseChainReaction;"Stemmer禾卩Crameri的WO97/20078"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination;"Minshull禾卩Stemmer的WO97/35966,"MethodsandCompositionsforCellularandMetabolicEngineering;"Punnonen等人的WO99/41402"TargetingofGeneticVaccineVectors;"Punnonen等人的WO99/41383"AntigenLibraryImmunization;"Punnonen等人的WO99/41369"GeneticVaccineVectorEngineering;"Punnonen等人的WO99/41368"OptimizationofImmunomodulatoryPropertiesofGeneticVaccines;"Stemmer禾口Crameri的EP752008"DNAMutagenesisbyRandomFragmentationandReassembly;"Stemmer的EP0932670"EvolvingCellularDNAUptakebyRecursiveSequenceRecombination;"Stemmer等人的WO99/23107,"ModificationofVimsTropismandHostRangebyViralGenomeShuffling;"Apt等人的WO99/21979,"HumanPapillomavirusVectors;"delCardayre等人的WO98/31837"EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination;"Patten禾口Stemmer的WO98/27230"MethodsandCompositionsforPolypeptideEngineering,"Stemmer等人的WO98/27230,"MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection,"WO00/00632,"MethodsforGeneratingHighlyDiverseLibraries,"WO00/09679,"MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences,"Arnold等人的WO98/42832,"RecombinationofPolynucleotideSequencesUsingRandomorDefinedPrimers,"Arnold等人的WO99/29902,"MethodforCreatingPolynucleotideandPolypeptideSequences,"Vind的WO98/41653,"AninVitroMethodforConstructionofaDNALibrary,"Borchert等人的WO98/41622,"MethodforconstructingaLibraryUsingDNAShuffling,"禾卩Pati禾口Zarling的WO98/42727,"SequenceAlterationsusingHomologousRecombination"。0279某些美国申请提供了关于产生不同多样性的方法的额外细节,包括Patten等人于1999年9月28日提交的"SHUFFLINGOFCODONALTEAEDGENES"(美国系列号09/407,800);delCardayre等人于1998年7月15日提交的(美国系列号09/166,188)和于1999年7月15日提交的(美国系列号09/354,922)"EVOLUTIONOFWHOLECELLSANDORGANISMSBYRECURSIVESEQUENCERECOMBINATION";Crameri等人的于1999年9月28日提交的"OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION"(美国系列号09/408,392)和Crameri等人于2000年1月18日提交的"OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION"(PCT/US00/01203);Welch等人于1999年9月28日提交的"USEOFCODON-VARIEDOLIGONUCLEOTIDESYNTHESISFORSYNTHETICSHUFFLING"(美国系列号09/408,393);Selifonov等人于2000年1月18日提交的"METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDS&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS"(PCT/US00/01202)禾口,例如,Selifonov等人于2000年7月18日提交的"METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDS&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS"(美国系列号09/618,579);Selifonov和Stemmer于2000年1月18日提交的"METHODSOFPOPULATINGDATASTRUCTURESFORUSEINEVOLUTIONARYSIMULATIONS"(PCT/US00/01138);和Affholter于2000年9月6日提交的"SINGLE-STRANDEDNUCLEICACIDTEMPLATE-MEDIATEDRECOMBINATIONANDNUCLEICACIDFRAGMENTISOLATION"(美国系列号09/656,549)。0280非随机或"定向进化"方法包括,例如饱和诱变(例如GSSM)、合成连接重装配(SLR)或其组合,它们被用于修饰本发明的核酸,以产生具有新的或改变的特性(例如在高度酸性或碱性条件下的活性,在高温或低温的活性,等等)的磷脂酶。由修饰的核酸编码的多肽可以在测试磷脂酶或其它活性之前被筛选活性。可以使用任何测试形式或实验方案,例如使用毛细管阵列平台。例如参见美国专利6,361,974;6,280,926;5,939,250。潜游诱变或G5W0281本发明的一个方面,非随机的基因修饰,"定向进化过程"用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为"基因位点诱变"、"位点饱和诱变"、"基因位点饱和诱变"或者简单地称为"GSSM"。饱和诱变可以与别的诱变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSM包括提供模板多核苷酸和众多的寡核苷酸,其中每种寡核苷酸包括与模板多核苷酸同源的序列,因此靶向模板多核苷酸中的特异序列,以及为同源基因的变体的序列;通过使用寡核苷酸复制模板多核苷酸,产生包括非随机序列变体的子代多核苷酸,从而产生包括同源基因序列变异的多核苷酸。0282一方面,含有简并N,N,G/T序列的密码子引物被用于将点突变引入多核苷酸中,以便产生一组子代多肽,其中在每一氨基酸位置上可表现出全范围的单氨基酸置换,置换发生的位置例如酶活性位点中的氨基酸残基,或将要被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列,简并N,N,G/T序列,和任选地第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并性包括了所有20个氨基酸的密码子。一方面,一个这样的简并寡核苷酸(例如包括一个简并N,N,G/T序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置换。另一方面,使用至少两个简并序列盒,或在相同的寡核苷酸中或不同的寡核苷酸中,用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。例如,一个寡核苷酸中可以包含一个以上N,N,G/T序列,以便在多于一个的位点上引入氨基酸突变。这些多个N,N,G/T序列可以直接相邻,或被一个或多个额外的核苷酸序列分隔开。另一方面,用于引入插入和删除的寡核苷酸可以单独使用,或者与含有N,N,G/T序列的密码子组合使用,以便引入氨基酸插入、删除和/或置换的任何排列组合0283一方面,两个或更多个连续氨基酸位置的同时诱变是使用含有相邻N,N,G/T三联体的寡核苷酸进行的,即简并(N,N,G/T)n序列。另一方面,使用与N,N,G/T序列相比具有较低简并性的简并序列盒。例如,在一些情况下,可能期望(例如,在寡核苷酸中)使用仅包括一个N的简并三联体序列,其中所述的N可以在三联体的第一、第二或第三位置上。在该三联体的剩余两个位置上,可以使用包括任意排列组合的任何其它碱基。可以选择地,在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列。0284一方面,使用简并三联体(例如N,N,G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)(在可以选择的方面,这些方法也包括在每一氨基酸残基或密码子、位置产生少于全部的可能置换)。例如,对于100个氨基酸的多肽,可以产生2000个不同种类(即每个位置上的20种可能氨基酸x100个氨基酸位置)。通过使用含有简并N,N,G/T三联体的寡核苷酸或一组寡核苷酸,32种不同序列可编码所有20种可能的天然氨基酸。因此,在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中,产生了编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷酸可以任选地与所公开的简并引物组合使用;例如,非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。0285一方面,每一饱和诱变反应容器含有编码至少20种子代多肽(例如磷脂酶)分子的多核苷酸,以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置(其它方面使用了少于20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的宿主中,例如大肠杆菌宿主中),并进行表达筛选。当单个子代多肽通过筛选鉴定,显示出有利的特性变化时(当与亲本多肽相比时,如在碱性或酸性条件下增高的磷脂酶水解活性),可以对其测序以鉴定其中所含的相应的有利氨基酸置换。0286一方面,如本文所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后,可以在超过一个的氨基酸位置确定出有利的氨基酸变化。可以产生一个或多个新的子代分子,其含有所有或部分这些有利的氨基酸置换的组合。例如,如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化,那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性,以及两个有利变化中的每一个的可能性)和3个位置。因此,总共有3x3x3或27种可能性,其中包括了先前被检验的7种可能性,即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。0287另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方法一起使用,例如合成的连接重装配(见下文)、重排、嵌合化、重组和其它诱变方法和诱变剂。本发明提供以重复方式使用任何诱变方法,包括饱和诱变。会成遂體微"丄W0288本发明提供称为"合成连接重装配",或者简单地称为"SLR"的非随机基因修饰系统,这是一种"定向进化方法",以产生具有新的或者改变的特性的磷脂酶。SLR是非随机地把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同,因为核酸构件不是改组的、串联的或者随机地嵌合的,而是非随机组装的。参见,例如,美国专利申请系列号(USSN)09/332,835,题目是"SyntheticLigationReassembtyinDirectedEvolution",于1999年6月14日提交("USSN09/332,835")。一方面,SLR包括下述步骤(a)提供模板多核苷酸,其中模板多核苷酸包含编码同源基因的序列;(b)提供多个构件多核苷酸,其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-overreassemble),所述构件多核苷酸包含作为同源基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列;(c)将构件多核苷酸与模板多核苷酸组合在一起,以便构件多核苷酸与模板多核苷酸交换重装配,以产生包含同源基因序列变异的多核苷酸。0289SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此,该方法可以被用于非随机地产生包括超过10,个不同嵌合体的子代分子的文库(或集合)。SLR可以被用于产生包括超过101()()()个不同子代嵌合体的文库。因此,本发明的一些方面包括产生一组最终嵌合的核酸分子的非随机方法,所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤,以及装配这些核酸构件的步骤,这样可获得依设计而定的整个装配次序,所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。02卯将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是"有用的",如果它们能使这些构件以预定次序结合的话。因此,核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定的。如果使用多于一个的装配步骤,那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面,用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段,以实现结构片段的共价结合。0291一方面,寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得,所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源,它们在将被诱变例如被嵌合或改组的核酸构件的设计中有用。0292在该方法的一个方面,多个亲本核酸模板的序列被联配,以便选择一个或多个分界点。这些分界点可以位于同源区域,由一个或多个核苷酸构成。这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界,以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地,分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域,或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地,在一个方面,有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域,或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。一方面,分界点是由所有亲本多核苷酸序列共有的同源区域。0293一方面,连接再装配过程被彻底地进行,以便产生含有尽量可能多的子代嵌合多核苷酸的文库。换句话说,核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时,另一方面,在每一组合中的装配次序(即各个最终嵌合核酸的5'到3序列中每一构件的装配次序)遵循如上所述的设计(或非随机地)。由于本发明的非随机特性,大大地降低了不需要的副产品的可能性。0294另一方面,连接再装配方法被系统地进行。例如,实施该方法,以便产生子代分子的系统区分化的文库,该文库分成能被系统地筛选的数个部分,例如可以逐个地筛选。换句话说,通过选择性的和审慎的应用特定的核酸构件,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检查和筛选步骤。因此,这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性,所产生的子代分子一方面包含有最终嵌合核酸分子的文库,这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到,本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步,应该意识到,就本发明的可操作性而言,对分子间同源性的要求大大地放宽了。事实上,甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如,由于密码子的摆动,即密码子的简并性,可以将核苷酸取代引入核酸构件,同时又不会改变在相应的祖先模板中最初编码的氨基酸。可以选择地,可以改变密码子,从而改变对原始氨基酸的编码。在本发明中,这样的取代可以被引入到核酸构件中,以便增加分子间同源分界点的发生率,从而使得在构件之间可获得的偶联的数量增加,而这又允许产生更多数量的子代嵌合分子。0295另一方面,产生构件的步骤的合成属性允许设计和引入核苷酸(例如一个或多个核苷酸,例如可以是密码子或内含子或调控序列),这些核苷酸随后可以在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪接能力)被任选地去除。应该意识到,在许多情况下,除了产生有用的分界点的潜在好处之外,还有许多其它原因也使得可能期望引入这些核苷酸。0296一方面,核酸构件被用于引入内含子。因此,功能性的内含子被引入进根据在此描述的方法产生的人造基因中。人工引入的内含子可以在宿主细胞中发挥基因剪切的功能,作用方式非常像天然产生的内含子发挥基因剪切功能的方式。汰众/^定砟遂众z务-统0297本发明提供了一种非随机的基因修饰系统,命名为"优化的定向进化系统",其可以用来产生具有新的或者改变的特性的磷脂酶。优化的定向进化涉及还原性重配、重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件(crossoverevents)的序歹"0298遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。0299此外,这一方法与其它系统相比,提供了一种用于探究大数量的可能蛋白变体空间的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得到的蛋白较不可能具有增高水平的特定活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界限缩小了。当要计算在最初的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时,这便提供了更加可控数目的变量。0300产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合在一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变体。在USSN09/332,835中可以发现另外的信息。对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如,为了发现如在高温下具有更高活性的嵌合变体,可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子,对应于每一个亲本变体的每一部分可以产生总共50个寡核苷酸序列。相应地,在连接再装配过程中,在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一种寡核苷酸的浓度都保持不变,那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将连接于嵌合序列内而不产生交换。0301因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给出了一套许多的亲本变体、对应于每种变体的许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,使得能够通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般是在两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。0302此外,这些方法与其它系统相比,提供了一种用于探究大数量的可能蛋白变体空间的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件,所以造成嵌合分子之间的功能多样性的界限减少。当计算出在最初的亲本多核苷酸中的哪一个可能影响到特定的性质时,便提供了更加可控制的变量。0303一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸,产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变体。也可参见USSN09/332,835。0304对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如,为了发现如在高温下具有更高活性的嵌合变体,可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子,对应于每一个亲本变体的每一部分可以产生一组50个寡核苷酸序列。相应地,在连接再装配过程中,在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接,而不导致遗传交换事件。如果在这一例子的任何连接歩骤中,来自每一个亲本的每一种寡核苷酸的浓度都保持不变,那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将连接于嵌合序列内而不产生交换。0305因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给出了一套许多的亲本变体、对应于每种变体的许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。緣叙袭事伴0306本发明的多个实施方式包括系统和软件,它们接收所需的遗传交换的概率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入值。该程序输出是"片段PDF",它可以用于确定用于产生重新装配的基因和那些基因的估计的遗传交换PDF的方案。在此描述的过程优选地在MATLAB(TheMathworks,Natick,Massachusetts)中进行,MATLAB是一种用于技术计算的程序语言和开发环境。0307在实践本发明时,这些过程可以迭代反复。例如,对产生改变的磷脂酶表型的核酸(或者,所述核酸)进行鉴定,重新分离,再修饰,再检测活性。此过程可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢途径可以被工程化到细胞中,包括磷脂酶活性。0308类似地,如果确定了某特定寡核苷酸对于所期望的特性(例如新的磷脂酶表型)根本不会造成影响,则可以通过合成包括待除去的序列的更大的亲本寡核苷酸,从而将这段序列作为变量除去。由于将这一序列合并到更大的序列中避免了任何遗传交换事件,所以在子代多核苷酸中,这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的可能提供特定性质或者活性的蛋白变体。沐力改邀0309分子的体内改组在本发明的方法中使用,提供本发明的多肽的变体,例如抗体、磷脂酶以及类似物。体内改组可以利用重组多聚体的细胞的天然特性进行。尽管体内重组已经提供了分子多样性的主要天然途径,但遗传重组仍然是一种相对复杂的过程,该过程涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombinationchiasma)的代谢步骤;和最后3)交叉消除,得到分离的重组分子。交叉的形成需要同源序列的识别。0310一方面,本发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂合多核苷酸的方法。本发明可以用于通过将共有部分序列同源性的至少一个区域的至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中而产生杂合多核苷酸。该部分序列同源性的区域促进导致产生杂合多核苷酸的序列识别的过程。如本文所用,术语"杂合多核苷酸"是由本发明的方法产生的任何核苷酸序列,含有从至少两个最初多核苷酸序列得到的序列。这样的杂合多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外,这样的杂合多核苷酸可以由利用重复序列以改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。0311本发明也提供使用本发明的核酸和多肽产生本发明的核酸和磷脂酶序列的序列变体,或者分离磷脂酶,例如,磷脂酶的序列变体的方法。一方面,本发明提供本发明的磷脂酶基因的变体,该变体可以使用任何方法改变,包括,例如随意或随机方法,或者非随机方法,或者"定向进化"方法,如以上描述。0312被分离的变体可以是天然发生的。变体也可以在体外产生。变体也可以应用基因工程技术来产生,如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地,可以应用化学合成或者修饰方法来产生这样的变体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变体的其它方法。这些方法包括这样的程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸,所述的特征增加这些多肽在工业或实验室应用中的价值。在这样的程序中,大量的变体序列被获得和表征,这些变体序列与从天然分离物中得到的序列相比,有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离物的核酸编码的多肽的氨基酸变化。0313例如,变体可以通过使用易错PCR产生。在易错PCR中,PCR在DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如,Leung,D.W.等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.R,PCRMethodsApplic.,2:28-33,1992中描述。简要地说,在这样的程序中,待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适当浓度的dNTP混合,从而在全长的PCR产物中得到高的点突变率。例如,反应可以使用20fmo1待诱变的核酸进行,每种PCR引物30pmo1,反应缓冲液包含50mMKC1、10mMTrisHC1(pH8.3)和0.0r^明胶、7mMMgCl2、0.5mMMnCl2、5单位的Taq聚合酶、0.2mMdGTP、0.2mMdATP、lmMdCTP禾卩lmMdTTP。PCR可以进行30个循环,每个循环为94°C1分钟;45°Cl分钟;和72'Cl分钟。然而,应该意识到,这些参数可以适当地变化。诱变的核酸被克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。0314变体也可以用寡核苷酸诱导的定向突变产生,在任何感兴趣的克隆DNA中产生位点特异性的突变。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中描述。简要地说,在这样的程序中,合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡核苷酸,将这些寡核苷酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆,并评估它们编码的多肽的活性。0315另一种产生变体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生,一个反应的产物引发另一个反应的产物。装配PCR已经被描述,例如在美国专利5,965,408中。0316还有另一种产生变体的方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,并重悬于PCR混合物中。在有利于核酸片段之间发生重组的条件下进行PCR反应。例如,PCR可以这样进行将纯化的片段以10-30ng/nl的浓度重悬于含有0.2mM的各种dNTP、2.2mMMgCl2、50mMKCl、10mM的Tris-HCl,pH9.0以及0.1%的TritonX-100的溶液中。以100:1的比例在反应混合物中加入2.5单位的Taq聚合酶,用以下的条件进行PCR:94'C60秒,94。C30秒,50陽55。C30秒,72°C30秒(30-45次),然后72"C进行5分钟。然而,可以意识到,这些参数可以进行适当的变化。在一些方面,寡核苷酸可以被包括在该PCR反应中。在其它方面,DNA聚合酶I的Kleriow片段可以用于第一组PCR反应,而Taq聚合酶可以用于后续组的PCR反应。重组序列被分离,并评估它们编码的多肽的活性。0317变体也可以通过体内诱变产生。在一些实施方式中,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的"突变"菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT发明者E·奥多诺谷,N·R·巴尔顿申请人:维莱尼姆公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1