磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法

文档序号:449671阅读:315来源:国知局
专利名称:磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
技术领域
本发明总体上与磷脂酶,编码磷脂酶的多核苷酸,制备以及应用这些多核苷酸和多肽的方法。特别地,本发明提供具有磷脂酶活性的新颖多肽,编码它们的核酸以及与它们结合的抗体。也提供工业方法和包括应用这些磷脂酶的产品。
背景技术
磷脂酶是水解磷脂的酯键的酶。与它们在磷脂代谢的重要性相对应,这些酶广泛存在于真核和原核生物中。磷脂酶影响代谢,生物膜的形成和重组,并且磷脂酶也涉及信号的级联。按照磷脂分子攻击的键的位置,已知有几种类型的特异性不同的磷脂酶。磷脂酶A1(PLA1)去除1-位的脂肪酸而产生游离的脂肪酸和1-溶血-2-酰基磷脂。磷脂酶A2(PLA2)去除2-位的脂肪酸而产生游离的脂肪酸和1-酰基-2-溶血磷脂。PLA1和PLA2酶可能是在细胞内也可以在细胞外,是膜结合的或者可溶的。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC)去除磷酸组分,产生1,2二酰基甘油和磷基。磷脂酶D(PLD)产生1,2-二酰基甘油磷酸和碱性基团。PLC和PLD在细胞功能和信号传导中是重要的。PLD曾经是在生物催化中主要的磷脂酶(参见,如,Godfrey,T.and West S.(1996)工业酶学,299-300,Stockton Press,New York)。马铃薯块茎储藏蛋白(Patatins)是另一类磷脂酶,认为其作用如同PLA(参见例如,Hirschberg HJ,et al.,(2001),EurJ Biochem 268(19)5037-44)。
普通的含油种子,如大豆,油菜籽,向日葵籽,芝麻和花生用于油的来源和原料。在榨油的过程中,种子用机械和热处理。油分离,并且用溶剂从粗粉中分离。应用蒸馏法,从油中分离出溶剂并且回收。油经过“脱胶(degummed)”并且进行精练。粗粉中的溶剂组分可以通过“脱溶剂烤炉”的热处理来蒸发,随后,粗粉干燥和冷却。当溶剂通过蒸馏分离以后,产生的粗油经过特殊的脱胶程序和物理精练的方法加工成为食用油。也可以作为原料产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animal rations)。
脱胶(degumming)是精练植物油的第一步,脱胶设计为去除与油一起抽提、但影响以后的工艺过程的污染磷脂。这些磷脂仅仅以无水形式溶于植物油中,如果通过简单的水合作用,磷脂可以沉淀并去除。水合作用一般通过少量的水与充分干燥的油连续混合进行。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1到1.5%。虽然假如在50℃到80℃的范围内,油的粘度会降低,水合胶的分离更好,但是温度条件并不高度严格。
很多油脱胶(oil degumming)的方法目前都在使用。油脱胶的过程可以通过使用磷脂酶进行酶协助。磷脂酶A1和A2已经应用于不同商业过程中的油脱胶过程,如“ENZYMAXTM脱胶”(Lurgi Life Science Technologies GmbH,Germany)。也已经考虑磷脂酶C(PLC)应用于油的脱胶,因为磷脂酶C在磷脂上作用产生的磷酸组分是水溶性的,并且容易去除,而且甘油二酯与油在一起,降低了损失;参见,如Godfrey,T.and West S.(1996)工业酶学pp.299-300,Stockton Press,NewYork,Dahlke(1998)“An enzymatic process for the physical refining of seed oils,”Chem.Eng.Technol.21278-281,Clausen(2001)“Enzymatic oil degumming by anovel microbial phospholipase,”Eur.J.Lipid Sci.Technol.103333-340。
高磷脂油(high phosphatide oils),例如黄豆,芸苔和向日葵的处理方法不同于别的油如棕榈的处理方法。不像低磷脂油的蒸汽或“物理精练”处理过程,这些高磷油需要特定的化学和机械处理去除含磷的磷脂。这些油一般通过化学精练的过程,化学精练过程必需中和形成皂的游离脂肪酸和一种不溶性的胶组成。中和过程对于去除游离脂肪酸和磷脂非常有效,但是该过程也导致了显著的产率损失和质量的下降。在一些情况下,高磷脂的粗制油在苛性中和前进行脱胶。利用卵磷脂的大豆油就是这种情况,其中的油首先用水或者酸来脱胶。
植物固醇(phytosterols)(植物甾醇(plant sterols))是天然产物的三萜家族的成员,其包括超过100种不同的植物固醇和超过4000种其它种类的三萜。总体上,认为植物固醇是由于增加类固醇/磷脂的比例而导致膜的硬化从而稳定植物的细胞膜。在化学上,植物固醇在结构上非常类似于胆固醇。主要的植物固醇是β-谷甾醇,芸苔固醇和豆固醇。其它的包括豆甾烯醇(二氢β-谷甾醇),二氢谷甾醇,24-脱氢胆固醇,海绵甾醇,海绵甾醇,γ-谷甾醇和菜子甾醇。
植物甾醇是健康和营养工业中的重要的农产品。它们用于制造化妆品的乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和类似物以及它们的酯已经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物甾醇通过在肠腔中抑制胆固醇的吸收来降低血清中的胆固醇水平,并且植物甾醇在很低的水平具有免疫调节特征,包括T淋巴细胞增强的细胞应答和抗癌症细胞系的天然杀伤细胞的细胞毒性。此外,它们在治疗肺结核,风湿性关节炎,控制HIV-感染的病人和马拉松选手的免疫压力抑制的临床研究中的治疗效应已经得到证明。
植物固醇的酯类,也指植物甾醇酯,由美国食品药品管理局(FDA)批准为GRAS(一般认为安全,Generally Recognized As Safe),用于人造黄油,并在1999年推广。2000年9月,FDA也提出一个过渡性的规定,其准许了含有植物甾醇酯类的食品的健康申明标记(health-claiming labeling)。因此,用植物甾醇酯类进行营养强化的食品是高度预期被消费者接受的。
发明概述本发明提供包括与本发明的典型序列,例如SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO11,SEQ ID NO13,SEQID NO15,SEQ ID NO17,SEQ ID NO19,SEQ ID NO21,SEQ ID NO23,SEQID NO25,SEQ ID NO27,SEQ ID NO29,SEQ ID NO.31,SEQ ID NO33,SEQID NO35,SEQ ID NO37,SEQ ID NO39,SEQ ID NO41,SEQ ID NO43,SEQID NO45,SEQ ID NO47,SEQ ID NO49,SEQ ID NO51,SEQ ID NO53,SEQID NO55,SEQ ID NO57,SEQ ID NO59,SEQ ID NO61,SEQ ID NO63,SEQID NO65,SEQ ID NO67,SEQ ID NO69,SEQ ID NO71,SEQ ID NO73,SEQID NO75,SEQ ID NO77,SEQ ID NO79,SEQ ID NO81,SEQ ID NO83,SEQID NO85,SEQ ID NO87,SEQ ID NO89,SEQ ID NO91,SEQ ID NO93,SEOID NO95,SEQ ID NO97,SEQ ID NO99,SEQ ID NO101,SEQ ID NO103,SEQ ID NO105在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850,1900,1950,2000,2050,2100,2200,2250,2300,2350,2400,2450,2500,或者更多的残基范围内具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多的或者完全的(100%)的序列同一性的核酸序列的分离的或者重组的核酸,编码具有磷脂酶,例如磷脂酶A,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO1在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续的残基范围内具有至少81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中该核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO3在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续的残基范围内具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO5在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续残基范围内具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO7在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续残基范围内具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
在可选择的方面,分离的或者重组的核酸编码包括在序列SEQ ID NO2,SEQID NO4,SEQ ID NO6,或者SEQ ID NO8中阐明的序列的多肽。一方面,这些多肽具有磷脂酶,例如,磷脂酶A,B,C或者D活性。
一方面,序列比较算法是BLAST算法,如BLAST 2.2.2版算法。一方面,筛选设置(filtering setting)设为blastall-p,blastp-d“nr pataa”-F F,所有其它可选项(options)设为默认值。
一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切断甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性包括磷脂酶C(PLC)活性,磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性,磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性或者patatin活性。磷脂酶活性可以包括糖蛋白的水解,如,在马铃薯块茎中发现的糖蛋白的水解。磷脂酶活性可以包括马铃薯块茎储藏蛋白(patatin)的酶活性,磷脂酶活性可以包括脂酰水解酶(LAH)活性。
一方面,分离的或者重组的核酸编码具有热稳定性的磷脂酶活性的多肽。多肽可以在包括大约37℃到95℃;大约55℃到85℃,70℃到95℃,或者大约90℃到95℃之间的温度范围的条件下保持磷脂酶活性。另一方面,分离或者重组的核酸编码具有耐热的磷脂酶活性的多肽。多肽可以在暴露于37℃到95℃的温度范围内或者高于55℃到85℃的范围内后仍保持磷脂酶活性。一方面,多肽在pH 4.5下,暴露于高于90℃到95℃的范围后仍保持磷脂酶活性。
多肽在包括大约pH 7,pH 6.5,pH 6.0,pH 5.5,pH 5,或者pH 4.5的条件下可以保持磷脂酶的活性。多肽可以在包括温度范围为大约40℃到大约70℃的条件下保持磷脂酶活性。
一方面,分离的或者重组的核酸包括在严谨条件下与在SEQ ID NO1,SEQ IDNO3,SEQ ID NO5,或SEQ ID NO7中阐明的序列杂交的核酸,其中该核酸编码具有磷脂酶活性的多肽。正如在此所述的,核酸可以是基因或者转录本的至少大约10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850残基或者全长残基,具有或者不具有信号序列。正如在此所述的,严谨条件可以是高度严谨,中度严谨或者低严谨性。严谨条件可以包括洗涤步骤,如,包括在0.2×SSC,大约65℃条件下洗涤大约15分钟的洗涤步骤。
发明提供用于鉴定编码具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探针,其中该探针包括发明的序列,例如在SEQ ID NO1,SEQ ID NO3,SEQ IDNO5,或者SEQ ID NO7中阐明的序列的至少10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850个或者更多的连续碱基,该探针通过结合或者杂交确定核酸。探针可以包括含有在SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,和/或SEQ ID NO7中阐明的序列的至少大约10到50,大约20到60,大约30到70,大约40到80,或者大约60到100的连续碱基的寡聚核苷酸。
发明提供用于鉴定编码具有磷脂酶,如,磷脂酶活性的多肽的核酸的核酸探针其中探针包括发明的核酸,例如在至少大约10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850或者更多连续残基的范围内,与SEQ ID NO1,SEQ ID NO3,SEQ IDNO5,和/或SEQ ID NO7或者它们的亚序列具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)的序列同一性的核酸,其中序列同一性通过序列比较算法分析或者目测检查确定。
发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括发明的核酸序列或者片段或者亚序列的核酸序列。扩增引物序列的每一个成员可能包括含有至少大约10到50个连续碱基元列,或者大约12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个连续碱基元列的寡聚核苷酸。
发明提供扩增引物对,其中引物对包括具有如发明的核酸的大约第一个(5′端)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基所阐明的序列的第一成员,和具有与第一成员的互补链的第一个(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基所阐明的序列的第二成员。
应用发明的扩增引物对,发明提供通过扩增,例如,聚合酶链式反应(PCR)产生的磷脂酶。应用发明的扩增引物对,发明提供通过扩增,例如,聚合酶链式反应(PCR)制备磷脂酶的方法。一方面,扩增引物扩增来自文库的核酸,如,基因文库(gene library),如环境文库(environmental library)。
发明提供扩增编码具有磷脂酶活性的多肽的核酸的方法,包括用可以扩增发明的核酸序列或者其片段或者其亚序列的扩增引物序列来扩增模板核酸序列。扩增引物可以是发明的扩增引物对。
发明提供包括发明的核酸或者它的亚序列的表达盒(expression cassettes)。一方面,表达盒可以包括连接启动子的核酸。启动子可以是病毒的,细菌的,哺乳动物或者植物启动子。一方面,植物启动子可以是马铃薯,水稻,玉米,小麦,烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面,启动子可以是可诱导的启动子。一方面,启动子可以是组织-特异性启动子或者环境调控或者发育调控启动子。因此,启动子可以是,如,种子-特异性,叶子-特异性,根-特异性,茎-特异性或者脱落-诱导的启动子。一方面,表达盒可以进一步包括植物的或者植物病毒的表达载体。
发明提供包括发明的表达盒(如载体)或者发明的核酸的克隆载体。克隆载体可以是病毒载体,质粒,噬菌体,噬菌质粒,粘粒,fosmid,细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体,逆转录病毒载体或者腺相关病毒载体。克隆载体可以包括细菌人造染色体(BAC),质粒,细菌噬菌体P1衍生载体(PAC),酵母人造染色体(YAC),或者哺乳动物人造染色体(MAC)。
发明提供含有发明核酸或者发明表达盒(如,载体)或者发明克隆载体的转化的细胞。一方面,转化细胞可以是细菌细胞,哺乳动物细胞,真菌细胞,酵母细胞,昆虫细胞或者植物细胞。一方面,植物细胞可以是马铃薯,小麦,水稻,玉米,烟草或者大麦细胞。
发明提供包括发明的核酸或者发明的表达盒(如,载体)的转基因非-人类动物。一方面,动物是小鼠。
发明提供包括发明的核酸或者发明的表达盒(如,载体)的转基因植物。转基因植物可以是玉米植物,马铃薯植物,番茄植物,小麦植物,油籽植物,油菜籽植物,大豆植物,水稻植物,大麦植物,或烟草植物。发明提供包括发明的核酸或发明的表达盒(例如,载体)的转基因种子。转基因种子可以是玉米种子,小麦种子,油籽,油菜籽(芸苔植物),大豆种子,棕榈种子,向日葵种子,芝麻种子,花生或烟草植物种子。
发明提供含有在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。发明提供抑制细胞内磷脂酶信使翻译的方法,包括往细胞中施用或者在细胞中表达包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。
发明提供包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡聚核苷酸。发明提供抑制细胞内磷脂酶信使翻译的方法,包括往细胞中施用或者在细胞中表达包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。反义寡聚核苷酸可以是在10到50,大约20到60,大约30到70,大约40到80,大约60到100,大约70到110,或者大约80到120个碱基的长度。
发明提供抑制细胞内磷脂酶如,磷脂酶信使翻译的方法,包括往细胞中施用或者在细胞中表达包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。发明提供包括发明序列的亚序列的双链抑制RNA(RNAi)分子。一方面,RNAi长度是大约15,16,17,18,19,20,21,22,23,24,25或者更多的双链核苷酸。发明提供在细胞内抑制磷脂酶,如磷脂酶表达的方法,包括往细胞中施用或者在细胞中表达双链抑制RNA(RNAi),其中RNA包括发明序列的亚序列。
发明提供包括与发明的典型多肽或肽在至少大约25,50,75,100,125,150,175,200,225,250,275,300,325,350或者更多残基,或者全长的多肽范围内具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)同一性的氨基酸序列的分离的或者重组的多肽,序列同一性通过序列比较算法分析或者通过目测观察来确定。发明的典型多肽或者肽序列包括SEQ ID NO2,SEQ ID NO4,SEQID NO6或者SEQ ID NO8。一方面,发明提供包括与SEQ ID NO2具有至少81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。一方面,发明提供包括与SEQID NO4具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。一方面,发明提供包括与SEQ ID NO6具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。一方面,发明提供包括与SEQID NO8具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。发明提供由发明的核酸编码的分离的或者重组的多肽。在可选择方面,多肽可以具有如SEQ ID NO2,SEQ ID NO4,SEQ IDNO6,或者SEQ ID NO8中阐明的序列。多肽可以具有磷脂酶活性,如,磷脂酶A,B,C或者D活性。
发明提供含有缺乏信号序列的发明的多肽的分离的或者重组的多肽,一方面,缺乏信号肽的多肽与SEQ ID NO2的残基30到287具有至少81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或者更多序列同一性,缺乏信号肽的多肽具有与SEQ IDNO4的残基25到283有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多序列同一性的氨基酸序列,与SEQ ID NO6的残基26到280有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多序列同一性的氨基酸序列,与SEQ ID NO8的残基40到330有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多的序列同一性的氨基酸序列。序列同一性通过序列比较算法分析或者通过目测观察确定。
发明的另一方面提供分离的或者重组的多肽或者肽,分离的或者重组的多肽或者肽包括发明的多肽或肽序列,与之实质上的一致序列,与之互补序列的至少10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95或者100或者更多的连续碱基。肽可以是,例如,产生免疫性的片段,基元(如,结合位点)或者活性位点。
一方面,发明分离的或者重组的多肽(有或没有信号序列)具有磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性,磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2的活性,磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性。磷脂酶活性可以包括水解糖蛋白,如,马铃薯储存块茎中的糖蛋白。磷脂酶活性可以包括脂酰水解酶(LAH)活性。
一方面,磷脂酶活性是热稳定性的。多肽可以在包括温度范围在大约37℃到大约95℃之间,大约55℃到大约85℃之间,大约70℃到大约95℃之间,或者大约90℃到大约95℃之间的条件下保持磷脂酶活性。另一方面,磷脂酶活性可以是耐热的。多肽可以在暴露于温度范围高于37℃到大约95℃,或者在高于55℃到大约85℃下后仍保持磷脂酶活性。一方面,多肽可以在暴露于温度范围在90℃到大约95℃,在pH4.5下后仍保持磷脂酶活性。
一方面,多肽可以在包括大约pH 6.5,pH 6,pH 5.5,pH 5,pH 4.5或者pH4的条件下保持磷脂酶活性。另一方面,多肽可以在包括大约pH 7,pH 7.5,pH 8,pH 8.5,pH 9,pH9.5,pH 10,pH 10.5,或pH 11的条件下保持磷脂酶活性。
一方面,分离的或者重组的多肽可以包括发明的多肽,其缺乏信号序列。一方面,分离的或者重组的多肽可以包括含有异源信号序列,如异源的磷脂酶或者非-磷脂酶的信号序列的本发明多肽。
发明提供含有与SEQ ID NO2的1到29残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,含有与SEQ ID NO4的1到24残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,含有与SEQ ID NO6的1到25残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,含有与SEQ ID NO8的1到39残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,和别的在其它的SEQ ID列表中阐明的信号序列,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。这些肽可以作为内源性磷脂酶或者其它磷脂酶,或者外源蛋白(非磷脂酶或者其它蛋白)的信号肽序列。一方面,发明提供包括第一结构域和至少第二结构域的嵌合蛋白,第一结构域包括发明的信号序列。蛋白可以是融合蛋白。第二结构域可以包括酶,酶可以是磷脂酶。
发明提供包括至少第一结构域和至少第二结构域的嵌合多肽,第一结构域包括发明的信号肽(SP)或催化结构域(CD),或发明的磷脂酶的活性位点,第二结构域包括异源多肽或肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间并没有天然的联系。一方面,异源多肽或者肽不是磷脂酶。异源多肽或者肽可以是信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者羧基和氨基末端。
发明提供分离的或者重组的编码嵌合多肽的核酸,其中嵌合多肽包括至少第一结构域和至少第二结构域,第一结构域含有发明多肽的信号肽(SP)或者催化结构域(CD)或者活性位点,第二结构域包括异源多肽或者肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间并不是天然联合。
一方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约100到大约1000单位的特异活性。另一方面,磷脂酶活性包括每毫克蛋白大约500到大约700单位的特异活性。可选择的,磷脂酶活性包括在大约37℃下,每毫克蛋白大约500到大约1200单位的特异活性。一方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约750到大约1000单位的特异活性。另一方面,耐热性包含在加热至升高的温度以后,在37℃下保持至少一半磷脂酶的特异活性。可选择的,耐热性包含在加热至升高的温度以后,在37℃下每毫克蛋白保持大约500到大约1200单位的特异活性。
发明提供发明分离的或者重组的多肽,其中多肽包括至少一个糖基化位点,一方面,糖基化可以是N-连接糖基化。一方面,多肽可以是在毕赤酵母(P.pastoris)或者裂变酵母(S pombe.)表达后进行糖基化。
发明提供包括发明多肽的蛋白制备,其中蛋白制备包括液相,固相或者凝胶。
发明提供包括发明多肽和第二个蛋白或者结构域的异源二聚物。异源二聚物的第二成员可以是不同的磷脂酶,不同的酶或者另一个蛋白。一方面,第二结构域可以是多肽,异源二聚物可以是融合蛋白。一方面,第二结构域可以是抗原决定簇或者标记。一方面,发明提供包括发明多肽的同源二聚物。
发明提供具有磷脂酶活性的固定化多肽,其中多肽包含发明的多肽,发明核酸编码的多肽,或者包括发明多肽和第二结构域的多肽。一方面,多肽可以固定于细胞,金属,树脂,多聚物,陶瓷,玻璃,微电极,石墨颗粒,珠子,凝胶,金属板,阵列或者毛细管。
发明提供包含固定多肽的阵列,其中多肽是发明的磷脂酶或者发明核酸编码的多肽。发明提供含有发明的固定化核酸的阵列。发明提供含有发明的固定化抗体的阵列。
发明提供特异结合于发明多肽或者发明的核酸编码的多肽的分离的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。发明提供含有发明抗体的杂交瘤。
发明提供分离和鉴定具有磷脂酶活性的多肽的方法,包括以下步骤(a)提供发明的抗体;(b)提供含有多肽的样品;以及(c)在抗体特异结合于多肽的条件下,步骤(a)的抗体与步骤(b)的样品接触,然后分离和鉴定磷脂酶。发明提供制备抗-磷脂酶抗体的方法,包括向非-人类动物以足够的量施用发明的核酸或者发明的多肽,产生体液免疫应答,从而制备抗-磷脂酶抗体。
发明提供产生重组的多肽的方法,包含以下的步骤(a)提供可操作地连接于启动子的发明的核酸,以及(b)在多肽表达的条件下表达步骤(a)的核酸,然后产生重组多肽。核酸可以包括与SEQ ID NO1序列在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO3的序列在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO5序列在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO7序列在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者目视检测观察来确定。核酸可以包括在严谨的条件下与SEQ ID NO1所列核酸或者亚序列,与SEQ ID NO3所列核酸或者亚序列,与SEQ ID NO5所列核酸或者亚序列,与SEQ ID NO7所列核酸或者亚序列杂交的核酸。方法进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,然后在转化的细胞中产生重组的多肽。方法进一步包括把步骤(a)的核酸插入到宿主非人类动物中,随后表达步骤(a)的核酸,然后在宿主非人动物中产生重组多肽。
发明提供鉴定具有磷脂酶活性的多肽的方法,包括以下的步骤(a)提供发明的多肽或者编码发明多肽的核酸,或者片段或者变异体,(b)提供磷脂酶底物;(c)步骤(a)的多肽或者片段或者变异体与步骤(b)的底物接触,检测底物的量的增加或者反应产物的量的减少,其中底物的量的减少或者反应产物的量的增加检测了具有磷脂酶活性的多肽。在可选择的方面,核酸可以包括与SEQ ID NO1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ IDNO7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者目视检测观察来确定。核酸可以包括在严谨的条件下与SEQ ID NO1所列核酸或者亚序列,与SEQ ID NO3所列核酸或者亚序列,与SEQ ID NO5所列核酸或者亚序列,与SEQ ID NO7所列核酸或者亚序列杂交的核酸。
发明提供确定磷脂酶底物的方法,包括以下步骤(a)提供发明的多肽或者编码发明多肽的核酸;(b)提供检测底物;以及(c)步骤(a)的多肽与步骤(b)的检测底物接触,检测底物的量的增加或者反应产物的量的减少,其中底物的量的减少或者反应产物的量的增加确定底物为磷脂酶底物。在可选择的方面,核酸可以包括与SEQ ID NO1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者可视的检测观察来确定。在可选择的方面,核酸可以包括在严谨的条件下与SEQ ID NO1所列核酸或者亚序列,与SEQ ID NO3所列核酸或者亚序列,与SEQ ID NO5所列核酸或者亚序列,与SEQ ID NO7所列核酸或者亚序列杂交的核酸。
发明提供确定是否化合物特异结合于磷脂酶的方法,包括以下步骤(a)在允许核酸翻译成多肽的条件下,表达核酸或者包括该核酸的载体,其中核酸和载体包括发明的核酸或者载体;或者,提供发明的多肽,(b)使多肽与检测化合物接触;并且,(c)确定是否检测化合物特异结合于多肽,从而确定该化合物特异地结合于磷脂酶。在可选择的方面,核酸可以包括与SEQ ID NO1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者可视的检测观察来确定。在可选择的方面,核酸可以包括在严谨的条件下与SEQ ID NO1所列核酸或者亚序列,与SEQ ID NO3所列核酸或者亚序列,与SEQ ID NO5所列核酸或者亚序列,与SEQ ID NO7所列核酸或者亚序列杂交的核酸。
发明提供确定磷脂酶活性的调节物的方法,包括以下步骤(a)提供发明的多肽或者编码发明多肽的核酸;(b)提供检测化合物;以及(c)步骤(a)的多肽与步骤(b)的检测化合物接触,测定磷脂酶的活性,其中在检测化合物存在的条件下检测的磷脂酶活性与在无检测化合物存在的条件下检测的磷脂酶活性相比得到的变化证明检测化合物调节磷脂酶的活性。在可选择的方面,核酸可以包括与SEQ ID NO1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者可视的检测观察来确定。在可选择的方面,核酸可以包括在严谨的条件下与SEQ ID NO1所列核酸或者亚序列,与SEQ ID NO3所列核酸或者亚序列,与SEQ ID NO5所列核酸或者亚序列,与SEQ ID NO7所列核酸或者亚序列杂交的核酸。
一方面,磷脂酶活性通过提供磷脂酶底物并且检测底物的量的增加或者反应产物的量的减少测定。与不存在检测化合物的条件下底物或者反应产物的量相比较,在存在检测化合物的条件下,底物的量的减少或者反应产物的量的增加证明检测化合物是磷脂酶活性的激活剂。与不存在检测化合物的条件下底物或者反应产物的量相比较,在存在检测化合物的条件下,底物的量的增加或者反应产物的量的减少证明检测化合物是磷脂酶活性的抑制剂。
发明提供包含处理器和数据存储设备的计算机系统,其中所述的数据存储设备已经存储了发明的多肽序列或者发明的核酸序列。
一方面,计算机系统可以进一步包括序列比较算法,和已经存储了至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的鉴定器。
发明提供已经存储了包括发明的多肽序列或发明的核酸序列的序列的计算机可读存储介质。
发明提供鉴定序列的特征的方法,包括以下步骤(a)应用鉴定序列的一个或者多个特征的计算机程序来读取序列,其中该序列包括发明的多肽序列或者发明的核酸序列;和(b)用计算机程序鉴定序列中的一个或者多个特征。
发明提供比较第一序列和第二序列的方法,包括以下步骤(a)应用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括发明的多肽序列或者发明的核酸序列;并且,(b)用计算机程序确定第一序列和第二序列的差别。一方面,确定第一序列和第二序列的差异的步骤进一步包括确定多态性的步骤。一方面,方法进一步包括鉴定序列中一个或者多个特征的鉴定器(以及鉴定器的应用)。一方面,方法包括用计算机程序读取第一序列,鉴定序列中的一个或者多个特征。
发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增发明的核酸(如,SEQ ID NO1或者亚序列,SEQ IDNO3或者亚序列,SEQ ID NO5核酸或者亚序列,SEQ ID NO7核酸或者亚序列。等等);(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与扩增引物对杂交;和(c)步骤(b)的核酸和步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,随后从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。一方面,扩增引物序列对的每一个成员包括含有发明的核酸序列的至少大约10到50连续碱基的寡核苷酸。一方面,扩增引物序列对是发明的扩增对。
发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤(a)提供包含发明的核酸序列,或者亚序列的多核苷酸探针;(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合;和(d)与步骤(a)的多核苷酸探针特异杂交的核酸分离,因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选择的方面,环境样品包括水样品,液体样品,土壤样品,气体样品或者生物样品。在可选择的方面,生物样品来源于细菌细胞,原生动物细胞,昆虫细胞,酵母细胞,植物细胞,真菌细胞或者哺乳动物细胞。
发明提供产生编码磷脂酶的核酸的变异体的方法,包括以下步骤(a)提供包括发明核酸的模板核酸;(b)模板序列中修饰,缺失或者添加一个或者多个核苷酸,或者它们的组合,产生模板核酸的变异体。
一方面,该方法进一步包括表达变异核酸,产生变异磷脂酶多肽。可选择的方面,修饰,添加或者缺失由错误倾向PCR,重排,寡聚核苷酸定向诱变,组装PCR,有性PCR诱变,体内诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,基因位点饱和诱变(GSSM),合成连接重装配(SLR)和/或其组合的方法来引入。在可选择的方面,修饰,添加或者缺失由以下方法引入,包括重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板诱变,缺口双螺旋诱变,点错配修复诱变,修复-缺陷宿主株诱变,化学诱变,放射诱变,缺失诱变,限制选择诱变,限制纯化诱变,人工基因诱变,整体诱变,嵌合核酸多聚体的产生和/或它们的组合。
一方面,该方法被反复重复,直到产生与模板核酸编码的磷脂酶相比,具有改变的或者不同的活性或者改变的或者不同的稳定性的磷脂酶。一方面,改变的或者不同的活性是在酸性条件下的磷脂酶活性,其中模板核酸编码的磷脂酶在酸性条件下没有活性。一方面,改变的或者不同的活性是在较高的温度下的磷脂酶活性。其中模板核酸编码的磷脂酶在较高温度的条件下没有活性。一方面,该方法反复重复,直到产生与模板核酸的密码子选择相比具有改变的密码子选择的序列编码的磷脂酶。该方法反复重复,直到产生与模板核酸产生的信使相比具有更高或更低水平的信使表达或者信使稳定性的磷脂酶基因。
发明提供改变编码磷脂酶的核酸中密码子,增强其在宿主细胞中表达的方法,该方法包括(a)提供发明的编码磷脂酶的核酸;(b)鉴定步骤(a)的核酸中的非优选的或者较不优选的密码子,并且用编码相同氨基酸的优选的或者中性应用的密码子替换,其中优选的密码子是在宿主细胞的基因编码区中超常出现的密码子,非-优选的或者较不优选的密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰改变核酸,增强其在宿主细胞的表达。
发明提供在编码磷脂酶的核酸中修饰密码子的方法,该方法包括(a)提供发明的编码磷脂酶的核酸;并且,(b)确定步骤(a)的核酸中的密码子,作为被取代的密码子,把它用编码同一个氨基酸的不同的密码子替换,从而修饰编码磷脂酶的核酸中的密码子。
发明提供修饰编码磷脂酶的核酸中的密码子的方法,增强其在宿主细胞中的表达,该方法包括(a)提供发明的编码磷脂酶的核酸,并且(b)鉴定步骤(a)的核酸中的非优选的或者较不优选的密码子,用编码相同氨基酸的优选的或者中性应用的密码子来替换,其中优选的密码子是在宿主细胞的基因编码区中超常出现的密码子,不优选的或者较不优选的密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,增强其在宿主细胞的表达。
发明提供修饰编码磷脂酶的核酸的密码子的方法,降低其在宿主细胞的表达,该方法包括,(a)提供发明的编码磷脂酶的核酸;和,(b)鉴定步骤(a)的核酸中的至少一个优选的密码子并且用编码相同氨基酸的不优选的或者较不优选的密码子替换,其中优选的密码子是在宿主细胞的基因编码区中超常出现的密码子,不优选的或者较不优选的密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,降低其在宿主细胞的表达。可选择的方面,宿主细胞是细菌细胞,真菌细胞,昆虫细胞,酵母细胞,植物细胞或者哺乳动物细胞。
发明提供产生编码很多经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位点或者第一底物结合位点的序列的第一核酸,该方法包括(a)编码第一个活性位点或者第一个底物结合位点的第一核酸序列,其中第一核酸序列包括发明的核酸,(b)提供一套在第一个核酸的多个靶密码子编码天然产生的氨基酸的突变体的诱变寡聚核苷酸;和,(c)应用这套诱变的寡聚核苷酸,产生一套编码活性位点或者编码底物结合位点的突变核酸,在每一个被诱变的氨基酸密码子处,突变核酸编码氨基酸突变体,从而产生编码修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选择的方面,该方法包括通过包括优化的定点进化系统,基因定点饱和诱变(GSSM),和合成连接重装配(SLR)的方法,诱变步骤(a)的第一核酸。方法进一步包括通过包括错误倾向PCR,重排,寡核苷酸定向突变,装配PCR,有性PCR诱变,体内诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,基因位点饱和诱变(GSSM),合成连接重装配(SLR)和其组合的方法诱变步骤(a)的第一核酸或者突变体。方法进一步包括通过包括重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板的诱变,缺口双螺旋诱变,点错配修复诱变,修复-缺陷宿主株诱变,化学诱变,放射诱变,缺失诱变,限制选择诱变,限制纯化诱变,人工基因诱变,整体诱变,嵌合核酸多聚体的产生和它们的组合的方法诱变步骤(a)的第一核酸或者变异体。
发明提供制备小分子的方法,包括以下步骤(a)提供可以合成或者修饰小分子的多个生物合成酶,其中一个酶包括由发明核酸编码的磷脂酶;(b)对步骤(a)的至少一个酶提供底物,(c)在利于生物催化反应进行的条件下,步骤(b)的底物和酶反应,通过一系列生物催化反应产生小分子。
发明提供修饰小分子的方法,包括以下步骤(a)提供由发明核酸编码的磷脂酶;(b)提供小分子;(c)在利于磷脂酶催化的酶反应进行的条件下,步骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶反应修饰小分子。一方面,方法包括为步骤(a)的酶提供很多的小分子底物,从而产生了经修饰的小分子文库,该小分子文库通过至少一个由磷脂酶催化的酶促反应产生。一方面,方法进一步包括很多的额外酶,在利于很多酶催化的生物催化反应的条件下,通过很多酶促反应产生由很多酶促反应产生的经修饰的小分子文库。一方面,方法进一步包括检测文库的步骤,确定在文库中是否存在表现出所需活性的特定的经修饰的小分子。该检测文库的步骤可以进一步包括通过检测经过修饰的小分子的部分存在或者不存在具有所需活性的特定经修饰的小分子部分,系统性地去除干扰,在库中选择一个用于产生经修饰的小分子部分的生物催化反应,并且确定至少一种特定的生物催化反应,该反应产生了特定的具有所需活性的经修饰的小分子。
发明提供用于确定磷脂酶的功能性片段方法,其包括以下的步骤(a)提供包括发明氨基酸序列的磷脂酶;(b)缺失步骤(a)序列中的多个氨基酸残基,并且测定余下的序列的磷脂酶活性,从而确定磷脂酶的功能性片段。一方面,磷脂酶活性通过提供磷脂酶底物,测定底物的量的增加或者反应产物的量的减少来测定。一方面,与不存在检测化合物条件下确定的底物或者反应产物的量相比较,在检测化合物存在的条件下,底物的量的减少或者反应产物的量的增加鉴定检测化合物是磷脂酶活性的激活剂。
发明提供切割磷酸甘油酯键的方法,包括以下步骤(a)提供具有磷脂酶活性的多肽,其中多肽包括发明的氨基酸序列,或者多肽由发明的核酸序列编码;(b)提供包括磷酸甘油酯键的组合物;(c)在多肽切割磷酸甘油酯键的条件下,把步骤(a)的多肽与步骤(b)的组合物接触。一方面,条件包括大约pH5到大约5.5之间,或者大约pH4.5到大约5.0之间。一方面,条件包括大约40℃到大约70℃温度之间。一方面,该组合物包括植物油。一方面,该组合物包括油籽磷脂。一方面,切割反应可以产生水可抽提的磷酸化的碱和甘油二酯。
发明提供油脱胶(oil degumming)的方法,包括以下步骤(a)提供具有磷脂酶活性的多肽,其中多肽包括发明的氨基酸序列,或者多肽由发明的核酸序列编码;(b)提供包括植物油的组合物;(c)在多肽切割植物油的酯键的条件下,把步骤(a)的多肽与步骤(b)的植物油接触,从而进行油的脱胶。一方面,植物油包括油籽。植物油可以包括棕榈油,油菜籽,玉米油,大豆油,芸苔油,芝麻油,花生油,或者葵花子油。一方面,方法进一步包括加入发明的磷脂酶,另外的磷脂酶或者它们的组合。
发明提供转化非水合的磷脂成水合形式的方法,包括以下步骤(a)提供具有磷脂酶活性的多肽,其中多肽包括发明的氨基酸序列,或者多肽由发明的核酸编码;(b)提供包括非水合磷脂的组合物;(c)在多肽切割非水合磷脂的酯键的条件下,把步骤(a)的多肽与步骤(b)的非水合磷脂接触,从而非水合磷脂转化为水合形式。
发明提供使油脱胶的方法,包括以下步骤(a)提供组成包括发明的具有磷脂酶活性的多肽,或者由发明核酸编码的多肽;(b)提供包括脂肪或者油的组合物,脂肪或者油含有磷脂;(c)在多肽可以对含有磷脂的组合物进行脱胶的条件下,把步骤(a)的多肽与步骤(b)的组合物进行接触(在发明的多肽可以催化磷脂水解的条件下)。一方面,含油的组合物包括植物,动物,藻或者鱼的油。植物油可以包括大豆油,油菜籽油,玉米油,棕榈仁的油,芸苔油,葵花油,芝麻油或者花生油。多肽可以水解含油组合物中水合的和/或非水合的磷脂中的磷酸。多肽可以水解甘油磷脂键处的磷酸,产生甘油二酯和水溶性的磷酸化合物。多肽可以有磷脂酶C,B,A或者D的活性。一方面,加入了磷脂酶D活性和磷酸酶活性。接触可以包括水解油中水合的磷脂。水解条件可以包括在碱性pH下,温度为大约20℃到40℃之间。碱性条件可以包括大约pH 8到pH 10的pH。水解条件可以包括反应时间为3到10分钟。水解条件可以包括水解油中水合的或者非水合的磷脂,温度为大约50℃到60℃,pH大约为pH 5到pH 6.5,应用的反应时间为大约30到60分钟。多肽可以结合于滤膜,含有磷脂的脂肪或者油通过滤膜。多肽可以加入到含有磷脂的脂肪或者油的溶液中,然后溶液通过滤膜过滤。
发明提供转化非-水合的磷脂为水合形式的方法,包括以下的步骤(a)提供包括具有发明磷脂酶活性的多肽的组成,或者由发明的核酸序列编码的多肽;(b)提供包括非-水合的磷脂的组合物;并且(c)在多肽转化非-水合的磷脂为水合的磷脂形式的条件下,把步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性并且也加入磷酸酶。
发明提供碱法净化含有磷脂的组合物的方法,包括以下步骤(a)提供包含发明的具有磷脂酶活性的多肽或者由发明核酸编码的多肽的组合物;(b)提供包含磷脂的组合物,并且(c)在碱法净化前,碱法净化中或者后,把步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶C的活性。多肽可以在碱法净化前加入,并且含有磷脂的组成可以包括植物,并且多肽可以以转基因方式在植物中表达,具有磷脂酶活性的多肽可以在压榨种籽或者其它植物部分的过程中加入,或者具有磷脂酶活性的多肽在压榨后或者在净化前加入。多肽可以在碱法净化中加入,并且依据磷的水平和游离脂肪酸的水平加入不同水平的酸和碱。多肽可以在碱法净化后加入在分离前的剧烈搅拌器或者保持混合器中,随后在离心机中,皂脚中,清洗水中进行,或者在漂白或者除臭步骤中进行加热步骤。
发明提供纯化植物甾醇或者三萜的方法,包括以下的步骤(a)提供包括发明的具有磷脂酶活性的多肽的组合物,或者多肽由发明核酸编码;(b)提供含有植物甾醇或者三萜的组合物;并且(c)在多肽可以催化组合物中的磷脂的水解的条件下,把步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇。植物甾醇可以来源于植物油。植物油可以包括椰子油,芸苔油,可可黄油,玉米油,棉籽油,亚麻油,橄榄油,棕榈油,花生油,来自稻麸子的油,红花油,芝麻油,大豆油,或者葵花油。该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇类脂肪酸酯。植物甾醇或者三萜可以包括β-谷甾醇,菜油甾醇,豆甾醇,豆甾烷醇,β-谷甾烷醇,谷甾烷醇,链甾醇,海绵甾醇, 多孔甾醇,γ-谷甾醇或者菜籽甾醇。
发明提供精练粗油的方法,包括以下步骤(a)提供包括发明的具有磷脂酶活性的多肽的组合物,或者多肽由发明的核酸编码;(b)提供包括含有磷脂的油的组合物;并且(c)在多肽催化组合物中的磷脂水解的条件下,把步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶C的活性。多肽可以在加入到组分水溶液的情况下具有磷脂酶活性。水的水平可以是在0.5到5%之间。处理时间可以少于2小时,少于大约60分钟,少于大约30分钟,少于大约15分钟,或者少于5分钟。水解条件可以包括温度范围在大约25到70℃之间,水解条件可以包括应用苛性碱,水解条件可以包括pH范围为大约pH 3到pH10之间,pH 4到pH9之间,或者pH 5到pH 8之间。水解条件可以包括在接触步骤(c)后加入乳化剂和/或进行混合。该方法可以包括加入去乳化剂和/或加热来促进水相的分离。该方法可以包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后再加入PLC,PLC和/或PLA,去除非水合的磷脂。对于食用油,该方法可以包括粗油的水脱胶到少于10ppm,对于生物柴油,然后通过物理精练至少到大约50ppm。该方法可以包括加入酸来增强非水合磷脂的水合。
发明的一个或者多个具体例子的细节在附加图表和以下说明中进行阐明。发明的其它特征,目标,以及优势将通过描述和图表以及权利要求得到阐明。
用于各种目的的所有出版物,专利,专利申请,GenBank序列以及美国模式菌种收集中心(ATCC)保藏物,在此一并引用和参考。
附图简述以下的图是本发明的实施方案的例示性说明,并不意味着限制权利要求所包含的发明范围。


图1是计算机系统的框图,具体的细节说明参见下文。
图2是过程200的一个方面的流程图,为了确定新序列和数据库中的序列之间的同源性水平,把新的核苷酸或蛋白质序列与数据库中的序列相比较,具体的细节说明参见下文。
图3是说明在计算机中确定是否两个序列是否是同源的过程的实施方案的流程图,具体细节说明参见下文。
图4是说明鉴定器过程的一个方面的流程图,检测序列中特征的存在,具体的细节说明参见下文。
图5A,5B和5C用图表说明用于同时PLC-介导脱胶的典型两相系统,具体的细节说明参见下文。
图6用图表说明应用发明的磷脂酶的典型的植物油精练过程。
图7用图表说明用于物理精练油的发明的典型脱胶过程,具体的细节说明参见下文。
图8用图表说明用发明的磷脂酶C进行磷脂的水解,具体的细节说明参见下文。
图9用图表说明用发明的磷脂酶C作为“碱法净化辅助”(长混合碱法净化),具体的细节说明参见下文。
图10用图表说明用发明的磷脂酶C作为脱胶辅助,具体的细节说明参见下文。
不同图中的类似参考符号说明类似元素发明祥述发明提供磷脂酶(如,磷脂酶A,B,C和D,马铃薯块茎储藏蛋白酶),编码它们的核酸。以及制备和应用它们的方法。发明提供可以有效地切割油,如植物油,例如油籽磷脂中的甘油磷酸酯键的酶,产生水可提取的磷酸化的碱和甘油二酯。一方面,发明的磷脂酶具有脂酰水解酶(LAH)的活性。可选择的方面,发明的磷脂酶可以切割卵磷脂,磷脂酰乙醇胺,磷脂酰丝氨酸,和鞘磷脂中的甘油磷酸酯键。
发明的磷脂酶(如,磷脂酶A,B,C和D,马铃薯块茎储藏蛋白酶)可以用于植物油的酶法脱胶,因为磷酸组分在水中可溶,并且容易去除。甘油二酯产物将仍存留在油中,从而降低损失。发明的PLCs可以用于商业上的油脱胶中,加入到或者替换PLA1s和PLA2s,诸如ENZYMAX_工艺,其中磷脂是由PLA1和PLA2水解的。
一方面,发明的磷脂酶在较高的和/或较低的温度下,或者在较宽的温度范围内,具有活性,例如,它们可以在温度范围在20到90℃,30到80℃,或者在40到70℃下具有活性。发明也提供发明的磷脂酶,其在碱性pH或者酸性pH下具有活性,例如低的水酸度。可选择的方面,发明的磷脂酶可以在酸性pH低至pH6.5,pH6.0,pH5.5,pH5.0,pH4.5,pH4.0,和pH3.5仍具有活性。可选择的方面,发明的磷脂酶可以在碱性pH高至pH7.5,pH8.0,pH8.5,pH9.0,和pH9.5仍具有活性。一方面,发明的磷脂酶在低水活性(低的水含量)条件下,在温度范围40到70℃之间具有活性。
发明也提供进一步修饰本发明的典型磷脂酶的方法,以便产生具有理想特性的酶。例如,由发明方法产生的磷脂酶可以具有改变了的底物特异性,底物结合特异性,底物切割形式,热稳定性,pH/活性曲线,pH/稳定性曲线(如在较低pH值,例如pH小于6或者pH小于5或者较高的pH值,如pH大于9的情况下热稳定性提高),对于氧化作用的稳定性,Ca2+的依赖性,特异性活性,类似特性。发明提供对于任何感兴趣特性的改变。例如,这些改变可以导致与原磷脂酶相比的变异体,具有改变的pH和温度活性曲线。
一方面,发明的磷脂酶在不同的植物油处理步骤,如植物油提取中,特别地,在称为“油脱胶”的过程中去除“磷脂胶”中的使用,如在此所述。植物油产生于不同的植物来源,如大豆,油菜,花生,芝麻,葵花和玉米。发明的磷脂酶可以在任何植物油处理过程中用于替代PLA,例如磷脂酶A2。
定义术语“磷脂酶”包括具有磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。发明的磷脂酶活性可以产生水可提取的磷酸化的碱以及甘油二酯。发明的磷脂酶活性也包括在高温,低温,碱性pH和酸性pH下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯,产生水可提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性,如结合底物的能力,如油,例如植物油,底物也包括植物和动物的卵磷脂,磷脂酰乙醇胺,磷脂酰丝氨酸,和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性,磷脂酶A(PLA)的活性,如磷脂酶A1或者磷脂酶A2的活性,磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2的活性,磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属植物(Solanum),如,马铃薯(Solanum tuberosum.)中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog.18635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。
术语“抗体”包括源自模式的或者实质上由免疫球蛋白基因或者免疫球蛋白基因的片段编码的肽或者多肽,可以特异地结合于抗原或者抗原决定簇,见,例如Fundamental lmmunology,Third Edition,W.B.Paul,ed.,Raven Press,N.Y.(1993)Wilson(1994)J.Immunol.Methods 175267-273;Yarmush(1992)J.Biochem.Biophys.Methods 2585-97。术语抗体包括抗原结合部分,即,“抗原结合位点”(例如,保持了结合抗原能力的片段,亚序列,互补决定区(CDRs),包括(i)Fab片段,包括由VL,VH,CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包括在铰链区通过二硫键连接两个Fab片段的二价片段;(iii)包括VH和CH1结构域的Fd片段;(iv)包括抗体单臂的VL和VH结构域的Fv片段,(v)含有VH结构域的dAb片段(Ward et al.,(1989)Nature 341544-546);以及(vi)分离的互补决定区(CDR)。作为参考,单链抗体也包括于术语“抗体”中。
在此应用的术语“阵列”或者“微阵列”或者“生物芯片”或者“芯片”是许多靶元素,每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面积的确定区域的核酸,参见以下进一步的具体讨论。
正如在此所用的术语“计算机”,“计算机程序”和“处理器”在上下文广泛应用,并且用于所有的这样的设备,如以下所述的。
“编码序列”或者“序列编码”特定的多肽或者蛋白,是指当置于合适的调控序列的控制下可以转录和翻译成多肽或者蛋白的核酸序列。
在此使用的术语“表达盒”是指在与这样的序列相容的宿主细胞中可以影响结构基因表达(即,编码蛋白质,如本发明的磷脂酶的序列)的核苷酸序列。表达盒包括至少一个可以可操作地连接至编码多肽的序列上的启动子;并且,可选择地,还有其它的序列例如,转录终止信号。另外的必要的或者有助于影响表达的因子也可以应用,例如,增强子。正如在此所应用的“可操作地连接”是指在上游连接启动子与DNA序列,这样该启动子介导了该DNA序列的转录。这样,表达盒也包括质粒,表达载体,重组病毒,任何形式的重组的“裸露DNA”载体,和类似物。“载体”包括可以感染,转染,瞬间或者永久转导细胞的核酸。可以认为载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体可选择地包括病毒或者细胞的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂类包膜,等等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),其中DNA片段可以结合到其上,变成复制状态。这样的载体包括,但不限于是RNA,自主复制的环状或者线性的DNA或者RNA(如,质粒,病毒,以及类似物,见,如,美国专利No.5,217,879),并且也包括表达的和非表达的质粒。其中描述重组微生物或者细胞培养物是作为宿主培养“表达载体”,其包括染色体外的环状和线性DNA,并且已经整合进入宿主染色体的DNA。其中载体保存在宿主细胞中,该载体可以在细胞有丝分裂中作为自主结构稳定地在细胞中复制,或者整合入宿主基因组中。
“质粒”的命名为在名称前加上小写字母“p”和/或接下来是大写字母和/或数字。在此使用的起始质粒可以买到,在非限制的基础上可以公开获得,或者按照出版的程序从已有的质粒构建。此外,与那些在此描述的质粒等价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。
术语“基因”是指DNA片段,涉及在产生多肽链,包括,除此之外,在编码区的前面和后面的区域,如头部和尾部,启动子和增强子,当适合时,还有单个编码片段(外显子)之间的插入序列(内含子)。
正如在此应用的短语“核酸”或者“核酸序列”是指寡核苷酸,核苷酸,多聚核苷酸,或者是指它们的任何之一的片段,是指基因组或者合成来源的DNA或者RNA(如,mRNA,rRNA,tRNA,iRNA),其可以是单链的或者双链的,并且可以代表有义链或者无义链,是指肽核酸(PNA),或者是指天然的或者起始于合成的任何DNA样或者RNA样的物质,包括如,iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。术语也包括具有合成骨架的核酸样结构,见,如,Mata(1997)Toxicol.Appl.Pharmacol.144189-197;Straus.-Soukup(1997)Biochemistry 368692-8698;Samstag(1996)Antisense NucleicAcid Drug Dev 6153-156。
在此应用的“氨基酸”或者“氨基酸序列”是指寡肽,肽,多肽,或者蛋白序列,或者是指以上任何这些的任何一个的片段、部分或亚基,并且是指天然产生或者合成的分子。
在此应用的术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键连接在一起的氨基酸,即,肽等排体,可以含有不是20个基因编码的氨基酸的修饰氨基酸。术语“多肽”也指肽或者多肽片段,基元(motif),类似物。术语也包括糖基化的多肽。发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式,以下进一步描述。
正如在此所应用的,术语“分离的”是指从起始的环境中分离的物质(如,如果是天然发生的,那么就是天然环境)。例如,存在于活动物中的天然发生的多聚核苷酸或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些或者所有的共存物分离,那么就是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是一个组合物的一部分,并且仍然是分离,因为这样的载体或者组合物不是天然环境的一部分。正如在此使用的,分离的物质或者组合物可以是“纯化”的组合物,即,它并不需要绝对的纯度;更正确地,认为其是相对性的定义。从文库中得到的单个核酸可以经过常规纯化为电泳均一性。可选择的方面,发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中纯化至少一个,两个,三个,四个,五个或者更多数量级的核酸。
正如在此应用的,术语“重组”是指核酸邻近于“骨架”核酸,而在天然环境下它们并不邻近。一方面,核酸代表了核酸“骨架分子”群体中5%或者更多数目的插入物的核酸。按照发明,“骨架分子”包括核酸,如表达载体,自主复制核酸,病毒,整合的核酸,和其他的载体或者用于保持或者操作感兴趣的核酸插入物的核酸。一方面,富集的核酸代表了重组骨架分子群体中的15%,20%,30%,40%,50%,60%,70%,80%,90%或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白,如,从编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白,如以下进一步的描述。
正如以下进一步讨论的,当启动启动子处转录的RNA聚合酶转录编码序列成为mRNA时,启动子序列是“可操作地连接于”编码序列。
“寡聚核苷酸”是指单链多聚脱氧核苷酸或者化学合成的两个互补的多聚脱氧核苷酸链。这样合成的寡聚核苷酸在5’没有磷酸,并且在不用激酶和ATP加入磷酸的情况下,不能连接于另一个寡聚核苷酸。合成的寡聚核苷酸将连接于没有脱磷酸化的片段。
上下文中的两个核酸或者多肽“实质上相同”的短语,是指当使用任何已知的序列比较算法,如以下详细讨论的,或者通过目测的方法检测,比较和对齐为最大同一性时,两个或者多个序列至少具有50%,60%,70%,75%,80%,85%,90%,95%,98%或者99%的核苷酸或者氨基酸残基(序列)的同一性。在可选择的方面,发明提供与发明的典型序列,如,SEQ ID NO1,SEQ ID NO2,SEQ IDNO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,等等,在核酸或者多肽的至少大约100个残基,150个残基,200个残基,300个残基,400个残基,或者从大约50个残基到全长的区域范围内实质上具有同一性的核酸和多肽序列。发明的核酸可以是在整个长度的多肽编码区域实质上一致。
另外的,“实质上一致”的氨基酸序列是与参考序列不同的序列,其中具有一个或者多个保守性或者非保守性的氨基酸取代,缺失,或者插入,特别地,当这样的取代发生在分子的非活性位点的一个位置,并且假设,多肽实质上保持了它的功能特性。保守氨基酸的取代,例如,用一个氨基酸取代另一个同类的氨基酸(如,用一个疏水氨基酸,如异亮氨酸,缬氨酸,亮氨酸,或者甲硫氨酸,取代另一个,或者用极性氨基酸取代另一个极性氨基酸,如,用赖氨酸取代精氨酸,用谷氨酸取代天冬氨酸或者,谷酰胺取代天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中缺失,得到多肽结构的修饰,而并不显著改变其生物活性。例如,对于磷脂酶的生物活性,并不需要氨基或者羧基端氨基酸,可以去除。发明的修饰的多肽序列可以通过很多的方法分析其磷脂酶活性,包括让改变的多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如以下详细说明的。
“杂交”是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性,这样在样品量很低的浓度下可以鉴定感兴趣的特定的序列。合适的严谨条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂交温度来确定,并且本领域是熟知的。例如,严谨性的增加可以通过降低盐浓度,增加甲酰胺的浓度,或者提高杂交温度,改变杂交时间予以实现,如以下所详细描述。可选择的方面,发明的核酸通过它们可以与在此所阐明的不同的严谨条件下杂交的能力(如,高,中,和低)来确定。
术语“变异体”是指在一个或者多个碱基对,密码子,内含子,外显子,或者氨基酸残基(分别)改变的发明的多聚核苷酸或者多肽,但仍保持发明的磷脂酶的生物活性。变异体可以通过很多种方法产生,例如,错误倾向PCR,重排,寡聚核苷酸定向诱变,装配PCR,有性PCR诱变,体外诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,GSSM和它们的组合。在此包括了产生在pH或温度下具有活性的磷脂酶突变体,例如,不同与野生型磷脂酶的技术。
术语“饱和诱变”或者“GSSM”包括应用变性的寡聚核苷酸引物在多聚核苷酸中引入点突变的方法,如下的详细解释。
术语“优化的定向进化系统”或者“优化的定向进化”包括重组装相关核酸序列片段的方法,例如,相关基因,以下详细解释。
术语“合成连接重组装”或者“SLR”包括以非随机的方式连接寡聚核苷酸片段的方法,以下详细解释。
核酸的产生和操作发明提供核酸(如,典型的SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,SEQID NO7,SEQ ID NO9,SEQ ID NO11,SEQ ID NO13,SEQ ID NO15,SEQ IDNO17,SEQ ID NO19,SEQ ID NO21,SEQ ID NO23,SEQ ID NO25,SEQ IDNO27,SEQ ID NO29,SEQ ID NO31,SEQ ID NO33,SEQ ID NO35,SEQ IDNO37,SEQ ID NO39,SBQ ID NO41,SEQ ID NO43,SEQ ID NO45,SEQ IDNO47,SEQ ID NO49,SEQ ID NO51,SEQ ID NO53,SEQ ID NO55,SEQ IDNO57,SEQ ID NO59,SBQ ID NO61,SEQ ID NO63,SEQ ID NO65,SEQ IDNO67,SEQ ID NO69,SEQ ID NO71,SEQ ID NO73,SEQ ID NO75,SEQ IDNO77,SEQ ID NO79,SEQ ID NO81,SEQ ID NO83,SEQ ID NO85,SBQ IDNO87,SEQ ID NO89,SEQ ID NO91,SEQ ID NO93,SEQ ID NO95,SEQ IDNO97,SEQ ID NO99,SEQ ID NO101,SEQ ID NO103,SEQ ID NO105),包括编码发明的多肽和磷脂酶的表达盒,如表达载体。发明也包括应用发明的核酸发现新的磷脂酶序列的方法。也提供用于修饰的本发明核酸的方法,例如,合成连接重装配,优化的定向进化系统和/或饱和诱变。
发明的核酸可以是制备的,合成和/或通过,如,克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA,和类似方法进行操作。在实践本发明的方法中,通过操作模板核酸,可以修饰同源基因,正如在此所述的。本发明可以和本领域已知的其它任何方法或者方案或者装置结合进行实践,这些在科学和专利的文献中有很好的描述。
一般技术用于实践本发明的核酸,不管是RNA,iRNA,反义核酸,cDNA,基因组DNA,载体,病毒或者它们的杂合体,都可以自不同的来源分离,遗传工程,扩增,和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌,哺乳动物,酵母,昆虫或者植物细胞表达系统。
可选择地,这些核酸可以通过已知的化学合成技术在体外合成,正如在如Adams(1983)J.Am.Chem,Soc.105661;Belousov(1997)Nucleic Acids Res.253440-3444Frenkel(1995)Free Radic.Biol.Med.19373-380;Blommers(1994)Biochemistry 337886-7896;Narang(1979)Meth.Enzymol.6890,Brown(1979)Meth.Enzymol.68109;Beaucage(1981)Tetra.Lett.221859;美国专利4,458,066中描述的。
用于核酸操作的技术,如,亚克隆,探针标记(如,使用Klenow聚合酶的随机引物标记,切口平移,扩增),测序,杂交等等,这些方法在科学和专利文献中有说明,见,如,Sambrook,ed.,MOLECULAR CLONINGA LABORATORYMANUAL(2ND ED.),Vols.1-3,Cold Spring Harbor Laboratory,(1989)CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,New York(1997);LABORATORY TECHNIQUES INBIOCHEMSTRY AND MOLECULAR BIOLOGYHYBRlDlZATION WITHNUCLEIC ACID PROBES,Part I.Theory and Nucleic Acid Preparation,Tijssen,ed.Elsevier,N.Y.(1993)。
另一个用于实践发明的方法,即获得和操作核酸的有用方法是从基因组样品中克隆,并且如果需要,筛选和再克隆从例如,基因组克隆或者cDNA克隆中分离或者扩增的插入物。在发明方法中使用的核酸的来源包括包含于如,哺乳动物人工染色体(MACs)中的基因组或者cDNA文库,见如,美国专利5,721,118,6,025,155;人的人工染色体,见,如,Rosenfeld(1997)Nat.Genet.15333-335,酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,见,如,Woon(1998)Genomics 50306-3 16;P1-来源的载体(PACs),见,如,Kern(1997)Biotechniques 23120-124,粘粒,重组病毒,噬菌体或者质粒。
一方面,编码发明多肽的核酸在适当的阶段与可以引起翻译的多肽或者片段分泌的先导序列装配在一起。
发明提供融合蛋白和编码融合蛋白的核酸。发明的多肽可以与异种的肽或者多肽融合,如N-末端鉴定肽,其赋予了所需的特征,如增加的稳定性或者纯化方法的简化。发明的肽和多肽也可以合成并且以与一个或者多个另外的结构域连接的融合蛋白形式进行表达,从而,如,产生更具免疫原性的肽,更容易分离的重组合成肽,鉴定和分离抗体和表达抗体的B细胞,等等。测定和纯化促进结构域包括,如,可以在固定的金属上纯化的金属鏊合肽,如,聚组氨酸序列片(polyhistidine tracks)和组氨酸-色氨酸模块(histidine-tryptophan),可以在固定的免疫球蛋白上纯化的蛋白A结构域,以及在FLAGS伸展/亲和纯化系统(FLAGSextension/affinity purification system,Immunex Corp,Seattle WA)中使用的结构域。在纯化的结构域和含有基元的肽或者多肽之间包含可以切割的如因子Xa或者肠激酶(lnvitrogen,San Diego CA)的接头序列,以便于纯化。例如,表达载体可能包括连接于六个组氨酸残基的编码抗原决定簇的核酸序列,然后是硫氧还蛋白和肠激酶切割位点(见,如,Williams(1995)Biochemistry 341787-1797,Dobeli(1998)Protein Expr.Purif.12404-414)。肠激酶切割位点提供从融合蛋白的残留物中纯化抗原决定簇的方法,同时组氨酸残基有利于检测和纯化。关于编码融合蛋白的载体以及应用融合蛋白的技术在科学和专利文献中有很好的说明,见,例如,Kroll(1993)DNA Cell.Biol.,12441-53。
转录和翻译控制序列发明提供可操作地与表达控制序列(如,转录和翻译)如,启动子或者增强子连接的发明的核酸(如,DNA)序列,指导或者调控RNA的合成/表达。表达控制序列可以在表达载体中。典型的细菌启动子包括lacI,lacZ,T3,T7,gpt,λPR,PL和trp启动子。典型的真核启动子包括CMV即刻早期,HSV胸腺嘧啶激酶激酶,早期和晚期SV40,来自逆转录病毒的LTRs(长末端重复序列)和鼠金属硫蛋白I。
适于在细菌中表达多肽的启动子包括大肠杆菌lac或者trp启动子,lacI启动子,lacZ启动子,T3启动子,T7启动子,gpt启动子,λPR启动子,λPL启动子,来自编码糖酵解的酶的操纵子的启动子如,3-磷酸甘油激酶(PGK),和酸性磷酸酶启动子。真核启动子包括CMV即刻早期启动子,HSV胸腺嘧啶激酶启动子,热休克启动子,早期和晚期SV40启动子,来自逆转录病毒的LTRs,和鼠金属硫蛋白-I启动子。也可以应用已知的在原核或者真核细胞或者其病毒中控制基因表达的其它启动子。
表达载体(expression vectors)和克隆(运)载体(cloning vehicles)发明提供包括发明的核酸,如,编码发明额磷脂酶的序列的表达载体和克隆载体,发明的表达载体和克隆载体可以包括病毒颗粒,杆状病毒,噬菌体,质粒,噬菌粒,粘粒,fosmids,细菌人工染色体,病毒DNA(如,牛痘,腺病毒,禽类痘病毒,伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色体,酵母质粒,酵母人工染色体,以及对感兴趣的特定宿主(如杆状菌,曲霉属(Aspergillus)和酵母)特异的任何其它载体。发明的载体可以包括染色体的,非染色体的和合成的DNA序列。很多合适的载体为本领域技术熟练人员所了解,并且可以买到。典型的载体包括细菌的pQE载体(Qiagen),pBluescript质粒,pNH载体,(λ-ZAP载体(Stratagene);ptrc99a,pKK223-3,pDR540,pRIT2T(Pharmacia);真核的PXTI,pSG5(Stratagene),pSVK3,pBPV,pMSG,pSVLSV40(Pharmacia)。然而,也可以应用任何其它的质粒或载体,只要可以在宿主中复制并且可繁殖。低拷贝数或者高拷贝数的载体可以应用于本发明。
表达载体可以包括启动子,用于翻译起始的核糖体结合位点和转录终止子。载体也包括扩增表达的合适序列。哺乳动物表达载体可以包括复制起始位点,任何必要的核糖体结合位点,多聚腺苷酸化位点,剪接供体和接纳位点,转录终止序列,和5′侧非转录序列。一些方面,源于SV40的剪接和多聚腺苷酸化位点的DNA序列可以用于提供所需的非-转录遗传元件。
一方面,表达载体含有一个或者多个选择性标记基因,使得可以选择含有这些载体的宿主细胞。这些选择标记包括编码二氢叶酸还原酶的基因或对真核细胞培养有新霉素抗性的基因,大肠杆菌中赋予抗四环素或者抗氨苄青霉素的基因,以及酿酒酵母(S.cerevisiae)的TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或者具有选择标记的其它载体,从任何所需基因中选择。
在真核细胞中表达多肽或者其片段的载体也包括用于增加表达水平的增强子。增强子是DNA的顺式作用元件,一般长度从大约10到大约300bp,其作用于启动子,增强启动子的转录。例子包括在复制起点的晚期侧100到270bp的SV40增强子,巨细胞病毒的早期启动子增强子,在复制起点的晚期侧的多瘤增强子,和腺病毒增强子。
DNA序列可以以不同的程序插入到载体中。总体上,DNA序列连接于载体上所需的位置,是在用适合的限制性内切酶消化切下插入片段和消化切割载体之后进行的。可选择地,插入片段和载体两者可以以平端的形式连接。在专业上已知不同的克隆技术,例如,如在Ausubel和Sambrook中所描述的技术。这样的程序和其它程序被认为是属于本领域的技术人员的范围之内。
载体可以是质粒,病毒颗粒或者噬菌体的形式。其它的载体包括染色体的,非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒,噬菌体DNA,杆状病毒,酵母质粒,源于质粒和噬菌体DNA组合的载体,病毒DNA如牛痘,腺病毒,禽类痘病毒,和伪狂犬病病毒。在原核和真核宿主中使用的多种克隆和表达载体,在如Sambrook中所说明的。
可以应用的特定细菌载体包括可以买到的含有以下克隆载体遗传学元件的质粒,pBR322(ATCC 37017),pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden),GEM1(Promega Biotec,Madison,WI,USA)pQE70,pQE60,pQE-9(Qiagen),pD10,psiX174,pBlueScript II KS,pNH8A,pNH16a,pNH18A,pNH46A(Stratagene),ptrc99a,pKK223-3,pKK223-3,pDR540,pRIT5(Pharmacia),pKK232-8和pCM7。特定的真核载体包括pSV2CAT,pOG44,pXTI,pSG(Stratagene)pSVK3,pBPV,pMSG,和pSVL(Pharmacia)。然而,任何其它的载体也可以应用,只要它在宿主细胞可以复制和繁殖。
宿主细胞和转化细胞发明也提供包括发明核酸序列,如,编码发明磷脂酶的序列,发明的载体的转化的细胞。宿主细胞可以是技术熟练人员所熟悉的任何宿主细胞,包括原核细胞,真核细胞,如,细菌细胞,真菌细胞,酵母细胞,哺乳动物细胞,昆虫细胞,或者植物细胞。典型的细菌细胞包括大肠杆菌E.coli,链霉菌Streptomyces,枯草杆菌Bacillus subtilis,沙门氏菌Salmonella typhimurium和假单胞菌Pseudomonas,链霉菌Streptomyces,和葡萄球菌Staphylococcus属中的各种种类。典型的昆虫细胞包括果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)。典型的动物细胞包括CHO,COS或者Bowes melanoma或者任何小鼠或者人类细胞系。适当的宿主的选择是在专业知识的范围内。
载体可以应用任何不同的技术引入到宿主细胞,包括转化,转染,转导,病毒感染,基因枪,或者Ti-介导的基因转移。特定的方法包括磷酸钙转染,DEAE-Dextran介导的转染,脂质体转染,或者电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
适当地,工程化的宿主细胞可以在传统营养培养基中培养,可以修改以便适于活化启动子,选择转化子或者扩增发明的基因。随后转化适当的宿主株,并且该宿主株生长至适当的细胞密度,通过适当的方法诱导所选择的启动子(如,温度变换或者化学诱导),细胞被额外培养一段时间,使得它们产生所需的多肽或者其片段。
细胞通过离心收集,通过物理或者化学的方法破碎,得到的粗提取物保留用于进一步的纯化。用于表达蛋白的微生物细胞可以通过方便的方法破碎,包括反复冷冻-融化循环,机械破碎,或者应用细胞裂解试剂。这样的方法为技术熟练人员所熟悉。表达的多肽或者片段可以通过下述方法从重组细胞培养物中回收纯化,包括硫酸铵或者乙醇沉淀,酸抽提,阳离子或者阴离子交换层析,磷酸纤维素层析,疏水相互作用层析,亲和层析,羟基磷灰石层析和植物凝集素层析。如果必要的话,可以在实现多肽的构象中应用蛋白重新折叠步骤。如果需要,可以应用高效液相色谱(HPLC)进行最终的纯化步骤。
各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括可以从相容性载体中表达蛋白的猴肾成纤维细胞COS-7细胞系和其它的细胞系,如C127,3T3,CHO,Hela和BHK细胞系。
宿主细胞中的构建物可以应用传统的方式来产生重组序列编码的基因产物。依赖于在重组产生程序中采用的宿主,含有载体的宿主细胞产生的多肽可以是糖基化或者是非糖基化的。发明的多肽可以包括,也可以不包括起始的甲硫氨酸氨基酸残基。
无细胞的翻译系统可能也用于产生发明的多肽。无细胞翻译系统可以应用从在带有启动子的编码多肽或者其片段的核酸的DNA构建物转录的mRNA。一些方面,DNA构建物可以,在体外转录反应前,先线性化。然后转录的mRNA与合适的无细胞翻译提取物如,兔网织红细胞提取物一起温育来产生所需的多肽或者片段。
表达载体可以含有一个或者多个选择性标记基因,提供用于选择转化的宿主细胞的表型特征,如,二氢叶酸还原酶和真核细胞培养的新霉素抗性,或者如大肠杆菌中的四环素或者氨苄青霉素抗性。
核酸的扩增在实践发明时,编码发明多肽的核酸,或者修饰的核酸可以再生,如通过扩增。发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。一方面,引物对可以扩增发明的核酸序列,如,包括典型的SEQ ID NO1,或者其一个亚序列;如SEQ ID NO3所阐明的一个序列,或者其一个亚序列;如SEQ ID NO5所阐明的一个序列,或者其一个亚序列;如SEQ ID NO7所阐明的一个序列,或者其一个亚序列,等等。技术熟练人员可以设计这些序列的任何部分或全长的扩增引物序列对。
发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括发明序列的核酸,或者其片段或亚序列。用于扩增的引物序列对的一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡聚核苷酸,或者包括含有该序列的大约12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个连续碱基的寡聚核苷酸。
发明提供扩增引物对,其中引物对包括具有在发明核酸的大约第一个(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基中阐明的序列的第一成员,和具有在第一成员的互补链的大约第一个(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基中阐明的序列的第二成员。发明提供通过扩增产生的磷脂酶,如应用本发明的扩增引物对的多聚酶链式反应(PCR)。发明提供使用发明的扩增引物对,通过扩增,例如,多聚酶链式反应(PCR)制备发明磷脂酶的方法。一方面,扩增引物扩增从文库,例如,基因文库,如环境文库中得到的核酸。
扩增反应也可以用于定量样品中(如在细胞样品中的信使的量)的核酸,标记的核酸(如,用于分析或者印迹)的量,确定核酸,或者定量样品中特异核酸的量。发明的一方面,对分离自细胞或者DNA文库的信使进行扩增。技术熟练人员可以选择和设计合适的寡聚核苷酸扩增引物。扩增的方法为技术熟练人员所熟悉,并且包括,如,多聚酶链式反应,PCR(见,如,PCRPROTOCOLS,AGUIDETO METHODS AND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),ed.Innis,Academic Press,Inc.,N.Y.,连接酶链式反应(LCR)(见,如,Wu(1989)Genomics 4560,Landegren(1988)Science 2411077,Barringer(1990)Gene 89117);转录扩增(见,如,Kwoh(1989)Proc.Natl.Acad.Sci.USA 861173),和自支持序列复制(见如,Guatelli(1990)Proc.Natl,Asad.Sci.USA 871874),Q-β复制酶扩增(见,如,Simth(1997)J.Clin.Microbiol.351477-1491),自动的Q-β复制酶扩增分析(见,如,Burg(1996)Mol.Cell.Probes 10257-271) 和其它RNA聚合酶介导的技术(如,NASBA,Cangene,Mississauga,Ontario),也见,例如,Berger(1987)Methods Enzymol.152307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology 13563-564。
确定序列同一性的水平发明提供包括与发明的典型核酸(例如,SEQ ID NO1,SEQ ID NO3,SBQID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO11,SEQ ID NO13,SEQ IDNO15,SEQ ID NO17,SEQ ID NO19,SEQ ID NO21,SEQ ID NO23,SEQ IDNO25,SEQ ID NO27,SEQ ID NO29,SEQ ID NO31,SEQ ID NO33,SEQ IDNO35,SEQ ID NO37,SEQ ID NO39,SEQ ID NO41,SEQ ID NO43,SEQ IDNO45,SEQ ID NO47,SEQ ID NO49,SEQ ID NO51,SEQ ID NO53,SEQ IDNO55,SEQ ID NO57,SEQ ID NO59,SEQ ID NO61,SEQ ID NO63,SEQ IDNO65,SEQ ID NO67,SEQ ID NO69,SEQ ID NO71,SEQ ID NO73,SEQ IDNO75,SEQ ID NO77,SEQ ID NO79,SEQ ID NO81,SEQ ID NO83,SEQ IDNO85,SEQ ID NO87,SEQ ID NO89,SEQ ID NO91,SEQ ID NO93,SEQ IDNO95,SEQ ID NO97,SEQ ID NO99,SEQ ID NO101,SEQ ID NO103,SEQID NO105,和编码SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO12,SEQ ID NO14,SEQ ID NO16,SBQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,SEQ ID NO34,SEQ ID NO36,SEQ ID NO38,SEQ ID NO40,SEQ ID NO42,SBQ ID NO44,SEQ ID NO46,SEQ ID NO48,SEQ ID NO50,SEQ ID NO52,SEQ ID NO54,SEQ ID NO56,SEQ ID NO58,SEQ ID NO60,SEQ ID NO62,SEQ ID NO64,SEQ ID NO66,SEQ ID NO68,SEQ ID NO70,SEQ ID NO72,SEQ ID NO74,SEQ ID NO76,SEQ ID NO78,SEQ ID NO80,SEQ ID NO82,SEQ ID NO84,SEQ ID NO86,SEQ ID NO88,SEQ ID NO90,SEQ ID NO92,SEQ ID NO94,SEQ ID NO96,SEQ ID NO98,SEQ ID NO100,SEQ ID NO102,SEQ ID NO104,SEQ ID NO106的核酸)在至少大约50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550或者更多的残基范围内具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的序列的核酸。发明提供含有与发明的典型多肽具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全(100%)的序列同一性的序列的多肽。序列同一性(同源性)的范围可以应用任何计算机程序和相关参数来确定,包括那些在此所说明的,如用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。
在可选择的实施方案中,序列同一性可以在核酸或者多肽的至少大约5,10,20,30,40,50,100,150,200,250,300,350,400个连续的残基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定,包括那些在此所说明的,如使用默认参数的BLAST 2.2.2.或者FASTA3.0t78版。
同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧啶。同源序列可以应用在此说明的任何程序得到或者可以由校正序列错误得到。应该理解到的是,在此所列的核酸序列可以以传统的单一字母的形式来代表(见,如,Stryer,Lubert.Biochemistry 3rd Ed.,W.H.Freeman & Co.,New York)或者以记录序列中的核苷酸的同一性的任何其他形式来代表。
在发明的这一方面,在此指明的各种序列比较程序得以使用。蛋白和/或核酸序列同一性(同源性)可以应用技术上已知的任何序列比较算法和程序评估。这样的算法和程序包括,但不限于,TBLASTN,BLASTP,FASTA,TFASTA,和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8)2444-2448,1988Altschul et al.,J.Mol.Biol.215(3)403-410,1990;Thompson et al.,NucleicAcids Res.22(2)4673-4680,1994;Higgins et al.,Methods Enzymol.266383-402,1996;Altschul et al.,J.Mol.Biol.215(3)403-410,1990;Altschul et al.,NatureGenetics 3266-272,1993)。
同源性或者同一性可以应用序列分析软件来测定(如,遗传学计算机组的序列分析软件包,Uinversity of Wisconsin Biotechnology Center,1710 UniversityAvenue,Madison,WI 53705)。这样的软件通过对各种缺失,替换,或者其它的修饰进行同源性水平赋值比较相似的序列。在两个或者多个核酸或者多肽序列的语境下,术语“同源性”和“同一性”是指两个或者多个序列或者亚序列,当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动排列和目测来测定,通过比较和排列以便获得最大的一致性时,它们是相同的或者具有氨基酸残基或者核苷酸的特异百分比。对于序列比较,一个序列可以作为参照序列(典型序列SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,.SEQ ID NO5,SEQID NO6,SEQ ID NO7,SEQ ID NO8,等等)与待测序列进行比较。当应用序列比较算法,待测序列和参照序列被输入到计算机中,如果必要指定亚序列坐标,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。序列比较算法依据程序参数,计算待测序列和参照序列同一性的百分比。
在此应用的“比较窗口”,包括涉及连续残基的数目的任何一个片段。例如,在发明可选择的方面,连续残基的范围从20到全长的发明的典型序列,例如,SEQID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,等等,当两个序列优化地排列后,与参照序列的相同数目的连续位置进行比较。如果参照序列与发明的典型序列,例如SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ IDNO7,SEQ ID NO8等具有必要的序列同一性,如,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多的序列同一性,该序列是属于发明的范围。在可选择的实施方案中,当两个序列优化地排列后,从大约20到600,大约50到200,和大约100到150范围的序列与参照序列的同样的连续位置比较。用于比较的序列比对方法为技术熟练人员所熟悉。用于比较的优化序列比对可以用,例如,Smith & Waterman,Adv.Appl.Math.2482,1981的局部同源性算法,Needleman & Wunsch,J.Mol.Biol.48443,1970的同源排列算法,Person & Lipman,Proc,Nat′1.Acad.Sci.USA 852444,1988的搜索相似性法,通过计算机化这些算法(Wisconsin的遗传学软件包,遗传学计算机组,575 Science Dr,Madison,WI的GAP,BESTFIT,FASTA,和TFASTA)或者通过手动排列和目测完成。其它的用于确定同源性或者同一性的算法包括,例如,除了(在生物信息国家中心的基本局部排列搜索工具)BLAST程序外,ALIGN,AMAS(多排列的序列分析),AMPS(蛋白多序列比对),ASSET(比对片段的统计评估工具),BANDS,BESTSCOR,BIOSCAN(生物序列比较分析节点),BLIMPS(BLocks IMProved Searcher),FASTA,Intervals & Points,BMB,CLUSTAL V,CLUSTAL W,CONSENSUS,LCONSENSUS,WCONSENSUS,Smith-Waterman算法,DARWIN,Las Vegas算法,FNAT(强迫核苷酸比对工具),Framealign,Framesearch,DYNAMIC,FILTER,FSAP(Fristensky序列分析包),GAP(通用比对程序),GENAL,GIBBS,GenQuest,ISSC(灵敏的序列比较),LALIGN(局部序列比对),LCP(局部含量程序),MACAW(多比对构建&分析工作台),MAP(多比对程序),MBLKP,MBLKN,PIMA(模式诱导的多序列比对),SAGA(遗传算法的序列比对)和WHAT-IF。这样的比对程序也可以用于筛查基因组数据库,鉴定具有实质上同一性序列的多核苷酸序列。目前已经有很多基因组数据库,例如,人类基因组的实质上部分可以作为人类基因组测序计划(Gibbs,1995)的一部分。几个基因组已经测序完成,如,生殖道支原体Mgenitalium(Fraseret al.,1995),甲烷球菌M.jannaschii(Bult et al.,1996),流感嗜血菌H influenzae(Fleischmann et al.,1995),大肠杆菌E coli(Blattner et al.,1997),和酵母(S.cerevisiae)(Mewes et al.,1997),和果蝇D.melanogaster(Adams et al.,2000)。模式生物的基因组测序中已经取得了显著的进展,如小鼠,线虫,和拟南芥Arabadopsis sp.。含有具功能性信息注解的基因组信息的数据库由不同的组织保持,并且可以通过因特网进行访问。
BLAST,BLAST 2.0和BLAST 2.22算法也用于实践发明。这些算法在,如,Altschul(1977)Nuc.Acids Res.253389-3402,Altschul(1990)J.Mol.Biol.215403-410中有描述。进行BLAST分析的软件可以通过生物技术信息国家中心(the National Center for Biotechnology Information)公开得到。此算法包括首先通过确定询问序列中长度为W的短词,当与数据库中相同长度的词对齐时,其或者匹配或者满足正值阈得分T,从而确定高分值序列对(HSPs)。T值是指作为邻近词的分数阈值(Altschul(1990),见上文)。这些起始的邻近词命中作为起始搜索的起始,从而发现更长的含有邻近词的HSPs。只要积累的比对值可以增加,词命中就沿着每个序列向两个方向延伸。对于核苷酸序列,积累值的计算应用参数M(匹配残基对的奖励得分值;一般情况下大于0)。对于氨基酸序列,应用记分矩阵来计算累积值。当累积的比对得分值从其最大所得值跌落到数量X;由于一个或者多个负值残基的比对的积累,累积值趋向零或者零以下;或者任何一个序列的到达了末端,单词命中的延伸在每一个方向终止。BLAST算法参数W,T,和X决定了比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字母长度(W)为11,期望值(E)为10,M=5,N=-4的默认值并且比较两条链。对于氨基酸序列,BLASTP程序使用字母长度为3,期望值(E)为10的默认值,BLOSUM62记分矩阵(见Henikoff & Henikoff(1989)Proc.Natl.Acad.Sci.USA8910915)比对值(B)为50,期望值(E)为10,M=5,N=-4,并且比较两条链。BLAST算法也对两个序列之间的相似性进行统计分析(见,如,Karlin&Altschul(1993)Proc.Natl.Acad.Sci.USA 905873)。由BLAST算法提供的一个相似性测定是最小总概率(P(N)),其通过两个核苷酸之间或者氨基酸序列之间随机配对,提供概率的指标。例如,在检测核酸和参照序列比较时,如果最小的总概率小于大约0.2,更优选的是小于大约0.01,最优选的小于大约0.001,那么认为核酸与参考序列相似。一方面,蛋白质和核酸序列的同源性应用基本局部比对搜索工具(“BLAST”)评估。例如,五个特异性的BLAST程序可以用于以下任务(1)BLASTP和BLAST3把氨基酸询问序列与蛋白序列数据库进行比较。(2)BLASTN把核酸询问序列与核酸序列数据库进行比较。(3)BLASTX把询问的核苷酸序列的六个框架的翻译产物(两个链)与蛋白序列数据库进行比较。(4)TBLASTN把询问的蛋白序列与六个阅读框架(双链)中翻译的核酸序列数据库进行比较,并且(5)TBLASTX把询问核酸的六个阅读框架的翻译与数据库中核苷酸序列的六个阅读框架的翻译进行比较。BLAST程序通过鉴定相似片段来鉴定同源序列,相似片段在此是指询问氨基酸或者核酸序列之间的“高分值片段对”,检测序列优选的从蛋白质或者核酸序列数据库中获得。高分值片段配对优选地通过记分矩阵鉴定(比对),它们中的很多为技术熟练人员所熟悉。优选地,应用的记分矩阵是BLOSUM62矩阵(Gonnet et al.,Science 2561443-1445,1992,Henikoff和Henikoff,Proteins 1749-61,1993)。较不优选地,PAM或者PAM250矩阵也可以应用(见,例如,Schwartz和Dayhoff,eds.,1978,检测距离关系的矩阵蛋白质序列和结构集,华盛顿 国家生物医学研究基金会)。
发明的一方面,为了确定是否核酸具有发明范围内的必需序列同一性,应用NCBI BLAST 2.2.2程序,默认值的选择是blastp。在BLAST 2.2.2程序中,有大约38个设定的选择。在发明的典型方面,除了默认的过滤设置外,所有都应用默认值(即除了过滤设定为关闭,所有的参数设定为默认值),在该位置上应用不进行过滤“-F F”设置。一般由于序列的长度,默认过滤的使用经常导致Karlin-Altschul违背。
发明的典型方面的使用的默认值包括“低复杂性过滤on>字长3>矩阵Blosum62>缺口成本存在值11
>延伸1”其它的默认值设置为低复杂性过滤关闭(off),蛋白质字母长度为3,BLOSUM62矩阵,缺口存在补偿-11,并且缺口延伸补偿-1。
典型的NCBI BLAST 2.2.2程序设置在以下的实施例1中阐明。注意,“-W”选择默认值为0。这是指,如果没有设置,对于蛋白,字母长度默认值为3,对于核苷酸字母长度默认值为11。
计算机系统和计算机程序产品为了确定和鉴定序列同一性,结构同源性,基元等等,发明的序列可以在任何计算机可以读取的介质上储存,记录和操作。相应地,发明提供计算机,计算机系统,计算机可读介质,计算机程序产品和等等可以记录和储存发明的核酸和多肽序列,例如,发明的典型序列,如,SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,等等的产品。正如在此使用的,单词“记录的”和“存储的”是指在计算机介质上储存信息的过程。熟练的技术人员可以很容易地采用任何已知的方法在计算机的可读介质上记录信息,产生含有一个或者多个发明的核酸和/或多肽序列的产品。
发明的另一方面是具有记录发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质,光学可读介质,电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘,软盘,磁带,CD-ROM,DVD,随机存取存储器(RAM),只读存储器(ROM)以及其它类型的技术人员熟知的其它媒介。
发明的方面包括系统(如,以因特网为基础的系统),特别的计算机系统,其存储和操作在此说明的序列和序列信息。计算机系统100的一个实施例在图1的方块图中有说明。正如在此所使用的,“计算机系统”是指用于分析发明的核苷酸和多肽序列的硬件组件,软件组件,以及数据存储组件。计算机系统100可以包括用于序列数据处理,访问和操作的处理器。处理器105可以是任何已知类型的中央处理器如,例如,Intel公司的奔腾III处理器或者Sun,Motorola,Compaq,AMD或者IBM公司相似的处理器。计算机系统100是一般目的的系统,其包括处理器105和用于存储数据的一个或者多个内部数据存储组件110,和一个或者多个用于检索存储于数据存储装置的数据的数据检索装置。熟练的技术人员可以很容易地应用任何一个目前可得到的合适的计算机系统。
一方面,计算机系统100包括连接于总线的处理器105,该总线连接于主存储器115,(优选地,作为RAW执行)和一个或者更多的内部数据存储装置110,如硬盘驱动器和/或其它的具有数据存储的计算机可读介质。计算机系统100可以进一步包括一个或者多个用于读取存储于内部数据存储装置110的数据的数据检索装置118。
数据检索装置118可以为,例如,软盘驱动器,光盘驱动器,磁带驱动器或者可以连接于远端数据存储系统的调制解调器(如通过因特网)等等。在一些具体情况下,内部的数据存储装置110是可移动的计算机可读介质如,软盘,光盘,磁带,等等。含有控制逻辑和/或其中记录的数据。当数据存储组件插入到数据检索装置中时,计算机系统100可以优势地包括或者通过适当的软件执行来读取控制逻辑和/或数据。
计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到计算机系统100可以在网络中或者宽带网中连接于其它的计算机系统125a-c,提供集中地接到计算机系统100。连接和处理发明的核酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。
一些方面,计算机系统100可以进一步包括比较发明的核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一个或者多个程序,可以安装在(局域地或者远程地)计算机系统100上,把核酸序列与别的核酸序列和/或在数据存储方式中存储的化合物相比较。例如,序列比较算法可以把典型的序列的核苷酸序列,如,存储在计算机可读介质中的SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID.NO4,SEQ ID NO5,SEQ ID NO6,SEQ IDNO7,SBQ ID NO8等等与存储在计算机可读介质中的参照序列进行比较,确定同源性或者结构基元。
以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以变化。一些方面,算法使用的参数可以在使用者没有给出指令的情况下,应用默认参数。图2是说明过程200的流程图,把新的核苷酸或者蛋白序列和数据库的序列加以比较,确定新序列和数据库序列之间的同源性水平。序列数据库可以是在储存于计算机系统100的私人数据库,或者公开数据库,如通过因特网可以查到的GENBANK。过程200在起始状态201开始,并且移动到状态202,其中待比较的新序列储存于计算机系统100的存储器中。正如以上所讨论的,存储器可以是任何类型的存储器,包括RAM或者内部存储装置。
过程200随后移至状态204,其中的序列数据库开放用于分析和比较。进程200然后移至状态206,其中读取存储在数据库的第一序列至计算机的存储器中。在状态210下进行比较,确定是否第一序列与第二序列一样。值得注意的是,本步骤并不限于进行新序列和数据库中的第一序列进行精确的比较。技术熟练人员熟悉比较两个核苷酸或者蛋白序列的方法,尽管它们并不相同。例如,为了提高两个待检测序列的同源性水平,可以在一个序列中引入缺口。在比较过程中控制是否引入缺口或者其它的特征到序列中的参数一般由计算机系统的使用者输入。
一旦在状态210的情况下,进行了两个序列的比较,那么在决定状态210就作出是否两个序列一样的确定。当然,术语“同样”并不限于完全绝对一样的序列。在使用者输入的同源性参数内的序列将在过程200中被标记为“相同的”。如果确定了两个序列是一样的,过程200移至状态214,其中来自数据库的序列的名称给使用者显示出来。该状态告诉使用者显示了名称的序列具有输入所限制的同一性。一旦储存序列的名称给使用者显示出来,过程200移至决定状态218,作出是否在数据库中有更多的序列的结论。如果在数据库中没有更多的序列,那么过程200终止于结束状态220。然而,如果在数据库中存在更多的序列,那么过程200移至状态224,其中指示器移到数据库中下一个序列,以便可以与新序列进行比较。以这种方式,比对新序列并且与数据库中的每一个序列进行比较。
应当注意,如果在决定状态212作出了决定,序列没有同源性,那么过程200将立即移至决定状态218,确定在数据库中是否有其它的序列用于比较。同样地,发明的一方面是包括处理器,储存有发明的核酸序列的数据存储装置以及用于进行比较的序列比较软件的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基元,或者可以确定与核酸密码子和多肽密码相比较的序列中的结构基元。
图3是说明计算机中过程250的一个具体例子,确定是否两个序列具有同源性的流程图。过程250开始于起始状态252,并且随后移至状态254,其中待比较的第一序列存储于存储器中。待比较的第二序列随后在状态256存储于存储器中。过程250然后移至状态260,其中读取第一序列的第一个字母,然后移至状态262,其中读取第二序列的第一个字母。应当理解如果序列是核苷酸序列,那么字母是A,T,C,G,或者U。如果序列是蛋白序列,那么字母为单个的氨基酸序列密码,以便第一序列与第二序列可以很容易地进行比较。在决定状态264作出是否两个字母是一样的决定。如果它们一样,过程250移至状态268,来读取第一和第二序列的下一个字母,然后确定是否下一个字母是相同的。如果相同,过程250继续该循环一直到两个字母不同。如果确定下一个两个字母不同,过程250移至决定态274,确定是否在序列中有任何更多的字母来读取。如果没有更多的字母来读取,那么过程250移至状态276,其中第一和第二序列的同源性水平给使用者显示出来。同源性水平通过计算序列间的相同字母的数目占第一序列总的字母数的比例来确定。这样,如果在第一个100个核苷酸序列中比对的每一个字母与第二序列的每一个字母一样,同源性水平将是100%。
可选择地,计算机程序可以比较参照序列与发明的序列,确定是否序列在一个或者多个位置上不同。程序可以记录发明序列和参照序列中插入,缺失或者替换核苷酸或者氨基酸残基的长度和同一性,计算机程序可以是确定是否参照序列与发明的序列相比含有单一核苷酸多态性(SNP),或者是否发明的序列含有已知序列的SNP的程序。这样,在一些方面,计算机程序是鉴定SNPs的程序。该方法可以通过以上说明的计算机系统来完成并且该方法在图3中有说明。该方法可以通过应用计算机程序读取发明序列和参照序列来进行,并且用计算机程序来鉴定差异。
另一方面,以计算机为基础的系统包括鉴定发明的核酸或者多肽特征的鉴定器。“鉴定器”是指一个或者多个鉴定核酸序列的一些特征的程序。例如,鉴定器可以包括鉴定核酸序列中开放阅读框架(ORF)的程序。图4是说明用于检测序列中存在特征的鉴定器程序300的一个方面的流程图。过程300起始于起始状态302然后移至状态304,其中待检测特征的第一序列存储于计算机系统100的存储器115。过程300然后移至状态306,在该状态下,开放具有序列特征的数据库。这样数据库将包括每一个特征属性和特征名称的菜单。例如,特征名称可以是“起始密码子”,特征属性为“ATG”。另一个例子是特征名称为“TAATAA盒”,特征属性为“TAATAA”。这样的数据库是由威斯康辛大学遗传学计算机组制作。可选择地,特征可以是结构多肽基元如α螺旋,β折叠,或者功能性多肽基元如,酶的活性位点,螺旋-转角-螺旋基元或者其它的技术熟练人员所熟知的基元。一旦在状态306特征数据库开放,过程300移至状态308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在状态316下作出决定是否在第一序列发现有特征的属性。如果发现属性,过程300移至状态318,其中发现特征的名称显示给使用者。过程300然后移至决定状态320,在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库中有更多的特征,过程300在状态326读取下一个序列特征,并且循环至状态310,其中下一个特征的属性与第一序列进行比较。如果在状态316并没有在第一序列中发现特征属性,过程300直接移至决定状态320,作出是否有更多的特征存在于数据库中的确定。这样,一方面,发明提供鉴定开放阅读框架(ORFs)的计算机程序。
发明的多肽和核酸序列可以以不同的形式用不同的数据处理程序存储并且处理。例如,序列可以以如文本的字处理文件储存,如,Miorosoft WORD或者WORDPERFECT或者那些技术熟练人员熟悉的不同的数据程序的ASCll文件,如,DB2,SYBASE,或者ORACLE。此外,很多的计算机程序和数据库可以作为序列比较算法,鉴定器,或者,参照核苷酸序列或者多肽序列的来源,与发明的核酸序列比较。用于实践发明的程序和数据库包括,但不限于MacPattern(EMBL),DiscoveryBase(Molecular Applications Group),GeneMine(Molecular ApplicationsGroup),Look(Molecular Applications Group),MacLook(Molecular ApplicationsGroup),BLAST和BLAST2(NCBI),BLASTN和BLASTX(Altschul et al,J.Mol.Biol.215403,1990),FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,852444,1988),FASTDB(Brutlag et al.Comp.App.Biosci.6237-245,1990),Catalyst(Molecular Simulations Inc.),Catalyst/SHAPE(Molecular Simulations Inc.),Cerius2.DBAccess(Molecular Simulations Inc.),HypoGen(Molecular Simulations Inc.),Insight II,(Molecular Simulations Inc.),Discover(Molecular Simulations Inc.),CHARMm(Molecular Simulations Inc.),Felix(Molecular Simulations Inc.),DelPhi,(Molecular Simulations Inc.),QuanteMM,(Molecular Simulations Inc.),Homology(Molecular Simulations Inc.),Modeler(Molecular Simulations Inc.),ISIS(Molecular Simulations Inc.),Quanta/Protein Design(Molecular Simulations Inc.),WebLab(Molecular Simulations Inc.),WebLab Diversity Explorer(MolecularSimulations Inc.),Gene Explorer(Molecular Simulations Inc.),SeqFold(MolecularSimulations Inc.),MDL可用的化学品目录数据库,MDL的药物数据报告数据库,综合药物化学数据库(the Comprehensive Medicinal Chemistry database),Derwent′s世界药物索引数据库,BioByteMasterFile数据库,Genbank数据库,和Genseqn数据库。很多其它的程序和数据库对于技术熟练人员是显然的。
可以应用以上程序检测的基元包括序列编码的亮氨酸拉链,螺旋-转角-螺旋基元,糖基化位点,泛素化位点,α螺旋,和β折叠,编码信号肽的信号序列,信号肽引导编码蛋白的分泌,转录调控涉及的序列,如,同源盒,酸性分枝,酶活性位点,底物结合位点,和酶切割位点。
核酸的杂交发明提供可以在严谨的条件下,与发明的典型序列,例如,在SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO11,SBQID NO13,SEQ ID NO15,SBQ ID NO17,SEQ ID NO19,SBQ ID NO21,SEQID NO23,SEQ ID NO25,SEQ ID NO27,SEQ ID NO29,SEQ ID NO31,SEQID NO33,SEQ ID NO35,SEQ ID NO37,SEQ ID NO39,SEQ ID NO41,SEQID NO43,SEQ ID NO45,SEQ ID NO47,SEQ ID NO49,SEQ ID NO51,SEQID NO53,SEQ ID NO55,SEQ ID NO57,SEQ ID NO59,SEQ ID NO61,SEQID NO63,SEQ ID NO65,SEQ ID NO67,SEQ ID NO69,SEQ ID NO71,SEQID NO73,SEQ ID NO75,SEQ ID NO77,SEQ ID NO79,SEQ ID NO81,SEQID NO83,SEQ ID NO85,SEQ ID NO87,SEQ ID NO89,SEQ ID NO91,SEQID NO93,SEQ ID NO95,SEQ ID NO97,SEQ ID NO99,SEQ ID NO101,SEQ ID NO103,SEQ ID NO105中阐明的序列,或者编码包括在SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO12,SEQID NO14,SEQ ID NO16,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,SEQID NO34,SEQ ID NO36,SEQ ID NO38,SEQ ID NO40,SEQ ID NO42,SEQID NO44,SEQ ID NO46,SEQ ID NO48,SEQ ID NO50,SEQ ID NO52,SEQID NO54,SEQ ID NO56,SEQ ID NO58,SEQ ID NO60,SEQ ID NO62,SEQID NO64,SEQ ID NO66,SEQ ID NO68,SEQ ID NO70,SEQ ID NO72,SEQID NO74,SEQ ID NO76,SEQ ID NO78,SEQ ID NO80,SEQ ID NO82,SEQID NO84,SEQ ID NO86,SEQ ID NO88,SEQ ID NO90,SEQ ID NO92,SEQID NO94,SEQ ID NO96,SEQ ID NO98,SEQ ID NO100,SEQ ID NO102,SEQ ID NO104,SEQ ID NO106中阐明序列的多肽的核酸杂交的分离的或者重组的核酸。严谨条件可以是高度严谨条件,中度严谨条件,低度严谨条件,包括在此说明的高度和降低严谨性的条件。在可选择的具体情况下,通过在严谨条件下杂交能力所定义的发明的核酸可以是大约5个残基到全长分子之间,例如,发明的典型核酸。例如,它们的长度可以是至少5,10,15,20,25,30,35,40,50,55,60,65,70,75,80,90,100,150,200,250,300,350,400个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用于如杂交探针,标记探针,PCR寡聚核苷酸探针,iRNA(单链或者双链),反义或者编码抗体结合肽(抗原决定簇)的序列,基元,活性位点和类似物。
一方面,发明的核酸通过其可以在高的严谨性条件下杂交的能力定义,高严谨性包括条件为大约37℃到42℃,大约50%的甲酰胺。一方面,发明的核酸通过其可以在降低的严谨性条件下杂交的能力定义,降低的严谨性包括条件为大约30℃到35℃,大约35%到25%的甲酰胺。可选择地,发明的核酸通过其可以在高严谨性条件下杂交的能力定义,高严谨性包括条件为42℃,50%的甲酰胺中,5×SSPE,0.3%的SDS,以及作为封闭核酸的重复序列,如cot-1或者鲑鱼精DNA(例如,200n/ml剪切的和变性的鲑鱼精DNA)。一方面,发明的核酸通过其可以在降低的严谨条件下杂交的能力定义,降低的严谨性包括条件为降低的温度35℃,含有35%的甲酰胺。
杂交以后,滤膜可以在50℃,用6×SSC,0.5%的SDS洗膜。认为超过25%的甲酰胺的这些条件是“中度”条件,而小于25%的甲酰胺的条件是“低度”条件。“中度”杂交条件的一个特定例子是当以上的杂交在30%的甲酰胺下进行。“低严谨性”的特定例子是当上述杂交在10%的甲酰胺下进行。
与特定水平的严谨性相对应的温度范围可以进一步通过计算该核酸中嘌呤与嘧啶的比例来细化,并且相应地调节温度。发明的核酸也通过其可以在Ausubel和Sambrook中所述的高度,中度,低度严谨性条件下杂交的能力来定义。以上范围和条件的变化为技术熟练人员所熟悉,杂交条件在以下有进一步的讨论。
寡聚核苷酸探针和应用方法发明也提供用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面,探针包括在SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7,SEQ IDNO9,SEQ ID NO11,SEQ ID NO13,SEQ ID NO15,SEQ ID NO17,SEQ IDNO19,SEQ ID NO21,SEQ ID NO23,SEQ ID NO25,SEQ ID NO27,SEQ IDNO29,SEQ ID NO31,SEQ ID NO33,SEQ ID NO35,SEQ ID NO37,SEQ IDNO39,SEQ ID NO41,SEQ ID NO43,SEQ ID NO45,SEQ ID NO47,SEQ IDNO49,SEQ ID NO51,SEQ ID NO53,SEQ ID NO55,SEQ ID NO57,SEQ IDNO59,SEQ ID NO61,SEQ ID NO63,SEQ ID NO65,SEQ ID NO67,SEQ IDNO69,SEQ ID NO71,SEQ ID NO73,SEQ ID NO75,SEQ ID NO77,SEQ IDNO79,SEQ ID NO81,SEQ ID NO83,SEQ ID NO85,SEQ ID NO87,SEQ IDNO89,SEQ ID NO91,SEQ ID NO93,SEQ ID NO95,SEQ ID NO97,SEQ IDNO99,SEQ ID NO101,SEQ ID NO103,SEQ ID NO105中阐明的序列的至少10个连续碱基。可选择地,发明的探针可以是发明的序列中所阐明的序列的至少大约5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,30,35,40,50,55,60,65,70,75,80,90,100,150,大约10到50,大约20到60,大约30到70个连续碱基。探针通过结合或者杂交来鉴定核酸。探针可以用于本发明的阵列中,见以下讨论,包括,例如,毛细管阵列。发明的探针也可以用于分离其它的核酸或者多肽。
发明的探针可以用于确定是否生物样品,如土壤样品,含有具有发明的核酸序列的生物或者含有核酸来源的生物。在这一程序中,获得潜在地隐藏了从其中分离核酸的生物体的生物样品,并且从样品中获得核酸。核酸在允许探针与样品中存在的任何互补序列特异杂交的条件下与探针接触。如果必要,探针与互补序列特异杂交的条件可以通过将探针与已知含有互补序列核酸的样品中的互补序列接触来确定,同时对照序列为不含有互补序列。可以改变杂交条件,如杂交缓冲液中的盐浓度,杂交缓冲液中的甲酰胺浓度,或者杂交温度,来使得探针特异性地与互补的核酸序列杂交(见,特异杂交条件的讨论)。
如果样品中含有核酸自其中分离的生物,检测探针特异的杂交。杂交可以通过用检检测剂,如放射性同位素,荧光染料或者可以催化形成可检测产物的酶,标记探针进行检测。应用标记的探针来检测在样品中存在互补的核酸的很多方法为技术熟练人员所熟悉。这些方法包括Southern印迹,Northern印迹,菌落杂交程序,以及斑点印迹杂交。每一个程序的具体方法参见Ansubel和Sambrook。
可选择地,多于一个探针(至少一种可以与存在于核酸样品中的任何互补序列杂交的探针)可以在扩增反应中使用,确定是否样品中含有具有发明的核酸序列的生物(如,核酸自其中分离的生物)。一方面,探针包括寡核苷酸。一方面,扩增反应可以包括PCR反应。PCR的具体方法在Ansubel和Sambrook的书中有说明(参见扩增反应的讨论)。在这样的程序中,样品中的核酸与探针接触,进行扩增反应,检测得到的任何扩增产物。扩增产物可以通过反应产物进行凝胶电泳来检测,并且用如溴乙啶的插入试剂来染胶。可选择的,一个或者多个探针可以用放射性同位素标记,并且在凝胶电泳后,通过放射自显影检测是否存在放射性标记的扩增产物。
来源于发明的核酸序列的近3’或者5’端的探针也可以用染色体步行程序来确定含有另外的,如基因组序列的克隆。这样的方法允许从宿主生物体中分离编码另外感兴趣蛋白的基因。
一方面,发明的核酸作为探针鉴定和分离相关的核酸。在一些方面,这样确定的相关核酸可以是来自于非发明核酸首次自其中分离的生物体的cDNA或者基因组DNA,通过这样的程序,核酸样品与探针在允许探针特异地与相关序列杂交的条件下接触。探针与来源于相关生物体的核酸杂交后,应用以上说明的任何方法来检测。
在核酸杂交反应中,用于达到特定严谨性水平的条件可以根据待杂交核酸的性质来进行改变。例如,在选择杂交条件中要考虑长度,互补水平,核酸杂交区域的核苷酸序列组成(如,GC对AT含量的比率),以及核酸类型(如,RNA对DNA)。另外考虑是否核酸中的一个是固定于,如滤膜上。杂交可以在低严谨性,中度严谨性或者高严谨性的条件下进行。作为核酸杂交的一个例子,含有固定的变性的核酸的多聚膜首先在45℃下,在含有0.9M NaCl,50mM NaH2PO4,PH 7.0,5.0mM Na2EDTA,0.5%SDS,10×Denhardt′s和0.5mg/ml多核腺苷酸的溶液中预杂交30分钟。大约2×107cpm(特异活性4-9×108cpm/ug)的32P末端标记的寡聚核苷酸探针加入到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5%SDS的1×SET(150mM NaCl,20mM Tris盐酸,PH 7.8,1mM Na2EDTA)中洗涤30分钟,然后在新鲜配制的1×SET,寡聚核苷酸探针的Tm-10℃下,再洗涤30分钟。然后将膜暴露于自显影胶片上来检测杂交信号。
通过改变鉴定核酸,如可以与探针杂交的cDNA或者基因组DNA,时所用的杂交条件的严谨性,可以鉴定和分离与探针具有不同同源性水平的核酸。严谨性变化可以通过在低于探针熔链温度的改变温度下进行杂交来进行。熔链温度Tm,是(在确定的离子强度和pH值的条件下)50%的靶序列与完全互补探针杂交的温度。对于特定的探针,非常严谨性的条件是选择等于或者低于特定探针Tm值5℃。探针的熔链温度可以通过以下的经验公式计算。对于长度为14到70个核苷酸长度的探针,熔链温度(Tm)的计算应用以下公式Tm=81.5+16.6(log[Na+])+0.41(G+C部分)-(600/N),其中N是探针的长度。如果杂交是在含有甲酰胺的溶液中进行,熔链温度的计算用以下的公式Tm=81.5+16.6(log[Na+])+0.41(G+C部分)-(0.63%甲酰胺)-(600/N)其中N是探针的长度。预杂交可以在6×SSC,5×Denhardt′s试剂,0.5%SDS,100μg变性的鲑鱼精DNA片段或者6×SSC,5×Denhardr′s试剂,0.5%SDS,100μg变性的鲑鱼精DNA片段,50%甲酰胺中进行。SSC和Denhardt′s以及其它溶液的配方见,例如,Sambrook。
杂交是通过加入可检测到的探针于以上所列的预杂交溶液中进行,其中的探针包括双链DNA。探针在加入到杂交溶液之前先要进行变性。滤膜首先与杂交溶液充分接触一段时间,使得探针与含有互补序列或者同源序列的cDNA或者基因组DNA杂交。对于长度超过200个核苷酸的探针,杂交在比Tm低15到25℃进行。对于较短的探针如寡聚核苷酸探针,杂交在比Tm低5到10℃进行。一方面,在6×SSC中,大约是68℃进行杂交。一方面,在含有50%甲酰胺的溶液,温度大约为42℃进行杂交。认为前述的所有杂交认为是在高严谨性条件下进行。
杂交以后,滤膜洗涤去除任何非特异结合的可以检测到的探针。洗膜所用的严谨性也可以根据杂交的核酸的性质,杂交核酸的长度,互补的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对DNA)来进行变化。逐渐增高严谨性条件的洗膜例子如下2×SSC,室温下0.1%SDS 15分钟,(低严谨性);0.1×SSC,室温下0.5%SDS30分钟到1小时(中度严谨性);0.1×SSC,0.5%SDS,杂交温度和68℃之间15到30分钟(高严谨性);0.15M NaCl,在72℃下15分钟(很高严谨性),最后低严谨性洗涤可以在0.1×SSC室温下进行。以上的例子仅仅是用于洗膜的一系列条件。技术熟练人员应该了解对于不同严谨性的洗涤有很多不同的方法(recipes)。
可以与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定具有与探针序列具有降低的同源性水平的核酸。例如为了获得与探针序列具有降低的同源性水平的核酸,可以应用不太严谨的条件。例如,在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以从68℃到42℃以5℃的幅度降低。杂交后,滤膜用2×SSC,0.5%SDS在杂交温度下洗膜。认为高于50℃的条件为“中度”条件,低于50℃的条件为“低度”条件。“中度”杂交条件的一个例子是当以上的杂交在55℃的条件下进行。“低严谨性”杂交条件的一个例子是当以上的杂交在45℃的条件下进行。
可选择地,杂交在缓冲液,如含有甲酰胺的6×SSC中,在42℃下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%来确定对探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6×SSC,0.5%SDS在50℃下洗涤,认为当甲酰胺浓度大于25%为“中度”条件,而低于25%为“低度”条件。“中度”杂交条件的一个例子是当以上的杂交在30%的甲酰胺中进行。“低严谨性”杂交条件的一个例子是当以上的杂交在10%的甲酰胺中进行。
发明的这些探针和方法可以用于分离具有与发明的核酸序列有至少大约99%,98%,97%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%,或者至少50%的序列同源性的序列的核酸,该核酸包括至少大约10,15,20,25,30,35,40,50,75,100,150,200,250,300,350,400,或者500个连续的碱基和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多聚核苷酸可以具有在此说明的一个编码序列的天然发生等位基因突变体的编码序列。这样的等位基因突变体与发明的核酸比较,可以具有取代,缺失或者插入一个或者多个核苷酸。
此外,发明的探针和方法可以用于分离编码与发明多肽具有至少大约99%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%,,或者至少50%的序列同一性(同源性)的多肽的核酸,应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具有在此阐明的典型设置的BLAST2.2.2程序)确定的,该多肽具有其至少5,10,15,20,25,30,35,40,50,75,100,或者150个连续的氨基酸。
抑制磷脂酶的表达发明进一步提供与发明的核酸序列如磷脂酶编码核酸互补的核酸(如,反义序列)。反义序列可以抑制磷脂酶编码基因的转运,剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA起作用。靶核酸的转录或者功能可以被抑制,例如,通过杂交和/或切割。发明提供的特别有效的一套抑制物包括可以结合磷脂酶基因或者信使PNA的寡聚核苷酸,在每一种情况下,阻止或者抑制磷脂酶的产生或者功能。结合是通过序列特异性的杂交实现的。另一类有用的抑制物包括引起磷脂酶信使RNA失活或者切割的寡聚核苷酸。寡聚核苷酸可以具有引起切割的酶活性,如核酶。寡聚核苷酸可以通过化学修饰或者接合到可以切割互补核酸的酶或成分上。操作人员可以从很多不同的此类寡聚核苷酸所构成的文库中筛选出具有所需活性的这样寡聚核苷酸。
磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶降解时,可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂酶的表达和/或活性的本发明的组分,例如,抗体,反义寡聚核苷酸,核酶和RNAi可以用于减缓或者阻止酸败。这样,一方面,发明提供包括应用于植物或者植物产品(如,水果,种籽,根,叶,等等)的方法和组分的本发明的抗体,反义寡聚核苷酸,核酶和RNAi,用于阻止或者延缓酸败。这些组分也可以由植物表达(如,转基因植物)或者其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)。
用于抑制磷脂酶表达的本发明的组分(如反义,iRNA,核酶,抗体)可以作为药物的组分。
反义寡聚核苷酸发明提供可以结合磷脂酶信使的反义寡聚核苷酸,反义寡聚核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡聚核苷酸的策略在科学和专利文献中有说明,并且技术熟练人员可以应用发明的新试剂设计这样的磷脂酶寡聚核苷酸。例如,基因步行/RNA作图方法来筛查有效的反义寡聚核苷酸为技术熟练人员所了解,见,如,Ho(2000)Methods Enzymol.314168-183,描述了RNA图谱分析,RNA图谱分析以标准的分子技术为基础,给有效的反义序列的筛选提供了简易的和可靠的方法。也见Smith(2000)Eur.J.Pharm.Sci.11191-198。
也可以应用天然产生的核酸作为反义寡聚核苷酸。反义寡聚核苷酸可以是任何长度;例如,在可选择的方面,反义寡聚核苷酸在大约5到100,大约10到80,大约15到60,大约18到40之间。优化的长度可以通过常规的筛查来确定。反义寡聚核苷酸可以以任何浓度存在。优化的浓度可以通过常规的筛查来确定。已知有许多合成的,非天然产生的核苷和核酸类似物可以解决潜在的问题。例如,可以应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有磷硫连接的反义寡聚核苷酸,如,WO 97/03211;WO 96/39154所述;Mata(1997)Toxicol Appl Pharmacol 144189-197;反义治疗学,ed.Agrawal(Humana Press,Totowa,N.J.,1996)。发明提供的具有合成的DNA骨架类似物的反义寡聚核苷酸也可以包括磷-二硫,甲基磷酸,磷阿米酮,烷基磷三酯,氨基磺酸盐,3’-硫代乙缩醛,甲叉(甲基亚胺),3′-N-氨基甲酸酯剂,和吗啉代氨基甲酸酯核酸,如以上所述。
可以应用组合化学的方法产生大量的寡核苷酸,这些寡核苷酸是可以快速筛选对任何靶具有适当结合亲和性和特异性的寡聚核苷酸,如发明的有义和反义的磷脂酶序列(见,如,Gold(1995)J.of Biol.Chem.27013581-13584)。
抑制性核酶发明提供可以结合磷脂酶信使的核酶,其可以通过靶向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向的磷脂酶特异的反义序列在科学和专利文献中有说明,并且技术熟练人员可以应用发明的新试剂设计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA起作用,核酶的靶RNA结合部分靠近RNA的酶活部分,酶活部分切割靶RNA。这样,核酶通过互补的碱基配对识别并且结合靶RNA,并且一旦结合于正确的位点,将以酶的方式来切割并且使靶RNA失活。如果切割发生在编码序列,以这种方式的靶RNA的切割将破坏其引发编码蛋白合成的能力。当核酶结合并且切割其靶RNA后,一般情况下,将从RNA上释放,然后对新的靶重复结合和切割过程。
在一些情况下,核酶的酶本质决定了其比其它技术如反义技术(其中核酸分子简单地结合于核酸靶来阻止其转录,翻译或者与其它分子的结合)更优越,因为作为治疗处理有效的必要的核酶的活性浓度低于反义寡聚核苷酸的浓度。这一潜在的优点反映了核酶可以以酶的方式起作用的能力。这样,单一的核酶分子可以切割靶RNA的很多分子。此外,核酶是典型的高度特异性的抑制剂,其抑制的特异性不仅仅依赖于结合的碱基配对机制,也依赖于分子抑制其结合的RNA表达的机制。即,抑制是通过切割RNA靶来引起的,并且特异性是通过切割的靶RNA的切割率占切割的非靶RNA中的切割率的比率来确定。这一切割机制依赖于涉及碱基配对的另外的因子。这样,核酶的特异性作用高于结合于同一个RNA位点的反义寡聚核苷酸。
具有酶活的核酶RNA分子可以形成锤头基元,但是也可以形成发夹,肝炎δ病毒,I类内含子或者RnaseP样的RNA(与RNA的引导序列有关)基元。这样的锤头基元的例子在Rossi(1992)Aids Research and Human Retroviruses 8183中有说明;发夹基元在Hampel(1989)Biochemistry 284929,和Hampel(1990)Nuc.Acids Res.18299中有说明;肝炎δ病毒基元在Perrotta(1992)Biochemistry3116中有说明;RNaseP基元在Guerrier-Takada(1983)Cell 35849中有说明;并且I类内含子在Cech U.S.Pat.No.4,987,071中有说明。列举这些特异基元的目的不是在于对此进行限制;技术熟练人员可以认识到本发明的酶RNA分子具有与一个或者多个靶基因RNA区域互补的特异性底物结合位点,并且在底物结合位点中或者周围具有赋予该分子的RNA切割活性的核苷酸序列。
RNA干涉(RNAi)一方面,发明提供包括发明的磷脂酶序列的RNA抑制分子,叫做“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。一方面,RNAi是长度为大约15,16,17,18,19,20,21,22,23,24,25或者更长的双螺旋核苷酸。虽然发明并不受限于任何特别的作用机理,但是RNAi可以进入细胞,并且造成相似或相同序列的单链RNA(ssRNA),包括内源性mRNA的降解。当细胞暴露于双链RNA(dsANA)时,来自同源基因的mRNA被选择性地被降解,该过程叫做RNA干涉(RNAi)。RNAi背后的可能的基本机理是与特异的基因序列配对的双链RNA(dsANA)断裂形成短片段,叫做短干扰RNA,这些短片段可以触发与其序列配对的mRNA的降解。一方面,发明的RNAi在基因沉默治疗中使用,见,例如Shuey(2002)Drug Discov.Today 71040-1046。一方面,发明提供使用发明的RNAi选择性降解RNA的方法。该方法可以在体外,离体或在体内进行。一方面,发明的RNAi分子可以用于在细胞,器官或动物内产生功能缺失的突变。产生和使用RNAi分子选择性降解RNA的方法在本领域众所周知,见,例如美国专利号6,506,559;6,511,824;6,515,109;6,489,127。
核酸修饰本发明提供产生发明的核酸的变异体的方法,例如,那些编码磷脂酶的核酸。这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷脂酶相比具有改变的或不同活性或者改变的或不同稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用,例如,产生基因/信息表达,信息翻译或者信息稳定性的变异。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后再插入细胞中而加以改变。
本发明的核酸可以通过任何方法改变。例如,无规则或随机方法,或者,非随机方法,或者“定向进化”方法。
基因的随机突变的方法在技术上众所周知,见,例如,美国专利号5,830,696。例如,诱变剂可以用于随机突变基因。诱变剂包括,例如,紫外线或者γ-辐射,或者化学诱变剂,例如,丝裂霉素,亚硝酸,光致活性补骨脂素,它们单独使用或组合使用,诱导可以通过重组修复的可修复DNA断裂。别的化学诱变剂包括,例如,重亚硫酸钠,亚硝酸,羟胺,肼或者甲酸。别的诱变剂是核苷酸前体的类似物,例如,亚硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶氮蒽。这些试剂可以在PCR反应时代替核苷酸前体加入,从而把序列变异。嵌入试剂例如原黄素,吖啶黄,阿的平等等也可以使用。
任何分子生物学技术都可以使用,例如,随机PCR诱变,见,例如,Rice(1992)Proc.Natl.Acad.Sci.USA 895467-5471;或者组合多重盒式诱变,见,例如Crameri(1995)Biotechniques 18194-196。做为选择,核酸,例如,基因,可以在随机分裂后重新装配,见,例如,美国专利号6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514;5,811,238;5,605,793。可选择的方面,可以通过错误倾向PCR,重排,寡核苷酸-定向的诱变,装配PCR,有性PCR诱变,体外诱变,盒式诱变,回归整体诱变,指数整体诱变,位点专一诱变,基因重装配,基因位点饱和诱变(GSSW),合成的连接重装配(SLR),重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板诱变,缺口双螺旋诱变,点错配修复诱变,修复缺失宿主株变异,化学诱变,放射产生的诱变,缺失诱变,限制选择诱变,限制纯化诱变,人造基因合成,整体诱变,嵌合核酸多聚体产生,和/或这些方法和别的方法的组合导入修饰,添加或缺失。
以下出版物描述了多种可以与发明的方法结合的回归重组程序和/或方法Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 41-4,Ness(1999)Nature Biotechnology 17893-896,Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17793-797,65 Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology 3284-290,Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA familyshuffling”Nature Biotechnology 17259-264,Crameri(1998)“DNA shuffling of afamily of genes from diverse species accelerates directed evolution”Nature391288-291,Crameri(1997)“Molecular evolution of an arsenate detoxificationpathway by DNA shuffling,”Nature Biotechnology 15436-438,Zhang(1997)“Directed evolution of an effective fucosidase from a.galactosidase by DNA shufflingand screening”Proc.Natl.Acad.Sci.USA 944504-4509,Patten et al.(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion inBiotechnology 8724-733,Crameri et al.(1996)“Construction and evolution ofantibody-phage libraries by DNA shuffling”Nature Medicine 2100-103,Crameri et ai.(1996)“Improved green fluorescent protein by molecular evolution using DNAshuffling”Nature Biotechnology 14315-319,Gates et al.(1996)“Affinity selectiveisolation of ligands from peptide libraries through display on a lac repressor ′headpiecedimer″,Journal of Molecular Biology 255373-3 86,Stemmer(1996)“Sexual PCRand Assembly PCR”InThe Encyclopedia of Molecular Biology.VCH Publishers,NewYork.pp.447-457,Crameri and Stemmer(1995)“Combinatorial multiple cassettemutagenesis creates all the permutations of mutant and wildtype cassettes”Bio Techniques 18194-195,Stemmer et al.(1995)“Single-step assembly of a geneand entire plasmid form large numbers of oligodeoxyobonucleotides”Gene,16449-53,Stemmor(1995)“The Evolution of Molecular Computation”Science 2701510,Stemmer(1995)“Searching Sequence Space”Bio/Technology 13549-553;Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370389-391,and Stemmer(1994)“DNA shuffling by random fragmentation and reassemblyInvitro recombination for molecular evolution.”Proc.Natl.Acad.Sci.USA9110747-10751.
产生多样性的诱变方法包括,例如定向诱变(Ling et al.(1997)“Approashesto DNA mutagenesisan overview”Anal Biochem.254(2)157-178;Dale et al.(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioatemethod”Methods Mol.Biol.57369-374,Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19423-462,Botstein & Shortle(1985)“Strategies and applications of invitro mutagenesis″Science 2291193-1201,Carter(1986)“Site-directed mutagenesis″Biochem.J.2371-7;and Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”in Nucleic Acids & Molecular Biology(Eckstein,F.and Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含尿嘧啶的模板进行诱变(kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”,Proc.Natl.Acad.Sci.USA 82488-492.Kunkel et al.(1987)“Rapid and efficient site-specificmutagenesis without phenotypic selection”Methods in Enzymol.154,367-382,andBass et al.(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242240-245),寡核苷酸定点诱变(Methods in Enzymol.100468-500(1983),Methods in Enzymol.154329-350(1987),Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectorsan efficient andgeneral procedure for the production of point mutations in any DNA fragment”NucleicAcids Res.106487-6500,Zoller & Smith(1983)“Oligonucleotide-directedmutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100468-500,and Zoller & Smith(1987)“Oligonucleotide-directed mutagenesisasimple method using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154329-350);磷硫修饰的DNA诱变(Taylor et al.(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to preparenicked DNA”Nucl.Acids Res.138749-8764,Taylor et al.(1985)“The rapidgeneration of oligonucleotide-directed mutations at high frequency usingphosphorothioate-modified DNA”Nucl.Acids Res.138765-8787(1985);Nakamaye(1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.149679-9698,Sayers et al.(1988)“Y-T Exonucleases in phosphorothioate-basedoligonucleotide-directed mutagenesis”Nucl.Acids Res.16791-802,and Sayers et al.(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reactionwith restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16803-814);使用有缺口的双螺旋DNA进行诱变(Kramer et al.(1984)“Thegapped duplex DNA approach to oligonucleotide-directed mutation construction”Nucl.Asids Res.129441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction of mutations via gapped duplex DNA”154350-367;Kramer et al.(1988)“improved enzymatic in vitro reactions in thegapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.167207;and Fritz et al.(1988)“Oligonucleotide-directedconstruction of mutationsa gapped duplex DNA procedure without enzymaticreactions in vitro”Nucl.Acids Res.166987-6999).
发明的方法中使用的另外方案包括点错配修复(Kramer(1984)“PointMismatch Repair”Cell 38879-887),使用修复缺陷宿主菌株进行诱变(Carter et al.(1985)“Improved oligonucleotide site-directed mutagenesis using M13 vectors”Nucl.Acids Res.134431-4443,和Carter(1987)“Improved oligonucleotide-directedmutagenesis using M13 veotors”Methods in Enzymol.154382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate large deletions”Nucl.Asids Res.145115),选择限制和选择限制和纯化限制(Wells et al.(1986)“Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.K Soc.Lond.A 317415-423),通过全基因合成进行诱变(Nambiar et al.(1984)“Total synthesis and cloning of a gene coding for the ribonuclease S protein”Science 2231299-1301;Sakamar and Khorana(1988)“Total synthesis andexpression of a gene for the α-subunit of bovine rod outer segment guaninenucleotide-binding protein(transducin)”Nucl.Asids Res.146361-6372,Wells et al.(1985)“Cassette mutagenesisan efficient method for generation of multiplemutations at defined sites”Gene 34315-323,和Gnmdstrom et al.(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Asids Res.133305-3316),双链断裂修复(Mandecki(1986),Amold(1993)“Protein engineering for unusual environments”Current Opinion in Biotechnology.4450455.“Oligonucleotides directed double-strand break repair in plasmids ofEscherichia colia method for site-specific mutagenesis”Proc.Natl.Acad.Sci.USA,837177-7181)。以上许多方法的另外细节可以在Methods in Enzymology Volume154中找到,此书也描述了针对不同诱变方法的故障检测问题的有用控制。
也参见Stemmer的美国专利5,605,793(Feb.25,1997),“Methods for In VitroRecombination;”Stemmer等人的美国专利5,811,238(Sep.22,1998)“Methods forGenerating Polynucleotides having Desired Characteristics by Iterative Selection andRecombination;”Stemmer等人的美国专利5,830,721(Nov.3,1998),“DNAMutagenesis by Random Fragmentation and Reassembly;”Stemmer等人的美国专利5,834,252(Nov.10,1998)“End-Complementary Polymerase Reaction;”Minshull等人的美国专利5,837,458(Nov.17,1998),“Methods and Compositions for Cellularand Metabolic Engineering;”WO 95/22625,Stemmer和Cramen,“Mutagenesis byRandom Fragmentation and Reassembly;”Stemmer和Lipschutz的WO 96/33207“End Complementary Polymerase Chain Reaction;”Stemmer和Crameri的WO97/20078“Methods for Generating Polynucleotides having Desired Characteristics byIterative Selection and Recombination;”Mmshull和Stemmor的WO 97/35966,“Methods and Compositions for Cellular and Metabolic Engineering;”Punnonen等人的WO 99/41402“Targeting of Genetic Vaccine Vectors;”Punnonen等人的WO 99/41383“Antigen Library Immunization;”Punnonen等人的WO 99/41369“GeneticVaccine Vector Engineering;”Punnonen等人的WO 99/41368“Optimization ofImmunomodulatorv Properties of Genetic Vaccines;”Stemmer和Crameri的EP 752008“DNA Mutagenesis by Random Fragmentation and Reassembly;”Stemmer的EP0932670“Evolving Cellular DNA Uptake by Recursive Sequence Recombination;”Stemmer等人的WO 99/23107,“Modification of Virus Tropism and Host Range byViral Genome Shuffling;”Apt等人的WO 99/21979,“Human Papillomavirus Vectors;”del Cardayre等人的WO 98/31837“Evolution of Whole Cells and Organisms byRecursive Sequence Recombination;”Patten和Stemmer的WO 98/27230“Methodsand Compositions for Polypeptide Engineering,”Stemmer等人的WO 98/27230,“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling andSelection,”WO 00/00632,“Methods for Generating Highly Diverse Libraries,”WO00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide SequenceBanks and Resulting Sequences,”Arnold等人的WO 98/42832,“Recombination ofpolynucleotide Sequences Using Random or Defined Primers,”Arnold等人的WO99/29902,“Method for Creating Polynucleotide and Polypeptide Sequences,”Vind的WO 98/41653,“An in Vitro Method for Construction of a DNA Library,”Borchert等人的WO 98/41622,“Method for constructing a Library Using DNA Shuffling,”和Pati和Zarling的WO 98/42727,“Sequence Alterations using HomologousRecombination.”某些美国申请提供了关于多种不同产生方法的另外细节,包括Patten等人的“SHUFFLING OF CODON ALTEAED GENES”,归档于1999年9月28日,(U.S.Ser.No.09/407,800),del Cardayre等人的“EVOLUTION OF WHOLE CELLS ANDORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,归档于1998年7月15日(U.S.Ser.No.09/166,188)和1999年7月15日(U.S.Ser.No 09/354,922);Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACIDRECOMBINATION”,归档于1999年9月28日(U.S.Ser.No.09/408,392)和Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,归档于2000年1月18日(PCT/US00/01203);Welch等人的“USE OFCODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETICSHUFFLING”,归档于1999年9月28日(U.S.Ser.No.09/408,393);Selifonov等人的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDS& POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,归档于2000年1月18日(PCT/US00/01202)和,例如,Selifonov等人的“METHODS FOR MAKINGCHARACTER STRINGS,POLYNUCLEOTIDS & POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”,归档于2000年7月18日(U.S.Ser.No.09/618,579),Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,归档于2000年1月18日(PCT/US00/01138);Affholter的“SINGLE-STRANDED NUCLEIC ACIDTEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENTISOLATION”,归档于2000年9月6日(U.S.Ser.NO.09/656,549)。
非随机的,或者“定向进化”的方法包括,例如,饱和诱变(GSSM),合成的连接重组装(SLR),或者这些方法的组合用于修饰发明的核酸,产生具有新的或者性质改变(例如,在高的酸性或碱性,高温,等等条件下具有活性)的磷脂酶。修饰的核酸编码的多肽可以在检测磷脂酶前筛查其活性或者别的活性。可以使用任何检测的形式或者方案。例如,使用毛细管阵列平台,见,例如,美国专利6,280,926;5,939,250。
饱和诱变,或者GSSM发明的一个方面,非随机的基因修饰,“定向进化过程”用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点-饱和诱变”,“位点饱和诱变”,“饱和诱变”或者简单地为“GSSM”。饱和诱变可以与别的诱变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSM包括提供模板多核苷酸和多数的寡核苷酸,其中每种寡核苷酸包括一个与模板多核苷酸同源的序列,因此靶向模板多核苷酸的特异序列,每种寡核苷酸包括一个同源基因的变异体的序列;通过使用寡核苷酸复制模板多核苷酸产生包括非随机序列变异体的子代多核苷酸,因此产生包括同源基因序列变异体的多核苷酸。
一方面,为了产生一套子代多肽,其中在每个氨基酸位置都是全范围的单氨基酸取代,例如酶活性位点或者配基结合位点中的氨基酸残基被靶向修饰,将含有简并N,N,G/T序列的密码子引物用于往多核苷酸中引入点突变。这些寡核苷酸可以包括连续的第一同源序列,简并N,N,G/T序列,和任选地,第二同源序列。从使用这些寡核苷酸得到的下游的子代翻译产物包括沿着多肽的每个氨基酸位点的所有可能的氨基酸变异,因为N,N,G/T序列的简并性包括所有20种氨基酸的密码子。一方面,一个这样的简并寡核苷酸(包括,例如,一个简并N,N,G/T盒)用于使母本多核苷酸模板中的每个最初密码子形成全范围的密码子取代。另一方面,为了使母本多核苷酸模板中的至少两个最初密码子形成全范围的密码子取代,使用至少两个简并盒—或者在相同的寡核苷酸中,或者在不相同的寡核苷酸中。例如,一个寡核苷酸中可以含有多于一个N,N,G/T序列,可以在多于一个位点引入氨基酸突变。此N,N,G/T序列的大多数可以直接相邻,或者被一个或多于一个的另外核苷酸序列分隔开。另一方面,适用于引入添加或者缺失的寡核苷酸可以单独使用或者与含有N,N,G/T序列的密码子合并使用,引入氨基酸添加,缺失,和/或取代的任何组合或者排列组合。
一方面,使用含有相邻的N,N,G/T三联体,即简并的(N,N,G/T)n序列的寡核苷酸,可以同时诱变两个或者更多相邻的氨基酸位点。另一方面,使用具有比N,N,G/T序列简并性小的简并盒。例如,理想的是在一些例子中(例如,在寡核苷酸中)使用包括仅仅一个N的简并的三联体序列,其中所述N可以在三联体的第一,第二或者第三位置上。包含任何别的碱基的任何组合和排列组合可以在三联体的剩下两个位置上使用。可选择地,理想的是在一些例子中(例如,在寡核苷酸中)使用简并的N,N,N三联体序列。
一方面,简并的三联体(例如,N,N,G/T三联体)的使用可以使得系统的和容易的在多肽中的每个氨基酸位置上产生全范围的可能的天然氨基酸(全部20种氨基酸)(在可选择的方面,该方法也包括在每个氨基酸残基,或者密码子,位置上产生少于所有可能的取代)。例如,对于100个氨基酸的多肽,可以产生2000个不同的种类(即,每个位置20种可能的氨基酸×100个氨基酸位置)。通过使用含有简并的N,N,G/T三联体的寡核苷酸或一套寡核苷酸,32个单独的序列可以编码所有20种可能的天然氨基酸。因此,在其中,母本多核苷酸序列被使用至少一个这样的寡核苷酸饱和诱变的反应容器中,可以产生编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点诱变中使用非简并的寡核苷酸可以导致每个反应容器中仅仅有一种多肽产物。非简并寡核苷酸可以任选地与公开的简并引物组合使用;例如,非简并寡核苷酸可以用于在一个处理中的多核苷酸中产生特异的点突变。这就提供了一种产生特异的沉默点突变,可以导致相应的氨基酸改变的点突变,和导致终止密码子产生和相应的多肽片段表达的点突变的方法。
一方面,每个饱和诱变反应容器中都含有编码至少20种子代多肽(例如,磷脂酶)分子的多核苷酸,这样所有20种天然氨基酸相应地在母本多肽的经诱变密码子位置上的特异氨基酸位置上呈现出来(别的方面使用少于所有20种天然氨基酸的组合)。每个饱和诱变反应容器所产生的32重简并子代多肽可以进行克隆扩增(例如,使用,例如表达载体克隆到合适的宿主,例如大肠杆菌(E.coli)宿主中)和表达筛选。当单独的子代多肽通过筛选鉴定具有有利的特性改变时(当与母本多肽比较,例如在碱性或酸性条件下具有增加的磷脂酶活性时),可以相应测序鉴定其中含有的有利的氨基酸取代。
一方面,如在此公开的,使用饱和诱变诱变母本多肽中的每个氨基酸位置,有利的氨基酸改变可以在多于一个氨基酸位置上得到鉴定。可以产生含有全部或部分这些有利的氨基酸取代的组合的一个或多个新的子代分子。例如,假如一个多肽中的每3个氨基酸位置中都可以鉴定到2个特异的有利氨基酸改变,在每个位置,排列包括3个可能(最初的氨基酸没有改变,和两个有利改变中的每一个),并且有三个位置。因此,总的可能性就有3×3×3或者27种,包括以前检测到的7种可能性-6种是点突变(即,三个位置中的每一个都有两种可能性)和在任何位置都没有改变。
另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方法一起使用,例如,合成的连接重组装(见下文),重排,嵌合化,重组和别的诱变过程和诱变剂。本发明提供以重复方式使用任何诱变过程,包括饱和诱变。
合成的连接重组装(SLR)发明提供叫做“合成的连接重组装”,或者简单地为“SLR”,的非随机基因修饰系统产生具有新的或者改变的特性的磷脂酶,这是一种“定向的进化过程”。SLR是非随机的把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同,因为核酸构件不是改组的,串联的或者随机地嵌合的,而是非随机的组装,见,例如,美国专利申请系列号(USSN)09/332,835,题目是”Synthetic LigationReassembty in Directed Evolution”,于1999年6月14日归档(“USSN 09/332,835”)。一方面,SLR包括以下步骤(a)提供模板多核苷酸,其中模板多核苷酸包括编码同源基因的序列;(b)提供多个构件多核苷酸,其中设计的构件多核苷酸用于与模板多核苷酸以一个预定序列进行交叉重组装,并且构件多核苷酸包括一个是同源基因的变异体的序列,和一个与模板多核苷酸两侧的变异序列同源的序列;(c)构件多核苷酸与模板多核苷酸合并,这样构件多核苷酸与模板多核苷酸交叉重组装,产生包括同源基因序列变异体的多核苷酸。
SLR并不依赖于将要重排的多核苷酸之间的高水平同源性的存在。因此,此方法可以用于非随机产生包括多于10100种不同的嵌合体的子代分子库(或套)。SLR可以用于产生包括多于101000种不同子代嵌合体的库。因此,本发明的方面包括产生一套最终嵌合核酸分子的非随机方法,其掠过设计所选择的全面组装顺序。此方法包括步骤设计产生众多具有可用的相互兼容连接末端的特异核酸构件,把这些核酸构件组装,这样得到设计的全面组装顺序。
假如构件可以以预确定的顺序偶联起来,那么核酸构件的相互兼容连接末端进行组装被认为对于这种类型的顺序组装是“可用的”。因此,核酸构件偶联的全面组装顺序是由连接末端的设计决定的。假如使用步骤多于一步的话,那么核酸构件偶联的全面组装顺序也由组装步骤的相继顺序所确定。一方面,退火的构件部分用酶处理,例如连接酶(例如,T4 DNA连接酶),得到构件部分的共价连接。
一方面,寡核苷酸构件是通过分析的序列模板进行设计的,序列模板作为产生最终嵌合多核苷酸核酸子代的基础。这些母本寡核苷酸模板作为设计待诱变的例如,嵌合的或改组的核酸构件的序列信息来源。
本方法的一方面,为了选择一个或多个分界点,把大多数母本核酸模板的序列进行比对。分界点可以位于同源区域,并且包括一个或多个核苷酸。这些分界点优选的由至少两个祖代模板所共同所有。因此,为了母本多核苷酸重排,分界点可以用于描绘产生的寡核苷酸构件的界限。在祖代分子中确定和选择的分界点作为最终嵌合子代分子组装的潜在的的嵌合点。分界点可以是由至少两个母本多核苷酸序列具有的同源区域(包括至少一个同源核苷酸碱基)。做为选择,分界点可以是由至少一半的母本多核苷酸序列具有的同源区域,或者分界点可以是由至少三份之二的母本多核苷酸序列具有的同源区域。甚至更优选的适用的分界点是由至少四分之三的母本多核苷酸序列具有的同源区域,或者分界点可以是由几乎全部母本多核苷酸序列具有的同源区域。一方面,分界点是由全部母本多核苷酸序列具有的同源区域。
一方面,为了产生子代嵌合多核苷酸的完备文库,连接重组装过程要深入的进行。换句话说,所有可能的核苷酸构件的顺序组合都在最终的嵌合核酸分子组中表现出来。同时,在另一个具体例子中,每个组合中的组装顺序(即,每个最终嵌合核酸的5’到3’序列中每个构件的组装顺序)都如以上描述的(或者非随机的)设计。因为本发明的非随机特性,所有不需要的副产物的可能性大大降低。
另一方面,连接重组装方法是系统地进行的。例如,为了产生子代分子的系统性划分的文库,划分的区域可以系统地,例如逐个地筛选出来,可以实施此方法。换句话说,通过选择性的和明智的使用特异核酸构件,同时选择性的和明智的使用后继步骤的组装反应,本发明提供可以在几个反应容器的每一个中都得到子代产物的特异组的设计。这就使得可以进行系统的检测和筛选程序。因此,这些方法可以使在更小的组中对一个待检测的潜在的非常大数目的子代分子进行系统检测。因为可以以高度灵活,却是完备和系统的方式,特别是当祖先分子中具有低水平的同源性时进行嵌合,所以这些方法提供了包括大数目的子代分子的文库(或者组)的产生。因为本连接重组装发明的非随机特性,所以产生的子代分子,优选包括具有由设计所选择的全面组装顺序的最终嵌合核酸分子文库。饱和诱变和完善的定点进化方法也可以用于产生不同的子代分子种类。关于分界点的选择,核酸构件的大小和数目,偶联的大小和设计,本发明提供了选择和控制的自由,这一点是应该予以理解的。而且,应该理解的是,对于本发明的可操作性来说,分子内同源性的要求并不高。实际上,分界点甚至可以选择在很少或没有分子内同源性的区域。例如,因为密码子的摆动,即,密码子的简并性,核苷酸取代可以引入核酸构件中而不会改变在相应的祖代模板中编码的氨基酸。作为选择,可以改变密码子,这样最初的氨基酸被改变。为了增加分子内同源分界点的发生率,从而增加构件中可以得到的偶联的数目,本发明提供这样的可以引入核酸构件中的取代,这反过来会产生更大数目的子代嵌合分子。
另一方面,构件产生的步骤的合成特性允许核苷酸(例如,一个或者多个核苷酸,可以是,例如密码子或内含子或者调控序列)的设计和引入,其以后可以被任选在体外过程(例如,通过诱变)或者体内过程(例如,通过利用宿主微生物的基因剪切能力)中除去。在许多情况中,应该理解的是,除了产生适用的分界点的潜在好处之外,由于许多别的原因,这些核苷酸的引入也是理想的。
一方面,核酸构件用于引入内含子。因此,根据在此描述的方法,功能性的内含子被引入进生产的人造基因中。人工引入的内含子在宿主细胞中可以功能性的用于基因剪切中,以天然产生的内含子作用功能性的方式进行基因剪切。
优化的定向进化系统发明提供非随机的基因修饰系统,叫做“优化的定向进化系统”,产生具有新的或者改变的特性的磷脂酶。优化的定向进化针对的是使用重复轮次的还原性重配、重组和选择这个重复循环,从而通过重组进行核酸的定向分子进化。优化的定向进化可以产生大量的进化的嵌合序列,其中产生的群体大大富含具有预确定数目的交换事件的序列。
交换事件是嵌合序列中的一个点,其中序列中的交换发生于从一个母本变异体到另一个母本变异体。这样的点一般在两个母本连接在一起形成一个单一序列的寡核苷酸的接头处都具有。此方法可以计算寡核苷酸序列的正确浓度,这样最终序列的嵌合总体由于选择数目的交换事件而得到富集。这提供了针对选择具有预确定数目的交换事件的嵌合变异体的更大控制。
另外,与别的系统相比,此方法提供了开发巨大数目的可能蛋白变异体空间的合宜方法。以前,假如嵌合分子产生,例如,在反应过程中产生了1013个嵌合分子,检测这样高数目的特异活性的嵌合变异体是十分困难的。而且,子代群体中的一大部分将具有非常高数目的交换事件,这导致蛋白质具有增加水平的特异活性的可能性降低。通过使用这些方法,嵌合分子群体可以富集具有特定数目交换事件的变异体。因此,虽然在反应过程中可以产生1013嵌合分子,但是选择用于进一步分析的每个分子最可能,例如,仅仅有三个交换事件。因为得到的子代群体可以倾向于具有预定数目的交换事件,所以嵌合分子之间的函数变量的范围减小。当计算从最初母本多核苷酸得到的可能影响特定性状的寡核苷酸时,这提供了更易控制的变量数目。
产生嵌合子代多核苷酸的一个方法是产生每个母本序列的片段或部分的对应寡核苷酸。每个寡核苷酸优选的包括独特的重叠区域,这样当寡核苷酸混合在一起,得到每个寡核苷酸片段以正确顺序组装的新的变异体。在USSN 09/332,835中可以发现另外的信息。每个母本变异体产生的寡核苷酸的数目与最终产生的嵌合分子中得到的交换总数目之间具有相关性。例如,为了发现具有,例如在高温下具有更大活性的嵌合变异体,三个母本核苷酸序列变异体可能经过连接反应。作为一个例子,对应于每个母本变异体的每部分产生一组50个寡核苷酸序列。相应地,在连接重组装过程中,在每个嵌合序列中可以有高达50个交换事件。每个产生的嵌合多核苷酸以改变的顺序含有从每个母本变异体得到的寡核苷酸的概率是很低的。假如每个寡核苷酸片段在连接反应中以相同摩尔数存在,那么可能在相同母本多核苷酸得到的多个位点寡核苷酸中将彼此紧靠的相邻,从而不会导致交换事件。假如在本例子中,从每个母本得到的每个寡核苷酸的浓度在连接步骤中保持恒定,那么有1/3的机会(假设为3个母本)从相同母本变异体得到的寡核苷酸将在嵌合序列中连接,而且并不产生交换。
相应地,在给定母本变异体的组数目,对应于每个变异体的寡核苷酸的数目,和连接反应的每一步骤中每个变异体的浓度的情况下,确定概率浓度函数(PDF),可以用于预测连接反应的每一步骤中可能发生的交换事件的群体。以下描述确定PDF的统计学和数学。通过利用这些方法,人们可以计算这样的概率浓度函数,从而富集在特定连接反应中得到的预确定交换事件数目的嵌合子代群体。而且,交换事件的靶数目可以预确定,然后对系统进行编程,计算连接反应的每一步骤中每个母本寡核苷酸的起始数量,得到关于预确定数目的交换事件的概率浓度函数。这些方法针对的是使用还原性重配,重组和选择这个重复循环,使得可以通过重组进行编码多肽的核酸的定向分子进化。此系统可以产生大数量的进化的嵌合序列,其中产生的群体大大富集了具有预确定数目的交换事件的序列。交换事件是嵌合序列中的点,其中序列的变换发生于从一个母本变异体到另一个母本样板田。这样的点一般在两个母本连接形成一个单一序列的寡核苷酸连接处。该方法可以计算寡核苷酸序列的正确浓度,这样附件所选定数目的交换事件的序列的最终嵌合群体。这提供了对选择具有预确定数目的交换事件的嵌合变异体的更多控制。
另外,与别的系统相比,此方法提供了开发巨大数目的可能蛋白变异体空间的合宜方法。通过使用在此描述的方法,嵌合分子群体可以富集那些具有特定数目的交换事件的变异体。因此,虽然人们仍然可以在反应过程中产生1013嵌合分子,选择的进行进一步分析的每个分子最可以具有,例如,只有三个交换事件。因为得到的子代群体倾向于具有预确定交换事件,所有嵌合分子之间的函数变量的范围减小。当计算从最初母本多核苷酸得到的可能影响特定性状的寡核苷酸时,这提供了更易控制的变量数目。
一方面,方法通过产生对应于每个母本片段或部分的寡核苷酸,产生了嵌合子代核苷酸序列。每个寡核苷酸优选的包括独特的重叠区域,这样当寡核苷酸混合在一起,得到每个寡核苷酸片段以正确顺序组装的新的变异体。也见USSN09/332,835。
每个母本变异体产生的寡核苷酸的数目与最终产生的嵌合分子中得到的交换总数目之间具有相关性。例如,为了发现具有,例如在高温下具有更大活性的嵌合变异体,三个母本核苷酸序列变异体可能经过连接反应。一个例子,对应于每个母本变异体的每部分产生一组50个寡核苷酸序列。相应的,在连接重组装过程中,在每个嵌合序列中可以有高达50个交换事件。每个产生的嵌合多核苷酸以改变的顺序含有从每个母本变异体得到的寡核苷酸的概率是很低的。假如每个寡核苷酸片段在连接反应中以相同摩尔数存在,那么可能在相同母本多核苷酸得到的多个位点寡核苷酸中将彼此紧靠的相邻,从而不会导致交换事件。假如在本例子中,从每个母本得到的每个寡核苷酸的浓度在连接步骤中保持恒定,那么有1/3的机会(假设为3个母本)从相同母本变异体得到的寡核苷酸将在嵌合序列中连接,而且并不产生交换。
相应地,确定概率浓度函数(PDF),预测连接反应的每一步骤中可能发生的交换事件群体,是在给定母本变异体的组数、对应于每个变异体的寡核苷酸数目、和连接反应的每一步骤中每个变异体的浓度的条件下。以下描述确定PDF的统计学和数学。通过利用这些方法,人们可以计算这样的概率浓度函数,从而富集在特定连接反应中得到的预确定交换事件数目的嵌合子代群体。而且,交换事件的靶数目可以预确定,然后对系统进行编程,计算连接反应的每一步骤中每个母本寡核苷酸的起始数量,得到关于预确定数目的交换事件的概率浓度函数。
确定交换事件发明的具体例子包括系统和软件,可以接受所需交换概率浓度函数(PDF),要重组装的母本基因的数目和重组装中片段的数目,作为输入。此程序的输出是“片段PDF”,可以用于确定产生重装配基因的配方和那些基因的预计交换PDF。优选地,在此描述的处理用MATLAB_(Mathworks,Natick,masschusetts),一种程序语言和技术计算发展环境进行。
重复过程在本发明的实践过程中,这些过程可以反复重复。例如,对改变的磷脂酶表型的核酸(或者,核酸)进行鉴定,再分离,再修饰,活性再检测。此过程可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢途径可以工程进细胞中,包括磷脂酶活性。
相似地,假如确定特定的寡核苷酸对于所需性状没有影响(例如,新的磷脂酶表型),那么可以通过合成包括待除去序列的更大母本寡核苷酸,把它作为变量除去。因为序列与更大序列合并阻止了交换事件,所以在子代多核苷酸中此序列没有任何变化。此确定哪种寡核苷酸与所需性状最为相关,哪种寡核苷酸与所需性状无关的反复过程,可以允许对所有可能蛋白质变异体的有效开发,这些变异体可能个年个特定性状或活性。
体内改组在提供发明的多肽变异体,例如,抗体,磷脂酶,和类似物的本发明方法中使用分子的体内改组。体内改组可以利用正常性状的细胞,得到重组的多聚体。虽然体内重组提供了获得分子多样性的主要天然途径,但是遗传重组仍然是相对复杂的过程,涉及1)同源性的识别;2)导致产生重组交叉的链切割,链侵入,和代谢步骤,和最后3)交叉转变成为分离的重组分子。交叉的形成要求同源序列的识别。
一方面,发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂交多核苷酸的方法。发明可以用于通过引入具有至少部分序列同源性的一个区域的至少第一多核苷酸和第二多核苷酸于合适的宿主细胞中而产生杂交多核苷酸。部分序列同源性区域促进导致产生杂交多核苷酸的序列识别的过程。正如在此使用的,术语“杂交多核苷酸”是任何由本发明的方法产生的核苷酸序列,含有从至少两个最初多核苷酸序列得到的序列。这样的杂交多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外,这样的杂交多核苷酸可以由利用重复序列,改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。
产生序列变异体发明也提供使用发明的核酸和多肽产生发明的核酸和磷脂酶序列变异体,或者分离的磷脂酶,例如,磷脂酶的序列变异体的方法。一方面,发明提供发明的磷脂酶基因的变异体,变异体可以使用任何方法改变,包括,例如随机方法,或者非随机方法或者“定向进化”方法,如以上描述。
分离的变异体可以是天然发生的。变异体也可以体外产生。变异体可以使用基因工程技术,例如定点诱变,随机化学诱变,核酸外切酶III缺失程序和标准克隆技术产生。做为选择,这样的变异体,片段,类似物或衍生物可以使用化学合成或者修饰程序产生。产生变异体的别的方法也被那些技术熟练人员所熟悉。这些方法包括修饰天然分离得到的核酸序列,产生编码具有特性的多肽的核酸的程序,多肽的特性增加它们在工业或实验室应用中的价值。在这些程序中,产生并且定性许多与天然分离得到的序列相比具有一个或多个核苷酸差异的变异体序列。这些核苷酸差异可以产生与天然分离物得到的核酸编码的多肽相比的氨基酸变化。
例如,变异体可以使用错误倾向PCR产生。在错误倾向PCR中,PCR在DNA聚合酶复制忠实度度低的情况下进行,这样在PCR产物的全长中获得高比率的点突变。错误倾向PCR在,例如Leung,D.W.,等,技术,111-15,1989)和Caldwell,R.C.& Joyce G.F.,PCR方法应用,228-33,1992中有描述。简要而言,在这些程序中,为了在全长的PCR产物中得到高比率的变突变,待诱变的核酸与PCR引物,反应缓冲液,MgCl2,MnCl2,Taq聚合酶和合适浓度的dNTP混合。例如,反应使用20毫微微摩尔(fmoles)待诱变的核酸,每种PCR引物30皮摩尔,反应缓冲液包括50mM KCl,10mM Tris HCl(PH8.3)和0.01%明胶,7mM MgCl2,0.5mMMnCl2,5单位的Taq聚合酶,0.2mM dGTP,0.2mM dATP,1mM dCTP和1mM dTTP。PCR进行30个循环,每个循环为94℃1分钟,45℃1分钟,72℃1分钟。然而,这些参数可以适当的改变。诱变发核酸克隆进入合适的载体中,评估诱变的核酸编码的多肽的活性。
变异体也可以使用寡核苷酸定向诱变产生,在感兴趣的任何和克隆DNA中得到位点专一的变异。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science24153-57中有描述。简要地,在这些程序中,合成待引入的克隆DNA中多数具有一个或多个突变的双链寡核苷酸,并且插入待诱变的克隆DNA中。回收含有经诱变的DNA的克隆,评定经诱变的DNA编码的多肽的活性。
产生变异体的另一个方法是组装PCR。组装PCR涉及从小DNA片段中得到的PCR产物的组装。在相同管中平行发生了许多不同的PCR反应,一个反应的产物是另一个反应产物的引物。组装PCR在,例如美国专利5,965,408中描述。
另一种产生变异体的方法是有性PCR诱变。在有性PCR诱变中,在体外,强迫同源重组在不同的,但是高度相关的DNA序列之间发生,是基于序列同源性的DNA分子随机断裂的结果,然后通过PCR反应中引物延伸从而固定交换。有性PCR诱变在,例如,Stenlnier(1994)Proc.Natl.Acad.Sci.USA 9110747-10751中描述。简要地,在此程序中,待重组的多数核酸都用DNA酶消化,产生平均大小为50-200个核苷酸的片段。纯化所需平均大小的片段,再悬浮于PCR混合物中。在促进核酸片段之间重组的条件下进行PCR。例如,通过把纯化的片段以10-30ng/μl的浓度再悬浮于每种dNTP 0.2mM,2.2mM MgCl2,50mM KCl,10mMTris HCl,PH 9.0和0.1%Triton X-100的溶液中进行PCR。以反应混合物的100∶1加入2.5单位Taq聚合酶,使用以下方案进行PCR94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),72℃5分钟。然而,这些参数可以适当的改变。一些方面,寡核苷酸可以包括在PCR反应中。另一方面,DNA聚合酶Klenow片段可以在第一组PCR反应中使用,Taq聚合酶可以在随后组的PCR反应中使用。分离重组序列,评估重组序列编码的多肽的活性。
变异体也可以通过体内诱变产生。在一些具体例子中,序列中感兴趣的随机突变通过在细菌株,例如一个或多个DNA修复途径中具有突变的大肠杆菌中增殖感兴趣序列而产生。这样的“突变”菌株具有比野生型母本高的随机突变率。DNA在这些菌株中的一种中增殖将最终产生DNA中的随机突变。适合于体内诱变的突变菌株在,例如PCT
发明者S·格拉马蒂科瓦, G·黑尔伍德, D·拉姆, N·巴顿 申请人:戴弗萨公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1