鉴定新基因的方法

文档序号:438865阅读:1725来源:国知局

专利名称::鉴定新基因的方法
技术领域
:本发明涉及鉴定与已知基因特别是苏云金芽孢杆菌CSa"7/w^mn'wg/eww、,份)Cry基因同源的新基因的方法和组合物。
背景技术
:虫害是全球农作物损失的主要因素。例如,玉米食根虫的损害以及棉籽象鼻虫的破坏可在经济上对农业生产者造成破坏。仅玉米根虫造成的虫害相关的农作物损失已达到每年IO亿美元。传统上,应对虫害群体如玉米根虫群体的主要方法是农作物轮种以及应用广谱的合成化学杀虫剂。然而,消费者以及政府管制者日益担忧与合成的化学杀虫剂的生产和使用有关的环境危害。因为有此担忧,管制者已经禁止或者限制使用一些较为危险的杀虫剂。因此,研发传统化学杀虫剂的替代品具有实质利益,其具有较低的污染和环境危害风险,且提供了比广谱化学杀虫剂更强的耙标特异性特征。已知芽孢杆菌属CSa"7/w力微生物的某些种类具有针对广泛范围的虫害的杀虫活性,所述虫害包括鳞翅目(丄印zWoWera)、双翅目era)、鞘翅目(Co/eo;fera)、半翅目(//e脂Wera)以及其他的目。苏云金芽孢杆菌(价)和金龟子芽孢杆菌CS./^/////^)是目前发现的最成功的生物防治剂之一。昆虫的致病性归因于下列菌抹幼虫芽胞杆菌(及/"n^e)、緩病芽孢杆菌(及/e""mo^w)、金龟子芽孢杆菌、球形芽孢杆菌OB.s//zaeWc—、份(Harwook,(1989)B""7/附(PlenumPress),p.306)以及蜡状芽孢杆菌CB.cerew)(国际公布第WO96/10083号)。尽管从芽孢杆菌营养生长阶段中也分离出杀虫蛋白,但杀虫活性看起来集中于伴胞晶体蛋白包涵体中。已经分离并表征了编码这些杀虫蛋白的几个基因(参见例如美国专利5,366,892和5,840,868)。微生物杀虫剂,特别是从芽孢杆菌菌株中获得的那些杀虫剂,作为化学虫害防治的替代产品,在农业中发挥了重要作用。从价菌抹中分离的称为S-内毒素或Cry毒素的杀虫蛋白最初是以无活性的原毒素形式产生的。这些原毒素通过昆虫肠内蛋白酶的作用以蛋白水解的方式转变成有活性的毒素。参阅RukminiW(2000)82:109-116;Oppert(1999)y^c/z./附e"B/oc/zew.户/z;^.42:1-12;和CarrollW(1997)乂/"veWe6rafe尸加/20/ogy70:41-49。毒素的蛋白水解激活可包括从蛋白中除去N和C末端肽,以及蛋白的内部切割。一旦激活,Cry毒素便与昆虫肠内上皮细胞上的受体高亲和性结合,由此,产生细胞膜中的渗漏通道、昆虫肠的溶解和随后由于饥饿和败血症的昆虫死亡。参见,例如Li(799/」A^"w353:815-821。近来,通过用杀虫基因遗传改造农作物产生芽孢杆菌杀虫蛋白,农业科学家已经研发了昆虫抗性提高的农作物。例如,经遗传改造产生Cry毒素的玉米和棉花(参见例如Aronson(2002)Ce〃Mo/.h/eSc/.59(3):417-425;Schnepf"(1998)M/cra&o/.M/.肠/.iev.62(3):775-806)目前已广泛用于美国农业中,为农场主提供了传统昆虫防治方法的环境友好的替代方法。另外,已经研发了经遗传改造含杀虫Cry毒素的马铃薯。这些利用基因工程的成就促使研究人员探求杀虫基因特别是Cry基因。因此,本领域需要有效鉴定新的杀虫基因包括与已知Cry基因同源的基因以及代表Cry基因新家族的基因的方法。发明概述本发明涉及鉴定新基因的方法和组合物。本文公开的方法可快速有效地筛选大量的核香酸序列来鉴定多种有机体中的潜在新基因。本发明鉴定新基因的方法可鉴定与已知基因同源的基因,以及鉴定完全的新基因,包括杀虫基因,所述新基因是目前尚未被鉴定的所关注的基因家族的成员。在本发明的某些方面中,该方法可鉴定与已知的杀虫基因包括例如价Cry毒素基因同源的新杀虫基因。本发明的方法包括系统地设计寡核苷酸引物以及进行来自所关注的有机体的核苷酸材料的第一轮PCR扩增,所述寡核苷酸引物对已知的所关注基因的靶群组(例如杀虫基因)具特异性。第一轮PCR意在扩ii增含有特征序列(signaturesequence)的已知基因和新基因两者。如果在第一轮PCR中检测到PCR产物,则从该有机体获得核酸材料的第二个样品,并用对基因靶群组中的特征序列具特异性的第二套寡核苷酸引物将其进行第二轮PCR。利用琼脂糖凝胶电泳分离第二轮PCR的PCR产物,并将所得的分离的核苷酸克隆至克隆载体,特别是细菌克隆载体。随后将克隆载体转化入感受态的宿主细胞如细菌细胞。使用对靶群组中所有已知基因具特异性的标记的寡核苷酸探针,通过斑点印迹杂交,分析从单个宿主细胞集落中分离的核苷酸材料。本发明方法的斑点印迹分析步骤旨在出于进一步的考虑鉴定并除去靶群组中已知的基因。通过斑点印迹分析未能检测到的在第二轮PCR中扩增的PCR产物含有推断的新基因(如新的杀虫基因)或其片段。这些核酸序列进行进一步的序列分析,以便证实新颖性并测定核苷酸序列。表达推断的新基因并测定重组蛋白以评估生物学活性,如当本发明的方法用于鉴定新杀虫基因时的杀虫活性。本发明的方法还适于自动操作和高通量筛选。本发明的组合物包括含有新基因的分离的新多核苷酸以及其变体和片段,所述新基因包括例如新杀虫基因。也提供了本发明的多核苷酸编码的多肽。本文公开的方法所鉴定的新杀虫基因(如价Cry毒素基因)可用于保护植物免遭害虫特别是虫害以及虫害相关的损害。图1提供了下文详细描述的用于第一和第二轮PCR的寡核苷酸引物和用于斑点印迹分析的寡核苷酸探针的设计方案的示意图。发明的详细描述本发明涉及鉴定新基因特别是新杀虫基因更特别是新份Cry毒素基因的方法和组合物。本文公开的方法可快速有效地筛选大量的核苷酸序列来鉴定与已知基因同源的推断的新基因。如本文所用的,术语"基因耙群组,,指含有同源区的、任何所关注有机体中已知基因的任何集合。在一些实施方案中,"靶群组"含有已知杀虫基因的集合,更特别是已知的份Cry毒素基因群组。通常本发明的方法包括3个不同的步骤,用于鉴定靶群组中的新基因,这3个步骤是第一轮PCR,更具体来说是实时PCR步骤,第二轮PCR步骤以及斑点印迹分析步骤。在具体实施方案中,进行来自所关注有机体的核酸材料的第一轮PCR扩增,意在既扩增含有靶向的特征序列的已知基因和新基因两者。"特征序列"意指同源区,其存在于所关注基因靶群组的所有成员中。如果在第一轮PCR中检测到PCR产物,则从该有机体获得核酸材料的第二样品的第二轮PCR,并进行额外轮的PCR扩增。第二轮PCR意在扩增含有具体的靶向特征序列的已知基因和新基因两者。通常分离第二轮PCR产物,用于进一步的分析。第三步包括进行第二轮PCR中分离的单个PCR产物的斑点印迹分析。用对靶群组中已知基因具特异性的寡核苦酸探针进行斑点印迹分析,因而,出于进一步考虑意图检测并除去已知基因。斑点印迹分析未检测到的第二轮PCR的PCR产物含有推断的新基因(如新杀虫基因)或其片段,并进行进一步的序列分析来证实新颖性。测定推断的新基因的序列,这些核酸分子以及由其编码的蛋白用于生物测定中,以评估生物学活性如杀虫活性。具体来说,鉴定新基因的方法包括系统地设计已知基因靶群组如&杀虫基因靶群组中同源区(即特征序列)的寡核苷酸引物,并在来自所关注有机体的核酸材料的第一轮PCR扩增中使用这些引物。在本发明的某些方面中,所关注有机体是微生物,具体来说是价菌株。如下文更详细描述的,为第一轮PCR扩增设计的引物意图扩增含靶向的特征序列的已知基因和新基因两者。如果在第一轮PCR中检测到PCR产物,则从该有机体获得核酸材料的第二样品,并将其进行第二轮PCR扩增。还设计第二轮PCR所用的寡核苷酸引物,以便扩增含有耙向的特征序列的已知基因和新基因(如杀虫基因)两者。通常设计第二轮PCR所用的寡核苷酸引物,以产生特定长度(如长度为约500碱基对(bp)至约800bp,特别是约600bp至约750bp,更特别是约650bp至约700bp)的PCR产物。通过例如琼脂糖凝月交电泳,分离第二轮PCR中产生的期望长度的PCR产物。因此,第二轮PCR可扩增含有特定特征序列的已知基因和新基因两者,或其片段,并可分离这些核酸分子,用于进一步分析。第二轮扩增的PCR产物,是期望的长度,通常含有已知基因或新基因的片段。将这些核酸片段克隆入克隆载体(如细菌克隆载体)。克隆载体的插入物(即第二轮PCR的PCR产物)含有来自靶群组的已知基因和潜在的新基因,或可能含有其片段,并用于转化感受态的宿主细胞,特别是细菌细胞,如大肠杆菌(五.co/Z)细胞。在本发明的具体方面,从单个宿主细胞(如细菌)集落中分离核苷酸材料(如质粒DNA),并使用对靶群组中所有已知基因具特异性的标记的寡核苷酸探针通过斑点印迹分析进行分析。在具体实施方案中,如下文所述,设计寡核苷酸探针,以便与第二轮扩增中产生的PCR产物的片段互补。用对靶群组中所有已知基因具特异性的寡核苷酸探针的斑点印迹分析,可鉴定含有已知基因(如特定靶群组的已知ACry毒素基因)的核酸分子。出于进一步的考虑,除去含有已知基因的核酸。斑点印迹分析未检测到的核酸含有推断的新基因或其片段,将其进行进一步的序列分析和生物学活性测定。在本发明具体的实施方案中,该方法用于鉴定新杀虫基因,特别是新份Cry毒素基因,因此,进一步分析推断的新杀虫基因的杀虫活性。在本发明的某些方面中,第二轮PCR中产生的PCR产物,如上文所述不能为斑点印迹分析所检测,将其进行测序,并与公共数据库的已知序列进行比较,以评估新颖性。如果序列比较显示PCR产物含有潜在的新基因如新杀虫基因(如新价Cry毒素基因),则使用例如GenomeWalkerUniversal^式剂盒(BectonDickinsonBioscience,Inc.),获一步证实新颖性。在具体的实施方案中,将新基因克隆如表达载体,并测定其编码的蛋白的生物学活性,如新的推断的新杀虫基因的杀虫活性。本发明的方法涉及鉴定新基因,特别是杀虫基因,更特别是价Cry此类方法可用于鉴定与来自任何所关注有机体的已知基因任何群组(即所关注的靶群组)同源的新基因。对新杀虫基因的鉴定进行描述仅仅是示例性的,并非限制。尽管可以鉴定与以前鉴定的Cry基因具有很少的同源性且代表新份杀虫基因家族的基因,但本发明的方法用于鉴定与已知Cry基因同源的新基因。在本发明的一个实施方案中,使用对存在于杀虫基因靶群组的所有成员中的同源区(即特征序列)具特异性的至少一套简并寡核苷酸引物,对从所关注的份菌林中分离的核酸材料进行第一轮PCR,—般为实时PCR。本文所用的"杀虫基因靶群组"指含有同源区的已知杀虫基因的任何集合。对杀虫基因靶群组的成员进行比对,以设计寡核苷酸引物。如上文指出的,存在于杀虫基因靶群组所有成员中的同源区,称为"特征序列"。如下文更详细描述的,杀虫基因靶群组的核苷酸序列中的特征序列是设计用于第一轮和第二轮PCR中的寡核苷酸引物的基础。在本发明的某些方面,靶群组含有对鞘翅目的昆虫具活性的所有已知杀虫Cry基因(即鞘翅目活性Cry基因)。在其他的实施方案中,靶群组含有例如具有针对鳞翅目和鞘翅目昆虫的杀虫活性的所有已知价基因,但不包括对双翅目昆虫有活性的Cry基因。在开始探求新基因时,研究人员选择并限定杀虫基因的靶群组。在适宜进行PCR扩增的条件下,将对杀虫基因靶群组具特异性的寡核苷酸引与来自所关注微生物核酸材料的第一样品以及DNA聚合酶混合。本发明的方法还包括进行第一轮PCR并检测PCR扩增产物存在与否。在具体的实施方案中,第一轮PCR包括使用SYBRGreen染料进行定量实时PCR,以纟企测PCR产物的存在。如果在第一轮PCR中检测到PCR产物,则从所关注微生物获得核酸的第二样品,并将其进行第二轮PCR。如上文所述,第二轮PCR所用的寡核苷酸引物也对杀虫基因靶群组的核苷酸序列中的特征序列具特异性。通常,利用第一轮PCR所用的反向寡核苷酸引物,产生第二轮PCR的正向引物,据此,作为第一轮和第二轮PCR之间的桥梁。设计第二轮PCR所用的反向引物,以便靶向通常位于设计第一轮PCR反向引物所用的特征序列的3,端的不同的特征序列。进一步设计第二轮PCR的寡核苦酸引物,以产生特定长度的PCR产物,具体来说约15500bp至约800bp,特别是约600bp至约700bp,更特别是约650bp至约700bp的PCR产物。可通过琼脂糖凝胶电泳分离第二轮PCR扩增的PCR反应物,并将含有期望长度的核酸片段的所得PCR产物连接于克隆载体,特别是细菌克隆载体。随后将载体转化入感受态的宿主纟田月包,例如i者^口co//纟田月包的纟田菌细月包。适宜的宿主细胞的实例包括但不限于细菌细胞、真菌细胞、植物细胞(双子叶植物和单子叶植物细胞)以及动物细胞。在具体的实施方案中,宿主细胞是细菌细胞。将多核苷酸递送至多种宿主细胞的克隆载体,在本领域内是熟知的。将核酸分子克隆于载体的方法以及转化宿主细胞的方法在本领域内是熟知的。有关克隆、包装以及表达系统和方法的一般性描述,参见GilimanandSmith(1979)Gewe8:81-97;Roberts"a/.(1987)to騰328:731-734;BergerandKimmel(1989)GWcfetoMo/ecw/arC7om'"g7fec/7w—es1,Mef/zods/"£>2z_ymo/ogy(分子克隆技术指南一酶学方法),Vol.152(AcademicPress,Inc.,SanDiego,California);SambrookWa/.(1989)A/o/ecw/"rC7ow/wgv爿Z^6on^or_yAfam^/(分子克隆实-验室手册),Vols.1-3(2ded;ColdSpringHarborLaboratoryPress,Plainview,NewYork)以及Ausubeleds.(1994)Cwn^W尸ratoco/sMo/ecw/arCi/rrewf/Votoco/s(分子生物学现行实验方案)(GreenePublishingAssociates,Inc.,andJohnWiley&Sons,Inc.,NewYork;1994Supplement。进一步分析来自含有第二轮PCR的PCR产物的单个细菌菌落的核酸材料,如质粒制备物,以鉴定推断的新杀虫基因。在具体的实施方案中,使用经设计以检测靶群组中所有已知杀虫基因的标记的寡核芬酸探针,通过斑点印迹分析,分析单个菌落的质粒DNA。通常寡核芬酸探针经设计,与第二轮PCR扩增中产生的PCR产物的片段互补。设计探针是为了鉴定含有靶群组中已知杀虫基因的任何核酸(即"斑点印迹阳性")。这些探针利用斑点印迹分析未能检测到的任何核酸(即"斑点印迹阴性"),含有推断的新杀虫基因或可能其片段,对其进一步分析,以评估新颖性。对根据本发明的方法鉴定的推断的新杀虫基因的片段进行测序,并与已知的杀虫基因进行序列比较,以评估新颖性。16此类序列分析方法在本领域中是熟知的。进一步分析新核苷酸序列,以获得推断的杀虫基因。在一些实施方案中,将含有推断的新杀虫基因的核酸分子克隆于表达载体,并使用标准的测定方法如下文所述的测定方法,测定这些基因编码的多肽的杀虫活性。上文所述用于鉴定新杀虫基因的方法也可用于鉴定来自其他所关注的耙群组的新基因。当本发明的方法用于鉴定非杀虫基因特别是非份Cry毒素基因时,可从不同的所关注有机体中获得核酸起始材料。然而,与所关注的基因靶群组无关,以基本上相同的方式进行其他的方法步骤,即系统的引物设计(下文详述)、第一轮PCR、第二轮PCR以及斑点印迹分析。尽管意图不限于任一机制,但将第一和第二轮PCR扩增中所用的寡核苷酸引物设计为并可能使得扩增含有如上文所定义的含有特征序列的已知基因和新基因两者。相反,选择本发明第三步(通常为斑点印迹分析)所用的寡核苷酸探针,以便仅特异性地检测已知基因。因此,含有第一轮和第二轮PCR中扩增的但未被斑点印迹分析期检测到的核酸材料的有机体,如微生物,特别是&菌抹,可含有新基因。在本发明的具体方面,设计上文所述的第一轮PCR扩增所用的至少一对寡核香酸引物包括经由多步骤方法设计简并寡核苷酸引物。在某些实施方案中,进行基因靶群组核苷酸序列比对。例如,杀虫基因靶群组可含有具有针对鞘翅目昆虫的杀虫活性的所有已知Cry基因(即鞘翅目活性基因)。靶群组中的基因共有本文称为特征序列的同源区。如下文详细描述的,特征序列充当寡核苷酸引物设计的起始点。尽管特征序列是在靶基因群组所有成员中保守的一段核苷酸,但靶群组的基因与基因之间,在特征序列中有一些差异。因此,设计对靶群组中所有基因都具有特异性的单套寡核苷酸引物是不可能的。所以,使用寡核苷酸引物的混合物涵盖靶群组中出现的特征序列的所有可能的变异。当由于靶基因群组中特征序列的序列变异而难以或不可能研发对全部靶群组的特征序列具特异性的一套引物时,利用寡核苷酸引物的混合物具有特殊的用途。如果可能,设计和使用对靶群组中尽可能多的基因具特异性的单套引物。在本发明鉴定新价Cry毒素基因的某些方面,将第一轮PCR所用的寡核芬酸引物设计为靶向已知的份Cry基因耙群组的"结构域1"中的特征序列,而第二轮PCR所用的引物则对"结构域2"中的序列具有特异性。设计用于第一轮和第二轮PCR所用的简并寡核苷酸引物包括浏览基因耙群组的核苷酸序列比对,以鉴定几个同源区,所述同源区为下文所述的引物设计的适当起始点。这些同源区称为"特征序列"。选择初始引物长度,其中初始引物长度为约15碱基对(bp)至约30bp,例如15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp和30bp。随后,通过观察特征序列中一条序列内的连续核苷酸的初始窗口,进行寡核苷酸引物的第一轮筛选。初始窗口开始于所选择的特征序列的5,端,并且其长度与初始引物的长度相当。检查初始窗口中的核苷酸序列,确定其是否具有下列所需的序列特征。用于第一轮或第二轮PCR的引物的适当核苷酸序列1)不具有4个或更多个连续相同的核苷酸残基;2)在核苷酸序列3'端最后5个残基中具有不多于2个鸟嘌呤或胞嘧啶残基;3)解链温度约50°C至65°C,更特别是约54°C±2°C;4)不形成发夹结构或二聚体结构;5)存在于基因靶群组(即上文所述的比对)中核苷酸序列的至少一条序列中;以及6)在来自非靶群组的核苷酸序列中不是保守的。为了增加寡核香酸引物的多样性,允许一个核苷酸残基为n,其中n是A、T、C或G。如果初始窗口中的核苷酸序列具备所有的上述序列特征,则选择初始窗口中的核苷酸序列作为寡核苷酸引物。如果初始窗口中的核苷酸序列不具有所有这些序列特征,则通过将初始窗口向特征序列的3'端移动1个碱基对,选择连续核苷酸的邻近窗口。如果邻近窗口的核香酸序列具备所有的序列特征,则如上文所述对其进行检查,并选择用作寡核苷酸引物。如有必要,进行其他轮的筛选,以鉴定满足上述条件的核苷酸序列。选择特征序列中具有所需特征的寡核苷酸,并用作第一轮或第二轮PCR的寡核苷酸引物。如上文所述,设计正向引物和反向引物两者。而且,设计第一4仑PCR所用的正向和反向引物,以便它们与靶群组基因中相隔约50bp至约150bp的核苷酸序列互补。通常设计第二轮PCF扩增的正向和反向引物,以便它们与耙群组基因中相隔约500bp至约800bp的核苷酸序列互补。如果相同的核苷酸序列存在于靶群组的至少一个成员的核苷酸序列中,则上文所用的核苷酸序列"存在于"来自基因靶群组的至少一个核苷酸序列中,前提是允许一个核苷酸残基为任何核苷酸(即n=A、T、C或G)。术语"杀虫基因非靶群组"指特定杀虫基因家族中所有的杀虫基因,不包括已选作靶群组的那些杀虫基因。例如,如果靶群组含有鞘翅目活性的所有份Cry基因,则相应的杀虫基因非靶群组含有除对鞘翅目昆虫有活性的价基因之外的所有份基因。同样,"非靶基因"或"基因非耙群组"指特定杀虫基因家族的所有基因,不包括已选作靶群组的那些基因。如果核苷酸序列与非靶群组中的所有核苷酸序列有至少2个核苷酸残基的差异,则其"在来自基因非靶群组的核苷酸序列中是不保守的"。在本发明的某些方面,测定连续核苷酸的特定窗口中的核苷酸序列在非靶群组基因中是否是保守的,包括搜索基因非靶群组中每个基因的全长序列。在某些实施方案中,使用窗口中的核苷酸序列作为字符串搜索项,穷举搜索基因非靶群组中每个基因的全长序列。也就是说,如果窗口内的核苷酸序列出现于非靶群组基因中的某处,或者如果具有小于2个核芬酸残基差异的核香酸序列出现于非靶群组基因中的某处,则不选择该窗口内的特定核普酸序列作为寡核苷酸引物。如上文所指出的,第一轮PCR所用的反向引物通常用于产生第二轮PCR的正向引物。才艮据上文所述的方法,使用不同的特征序列作为引物设计的起始点,特别是是设计第一轮PCR的寡核香酸引物所用的特征序列的3'的特征序列,设计第二轮PCR的反向引物。图l表示设计第一轮和第二轮PCR示例性引物的示意图。因为基因靶群组中特征序列通常在所有成员中不相同,所以通常在第一轮PCR和第二轮PCR两者中使用寡核苷酸引物的混合物,以解决这些序列变异。当本发明的PCR反应使用寡核苷酸引物的混合物时,进一步设计所述引物,使得所有引物具有相同或者几乎相同的解链温度。在某些实施方案中,第一轮和第二轮PCR所用的寡核苷酸引物的解链温度为约54。C士2。C。"杀虫基因"指编码显示了杀虫活性的多肽的核苷酸序列。本文所用术语"杀虫活性"指物质如多肽抑制害虫的生长、摄食或繁殖和/或杀灭害虫的能力。"杀虫多肽"或"昆虫毒素"意指具有杀虫活性的蛋白。杀虫活性可通过本领域已知的常规分析来测量。此类分析包括但不限于在喂食并暴露于所述物质适当长的时间后的害虫死亡率、害虫体重损失、害虫抵抗性、对害虫的引诱作用以及害虫其他的行为和身体变化。一般的方法包括向封闭容器内的食源添加实验化合物或有机体。评估杀虫活性的分析法在本领域中是熟知的。参见例如美国专利6,570,005和6,339,144;通过引用的方式在此将其全文并入。测试杀虫活性的优选发育阶段是所关注昆虫的幼虫或未发育完全形态。在完全黑暗、约20°C至约30°C和约相对湿度为约30%至约70%的条4牛下饲养昆虫。如CzaplaandLang(1990)/五cow.五wto附o/.83(6):2480-2485中所述进行生物测定。饲养昆虫幼虫以及进行生物测定的方法对本领域普通技术人员而言是熟知的。在本发明的某些实施方案中,所关注的靶群组是含有ACry毒素基因或份基因特定子集如鞘翅目活性价Cry基因的杀虫基因。"价"基因或"苏云金芽孢杆菌基因,,意指较为宽泛的基因类,其存在于编码价毒素的各种价菌抹中,所述价毒素包括例如Cry(晶体)毒素(即S-内毒素)和Cyt(细胞毒性)毒素的这些毒素。"Cry毒素"和"Cyt毒素"包括分别与已知的Cry蛋白或Cyt蛋白同源的杀虫多肽。Cry基因包括编码任何划分为Cry毒素如Cryl、Cry2、Cry3、Cry7、Cry8和Cry9的核苷酸序列。参阅CrickmoreW(1998)Af/cra&o/.JWo/ec.所o/.iev.62:807-813以及lifesci.sussex.ac.uk/Home/Neil一Crickmore/5.^zwWwg/eww's中的CrickmoreWa/.(2004)Ba"7/wsT7zwWwg/eww、7bx/"Mmewc/fl^M(云金芽孢杆菌毒素命名法),将两者以其整体通过引用并入。份毒素是杀虫蛋白的家族,以原毒素合成并结晶为伴孢包涵体。20当被害虫摄取后,微晶体结构通过昆虫中肠的碱性pH溶解,原毒素经昆虫肠的蛋白酶切割而产生活性毒素。激活的价毒素与昆虫肠上皮中的受体结合,导致昆虫肠的膜损伤和相关的膨胀和裂解。饥饿和败血症造成昆虫死亡。参见,例如Lietal.(1991)Nature353:815-821。原毒素形式的Cry毒素含有晶体形成部分。不同特异性的活性Cry毒素的氨基酸序列的比较还揭示了5个高度保守的序列区。从结构上来讲,Cry毒素含有3个不同的结构域,从N末端到C末端,它们为一簇与毛孔形成相关的7个a螺旋(称为"结构域l");3个与细胞结合相关的反向平行的卩折叠片(称为"结构域2");以及(3夹层结构(称为"结构域3")。这些结构域的位置和特性对本领域技术人员而言是已知的。参见侈寸^口上述Lida/.(1991)和Morsee/a/.(2001)S^M"wre9:409-417。最初的份毒素命名系统基于杀虫活性特征对毒素进行分类。这种系统已经被仅基于氨基酸序列的同一性的新命名法取代。在这种系统中,基于氨基酸序列的同一性,已经将Cry毒素和Cyt毒素划分为类或家族,毒素的名称提供了有关其与其他序列同源性的信息。因此例如Cry2家族的成员Cry2Aa、Cry2Ab和Cry2Ac毒素共有约80%的氨基酸序列同一性。同样,Cry8家族毒素Cry8Aa和Cry8Ba共有约65%的氨基酸序列同一性。参见CrickmoreW"/.(1998),同上。对所关注靶群组如杀虫基因靶群组中特征序列具有特异性的寡核苷酸引物,用于第一轮和第二轮PCR两者中并根据本发明的方法来设计,其通常经设计而具有约50。C至65。C的热熔点(Tm)或热熔温度。在具体的实施方案中,寡核苷酸引物的Tm为约52。C至56。C、更特别是约54。C。许多公式已用来测定Tm。计算Tm的任何公式可用于实践本发明的方法。例如,如下为基于最紧邻热力学(nearest-neighborthermodynamics)的测定Tm的经典算法Tm=EH7(ES。+(RxIn(Ct))-273.15+16.6log[X]其中EH。和ES。分别为螺旋形成的焓和熵;R是摩尔气体常数(1.987(cal)(K")(mol"));Ct是总的链(引物)浓度;以及X是盐浓度。RychlikWa/.(1990)iVwc/e/cv4"Wi^s.18(21):6409画6412。而且,在某些实施方案中,寡核苷酸引物的Tm利用如下公式计算Tm=(EH7[ES0+(RxIn(Ct))]-273.15+16.6log([X]))x1.1144-14.964其中EH。(烚)ZAH;ES。(熵)=!;AS+0.368x19x1.585;R(摩尔气体常数)=1.987;Ct(总的引物浓度)=log(0.00000005/4)x1000;以及X(盐浓度[K+]):0.05。本领域技术人员应该认识到,用于实践本发明方法的寡核苷酸引物是成对的寡核苷酸引物,因此,每对存在两个单个的引物(即正向引物和反向引物)。每对引物中的一个引物(正向引物)与靶基因群组中特征序列的5,链的一部分是互补的(即能杂交),而另一个(反向引物)则与特征序列的3'链的一部分互补。设计寡核苦酸引物,以便适宜的聚合酶将针对每个引物复制每个3'链的序列,产生扩增的拷贝(即"PCR扩增产物"或"PCR产物")。本发明的方法利用至少一对寡核苷酸引物进行PCR扩增。在本发明的某些方面,使用含有2、3、4、5、10、2.0、30、40、50或更多引物对的寡核苷酸引物对的混合物。设计对所关注的特定核苷酸序列(即特征序列)具有特异性的寡核苷酸引物包括简并寡核苷酸引物的方法在本领域中是熟知的。本发明的寡核苷酸引物是允许扩增新基因如新杀虫基因的适宜长度的引物。每对引物的单个引物通常包含约15bp至约30bp,更特别是约20bp至约25bp。寡核苷酸引物对中单个引物之间的距离也足以产生可检测长度的PCR产物。因此,在第一轮PCR中,选择正向和反向引物,以便它们与基因靶群组成员的核苷酸序列内通常相隔约50bp至约150bp更特别相隔约100bp的核香酸序列互补。在第二轮PCR中,正向和反向引物通常与靶群组中的核苷酸序列互补,所述核苷酸序列相隔约500bp至约800bp,特别是相隔约600bp至约750bp,更特别是相隔约600bp至约650bp。用于本发明方法的核酸材料可通过任何方法从任何所关注有机体中获得。所关注有机体包括,例如微生物(更特别是份菌抹)、植物、动物、真菌、细菌和昆虫。核酸材料可含有例如由所关注有机体如价菌抹制备的质粒DNA。在某些实施方案中,获得核酸材料包括从所关注有机体特别是所关注微生物中分离DNA。核酸材料可以含有例如基因组DNA。在本发明的具体方面,核酸材料含有从价菌抹产生的质22粒文库。当进行多轮PCR扩增时,获得来自有机体核苷酸材料的新样品,并用于每一轮PCR。因此,例如,可由价菌林制备新的DNA质粒制备物,用于每一4仑PCR。通过PCR扩增核酸是基本的分子生物学技术。进行PCR的方法在本领域中是熟知的,并可在商购的仪器上进行。参见例如Sambrookda/.(1989)Mo/ecw/orC7om'wgv丄a60rato7Mawwa/(2ded.,ColdSpringHarborLaboratoryPress,Painview,NewYork);InnisW<a/.,eds.(1990)户C7尸ratoco/s:爿GwzWetoMe^oAawdJ;/7/^3"c1"s(PCR实验、方案方法禾口应用指南)(AcademicPress,NewYork);InnisandGelfand,eds.(1995)PCT^ra/eg/w(PCR策略)(AcademicPress,NewYork);andInnisandGelfand,eds.(1999)尸CTj^feAotfe^fawwa/(PCR方法手册)(AcademicPress,NewYork),通过引用将它们并入本文。简单而言,PCR允许快速有效地扩增含有所关注靶序列的核酸材料(如来自所关注基因的DNA)。在适宜PCR扩增的添加下,混合待扩增的核酸材料、寡核香酸引物以及热稳定DNA聚合酶(如Taq聚合酶)。PCR反应混合物还含有足够量的4种脱氧核糖核核普三磷酸和氯化镁。PCR单个反应成分可商购获得,且由许多公司(如RocheDiagnostics、Qiagen、Promega、Stratagene等)4是供。仅需加入核酸材料和寡核普酸引物的先前制备的反应混合物或"反应基液(mastermixes)"也可使用。进行PCR的时间为至少足以允许产生可检测量的寡核普酸引物间的核苷酸序列的拷贝。在具体的实施方案中,本发明的方法包括进行第一轮PCR特别是实时PCR,更特别是定量实时PCR。实时PCR允许;险测扩增反应早期的PCR产物。具体来说,在实时PCR中,PCR产物的定量依赖于核酸材料的量以对数扩增直至到达一个平台的几个循环。在指数期,靶核酸材料的量在每个循环中加倍,且因为试剂有限,而没有偏爱。进行实时PCR的方法和仪器在本领域中是熟知的。参见例如Bustin(2000)/A/o/ec.五"fifocrz"o/.25:169-193;Freemana/.(1999)跑ec/zm々廳112:124-125;Halford(1999)组肠fe由o/.17:835;以及Heid"a/.(1996)7仏6(10):986-994,将它们的全文通过引用并入本文。在本发明的某些方面,第一轮PCR扩增包括进行实时PCR。如上文所用的,"检测,,PCR扩增产物包括检测本发明PCR步骤扩增的核普酸的存在与否或数量的任何方法。检测方法可提供有关扩增水平的定性或定量信息。此类检测PCR扩增产物的方法在本领域中是熟知的,包括例如溴化乙锭染色的琼脂糖凝胶电泳、Southern印迹/探针杂交以及荧光测定。许多不同的染料和探针可用来监控PCR和才企测PCR产物。例如,实时PCR扩增产生的PCR产物可利用多种荧光染料和用荧光分子共价标记的寡核苦酸探针来检测。此类荧光体能指示PCR产物的存在,并提供有关PCR产物的量的信号。而且,通过利用连续的荧光监控PCR产物,可测定检测到信号高于背景(Ct;循环阁值)且处于指数期时的点。核酸序列的模板越丰富,越更早达到Ct。可用双链DNA特异性染料;险测任何PCR扩增中PCR产物的形成,而无需合成序列特异性探针。这些染料与双链DNA(dsDNA)特异性结合,包括但不限于SYBRGreen、SYBR60^@以及溴化乙锭。"SYBRGreen"指任何可购买到的SYBRGreen荧光染料,包括SYBRGreenI和SYBRGreenII。用dsDNA染料,通过分析解链曲线或通过在使非特异性产物解链的高温下获得荧光,可提高产物的特异性。参见Ririe"a/.(1997"rn/.肠c/z纖.245:154-160;Morrisonda/.(1998)肠rec—諮24:954-962。寡核普酸探针也可用荧光分子共价标记,并用来检测PCR产物。发夹引物(811111^6@引物)、发夹探针(MolecularBeacons吸)以及核酸外切酶探针(TaqMar^探针)是双标记的荧光寡核苷酸,可在PCR过程中受到监控。这些探针取决于同一个寡核苷酸上的淬火剂对荧光团的荧光淬火。发生杂交或核酸外切酶水解时,荧光增加。PCR产物也可用两种寡核苷酸(每种都用荧光探针标记)检测。这些寡核苷酸与靶核酸杂交使两种荧光探针相互靠近,从而发生共振能量转移。参见例如Wittwer"a/.(1997)B/orec/zm々w&y22:130-138。可接受的用作荧光共振能量转移对的荧光团对,对本领域技术人员而言24是已知的,其包括但不限于焚光素/若丹名、藻红蛋白/Cy7、荧光素/Cy5、荧光素/Cy5.5、荧光素/LCRed640以及荧光素/LCRed705。在本发明的某些方面,SYBRGreen荧光染料用于检测PCR产物,更特别是第一轮PCR中产生的实时PCR产物。如上文所述,SYBRGreen是结合dsDNA小沟的荧光染料。因此,当较多的双链PCR产物产生时,SYBRGreen的荧光信号也增加。在本发明的其他方面,5,核酸酶测定用于监控PCR,特别是实时PCR,以及4企测PCR扩增产物。在5'核酸酶测定中,将称为TaqMai^探针的寡核苷酸探针加入PCR反应混合物中。TaqMan⑧探针在5'端含有高能荧光报道染料(如FAM),在3,端含有低能淬火染料(如TAMRA)。当探针完整时,报道染料的荧光发射受到紧密邻近的淬火剂的抑制。将TaqMan⑧探针进一步设计为对正向和反向引物之间模板的特异性序列退火,因此,探针与聚合酶途径中的模板核酸材料结合。PCR扩增导致通过聚合酶的核酸酶活性将报道染料从含有探针的淬灭剂上裂解或释放。因此,释放的报道染料产生的荧光信号与PCR产物的量成比例。使用SYBRGreen或TaqMan⑧探针,进行实时PCR的方法和仪器(如ABIPrism7700Detector;PerkinElmer/AppliedBiosytemsDivision)在本4页i或内是熟少、p的。在具体的实施方案中,使用SYBRGreen检测来自第一轮PCR扩增的PCR产物。如上文所指出的,在第二轮PCR中产生的PCR产物通常经由琼脂糖凝胶电泳分离。出于进一步的考虑,分离期望长度的核酸分子并进行斑点印迹分析,以除去耙群组中已知的基因。"斑点印迹分析"或"斑点印迹杂交"是分子生物学领域的标准方法。通常,斑点印迹杂交包括将核酸材料固定于例如硝酸纤维或尼龙膜上。在适宜杂交的条件下,将固定的核酸材料暴露于标记的寡核苷酸探针下,并检测结合探针存在与否。本发明的寡核苷酸探针可用放射性标记或非放射性标记来标记,以利于探针结合的检测。本领域可利用各种放射性或非放射性标记。此类标记包括例如地高辛(DIG)、生物素、荧光分子和氚(311)。产生用于斑点印迹分析的标记的寡核苷酸探针的方法在本领域中是熟知的。本发明方法中的斑点印迹分析所用的寡核苷酸探针对靶群组中所有的已知基因(如杀虫基因)都具有特异性。将探针设计为与第二轮PCR产生的PCR产物的片段互补。设计用于本发明斑点印迹分析步骤的寡核苷酸探针的示意图显示于图1中。在具体的实施方案中,使用对耙群组中所有已知基因具特异性的寡核苷酸探针的混合物。当由于序列的差异难以研发对整个靶群组都具有特异性的单个探针时,设计寡核苷酸探针混合物具有特定的用途,其中每个探针对靶群组中的每个基因都是特异性的。如果可能,设计和使用对靶群组中尽可能多的基因(如杀虫基因)具特异性的单套探针。而且,当使用多于1种寡核苷酸探针时,可将该探针与单个斑点印迹膜一起孵育,作为探针混合物,或可选地,制备多个膜并单独地与单个探针一起孵育。斑点印迹寡核苷酸探针的长度通常为约20bp至约40bp,特别是约25bp至约35bp,更特别是约30bp至约35bp。而且,通常将用于斑点印迹分析的寡核苷酸探针的Tm设计为至少约70°C,特別是至少约75。C,更特别是至少约80。C。当使用寡核苷酸探针混合物时,将每个探针设计为具有大约相同的Tm。本领域技术人员理解鉴定新基因包括新杀虫基因更特别是新价Cry毒素基因的方法及其任何步骤能以自动、半自动或手动方式实现。本文公开的方法可用于高通量筛选测定中。本发明的组合物包括含有新基因的分离的多核苷酸以及其变体或片段。此类新基因使用本发明的方法来鉴定。还提供了含有本发明核酸分子编码的多肽的氨基酸序列。由本文提供的方法鉴定的新核酸分子和杀虫多肽可用于例如保护植物免遭害虫相关的损害。本发明包括分离的或基本上纯化的多核苷酸或蛋白组合物。"分离的"或"纯化的"多核芬酸或蛋白或其生物学活性部分大体上或基本上不含通常伴有天然存在环境中发现的多核苷酸或蛋白或与之相互作用的组分。因此分离或纯化的多核苷酸或蛋白当通过重组技术产生时大体上不含其他的细胞材料或培养基,或当化学合成时,大体上不含化学前体或其他的化学品。最理想的是,"分离的"多核苷酸不含天然位于有机体基因组DNA中多核苷酸侧翼(即位于多核苷酸5,和3'端的序歹寸)的序列(最理想的是蛋白编码序列),该多核苷酸来源于所述有机体。例如,在多个实施方案中,分离的多核苷酸能含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,所述核香酸序列天然位于该多核苷酸来源的细胞基因组DNA中多核苷酸侧翼。大体上不含细胞材料的蛋白包括含有少于约30%、20%、10%、5%或1%(干重)污染蛋白的蛋白制剂。当重组产生本发明的蛋白或其生物学活性部分时,最理想的是,培养基含有少于约30%、20%、10%、5%或1%(干重)的化学前体或非所关注蛋白化学品。如本文所用的,"核酸,,包括提到的单链或双链形式的脱氧核糖核苷酸或核糖核苷酸多聚体,除非另有限制,其包括具有天然核苷酸本质属性的已知类似物(如肽核酸),因为它们以与天然存在的核苷酸相似的方式与单链核香酸杂交。使用术语"寡核苷酸"或"多核苷酸"并非意欲将本发明限制于含有DNA的多核普酸。本领域普通技术人员应该意识到寡核苷酸和多核苷酸能含有核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合。此类脱氧核糖核苦酸和核糖核苷酸既包括天然存在的分子也包括合成的类似物。本发明的寡核苷酸和多核苷酸也包括序列的所有形式,包括但不限于单链形式、双链形式等。术语"多肽"、"肽"和"蛋白"在本文中可交换使用,表示氨基酸残基的多聚体。这些术语适用于一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学类似物的氨基酸多聚体,也适用于天然存在的氨基酸多聚体。本文所用有关特定多核苷酸或其编码的蛋白的"全长序列",意指天然序列的全部核苷酸序列或全部氨基酸序列。"天然序列"意指内源性序列,即有机体基因组中非改造的序列。全长多核苷酸编码全长形式的具体蛋白。本文所用术语"编码"或"编码的",当用于具体核酸环境中时,意指该核酸含有指导该核苷酸序列翻译成具体蛋白所需的信息。编码蛋白的信息通过使用的密码子明确说明。编码蛋白的核酸分子在该核酸分子的翻译区可含有非翻译序列(即内含子),或不含此类居间的非翻译序歹寸(如在CDNA中)。公开的多核香酸和其编码的蛋白的片段或变体也包含于本发明中。"片段"意指多核苷酸的一部分,或由其编码的蛋白和氨基酸序列的一部分。多核苷酸的片段可编码保留了天然蛋白生物学活性的蛋白片段,因而,其也具有例如杀虫活性。可选地,可用作杂交探针的多核芬酸片段通常不编码保留了生物学活性的蛋白片段。因此,多核苷酸片段的长度范围可以是至少约20个核苷酸、约50个核苷酸、约100个核苷酸,最多至编码本发明蛋白的全长多核苷酸。编码蛋白质生物学活性部分的本发明多核苷酸的片段,编码至少15、25、30、50、100、150、200或250个连续氨基酸,或高达存在于本发明全长蛋白如杀虫蛋白中的氨基酸的总数。可用作杂交探针或PCR引物的多核香酸的片段通常不需要编码蛋白的生物学活性部分。因此,多核香酸的片段可编码蛋白的生物学活性部分,或其可以是用作使用下文公开的方法的杂交探针或PCR引物的片段。通过分离本发明多核苷酸中的一种多核苷酸的一部分、表达蛋白的编码部分(如体外重组表达)以及评估蛋白的编码部分的生物学活性,制备蛋白的生物学活性部分。是本发明方法鉴定的核普酸序列的片段的多核苷酸在此含有至少16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、l,OOO、1,100、1,200、1,300或1,400个连续核苷酸,或高达存在于本文7>开的全长多核苦酸中的核香酸的数量。"变体"意指大体上相似的序列。对于多核苷酸而言,变体含有一个或多个核香酸在天然多核香酸的一个或多个内部位点处的缺失和/或添加,和/或一个或多个核苦酸在天然多核普酸的一个或多个位点处的取代。本文所用"天然"多核苷酸或多肽分别含有天然存在的核苷酸序列或氨基酸序列。对于多核苷酸而言,保守变体包括由于遗传密码的简并性而编码本发明多肽之一的氨基酸序列的序列。诸如这些变体的天然存在的等位基因变体能用熟知的分子生物学技术如下文概述的多聚酶链式反应(PCR)以及杂交技术鉴定。变异的多核香酸也包括合成的衍生多核香酸,如通过使用定点诱变产生但仍然编码本发明蛋白(如28200780030667.4杀虫蛋白)的生物学活性部分的多核苷酸。如本文别处所述的序列比对程序和参数所测定的,通常本发明具体多核苷酸的变体与该具体多核苷酸具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。本发明具体多核苷酸(即参照多核苷酸)的变体也可通过比较变异的多核苷酸编码的多肽和参照多核苷酸编码的多肽之间的百分比序列同一性来评估。因此,公开了例如分离的多核苷酸,其编码与本发明多肽具有给定百分比序列同一性的多肽。任何两条多肽之间的百分比序列同一性可使用本文别处所述的序列比对程序和参数计算。当本发明的任何给定对的多核苷酸通过比较这两条多核芬酸编码的多肽共有的百分比序列同一性来评估时,两条编码的多肽之间的百分比序列同一性至少是约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。"变异"蛋白意指经由一个或多个氨基酸在天然蛋白一个或多个内部位点缺失和添加,和/或一个或多个氨基酸在天然蛋白的一个或多个位点取代而从该天然蛋白衍生的蛋白。包括于本发明的变异蛋白是生物学活性的,即它们继续具有期望的天然蛋白的生物学活性,如本人所述的杀虫活性。此类变体产生于例如遗传多态性或产生于人的操作。如本文别处所述的序列比对程序和参数所测定的,本发明天然蛋白的生物学活性变体与天然蛋白的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。本发明蛋白的生物学活性变体与该蛋白的差异在于象1-15个氨基酸残基一样少、象1-10个氨基酸残基一样少如6-10个氨基酸残基、象5个氨基酸残基一样少、象4、3、2、或甚至1个氨基酸残基一样少。本发明的蛋白可以各种方式进行改变,包括氨基酸取代、缺失、截短和插入。此类操作的方法在本领域内通常是已知的。例如,杀虫蛋白或其他蛋白的氨基酸序列变体和片段可通过DNA中的突变制备。i秀变或多核苷酸改变的方法在本领域内是熟知的。参见例如Kunkel(1985)户rac.iV^/,v4cadSc/.6^482:488-492;Kunkel"a/.(1987)MeAoA/"五"zy柳o/.154:367-382;美国专利4,873,192;WalkerandGaastra,eds.(1983)Tfec/m—Mo/ecw/arS/o/ogy(分子生物学技术)(MacMillanPublishingCompany,NewYork),以及本文引用的文献。有关不影响所关注蛋白生物学活性的适当氨基酸取代的指导,见于Dayhoffda/.(1978)AAxso/尸rate/"5^《wewce(Natl.Biomed.Res.Found.,Washington,D.C.)的才莫型中,将其通过引用并入本文。保守取代,如用另一个具有相似特性的氨基酸取代一个氨基酸,是最佳的。因此,本发明的多核苷酸既包括天然存在的序列也包括突变形式。同样,本发明的蛋白既包括天然存在的蛋白又包括其变体和修饰形式。此类变体继续具有期望的生物学活性,如杀虫活性。显然,将在编码变体的DNA内发生的突变无需在阅读框外插入序列,且最理想的是,不产生互补区,所述互补区能产生二级mRNA结构。参见欧洲专利申请公布第75,444号。不希望包括于本文的蛋白序列的缺失、插入和取代对该蛋白的特性产生根本的变化。但如果在进行取代、缺失或插入之前难以预测它们的影响,则本领域的技术人员应理解所述影响可通过常规筛选测定评估。例如,新杀虫蛋白变体的活性可通过测定杀虫活性评估。参见例如美国专利6,570,005和6,339,144,将其通过引用并入本文。变异多核苷酸和变异蛋白也包括由致突变和致重组方法如DNA穿梭得到的序列和蛋白。用此类方法,可操作一种或多种不同的蛋白编码序列,产生具有期望特性如杀虫活性的新多肽。在此情况下,重组的多核苷酸文库是从一群含有序列区的相关的序列多核苷酸序列产生的,所述序列区具有大体上的序列同一性并能体外或体内同源重组。例如,使用这种方法,编码所关注结构域的序列基序可在本发明的基因(如新的份Cry毒素基因)和其他已知的相关基因间穿梭,获得编码所关注改进的特性如杀虫活性提高的蛋白的新基因。此类DNA穿梭的策略在本领域内是已知的。参见例如Stemmer(l994)Prac.A^/.爿cad5W.91:10747-10751;Stemmer(1994)Atow阳370:389-391;Crameria/.(1997)TVafwreS/o^c/z.15:436-438;Moorea/.(1997)Tkfo/.B/o/.272:336-347;Zhanga/.(1997)尸roc.TVa//.jcafciSc/.94:4504-4509;Cmmerida/.(1998)iVWwre391:288-291;以及美国专利5,605,793和5,837,458。本发明的多核苷酸可用于从其他的有机体特别是其他的微生物中分离相应的序列。在此情况下,基于此类序列与本文所述序列的序列同源性,诸如PCR、杂交等方法可用来鉴定此类序列。基于它们与本文所述的完整序列或与其变体或片段的序列同一性而分离的序列,包括于本发明中。此类序列包括公开的序列的直系同源物(orthologs)。"直系同源物"意指由共同祖先基因衍生的基因,且其作为物种形成的结果,存在于不同的物种中。当存在于不同物种内的基因的核苷酸序列和/或它们编码的蛋白序列共有至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性时,则认为这些基因是直系同源物。直系同源物的功能在物种间经常是高度保守的。因此,本发明包括编码具有所关注生物交的分离多核苷酸。在PCR方法中,设计用于PCR反应的寡核香酸引物,以扩增从任何所关注有机体中提取的cDNA或基因组DNA的相应DNA序列。设计PCR引物和PCR克隆的方法在本领域内通常是已知的,公开于Sambrooka/.(1989)A/o/ecw/a厂C7owz'wg.'丄a6orafo^yMa"wa/(2ded.,ColdSpringHarborLaboratoryPress,Plainview,NewYork)。也可参见Innisa/.,eds.(1990)尸CiiVo/oco/s..JC7w/cfeMef/70fi^4p//z'ca"o"s(AcademicPress,NewYork);InnisandGelfand,eds.(1995)PCT5Vra绍z,es(AcademicPress,NewYork),以及InnisandGelfand,eds.(1999)PCRTl/e^w^Afo"wa/(AcademicPress,NewYork)。已知的PCR方法包括但不限于使用成对引物、巢式引物、单个特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。在杂交技术中,使用已知多核苷酸的全部或部分作为与存在于来31自经选择的有机体的克隆的基因组DNA片段群或cDNA片段群(即基因组文库或cDNA文库)中的其他的相应多核苷酸选择性杂交的探针。杂交探针可以是DNA片段、cDNA片段、RNA片段或其他的寡核苷酉吏,也可以用可才企测基-团fe口32PiU壬4可其^f也可才企测才示志4勿土i4亍才示i己。因此,例如杂交探针可基于本发明的杀虫多核苷酸通过标记合成的寡核苷酸来制备。制备杂交探针和构建cDNA文库和基因组文库的方法在本领域内通常是已知的,并公开于Sambrookda/.(1989)Mo/ecw/wC7ow/wg:J丄a6oratoryMawwa/(2ded.,ColdSpringHarborLaboratoryPress,Plainview,NewYork)中。尽管本发明提供了较为有效的鉴定与任何所关注已知基因靶群组共有同源区(即特征序列)的新基因特别是新杀虫基因更特别是新价Cry毒素基因的方法,^旦本领域4支术人员应该意识到,本领域已知的标准方法也可用来鉴定与本文公开的多核苷酸同源的序列。例如,本文公开的完整核苷酸,或其一个或多个部分,可用作能与相应多核苷酸和信使RAN选择性杂交的探针。为了实现在多种条件下的特异性杂交,此类探针包括多核苷酸序列间的独特序列,并且其长度最佳是至少约IO个核苦酸,最佳至少约20个核苷酸。此类探针可用来通过PCR扩增来自经选择的有机体的相应多核苷酸(如杀虫多核苷酸)。这种技术可用来从期望的有机体中分离其他的编码序列,或作为诊断性分析法测定有机体中编码序列的存在。杂交技术包括平板内DNA文库(或J寇块或集落,参见侈'J^口Sambrook"a/.(1989)Mo/ecw/arC/om'wg..^丄a6ora/o^yMa,a/(2ded.,ColdSpringHarborLaboratoryPress,Plainview,NewYork)的杂交筛选。此类序列的杂交可在严紧条件下进行。"严紧条件"或"严紧杂交条件,,意指探针以比其他序列更高的可检测程度(如至少高于背景2倍)与其靶序列杂交的条件。严紧条件是序列依赖性的,并且因环境的不同而不同。通过控制杂交的严紧性和/或洗涤条件,可鉴定与探针100%互补的靶序列(同源杂交)。可选地,可将严紧条件调整为允许序列错配,以便检测更低程度的相似性(异源杂交)。通常,探针的长度小于约1000个核香酸,最佳小于500个核苷酸。32通常,严紧条件是盐浓度在pH7.0-8.3时为小于约1.5MNa离子浓度,通常约O.Ol-l.OMNa离子浓度(或其他的盐);且温度对于短探针(如10-50个核苷酸)为至少约30。C,对于长探针(长于50个核苷酸)至少约60°C。加入去稳定剂如曱酰胺,也可获得严紧条件。示例性的低度严紧条件包括用含30-35%曱酰胺、1MNaCl、1%SDS(十二烷基硫酸钠)的緩沖液在37。C下杂交,以及50-55。C下用lx至2xSSC(20xSSC=3.0MNaCl/0.3M柠檬酸三钠)洗涤。示例性的中度严紧条件包括37。C下在40-45%曱酰胺、l.OMNaCl、1。/。SDS中杂交,以及55-60。C下用0.5x至lxSSC洗涤。示例性的高度严紧条件包括37°C下50%甲酰胺、1MNaCl、1%SDS中杂交,以及60-65°C下用O.lxSSC洗涤。任选地,洗涤緩冲液可含有约0.1%至约1%SDS。杂交的持续时间通常少于约24小时,通常约4-12小时。洗涤持续时间至少是足以达到平衡的时间长度。特异性通常是杂交后洗涤的功能,因为关键的因素是离子强度和终洗涤液的温度。对于DNA-DNA杂交,Tm可冲艮据MeinkothandWahl(1984)^2。/.所oc/zem.138:267-284中的公式Tm=81.5。C+16.6(logM)+0.41(%GC)-0.61(%形态)-500/L来估算,其中M是单价阳离子的摩尔浓度,%GC是DNA中鸟苷核苷酸和胞嘧啶核苷酸的百分比,%形态表示杂交溶液中曱酰胺的百分比,以及L是碱基对中杂化物的长度。Tm是50%的互补靶序列与完美匹配的探针杂交时的温度(在限定离子强度和pH的情况下)。每次错配1%,Tm降低约rc,因此,Tm、杂交和/或洗涤条件可调整为与期望的同一性的序列杂交。例如,如果寻求具有^90%同一性的序列,则可将Tm降低10。C。通常,选择的严紧条件比限定离子强度和pH下的特定序列和其互补物的Tm低约5。C。然而,严格严紧条件可利用比Tm低1、2、3或4。C的温度杂交和/或洗涤;中度严紧条件可利用比Tm低6、7、8、9或10。C的温度杂交和/或洗涤;低度严紧条件可利用比Tm低11、12、13、14、15或20°C的温度杂交和/或洗涤。使用公式、杂交和洗涤组合物以及期望的Tm,本领域普通技术人员应该理解,杂交严紧性和/洗涤溶液中的变化在本公开之内。如果期望的错配程度导致小于45。C(水溶液)或32。C(曱酰3胺溶液)的Tm,最佳的是,增加SSC的浓度,以便可以使用较高的温度。有关核酸杂交的详尽指导可见于Tijssen(l993)丄"Z)0rato7iYwc/dc爿"WPra6^s(生物化学和分子生物学实验技术核酸探针杂交),第I部分,第2章(Elsevier,NewYork);和Ausubel"a/.,eds.(1995)Cw;rewf尸ratoco/sZ"Mo/ecw/"rB/o/ogy,第2章(GreenePublishingandWiley-Interscience,NewYork)中。参见Sambrooka/.(1989)Mo/ecw/arCVom'"gv^4La6orator_yMawwa/(2ded.,ColdSpringHarborLaboratoryPress,Plainview,NewYork)。下列术语用于描述两条或多条多核苷酸或多肽之间的序列关系(a)"参照序列",(b)"对比窗口",(c)"序列同一性"以及(d)"序列同一性百分比"。(a)本文所用"参照序列"是作为序列对比基础的限定序列。参照序列可以是全部指定序列的子集;例如作为全长cDNA或基因序列的片段,或完整的cDNA或基因序列。(b)本文所用"对比窗口"涉及多核苷酸序列的连续和指定片段,其中,为了两条多核苷酸的最佳比对,对比窗口中的多核苷酸序列与参照序列(其不含添加或缺失)相比,可含有添加或缺失(即空位)。通常,对比窗口的长度至少是20个连续的核苷酸,任选地能是30、40、50、100个核普酸或更长。本领域的技术人员可以理解,为了避免由于多核苷酸序列中含有的空位而导致与参照序列的高度相似性,通常引入空位罚分并将其^^人匹配数目中减去。用于比较序列比对的方法在本领域内是熟知的。因此,测定任何两条序列间百分比序列同一性可使用数学算法实现。此类数学算法的非限制性实例是MyersandMiller(1988)4:11-17中的算法;Smith"a/.(1981)爿dv.^//.Ma仇2:482的局部比对算法;NeedlemanandWunsch(1970)/Mo/.所o/.48:443-453的全局比对算法;PearsonandLipman(1988)Prac.7Va/.Jcad5W.85:2444-2448的搜索局部(search-for画local)比对法;在KarlinandAltschul(1993)户"&490:5873-5877中改良的KarlinandAltschul(19卯)Prac.A^/.^cadSc/.6^4872264中的算法。对于序列对比,可利用计算机执行这些数学算法,以测定序列同Intelligenetics(MountainView,California)获得);ALIGN程序(版本2.0)和GCGWisconsin遗传学软件包版本10(可从AccelrysInc.(9685ScrantonRoad,SanDiego,California,USA)获得)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。使用缺省参数,可进行利用这些程序的比对。以下对CLUSTAL程序作了详细描述HigginsWa/.(1988)73:237-244(1988);Higgins^(1989)5:151-153;Corpet"a/.(1988)A^c/ezci^.16:10881-90;Huang"a/.(1992)8:155-65;和Pearson"a/.(1994)MeA.Mo/.24:307-331。ALIGN程序基于MyersandMiller(1988)(同上)的算法。当比较氨基酸序列时,PAM120加权残基表、空位长度罚分12和空位长度罚分4可与ALIGN程序一起4吏用。AltschulWa/(1990)Mo/.所o/.215:403的BLAST程序基于KarlinandAltschul(1990)(同上)的算法。BLAST核苷酸搜索可用BLASTN程序(得分二IOO,字长=12)执行,以获得与编码本发明蛋白的核苷酸序列同源的核苷酸序列。BLAST蛋白搜索可用BLASTX程序(得分=50,字长=3)执行,以获得与本发明的蛋白或多肽同源的氨基酸序列。出于比较目的为了获得空位比对,可利用AltschulW"/.(1997)7Vwc/e/cv4c/A25:3389所述的GappedBLAST(在BLAST2.0中)。可选地,可用PSI-BLAST(在BLAST2.0中)执行检测分子间疏远关系的迭代搜索。参见Altschul"a/.(1997)同上。当利用BLAST、GappedBLAST、PSI-BLAST时,可利用各自程序的缺省参数(例如,BLASTN用于核苷酸序列,BLASTX用于蛋白)。参见www.ncbi.nlm.nih.gov。比只于也可通过》见察手动进4亍。除非另有说明,本文提供的序列同一性/相似性值指使用版本10的GAP利用下列参数获得的值使用空位权重(GAPWeight)50和长度权重(LengthWeight)3以及nwsgapdna.cmp得分矩阵的核苷酸序列的百分比同一性和百分比相似性;使用空位权重8和长度权重2以及BLOSUM62得分矩阵的氨基酸序列的百分比同一性和百分比相似性;35或其任何等同程序。"等同程序"指任何序列对比程序,当与版本10的GAP产生的相应比对相比,其对于任何研究的两条序列,产生具有相同的核苷酸或氨基酸残基匹配的比对以及相同的百分比序列同一性。GAP利用NeedleinanandWunsch(1970)Mo/.48:443-453的算法,寻找两条完整序列的使匹配数最大和使空位数最小的比对。GAP考虑所有可能的比对和空位位置,并产生匹配;咸基lt最大和空位数最小的比对。其允许在匹配的碱基单位中提供空位产生罚分和空位延伸罚分。对于其插入的每个空位而言,GAP必须利用匹配的空位产生罚分数。如果选择的空位延伸罚分大于0,则对于插入的每个空位,GAP必须另外利用空位长度乘空位延伸罚分。在蛋白序列的GCGWisconsin遗传学软件包版本10中,缺省空位产生罚分值和空位延伸罚分值分别为8和2。对于核苷酸序列,缺省空位产生罚分是50,而缺省空位延伸罚分是3。空位产生罚分和空位延伸罚分可表示为选自整数0-200的整数。因此,例如,空位产生罚分和空位延伸罚分可以是0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。GAP是最佳比对家族的一个成员。该家族有许多成员,但其他的成员都不具有4交好的品质。GAP显示比对的4个价值数字品质(Quality)、比率(Ratio)、同一性(Identity)以及相似性(Similarity)。品质是为了比对序列而最大化的度量。比率是较短片段中碱基的数目除以品质。百分比同一性是事实上匹配的符号的百分比。百分比相似性是相似符号的百分比。忽略跨越空位的符号。对符号对的得分矩阵值大于或等于0.50(相似性阈值)时,对相似性进行评分。版本10的GCGWisconsin遗传学软件包所用的得分矩阵是BLOSUM62(参见HenikoffandHenikoff(1989)尸rac.iVaf/.^cad5W.89:10915)。(c)在两条多核苷酸或多肽序列环境中,本文所用"序列同一性"或"同一性,,指当在指定的对比窗口内比对最大一致性时两条序列中相同的残基。对于蛋白,当使用序列同一性百分比时,必须承认,不相同的残基位置经常因保守氨基酸取代而不同,其中氨基酸残基被具有相似化学特性(如电荷和疏水性)的其他氨基酸残基取代,且因此不改变分子的功能特性。当序列在保守取代方面不同时,可上调百分比序列同一性,以校正取代的保守特性。由这类保守取代而不同的序列被认为具有"序列相似性"或"相似性"。进行这种调整的方式对本领域技术人员而言是熟知的。通常,其包括将保守取代评为部分而不是完全的错配,据此增加百分比序列同一性。因此,例如,如果给予相同氨基酸的得分为1,而给予非保守取代的得分为0,则给予保守取代的得分为0至1。i口禾呈序PC/GENE(Intelligenetics,MountainView,California)中所执行的,计算保守取代得分。(d)本文所用"序列同一性百分比"意指通过比较对比窗口中两条最佳比对的序列而测定的值,其中,为了两条序列的最佳比对,对比窗口中多核香酸序列的部分与参照序列(其不含添加或缺失)相比,可含有添加或缺失(即空位)。百分比通过以下计算测定两条序列中相同核酸碱基或氨基酸残基出现的位置的数目,得出匹配位置的数目,用对比窗口中位置总数除匹配位置的数目,并且以100乘以结果,得出序列同一性百分比。本发明的方法可用来鉴定与任何已知基因靶群组共有同源区的新基因。在一个实施方案中,本发明的方法用于鉴定有效对抗多种害虫的新杀虫基因。对本发明的目的而言,害虫包括但不限于昆虫、真菌、细菌、线虫类、螨、原生动物病原体、动物寄生肝吸虫等。特别关注的害虫是虫害,特别是使农业植物产生显著损害的虫害。虫害包括选自下歹'J目的昆虫鞘翅目、双翅目、膜翅目(Hymenoptera)、鳞翅目、食毛目(Mallophaga)、同翅目(Homoptera)、半翅目、直翅目(Orthoptera)、缨翅目(Thysanoptera)、革翅目(Dermaptera)、等翅目(Isoptera)、虱目(Anoplura)、隐翅目(Siphonaptera)、毛翅目(Trichoptera)等,特别是鞘翅目和鳞翅目。本发明有关主要农作物的虫害包括玉米:玉米螟欧洲玉米螟(Europeancornborer);小地老虎(々ra"、—7—,小地老虎(blackcutworm);谷实夜蛾(Z/e/z'cove,zea),玉米穗虫(cornearworm);草i也夜虫我(S/0(io/ten3yh^/per^jf),牙火天^f亍军虫(fallarmyworm);西南玉米杆草螟(Z)/afraeagra"c/z'ase〃a),西南玉米杆草螟(southwesterncornborer);南美玉米苗斑螟(五/asmo/3a/pz^//g7ase〃us),小玉米茎虫主虫(lessercornstalkborer);小嚴螺(Z)/aZraeflfsacc/2ara//51),蔗螟(surgarcaneborer);玉米才艮虫(D/a6raf/cavz>gzjfera),西邵玉米才艮虫(westerncornrootworm);长角玉米才艮虫(Z)/aZ>ra/7'co/0wg7,corm、Z)"r6en〕,3匕吾卩才艮虫(northerncornrootworrn);南部玉,朱推、虫(D/"Zra/caM"fife"'mpwwctoto/2owani/),南邵玉米才艮虫(southerncornrootworm);金针虫属的种类(Me/a"owspp.),铁、线虫(wireworms);北方圓头犀金龟(Cyc/ocep/za/aZjorea/^),北方圆头犀金龟(northernmaskedchafer)(白色幼虫);Cyc/oce//za/az'm顧cw/ato,南方圆头犀金龟(southernmaskedchafer)(白色幼虫);日本金龟子(尸op/〃/ayopom'ca),日本金龟子(Japanesebeetle);玉米跳曱(67^^0^£7<3/1///^/"7'"),玉米3兆曱(cornfleabeetle);玉米象虫(5^/2ewo//20myz'cfc),玉米象虫(maizebillbug);玉米虫牙(i/zopa/os—附aW力,玉米叶虫牙(cornleafaphid);」,ra//^wa/d/rad/c/s,玉米才艮虫牙(cornrootaphid);麦长蝽(5/z、sws/ewco/^eras/ewcop/erw",麦鼠(chinchbug);赤月逸虫皇(iW"e/awop/w51/^mw;TwZ)n^w),赤腿虫皇(redleggedgrasshopper);黑虫皇(Me/awop/z^sawgw/w—力,迁移虫皇(migratorygrasshopper);种虫邑(/fy/價戸//afwra),种虫虽(seedcornmaggot);美洲黍潜叶虫电(^gramyza/arWcorm'力,玉米斑'潜叶虫(cornblotleafminer);玉米黄呆蓟马(^"ap/zo*—oZwcrwr—,草蓟马(grassthrips);贼虫义(5"o/e"o戸's脂7e加),贼虫义(thiefant);二斑叶螨(7^ra,c/zi^w"c—,二斑叶竭(twospottedspidermite);高粱:斑禾草螟(CMo;aWe〃w),高粱螟(sorghumborer);草地夜蛾,秋天4亍军虫;谷实夜蛾,玉米穗虫;南美玉米苗斑螟,小玉米茎蛀虫;斑点^艾蛾(Fe/"as由errawea),颗粒夜蛾(granulatecutworm);蜂螬(尸/^〃o//zflgacn'm.to),蜂螬(whitegrub);伪金针虫属CE/eocfes)、单叶叩曱属(Co"ofiferws)以及Jeo/ws属种类,纟失线虫;黑角负泥虫((9w/em"me/a"o/w),谷类叶曱(cerealleafbeetle);玉米跳曱;玉米象虫;玉米坊,玉米叶辨;甘蔗黄虫牙(57p/za/ava),甘蔗黄虫牙(yellowsugarcaneaphid);麦长棒,麦H;高粱癭蚊(Cowton'm'asorg/n'co/a),高粱癭蚊(sorghummidge);朱砂'叶螨(7^ra"yc/zwsc/朋"6aW"ws),朱石少叶螨(carminespidermite);二斑叶螨;小麦:一星4'占虫CPsew(ia/e^3w"/pwwctoto),津占虫(armyworm);草;也夜38蛾,碎火天行军虫;南美玉米苗斑螟,小玉米茎蛀虫;地老虎属04grafe),胖夜虫我属(oW/wgom'a),西部切才艮虫(westerncutworm);南美玉米苗斑虫冥小玉米茎蛀虫;黑角负泥虫,谷类叶曱;三叶草叶象(/fy;era;w"ctoto),三叶草叶象(doverleafweevil);南部玉米才艮虫;俄罗斯小麦虫牙虫(Russianwheataphid);麦二叉虫牙(Sc/2—油、gra脂'"謂),麦二叉虫牙(greenbug);麦长管虫牙(/v/acms抽認ave"ae),麦长管虫牙(Englishgrainaphid);赤腿蝗;殊种蝗(Me/a"o//w^^w""a/z'",殊种蝗(differentialgrasshopper);黑蝗,迁移蝗;黑森瘿蚊(May"/o/flcfeWractor),黑森瘿虫丈(Hessianfly);麦纟工吸i!il虫(5VtoA;p/as7、wose〃a""),小麦吸浆虫(wheatmidge);美洲麦秆虫菱(Mer画yza謹en.ccma),麦肝虫乾(wheatstemmaggot);coarctoto,麦》也种虫乾(wheatbulbfly);火因草莉马(FrawAi/mW/a/wsca),烟草蓟马(tobaccothrips);麦茎蜂(Cep/ms麦茎虫奪(wheatstemsawfly);曲叶螨(爿cen.ae),小麦曲叶虫葛(wheatcurlmite);向曰婆:5"w/ez'wa/ze/,a;^/zawa,向日葵花蕾蛾(sunflowerbudmoth);向曰蔡王赶螺(//0附0600附"e/ecfe//ww),向曰蔡域(sunflowermoth);(2yg0gramwaexc/amadom、),向曰葵曱(sunflowerbeetle);5of/^n^g/Z)6ayMs,古月萝卜金龟子(carrotbeetle);7Veo/os7.o/^eraww^/^W"a"a,葵花籽瘿蚊(sunflowerseedmidge);棉花:烟芽夜蛾v/msce"力,棉花虫牙虫(cottonbudworm);谷实夜蛾,棉铃虫(cottonbollworm);甜菜夜蛾ex一a),甜菜夜蛾(beetarmyworm);才帛纟工铃虫(i^cf/wop/zora;goM_y;/e〃a),才帛纟工铃虫(pinkbollworm);墨西哥冲帛铃象(v4wf/zo"omwsgrawcfe),斗帛铃象曱(bollweevil);才帛虫牙(v4//h、,才帛虫牙(cottonaphid);/^ewda/owo5re/z、ser/o^ws,棉盲棒(cottonfleahopper);温室粉虱(JhWew/W^y"Zmfz7o"ea),带纟文有翼粉虱(bandedwingedwhitefly);美国牧草盲蝽(丄ygM""eo/an'力,牧草盲椿(tarnishedplantbug);赤腿蝗;殊种蝗;烟蓟马(77zn:psto^c/),葱蓟马(onionthrips);烟草蓟马,烟草蓟马;朱砂叶螨;二斑叶螨;水稻:小蔗螟,蔗螟;草地夜蛾,秋天行军虫;谷实夜蛾,玉米穗虫;C0/w/7",葡萄肖叶曱(grapecolaspis);稻水象曱(丄^or/20,Mso,op/n7—,稻水象曱(ricewaterweevil);米象(幼o//zz71^o,ae),米象(riceweevil);二条黑尾叶蝉C/Ve;/zofem'xm'gra//"w力,黑尾叶蝉(riceleafhopper);麦长蝽,麦虱;稻绿蝽(Jcro他r"誦稻绿棒(greenstinkbug);大豆:大豆夜蛾(尸i^(io;7/願'a/"cWe"力,大豆夜蛾(soybean1aawa"、.3tt决/t",'-o,^"/^/,'rt、O乂々+沐/\、IUU]JCI乂5邻、1入、^1〃"IWAJfCi^C〃"〃WtL4"Jy7々J;_l,3、、V"VHU/L"11caterpillar);苜蓿绿夜蛾(/V威,ewasc"6ra),苜蓿绿夜蛾(greencloverworm);玉米螟,欧洲玉米螟;小地老虎;甜菜夜蛾;烟芽夜蛾,棉花蜂虫;谷实夜蛾,棉铃虫(cottonbollworm);墨西哥豆票瓜虫(iE^7ac/mavar/ves"s),墨、西哥豆票瓜虫(Mexicanbeanbeetle);才兆虫牙(Afyzws/ers/cae),桃虫牙(greenpeachaphid);马铃薯小绿叶蝉(五m/oosc"/a6ae),马铃薯小绿叶蝉(potatoleafhopper);稻绿蝽;赤腿蝗;殊种蝗;种蝇;大豆蓟马(Sen'cc^n)wvah"6z7/力,大豆蓟马(soybeanthrips);烟蓟马,葱蓟马;土耳其关斤坦叶螨(r"raw少c/msfwfesto"/),土耳其其斤坦叶蟎(strawberryspidermite);二斑叶螨;大麦:玉米螟,欧洲玉米螟;小地老虎;麦二叉蚜;麦长棒,麦虱;稻绿椿;褐臭蝽CEwsc/n、^yswvm力,褐臭蝽(brownstinkbug);灰地种蝇(De/^p/Wwra),种蝇;黑森瘿蚊;麦长腿蜘蛛CPdra6z'a/ate"力,麦长月逸蜘蛛(brownwheatmite);油菜:甘蓝虫牙(細Wco,"腦w'c—,甘蓝虫牙(cabbageaphid);甘蓝叶蚤(P/7少〃0^tocrw"/erae),3兆曱(Fleabeetle);蓓带夜蛾(Afamestraco"/gwrato),伯莎粘虫(Berthaarmyworm);小菜蛾(P/她〃axy/o他〃a),小菜蛾(Diamond-backmoth);J也种蝇属的种类(Z)e/z》ssp.),才艮蛆(Rootmaggots)。线虫类包括寄生线虫,如根结线虫、胞嚢线虫和根腐线虫,包括月包嚢线虫属的种类(//eteraderaspp.)、才艮瘤线虫属的种类(Afe/wWogy"espp.),以及球胞嚢属的种类(G/o6oc/eraspp.);特别是胞嚢线虫的成员,其包4舌<旦不卩艮于大豆月包嚢线虫(//eferaderag/_yc/"w)(soybeancystnematode,大豆孑包嚢线虫);甜菜月包嚢纟戋虫(77e&raden3!sc/^c/"0(beetcystnematode,舌计菜月包嚢线虫);燕麦胞嚢线虫(//"eracferaave"ae)(cerealcystnematode,禾谷孢嚢线虫);以及马铃薯金线虫(G/060&ramstoc/z/e/w/力和马铃薯白线虫(G/oZwcfera(马铃薯胞嚢线虫)。才艮腐线虫包括短体线虫属的种类(尸ra/y/e"c/n^spp.)。40本文所用术语植物包括植物细胞、植物原生质体、可再生植物的植物细胞组织培养物、植物愈伤组织(plantcalli)、植物团块(plantclumps),以及才直物或植物部分中完整的细胞,所述才直物部分如胚芽、花粉、胚珠、种子、叶、花、枝、果实、果仁、穗、穗轴、壳、茎、根、根尖、花药等。谷类意指除了种植和繁殖物种以外的目的由商业种植者生产的成熟种子。再生植物的子代、变体和突变体也包含于本发明的范围内,只要它们含有引入的多核苷酸。尽管本发明的方法可用于鉴定与任何已知基因靶群组同源的新基因,但本发明也可以例如用于鉴定新杀虫基因,所述新杀虫基因编码保护任何植物种类免遭害虫相关的损害的多肽,所述植物种类包括但不限于单子叶植物和双子叶植物。所关注植物种类的实例包括但不限于玉米(Zeo附<3>^)、芸苔属(5ra^z'ca)的种类(^口油菜(5.wap^)、芜菁(5.rapfl)、芥菜(及^"cea),特别是可用作籽油来源的那些芸莒属的种类、苜蓿(MWcago虚/va)、水稻虚/v")、黑麦(&ca/ecerea/e)、高粱(5brg7zwm6/co/o/-、5brg/zwmvw/gwe)、粟(^!口《良尾草(尸ewm、efwmg7awcww))、黍(户awz'cw附mz7/acew附)、谷子(5^fan'"zY"//ca)、禾參子(五/eww'"ecoracaMa)、向曰蔡(i/e/zYmf/^a朋ww力、红花(CaW/2awws"'w"on.w力、小麦(7H〃cwmaes〃vw附)、大豆(G7yc/wemax)、烟草(Mco"""atoZacwm)、马#募(5b/awwm化Z)erasMm)、$生(Jrafc/ni/z_y_pogaea)、才帛(》每岛冲帛kztafw"、木薯(Afam7zof^cw/ewto)、咖啡(咖啡树属的种类(Co^kspp.))、浙卩子(Cocos"wcz/en3)、菱萝(Jmwascomosw力、牙计片吉(斥甘才吉属的种类(C〃n^spp.))、可可(777eoZromacflcao)、茶(C"ame〃/crw./eww^)、香;^、(色蕉属的种类(Afwsaspp.))、鲟梨(尸e^sea、无花果(F/ct^ewrapa—、木瓜(Can.capapaya)、腰果(」wac"Wwwocc油"to/e)、坚果甘蔗(5Wcc/wn^spp.)、燕麦、大麦、蔬菜、观赏植物以及针叶树。蔬l菜包4舌番痴(Z^co/ers7.cowescw/ew^m)、莴苣(^口莴苣(丄""wca黧豆属的种类(丄a^yn^sspp.))、以及黄瓜属(Cwcwm、)的成员如黄瓜(C.^m'vw力、罗马甜瓜(C.ca"to/w;e"wX)以及甜瓜(C,we/o)。观赏植物包括杜鹃花(i^O(i。<ie"t^o"spp.)、八仙花(Macra//^〃a/z;^/ra"g—、木槿/Z_T''L"力-"八n"n""n—lA"j由/丄昆"5&di来/D八《"cmtA、、右Kv^^f,7t'""spp.)、7JC仙花(iVarc^MSspp.)、矮牵牛(P由"/a/2_y6W<ia)、康乃馨(Z)/awf/7MSca^yop/y^/ws)、《星《星木(五wp/2or6/a/^/c/zern.ma)k乂及菊花。可用于实践本发明的4十叶杉于包4舌例如+>如火炬+>(户/"^to^b)、湿地松(尸/"we〃/o"/)、西黄+〉(尸以、及辐射^^(尸/"wsnaft/z'a/a);花》真+〉(/^e"(io&wgamewzz'ey/z〕;力口拿大4失杉(7iwgac朋a(ie腦'力;白云杉(ZVceag7awca);红杉(5^wo/"sem/ervzVe"力;真冷片》^口^艮;令斗》(J6/es"wa6z7/力禾口香月旨冷才》(」6z'&k^omea);以及雪*〉如西方红色雪爭〉(77mya/"cato)和阿^立加斯加黄柏(C/wm"ec;^2n、"oo^^ew:y/》。在具体的实施方案中,本发明的植物是农作物(例如玉米、苜蓿、向日葵、芸苔属、大豆、棉、红花、花生、高粱、小麦、粟、烟草等)。在其他的实施方案中,玉米和大豆植物是最佳的,并且甚至在其他的实施方案中,玉米植物是最佳的。所关注的其他植物包括提供所关注的种子的谷类植物、含油种子植物以及豆科植物。所关注的种子包括谷类种子,如玉米、小麦、大麦、水稻、高粱、黑麦等。含油种子植物包括棉、大豆、红花、向日葵、芸苔属、玉米、苜蓿、棕榈、椰子等。豆科植物包括菜豆和豌豆。菜豆包括瓜尔豆、刺槐豆、胡声巴、大豆、青刀豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。本文所用的冠词"a"和"an"指该冠词的一个或多于一个(即至少一个)合乎文法的目标。作为实例,"anelement(元件)"意指一个或多个元件。通过举例而非限制的方式,提供了下列实施例。实验实施例l:新杀虫基因的鉴定价|在Z)AC4的为、專将各种份菌抹的甘油贮藏物在LB琼脂平板上划线培养。次日,将每个菌株的单个菌落接种于48孔板的每孔2mLTB培养基中。该板28。C温育过夜并250rpm离心。室温下6,000xg离心10分钟,收获细胞。通过涡旋,将细胞沉淀重悬浮于P1悬浮緩冲液(Qiagen)中。分别用P2和P3緩沖液裂解和中和细胞,用外加真空吸尘机,将裂解物转移至TurboFilters(Qiagen)。将滤液粘着于QIAprep板,并用PB和PE(Qiagen)緩冲液洗涤。用EB緩沖液洗脱质粒制备物,并在96孔板中收集。岸一轮尸C//f并,核茅^f/參的谈^为了鉴定新价基因,即与已知Cry基因同源的基因以及代表新Cry基因家族的杀虫基因两者,设计所关注的已知份基因的靶群组中高同源区的寡核苷酸引物。在本实施例中,靶群组含有具有针对鳞翅目和鞘翅目昆虫的杀虫活性的已知Cry基因,但不含有双翅目活性Cry基因。具体来说,从公共数据库中收集靶群组中所有已知ACry基因的核香酸序列,并比对这些序列。将符合严格的引物设计条件的沿着核苷酸序列的几个DNA区定位于所选择的A基因中。这些区域是杀虫5f基因的"特征序列",因为少数DNA序列(17-24个连续核苷酸),存在于所有已知的杀虫价基因中。选择的初始引物长度具有54。C的Tm,且观察从所选择的特征序列的5'端开始的连续寡核苷酸的窗口。具体来说,检查窗口内的核苷酸序列,以确定是否存在如下序列特征1)不具有4个或更多个连续相同的核苷酸残基;2)在该核苷酸序列3,端最后5个残基中具有不多于2个的鸟嘌呤或月包嘧,定残基;3)具有固定在5斗。C土"C的解链温度Tm;4)不形成发夹或二聚体结构;5)存在于来自杀虫基因靶群组(即比对)中的至少l条核苷酸序列中;以及为了增加引物的多样性,工允许一个碱基对是n:其中n选自腺噪呤、胸腺嘧,定、胞嘧梵和鸟。票呤。如果存在所有序列特征,则选择核苷酸窗口中的核苷酸序列,用作第一轮PCR的寡核苷酸引物。如果窗口中的核苷酸序列不具有所期望的序列特征,则通过向特征序列的3'移近1bp,选择连续核苷酸的邻近窗口,并重复该过程。根据本方法设计正向和反向引物两者。此外,设计正向和反向引物,以便它们与所关注杀虫基因中相隔约50bp至约150bp的核苷酸序列互补。图1提供了设计第一轮PCR引物的一般性方法的示意图。,一發PCi,增5TBi#嚴使用上文所述设计的寡核苷酸引物,进行分离于份菌株的核苷酸材料的第一样品的第一轮PCR扩增。具体来说,通过PCR在下列反应条件下,扩增96孔板中份质粒制备物模板DNA的量100ng引物的量7.5nmole(5[xMxl.5|iL)反应混合物的体积25(iLAmpliTagGoldDNA聚合酶激活95°C,10分钟PCR循环(40个循环)95°C15秒;60°C1分钟使用SYBRGreen荧光染料和7700ABIPrism序列检测系统,根据本领域已知的方法,检测第一轮扩增的PCR产物。用来自含有Cry8Bb1基因的DP菌株1218-1的质粒制备物作为阳性对照。参见2001年10月23日4是交的才示题为"GenesEncodingNovelProteinswithPesticidalActivityAgainstColeopterans(编码具有4十对鞘翅目的杀虫活性的蛋白的基因)"的未决美国专利申请10/032,717,将其全文通过引用并入本文。利用上文所述的PCR条件,1218-1质粒制备物在7700ABIPrism序列检测系统中产生了PCR扩增的标准曲线,获得的阳性对照的CJ直为约13。检测仅含PCR反应混合物而无DNA模板的阴性对照,产生了约35的Ct值。选择产生Ct值低于16的份质粒制备物,并将其称为SYBRGreen阳性。用SYBRGreen引物组中的所有反向引物(即第一轮PCR所用的反向寡核苷酸引物)产生第二轮PCR的正向引物(即第一轮引物的反向模板)。这些引物的功能是作为SYBRGreen步骤(即第一轮PCR)和第二轮PCR之间的桥梁。基本上如上文设计第一轮寡核苷酸引物时所述,设计第二轮PCP、所用的反向引物。将该PCP、引物的Tm保持在54。C±2°C,并将其设计为产生约650bp至约700bp的片段。图l提供了设计第二轮PCR引物的一般性方法的示意图。从在第一轮PCR中鉴定为SYBRGreen阳性的价菌林中分离质粒DNA,接着进行第二轮PCR。使用QiagenMultiplexPCR试剂盒以及上文所述的份质粒制备物,第二轮PCR的条件如下DAN:0.5吗程序95。C15分钟94。C30秒54°C1.5分钟720C1.5分钟35x从第2步到第4步72。C10分钟4°C待机用1.0%的琼脂糖凝胶电泳,分析第二轮PCR的反应物,并利用平末端载体试剂盒(Invitrogen),将650bp-700bp的期望片段克隆至细菌克隆载体。连接后,将产物转化入Top10五.co/纟感受态细胞(Invitrogen)。制备来自单个细菌菌落的质粒DNA,并通过下文所述的斑点印迹分析,进行分析。虚,《伊遂为、浙为了根据分析除去已知的份基因,以及为了鉴定含有第一轮和第二轮PCR所用的特征序列的新杀虫基因,进行斑点印迹分析。具体来说,将分离自单个细菌菌落的质粒DNA点涂于带有阳性电荷的尼龙第二轮PCR中产生的期望的DAN序^J片段内。图l提供了用于斑点印迹步骤的一般性探针设计方法的示意图。经设计,所有探针的Tm45均为74。C土2C。在所有三个步骤(即第一4仑PCR、第二轮PCR以及斑点印迹分析)中,寡核苷酸引物/探针的Tm是固定的。以便引物/探针的混合物可用于每一步骤。用DIG寡核普酸3,端标记试剂盒(Roche),标记寡核苦酸探针,并用来篩选已知A基因的斑点印迹。单独检测探针混合物中的每一个探针,以确保每个探针的特异性和有效性。根据进一步分析,除去通过斑点印迹分析特征为对已知份基因阳性的所有质粒制备物。将通过斑点印迹分析为阴性的质粒制备物进行如下文所述的进一步序列分析,以评估新颖性。对第二轮PCR中产生的并且特征为通过斑点印迹分析为"阴性"的核酸(即650bp-700bp的片段)进行测序。使用Blast,将这些核酸的序列结果与公共数据库中可用的核苷酸序列进行对比。如果序列分析显示潜在的新价基因,则利用基因组Walker通用试剂盒(BectonDickinsonBioscience),获得该全长基因的核苷酸序列。如上文所述,进一步分析推断的全长新杀虫基因的核苷酸序列,以证实新颖性。通过本发明的方法鉴定新杀虫基因,如SEQIDNOs:l、3和5所示的新基因(以及由其编码的分别为SEQIDNOs:2、4和6所示的多肽)。如下文所述,测试新杀虫基因的杀虫活性。i如縱将新杀虫基因克隆入表达载体,并分析其对玉米虫害的杀虫活性。此类方法在本领域中通常是已知的。分析针对鞘翅目昆虫的杀虫活性的方法在本领域中是已知的,并且描述于例如美国专利申请公布2002/0151709中。针对鳞翅目昆虫的杀虫活性的分析法公开于例如美国专利申请公布2005/0138684中。潜果生物测定的结果列于表1和表2中。46表l:具鳞翅目昆虫活性的新杀虫基因<table>tableseeoriginaldocumentpage47</column></row><table>本说明书提到的所有出版物和专利申请表示本申请所属
技术领域
技术人员的水平。所有出版物和专利申请通过引用并入本文的程度,如同明确和单独地指出每个单个出版物或专利申请通过《1用并入。尽管出于清楚理解的意图,以举例和实施例的方式相当详细地描述了上述发明,但显然在所附的权利要求书的范围内可做某些变化和更改。权利要求1.鉴定新杀虫基因的方法,所述方法包括a)设计对杀虫基因靶群组具有特异性的用于第一轮PCR的至少一对寡核苷酸引物,所述引物对含有正向引物和反向引物,其中每个引物靶向存在于靶群组的核苷酸序列中的特征序列;b)从所关注微生物中获得核酸材料的第一样品;c)在适宜PCR扩增的条件下,将核酸材料的第一样品与用于第一轮PCR的至少一对寡核苷酸引物以及热稳定DNA聚合酶混合;d)进行第一轮PCR并检测PCR扩增产物,据此测定PCR产物是否在第一轮PCR中产生;e)如果在第一轮PCR中检测到PCR产物,则从该微生物中获得核酸材料的第二样品;f)设计对杀虫基因靶群组具有特异性的用于第二轮PCR的至少一对寡核苷酸引物,所述引物对含有正向引物和反向引物,其中每个引物靶向存在于靶群组的核苷酸序列中的特征序列;g)在适宜PCR扩增的条件下,将所述核酸材料的第二样品与用于第二轮PCR的至少一对寡核苷酸引物以及热稳定DNA聚合酶混合,并进行第二轮PCR;h)使用琼脂糖凝胶电泳分离第二轮PCR产生的任何PCR扩增产物,并分离用于进一步分析的核酸片段,其中所述核酸片段可能含有推断的新杀虫基因片段;i)将每一个核酸片段克隆入克隆载体;j)用所述克隆载体转化宿主细胞,其中所述克隆载体含有步骤(h)中分离的核酸片段;k)从含有克隆载体的单个宿主集落中制备核酸样品;1)使用对靶群组中所有已知杀虫基因具特异性的标记的探针,对来自单个宿主集落的核酸样品进行斑点印迹分析,其中所述斑点印迹分析步骤未检测到的步骤(h)中分离的核酸片段含有推断的新杀虫基因片段;以及m)分析所述推断的新杀虫基因片段。2.如权利要求l所述的方法,其中所述所关注微生物包括苏云金芽孑包軒菌(5ac/〃ws决,'"gfem7》菌林。3.如权利要求2所述的方法,其中从所关注的所述微生物中获得核酸材料的第一和第二样品包括从苏云金芽孢杆菌菌抹中制备质粒DNA。4.如权利要求l所述的方法,其中从所关注的所述微生物中获得核酸材料包括分离DNA。5.如权利要求l所述的方法,其中所述杀虫基因靶群组含有苏云金芽孢杆菌Cry基因。6.如权利要求5所述的方法,其中所述耙群组含有对鞘翅目昆虫具杀虫活性的苏云金芽孢杆菌Cry基因。7.如权利要求1所述的方法,其中所述第一轮PCR包括进行定量实时PCR。8.如权利要求7所述的方法,其中在存在荧光体时进行第一轮PCR,所述荧光体能指示PCR产物的存在并提供有关PCR产物数量的信号。9.如权利要求8所述的方法,其中说是荧光体是染料。10.如权利要求9所述的方法,其中所述染料是SYBR⑧Green。11.如权利要求1所述的方法,其中用于斑点印迹分析的、对靶群组中所有已知杀虫基因具特异性的所述标记的探针经设计,对第二轮PCR中产生的核苷酸片段中的区域具特异性。12.如权利要求1所述的方法,其中用于斑点印迹分析的所述标记的探针的热解链温度(Tm)为约70。C至约85。C。13.如权利要求12所述的方法,其中所述Tm为约80。C。14.如权利要求5所述的方法,其中第一轮PCR所用的所述至少一对寡核苷酸引物经设计,对苏云金芽孢杆菌Cry基因结构域1中的核香酸序列具特异性。15.如权利要求5所述的方法,其中第二轮PCR所用的所述至少一对寡核苦酸引物经设计,对苏云金芽孢杆菌Cry基因结构域2中的核普酸序列具特异性。16.如权利要求l所述的方法,其中第一和第二轮PCR所用的所述至少一对寡核苷酸引物的Tm为约50。C至约65°C。17.如权利要求16所述的方法,其中所述Tm为约52°C至约56。C。18.如权利要求1所述的方法,其中分析所述推断的新杀虫基因片段包括核苷酸序列分析。19.如权利要求18所述的方法,其中所述核苷酸序列分析包括将含有推断的新杀虫基因片段的核酸进行测序,并将推断的新杀虫基因片段的核苷酸序列与所有已知的杀虫基因比较,据此确定所述片段是否是新的。20.如权利要求19所述的方法,如果确定所述片段是新的,则还包括对推断的新杀虫基因的全长进行测序。21.如权利要求20所述的方法,还包括将所述新杀虫基因克隆入克隆载体并评估所述新杀虫基因编码的多肽的杀虫活性。22.如权利要求21所述的方法,其中评估所述杀虫活性包括进行生物测定。23.如权利要求l所述的方法,其中第一轮PCR所用的对杀虫基因耙群组具特异性的所述至少一对寡核普酸引物含有对所述靶群组所有成员共有的同源区具特异性的引物。24.如权利要求23所述的方法,其中第一4仑PCR中的所述反向寡核苷酸引物用于产生第二轮PCR的正向引物。25.如权利要求l所述的方法,所述第一轮PCR所用的所述正向和反向寡核苷酸引物与杀虫基因靶群组中相隔约50碱基对(bp)至约150bp的核苷酸序列互补。26.如权利要求l所述的方法,其中所述第二轮PCR所用的所述寡核苷酸引物经设计,产生长度为约600bp至约750bp的片段。27.如权利要求26所述的方法,其中所述第二轮PCR所用的所述寡核苷酸引物经设计,产生长度为约650bp至约700bp的片段。28.如权利要求1所述的方法,其中设计对杀虫基因靶群组具特异性的第一轮PCR所用的至少一对寡核苷酸引物包括a)进行所述靶群组中所有核苷酸序列的比对;b)鉴定杀虫基因靶群组的核苷酸序列中的特征序列,其中特征序列含有所述耙群组所有成员之间的同源区;c)选择初始引物长度,其中所述初始引物长度为约15bp至30bp;d)进行第一轮寡核芬酸引物序列的篩选,所述筛选包括观察所述靶群组核苷酸序列的特征序列中连续核苷酸序列的初始窗口,其中所述初始窗口起始于所述特征序列的核苷酸序列的5'端;e)确定初始窗口中的核苷酸序列是否具有下述(i)至(vi)的序列特征i)不具有4个或更多个连续相同的核苷酸残基;ii)在所述普酸序列3'端最后5个残基中具有不多于2个鸟噪呤或力包嗜,定残基;iii)具有约50。C至65°C的Tm;iv)不形成发夹结构或二聚体结构;v)存在于杀虫基因靶群组中核苷酸序列的至少一条序列(即上述的比对)中;以及vi)在来自杀虫基因非靶群组的核苷酸序列中不是保守的。其中所观察的核苷酸序列内的一个核苷酸残基允许是n,其中n是选自腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶的任一核苷酸;f)如果存在步骤(e)中的所有序列特征,则选择所述初始窗口中的核苷酸序列,用作寡核苷酸引物;g)如果所述初始窗口不具有步骤(e)中所有的序列特征,则通过将第一窗口向把群组的核苦酸序列中的特征序列的3'端移动1个碱基对,选择连续核苷酸的邻近窗口,其中所述邻近窗口的长度与初始引物长度相等;h)用邻近窗口重复步骤(e)-(g),直到鉴定了具有所有所述序列特征的核苷酸序列或直到筛选了靶群组的全部特征序列;以及i)如果通过筛选第一特征序列鉴定无核苷酸序列具有所有所述特征,则在所述杀虫基因耙群组中选择第二特征序列,并进行其他轮的筛选,包括使用所述第二特征序列重复步骤(c)至(h)。29.如权利要求28所述的方法,其中所述Tm为约52。C至约56。C。30.如权利要求28所述的方法,其中设计对所述杀虫基因靶群组具特异性的所述第一轮PCR所用的至少一对寡核苷酸引物,包括根据权利要求28所述的方法设计简并寡核苷酸引物对的混合物,以便每对寡核苷酸引物对所述靶群组中尽可能多的杀虫基因具有特异性。31.如权利要求30所述的方法,其中根据权利要求30设计的所述寡核苷酸引物对的混合物用于第一轮PCR中。32.如权利要求28所述的方法,其中设计对所述杀虫基因靶群组具特异性的所述第二轮PCR所用的至少一对寡核苷酸引物包括a)利用第一轮PCR的反向寡核苷酸引物产生第二轮PCR中的正向寡核苷酸引物;b)进行杀虫基因靶群组中所有核苷酸序列的比对,以设计第二轮PCR所用的反向寡核苷酸引物;c)鉴定所述靶群组的核苷酸序列中的特征序列,其中特征序列含有所述靶群组所有成员之间的同源区,且其中用于设计所述第二轮PCR的反向引物的所述特征序列位于用于设计所述第一轮PCR所用的反向寡核香酸引物的特征序列的3'端;d)进行权利要求28的步骤(c)至(i),直到鉴定具有所有所述序列特征的核苷酸序列,并选择所述核苷酸序列用作第二轮PCR的反向引物。33.如权利要求32所述的方法,其中所述Tm为约52。C至约56。C。34.如权利要求32所述的方法,其中设计对杀虫基因靶群组具特异性的用于第二轮PCR的至少一对寡核苷酸引物,包括根据权利要求32所述方法设计简并寡核苷酸引物对的混合物,以便每对寡核香酸引物对所述靶群组中尽可能多的杀虫基因具特异性。35.如权利要求34所述的方法,其中根据权利要求34设计的所述寡核苷酸引物对的混合物用于第二轮PCR中。36.如权利要求l所述的方法,其中根据权利要求30设计的简并寡核苷酸引物对的混合物用于第一轮PCR中,且其中根据权利要求34设计的简并寡核香酸引物对的混合物用于第二轮PCR中。37.鉴定与已知基因靶群组共有同源性的新基因的方法,所述方法包括a)设计对基因靶群组具特异性的用于第一轮PCR的至少一对寡核苷酸引物,所述引物对含有正向引物和反向引物,其中每个引物靶向存在于所述靶群组的核苷酸序列中的特征序列;b)从所关注有机体中获得核酸材料的第一样品;c)在适宜PCR扩增的条件下,将核酸材料的第一样品与用于第一轮PCR的至少一对寡核香酸引物以及热稳定DNA聚合酶混合;d)进行第一轮PCR并检测PCR扩增产物,据此测定PCR产物是否在第一轮PCR中产生;e)如果在第一轮PCR中检测到PCR产物,则从所述有机体中获得核酸材料的第二样品;f)设计对基因耙群组具有特异性的用于第二轮PCR的至少一对寡核普酸引物,所述引物对含有正向引物和反向引物,其中每个引物靶向存在于所述靶群组的核苷酸序列中的特征序列;g)在适宜PCR扩增的条件下,将所述核酸材料的第二样品与用于第二轮PCR的至少一对寡核香酸引物以及热稳定DNA聚合酶混合,并进行第二轮PCR;h)使用琼脂糖凝胶电泳分离第二轮PCR产生的任何PCR扩增产物,并分离用于进一步分析的核酸片段,其中所述核酸片段含有与所述耙群组的基因共有同源性的推断的新基因片段;i)将每个核酸片段克隆入克隆载体;j)用所述克隆载体转化宿主细胞,其中所述克隆载体含有步骤(h)中分离的核酸片段;k)从含有克隆载体的单个宿主集落中制备核酸样品;1)使用对靶群组中所有已知基因具特异性的标记的探针,对来自单个宿主集落的核酸样品进行斑点印迹分析,其中所述斑点印迹分析步骤未检测到的步骤(h)中分离的核酸片段含有与所述靶群组的基因共有同源性的推断的新基因片段;以及m)分析所述推断的新基因片段。全文摘要本发明提供了鉴定与所关注基因靶群组中已知基因共有同源区的新基因的方法和组合物。所述方法包括系统地设计寡核苷酸引物并进行所关注有机体核酸材料的连续轮的PCR扩增,所述寡核苷酸引物对已知基因靶群组的核苷酸序列中的同源区是特异性的。PCR步骤意在鉴定和扩增既含有已知基因又含有新基因的核酸。使用对靶群组中已知基因具特异性的寡核苷酸探针,通过斑点印迹分析检测含有已知基因的核酸分子,且出于进一步的考虑,将其除去。将潜在的新基因进行进一步序列分析以证实其新颖性,并测定其生物学活性。本发明的组合物包括包含新基因的新多核苷酸和其变体和片段,以及其编码的多肽。文档编号C12Q1/68GK101506382SQ200780030667公开日2009年8月12日申请日期2007年7月20日优先权日2006年7月21日发明者安德烈·R·阿贝德,施晓梅,比利·F·麦卡特彻恩,苏珊·B·罗,华董申请人:先锋高级育种国际公司;纳幕尔杜邦公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1