苏云金芽孢杆菌分泌的杀虫蛋白及其应用的制作方法

文档序号：3555902阅读：598来源：国知局

专利名称：苏云金芽孢杆菌分泌的杀虫蛋白及其应用的制作方法
技术领域：
本发明涉及一个编码杀虫蛋白及其杀虫片段的新的核酸序列家族。特别指出的是，本发明涉及这里定名的示例性的蛋白TIC901、TIC120、TIC407、TIC417和TIC431及其有杀虫作用的片段，这些蛋白由这里定名的示例性的核酸编码序列tic901、tic1201、tic407、tic417和tic431分别编码；也涉及核苷酸序列同源物，这些同源物(1)编码杀虫蛋白且(2)在选自严格杂交条件和特异杂交条件的杂交条件下，与tic901、tic1201、tic407、tic417和tic431编码序列杂交。本发明还涉及到用本发明的核苷酸序列或基于tic901基因、相关基因、和/或其同源物的变异核苷酸序列转化的宿主细胞，尤其是那些为促进在植物中表达而修饰的序列所转化的宿主细胞。在优选的实施方案中，转化的宿主细胞是植物细胞。
背景技术：
苏云金芽孢杆菌(Bacillus thuringiensis)是一种在孢子形成过程中产生蛋白质晶状包含体的革兰氏阳性细菌。这些苏云金芽孢杆菌的晶体蛋白对某些特定的昆虫常常是有高毒性的。来源于不同苏云金芽孢杆菌菌株的晶体蛋白被证实对鳞翅目(毛虫)、双翅目(蚊子、苍蝇)和鞘翅目(甲虫)昆虫目的昆虫幼虫具有杀虫活性。
单个的苏云金芽孢杆菌晶体蛋白，也叫做δ-内毒素或伴孢晶体或是毒素蛋白，在其结构和杀虫活性上的差异很大。这些杀虫蛋白通常是由定位于大质粒的基因所编码的，这些大质粒发现于苏云金芽孢杆菌中，大于30兆道尔顿。许多苏云金芽孢杆菌的毒素基因已经被克隆且杀虫晶体蛋白产物的特异性杀虫作用也已经得到鉴定。可见关于苏云金芽孢杆菌毒素基因和晶体蛋白的综述文章(如Hotte et al.，1989；Schnepf et al.，1998)。
苏云金芽孢杆菌的杀虫特性早已被认识到，而且将苏云金芽孢杆菌的菌株加入到市售生物杀虫剂产品已经超过了四十年的时间。市售苏云金芽孢杆菌杀虫剂的典型成分是干燥的芽孢化的苏云金芽孢杆菌发酵培养物，其晶体蛋白对不同种的昆虫有毒性。
传统的市售苏云金芽孢杆菌生物杀虫剂产品来源于“野生型”的苏云金芽孢杆菌，即分离于自然界来源的苏云金芽孢杆菌菌株的纯化培养。较新的市售苏云金芽孢杆菌生物杀虫剂产品是基于遗传改造的苏云金芽孢杆菌株，如美国专利5,080,897和4,935,353中所描述的转接合(transconjugant)苏云金芽孢杆菌株。
不同的苏云金芽孢杆菌是基于其鞭毛与抗体的反应来分类。一种苏云金芽孢杆菌的鞭毛和一种独特的抗体反应就被分类为一种血清独特型，并且已经描述的血清独特型苏云金芽孢杆菌及其亚种超过30种(DeBarjac和Frachon，1990)。
苏云金芽孢杆菌的每个亚种常常产生独特类型的杀虫晶体蛋白。例如，苏云金芽孢杆菌的却氏卡奇(kurstaki)亚种产生对毛虫有毒性的晶体蛋白，大小约130千道尔顿(KD)和70KD，而苏云金芽孢杆菌的拟步甲(tenebrionis)亚种产生一个约72KD的对甲虫有毒性的晶体蛋白。
晶体蛋白的一个特征是它们能在苏云金芽孢杆菌的母细胞内聚合成晶体。随母细胞的裂解，这些蛋白以晶体形式释放到外界环境中。另外苏云金芽孢杆菌也产生非晶体蛋白，与晶体蛋白相反，这些非晶体蛋白被苏云金芽孢杆菌细胞以可溶蛋白形式分泌到培养基中。苏云金芽孢杆菌分泌的非晶体蛋白包括磷脂酶、蛋白酶和β-内酰胺酶，这些蛋白几乎没有杀虫活性。然而，苏云金芽孢杆菌分泌的三种非晶体蛋白，命名为Vip1，Vip2和Vip3，据报导对鞘翅目和鳞翅目昆虫具有毒性(Estruch等，1996；美国专利No.5,866,326；WO94/21795；WO96/10083)。另一种苏云金芽孢杆菌的非晶体蛋白，命名为CryV，据报导对鳞翅目昆虫具有毒性(Kostichka等，1996)。以前已经鉴定了许多分泌产生杀虫蛋白毒素到胞外的苏云金芽孢杆菌的分离株(美国专利号No.5,840,868；美国专利号No.5,849,870；美国专利No.5,866,326；美国专利No.5,872,212；美国专利No.5,877,012；美国专利No.5,888,801；美国专利No.6,204,435；美国专利No.6,242,669；美国专利No.6,279,369)。所有这些菌株都显示出产生一种或多种VIP或CryV毒性蛋白或密切相关的同源物。令人惊奇的是，在这里本发明者揭示了一类新的胞外分泌的杀虫蛋白毒素，并且这类毒素与已知的VIP类或CryV类蛋白不表现同源性。
氨基酸序列比对显示，本发明中的蛋白不涉及Vip1、Vip2、Vip3、WAR、MIS和CryV蛋白类。进一步的对比显示，本发明中的蛋白不涉及137种或多或少已知的苏云金芽孢杆菌昆虫-毒性蛋白中的任一种(Crickmore等，1998)。实际上，本发明的蛋白序列与美国国家基因资源中心(GenBank，Santa Fe，NM)中收录的上千条蛋白序列中任何一条都没有显著的同源性。在GenBank数据库中的BLAST搜索鉴定出仅有两条蛋白可能与TIC901有同源性。球状杆菌Mtx2杀虫蛋白与TIC901比对，在连续的135个氨基酸序列中，仅有21％的氨基酸序列一致。由禽痘病毒基因组推导出的可能表达的氨基酸序列与TIC901比对，在连续的147个氨基酸序列中，仅有27％的氨基酸序列一致。
发明概述在一个实施方案中，本发明涉及一种分离并纯化的杀虫蛋白。该蛋白基本上表现出如SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10和SEQ ID NO33所示的氨基酸序列，无论是作为前体氨基酸序列或是成熟的和/或这些氨基酸序列的加工和分泌形式，或是相关的氨基酸序列及其同源物。TIC901及其相关蛋白的杀虫活性已经用马铃薯甲虫(CPB)以及西部和南部的玉米根叶甲的生物检定实验证实。正如这里所示，这些蛋白尤其对包括马铃薯甲虫(舞毒蛾(Lymantria dispar))和玉米根叶甲(CRW)在内的鞘翅目昆虫具有毒性。
在另一个实施方案中，本发明也涉及一种分离并纯化的核苷酸序列，即一种编码序列，包含如SEQ ID NO3、SEQ ID NO5、SEQID NO7、SEQ ID NO9和/或SEQ ID NO32中所示的核苷酸序列以及其相关序列或同源物。天然或野生型的tic901编码序列如SEQ IDNO3所示，它编码天然TIC901前体、前蛋白或是前毒素蛋白，其具有SEQ ID NO4所示的氨基酸序列。生物体产生的TIC901蛋白显示杀虫活性和/或抗虫特性(insect-resistance)。一种杀虫氨基酸序列，其相应的蛋白由细胞从SEQ ID NO3表达并位于杆菌细胞周围的胞外空间，对应的蛋白组成如SEQ ID NO4所示从约第44位氨基酸至约第367位氨基酸。天然的或野生型tic1201编码序列如SEQID NO5所示，其编码的前体蛋白TIC1201具有SEQ ID NO6所示的氨基酸序列。一种杀虫氨基酸序列，其相应的蛋白由细胞从SEQID NO5表达并位于杆菌细胞周围的胞外空间，对应的成熟蛋白组成如SEQ ID NO6所示从约第44位氨基酸至约第364位氨基酸。天然的或野生型tic407编码序列具有SEQ ID NO7所示序列，其编码的TIC407前体、前体蛋白或前毒素蛋白具有SEQ ID NO8所示的氨基酸序列。一种杀虫氨基酸序列，其相应的成熟蛋白位于杆菌细胞周围的胞外空间，细胞从SEQ ID NO7表达蛋白，对应的成熟蛋白组成如SEQ ID NO8所示从约第44位氨基酸至约第367位氨基酸。天然的或野生型tic417编码序列具有SEQ ID NO9所示序列，其编码的TIC417前体、前体蛋白或前毒素蛋白具有SEQ ID NO10所示的氨基酸序列。一种杀虫氨基酸序列，其相应的成熟蛋白位于杆菌细胞周围的胞外空间，细胞从SEQ ID NO9表达蛋白，对应的成熟蛋白组成如SEQ ID NO10所示从约第44位氨基酸至约第364位氨基酸。天然的或野生型tic431编码序列具有SEQ ID NO32所示序列，其编码的TIC431前体、前体蛋白或前毒素蛋白具有SEQ IDNO33所示的氨基酸序列。一种杀虫氨基酸序列，其相应的成熟蛋白位于苏云金芽孢杆菌细胞周围的胞外空间，细胞从SEQ ID NO33表达蛋白，对应的蛋白组成如SEQ ID NO33所示从约第44位氨基酸至约第364位氨基酸。核苷酸的同源物，即在严格杂交条件下可与这里公开的每条或任何一条序列杂交的编码杀虫蛋白的核苷酸序列，也被明确的包括于本专利范围内。
在又一个实施方案中，本发明涉及一种转化了质粒载体的苏云金芽孢杆菌的生物纯培养物，该质粒载体包含如SEQ ID NO3、SEQID NO5、SEQ ID NO7、SEQ ID NO9和/或SEQ ID NO32所示核苷酸序列及能在发酵过程中产生杀虫蛋白并将蛋白分泌到菌株周围的胞外空间相关的核苷酸序列或同源物。一种示例性菌株EG12450按照布达佩斯条约(Budapest Treaty)被永久保藏，检索号为NRRL B-30357。
在又一个实施方案中，本发明也涉及一株指定为EG2158菌株的苏云金芽孢杆菌生物纯培养物，该菌株对鞘翅目昆虫表现杀虫活性。苏云金芽孢杆菌EG2158菌株代表了一种分离出tic901编码序列的野生型苏云金芽孢杆菌，该菌株按照布达佩斯条约被永久保藏，检索号为NRRL B-18213。这里显示的EG2158菌株产生至少两种杀虫蛋白，包含选自SEQ ID NO4和SEQ ID NO10的氨基酸序列。
在又一个实施方案中，本发明提供一种包含如SEQ ID NO3所示核苷酸序列的载体，该核苷酸序列编码SEQ ID NO4所示的TIC901氨基酸序列。一种含有SEQ ID NO3核苷酸序列质粒的大肠杆菌已在2002年2月6日，按照“国际承认用于专利程序的微生物保藏布达佩斯条约”(″Budapest Treaty on the InternationalRecognition of the Deposit of Microorganism for the Purposes of PatentProcedure″)保藏于美国农业部农业研究服务中心北部研究实验室(Northern Regional Research Lab of Agricultural Research ServiceCenter Collection (NRRL)，USDA)，其检索号为NRRL B-30549。这里所示的包含所述核苷酸的质粒为pEG1381。
在又一个实施方案中，本发明提供一种如SEQ ID NO3所示的核苷酸序列，该序列编码TIC901氨基酸序列，其寡聚核苷酸部分可以被标记用作杂交探针来鉴定编码相关杀虫蛋白或其同源物的其他相关基因。这里特别举例说明的其他相关核苷酸序列包含如SEQ IDNO5、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32所示序列，每个序列分别编码如SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10和SEQ ID NO33所示的杀虫蛋白毒素。
在再一个实施方案中，本发明提供用编码如SEQ ID NO4所示核苷酸序列的TIC901蛋白及其杀虫片段转化的植物细胞和植物。该核苷酸序列可被植物细胞翻译和表达并且在植物组织中有足够的翻译表达水平以抑制或杀死鞘翅目害虫。单子叶植物和双子叶植物都在本发明的范围内。可能需要修饰序列以引起最大水平表达和提高含有该序列的植物产生杀虫水平的TIC901蛋白的能力。
在再一个实施方案中，本发明也提供了制备一种转基因植物的方法，该转基因植物表现出编码TIC901核苷酸的表达水平的提高和其后杀虫蛋白TIC901水平的提高。因此，与没有转化TIC901或相关蛋白核苷酸序列的植物相比，转化了这里公开的修饰后核苷酸的植物表现出抗鞘翅目害虫能力的改良或提高。
完成上述的工作后，本发明提供了一种在植物中表达编码TIC901蛋核苷酸序列的方法，该方法包含步骤有将一段核苷酸序列以5′到3′的方向插入植物细胞的基因组中，该核苷酸序列包含植物功能性启动子并连接在为植物表达而优化的结构DNA序列上，使其能产生如SEQ ID NO4所示编码TIC901多肽序列的RNA序列，或是能产生与SEQ ID NO4有至少约80％、或至少约85％、或至少约90％、或至少约95％、或至少约99％以上同一性的氨基酸序列的RNA序列，该核苷酸序列还包含在植物细胞中起转录终止和多腺苷酸化作用的3’非转录DNA序列；获得转化了上述核苷酸序列的植物细胞；并从转化的植物细胞中再生出表达编码TIC901蛋白的核苷酸序列的遗传上的转化植株，其中转化植株形态正常并且与未转化表达所述蛋白的植株相比，表现出抗鞘翅目害虫水平的改良或提高。
本发明的另一个实施方案是提供了与仅由TIC901蛋白或同源物呈现的表位特异性结合的抗体。该抗体可用于鉴定TIC901蛋白及其同源物的存在、纯化所述蛋白及其同源物、鉴定表达TIC901蛋白及其同源物的核苷酸序列，及用于制成试剂盒检测TIC901蛋白或其同源物或者检测表达所述蛋白或同源物的核苷酸序列。
本发明的独特优势包含昆虫抗性控制的改进。组合两种或更多的杀虫剂为一种组合物，每种杀虫毒素针对同一种害虫，且每种杀虫剂的作用模式也不同于该组合中的其他杀虫剂，这样能本质上降低对该杀虫剂组合物耐药的昆虫发展成群，提供了一种更有效的控制个别害虫种的方法。本发明中的TIC901蛋白可以和已知的任何数量杀虫剂组合成一个特定的组合物以达到特定组合物中的抗性控制水平，最好是在植物中表达该抗虫剂组合物。具体说，TIC901蛋白组合物可以联合Cry3或Cry3的氨基酸序列变异体以实现对不同种鞘翅目植物害虫的控制，或联合其它合适的Cry蛋白如PS149B1、CryET33/34、CryET80/76、CryET70、Cry22、CryET39、CryET76、CrySBa、Cry6a和Cry12a等，和联合VIP、WAR或MIS蛋白等，以及联合来源于致病杆菌属(Xenorhabdus)和光杆状菌属(Photorhabdus)的细菌且已证实对鞘翅目植物害虫表现杀虫生物活性的不同杀虫组合物。这些组合物的使用最好是定向的在植物最易受鞘翅目昆虫捕食的部位增强这些蛋白的表达水平。为保护马铃薯对抗CPB，最好是在其叶和茎达到最高水平的表达。对于对线虫和根叶甲敏感的玉米类，最好是在其地下部分达到最高水平的表达，即在植物的根系中。
另一实施方案包含一种分离的编码苏云金芽孢杆菌杀虫毒素及其杀虫片段的多聚核苷酸序列，具有杀虫活性，其毒素或杀虫片段的分子量约36,000道尔顿和42,500道尔顿之间。此外，编码毒素或其互补链的核苷酸序列在严格杂交条件下与SEQ ID NO3中的序列杂交。该毒素在控制或杀死鞘翅目害虫方面具有最好的生物活性，优选马铃薯甲虫和/或玉米根叶甲。在一实施方案中，编码毒素的核苷酸序列被优化以在植物中表达，而优化的核苷酸序列基本上仍编码毒素蛋白或是其杀虫片段，即编码与在天然氨基酸序列中出现的氨基酸序列相同或基本上相同的氨基酸序列。
本发明的另一个实施方案提供了一种宿主细胞，该细胞转化了含有编码本发明的杀虫蛋白及其杀虫片段的多核苷酸。本发明的核苷酸序列最好经修饰以提高本发明的蛋白在优选的宿主细胞中的表达量。本发明中的宿主细胞选自细菌细胞、真菌细胞和植物细胞。植物细胞中的表达可包括实现杀虫蛋白在细胞质中的累积，或可造成杀虫蛋白在例如质体、叶绿体和线粒体亚细胞器中的累积。可替代的，本发明的杀虫蛋白或其杀虫片段可被定位于特定宿主细胞的蛋白分泌装置上，并导致产物蛋白在细胞外的累积和细胞周围的胞外空间的累积。
本发明的又一个实施方案提供了一种控制鞘翅目昆虫侵袭植物的方法。最好是在昆虫的食物中提供杀虫量的本发明的杀虫蛋白或其杀虫片段供昆虫食用。食物可由通常被昆虫食用的植物部分组成，例如植物组织或植物细胞。杀虫蛋白或其杀虫片段可以组合物方式提供，用于植物组织、植物部分的表面，或植物细胞，或是更优选的，如上所述由细胞的蛋白合成机制所产生，在植物细胞内累积或分泌至植物细胞外，只要提供的蛋白毒素的量达到足够抑制害虫进一步摄食的杀虫剂量，或是抑制害虫的进一步生长和发育，或使害虫死亡。提供给昆虫的食物还可以是人造食物，毒素蛋白均一的分布于食物内部或是局部的应用于食物基质的暴露表面，或是包括浓度梯度的分布于食物内部或是局部的应用于食物基质的暴露表面。杀虫毒素或其杀虫片段源自在苏云金芽孢杆菌编码的一段核苷酸序列，该序列在严格杂交条件下与基本互补于SEQ ID NO3的核苷酸序列杂交。
本发明还提供了一种检测与SEQ ID NO3所示的第二核苷酸序列杂交的第一核苷酸序列的方法，其中第一核苷酸序列编码一种杀虫蛋白或其杀虫片段，并在严格杂交条件下与第二核苷酸序列杂交。示例性序列是SEQ ID NO2和SEQ ID NO3。
本发明也提供了非自然出现的或是合成的编码TIC901杀虫蛋白或其杀虫片段或是其同源物的核苷酸序列，其中所述的TIC901蛋白或其杀虫片段或是其同源物，选自序列SEQ ID NO5和SEQ ID NO7。这种非自然出现或是这里提供的编码杀虫蛋白或其杀虫片段的核苷酸序列的序列最好是用于在植物细胞中表达TIC901蛋白或相关蛋白。这里提供了用这种序列转化的植物细胞。本发明提供由转化的植物细胞生长的植物。本发明还提供本发明中转化植物的种子，只要这些种子至少含有编码杀虫蛋白或其杀虫片段的序列。
本发明的示例性序列，除那些与SEQ ID NO3和SEQ ID NO4有关的序列以外，至少包括(1)如SEQ ID NO5所示的核苷酸序列和由SEQ ID NO5编码的如SEQ ID NO6所示的氨基酸序列，在这里还指杀虫蛋白TIC1201；(2)如SEQ ID NO7所示的核苷酸序列和由SEQ ID NO7编码的如SEQ ID NO8所示的氨基酸序列，在这里还指杀虫蛋白TIC407；(3)如SEQ ID NO9所示的核苷酸序列和由SEQ ID NO9编码的如SEQ ID NO10所示的氨基酸序列，在这里还指杀虫蛋白TIC417；及(4)如SEQ ID NO32所示的核苷酸序列和由SEQ ID NO32编码的如SEQ ID NO33所示的氨基酸序列，在这里还指杀虫蛋白TIC431。这些蛋白中的每个和编码这些蛋白的天然苏云金芽孢杆菌(B.t.)核苷酸序列都与这里定义的TIC901蛋白相关。分别举例来说，SEQ ID NO5是编码如SEQID NO6所示杀虫蛋白的核苷酸序列。这里所示的SEQ ID NO5可通过在严格条件下与SEQ ID NO3杂交而鉴定。SEQ ID NO5编码对鞘翅目昆虫毒性的生物活性的蛋白显示了对玉米根叶甲和马铃薯甲虫具有毒性。SEQ ID NO5、SEQ ID NO3、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32中的每个都能在选自严格杂交条件和特异杂交条件的杂交条件下互相杂交。每个序列也可以在选自严格杂交条件和特异杂交条件的杂交条件下，通过与SEQ ID NO2杂交而鉴定。每个序列还可以通过用如SEQ ID NO11和SEQ ID NO12所示的寡聚核苷酸引物对和如SEQ ID NO23和SEQ ID NO27所示的寡聚核苷酸引物对进行扩增来鉴定。如SEQ ID NO11和SEQID NO12所示的引物对和如SEQ ID NO23和SEQ ID NO27所示的引物对是鉴定样品中编码TIC901蛋白或相关杀虫蛋白存在的标准诊断引物。当在定义的扩增条件下和有合适的核苷酸序列底物存在时，单独或一起使用这些寡聚核苷酸对可产生约540至640个碱基对的扩增子。利用这些引物组的热扩增反应检测样品中编码与TIC901或相关蛋白相应的杀虫蛋白B.t.基因是非常有用的，并且极大的简化了对这些相关序列的寻找和鉴定。基于SEQ ID NO3、SEQID NO5、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32的核苷酸序列对比，也预见了用其他引物对得到的扩增子。由这些核苷酸序列编码的蛋白，其基本同一的氨基酸序列区域对应的编码核苷酸序列可用来制备互补或大致互补序列以用作探针或热扩增反应的引物，检测与TIC901，TIC1201，TIC407，TIC417，和TIC431相关的序列。
如SEQ ID NO23至SEQ ID NO29所示的变性寡聚核苷酸探针和引物是另外提供的，作为鉴定任何编码分泌杀虫蛋白的核苷酸序列的一种手段，这些杀虫蛋白至少来源于一种苏云金芽孢杆菌种，该菌种中的核苷酸序列以变性寡聚核苷酸探针在严格杂交条件下与一条或更多条选自SEQ ID NO2、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO12、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29和SEQ ID NO32的序列杂交来鉴定。示例性序列可利用这样的寡聚核苷酸包括选自SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQID NO30和SEQ ID NO32的序列识别，这些序列各自分别编码的蛋白如SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO31和SEQ ID NO33所示。
另一实施方案包含一种在芽孢杆菌菌株中编码序列的tic901和相关蛋白的鉴定方法，步骤包括在需氧条件下以丰富液体培养基培养芽孢杆菌约16至45小时；检测培养上清中显示TIC901相关抗原活性的蛋白，和/或与特异性结合一个或多个TIC901蛋白多肽或抗原的抗体产生交叉反应的蛋白；鉴定和纯化编码被测蛋白的核苷酸序列；以该序列表达蛋白；以及证明所表达蛋白的杀虫活性。
检测本发明中核苷酸序列存在的试剂盒，与探针、引物、相似物和衍生物一样也都予以考虑。这样的试剂盒含有一个或多个核苷酸序列，每一序列或者作为探针用于检测编码本发明中杀虫蛋白或其片段的核苷酸序列或相关的核苷酸序列的存在，或者与此试剂盒中包括的一个或多个其它探针或引物联合使用以扩增一条或更多的本发明中的序列或相关的核苷酸序列。这样的试剂盒也可以或可替代的含有能特异性的结合一个或多个本发明中多肽或蛋白的抗体，和用探针或抗体来检测的试剂一样，而且试剂盒中也将包含对照样品以确保用来检测核苷酸或多肽的探针或抗体和试剂依照说明书的指导是有效的。所有用于检测核苷酸序列或肽所必需的试剂都将和使用说明书一起包装在一个试剂盒中。一个示例性试剂盒将包括来自TIC901、TIC1201、TIC407、TIC417及TIC431编码序列的核苷酸序列，连同一个核苷酸序列扩增引物的样品，例如SEQ ID NO和SEQ ID NO12，或是SEQ ID NO23-26和SEQ ID NO27-29的不同组合加上进行扩增反应所需的试剂，所有都一起包装在所述的试剂盒中。
因此考虑到本发明所公开的组合物和方法将提供优于先前方法的技术，尤其包括以上重点描述的那些。此外，本发明提供了一个全新种类的以前在本领域是未知的杀虫蛋白和编码这些蛋白的核苷酸序列。
附图简述

图1是前体蛋白TIC901p、TIC407p、TIC417p、TIC1201p和TIC431p的氨基酸序列比对；每个氨基酸序列包含一个预测的N端30个氨基酸的II型信号肽特征序列，后跟另外13个氨基酸(在其各自序列的从第31位氨基酸至第43位氨基酸)，从发酵后培养基分离的成熟蛋白不出现这些氨基酸。共有序列的第44位有下划线的氨基酸表示成熟蛋白的N端氨基酸。基于75-83、147-153和275-283位阴影部分的氨基酸相应编码的天然核苷酸序列，构建大量核苷酸探针和引物，用于检测这些蛋白和其他相关的来源于芽孢杆菌核苷酸序列的杀虫蛋白的编码序列。
序列简述SEQ ID NO1表示一段由Edman降解法结果推断出的氨基酸序列，与如SEQ ID NO4所示第44位至第58位的氨基酸序列基本同一，用于降解的蛋白是苏云金芽孢杆菌EG2158细胞分泌于培养基中并经凝胶纯化约38kDa的杀虫蛋白。
SEQ ID NO2表示一段人工合成的核苷酸序列，作为探针检测tic901或其相关核苷酸序列，或用作热扩增引物对中的一条以扩增tic901或相关核苷酸序列的全部或一部分，并且偏好使用苏云金芽孢杆菌和其他芽孢杆菌的三联体密码子，特别偏好于使用在每个密码子的第三位碱基对含A或T的密码子。
SEQ ID NO3表示编码TIC901蛋白的天然(在这里也指野生型)的苏云金芽孢杆菌核苷酸序列。预测的普里布诺框(Pribnow box)或SD序列(Shine & Dalgarno sequence)位于约141-147位核苷酸。编码预测的TIC901前体蛋白的开放阅读框(ORF)对应的核苷酸序列从第153位至第1,253位。282-325位核苷酸与如SEQ ID NO2所示的寡聚核苷酸探针序列大致对应，该探针可与如SEQ ID NO3所示282-325位核苷酸的互补序列杂交。282-284位核苷酸的GTA缬氨酸密码子对应分泌形式TIC901的N端氨基酸。
SEQ ID NO4表示有367个残基的TIC901蛋白氨基酸序列，是由如SEQ ID NO3所示从第153位至第1,253位核苷酸的开放阅读框推断得来。全长的367残基氨基酸序列与苏云金芽孢杆菌中天然/野生型编码序列所表达的预测前体蛋白氨基酸序列一致。如SEQ IDNO4所示的1号残基至30号残基的氨基酸序列，和在苏云金芽孢杆菌中如SEQ ID NO3所示核苷酸序列表达产生的预测N端信号肽或分泌信号肽一致，其后的13个氨基酸不存在于苏云金芽孢杆菌表达的成熟/分泌型324个氨基酸残基的成熟杀虫蛋白序列中。该324氨基酸残基的成熟杀虫蛋白序列与具有杀虫效用的TIC901成熟和分泌蛋白序列一致。预测N端的43个残基氨基酸序列是从前体蛋白上被蛋白水解剪切掉的，或是部分的在穿过细菌细胞质膜的过程，或是部分的被未确定的信号肽酶或其它识别包含氨基酸残基XAA1-XAA2-GLN同样序列的蛋白酶在裂解点前立即水解，并将成熟杀虫蛋白释放到胞外环境，这里的XAA1对应丝氨酸(SER)、赖氨酸(LYS)、或天冬酰胺，XAA2对应谷氨酸(GLU)或谷胺酰氨(GLN)。
SEQ ID NO5表示一天然的苏云金芽孢杆菌核苷酸序列，编码这里指定的杀虫蛋白TIC1201。该序列包括529个核苷酸，在530-532位预测的ATG起始密码子上游。位于预测的ATG起始密码子上游518至524位核苷酸是预测共有的普里布诺框或SD序列。开放阅读框编码预测的TIC1201前体蛋白，如TIC901，包括一段与预测信号肽或分泌目标肽相应的N端氨基酸序列。预测编码TIC1201信号肽的序列编码30个氨基酸，其后是额外13个不出现在成熟/分泌形式杀虫蛋白中的氨基酸。该13个额外氨基酸在肽酶识别序列SER-GLN-GLN处终止，和存在于TIC901前体蛋白序列中的序列一致。由表达TIC1201杀虫蛋白的苏云金芽孢杆菌释放到培养基中的TIC1201杀虫蛋白氨基酸序列，从其编码序列预测包含321个氨基酸残基，由如SEQ ID NO5所示从第659位至1621位的核苷酸编码。即使预测的编码TIC1201前体蛋白的开放阅读框经鉴定为在530-1621位内，该开放阅读框有可能延伸成从437位至1621位核苷酸。这个预测不太可能发生，因为其信号肽与TIC901信号肽相似，并且在518至524位核苷酸的上游位置，缺乏任何共有的普里布诺框或SD序列与任何ATG起始密码子的合理接近。
SEQ ID NO6表示TIC1201前体蛋白的395个氨基酸序列，是由如SEQ ID NO5所示530位至1621位核苷酸编码序列推断出的。
SEQ ID NO7表示编码这里所指的TIC407杀虫蛋白的核苷酸序列。
SEQ ID NO8表示TIC407蛋白的368个氨基酸序列，是由如SEQ ID NO7所示196位至1299位核苷酸编码序列推断出的。
SEQ ID NO9表示编码这里所指的TIC417杀虫蛋白的核苷酸序列。
SEQ ID NO10表示TIC417蛋白的364个氨基酸序列，是由如SEQ ID NO9所示92位至1173位核苷酸编码序列推断出的。
SEQ ID NO11表示一段正向的热扩增引物序列或是探针序列，这里指prJWP139，相应的编码序列如SEQ ID NO3第438位至458位核苷酸序列所示，此外相应的密码子与如SEQ ID NO4第96-103位所示的氨基酸序列ASN-ASN-ASN-HIS-GLN-THR-ASN-ARG的密码子一致，偏好使用苏云金芽孢杆菌或其它芽孢杆菌基因序列中的密码子，在密码子的第三位含有A或T。
SEQ ID NO12表示一段反向的热扩增引物序列或是探针序列，这里指prJWP143，该序列与如SEQ ID NO3第978位至998位核苷酸所示的反向互补序列一致，此外相应的密码子与如SEQ ID NO4第276-282位所示的氨基酸序列GLN-LYS-PHE-ILE-TYR-PRO-ASN密码子一致，偏好使用苏云金芽孢杆菌或其它芽孢杆菌基因序列中的密码子，在密码子的第三位含有A或T。
SEQ ID NO13表示一段合成的、人造的或非自然出现的编码TIC901氨基酸序列变异体的核苷酸序列。
SEQ ID NO14表示由如SEQ ID NO13第1位至第1104位核苷酸所示的编码序列所推断出的氨基酸序列。
SEQ ID NO15表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP151。
SEQ ID NO16表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP152。
SEQ ID NO17表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP186。
SEQ ID NO18表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP183。
SEQ ID NO19表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP155。
SEQ ID NO20表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP156。
SEQ ID NO21表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP168。
SEQ ID NO22表示一段用作探针或引物的人造核苷酸序列，在这里被描述为prJWP170。
SEQ ID NO23表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP200。
SEQ ID NO24表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP201。
SEQ ID NO25表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP202。
SEQ ID NO26表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP203。
SEQ ID NO27表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP204。
SEQ ID NO28表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP205。
SEQ ID NO29表示一段用作探针或引物的人造简并核苷酸序列，在这里被描述为prJWP206。
SEQ ID NO30表示一段核苷酸编码序列，是用寡聚核苷酸prJWP200和prJWP204从EG2158基因组上热扩增得到的。
SEQ ID NO31表示来源于SEQ ID NO30的主要开放阅读框的氨基酸序列。
SEQ ID NO32表示编码本发明中所指的TIC431杀虫蛋白的核苷酸序列。
SEQ ID NO33表示由SEQ ID NO32中1位至1092位核苷酸编码序列推断出的TIC431蛋白的364个氨基酸序列。
发明详述依据本发明，发现了一类编码新的杀虫蛋白的新的核苷酸序列，来源于苏云金芽孢杆菌和相关芽孢杆菌。如在这里的其他处所定义的，这些核苷酸编码序列在合适的杂交条件下相互杂交，并且这些核苷酸序列所编码的蛋白与其它蛋白中任一种引起的抗血清起交叉反应。编码成熟/分泌型TIC1201、TIC901、TIC407、TIC417和TIC431蛋白的核苷酸序列的比对结果显示，编码成熟TIC901蛋白片段(如SEQ ID NO4第44位氨基酸至第367位氨基酸所示的分泌型TIC901)的编码序列与这里公开的编码其它4个成熟蛋白片段的各个序列有约79％至91％的同一性；编码预测的成熟/分泌型TIC417蛋白片段(SEQ ID NO10中第44位氨基酸至第364位氨基酸)的序列与每一个这里公开的编码其它3个成熟蛋白片段的序列有约75％至95％的同一性；编码预测的成熟/分泌型TIC407蛋白片段(序列表SEQ ID NO8中第44位氨基酸至第368位氨基酸)的序列与这里公开的编码其它4个成熟蛋白片段的各个序列有约75％至82％的同一性；编码成熟/分泌型TIC1201片段(SEQ ID NO6中第44位氨基酸至第395位氨基酸)的序列与这里公开的编码其它4个成熟蛋白片段的各个序列有约80％至91％的同一性；编码成熟/分泌型TIC431片段(SEQ ID NO33中第44位氨基酸至第364位氨基酸)的序列与这里公开的编码其它4个成熟蛋白片段的各个序列有约75％至95％的同一性。这些核苷酸编码序列编码的每个蛋白表现抑制鞘翅目昆虫的生物活性，显示出部分氨基酸序列的大体同一性和部分氨基酸序列的大体相似性，并因此被认为是相关的杀虫蛋白。预测的成熟/分泌型TIC417杀虫蛋白(TIC417m)的氨基酸序列与相应的成熟/分泌型TIC901(TIC901m)的氨基酸序列有约78.9％的同一性。预测的成熟/分泌型TIC1201杀虫蛋白(TIC1201m)的氨基酸序列与相应的TIC901m的氨基酸序列有约90.1％的同一性，并与相应的TIC417m和TIC431m氨基酸序列有约80.7％的同一性。预测的成熟/分泌型TIC407杀虫蛋白(TIC407m)的氨基酸序列与相应的TIC901m有约80％的同一性，并与相应的TIC417m有约75％的同一性，与相应的TIC1201m有约82％的同一性。预测的成熟/分泌型TIC431杀虫蛋白(TIC431m)的氨基酸序列与成熟的TIC407有约75％的同一性，与成熟的TIC901有约79％的同一性，与TIC1201有约80％的同一性，与TIC417成熟蛋白氨基酸序列有95％的同一性。这里公开的核苷酸序列所编码的每个蛋白都可以在植物中单独或相互不同组合进行表达，或与其它抑制鞘翅目的杀虫剂共同表达，如蛋白、晶体蛋白、δ-内毒素、外源凝集素、马铃薯块茎蛋白(patatins)和其它毒素等，来实现在以前仅使用已知的鞘翅目杀虫蛋白不可行的田间进行抑虫处理，其中来源于苏云金芽孢杆菌的已知蛋白如Cry3蛋白、VIP和/或WAR和/或MIS蛋白，和来源于侧孢芽孢杆菌(Bacilluslatersoporous)、球状芽孢杆菌(Bacillus thuringiensis)、致病杆菌和光杆状菌的抑制鞘翅目的不同杀虫蛋白。本发明中的蛋白也可与其它种类的杀虫剂和/或杀虫毒素联合使用于植物，实现将植物转化为具有至少一种手段以控制一种或多种常见的选自鞘翅目昆虫、鳞翅目昆虫、穿刺和吸吮类害虫等植物害虫。可以和本发明中蛋白联合在植物中表达的其它蛋白和/或昆虫控制试剂包括但不限于来源于芽孢杆菌的鳞翅目杀虫蛋白，如来源于苏云金芽孢杆菌、半孢芽孢杆菌和球状芽孢杆菌的Cry蛋白；分离于不同芽孢杆菌的WAR、MIS和/或VIP蛋白；来源于致病杆菌属和光杆状菌属菌的杀虫蛋白；和例如能明显直接抑制一种或更多目标有害昆虫的一个或多个基因的转基因双链RNA(dsRNA’s)的组合物。这里所用的“杀虫多肽”或“杀虫蛋白”或“其杀虫片段”是指具有杀虫特性的多肽，即抑制目标害虫生长、发育、成活或繁殖的多肽，和指包括所有及双链RNA’s在内的直接抑制一种或多种目标害虫的一个或多个基因的杀虫剂。
令人惊奇的是，本发明中的蛋白似乎与任何迄今本领域内发现的苏云金芽孢杆菌杀虫蛋白不相关。这里本发明中的蛋白显示出被分泌到其产生菌芽孢杆菌周围的胞外空间。这里显示的这些蛋白显著小于本领域中已知的Cry、VIP、WAR和MIS蛋白，并且可在生长期的营养阶段表达于分离纯化的细菌细胞培养物。这不同于Cry蛋白的表达，Cry蛋白通常是表达于生长的孢子形成期并在细胞的前孢子中形成不同的晶体。
与本领域技术相比显而易见的是，发明者在这里公开了核苷酸序列tic901的分离和纯化，该序列编码前体TIC901蛋白(TIC901p)，该蛋白随后经蛋白酶解处理释放出成熟的TIC901蛋白(TIC901m)，成熟蛋白具有抑制鞘翅目昆虫的生物学活性。发明者公开了利用tic901序列作为一种鉴定为数众多的其它相关序列的方法，这些序列各个编码与TIC901、TIC901p和TIC901m相关的杀虫蛋白，还公开了利用抗TIC901m的抗体在酶联免疫反应(ELISA)方法中检测由相关TIC901编码序列表达而产生TIC901相关蛋白的Bt菌株。
这里公开的核苷酸序列和TIC901编码序列来源于苏云金芽孢杆菌，包括菌株EG2158、EG6489、EG6561、EG12450和EG4653。这些菌株已按照“布达佩斯条约”保藏于美国农业部(USDA)农业研究服务中心北部研究实验室(NRRL)，美国伊利诺斯州皮奥里亚市北大学街1815号，邮编61604(1815 North University Street，Peoria，IL 61604)。相关菌株于1987年4月29日至2002年2月6日保藏于NRRL。苏云金芽孢杆菌菌株EG2158的NRRL登记号为NRRLB-18213，苏云金芽孢杆菌菌株EG12450的NRRL登记号为NRRLB-30357。这里公开的tic901相关核苷酸序列和TIC901(包括TIC901的前体和成熟蛋白)相关氨基酸序列包括tic1201及其编码的至少产生并分离于苏云金芽孢杆菌菌株EG3618和86833的杀虫蛋白TIC1201；tic407及其编码的至少产生并分离于苏云金芽孢杆菌菌株EG6618的杀虫蛋白TIC407；tic417及其编码的至少产生并分离于苏云金芽孢杆菌菌株EG2158、EG6489和EG6561的杀虫蛋白TIC417；和至少由苏云金芽孢杆菌EG4653编码的TIC431，但不限于此。
纯B.t.菌株EG2158的肉汤培养物测试杀虫活性，并证实直接对马铃薯甲虫(CPB)表现出抑制鞘翅目昆虫的生物学活性。从肉汤培养物中纯化出的蛋白用SDS-PAGE鉴定，其表观分子量为38kDa，经观察具有鞘翅目昆虫毒性。将该蛋白进行自动Edmund降解，其结果产生一段被认为是该38kDa蛋白即TIC901m蛋白的N端15个氨基酸序列(SEQ ID NO1)。按照分离于苏云金芽孢杆菌或相关芽孢杆菌细菌的蛋白编码序列中自然出现的密码子使用偏好性即每个密码子的第三位核苷酸优选A或T，构建了一个合成的半冗余寡聚核苷酸序列(WD444；SEQ ID NO2)作为探针检测在苏云金芽孢杆菌中可能编码38kDa杀虫蛋白的同源序列。构建了一个来源于B.t.菌株EG2158纯化的DNA核苷酸序列文库。纯化的DNA经HindIII完全消化，并将其片段插入经HindIII消化并经牛小肠磷酸酶处理的pUC18质粒载体中，构建B.t.菌株EG2158的基因组文库。将DNA文库转化大肠杆菌(E.coli)菌株，并将转化的混合物接于固体选择性平板培养。出现的茵落用缀合了碱性磷酸酶的合成核苷酸序列探针WD444(SEQ ID NO2)检测。含有质粒pEG1379(也称pMON74007，含有分离于苏云金芽孢杆菌EG2158的一段8kb的HindIII片段的pUC18衍生物)的重组大肠杆菌EG12447可与接合了碱性磷酸酶的寡聚核苷酸探针杂交。经核苷酸序列分析证实该8kb的HindIII片段含有编码TIC901p蛋白的全长核苷酸序列。2002年2月6日NRRL接受了菌株EG12447的保藏并提供保藏样品的登记号NRRL B-30549。
编码约38kDa杀虫蛋白开放阅读框的核苷酸序列已经确定。编码TIC901p的开放阅读框被称为tic901。该开放阅读框包含1101个核苷酸的核苷酸序列(如SEQ ID NO3第153-1253位核苷酸所示)，并预测编码一个含有367个氨基酸的前体蛋白(SEQ ID NO4)。从该开放阅读框推断出氨基酸序列的预测分子量为41,492道尔顿，考虑到因信号肽而丢失的3-4kDa，该预测分子量与经SDS-PAGE分析分泌蛋白估算的约38kDa分子量在合理的期望值范围内。预测前体蛋白(TIC901p)的等电点为6.368，pH 7.0时净电荷为-2.102。整个编码前体蛋白的氨基酸序列组成中，AT含量占69％，与其它在苏云金芽孢杆菌和其它芽孢杆菌中鉴定出的编码序列相符。编码序列的核苷酸组成也符合芽孢杆菌属其它基因的特性，含约39％的腺苷、约18％的鸟苷、约30％的胸苷和约13％的胞苷。
在pEG1379质粒中的天然tic901编码序列在含有该质粒的重组大肠杆菌中不能产生可检出量的TIC901m蛋白。考虑到大肠杆菌中缺乏芽孢杆菌启动子的功能，并且两种生物的密码子偏好性也不同，这并不意外。菌株EG12447培养物上清或含有该质粒的细胞都未观察到对马铃薯甲虫的抑制。将8kb的插入片段剪切并连接到大肠杆菌/苏云金芽孢杆菌穿梭载体中构建成质粒pEG12450。pEG12450质粒转化至一株无晶体(acrystalliferous)苏云金芽孢杆菌EG10650(美国专利号6,468,523)，产生菌株EG12450。EG10650来源于一株无晶体苏云金芽孢杆菌EG10368(鉴定于美国专利5,322,687)，该菌株的npr和apr(分别为中性蛋白酶和酸性蛋白酶基因)分别被其缺失突变等位基因npr3和apr1替换掉(美国专利5,759,538)。EG12450的培养上清对马铃薯甲虫抑制活性测试是阳性。从EG12450培养上清中纯化的蛋白经对马铃薯甲虫抑制活性测试也显示阳性。在孢子形成的培养物中没有观察到晶体结构，但是培养的细胞沉淀/孢子形成的培养物中的菌体经测试也具有抑制马铃薯甲虫(CPB)的生物活性，说明部分的TIC901蛋白仍伴随孢子/培养，或是被测试昆虫所食的孢子在昆虫体内萌发并产生足够量的杀虫蛋白导致所观察到的抑制效应。
EG12450菌株的培养上清和纯化的蛋白也对玉米根叶甲进行生物学活性的测试。对南部和西部玉米根叶甲(分别是瓜十一星叶甲(Diabrotica undecempnrnctata howardii)和玉米幼芽根叶甲(Diabroticavirgifera virgifera))都观察到抑制活性。
发明人测试了收集到的不同芽孢杆菌菌株如这里公开的，以检测这些苏云金芽孢杆菌和/或球状芽孢杆菌菌株是否也产生与TIC901相关的胞外蛋白。具体的说，处理了279株菌的细胞菌体和发酵后培养基用于对南方玉米根叶甲幼虫的生物学实验。大约三分之一的菌株产生分泌到生长培养基中的蛋白，并在根叶甲抑制活性实验中显示阳性。优先的是36株菌株，产生的胞外蛋白表现出对根叶甲的抑制最有效。通过每株菌的基因组中的序列是否能和TIC901编码序列杂交来进一步筛选这些菌株，并将这些结果和用含天然TIC901编码序列的菌株EG2158得到的杂交结果进行比较。结果如表1所示。
表1 芽孢杆菌产生的分泌CRW杀虫蛋白同型限制性内切酶多态性(RFLP)
1-各菌株中分离的总DNA经HindIII完全消化并以Southern blot分析。字母A、B、C或D对应特定限制性片段的大小(多态形)，由tic901或SEQ ID NO2探针确定。
2-EG2158也含有一个与tic901、tic1201、tic407和如SEQ ID NO30所示的tic417相关的第三氨基酸序列同源物。
3-表明仅得到部分核苷酸序列的鉴定，但是得到的所有或部分序列所编码的蛋白序列与指定的TIC蛋白序列100％一致。
4-表示这些菌株被证实产生对草盲蝽具有抑制活性的胞外基质。
36株菌株中有4株(菌株EG4332，EG5858，EG6618和86833)没有产生可在高度严格条件下即65℃用0.5X SSC洗涤，与VIP1和VIP2探针杂交的核苷酸片段。所有其它菌株都产生了与TIC901探针杂交的核苷酸片段，然而，有趣的是观察到了杂交信号的强度变化，特别是以TIC901探针识别的HindIII限制性片段作为参照时。通过与tic901探针杂交的方式鉴别出基本上有三种大小不同的限制性片段(多态形)。最初认为在这些条件下可与tic901探针杂交的三种不同片段中，只有一种显示存在于任何一株菌中。两种限制性片段多态形在与tic901探针杂交时，与该探针和来源于EG2158菌株的tic901片段杂交相比，显示出不同的信号强度。这个结果说明在这36株菌中，至少存在三个tic901编码序列的等位基因。如这里所述，对三种长度的限制片段长度多态形的序列分析，鉴定每个序列中含有的编码TIC901相关蛋白的ORF(开放阅读框)。这里显示了将这些核苷酸序列与天然TIC901编码序列进行的比对，以确定同一性的程度。此外，从这些限制性片段中鉴定出的TIC901和TIC1201开放阅读框所编码的蛋白，在用来检测其杀虫特性，每种都表现出对鞘翅目害虫的毒性。因此可以相信，基于TIC901和TIC1201蛋白的高度亲缘关系，TIC407和TIC417蛋白也将表现出对鞘翅目的杀虫生物学活性。鉴于TIC407、TIC417和TIC1201与TIC901蛋白氨基酸序列的显著同一性，这些蛋白在这里被描述为相互的氨基酸序列变异体。以TIC1201为例，与TIC901相比少了三个氨基酸并有31个氨基酸序列变异。因此，当与TIC901比较时，其它含有氨基酸变异的TIC氨基酸序列可能会有助于不同的杀虫谱和/或毒力和潜力。随后以热扩增方法对这些菌种和其它菌株进行分析，所用的简并引物整合了基于TIC901、TIC407、TIC1201和TIC417蛋白编码序列的核苷酸序列比对结果，导致可以得到相应存在于EG5858、EG5552和EG4332菌株基因组中的TIC407编码序列的扩增子。这些序列可能不会在用TIC901特异杂交时显现，因为TIC407序列已经被证实存在于一段大约18-19kb的HindIII大片段中，可能不能有效的转移到杂交膜上。
本发明的蛋白意欲用于农业用途，即保护植物免受害虫侵扰，更具体的说是保护植物免受鞘翅目害虫的侵扰。如示例所示，本发明的蛋白可以用来保护植物至少免受马铃薯甲虫和至少免受玉米根叶甲的侵扰。实现对植物的保护可以通过将组合物以粉尘、喷雾、粉末或乳状或其它农业上可以接受的赋形剂形式局部应用于植物或植物部分，如应用于植物表面即叶、花、干、茎和根，组合物包含一种或多种有效杀虫剂量的本发明中的蛋白。另一种方法是，除一种或多种本发明中蛋白外，农业赋形剂可以包含一种或多种另外的杀虫蛋白，该蛋白的抑制虫谱与本发明中蛋白确信能有效抑制的害虫一样，如Cry3蛋白、CryET33/34、CryET80/76、PS149B1和其它抑制鞘翅目昆虫的二元毒素蛋白，ⅥP/MIS/WAR蛋白等，和/或能有效控制植物害虫的完全不同杀虫谱的蛋白如Cryl′s、Cry2′s和Cry9′s等等。本发明的范围还包括上述的农业赋形剂，其包含其它类型杀虫组合物如杀真菌剂杀螨剂等等。另一种优选的方法是，植物本身经转化含有一种或多种核苷酸序列，这些序列经修饰后提高了一种或多种本发明中的蛋白在植物中的表达量，或提高了其杀虫部分的表达。这些序列单独或与其它杀虫剂联合表达，该杀虫剂通过分子生物学方法能在植物中产生，包括双链RNA介导的抑制目标害虫细胞基因的方法。
蛋白TIC901、TIC1201、TIC407、TIC417和TIC431是对如马CPB和根叶甲的鞘翅目昆虫具有抗性的杀虫化合物。分别如SEQ IDNO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10和SEQ ID NO33所示的这些蛋白及其杀虫片段以及相关杀虫蛋白，都可以在杀虫剂配方里用作活性配料成分用于控制鞘翅目昆虫。在这里所使用或提到的与这些蛋白相关的杀虫蛋白，意谓是相关杀虫蛋白是指那些鉴定为这些蛋白同源物的蛋白，或是那些鉴定为在严格杂交条件或特异杂交条件下与全部或一部分天然苏云金芽孢杆菌TIC901蛋白、TIC1201蛋白、TIC417蛋白TIC407和TIC431蛋白或其杀虫部分的编码序列杂交的核苷酸序列所编码的蛋白。这里所定义的严格条件，至少包括42℃杂交后室温下以2X SSC、0.1％SDS洗涤两次，每次五分钟；再在65℃下以0.5X SSC、0.1％SDS洗涤两次，每次三十分钟。当然，本领域技术人员会知道，由于遗传密码的冗余，许多其它序列也能编码这些相关蛋白，就那些序列可在芽孢杆菌中又可在植物细胞中表达杀虫蛋白的功能而言，这些序列也被规定为本发明的范围。当然，已知许多这种冗余编码序列在这些条件下不能与编码TIC901、TIC1201、TIC407、TIC417及TIC431的天然序列杂交。应当理解的是，当提及TIC901或相关杀虫蛋白或其杀虫片段时，或是当提及编码TIC901或相关杀虫蛋白或其杀虫片段的核苷酸序列时，该TIC901是与提到的TIC407、TIC417、TIC431和TIC1201等等可以互换的且不能区分的，包括如SEQ ID NO30所示的核苷酸序列编码的氨基酸序列SEQ ID NO31，SEQ ID NO31包括由全长的该蛋白编码序列编码的全长的杀虫蛋白，该蛋白的一部分例如SEQID NO31所示的氨基酸序列。
一些可能和本发明中核苷酸序列相关的核苷酸序列与tic901、tic1201、tic407、tic431及tic417及其相关序列在严格条件下可能不能杂交，但实际上可能在特异杂交条件下杂交。这样的序列可能编码与本发明中蛋白有至少30％同一性的蛋白。具有至少30％序列同一性的蛋白可能也具有相似的三级结构，并且可能具有相似的相似或相关的生物学活性。参照本发明，这样的三级结构相似性可能包括杀虫生物学活性。可以鉴别更远关系核苷酸序列的特异杂交条件包括低温下的首次杂交，典型的是在40℃左右；随后如上所述的在室温下洗涤两次以去除非特异性结合的探针；再在膜上曝光(以研究者使用同位素标记方法为例)或暴露于免疫学试剂和化学显影剂以鉴定和特异基因探针杂交的核苷酸片段。杂交无特异性的迹象是在一次杂交中观察到很多杂交片段。以观察到很多杂交片段为例，一次或多次的洗涤印迹，每次都比前次洗涤用稍高的温度(例如每一次都比前一次高约5℃洗涤)直到只能观察到一条或很少几条(两条或三条)杂交片段，这一条或几条显示特异杂交的片段随后可被克隆并测序以确定其与原始探针序列的同源性和/或同一性的程度。这样的序列与其编码的蛋白特别相关，该蛋白是来源于核苷酸探针的原始序列所编码并具有相关功能，例如杀虫活性。
编码序列编码全部或TIC901一个杀虫部分或相关蛋白，而在严格条件下不杂交，是可能的。不过，这样的序列来源于天然核苷酸序列，基于以下原理天然核苷酸序列能被修饰成为仍然编码相同或基本相同天然氨基酸序列的非天然核苷酸序列；或是天然氨基酸序列可以连同一张密码子表使用，让熟练的技工从氨基酸序列反翻译成编码全部或一个TIC901杀虫蛋白或相关蛋白的核苷酸序列。所有这样的序列都被规定为在本发明范围内。
杀虫组合物可从表达本发明蛋白的细菌菌株产生。含有一个或多个编码一个或多个TIC901或相关蛋白和/或其基本等价物的核苷酸序列的苏云金芽孢杆菌菌株，可以用已知的标准培养基和发酵技术培养。因为本发明中的蛋白更多的是分泌到胞外环境中，在发酵循环刚一结束时，先用本领域已知的方法从用过的培养基液体中，连同任何孢子和产生的晶体在内的苏云金芽孢杆菌一起分离，以收获细菌表达的TIC901蛋白或其同源物。回收的苏云金芽孢杆菌孢子或晶体可按照配方制造成可湿性粉剂、浓缩液体剂、颗粒剂、溶液、乳剂、喷雾剂、混悬剂、粉剂、泡沫剂、糊剂、气雾剂、胶囊剂，或制成其它精细或粗糙分离的材料，或天然或合成材料的浸润剂，或其它组分，与合适的载体、稀释剂、佐剂、防腐剂、分散剂、溶剂、乳化剂、惰性载体和其它适合与植物或其基因座进行物理或化学缔合的化合物，使目标植物病原体由口摄入，且便于对特定目标害虫的处理和应用。配方和应用过程是本领域熟知的。
配制好的诱饵颗粒含有引诱剂和苏云金芽孢杆菌分离物的孢子和晶体，或是浓缩的发酵后培养基，或是纯化于孢子或发酵后培养基的杀虫蛋白，或是包含有编码取自这里所公开的苏云金芽孢杆菌分离物的TIC901或相关杀虫蛋白的核苷酸序列的重组微生物，这样的引诱颗粒可以用于害虫环境。因为该毒素不影响动物和人，该诱饵可以不受限制的使用。产品也可制成喷雾剂或粉剂。害虫在其足部或腹部沾有产品，并将其带回巢穴，使其它害虫暴露于毒素。分离的苏云金芽孢杆菌或表达编码本发明中TIC901或相关蛋白的核苷酸序列或基因的重组宿主也可整合到害虫的一个诱饵或食物来源中。
正如本领域技术人员理解的，杀虫剂的浓度变化很大程度上依赖特定剂型的性质，特别是该剂型是否是浓缩或是直接使用的。杀虫剂可以至少以1％重量比存在且也可以100％重量比存在。杀虫剂在干剂型中的重量比可约为1-95％，而在液体剂型中一般是可悬浮固体或是能被悬浮于液相的固体占重量比的1-60％。剂型通常为每毫克(mg)约102-104个细胞，或是约5-100份每百万活性成分杀虫蛋白即TIC901蛋白及其氨基酸序列变异体、杀虫部分或其片段、或其同源物如TIC431、TIC1201、TIC417和TIC407。这些剂型将以每公顷约50mg(液体或固体)至1kg或更多来给药。这些剂型可用于鞘翅目昆虫的环境，如通过喷雾、撒粉和喷淋等方式施用于植物、土壤或水，也可以种子处理或种子包被的方法用于种子表面，使药渗透到种子皮或子叶。本领域技术人员也应该了解，在组合物或配方的联合使用中结合本发明中的蛋白也会有独特的用途和有益的作用，例如提供了更广阔的宿主范围控制害虫侵袭，或增加化合物的毒力或作为杀虫剂的潜力。
本领域内的技术有构建一段变异的或修饰的核苷酸序列，该序列编码本发明的杀虫蛋白、或其杀虫片段、或较天然氨基酸序列有增强的杀虫活性的其杀虫氨基酸序列变异体；并将该核苷酸序列连到一个表达盒，该表达盒在植物发挥将该编码序列转录为信使RNA(mRNA)的功能，随后在植物细胞中翻译，以至于在植物组织中产生有效杀虫剂量的杀虫蛋白。转化植物细胞也是本领域内的技术，转化一个嵌入了植物功能性表达载体的核苷酸序列到植物细胞，优选玉米、棉花、大豆、菜籽油、水稻、小麦、燕麦、买罗高梁(milo)、牧草、饲料植物、水果树、观赏花卉、西红柿、马铃薯、胡萝卜、羽衣甘蓝和烟草植物细胞等，筛选包含该序列并表达有效杀虫剂量的TIC901蛋白(及其氨基酸序列变异体、其杀虫部分或片段、或其如TIC431、TIC1201、TIC417和TIC407的同源物)的细胞，并从这样的转化细胞产生植物。本领域技术人员应该了解怎样使用电穿孔、融合、弹道法或根癌土壤杆菌介导法等，将本发明中的核苷酸序列或其修饰序列导入植物细胞。这些方法在本领域内熟知。
提及核苷酸序列时，术语“变异体或修饰的”被规定为指编码同样毒素或编码具有相似杀虫活性的等价毒素的核苷酸序列，术语“等价毒素”(equivalent toxins)是指与要求的天然或所指毒素一样，对目标害虫显示相同的、基本相同的、或提高的生物学活性的毒素。规定用于双子叶植物的变异体或修饰的核苷酸序列可编码与天然编码序列基本相同的氨基酸序列即自然界发现的编码序列，但是其包含的全部GC组成含量可为从约49％至58％，并且该序列要避免使用双子叶植物最不偏好的密码子，通过来源于一个或多个规定转化变异或修饰的核苷酸序列的双子叶植物个体的编码序列的群体中编译出的偏好性和使用频率，确定密码子偏好性。规定用于单子叶植物的变异体或修饰的核苷酸序列也可编码与天然编码序列基本相同的氨基酸序列，包含的全部GC组合含量可从约52％至64％或更多，并且也要避免使用最不偏好的密码子编码任何氨基酸，通过来源于一个或多个规定转化变异或修饰的核苷酸序列的双子叶植物个体的编码序列的群体中编译出的偏好性和使用频率，确定密码子偏好性。密码子的使用频率被规定为指特定密码子在编码序列中被使用的平均次数。对于特定的植物种，用来将特定氨基酸整合入新生氨基酸序列的密码子会以相对稳定的频率被平均使用。对于只有两个密码子的氨基酸，其频率一般是约50-50，即每个密码子都有一半的时间被使用，除非其中的一个使用了实质上更多的嘌呤或嘧啶密码子，这并不是特定植物种GC含量的典型代表。以芽孢杆菌为例，其编码序列通常含有60-70％的AT含量。芽孢杆菌的密码子使用倾向于使用在具体密码子中富含A或T的密码子，更具体的说是任何A或T处于第三位碱基的具体密码子。因此在天然的及自然出现的芽孢杆菌编码序列中使用的主要为G或C的密码子，其频率远低于含有A或T的密码子。因此，若想产生一个在特定植物，单子叶或双子叶，中使用的变异或修饰的核苷酸序列，确保适当关注以避免任何频繁使用该特定植物最不偏好的密码子是很重要的。实际上，对于单子叶植物，最好是编码序列模仿大部分天然或自然出现的单子叶植物的GC分布，即在最初10％的编码序列中优选含有约65％的GC，接下来的10-15％编码序列GC含量降为约60％，在中间的一半或更多编码序列中GC含量降到约50-55％，然后在最后15-20％的编码序列中GC含量逐渐上升为约60-64％。这样的GC％分布似乎尽可能模仿了单子叶植物基因天然出现的GC％分布，并因此可以相信合成的或人工产生的基因或编码序列也可以类似这样的构造。
如本发明中所用的，编码苏云金芽孢杆菌TIC901蛋白或同源物或作为本发明中杀虫毒素的衍生物的“合成的编码序列”或“非自然出现的编码序列”是指那些以能制备编码TIC901杀虫蛋白或相关氨基酸序列或同源物或变异体或其大致等同物的编码序列(包括至少编码一种TIC901、TIC431、TIC1201、TIC407或TIC417杀虫蛋白的编码序列)的包括任何种类的遗传分离或操作方式制备的核苷酸序列。这包括从其自然存在状态下分离编码序列、以密码子修饰(如这里所述)来操纵编码序列、以氨基磷酸酯化学等化学合成、或特异性点突变(如这里所述)、编码序列的截取或任何其它操纵或分离的方法。
如这里所用的短语“序列同一性百分比”通过在一个比对窗口中对比两个最佳对齐序列来确定，比对窗口中的部分序列可以包含对比于参照序列(不合插入或缺失)的插入或缺失(即缺口)以优化两个序列的比对。百分比的计算决定于在两个序列中具有相同核苷酸碱基或氨基酸残基的位置的数目，得到匹配位置的数目，再以匹配位置的数目除以比对窗口中位置的全部数目，并乘以100得到序列的同一性百分率。对比参照序列在每个位置都相同的序列称为与参照序列相同的序列，反之亦然。如果第一核苷酸序列与以5′至3′方向观察的第二或参照序列显示完全互补性，第一核苷酸序列被称为是以3′至5′方向观察的第二核苷酸序列或参照核苷酸序列的“互补”。这里所用的核苷酸序列分子称为显示“完全互补性”，是当一条序列中5′至3′方向的每一个核苷酸都与其它序列中3′至5′方向的每一个核苷酸都互补。一条核苷酸序列5′至3′方向与参照核苷酸序列5′至3′方向在每一个位置都相同，称为与参照序列相同，反之亦然。一条与参照核苷酸序列互补的核苷酸序列与该参照序列的反向互补序列相同。这些术语和描述在本领域被定义，并易于被本领域普通技术人员理解。
这里所用的，与参照核苷酸序列的“基本同源”(″substantialhomology″)是指在严格杂交条件下与如SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9或SEQ ID NO32所示序列或其互补序列杂交的核苷酸序列。在严格杂交条件下与如SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9或SEQ ID NO32所示序列或其互补序列杂交的核苷酸序列杂交，具体如SEQ ID NO3中153位核苷酸至1,253位核苷酸的序列，更具体如SEQ ID NO3中282位核苷酸至1,253位核苷酸的序列；或是如SEQ ID NO5中437位核苷酸至1,621位核苷酸的序列，更具体如SEQ ID NO5中530位核苷酸至1,621位核苷酸的序列，甚至更具体如SEQ ID NO5中659位核苷酸至1,621位核苷酸的序列；或是如SEQ ID NO7中196位核苷酸至1,299位核苷酸的序列，更具体如SEQ ID NO7中325位核苷酸至1,299位核苷酸的序列；或是如SEQ ID NO9中215位核苷酸至1,306位核苷酸的序列，更具体如SEQ ID NO9中344位核苷酸至1,306位核苷酸的序列；或是如SEQ ID NO5中437位核苷酸至1,621位核苷酸的序列，更具体如SEQ ID NO5中530位核苷酸至1,621位核苷酸的序列；或是如SEQ ID NO32中1位核苷酸至1,092位核苷酸的序列，更具体如SEQ ID NO32中130位核苷酸至1,092位核苷酸的序列，含有一个或多个连续核苷酸序列并与一个或多个具有SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ IDNO32或SEQ ID NO9连续核苷酸序列基本同一，两个序列间可以进行比对，并在严格杂交条件下在相反链的相应碱基处形成氢键和足够稳定的双链分子，以致于在严格条件下用本领域所知方法在足够长的检测时间例可检测到该双链分子。这种基本同源的序列参照如SEQ ID NO32、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7或SEQ ID NO9所示或其互补序列，优选的是具有约67-70％的同一性，更优选的是具有约80-85％的同一性，最优选的是具有约90-95％的同一性或至99％或更多。另外，编码可分离于苏云金芽孢杆菌或其它芽孢杆菌等的杀虫蛋白的，并在严谨条件下与SEQ ID NO2杂交的核苷酸序列，也可预想到显示与上面所列的参照核苷酸序列基本同源，上面所列的参照核苷酸序列在严格条件下分别与如SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32所示的编码序列tic901、tic1201、tic407、tic417和tic431或其互补序列杂交。这里提到的这样的序列是作为SEQ ID NO3等的同源物，并且包括SEQ ID NO5、SEQ ID NO7、SEQ ID NO9和SEQID NO32和相关序列及其同源物。
涉及多肽序列时，术语“基本同一”(“substantial identity″)或“基本相似”(″substantial similarity″)是指与参照的氨基酸序列相比具有基本氨基酸序列同一性或基本氨基酸序列相似性的多肽，特别的考虑到如这里所述事实，即基于疏水性和亲水性指数，特定氨基酸可以被其它氨基酸取代，而形成仍具有相似生物学活性的蛋白，也就是说仍能得到生物功能等价的蛋白。因此，与参照肽或氨基酸序列基本同一或基本相似的氨基酸序列应该与参照序列具有约30-50％的氨基酸序列同一性，优选的是与参照序列具有约70-80％的氨基酸序列同一性，更优选的是与参照序列具有约86-90％的氨基酸序列同一性，最优选的是与参照多肽序列具有约95-99％的氨基酸序列同一性。更具体的说，发明者预见到，与本发明相关的表现杀虫活性的肽与本发明中的肽具有基本的肽同一性或基本的肽相似性，并且与如这里所示的选自SEQ ID NO1、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10和SEQ ID NO33的参照多肽序列有至少约67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98和99％的同一性或相似性。
涉及本发明蛋白时，术语“变异的氨基酸序列”或“氨基酸序列变异体”或“修饰的氨基酸序列变异体”都被规定为与本发明中的氨基酸序列基本等价的氨基酸序列。例如，在本发明的一个编码序列中引入一个便于分子操作的限制性位点，导致增加或减少一个或多个密码子而(1)破坏天然编码序列，(2)破坏天然开放阅读框，和(3)破坏蛋白的杀虫生物学活性，并可构成(a)与天然杀虫毒素相比的变异氨基酸序列，(b)与天然杀虫毒素相比的氨基酸序列变异体，或(c)与天然杀虫毒素相比的修饰的氨基酸序列变异体。本领域技术人员了解，可对本发明中的氨基酸序列进行其它种类的修饰且不破坏蛋白的生物活性。涉及生物活性时，规定术语“破坏”的使用是指对天然氨基酸序列的修饰，通过插入或删除一个或多个氨基酸，或交换或取代一个氨基酸为另一个氨基酸，而不减少蛋白的杀虫生物学活性。插入、删除和取代也在本发明公开的范围内，公开程度是所得的氨基酸序列变异体所显示出不小于天然杀虫蛋白的杀虫活性。这里公开的蛋白的嵌合体、这里公开的蛋白或部分蛋白的融合体以及这里公开的序列改变蛋白是明确考虑到的。
与本发明蛋白基本等价的蛋白规定为生物功能等价物。在这里所用的关于本发明中杀虫蛋白，术语“生物功能等价物”是指肽、多肽和蛋白，其含有与本发明中的新肽具有序列相似性的序列或一部分，并与这里公开的多肽有相同或相似的功能特性，包括杀虫活性，新肽如TIC901蛋白或其杀虫片段，或TIC1201、TIC410、TIC407或TIC431蛋白或其杀虫片段。生物等价物也包括与抗体特异性结合的肽、多肽和蛋白，抗体针对存在于TIC901和相关蛋白如TIC1201、TIC417、TIC407和TIC431及其杀虫片段之上或之内的表位，并且这些生物等价物显示出相同或相近的结合或反应活性，包括与单克隆和多克隆抗体的反应。
还考虑到，本发明中的蛋白可以用来保护双子叶植物免受昆虫侵袭。这样的侵袭可能由鞘翅目、双翅目、鳞翅目，或甚至被螨类、粉虫、蛴螬，或是种类多样的昆虫导致，这些昆虫损伤植物的方式是刺入植物组织并吸取植物生长发育所需的营养成分。修饰本发明中蛋白的一级氨基酸序列可以得到具有与天然蛋白不同宿主范围的蛋白。
本发明中的蛋白，因为其被芽孢杆菌表达时定位于胞外空间，可以用来靶向引导其它蛋白定位于胞外空间。例如，熟练的技工知道连接一个通常不分泌到胞外空间的第一蛋白到一个通常分泌到胞外空间的第二蛋白，以达到将第一蛋白定位于胞外空间的目的。本发明中的蛋白可以用本领域所熟知的许多方法，融合一种或多种杀虫毒素例如晶状δ-内毒素以形成一个嵌合蛋白，该蛋白靶向的分泌于围绕特定宿主细胞的胞外空间。还考虑到，分泌事件本身可以导致两个蛋白部分的分离以至于两个单独的截然不同的杀虫蛋白被释放到围绕特定宿主细胞的胞外空间。这两个蛋白既可以是(1)对相同昆虫种有毒性，但是用不同的作用机制发挥其杀虫活性；也可以是(2)每一个都对不同的昆虫种有毒性。任何杀虫蛋白都可末端对末端的连接到本发明中的蛋白以形成靶向于围绕特定宿主细胞的胞外空间的多嵌合体蛋白，这是可能的。这样的其它蛋白可能是绿色荧光蛋白和相关蛋白和变异体、调节细胞信号过程的激酶和磷酸酶、核酸酶、脂肪酶、除草剂抑制蛋白，由如gox、不同的epsps同源物、bar及其同源物等等、Phn0、NptII和Aad等等基因所表达。所有这些蛋白也可以用来作为选择性标记，特别是当连接到编码一个或多个本发明中蛋白的基因时，可在植物或其它宿主细胞中示踪编码一个或多个本发明中蛋白的基因。
本发明中的蛋白可以被定向导入到亚细胞器。例如，编码叶绿体或质体定向序列的第一核苷酸序列可被操纵连接或融合于编码本发明中杀虫蛋白的第二核苷酸序列，以产生一个嵌合的前体蛋白，该蛋白在植物细胞中靶向插入到叶绿体或质体中。这种嵌合蛋白的表达可以使本发明中的蛋白输入到植物叶绿体或质体，导致杀虫毒素或其杀虫片段在叶绿体或质体中的定位。此外，编码一个或多个本发明中蛋白的核苷酸序列可被定位于叶绿体或质体中表达。将核苷酸序列定位于质体或叶绿体会导致核苷酸序列和叶绿体或质体基因组的整合，或可导致编码本发明中蛋白的核苷酸序列以自主复制方式存在。在任何一种意义上，本发明中的蛋白都被定位于叶绿体或质体。因此如在这里所用到的，短语“叶绿体或质体定位”是指定位在叶绿体或质体内的生物分子，无论是多核苷酸还是多肽，以至于该分子从细胞的细胞质环境隔离出来，而在叶绿体或质体细胞质(plastid cytoplasm)中发挥功能，提供发明中所声明的效应。定位生物分子于叶绿体或质体，对于多核苷酸，可用人工机械方式如电穿孔、机械微注射、或多核苷酸包被的微注射轰击来完成；对于多肽，可通过质体或叶绿体靶向性肽序列用分泌或输入的方式完成，天然的、合成的或异源的该序列具有将连接的多肽靶向、插入、辅助或定位于叶绿体或质体的功能。
这里所用的，短语“操作性地连接”或“操作性连接”是指核苷酸编码片段连接入读码框，使其中一个的特性影响另一个的表达。这些短语或词组也可用于指连接入另一个氨基酸序列并现实一些功能的氨基酸序列，例如，一个被连接到目的蛋白的信号肽可被操作性连接到目的蛋白以实现引导目的蛋白到表达该蛋白的宿主细胞的分泌器官，或到如内质网、叶绿体、质体、线粒体、液泡、核或核仁的亚细胞室，或其它亚细胞室等等。
对本发明目的而言，词“基因”是指含有开放阅读框的核苷酸序列，该核苷酸序列编码TIC901蛋白、TIC1201蛋白、TIC417蛋白、TIC407蛋白、TIC431蛋白、或其杀虫片段、或其氨基酸序列的变异体、或其相关蛋白同源物或其杀虫片段或其氨基酸序列变异体，并至少被操作性连接一个启动子序列和一个转录终止序列，其中启动子和转录终止序列在产生该蛋白的宿主细胞中具有功能。如这里所用的，“结构基因”是指被表达产生多肽的基因。本发明中的结构基因除启动子和转录终止序列以外还包括五个初级未翻译序列、内含子序列和特别是在植物中具有功能的增强子元件，最好是那些来源于玉米或其它单子叶植物的元件，当这些元件以适当的顺序和一个或多个编码本发明中蛋白的序列连接在一起时，使得蛋白在特定植物组织中表达水平提高，优选的是使蛋白在玉米根部组织的表达增强。
本发明提供的核苷酸序列信息可以用来制备相对短的DNA序列，在这里指探针或引物，该序列能和选自这里公开的多核苷酸序列特异性杂交。制备这种合适长度的核苷酸探针是基于对选出的编码本发明杀虫多肽的多肽序列的考虑，例如SEQ ID NO2中所示的序列，SEQ ID NO3从153位核苷酸至1,253位核苷酸的全部或一探针特异性部分；SEQ ID NO5从530位核苷酸至1,621位核苷酸的全部或探针特异性部分；SEQ ID NO7的全部或探针特异性部分；SEQ ID NO9的全部或探针特异性部分；SEQ ID NO32的全部或探针特异性部分；选自SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21和SEQ ID NO22及其互补序列等的全部或探针特异性或引物特异性部分。引用短语“全部或探针特异性部分”规定为指探针，它包含至少15到50个，或多或少的，选自于特定参照序列如SEQ ID NO2、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22和SEQ ID NO32所示的核苷酸及其互补序列等的连续核苷酸序列。这种核苷酸探针能与编码杀虫多肽的核苷酸序列特异性杂交，此能力在许多种实施方案中有具体应用。最重要的是，这些探针可以用于许多实验来检测给定样品中存在的互补序列。
在某些实施方案中，使用寡聚核苷酸引物是很有利的。利用本发明中的多聚核苷酸设计这种引物的序列，用热扩增技术来检测、扩增或修饰一段确定的来源于苏云金芽孢杆菌或球形芽孢杆菌属(B.sphaericus)编码杀虫蛋白序列的片段。与编码本发明中杀虫多肽的多聚核苷酸序列相关的核苷酸序列片段，也可以用这样的引物和热扩增技术进行分离和特性鉴定。
依照本发明为提供确保的优势，用于杂交研究或实验或作为引物的核苷酸序列最好包括与至少有14至30或更多的多聚核苷酸序列的核苷酸连续骨架(contiguous stretch)互补的序列，以上多聚核苷酸序列编码全部或部分本发明中的杀虫蛋白如SEQ ID NO2、SEQID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO32所示和其互补序列等等。
大小至少是14个核苷酸长度的引物或探针，有助于确保该片段足够长以形成既稳定又有选择性的双链分子。通常这种分子最好具有14个碱基以上长度互补序列。为了提高杂交的稳定性和选择性，并由此提高所得的特异性杂交分子的质量和程度，通常优选设计的核酸分子含14至20个核苷酸或所需更长的tic901互补序列等；或含14至20个核苷酸或所需更长的tic1201互补序列等；或含14至20个核苷酸或所需更长的tic417互补序列等；或含14至20个核苷酸或所需更长的tic407互补序列；或含14至20个核苷酸或所需更长的tic431互补序列。这样的片段易于制备，例如，通过化学方法直接合成该片段、应用核酸复制技术、或从定位于质粒或其它的含有适当插入和合适限制性位点的载体重组序列中剪切选择的DNA片段。
本发明人还设计了简并的通用探针或引物用于鉴定天然出现的核苷酸序列，其编码衍生自本发明蛋白同源物的杀虫蛋白。用SEQ IDNO23-SEQ ID NO29所示的示例探针和引物鉴定核苷酸序列，该序列在严格条件下与这里所示的编码分泌型杀虫蛋白的核苷酸序列杂交。
基于图1所示的氨基酸序列比对以确定在四个比对的杀虫前体蛋白中高度保守的氨基酸序列。例如SEQ ID NO4所示的氨基酸序列，从第75位到第83位氨基酸的一段序列在序列和位置上都与TIC901、TIC1201、TIC407、TIC417和TIC431的一级序列保守。这在这里被描述为“第一保守氨基酸序列”(first conserved amino acidsequence)。如SEQ ID NO4所示的从第147位到第153位氨基酸的一段氨基酸序列在序列和位置上也都与TIC901、TIC1201、TIC407、TIC417和TIC431的一级序列保守。这在这里被描述为“第二保守氨基酸序列”。同样地，如SEQ ID NO4所示第275位到第283位氨基酸的一段氨基酸序列在序列和位置上也都与TIC901、TIC1201、TIC407、TIC417和TIC431的一级序列保守。这在这里被描述为“第三保守氨基酸序列”。在每个蛋白各自的编码序列里，这些序列中的每个都对应一个基本同源的但稍有简并的核苷酸序列，这些核苷酸序列既可作为探针序列又可作为引物序列以鉴定与选自SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO32和SEQ ID NO9或其互补序列的至少包含14个碱基同源的核苷酸序列的存在。例如，使用简并引物的热扩增反应，引物的合成基于选自SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO32和SEQ ID NO9，及其互补序列编译的序列，当考虑反向热扩增时对应于上述“第一保守氨基酸序列”的编码序列，包含一个对应于第一保守核苷酸序列的26个碱基的寡聚核苷酸，如SEQ ID NO3从第375位核苷酸至第401位核苷酸可以作为其中一个简并序列用于检测样品中对应的与SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO32和SEQ ID NO9杂交的核苷酸序列同源物的存在。换句话说，这样的寡聚核苷酸序列可作为寡聚核苷酸引物对中的一条用于热扩增反应，以产生一条可在严格杂交条件下与这里所示的一个或多个序列相应序列杂交的扩增子序列，例如包含SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO32和SEQ ID NO9的序列。
本发明者因此构建了几组引物和探针，它们可以单独或相互组合使用来鉴定与本发明中蛋白相关的序列，包括TIC901、TIC1201、TIC407、TIC431和TIC417；编码分泌型杀虫蛋白的序列和在严格杂交条件下与一条或多条这里所公开的序列杂交的序列。一组简并寡聚核苷酸序列组成的引物其相应序列如SEQ ID NO23至SEQ IDNO25所示。SEQ ID NO23对应一组相应于SEQ ID NO3中375位核苷酸至401位核苷酸、SEQ ID NO5中752位核苷酸至778位核苷酸、SEQ ID NO7中391位核苷酸至417位核苷酸、SEQ ID NO9中437位核苷酸至463位核苷酸和SEQ ID NO32中223位核苷酸至249位核苷酸的简并寡聚核苷酸序列。合理预期的编码相应上述“第一保守氨基酸序列”的核苷酸序列存在于芽孢杆菌中，其所有可能的组合都被考虑到，如SEQ ID NO23所示。SEQ ID NO24和SEQ ID NO25是包含相应于SEQ ID NO23序列的简并寡聚核苷酸序列的子集，如SEQ ID NO23一样，所含的密码子偏好于芽孢杆菌编码序列中优先使用的密码子。
第二组引物和探针由如SEQ ID NO26所示的简并序列考虑得来，可用于鉴定这里所述的SEQ ID NO3、SEQ ID NO5、SEQ IDNO7、SEQ ID NO9和SEQ ID NO32的相关序列，以及鉴定分泌杀虫蛋白的编码序列。这些寡聚核苷酸序列对应先前出现的核苷酸序列范围，那些核苷酸序列编码的氨基酸序列是芽孢杆菌首选的上述“第二保守氨基酸序列”，此外还对应SEQ ID NO3中591位核苷酸至611位核苷酸、SEQ ID NO5中968位核苷酸至988位核苷酸、SEQ ID NO7中607位核苷酸至627位核苷酸、SEQ ID NO9中653位核苷酸至673位核苷酸和SEQ ID NO32中439位核苷酸至456位核苷酸。合理预期的编码相应上述“第二保守氨基酸序列”的核苷酸序列存在于芽孢杆菌中，其所有可能的组合都被考虑到，如SEQ ID NO26所示。选作掺入简并寡聚核苷酸序列的密码子偏好于芽孢杆菌编码序列中优先使用的密码子。
而第三组引物和探针由如SEQ ID NO27至SEQ ID NO29所示的简并序列考虑得来，可用于鉴定这里所述的SEQ ID NO3、SEQID NO5、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32的相关序列，以及鉴定分泌杀虫蛋白的编码序列。这些寡聚核苷酸序列对应先前出现的核苷酸序列范围，那些核苷酸序列编码的氨基酸序列是芽孢杆菌首选的上述“第三保守氨基酸序列”，此外还对应SEQ IDNO3中的975位核苷酸至1001位核苷酸的反向互补核苷酸序列、SEQ ID NO5中的1352位核苷酸至1378位核苷酸的反向互补核苷酸序列、SEQ ID NO7中的991位核苷酸至1017位核苷酸的反向互补核苷酸序列、SEQ ID NO9中的1037位核苷酸至1063位核苷酸的反向互补核苷酸序列、SEQ ID NO32中的823位核苷酸至846位核苷酸的反向互补核苷酸序列。合理预期的编码相应上述“第三保守氨基酸序列”的核苷酸序列存在于芽孢杆菌中，其所有可能的组合都被考虑到，如SEQ ID NO27所示。SEQ ID NO28和SEQ IDNO29也是包含相应于SEQ ID NO27序列的简并寡聚核苷酸序列的子集，如SEQ ID NO27一样，所含的密码子偏好于芽孢杆菌编码序列中优先使用的密码子。
由如SEQ ID NO23至SEQ ID NO29所示的序列考虑得来的任一序列都可单独用作探针以鉴定样品中出现的核苷酸序列，该序列编码一个和这里示例任一个蛋白相关的分泌杀虫蛋白，尤其是该核苷酸序列与本发明中一个或多个核苷酸序列杂交，包括SEQ ID NO2、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO32和这里所示的选自SEQ ID NO11、SEQ ID NO12、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29的探针和/或引物中的任意核苷酸序列，但不仅限于此。
另一个更好的选择是，这里所示的引物和探针的不同组合可以一起用于热扩增反应以产生一个或多个扩增子，该扩增子用于诊断样品中存在的编码与本发明蛋白相关的分泌杀虫蛋白的核苷酸序列，在严格杂交条件下编码杀虫蛋白的核苷酸序列与一个或多个这里示例的核苷酸序列包括SEQ ID NO2、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO12、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29、SEQ ID NO32或其互补序列杂交。例如，组合一个或多个如SEQ ID NO23-25所示的核苷酸，如引物prJWP200(SEQ ID NO23)，和如SEQ ID NO27-29所示的一个或多个核苷酸，如引物prJWP204(SEQ ID NO27)，热扩增反应中每个引物的浓度至少为约每微升1皮摩尔，反应包括1×TAQ扩增缓冲液、每种0.2摩尔的脱氧核苷三磷酸盐(dATP、dTTP、dCTP和dGTP)、2毫摩尔的MgCl2、2个单位的TAQ聚合酶和约10到100纳克的含有DNA模板的样品其中有一个或多个编码本发明分泌杀虫蛋白或其片段的序列，导致合成一个双链DNA片段，它是由约600到650个碱基对、更优选由约615到630个碱基对、最优选由623到626个碱基对组成的扩增子。这种大小的扩增子用于诊断样品中编码与本发明一个或多个蛋白相关的分泌杀虫蛋白的全部或部分核苷酸序列的存在，并且扩增子的大小可以被合理预期，特别是如果热扩增循环条件包括最初94℃变性2分钟，随后35个循环是94℃变性30秒、50℃退火30秒、72℃延伸45秒，再72℃最后延伸7分钟。退火步骤的温度应该每个相继的循环后降0.3℃这样最后的退火温度约为39.8℃。也可以组合一个或多个如SEQ ID NO26所示的寡核苷酸例如prJWP203和如SEQ ID NO27-29所示的一个或多个引物用于相似的热扩增反应，使得合成一个约400到415个碱基对的扩增子，或一个约400到415个碱基对或405到410个碱基对的扩增子，用于诊断样品中编码与本发明蛋白相关的分泌杀虫蛋白的核苷酸序列的存在。
按照这些条件并利用引物prJWP200(SEQ ID NO23)和prJWP204(SEQ ID NO27)连同菌株EG2158的基因组DNA一起，导致产生一段约620个碱基对的相应扩增子片段。若干展现该片段的单克隆从热扩增反应中随机分离并得到每个单克隆的核苷酸序列。正如预计的，与相应的TIC901核苷酸序列相同的第一序列在克隆群(clone population)中进行鉴定(不包括克隆的任一末端引物序列，如SEQ ID NO3所示从约402位核苷酸到约974位核苷酸)。还如预计的，与相应的TIC417核苷酸序列相同的第二序列在克隆群中进行鉴定(不包括克隆的任一末端引物序列，如SEQ ID NO9所示从约464位核苷酸到约1036位核苷酸)。
令人惊奇的是，也在克隆群中鉴定的第三序列没有同等对应这里所示的任何序列，但是其核苷酸序列与本发明中的每个序列都基本相似，包括tic901、tic1201、tic401、tic417、tic431编码序列中的相应编码序列。如这里示例的，在菌种EG2158中发现tic417的编码序列相当的意外。然而更意外的是鉴定来自EG2158基因组的第三序列，可能相应编码与TIC901、TIC1201、TIC401、TIC417和TIC431不同的第三分泌杀虫蛋白的核苷酸片段，但是序列上与本发明蛋白十分相似，被分类为和一个或多个这里所示的序列杂交的核苷酸序列编码的分泌杀虫蛋白属的一个种，并且是这里示例的新颖实用的简并寡核苷酸探针和引物的模式，用于鉴定编码分泌杀虫蛋白的序列以及在严格杂交条件下和这里所示的tic901、tic1201、tic401、tic417、tic431相关编码序列杂交的序列。
在SEQ ID NO31中列出的氨基酸序列，由连续开放阅读框编码如SEQ ID NO30所示，具有5’和3’末端都删除的26mer简并寡核苷酸序列。如SEQ ID NO31所示的氨基酸序列和如SEQ ID NO4中约85位氨基酸至274位氨基酸所示的TIC901的氨基酸序列基本相似，仅包含与SEQ ID NO4中的类似序列2个氨基酸的不同，在SEQ ID NO31和SEQ ID NO4相应序列之间对应约98.9％的同一性。如SEQ ID NO31所示的氨基酸序列和如SEQ ID NO10中约85位氨基酸至274位氨基酸所示的TIC417的氨基酸序列基本相似，仅包含与SEQ ID NO10中的类似序列30个氨基酸的不同，在SEQID NO31和SEQ ID NO10相应序列之间对应约83.7％的同一性。如SEQ ID NO31所示的氨基酸序列也和如SEQ ID NO8中约85位氨基酸至274位氨基酸所示的TIC401的氨基酸序列基本相似，仅包含与SEQ ID NO8中的类似序列41个氨基酸的不同，在SEQ IDNO31和SEQ ID NO8相应序列之间对应约78.4％的同一性。如SEQ ID NO31所示的氨基酸序列还和如SEQ ID NO33所示的氨基酸序列(TIC431)基本相似。
本发明也考虑了包含本发明多核苷酸的表达载体。因此，在一个实施方案中表达载体是一个分离并纯化的DNA分子，包括一个操作性连接到编码区域的启动子，编码区域编码本发明的多肽并操作性连接到转录终止区域，使得启动子驱动编码区域的转录。编码区域可包括编码本发明苏云金芽孢杆菌杀虫毒素的片段以及编码叶绿体和质体靶向肽的片段。包含表达载体的DNA分子也可包含功能性内含子序列，定位于编码序列的上游或者甚至在编码序列内，还可包含位于启动子和翻译起始点之间的5′非翻译前导序列(即UTR或5’UTR)。
这里所用并涉及启动子元件的术语“操作性地连接”或“操作性连接”规定为指包含启动子的核苷酸序列，即在特定宿主细胞内驱动转录起始的遗传元件，以编码序列的转录受启动子控制和大致调节的方式连接到编码区域。连接启动子到编码区域的操作方式是本领域内熟知的。在细菌中起作用的启动子是本领域内熟知的。苏云金芽孢杆菌晶体蛋白的示例性和优选启动子包括sigA，sigE和sigK基因启动子。另一个选择是来源于苏云金芽孢杆菌或其他芽孢杆菌的天然、诱变处理、异源或重组启动子，用来在芽孢杆菌菌株中实现本发明蛋白的表达。
编码本发明蛋白全部或杀虫部分的核苷酸序列用来转化植物的，选择能在特定植物种中驱动编码序列表达的启动子。在不同植物种中发挥功能的启动子在本领域内熟知。用来在植物中表达多肽的启动子是那些如Odell等人描述的(Nature 313810-812，1985)可诱导的、病毒的、合成的或组成型启动子，和/或时序调节、空间调节、时空调节的启动子。优选的启动子包括增强的CaMV35S启动子和FMV35S启动子。为通过在植物中表达本发明蛋白以最佳控制根叶甲，优选在玉米植物根系中实现这些蛋白的高水平表达。许多根系增强启动子已经鉴定并在本领域内已知(Lu et al.，J.Plant Phys.，2000，156(2)277-283；US Patent No.5,837,848；US Patent No.6,489,542)。基本时序或空间调节指的是由于植物可操作的启动子在植物或植物组织内表达基因。涉及时序调节，启动子可用于调节只在植物细胞或组织或甚至整个植物生长和发育期间的特定时间表达。只在种子萌芽期间活跃表达一个或多个基因的启动子是时序调节的一个例子。其他的例子可包括仅在植物、植物细胞或植物组织暴露于一定光强度或完全黑暗期间活跃表达的一个或多个基因的启动子。基本时序调节是指在一定时间活跃表达的启动子，但在其他时间可是或不是完全抑制，这种表达仍可被检测到，通过监测指示剂的存在例如和该启动子连接的编码序列产生的酶，或通过基因产物的增加或减少来测量例如遍及植物生长、分化和发育的不同时期和/或对不同环境刺激的响应产生的mRNA。基本空间调节是指连接到启动子的基因表达只在植物中特定细胞或组织的生长和发育期间进行。例如，绒毡层启动子(tapetal promoter)仅希望在花生长和发育时期进行大体的空间上的表达。相似的，根特异或根增强的启动子(root enhanced promoter)仅希望在根细胞或根组织中进行大体的空间上的表达。基本空间调节也指在特定组织中特定组织的特异启动子的表达水平和其涉及的表达水平或其他组织的相似启动子涉及的表达水平，其中与特定组织中优选的启动子表达不同，在其他组织中的表达通过测量连接到启动子的编码序列产生的酶量或一些可检测的基因产物也被检测到，但表达水平明显较低。启动子也可以协同调节的方式同时一起进行基本时序和基本空间调节。其他的特别是本发明规定范围内的启动子包括但不限于泛素启动子(theubiquitin promoter)、甘蔗杆状DNA病毒启动子(the sugarcanebacilliform DNA virus promoter)、二磷酸核酮糖羧化酶大亚基启动子(the ribulose bis-phosphate carboxylase large subunit promoter)。
为在单子叶植物中实现非自然存在的核苷酸序列的最优表达，优选的内含子序列也可被包含在DNA表达构建体中。这种内含子典型的位置靠近mRNA5’-末端，在非翻译序列中或直接位于非翻译序列的下游。内含子的获得可包括但不限于玉米热休克蛋白(the maizeHeat Shock Protein(HSP))70内含子(美国专利5,424,412；1995)、稻肌动蛋白1内含子(the rice Actl intron)(McElroy et al.，Plant Cell 2163-171，1990)、乙醇脱氢酶内含子(the Adh intron 1)(Callis et al.，Genes & Develop.11183-1200,1987)或蔗糖合酶内含子(the sucrosesynthase intron)(Vasil et al.，Plant Phys.911575-1579，1989)。
另一个对基因表达起调节或调控作用的元件是转录起始位点和编码序列起点之间的DNA序列，称作非翻译前导序列。前导序列的编译已经用来预测最优或次最优序列及产生“共有”(consensus)和优选的前导序列(Joshi，Nucl.Acids Res.159627-9640，1987)。预期的优选前导序列包括由预测出连接的结构基因直接最优表达的序列组成的那些序列，即包括优选的共有前导序列(consensus leadersequence)，该序列提高或维持mRNA稳定性和阻止不适合的翻译起始。按照本公开，本领域技术人员将知道如何选择这些序列。最优选来自植物中尤其是玉米中高表达基因的序列。一个特别有用的前导序列是牵牛花(penutia)HSP70前导序列。
转录增强子和复制增强子可用来提高表达。这些增强子常发现于真核细胞中起作用的启动子的转录起始5’端，但常常被插入到编码序列的5’或3’的前面或反方向。增强子的实例包括来自CaMV35S启动子、章鱼碱合酶基因(octopine synthase genes(Ellis et aL，EMBOJournal 611-16，1987))、米肌动蛋白基因(the rice actin gene)和来自非植物的真核生物启动子(e.g.，yeast；Ma et aL，Nature 334631-633，1988)的元件。
RNA聚合酶经由多腺苷酸化出现的位点转录核基因组DNA编码序列。典型的，位于多腺苷酸化位点下游数百个碱基对的DNA序列作终止转录用。那些区域是核转录信使RNA(mRNA)的有效多腺苷酸化所必需的。对于引入叶绿体或质体，或者引入到叶绿体或质体基因组的编码序列，mRNA的转录终止与细菌基因表达领域的所知方法相类似。例如，不论是在多顺反子还是单顺反子的序列里，转录可由茎环结构(stem and laoop structures)或与细菌rho相关序列相似的结构终止。
典型的表达构建体包括本发明示例的编码序列或其衍生物与3’末端DNA序列一起，该序列起转录终止信号作用并且在构建体上打算用于植物核基因组的表达，考虑到RNA转录生成物的3’末端多腺苷酸化。预期的最优选3’元件是那些来自根癌土壤杆菌(A.tumefaciens)的胆脂碱合酶基因(the nopaline synthase gene)(nos3′end)、根癌土壤杆菌的章鱼碱合酶基因T7转录终止子(the terminatorfor the T7 transcript from the octopine synthase gene)和拟南芥核酮糖1，5-二磷酸羧化酶合酶E9基因(pea RUBISCO synthase E9 gene(E93′))3’非翻译转录终止和多腺苷酸化序列。这些和其他3’末端调节序列在本领域内熟知。
优选的植物转化载体包括那些来自根癌土壤杆菌(Agrobacteriumtamefaciens)的Ti质粒，也包括那些由例如Herrera-Estrella(Nature 303209-213，1983)、Bevan(Nature 304184-187，1983)、Klee(Bio/Technol.3637-642，1985)和欧洲专利No.EP 0120516(Eur.Pat Appl.)公开的(每个都通过引用具体的结合到本文中)。
本发明公开了分离和纯化的编码来自芽孢杆菌的杀虫蛋白的核苷酸序列，特别是来自苏云金芽孢杆菌的核苷酸序列。尤其是，这里显示了苏云金芽孢杆菌菌株86833、EG2158、EG3618、EG6489、EG6561、EG6618和EG4653产生一种或多种位于培养基上清的可溶杀虫蛋白(见表1不合EG4653，它在实施例11中有详细描述)。
这里描述的苏云金芽孢杆菌菌株和其他的细菌菌株可用常规生长培养基和标准发酵技术进行培养。包含一个或多个tic901、tic1201、tic407、tic417、tic431或相关基因的苏云金芽孢杆菌菌株可按照这里所述进行发酵，直到培养的苏云金芽孢杆菌细胞达到它们生长周期中产生TIC901、TIC1201、TIC407、TIC417、TIC431和/或相关蛋白的阶段。
在该专利申请或专利发布未决期间，题述培养物已在确保能够使有授权的每一方得到该培养物的条件下保藏。然而，应该理解的是保藏物的可得性不构成许可实施题述发明而损害由政府行为授予的专利权利。
另外，这些微生物保藏物在国际承认用于专利程序的微生物保藏布达佩斯条约(“Budapest Treaty on the International Recognition ofthe Deposit of Microorganism for the Purposes of Patent Procedure”)规定下。题述培养保藏物的保藏和公众获得将与布达佩斯条约的规定一致，即要精心保藏使其有活力且无污染，在最近一次提供保藏物的样品后保持至少五年的时间，并且无论如何，在保藏日期后保持至少30年时间或任何造成培养公开的专利行使期(enforceable life)。保藏者承认由于保藏物的条件，保藏处有不能在被要求提供样品时更换保藏物的职责。公众获得题述培养保藏物的所有限制将被不可撤销的转移到公开它的专利授权上。
这里显示了TIC901、TIC1201、TIC407、TIC417、TIC431和本发明的相关蛋白被不同的苏云金芽孢杆菌菌株产生并分泌到生长培养基中。利用本发明中菌株的发酵可以继续经过孢子形成期，即当晶体蛋白要与孢子一同形成。孢子和细胞碎片可以通过离心从上清中分离，用后的培养基可用来分离本发明的杀虫蛋白。这里本发明者阐明了硫酸铵沉淀方法作为一种手段来浓缩和收集全部或大多数在用后澄清的培养基中出现的蛋白。然而，本领域技术人员将认识到有大量其他的方法可用于纯化和分离本发明的蛋白质。凝胶过滤和分子筛层析色谱是两个易用的直接从用后培养基提取蛋白的方法。用后的培养基也可除盐并用离子交换柱提取滤液的蛋白质。还有亲和柱，包含特异结合TIC901、TIC1201、TIC407、TIC417、TIC431或相关蛋白的抗体可用来直接从培养基中纯化本发明蛋白。
本发明的氨基酸序列已经和商业上可利用的蛋白序列数据库进行了对比，没有鉴定到显著同源性或相似性。基于这些分析，TIC901、TIC1201、TIC407、TIC417和TIC431蛋白以及相关序列显示是唯一的并且形成了确定芽孢杆菌杀虫蛋白一个新分类的基础，因为未观察到本发明的蛋白与其他已知杀虫蛋白显示任何显著的联系。
本发明的肽结构上可有修饰和改变并且其编码DNA片段仍有功能分子，该分子编码所需特性的蛋白或肽。这里预期的生物功能等价的肽、多肽和蛋白应该具有从约65至约70％或更高的氨基酸序列相似性，或从约80％或更高的氨基酸序列相似性、或从约90％或更高的氨基酸序列相似性至如SEQ ID NO4所示的基本的TIC901氨基酸序列内的相应部分，或者至如SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO32及相关序列分别所示的TIC1201、TIC407、TIC417和TIC431的氨基酸序列内的相应部分。
依照本发明提到的tic901基因和编码蛋白毒素，不仅包括这里公开的序列全长还包括这些序列的片段、自然变异体、突变体和重组体或遗传工程的包含SEQ ID NO3的tic901基因衍生物。这些序列编码的蛋白应该保留与含有SEQ ID NO4的TIC901蛋白基本一样或更好的杀虫特性。本发明中有用的蛋白也包括具有与TIC901蛋白一样或更好杀虫特性的融合蛋白。在一些例子中，除了这里详细示例蛋白的杀虫特性外，融合蛋白可包含由融合配体的氨基酸序列提供的另外的杀虫活性。另一个选择是，TIC901蛋白或其杀虫变异体的结晶学分析可提供一种方法来决定此蛋白是否是构建替换蛋白(permutein)的候选，替换蛋白(permutein)显示与天然的TIC901或相关蛋白一样或更好的杀虫活性，并且较好显示了在优选宿主细胞例如植物细胞中的表达相关的改良特性。同样的性质和特性也应用于tic1201，tic407和tic417；不仅用于这里公开的全长序列也用于这些序列的片段、自然变异体、突变体和重组体或遗传工程的分别包含SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO32的基因衍生物。这些序列编码的蛋白应该保留与分别包含SEQ ID NO5、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32的TIC901、TIC1201、TIC407、TIC417和TIC431蛋白基本一样或更好的杀虫特性。
对本领域技术人员显而易见是编码昆虫抑制毒素的核苷酸序列，尤其是鞘翅类昆虫抑制毒素，可由这里公开的几种方法鉴定并获得。这里示例的特定序列和相关序列可从如上所述培养保藏处的单独保藏物获得。这些序列，或杀虫部分或其变异体，也可合成构建，例如通过利用核苷酸序列合成仪。用制造点突变的标准方法易于构建改变的编码序列。并且，用市售的核酸外切酶或核酸内切酶依照标准程序制造这些序列的片段。例如，酶Bal31或定向诱变可用于系统的切除如这里示例的序列或蛋白编码序列内的末端核苷酸。也可用许多种限制性内切酶、核酸内切酶、热扩增方法等获得编码杀虫活性蛋白片段的核苷酸序列。蛋白酶例如蛋白酶K(proteinaseK)、胰蛋白酶(trypsin)、糜蛋白酶(chymotrypsin)、胃蛋白酶(pepsin)等可用于直接获得这些毒素的活性片段。
其他的毒素和编码与本发明毒素和编码序列相关毒素的核苷酸序列可来自用本领域提供的技术结合这里公开的核苷酸序列分离的DNA，该DNA得自苏云金芽孢杆菌、侧孢芽孢杆菌(B.laterosperous)、球形芽孢杆菌(B.sphaericus)和相关芽孢杆菌种类。这种与本发明毒素和编码序列相关的毒素和核苷酸序列被认为等价于与本发明的毒素和核苷酸序列。“等价”意味着蛋白显示出这里描述的一个或多个蛋白的特性，包括但不限于相似的杀虫抑制生物活性、杀虫生物活性的宿主范围，显示出与抗TIC901、TIC1201、TIC407、TIC417等和相关蛋白的抗体交叉反应的相似抗原表位，显示出与TIC901和相关蛋白相比相似的大小，显示出在苏云金芽孢杆菌和相关细菌等中表达时分泌到胞外环境的倾向性。术语“显示分泌到胞外环境的倾向性”包括TIC901和相关蛋白，包括但不限于细菌或宿主细胞作为前体蛋白产生的TIC1201、TIC407、TIC417和TIC431等，该蛋白含有一段连接到杀虫蛋白的氨基酸序列用于靶向杀虫蛋白到细菌或宿主细胞的分泌装置，并且与分泌装置接触后被信号肽酶水解切开，如果是革兰氏阳性菌就释放成熟的或杀虫的蛋白到胞外环境，如果是革兰氏阴性菌至少释放到周质中，如果是真菌或植物或其他真核宿主细胞就释放到内质网(endoplasmic reticulum)或分泌小泡(secretory vesicle)或亚细胞器例如线粒体或叶绿体或质体。本发明范围内隐含的核苷酸编码序列也被考虑到。
有许多鉴定与这里公开的肽相关的具有等价的杀虫毒素的方法。例如，针对这里公开和要求的杀虫毒素的抗体可用来从蛋白混合物中鉴定和分离其他毒素。具体的，培育的抗体可针对一部分毒素，与新类的蛋白很一致而与其他苏云金芽孢杆菌毒素很不同。这些抗体然后通过免疫沉淀、酶联免疫吸附测定(ELISA)或蛋白质印迹(Western blotting)用于特异的鉴定特征活性等价的毒素。用本领域的标准程序易于制备这里公开的针对毒素、或针对等价毒素、或针对这些毒素片段的抗体。编码这些毒素的核苷酸序列可随后从微生物或其他不同来源获得。
鉴定本发明毒素和基因的另外一种方法是通过利用寡核苷酸探针。这些探针是在严格杂交条件下与TIC901编码序列或TIC901编码序列的相关序列杂交的基本的核苷酸序列。正如本领域所熟知的，如果探针分子和样品中核酸序列分子通过在两个分子间形成足够强的键杂交，那么可以合理假设这两个分子显示了基本同源。探针结合用本领域已知的任一方法检测包括但不限于荧光、冷光、同位素、免疫学、表面等离子体共振光谱等。这种探针分析提供了快速鉴定本发明毒素编码基因的方法。依据本发明用作探针的核苷酸片段可由DNA合成仪用标准程序合成或由其他本领域所知方法合成。这些核苷酸序列也可用作扩增本发明核苷酸序列或其部分的PCR引物。
相关蛋白的片段和至少保留示例毒素的杀虫活性等价物在本发明范围内。并且，由于遗传密码的冗余，多种不同DNA序列可编码这里公开的氨基酸序列。这易于使本领域熟练技术人员建造编码相同或基本相同毒素的可选择的DNA序列。这些DNA序列的变异体包括在本发明范围内。
本领域熟知的是在蛋白结构中某个氨基酸可被另一个氨基酸取代而相互结合能力没有可感知的损失，例如抗体的抗原结合区域或底物分子的结合位点的结构。既然相互的能力和蛋白的性质确定了蛋白的生物功能活性，可在蛋白序列中制造确定的氨基酸序列取代，并且当然在其根本的DNA编码序列，而得到有相似性质的蛋白。因此发明者预期公开的组合物中存在不同改变的肽序列，或者编码所述蛋白的相应DNA序列没有可感知的生物效用或活性的损失。这种取代在本领域内叫做保守取代。
进行这种改变时，可考虑氨基酸的疏水指数(hydropathic index)。氨基酸疏水指数在比较蛋白的生物活性功能上的重要性是在本领域内广泛了解的(Kyte and Doolittle，1982)。一般公认的是氨基酸的相对水化特性促成了所得蛋白的二级结构，并依次确定了蛋白和其他分子例如酶、底物、受体、DNA抗体、抗原等的相互作用。
每个氨基酸都基于其疏水性和电荷特性(charge characteristics)被指定了一个疏水指数(Kyte and Doolittle，1982)，它们是异亮氨酸(isoleucine)(+4.5)、缬氨酸(valine)(+4.2)、亮氨酸(leucine)(+3.8)、苯丙氨酸(phenylalanine)(+2.8)、半胱氨酸/胱氨酸(cysteine/cystine)(+2.5)、甲硫氨酸(methionine)(+1.9)、丙氨酸(alanine)(+1.8)、甘氨酸(glycine)(-0.4)、苏氨酸(threonine)(-0.7)、丝氨酸(serine)(-0.8)、色氨酸(tryptophan)(-0.9)、酪氨酸(tyrosine)(-1.3)、脯氨酸(proline)(-1.6)、组氨酸(histidine)(-3.2)、谷氨酸(glutamate)(-3.5)、谷氨酰胺(glutamine)(-3.5)、天冬氨酸(aspartate)(-3.5)、天冬酰胺(asparagine)(-3.5)、赖氨酸(lysine)(-3.9)、和精氨酸(arginine)(-4.5)。
本领域内已知确定的氨基酸可被其他有相似的疏水指数或分数的氨基酸取代并仍然使蛋白有相似的生物活性，即仍然得到一个生物功能等价的蛋白。进行这种改变时，优选那些疏水指数为±2、尤其优选±1、最优选±0.5的氨基酸进行取代。
同样理所当然的是，本领域内相似氨基酸的取代可以基于亲水性有效地进行。由邻近氨基酸的亲水性支配的蛋白最大局部平均亲水性(local average hydrophilicity)与蛋白的生物学性质相关(美国专利4,554,101)。
如美国专利4,554,101中详述的，以下为指定的氨基酸残基亲水值精氨酸(+3.0)、赖氨酸(+3.0)、天冬氨酸(+3.0±1)、谷氨酸(+3.0±1)、丝氨酸(+0.3)、天冬酰胺(+0.2)、谷氨酰胺(+0.2)、甘氨酸(0)、苏氨酸(-0.4)、脯氨酸(-0.5±1)、丙氨酸(-0.5)、组氨酸(-0.5)、半胱氨酸(-1.0)、甲硫氨酸(-1.3)、缬氨酸(-1.5)、亮氨酸(-1.8)、异亮氨酸(-1.8)、酪氨酸(-2.3)、苯丙氨酸(-2.5)、色氨酸(-3.4)。
不言而喻的是一个氨基酸可被另一个有相似亲水值的氨基酸取代且仍得到一个生物等价物，具体的说是一个免疫等价的蛋白(immunologicaily equivalent protein)。在这种改变里，优选那些亲水值为±2、尤其优选±1、最优选±0.5的氨基酸进行取代。
如上所述，因此通常氨基酸的取代是基于氨基酸侧链取代物的相对相似性，例如它们的疏水性、亲水性、电荷数、大小等。本领域技术人员熟知的模式取代考虑了上述不同特性，包括精氨酸和赖氨酸；谷氨酸和天冬氨酸；丝氨酸和苏氨酸；谷氨酰胺和天冬酰胺；以及缬氨酸、亮氨酸和异亮氨酸。
TIC901、TIC1201、TIC407、TIC417、TIC431和相关蛋白等的肽、多肽及蛋白生物功能等价物，其氨基酸序列包括含有SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10和SEQ ID NO33所示的基本序列上变化的保守氨基酸序列。具体讲，涉及SEQ ID NO4从约44至367位氨基酸、SEQ ID NO6从约44至364位氨基酸、SEQ ID NO8从约44至368位氨基酸、SEQ ID NO10从约44至364位氨基酸和SEQ ID NO33从约44至364位氨基酸，对这种氨基酸序列，基本序列上的一个或多个氨基酸可被别的与天然氨基酸有相似电荷和极性的氨基酸取代，即保守氨基酸的取代导致沉默改变(silent change)。
基本多肽序列上氨基酸的取代物可选自自然出现的氨基酸所属类别的其他成员。氨基酸可被分为以下四组(1)酸性氨基酸；(2)碱性氨基酸；(3)中性极性氨基酸(neutral polar amino acids)；和(4)中性非极性氨基酸(neutral non-polar amino acids)。这些不同组的典型氨基酸包括但不限于(1)酸性(负电荷)氨基酸例如天冬氨酸和谷氨酸；(2)碱性(正电荷)氨基酸例如精氨酸、组氨酸和赖氨酸；(3)中性极性氨基酸例如甘氨酸、丝氨酸、苏氨酸、半胱氨酸、胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺；(4)中性非极性(疏水)氨基酸例如丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。
本发明基本多肽序列上保守氨基酸的改变可通过用同一组中别的氨基酸取代该组的一个氨基酸来得到。TIC901、TIC1201、TIC407、TIC417、TIC431等的生物功能等价物和相关序列可有小于或等于10个保守氨基酸的改变，更优选小于或等于7个保守氨基酸的改变，最优选小于或等于5个保守氨基酸的改变。编码的核苷酸序列(基因、质粒DNA、cDNA或合成DNA)因此会有相应的碱基取代，使它编码TIC901、TIC1201、TIC407、TIC417和TIC431蛋白及相关序列的生物功能等价形式。
本发明蛋白的氨基酸序列变异体和相关序列可用本领域熟知的程序得到。例如，通过甲基磺酸乙酯(EMS)对编码TIC901的核苷酸序列的诱变作用获得TIC901氨基酸序列的变异体蛋白，该蛋白不分泌到胞外环境。突变体也可通过本领域内熟知的程序用紫外线和亚硝基胍进行构建，或通过构建一个缺少全部或部分编码信号肽氨基酸序列的编码序列来实现。
定点突变是通过对潜在DNA特异的诱变作用来制备个别肽、或生物功能等价的蛋白或肽的另一种有用的技术。此技术还能方便的制备和检测序列变异体，例如，结合以上的一个或多个考虑，通过引入一个或多个核苷酸序列改变到DNA中。定点突变允许使用特异的寡核苷酸序列来生成变异体，该序列编码所需突变的DNA序列和足够数量的邻近核苷酸来提供足够大小和序列复杂性的引物序列，以在定向修饰序列的两边都形成稳定的双链。典型的，优选约17到25个核苷酸长度的引物，定向修饰序列的两边至少有约5到10个一致的残基。
用定点突变制备所选肽的编码DNA片段的序列变异体是作为产生潜在有用种类的一个方法提供的，并不意味着限制可获得肽变异体序列和其编码DNA序列的其他方法。例如，编码所需肽序列的重组载体可用作诱变剂，如羟胺，以获得序列变异体。
如这里SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ IDNO9和SEQ ID NO32等所示分离自苏云金芽孢杆菌菌株的tic901和相关核苷酸编码序列可用作杂交探针来鉴定和分离自然出现的它们的变异体，以及来自其他苏云金芽孢杆菌或其他微生物例如细菌类如梭状芽孢杆菌属(Clostridium)、芽孢杆菌属(Bacillus)、致病杆菌属(Xenorhabdus)和光杆菌属(Photorhabdus)的相关核苷酸编码序列。本发明包含微生物的核苷酸序列，其中核苷酸序列可通过与全部或部分本发明芽孢杆菌核苷酸序列杂交而分离。这种核苷酸序列编码的蛋白可用杀虫活性来检测。本发明还包含核苷酸序列编码的蛋白。例如，这四种核苷酸序列比对提供的同一性区域可优选用作探针和引物。而且，这些及相关核苷酸编码序列编码的氨基酸序列的比对提供了关于同一性区域和/或蛋白间基本相似性的信息，还提供了构建探针或引物的基础，用于鉴定这些及其他相关的编码这种杀虫蛋白的核苷酸序列。例如，SEQ ID NO23-SEQ ID NO29是这种探针和引物的典型并在实施例10中举例说明。
对TIC901、TIC1201、TIC407、TIC417和TIC431等或本发明相关蛋白的免疫刺激产生应答的抗体可用标准的免疫学技术生成多克隆抗血清来产生并且，若需要，使免疫宿主的抗体产生细胞不死(immortalizing)以生成单克隆抗体源。产生任何目的物抗体的技术是熟知的，如Harlow和Lane(1988)及Goding(1986)所述。例如，结合到TIC901上或其内表位的抗体可用作探针来鉴定苏云金芽孢杆菌菌株或其他产生TIC901变异体或者tic901或相关基因编码的相关蛋白的微生物。本发明包含与抗本发明一个或多个杀虫蛋白抗体交叉反应的杀虫蛋白。
本发明产生的抗体也用于确定生物样品中TIC901、TIC1201、TIC407、TIC417和TIC431或相关蛋白的数量或存在的免疫测定。这种分析还用于生产包含本发明一个或多个蛋白的组合物时的质量控制。此外，抗体可用于评价生产一个或多个本发明蛋白或相关蛋白的重组体的效力，以及用于筛选表达库中编码本发明一个或多个蛋白的核苷酸序列或相关蛋白编码序列的存在。抗体还作为亲和配体来纯化和/或分离本发明任一个或多个蛋白或者相关蛋白。本发明的蛋白和含有相关抗原表位的蛋白可通过在优选宿主细胞中过表达全长或部分编码全部或部分本发明蛋白或相关蛋白的序列来获得。
本发明的肽主要，虽然不是唯一，用于植物，并且在确定的优选实施方案中，在一个或多个质粒载体内包含植物中编码本发明蛋白的修饰核苷酸序列。这种载体可包括多种调控和其他元件以使本发明蛋白在植物细胞中进行最适表达。这些附加的元件可包括如上所述的启动子、终止子和内含子。包含DNA结构和任何调控或其他元件的载体可选自酵母人工染色体、细菌人工染色体、质粒或粘粒等。另外，表达载体自身可是多种形态。这些形态可由于不同的原因而不同，并且可能包含不同组件，这取决于它们是否会用于转化单子叶植物或者双子叶植物。
此外预计在本发明范围内的载体包括那些含有tic901、tic1201、tic407、tic417或以上公开的相关核苷酸成分的载体，以及任何其他还包含从芽孢杆菌得来的其他杀虫蛋白的植物可表达编码区域的DNA结构。
编码TIC901(SEQ ID NO3编码SEQ ID NO4)或编码相关肽序列如TIC1201(SEQ ID NO5编码SEQ ID NO6)、TIC407(SEQ IDNO7编码SEQ ID NO8)、TIC417(SEQ ID NO9编码SEQ ID NO10)和TIC431(SEQ ID NO32编码SEQ ID NO33)的核苷酸序列可用本领域熟知的程序转化合适的宿主，在允许稳定的维持和表达引入的核苷酸序列的条件下(Sambrook et al.，1989，Molecular CloningA Laboratory Manual 2nd Ed.，Cold Spring Harbor Press，New York)引入到不同的微生物宿主中而不需过度试验。允许本发明蛋白和相关序列表达的合适宿主包括苏云金芽孢杆菌和其他芽孢杆菌如枯草芽孢杆菌(Bacillus subtilis)、球形芽孢杆菌(Bacillus sphaericus)、侧孢芽孢杆菌(Bacillus laterosporous)、巨大芽孢杆菌(Bacillusmegaterium)或炭疽芽孢杆菌(Bacillus anthracis)。遗传改变或设计的微生物包含编码一个或多个本发明蛋白的基因，包括TIC901、TIC1201、TIC407、TIC417和TIC431等，也包括在相同微生物中存在的编码其他毒素蛋白的核苷酸序列；这些编码序列可同时产生与本发明蛋白或相关蛋白不同的杀虫蛋白。具体的说，最好在宿主细胞中产生两个或更多不同的杀虫蛋白，其中每个蛋白对同样的昆虫种类都有毒性并且每个蛋白表现的作用方式不同于其他。
植物寄居(plant-colonizing)或根寄居(root-colonizing)微生物也可用作产生一个或多个本发明蛋白或相关蛋白的宿主细胞。苏云金芽孢杆菌毒素基因的示例性微生物宿主包括Turner等人描述的(1993；Endophytesan alternative genome for crop improvement.；International Crop Science Congress，Ames，Iowa，USA，14-22 July 1992.，pp.555-560)植物寄居微生物棒杆菌(Clavibacter xyli)和如Obukowicz等人描述的(美国专利5,229,112)根寄居假单胞菌。
可从本发明获得的编码毒素的核苷酸序列可引入很多种微生物或植物宿主中。毒素基因的表达直接或间接的导致在胞内产生并维持杀虫剂。用合适的微生物宿主，例如假单胞菌，可将微生物用于虫害部位，它们将在那里增殖并被害虫摄取。结果使害虫得到控制，表现出植物损害减少、植物产量提高、表达毒素蛋白转基因生物一般局部环境的植物害虫患病率降低和植物害虫的死亡或发育障碍，通常对植物或表达毒素蛋白的转基因生物周围的菌丛没有另外的影响，并且一般对环境也没有别的影响。另一个选择是，含有毒素基因的微生物可在延长毒性和稳定细胞的条件下进行处理。处理后的细胞保留了毒性，随后可用于目标害虫的环境。
本发明的毒素基因或相关核苷酸编码序列通过合适的载体引入微生物宿主，宿主以有生命的状态用于环境，这便于使用微生物宿主。例如，可选择已知处于害虫栖息地的微生物宿主。微生物宿主也可以与特异的害虫种类共生生活。选择这些微生物是为了能在特定环境成功对抗野生型微生物，使基因稳定的维持和表达杀虫多肽，并且所需的，更好的防止杀虫剂遭受环境退化和失活作用。
已知大量的微生物居住于害虫的栖息地。这些微生物包括细菌、藻类和真菌。尤其感兴趣的微生物如细菌，例如芽孢杆菌属、埃希氏杆菌属、假单胞菌属、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷柏氏菌属(Klebsiella)、沙门氏菌属(Salrnonella)、巴斯德菌属(Pasteurella)、黄单胞杆菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、嗜甲基菌属(Methylophilius)、土壤杆菌属(Agrobacterium)、醋酸杆菌属(Acetobacter)、乳酸杆菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)和产碱杆菌属(Alcaligenes)；真菌例如Metarhizium、巴伐利亚菌属(Bavaria)、酿酒酵母属(Saccharomyces)、隐球菌属(Cryptococcus)、克鲁维酵母属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)和短梗霉属(Aureobasidium)。
可用很多种方法在允许基因的稳定维持和表达的条件下将编码毒素的毒素基因引入微生物宿主中。这些方法是本领域技术人员熟知并如美国专利5,135,867所述。
如上所述，苏云金芽孢杆菌或表达本发明蛋白或相关毒素蛋白的重组体细胞可经处理以延长毒性和细胞的稳定。微囊体杀虫剂是在一个结构中包含本发明一个或多个蛋白或者一个或多个相关毒素，当微囊体用于目标害虫的环境时该结构稳定并起到保护毒素的作用。合适的宿主细胞即包括原核生物也包括真核生物，通常受限于那些对高等生物如哺乳动物不产生物质毒性的细胞。但是，毒性物质不稳定或者使用水平十分低以至于避免了对哺乳动物宿主产生毒性的任何可能，则可以用产生的物质对高等生物有毒性的生物体。尤其感兴趣的宿主是原核生物以及低等的真核生物如真菌。这些生物体的细胞在处理时通常是完整的且是增殖型而非芽孢型，尽管在一些实例中可以使用芽孢。这种微囊体也可包含一个或多个本发明蛋白或一个或多个相关蛋白与一个或多个不相关的杀虫蛋白一起的组合物，包括但不限于δ-内毒素如Cry1、Cry2、Cry3、Cry9、Cry22、ET70、TIC851和/或二元毒素ET80/76、ET33/34、PS149B1和ET100/101等，以及杀虫蛋白或从不同的生物体如致病杆菌属和/或光杆菌属得来的杀虫蛋白复合物或VIP、WAR和/或MIS蛋白毒素及相关蛋白。
对微生物细胞的处理，即包含本发明核苷酸序列或核苷酸片段或相关编码序列的微生物，可通过化学或物理的方法进行，或通过结合化学和/或物理的方法进行，只要此方法对毒素的性质没有有害的影响，也不减少细胞保护毒素的能力。化学试剂的实例是卤化剂，具体的说是原子序号17-80的卤素。更具体的说，在温和的条件和足够的时间下用碘得到所需结果。其他合适的方法包括用醛，如戊二醛；抗感染药，如氯化卞烷氨和氯化十六烷基吡啶；乙醇，如异丙基和乙醇；不同的组织固定剂，如陆戈碘液(Lugol iodine)、Bouin’s固定液(Bouin′s fixative)、不同的酸和Helly′s fixative(见Humason，1967)；或结合物理(热)和化学病因进行处理使得当细胞投药给宿主动物体时保护并延长细胞产生毒素的活性。物理方法的实例是短波辐射如γ射线和X射线、冻结、紫外辐射、冻干法等。处理微生物细胞的方法在美国专利4,695,455和4,695,462中公开。
细胞通常会有提高的结构稳定性以提高对环境条件的抗性。其中杀虫剂是前型或前体形式，应选择不会对由目标害虫病原体将前型处理成成熟形式进行抑制的细胞处理方法。例如，甲醛会交联蛋白并抑制多肽杀虫剂前型的处理。细胞处理的方法至少保留毒素生物药效或生物活性的基本部分。
在为生产目的选择的宿主细胞尤其关注的特征包括引入一个或多个本发明编码虚礼或一个或多个相关编码序列到宿主中的方便性、表达系统的可用性、表达的有效性、宿主内杀虫药的稳定性和遗传能力辅助物的存在。用作杀虫药微囊体关注的特征包括杀虫剂的防护性质，如厚的细胞壁、着色和胞内包装或包涵体的形成；水相环境中的存活率；无哺乳动物毒性；对害虫进食的吸引力；易于杀死及毒素固定的无损害；等等。其他的考虑包括组分和操作、经济、保藏稳定性的方便性等等。
细胞宿主包含编码本发明蛋白或相关蛋白的核苷酸序列可在任何合宜的营养培养基上生长，其中DNA结构提供了使全部或基本上全部保留了编码本发明蛋白的核苷酸序列或相关编码序列的细胞在选择培养基上有选择优势。这些细胞随后可用常规方法收集。另一个选择是，细胞可在收获前进行处理。
本发明的编码序列，包括如SEQ ID NO3、SEQ ID NO5、SEQID NO7、SEQ ID NO9和SEQ ID NO32等所示的那些可用作构建修饰核苷酸序列的基础，以整合到植物细胞中。最好是合成非自然出现编码一个或多个本发明蛋白或相关杀虫蛋白或其等价物的核苷酸序列在植物细胞中表达，合成非自然出现的核苷酸序列是基于天然蛋白的氨基酸序列分析不是参考由天然氨基酸序列推导来的天然核苷酸序列。在植物细胞中表达这种序列使含有这种细胞的植物对鞘翅类等昆虫的攻击更有抵抗力。有编码一个或多个本发明蛋白或相关蛋白或相关杀虫氨基酸序列的修饰序列的遗传工程植物可通过引入所需的含有编码序列的植物化DNA(植物化是修饰或合成的同义词)，用多种形式且来源是植物基因工程技术人员熟知的DNA分子来实现。引入DNA到植物组织的技术实例至少由Perlak等人(1991)公开。
包含修饰的编码本发明蛋白如TIC901、TIC1201、TIC407、TIC417或TIC431等、或相关杀虫蛋白的基因操作性连接到植物功能性启动子的DNA，可用许多方法直接传送到植物细胞或组织中，这些方法包括但不限于农杆菌介导的转化、植物病毒、电穿孔、显微注射、真空侵入、脂质体融合法及弹道法等。植物的启动子可以是组成型启动子；或启动子可以是时序、空间、化学、光合、热或人为调节的启动子；组织特异的启动子；或由其他植物启动子部分装配的嵌合或杂合启动子。例如，启动子可以是花椰菜花叶病毒(CaMV)35S启动子或其植物功能性衍生物。
天然的细菌基因和编码序列常常难于在转基因植物细胞中表达。植物的密码子选择比单细胞生物如细菌更接近高等生物。若干报告公开了改善植物中表达重组基因的方法(Murray et aL，1989，Nucleic Acids Research，Vol.17477-498；Diehn et al.，1998，PlantPhysiology，1171433-1443；Rocher et al.，1998，Plant Phys.1171445-1461)。这些报告公开了不同设计编码序列的方法使表现的序列基于植物密码子频率表更有效的翻译，利用消除可疑的多腺苷酸化或A/T富含区或内含子拼接一致序列来改善密码子第三位碱基的偏移。虽然合成基因结构要注意这些方法，为在特定植物中表达合成的本发明基因的制备基本与Brown等人的方法一致(美国专利5,689,052)。
这里描述的工作利用了在植物中加强表达一个或多个本发明蛋白和相关杀虫蛋白的方法，通过编码序列整合或固定到易感植物的核、质粒或叶绿体基因组，赋予对鞘翅目或鳞翅目植物昆虫或线虫病原体的抗性。美国专利5,500,365和相关专利描述了综合处理植物基因的方法以实现综合的、非自然出现的、合成的或人造基因编码的蛋白最佳表达水平。这些方法是关于修饰天然Bt结构基因序列以产生植物更喜欢的编码序列并因此更可能由单子叶或双子叶植物翻译及表达。然而，Brown等人(美国专利5,689,052)提供了优选在单子叶植物中增强表达转基因的公开的方法。
因此，编码目的多肽的基因或核苷酸序列或核苷酸片段，即TIC901、TIC1201、TIC407、TIC417、TIC431或相关多肽的全部或杀虫部分，可通过用上述转化方法增加其转化到植物中的数量。具体说，叶绿体或质体细胞器的转化可导致所需编码序列在含有这些亚细胞器结构组织的每个细胞中出现多达约10,000个拷贝(McBride etal.，WO 95/24492)。
编码本发明蛋白和相关蛋白的DNA也可通过利用直接移植DNA到花粉的方式引入到植物中，如(Zhou et al.，1983，Mol.Cell Biol.，104529-4537；Hess，1987，Intern Rev.Cytol.，107367.)所述。编码多肽序列的表达，即tic901等，可通过将DNA注射到植物的生殖器官来获得，如(Pena et al.，1987，Nature，325274)所述。DNA也可直接注射到未成熟胚的细胞或干燥后再水化的胚中，如(Neuhaus et al.，1987，Theor.Appl.Genet.，7530)所述。
除去编码本发明杀虫蛋白或相关蛋白的外源核苷酸序列对受体细胞的影响后，获得转基因植物的下一步关注于鉴定转化的细胞以进一步进行培养和植物再生，即转化细胞的选择。如这里所述，为了提高鉴定转化细胞的能力，可能需要使用一个可选择或可筛选的标记基因作为，或除此外的，目的可表达的基因。既然如此，一般通过暴露细胞于一个或多个选择试剂来试验可能的转化细胞群，或者用所需标记基因的特征筛选细胞。
鉴定转化细胞方法的标准实施方案包括暴露转化物于选择试剂，如代谢抑制剂、抗生素、除草剂等。转化后并有稳定整合的赋予所用选择试剂的抗性标记基因的细胞，在培养后生长并分裂。在进一步的培养中敏感细胞经不起检验。优选的标记基因的一个实例是赋予细胞除草剂草甘磷的抗性。当这个基因用作可选标记时，假定的转化细胞培养物用草甘磷处理。暴露给草甘磷后，含有重组GOX酶或草甘磷不敏感的烯醇式丙酮酸芥草酸-3-磷酸合成酶(EPSPS)的转基因细胞可通过进一步培养得到，而得不到敏感的或非转化的细胞(美国专利5,569,834)。另一个优选的可选择标记系统实例是新霉素磷酸转移酶(neomycin phosphotransferase(nptII))抗性系统，它赋予细胞对卡那霉素的抗性，如美国专利5,569,834所述。再次，用这个系统转化后，可进一步用卡那霉素处理培养细胞来获得转化细胞，而不会得到非转化的细胞。还有一个优选的可选择标记系统包括使用能赋予巴龙霉素抗性的基因结构。美国专利5,424,412描述了用这种类型的可选择标记系统。其他本领域熟知的可选择标记包括但不限于抗生素抗性基因如nptII、tet、aad等、phnO和其他不同的乙酰基转移酶(美国专利6,448,476)、不同的脂酶(6,107,549)、芽孢杆菌RNA酶(Hartley，1988，J.Mol.Biol.202913)、赋予转化细胞草甘磷氧化酶活性(gox)的细菌酶类等(Barry et al.，1992，Inhibitors of amino acid biosynthesisStrategies for imparting glyphosatetolerance to crop plants.InBiosynthesis and Molecular Regulation ofAmino Acids in Plants.pp.139-145.Singh，Flores，and Shannon Eds.，American Society of Plant Physiologists，Rockville，Md.)。
质体转化(Transplastonomic)选择(选择质体或叶绿体转化事件)通过利用叶绿体或质体对大观霉素的敏感性得到简化，大观霉素抑制质体或叶绿体蛋白的合成但不影响编码胞质核糖体的核基因组的蛋白合成，阻止叶绿体光合作用必需的蛋白聚集因此转化了抗大观霉素的植物细胞可以基于其颜色的不同区分；抗性的转化细胞是绿色，而敏感细胞由于抑制了质体蛋白的合成是白色。用有合适的细菌add基因、或编码大观霉素抗性基因的质体或叶绿体功能性核糖体RNA的叶绿体或质体进行转化，提供了选择或维持质体转化(Transplastonomic)事件的方法(Maliga，1993，Trends in Biotechnology11101-106)。
进一步考虑到结合可筛选和可选择的标记用于鉴定转化细胞。在一些细胞或组织型中选择试剂如草甘磷或卡那霉素既不提供足够的杀死活性以清楚识别转化细胞也不引起对转化和相似的非转化细胞实质的非选择性的抑制，因此导致选择方法没有作用。建议用生长抑制复合物进行选择，如用高于100％抑制浓度的草甘磷或AMPA(氨基-甲基膦酸)，随后筛选表达可筛选基因如卡那霉素的生长组织，使仅靠选择检验不出的细胞或组织型的转化子复苏。建议结合选择和筛选使此方法能鉴定多种细胞和组织型的转化子。
从单个原生质体或不同分离块发育或再生植物使本领域熟知的(Weissbach and Weissbach，1988)。典型的再生和生长过程包括选择转化细胞的步骤、个体化培育细胞到通常的胚胎发育阶段再至苗生根阶段。同样再生转基因的胚胎和种子。得到转基因的生根嫩枝随后种植于合适的植物生长培养基如泥土中。
通过农杆菌转化叶分离块将包含外来的编码TIC901、TIC1201、TIC407、TIC417、TIC431或相关多肽全部或杀虫部分的外源基因引入植物基因组中，该植物的发育或再生可用本领域已知方法实现(Horsch et al.，1985)。在此过程，转化子在有选择试剂的存在并且诱导所述转化植株(Fraley et aL，1983)再生嫩枝的培养基中培养。具体说，美国专利5,349,124详述了遗传转化的莴苣细胞和植株的构建，使得植株从此表达杂合晶体蛋白，赋予此植株对鞘翅目幼虫的杀虫活性。
典型方法在2到4月内产生嫩枝，随后这些嫩枝转移到合适的诱导生根的培养基，培养基含有选择剂和抑制细菌生长的抗生素。嫩枝在选择剂存在下生根形成苗并随后移植到土壤或其他允许生根的培养基。这些过程的改变依赖于所用的特定植株，这种改变是本领域熟知的。
优选自花授粉的再生植物以提供纯合的转基因植物，或得自再生植物的花粉和农业上重要的种子植物，优选自交系，交叉授粉。相反得，那些重要品系植物的花粉用于给再生植物授粉。本发明转基因植物包含编码所需本发明杀虫蛋白或相关多肽的核苷酸序列，其种植方法为本领域技术人员熟知。
本发明转基因植物至少包含编码一个或多个本发明多肽或相关多肽的编码区，如TIC901、TIC1201、TIC407、TIC417、TIC431蛋白或这些蛋白嵌合体的杀虫片段。优选是独立分离子的转基因植物，它可以将该基因和活性传递至后代。更优选该基因纯合的转基因植物，可将该基因传递至所有性别交配的后代。转基因植物的种子可在田地或温室中生长，并使性成熟的转基因植物自花授粉以产生真正的育种植物。这些植物的后代成为真正的繁殖系，估计其增强表达苏云金芽孢杆菌的转基因。
优选表达多于一个杀虫剂的转基因植物，每个杀虫剂都对目标害虫有毒性，并且每个杀虫剂表现出不同的作用方式，或表现出导入目标害虫中肠上皮孔的不同方式，要么通过结合分开独立的受体要么通过形成与在同一转基因植物中存在的其他一个或多个杀虫剂形成的孔明显不同的孔。想得到这种植物可转化表达至少两种或更多本发明蛋白，或与至少一种本发明蛋白一起转化至少一个或多个不相关杀虫蛋白，包括但不限于δ-内毒素蛋白如一个或多个Cry1、Cry2、Cry3、Cry9、Cry22、ET70、TIC851；和/或任何一个或多个二元毒素ET80/76、ET33/34、PS149B1和ET100/101等以及其融合体、嵌合体和变异体；杀虫蛋白或从不同的生物体如致病杆菌和/或光杆菌得来的杀虫蛋白复合物；或VIP、WAR和/或MIS蛋白毒素及相关蛋白；和或一个或多个在植物细胞中表达的转基因双链RNA导致抑制一个或多个目标害虫的一个或多个基因。
鉴定高水平表达优选核苷酸序列的本发明多肽或相关蛋白的转基因植物必需对选择的转基因结果(R0代)就基因的杀虫活性和/或表达进行筛选。可以通过本领域技术人员熟知的不同方法来实现，包括但不限于1)从转基因R0植株获得小组织样品并直接测定组织对敏感昆虫的活性，平行作来自非表达的阴性对照植株的组织{例如，表达TIC901或相关蛋白杀虫片段的转基因玉米植株R0代可通过测定得自该植株的叶组织对马铃薯甲虫(CPB，马铃薯甲虫(Leptinotarsa decemlineata))和南部玉米根叶甲(SCR，瓜十一星叶甲(Diabrotica undecinzpunctata howardz))的活性来进行鉴定}；2)通过特异针对杀虫蛋白片段或相关蛋白得酶联免疫分析检验蛋白提取物；或3)反转录热扩增(本领域所知的RTPCR)鉴定表达编码杀虫蛋白片段或相关蛋白的序列。
本发明的杀虫剂可单独使用或与其他杀虫剂作为种子包被成分结合到种子，或在转基因种子里产生本发明的因子并结合种子包被形式的其他杀虫剂。种子包被的方法和组合物是本领域内已知的，用于本发明杀虫蛋白组合物一个附加的实施方案对种子进行修饰。这种包被方法和装置的应用见公开的美国专利如5,918,413、5,891,246、5,554,445、5,389,399、5,107,787、5,080,925、4,759,945和4,465,017。种子包被组合物见公开的美国专利其中包括如5,939,356、5,882,713、5,876,739、5,849,320、5,834,447、5,791,084、5,661,103、5,622,003、5,580,544、5,328,942、5,300,127、4,735,015、4,634,587、4,383,391、4,372,080、4,339,456、4,272,417和4,245,432。
这里使用的术语“生物样品”或“样品”包括核酸、多核苷酸、DNA、RNA、tRNA、cDNA等，其在组合物中或固定于底物上使样品易于分子探针分析或用寡核苷酸探针和/或引物进行热扩增。植物或植物产品或植物的果实或种子认为是一种生物样品，并且这种植物或植物产品、植物部分、果实或种子的任何提取物也被认为是一种生物样品。如此，生物样品可来自农艺上或商业上重要的产品和/或物质组合物包括但不限于动物饲料、农产品以及用作食品供人类消费或用于供人类消费的组合物中的玉米产品和副产品包括但不限于玉米面粉(corn flour)、玉米粗粉(corn meal)、玉米糖浆(cornsyrup)、玉米油(corn oil)、玉米淀粉(corn starch)、爆玉米花(popcorn)、玉米饼(corn cakes)、包含玉米及玉米副产品的谷类等，如果这些产品和物质组合物包含可检测量的编码这里所示的核苷酸序列或杀虫蛋白，则都在本发明预期范围内。
以下实施例进一步阐明这里公开的核苷酸的特性以及公开的核苷酸序列编码蛋白的杀虫活性。此外，公开了实施本发明的方法和程序。但依据本公开，本领域技术人员应该领会在公开的特定实施例中可有许多改变并且仍得到相似或类似的结果而未背离本发明的精神和范围。
实施例实施例1此实例举例说明对苏云金芽孢杆菌EG2158菌株分泌到培养基中的杀虫蛋白的鉴定。
EG2158最初是从大豆颗粒粉中分离到的野生型苏云金芽孢杆菌菌株(Donovan et al.，1988)。在EG2158细胞孢子形成期产生由73kDa经鉴定为Cry3C的蛋白组成的菱形晶体。EG2158孢子晶体的混合物对马铃薯甲虫幼虫有毒性。用克隆的cry3C基因转化的巨大芽孢杆菌表现出与EG2158菌株一样对CPB的毒性，说明EG2158对鞘翅目昆虫的特异毒性是由于Cry3C晶体蛋白(Donovan et al.，1988)。因此，因为处理的用后培养基不包含足够的孢子或Cry3C晶体蛋白以表现可测量的杀虫毒性，所以用于发酵EG2158菌株的用后培养基不包含足够的芽孢或Cry3C晶体蛋白对CPB有毒性就出乎意料了。
苏云金芽孢杆菌在60mL PYG培养基上30℃振摇过夜。PYG培养基由11.8克蛋白胨、23.6克酵母提取物、4mL甘油、19.4克无水K2HPO4及每升去离子水2.2克K2HPO4组成。苏云金芽孢杆菌过夜发酵培养物11,000×g离心30分钟并将无细胞的上清液转移到干净瓶。上清液这里也指用后培养基和/或澄清的用后培养基或澄清的上清液。
上清液冻于4℃。在60毫升上清液中边搅拌边缓慢加入34克硫酸铵和1毫升1M的NaOH。硫酸铵饱和的上清液混合物离心收集沉积蛋白的沉淀物。沉淀物溶解于2毫升20mM Tris.HCI pH7.5。Tris悬液转移到透析袋(6000MWCO)于4℃在20mM Tris-HCI pH7.5中透析。透析后的悬液这里称为硫酸胺透析液(am.sulf-dialysates(ASD))。
检验ASD对马铃薯甲虫幼虫(CPB，也被正式称为马铃薯甲虫(Leptinotarsa decemlineata))的毒性。每个ASD的50μl局部用于食物杯中2mL昆虫食物。用每个透析液共处理16个食物杯。每个食物杯中放入一个首龄的CPB幼虫并在3天后记录昆虫死亡率。用许多不同的苏云金芽孢杆菌菌株对此过程进行大量重复。苏云金芽孢杆菌菌株EG2158的透析液表现出对CPB幼虫的毒性。
实施例2此实施例举例说明一种从发酵苏云金芽孢杆菌EG2158菌株的用后培养基纯化杀虫蛋白的方法，这里指定为TIC901。
在EG2158 ASD中出现的蛋白用十二烷基磺酸钠聚丙烯酰胺凝胶(SDS-PAGE)电泳进行评估。30μl透析液与15μl Laemmli蛋白溶解缓冲液混合(Mol.Biol.80575-599；1973)并100℃加热5分钟。大约25μl混合液上样到10％SDS聚丙烯酰胺凝胶。电泳后用考马斯亮蓝染色可见蛋白。结果显示EG2158 ASD含有约30种大小从约20kDa到约120kDa的蛋白。
2毫升EG2158ASD用于20mM Tris-HCl pH7.5平衡后的二乙氨基乙基(DEAE)柱。用20mM Tris-HCl pH7.5中梯度NaCl(0到500mM)从柱上洗脱蛋白。收集每份1毫升的洗出液并且每份在20mM Tris-HCl pH7.5中透析。透析后用与实施例1所述相似的生物检测方法检测各流分对CPB的毒性。将对CPB幼虫表现毒性的流分合并并透析。合并后的组分称为EG2158 DEAE-毒性流分。EG2158DEAE-毒性流分中的蛋白用SDS-PAGE和考马斯染色进行分析。结果显示EG2158 DEAE-毒性流分包含5种主要蛋白质及几种大小不同的次要蛋白质。
2毫升EG2158 DEAE-毒性流分用于20mM Tris-HCl pH7.5平衡后的四价铵柱(QA)。用20mM Tris-HCI pH7.5中线性梯度的NaCl(0到500mM)从柱上洗脱蛋白。收集1毫升流分并且分别在20mMTris-HCl pH7.5中透析。检测透析后流分对CPB幼虫的毒性。合并对CPB有最强毒性的流分。合并后的流分称为EG2158 QA-毒性流分。EG2158 QA-毒性流分中的蛋白用SDS-PAGE和考马斯染色进行分析。结果显示EG2158 QA-毒性流分包含一种约38kDa的主要蛋白，称为TIC901，及几种大小不同的次要蛋白质。结果说明纯化的38kDa蛋白是造成样品对CPB表现毒性的原因。
实施例3
此实施例举例说明从EG2158分离和鉴定编码TIC901蛋白的核苷酸序列。
EG2158 QA-毒性流分中的蛋白由SED-PAGE按大小分离而不经考马斯染色。通过电转移将经SDS-PAGE分离的蛋白转移到聚氟乙烯(PVDF)膜。PVDF膜用考马斯染料简单染色，含有TIC901纯化蛋白的膜部分用干净的保险刀片切下并进行自动Edmund降解测序(automated Edmund degradation sequencing)。结果显示TIC901蛋白含有相应的NH3-V I G P Y A E S Y I D R V Q D-coo-N端氨基酸序列，如SEQIDNO1所示。
广泛公认的是细菌系统中大多数体内产生的蛋白在N端为甲硫氨酸(M)残基。事实是TIC901蛋白不包含甲硫氨酸残基的N端，与另一个事实即发现蛋白位于用后培养基一起，说明TIC901蛋白可能由大前体蛋白N端区域经蛋白质水解消化分泌信号肽而形成。
基于Edmund降解确定的凝胶纯化TIC901蛋白部分氨基酸序列，及基于天然的苏云金芽孢杆菌编码δ-内毒素基因表现的密码子使用偏好性，简并的寡核苷酸探针被指定用作检测苏云金芽孢杆菌EG2158菌株可能编码凝胶纯化的TIC901蛋白的核苷酸序列。探针被鉴别为WD444并包括如SEQ ID NO2(5′-GTA ATT GGA CCATAT GCA GAA TCA TAT ATT GAT XGA GTA CAA GA-3′，其中X是A或C)所示的序列。
用标准程序(如Sambrook et al.，1989)从苏云金芽孢杆菌EG2158中纯化DNA。DNA提取物的样品用限制性内切酶HindII消化，在TAE缓冲液中0.8％琼脂糖凝胶进行电泳，印迹到尼龙膜，并通过DNA印迹法进行分析，使用偶联碱性磷酸酶的WD444探针混合物于40℃在低到中等严格性的杂交缓冲液中杂交约16小时，在洗涤缓冲液中40℃洗涤，再暴露于化学发光试剂并使胶片感光(杂交和洗涤缓冲液由编号RPN3690的AMERSHAM/PHARMACIA BIOTECH试剂盒一起提供)。结果显示探针与一个约8千碱基对的HindIII片段特异杂交。
构建于质粒pUC18的大肠杆菌文库包含EG2158约8千碱基对的HindIII限制性片段。重组克隆通过标准程序(如Sambrook et al.，1989)印迹到尼龙膜并用NaOH变性。这些滤膜在杂交液中与标记的WD444探针混合物温育。在如上所述相似的条件下与探针温育后，洗涤膜，暴露于化学发光试剂并使胶片感光。鉴定与WD444探针混合物表现特异杂交的几个克隆。提取这几个克隆的质粒DNA并用WD444寡核苷酸混合物作为探针的DNA印迹法进行分析。结果显示质粒由pUC18载体和8kb HindIII插入片段组成。选出一个典型的质粒以进行进一步鉴定并指定为pEG1379(稍后指定为pMON74007)。包含pEG1379的纯化大肠杆菌菌落被指定为EG12447并于2002年2月保藏在NRRL，保藏检索号为NRRL B 30549。
实施例4此实施例举例说明质粒pEG1381上约8kb HindIII片段在苏云金芽孢杆菌无晶体菌株中杀虫蛋白的表达。
天然苏云金芽孢杆菌基因常常难以在非芽孢杆菌宿主细胞如大肠杆菌中表达。pEG518构建为芽孢杆菌-大肠杆菌穿梭载体并且是芽孢杆菌扩增子pMM101(Norton等，Plasmid 13211-214；1985)和pUC18(Yanisch-Perron等，Gene 33103-119；1985)的嵌合体，因此能在大肠杆菌和相近的革兰氏阴性细菌或芽孢杆菌和相近的革兰式阳性细菌中复制。pEG518赋予大肠杆菌和相关细菌β-内酰胺抗生素抗性并赋予芽孢杆菌和经转化含有此特定质粒衍生物的相关细菌四环素抗性。质粒pMON1379中存在的8kb HindIII片段被切下并插入到质粒pEG518的HindIII位点。所得质粒pEG1381，通过电穿孔转化入无晶体和非杀虫的苏云金芽孢杆菌EG10650菌株中(NRRL检索号NRRL B-30217)。
(苏云金芽孢杆菌EG10650菌株。苏云金芽孢杆菌EG10650菌株来自菌株EG10368(美国专利5,759,538，1998年6月2日))缺乏中性蛋白酶和碱性蛋白酶活性并仅包含一个已知的7.5kb染色体外质粒元件。碱性蛋白酶基因的缺失引入菌株EG10368中，得到菌株EG10654(NRRL检索号NRRL B-21344)。中性蛋白酶基因的缺失引入菌株EG10368中，得到菌株EG10624(NRRL检索号NRRL B-21347)。这些缺失随后结合到一个菌株中生成菌株EG10650，该菌株缺乏任何兆-道尔顿的质粒并因此缺乏表达任何已知杀虫蛋白的可能及缺乏中性和碱性蛋白酶产物)。
表示单个转化子并指定为EG12450的单菌落在含有四环素的培养基上选择以进一步分析。
质粒pEG1381分离自四环素存在下生长过夜的菌株EG12450培养物。pEG1381DNA用HindIII消化并通过琼脂糖凝胶电泳和溴化乙锭染色与pEG1379中存在的HindIII片段进行比较。两种质粒都包含表面上相同的约8kb HindIII片段。
菌株EG12450、EG2158和EG10650在PYG培养基上生长过夜。每个培养物的上清液如实施例1所述制备硫酸胺透析液(ASD)。ASD样品用于DEAE柱、从柱上洗脱蛋白和流分收集如实施例2所述。DEAE流分中的蛋白通过SDS-PAGE和考马斯亮蓝染色进行分析。结果证明对照无晶体菌株EG10650的DEAE流分不包含大小与TIC901蛋白相应的任何显著量的蛋白，尽管出现了一些约为TIC901蛋白大小的次要蛋白。相反的，从菌株EG2158生长后的培养基上清得到的DEAE流分，包含与TIC901蛋白大小相应的普通量的蛋白。从重组菌株EG12450用后培养基上清得到的DEAE流分包含明显量的蛋白，且与菌株EG2158产生的TIC901蛋白大小相应。结果显示来自菌株EG2158的8kb HindIII片段存在于重组质粒pEG1381中，其包含的天然的苏云金芽孢杆菌基因显示出与从菌株EG2158发酵培养基分离的TIC901蛋白大致等同的蛋白量。
实施例5此实施例举例说明对编码TIC901蛋白的天然核苷酸序列及推出的TIC901氨基酸序列进行DNA鉴定。
存在于质粒pMON1378中约8kb HindIII片段进行双脱氧核苷酸序列分析。8kb片段的部分核苷酸序列如SEQ ID NO5所示。在约8kb HindIII片段中鉴定出一个由1101个核苷酸组成的开放阅读框，开始于153-155位核苷酸的ATG甲硫氨酸密码子并终止于1251-1253位核苷酸的TTG亮氨酸密码子，直接在如SEQ ID NO5所示的TAG终止密码子上游。在此核苷酸序列中鉴定出的开放阅读框由429个腺苷残基(约39％A)、334个胸苷残基(约30％T)、196个鸟苷残基(约18％G)和145个胞苷残基(约13％C)组成，且表现出约69％AT和约31％GC。在ORF的前84核苷酸中有三个甲硫氨酸密码子。与如SEQ ID NO3所示153-155位核苷酸的ATG密码子不同的是，第二个框架内的ATG密码子接着153-155位位于182-184位核苷酸，而且第三个框架内的ATG密码子随着以上提及的ATG密码子位于201-203位核苷酸。在第二和第三个ATG密码子上游未发现共有的核糖体结合序列，而在第一个ATG密码子上游鉴定出一个共有的核糖体结合序列，集中在第一个ATG上游约10个核苷酸处。共有的核糖体结合序列由如SEQ ID NO3所示从约141到147的核苷酸组成。
从这个开放阅读框推导出的氨基酸序列由367个如SEQ ID NO4所示的氨基酸组成。预测该开放阅读框编码一个分子量计算值约为41,492道尔顿的前体蛋白。40个氨基酸是强碱性(赖氨酸和精氨酸)，43个氨基酸是强酸性(天冬氨酸和谷氨酸)，113个氨基酸是疏水性(丙氨酸、异亮氨酸、亮氨酸、苯丙氨酸、色氨酸和缬氨酸)，122个氨基酸是极性(天冬酰胺、半胱氨酸、谷氨酰胺、丝氨酸、苏氨酸和酪氨酸)。前体蛋白等电点计算值约6.368并在pH7.0时净电荷计算值约-2.102。预测由开放阅读框编码的前30个氨基酸残基包含N端终止信号肽，可能通过II型信号肽酶对其进行加工，释放杀虫蛋白到细胞外空间。对前30个包含N端终止信号肽的氨基酸残基的预测是基于Nielsen等人的算法(1997，Protein Engineering 101-6)。预测的信号肽除如SEQ ID NO4所示的31-43位氨基酸残基外，未发现连接或伴随位于用后培养基的成熟蛋白，相信在跨膜时被水解移除并释放成熟的杀虫蛋白至细胞外空间。
如SEQ ID NO3所示的130至174位核苷酸与SEQ ID NO2所示的探针序列最相近。当读入TIC901氨基酸序列的相应编码序列时，SEQ ID NO2的核苷酸相应的密码子是编码从培养苏云金芽孢杆菌EG2158菌株的培养基中纯化的杀虫蛋白N端氨基酸。核苷酸序列全区域的TIC901阅读框编码的氨基酸，预期与从培养菌株EG2158的培养基中纯化的杀虫蛋白Edmund降解作用推导出的氨基酸序列相应，如SEQ ID NO1所示。SEQ ID NO1所示的氨基酸序列与TIC901的开放阅读框区域推导出的氨基酸序列是一致的，除了SEQ ID NO1所示的12位氨基酸相应的精氨酸残基，而通过SEQ ID NO3开放阅读框的序列推出的相应氨基酸残基与SEQ ID NO4所示55位氨基酸的异亮氨酸残基相符。结果说明要么是对从菌株EG2158用后培养基纯化蛋白进行Edmund序列分析导致的错误，要么是交付Edmund序列分析的浓缩纯化样品中存在不止一个TIC901样蛋白。众所周知Edmund序列分析的错误不是罕见的。然而，仅此结果说明苏云金芽孢杆菌EG2158菌株中可能存在不止一种编码胞外分泌杀虫蛋白的基因。这里提出的假设在实施例9中有完整分析。
大多数释放到胞外空间的细菌蛋白倾向于合成为较大的前体，被分泌装置加工，切除前体蛋白的一部分成为释放到胞外环境的成熟蛋白。从培养菌株EG2158的培养基中发现的杀虫蛋白，在菌株EG2158中作为前体蛋白被合成是可能的，如SEQ ID N03所示的一部分开放阅读框推出43个氨基酸的全部或部分是前体蛋白定向分泌用的。革兰式阳性和革兰氏阴性细菌产生的分泌蛋白，定向于II型分泌装置，显示典型的长度介于约18至约28到30或更多氨基酸的分泌或信号肽。如上指出的，有两个甲硫氨酸密码子，各自对应氨基酸残基18和氨基酸残基27，如SEQ ID NO3所示的开放阅读框推出的，用Edmund降解法推出的缬氨酸残基的上游(如SEQ ID NO3所示282-284核苷酸的密码子)就是TIC901蛋白的N端氨基酸。如SEQ ID NO4所示的缬氨酸残基与Edmund降解法预测的发现于培养EG2158培养基的分泌蛋白N端残基相应，是44位残基。在氨基酸序列N端到44位缬氨酸残基内两个邻近的甲硫氨酸残基包含两种选择的翻译起始位点是可能的，以在产生TIC901蛋白的EG2158中合成预期的前体蛋白。但是，在这两种翻译起始密码子的上游得到非常弱的共有SD序列。此外，因为蛋白发现于用后的培养基，用领域内熟知的信号肽预测算法，分析153-155位MET密码子后核苷酸编码的预测氨基酸序列，显示出前30个氨基酸很适合为用作信号肽的氨基酸序列而建立的参数。因此，相信如SEQ ID NO3所示153-155位核苷酸的第一个ATG是实际上被苏云金芽孢杆菌EG2158使用的翻译起始密码子，用来表达前体TIC901蛋白并随后加工为细胞分泌的成熟型蛋白。
预测的信号肽，如上指出的，由SEQ ID NO4所示1到30氨基酸残基组成并表现出经典II型信号肽的真质标记，包括N端的碱性电荷、电中性的从约氨基酸残基6到约氨基酸残基22的预测α-螺旋核心区域和一个28到30残基的普遍信号肽酶II识别序列Ala-Xaa-Ala，作为蛋白水解切除的底物，切除30和31氨基酸残基之间的肽键。经鉴定认为信号肽的C端作为信号肽酶的识别序列至关重要，该信号肽酶负责将信号肽从前体蛋白水解切除并将成熟蛋白释放到细胞质外空间，即革兰氏阴性细菌的周质或胞外空间，或革兰式阳性细菌的胞外空间。定型的共有信号肽酶II的识别序列是Ala-Xaa-Ala。Xaa残基的典型规律是它不能是大的或带电荷的氨基酸残基。相反的，在成熟TIC901蛋白上邻近N端氨基酸残基(+1)的这三个残基不与共有信号肽酶II的识别序列一致。相反，可能由其它的或目前未知的和/或不同的信号肽酶识别的TIC901信号肽氨基酸序列为Ser-Gln-Gln(S-Q-Q)，这与以前观察到的信号肽酶识别序列显著不同。另一个可能是，仍有一些未鉴定的肽酶识别SEQ ID NO4所示的31到43氨基酸的总体结构并移除这些氨基酸释放杀虫活性蛋白到培养基或其他胞外空间周围。这些末尾的如SEQ ID NO4所示的31到43氨基酸可能用作缓冲蛋白的毒性直到蛋白从细胞释放。
实施例6此实施例举例说明从天然苏云金芽孢杆菌EG2158菌株纯化的蛋白与从重组苏云金芽孢杆菌EG12450菌株分离的杀虫蛋白进行杀虫生物活性对比。
获得培养菌株EG12450、EG2158和EG10650的用后培养基样品，浓缩每个样品中出现的可溶蛋白，根据如实施例3所示方法进行DEAE分级分离。合并含有每个菌株TIC901相应蛋白的流分。合并后流分在抗马铃薯甲虫的生物测定中并排进行比较。通过凝胶密度计量法用已知量的BSA作为标准，测定来自EG12450和EG2158用后培养基的DEAE流分，各包含87μg/μl和22μg/μl蛋白。对CPB幼虫的毒性通过用不同量的流分于杯中昆虫食物表面进行测量，如实施例1所述。结果见表2。
表2 CPB幼虫死亡率百分数
表2显示的结果证明，含有来自苏云金芽孢杆菌EG2158和EG12450菌株TIC901蛋白的DEAE流分对CPB幼虫是有毒的。来自菌株EG10650的相似DEAE流分用作阴性对照且对CPB幼虫无毒。未计算平均标准差。
实施例7此实施例举例说明含有pEG1379中完整TIC901编码区域的1.96kb NsiI-HincII限制性片段的分离，和对含有NsiI-HincII片段的质粒表达的TIC901蛋白进行抑制玉米根叶甲的生物活性分析，该蛋白分离自重组菌株SIC8098用后培养基。
1.96kb NsiI-HincII限制性片段含有pEG1379的整个TIC901编码区域，该片段被亚克隆到苏云金芽孢杆菌-大肠杆菌穿梭载体pEG597上相容的限制位点(PstI和SmaI)(Baum et al.，1990)。这个限制性片段内的唯一开放阅读框可编码TIC901大小的蛋白，是如SEQ ID NO3所示的编码序列。所得重组质粒，指定为pIC17048，通过电穿孔引入无晶体苏云金芽孢杆菌宿主菌株EG10650。包含pIC17048的重组苏云金芽孢杆菌指定为菌株SIC8098。
苏云金芽孢杆菌菌株EG10650和SIC8098在300ml丰富肉汤培养基(1L瓶装)中30℃强烈振荡培养40小时。用后培养基在SorvallGS3转子中8000rpm 4℃离心30分钟。SDS-聚丙烯酰胺凝胶电泳分析培养物上清等分试样。菌株SIC8098在培养物上清中累积了高水平的TIC901蛋白。对EG2158和编码TIC901的重组苏云金芽孢杆菌菌株的生长条件进行评估表明，当菌株在25℃发酵48小时而不是在标准条件下30℃发酵18小时，有大体上更高量的TIC901蛋白聚集在用后培养基中。这说明TIC901蛋白可能不是最佳生产，直到达到对数生长的晚期或平稳期的早期。
EG10650和SIC8098培养物上清在4℃用硫酸铵饱和至85％。离心收集沉淀蛋白。蛋白沉淀溶解于10mM Tris-HCI、0.1mMEDTA、0.005％Triton X-100(pH 6.8)并在200倍过量体积的同样缓冲液中透析。不溶物质用离心沉淀，包含基本纯化TIC901蛋白的澄清透析液直接用于昆虫生物测定。透析液中纯化TIC901蛋白的量通过SDS-聚丙烯酰胺凝胶电泳，和以牛血清白蛋白作为蛋白标准的密度计量法来确定。生物测定在96孔板中进行，每个孔含有一个人造的根叶甲的食物。含有毒素或对照样的样品放于食物上，使毒素浸透表面。每孔平均放置一个根叶甲卵。每次处理平均使用24个孔。板子密封，孵育一周，然后记录幼虫死亡率和质量。
用根叶甲毒素Cry3Bb(氨基酸序列变异体11231，English等，美国专利6,063,597)作为阳性对照，对南部和西部玉米根叶甲幼虫都进行生物测定。分析结果见表3和4。
表3 TIC901抗西部玉米根叶甲的生物测定
195％置信区间2星状号(*)说明结果与阴性对照EG10650显著不同，邓奈特检验，α＝0.05表4 TIC901抗南部玉米根叶甲的生物测定
195％置信区间2星状号(*)说明结果与阴性对照EG10650显著不同，邓奈特检验，α＝0.05结果证明TIC901对两种根叶甲都有活性，但对南部玉米根叶甲表现更高的活性。
实施例8此实施例举例说明构建编码TIC901蛋白的核苷酸序列以提高在植物中的表达。
如SEQ ID NO4所示TIC901蛋白的氨基酸序列用于构建核苷酸序列，基本依照Fischhoff和Perlak的美国系列专利5,500,365及Brown等的美国专利5,689,052进行。简单讲，从多于53,000个序列得来密码子频率表，这些序列是被认为在玉米、谷和小麦中编码蛋白序列的基因组DNA。从这些序列片段中得到不止10,900,000个密码子。再选择密码子，用于构建植物中使用的编码TIC901的非自然出现或合成序列。所得编码序列包含与植物中出现的序列相似的GC组成，具体讲，由于是用单子叶植物导出的密码子表，编码序列在结构上比双子叶植物基因更像单子叶植物基因，因此优选用来在单子叶植物中表达TIC901蛋白或蛋白变异体。这种非自然出现编码序列的一种如SEQ ID NO13所示，优选用于单子叶植物，编码蛋白的氨基酸序列如SEQ ID NO14所示。技术人员会认识到在单子叶植物中起表达杀虫蛋白功能的无数编码序列中，SEQ ID NO13仅是其中一个。此外，技术人员也会认识到，合成的编码序列如编码全部或部分TIC901蛋白的SEQ ID NO13，或编码其由与SEQ ID NO4所示不同的序列组成的杀虫氨基酸序列变异体但在严格杂交条件下与SEQ ID NO13杂交的序列也在本发明范围内。
实施例9此实施例举例说明对tic901同源物，以及对由这些核苷酸序列同源物编码，与TIC901蛋白基本相似并因而相关的肽进行鉴别和鉴定。
如表1所示，鉴定了产生胞外蛋白分布并表现出对鞘翅目昆虫杀虫生物活性的大量菌株。通过用与编码SEQ ID NO1相应的序列SEQ ID NO2探测菌株EG2158质粒库，鉴定在以上说明的实施例中的TIC901蛋白编码序列，并偏向天然苏云金芽孢杆菌编码δ-内毒素基因表现的密码子使用偏好性。tic901编码序列随后用作探针鉴定质粒基因组库的克隆中tic901的同源物，用其他苏云金芽孢杆菌菌株的基因组制备克隆，它们表现分泌杀虫蛋白活性且其限制性内切酶多态性(RFLP)图谱(profile)与菌株EG2158展示的RFLP图谱不同。
如表1所示，苏云金芽孢杆菌86833菌株包含一个不同于菌株EG2158的tic901同源序列。菌株86833分泌的蛋白图谱包含一个38kDa的主要带，这与菌株EG2158产生的相似。这些事实一起说明菌株86833包含一个tic901同源物。菌株86833蛋白的N端序列用Edmund降解法确定，鉴定出一个15个氨基酸的序列(76至91位氨基酸如SEQ ID NO6所示，也和预测的成熟TIC1201蛋白2-16残基相应)。该氨基酸序列与任何已知的氨基酸序列不相符，但和如上所述预测的成熟TIC901蛋白N端氨基酸序列表现出87％的同一性。质粒克隆，pJP263，来自用SauIIIA部分酶切并选择大小的λZAP表达DNA库(Lambda ZAP Express DNA library)，包含一个约5kb插入片段的菌株86833总DNA通过大致如实施例2所述用地高辛配基(digoxygenin)标记的tic901 DNA在热扩增条件下杂交进行鉴定。质粒pJP263在热扩增条件下切下整个菌株86833的插入片段，随后插入大肠杆菌/芽孢杆菌穿梭载体pEG597。得到的质粒pJP274-1用来转化无晶体菌株EG10650，检出含有该质粒的分离菌并指定为重组苏云金芽孢杆菌SIC4018菌株。菌株SIC4018如实施例1所示进行发酵，存在于用后培养基的蛋白被浓缩并用于检测杀虫活性的生物测定，SDS-PAGE进行分析。用后培养基对鞘翅目昆虫杀虫活性的检测是阳性，SDS-PAGE分析鉴定出在用后培养基中存在大量的约38kDa的一个蛋白。pJP274-1中的插入片段用Sanger双脱氧法测序，鉴定出如SEQ ID NO5所示从437至1621位核苷酸是一个开放阅读框。前体杀虫蛋白的氨基酸序列由如SEQ ID NO5所示的开放阅读框推出，指定为TIC1201(SEQ ID NO6)。另一个菌株EG3618的“B”型RFLP，其相应克隆的核苷酸序列也具此特征，并确定为包含一个与SEQ ID NO5所示序列一致的ORF。
菌株EG6618表现“C”型RFLP图谱如表1示例。质粒克隆，pJP264，来自用SauIIIA部分酶切并选择大小的λZAP表达DNA库，包含一个约5kb插入片段的菌株EG6618总DNA通过如实施例2所述用地高辛配基标记的tic901 DNA在热扩增条件下杂交进行鉴定。pJP264中插入DNA的序列分析表明克隆中的开放阅读框是不完整或局部的，可能编码一个新的且以前未鉴定的蛋白的C端部分。该局部ORF与如SEQ ID NO3所示编码TIC901的ORF对比，显示pJP264中插入DNA的核苷酸序列(如SEQ ID NO7所示481至1302核苷酸)编码一个肽，其推出的氨基酸序列基本上与TIC90196至367氨基酸残基相应的氨基酸序列相似。由pJP264中的核苷酸序列编码新的氨基酸序列，显示与类似的TIC901肽序列约78％同一性。编码这些肽的核苷酸序列显示约81％同一性。pJP264中的局部编码序列与SEQ ID NO7中481至1302位核苷酸相应，且与SEQ ID NO3从438至1253位核苷酸序列编码的TIC901类似。两个蛋白各自C端的同一性说明pJP264中序列编码的肽代表相关于TIC901蛋白的杀虫蛋白属新成员。因此，该蛋白指定为TIC407，编码TIC407蛋白的核苷酸序列指定为tic407。
认为TIC407的全长ORF存在于EG6618的基因组中。为了鉴定TIC407编码序列5’部分差额(balance)的核苷酸序列，苏云金芽孢杆菌EG6618菌株总DNA的样品用限制性内切酶NdeI消化，产物再稀释并用连接作用环化以产生用于反向热扩增反应(inverse thermalamplification)的模板群。选择NdeI酶是因为(1)它不剪切pJP264的插入序列，(2)由于该限制性酶识别序列中A和T的普遍所以它常常在苏云金芽孢杆菌的基因组中剪切，和(3)EG6618DNA的DNA印迹分析表明NdeI的切口合理的靠近插入质粒pJP264中的DNA末端而离整合的编码TIC407的全长ORF末端足够远。
基于pJP264中存在的部分tic407核苷酸序列制备两个反向热扩增反应的异向引物(divergent primer)。引物prJWP151(SEQ ID NO15CCTTTGGCAGAAACTTTAACTCC)相应于SEQ ID NO7中766-788核苷酸的反向互补序列。引物prJWP152(SEQ ID NO16GTGTATTCTGGTACGCATGAC)相应于SEQ ID NO7中955-975核苷酸。这些引物与上述NdeI环化模板分子一起以及必需的试剂、缓冲液和Pfu聚合酶用于热扩增反应中，95℃变性5分钟，随后30个循环包括37℃退火1分钟、55℃延伸2分钟和95℃变性1分钟，最后55℃延伸5分钟并存于4℃直到对样品进一步处理。通过凝胶电泳鉴定单个热扩增反应的产物，剪切并克隆到T-载体以构建质粒pJP300-2。得到插入pJP300-2中DNA序列的核苷酸序列并提供存在于pJP264前序列的上游和下游足够的核苷酸序列以鉴定编码TIC407杀虫蛋白的完整开放阅读框以及上游和下游的侧翼序列。因为pJP300-2中存在的序列是用反向热扩增菌株EG6618基因组环化的限制性片段构建的，所以得自pJP300-2的核苷酸序列信息用序列分析软件通过电脑装配。因此，为了证实所装配序列是准确的且实际上编码TIC407氨基酸序列，先从pJP264中鉴定的部分开放阅读框，再从pJP300-2中鉴定的部分开放阅读框，两个编码TIC407开放阅读框侧链的新热扩增引物(prJWP186和prJWP183)用于从EG6618基因组DNA扩增完整的TIC407编码序列。
引物prJWP186(SEQ ID NO17gccggatccCTAGCTGAATATGCAGTAGATAATG)的构建，部分基于鉴定为pJP300-2的TIC407开放阅读框上游序列。该引物的首9个核苷酸相应的核苷酸序列在鉴定为存在于pHP264或pJP300-2的序列中不存在，还包括用这些引物整合一个BamHI限制性位点到扩增子上游序列的序列。引物prJWP186末端的25个核苷酸相应于SEQID NO728到52核苷酸所示的序列，该序列位于提出的TIC407 ORF的ATG起始序列上游，使引物向TIC407 ORF延伸。
引物prJWP183的(SEQ ID NO18GTGGCACGTTTATAGGCCATTGTTC)构建，完全是基于pJP300-2中TIC407 ORF下游序列推出的序列，是SEQ ID NO7 1735至1759位核苷酸所示的反向互补序列。虽然该引物中没有整合限制性位点序列，但是在如SEQ ID NO7 1500-1505所示的TIC407 ORF下游存在一个天然出现的HindIII识别序列。
引物prJWP186和prJWP183与EG6618总DNA样品和反应必需的试剂一起用于热扩增反应。扩增条件与上述扩增NdeI环化样品的条件相似。分离到的一个扩增子包含相应于TIC407 ORF的1732个核苷酸，包括ORF上游和下游的侧翼核苷酸序列。该扩增子克隆到T-载体以构建pJP306-4，并得到扩增子的完整核苷酸序列。正如期望的，pJP306-4中扩增子的核苷酸序列与SEQ ID NO728到1759核苷酸相应，并包含一个编码含368个氨基酸的蛋白的开放阅读框，如SEQ ID NO7中196至1299位核苷酸所示。对比编码TIC407的核苷酸序列与编码TIC901的序列，证明两个ORF有约80％的同一性，而从ORF推出的氨基酸序列只有约74％的同一性。
对比TIC901、TIC1201和TIC407的氨基酸序列以产生共有的氨基酸序列。虽然基本的氨基酸序列都显著不同，但是易于辨认基本同一的区域。两个区域，相应的氨基酸序列如SEQ ID NO496-103位所示的ASN-ASN-ASN-HIS-GLN-THR-ASN-ARG和如SEQ IDNO4 276-282位氨基酸序列所示的GLN-LYS-PHE-ILE-TYR-PRO-ASN在基本序列和三个杀虫蛋白序列每个的位置上是100％保守的。编码这些蛋白序列的核苷酸序列在每个相应开放阅读框，即如SEQ IDNO3、SEQ ID NO5和SEQ ID NO9所示的序列(分别是TIC901、TIC1201和TIC407)也基本保守，提供一种鉴定其他同源序列的方法，这些序列编码这种分泌杀虫蛋白并存在于其他芽孢杆菌或苏云金芽孢杆菌菌株中。
制备两个热扩增引物序列用于热扩增反应来鉴定编码三种杀虫蛋白TIC901、TIC1201和TIC407其他同源物的核苷酸序列。热扩增引物序列这里列出为(1)SEQ ID NO11，正向扩增21mer引物序列指定为prJWP139，与SEQ ID NO3438至458位核苷酸所示编码序列相应，除了寡核苷酸上的18位核苷酸由于腺嘌呤或胸腺嘧啶核苷酸未整合其中而是冗余的，得到两个可能的引物序列，和(2)SEQ IDNO12，反向扩增20mer引物序列指定为prJWP143，与SEQ ID NO3998至978位核苷酸所示反向互补序列相应，除了寡核苷酸上的4位和/或10位核苷酸由于腺嘌呤或胸腺嘧啶核苷酸未整合到任一位置而是冗余的，得到四个可能的引物序列。SEQ ID NO11和SEQ ID NO12由来自苏云金芽孢杆菌或其他芽孢杆菌菌株的基因序列中偏好使用密码子的核苷酸序列组成，其中密码子在序列中每个密码子的第三位包含A和/或T。如上所述，自菌株EG2158发酵用后培养基分离纯化的约38kDa蛋白用Edumnd降解法鉴定氨基酸序列，与SEQ IDNO4所示TIC901的开放阅读框最终推出的相应序列有一个氨基酸的不同。认为Edumnd降解法观察到的氨基酸序列和由tic901 ORF推出的TIC901氨基酸序列的不同可能是菌株EG2158中存在多于一个基因的结果，每个基因编码一个不同的分泌杀虫蛋白，每个分泌蛋白大小约38kDa。实际上，如果EG2158中存在两个或多个基因，每个基因肯定会出现在实质上同样的HindIII片段上，或可能都出现在同一个HindIII片段上，或一个十分不同于tic901编码序列且不能在严格杂交条件下与含SEQ ID NO2的核苷酸序列杂交。如果每个基因真正编码同源杀虫蛋白，或至少与以上鉴定的那种保守序列存在于每个编码序列中的其他序列编码的蛋白十分相似的蛋白，如SEQID NO11和SEQ ID NO12所示的冗余的引物可通过热扩增反应中对普通样品相关编码序列的扩增来鉴定基因。例如，当用TIC901、TIC1201或TIC407编码序列作为样品模板时，含有如SEQ ID NO11和SEQ ID NO12所示序列的引物可用于生成一个约560个碱基对的扩增子。为了验证此假设，EG2158总DNA在热扩增反应中被用作模板，SEQ ID NO11和SEQ ID NO12用作扩增引物，在标准反应条件下每50μl反应体积中包含10-100纳克的细菌基因组DNA模板、50皮摩尔各引物、含有终浓度1.5mM二价阳离子Mg2+的1×ROCHE扩增反应缓冲液、0.2mM dNTP、2.5个单位的ROCHE TAQ聚合酶，94℃先变性2分钟，30个扩增循环包括94℃变性1分钟、45℃退火2分钟和72℃引物延伸1分钟，再是最后72℃延伸5分钟结束并保存于4℃。此外，模板DNA来自以下菌株菌株EG10650、菌株EG4332、菌株EG5552、菌株EG5858、菌株EG6489、菌株EG6561、菌株EG3618、菌株EG6555、菌株EG6618和菌株86833，也与SEQ ID NO11和SEQ ID NO12所示扩增引物一起用于平行的热扩增反应。通过凝胶电泳分析每个热扩增反应的样品。结果见表5。
表5 苏云金芽孢杆菌产生的扩增子
1-热扩增反应产生的扩增子，如上所述在严格条件下以标明菌种的DNA作为模板、包含SEQ ID NO11和SEQ ID NO12所示序列作为扩增引物。
当以来自菌株EG10650、EG4332、EG5552或EG5858的DNA作为模板与特定引物组一起，未检测到扩增子。结果说明这些菌株不含有编码TIC901、TIC1201和TIC407同源物的核苷酸序列。但是，其他测试的每个菌株看来在所用凝胶系统分辨能力的范围内都产生一个长度约560个碱基对的扩增子。在热扩增条件下产生阳性反应的样品，其每个扩增子都被克隆到T-载体，随机挑选每个热扩增反应的克隆扩增子以确定核苷酸序列。菌株EG2158、EG6489和EG6561的每一个都产生一个与相应的TIC901编码序列表现出核苷酸序列同一性的扩增子。菌株EG3618和86833产生一个与相应的TIC1201编码序列表现出核苷酸序列同一性的扩增子。菌株EG6555，和菌株EG3618和86833同样显示出“B”型HindIII RFLP图谱，也产生一个560碱基对的扩增子。以前未完全描述菌株EG6555的特征，但是如表1所示以前显示出它产生“B”型HindIII RFLP，相应于从中分离出TIC1201的菌株86833显示的RFLP表型。因此预测存在于菌株EG6555的同源物编码的蛋白如果不是与TIC1201一致就是基本相似。得自EG6555扩增子的序列分析和得自菌株86833的相应序列一致。正如预期的，菌株EG6618产生一个与相应的TIC407编码序列表现出核苷酸序列同一性的扩增子。
令人惊奇的是，除了包含相应tic901序列的扩增子，从分离自EG2158的总DNA得来得扩增子包含第二个编码序列，该序列不同于用SEQ ID NO2所示冗余探针鉴定的相应TIC901核苷酸序列。正如预期的，从EG2158 DNA得来的扩增子也包含约560个核苷酸，但是克隆的DNA序列分析得到一个编码肽序列(SEQ ID NO10所示96至282位氨基酸)的ORF(SEQ ID NO9所示377至937位核苷酸)，与TIC901相应的肽序列基本不同。结果说明在菌株EG2158中至少存在一个其他的核苷酸序列，编码TIC901蛋白同源物并被认为是TIC901、TIC1201和TIC407相关蛋白属的另一个成员。
为了完全描述从菌株EG2158 DNA鉴定的第二序列的特征，基于第二序列可特异扩增第二序列上游和下游的侧翼序列，设计反向热扩增反应的引物。EG2158 DNA的反向热扩增用来鉴定完整的包含第二序列的开放阅读框。首先，选择酶用来消化EG2158 DNA，该DNA(1)在以上鉴定的第二序列中没有被剪切，且(2)由于具有包含酶识别序列的AT富含序列，芽孢杆菌DNA被频繁剪切。考虑到这些参数，选择XbaI和SpeI，但是没有一种酶单独使用时将EG2158 DNA消化成用作反向热扩增模板的易于环化的片段。不过，既然两种酶都产生相容的5’突出端(overhanging end)，用两种酶双酶切EG2158 DNA产生的产物大小足够小，环化后可用作反向热扩增的模板。反向热扩增引物的设计是基于以上鉴定的第二序列，特别是与tic901相应序列(SEQ ID NO3)对比表现出显著不同的序列。
引物prJWP155(SEQ ID NO19)相应于且是SEQ ID NO9 454-476核苷酸所示第二序列的反向互补序列。引物prJWP156(SEQ IDNO20)相应于SEQ ID NO9 692-717所示第二序列。这两个引物用于扩增反应，以如上所述的双酶切环化的EG2158为模板DNA，在与上述相似的条件下反向热扩增EG6618 DNA。获得的单个扩增子插入到T-载体构建质粒pJP290-1，并确定插入扩增子的核苷酸序列。用这个方法衍生的反向热扩增序列应用DNA序列分析软件装配并与上面鉴定的第二序列对比以构建SEQ ID NO9所示序列，包括一个编码指定为TIC417肽序列的完整开放阅读框以及上游和下游侧翼序列。
为证实此从上述EG2158 DNA鉴定的第二扩增子部分装配序列，以及来自用引物prJWP155和156的反向热扩增反应的部分装配序列，设计另外两个与编码TIC417的开放阅读框侧翼序列互补的热扩增引物(prJWP168和prJWP 170)。这些引物可使完整的TIC417开放阅读框与TIC417 ORF上游和下游的短DNA一起得到扩增。引物prJWP168(SEQ ID NO21)的构建是基于鉴定为TIC417 ORF下游或3’的一部分序列，该序列起延伸聚合在TIC417 ORF的核苷酸序列的作用。该引物的前5个核苷酸相应的核苷酸不存在于鉴定为质粒pJP290-1中出现的序列中，并当与SEQ ID NO21的7、8个碱基配对时还起加入HindIII限制性位点的作用。prJWP168末端的39个核苷酸与SEQ ID NO9所示1148至1186位的反向互补核苷酸相应。引物prJWP170(SEQ ID NO22)的构建是基于鉴定为TIC417 ORF上游或5’的一部分序列，并发挥使引物向TIC417 ORF的5’末端延伸的功能。该引物的前9个核苷酸相应的核苷酸不存在于鉴定为质粒pJP290-1中出现的序列中，并还起加入BamHI限制性位点识别序列到预测TIC417 ATG起始密码子上游的作用。该引物末端30个核苷酸相应的核苷酸由这个不同的编码序列编码的蛋白被指定为TIC417。克隆的部分TIC417扩增子编码的氨基酸序列如SEQ IDNO10所示，克隆的扩增子编码序列如SEQ ID NO9所示。TIC417的氨基酸序列与TIC901和TIC1201的相应序列有约85％的同一性，与TIC407相应的氨基酸序列有约76％的同一性。来自EG2158 DNA的TIC417扩增子显示出TIC417的编码序列，其相应的蛋白片段被认为是与TIC901、TIC1201和TIC407相似的杀虫蛋白，相应的蛋白作为前体蛋白表达并有约43个氨基酸残基长的信号肽，终端的共有信号肽切割序列符合SER-GLN-GLN，经信号肽酶加工释放一个约38kDa(加或减约2kDa)的成熟蛋白到细胞外空间。也预期TIC417成熟N端氨基酸序列可能相应于SEQ ID NO1所示的氨基酸序列，并且TIC417蛋白表现出抗玉米根叶甲和马铃薯甲虫的抑制鞘翅目昆虫的杀虫生物活性。
实施例10此实施例举例说明设计和使用简并探针及引物，用来鉴定自然出现的编码全部或部分来自本发明蛋白或其同源物杀虫蛋白的核苷酸序列。
基于TIC901、TIC1201、TIC407和TIC417前体蛋白的氨基酸序列对比如图1所示，观察到许多氨基酸序列一致的区域。并考虑到已知的苏云金芽孢杆菌杀虫蛋白图谱，基于相应的每个蛋白天然核苷酸编码序列设计简并寡核苷酸序列引物。虽然如图1所示比对可选择许多保守氨基酸序列片段来设计简并引物，但是基于已知TIC蛋白编码区域的引物序列位置和用这些引物的热扩增反应所预计产生的扩增子独特大小，选择了三个片段。
鉴定了第一个区域或相应于SEQ ID NO4所示75至83位氨基酸的保守氨基酸序列片段，随后比对了编码来自如SEQ ID NO3、SEQID NO5、SEQ ID NO7和SEQ ID NO9所示的每个序列的氨基酸片段的相应核苷酸序列。编码这个特定氨基酸序列片段的共有核苷酸序列片段用来确定核苷酸序列的范围，包含正向扩增引物序列如SEQID NO23(prJWP200)所示，以及由SEQ ID NO23简并引物的亚组组成的两个其他简并引物(SEQ ID NO24-25，各自对应prJWP201和prJWP202)。
第二区域或本发明蛋白间的保守氨基酸序列片段通过如SEQ IDNO4所示约147至153位氨基酸的氨基酸序列来例证。随后比对了编码如SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9所示每个序列的该氨基酸片段的核苷酸序列。编码这个特定氨基酸序列片段的共有核苷酸序列片段用来确定核苷酸序列的范围，包含如SEQ ID NO6(prJWP203)所示正向引物序列。
第三区域或本发明蛋白间的保守氨基酸序列通过如SEQ ID NO4所示约275至283位氨基酸的氨基酸序列来例证。。随后比对了编码如SEQ ID NO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9所示每个序列的该氨基酸片段的核苷酸序列。编码这个特定氨基酸序列片段的共有核苷酸序列片段用来确定核苷酸序列的范围，包含如SEQ ID NO27(prJWP204)所示反向引物序列和由SEQ ID NO27简并引物的亚组组成的两个其他简并引物(SEQ ID NO28-29，各自对应prJWP205和prJWP206)。
引物prJWP200、prJWP201、prJWP202或prJWP203与prJWP204、prJWP205或prJWP206的任何组合可一起用于热扩增反应，以编码TIC901、TIC1201、TIC407、TIC417或相关分泌杀虫蛋白或其同源物的核苷酸序列为模板，产生的扩增子的相应序列片段与TIC编码序列内用来设计引物序列prJWP200-206的位置之间的相应序列杂交。如果引物prJWP200-202的任一个与引物prJWP204-206的任一个一起，及样品中的合适模板用于热扩增反应，产生的扩增子大小从约590到650个碱基对，是样品中存在一个或多个与本发明序列相关的编码序列的特征性判断依据。一般的，用这些范围内的引物得到的判断性扩增子会由约617到626个碱基对组成。
包含SEQ ID NO26(prJWP203)的任一引物与包含SEQ ID NO27-29(prJWP204-206)的任一引物一起，及样品中的合适模板用于热扩增反应，产生的扩增子大小从约390到415个碱基对，是样品中存在一个或多个与本发明序列相关的编码序列的特征性判断依据。一般的，用这些范围内的引物得到的判断性扩增子会由约400到410个碱基对组成。
为举例说明这些引物的使用，引物prJWP200(SEQ ID NO23)结合引物prJWP204(SEQ ID NO27)用于热扩增反应，每个浓度至少约每微升1皮摩尔以及1×TAQ扩增缓冲液、0.2摩尔dNTP(dATP，dTTP，dCTP和dGTP)、2毫摩尔的MgCI2、2单位TAQ聚合酶和约10到100纳克已知含有TIC901、TIC417编码序列的菌株EG2158基因组DNA样品。热扩增循环条件包括初始94℃变性约2分钟，然后35个循环是94℃变性30秒、50℃退火30秒和72℃延伸45秒，最后72℃延伸7分钟。退火步骤的温度在每个连续循环后降0.3℃使得最后退火温度约为39.8℃。
在1.2％TAE琼脂糖凝胶上分析10毫升样品并与共迁移的100碱基对标样(ladder)比较，溴化乙锭染色。结果表明产生的扩增子片段对应约620个碱基对。切下约620个碱基对的带并回收DNA用于克隆。表现该片段的不同单克隆被分离并得到每个的核苷酸序列。正如预期的，鉴定了与编码TIC901的相应核苷酸序列一致(不包括克隆任一末端的引物序列，如SEQ ID NO3从约402至974位核苷酸所示)的第一序列，并鉴定了与编码TIC417的相应核苷酸序列一致(不包括克隆任一末端的引物序列，如SEQ ID NO9从约464至1036位核苷酸所示)的第二序列。
令人惊奇的是，也鉴定了第三序列(SEQ ID NO30)，它与这里所示的任一序列没有相关的同一性。不过，第三序列与这里所示的编码分泌杀虫蛋白的每个序列，包括tic901、tic1201、ticc407和tic417，在核苷酸序列上基本相似。如以上实施例说明的，在菌株EG2158的基因组DNA中发现tic417编码序列是非常意外的。更惊奇的是鉴定出另一第三核苷酸序列可能相应于一段编码第三分泌杀虫蛋白的核苷酸片段，来自菌株EG2158的该蛋白不同于上述的那些蛋白但在序列上十分相似，并被分类为和这里一个或多个序列杂交的核苷酸序列编码的分泌杀虫蛋白属的一种，是这里示例的简并寡聚核苷酸探针和引物的新颖性和实用性的范例，用来鉴定分泌杀虫蛋白的编码序列和在严格杂交条件下与这里所示tic901、tic1201、tic407和tic417相关编码序列杂交的序列。
SEQ ID NO30所示的连续开放阅读框编码的氨基酸序列，从5’和3’末端都删除26mer简并寡聚核苷酸序列，如SEQ ID NO31所示。SEQ ID NO31所示的氨基酸序列与SEQ ID NO4所示从约85至274位氨基酸的TIC901氨基酸序列基本相似，仅包含与SEQ ID NO4类似序列2个氨基酸的不同，SEQ ID NO31和SEQ ID NO4的相应序列之间对应约98.9％的同一性。SEQ ID NO31所示的氨基酸序列与SEQ ID NO6从约85至274位氨基酸所示的TIC1201氨基酸序列基本相似，仅包含与SEQ ID NO6类似序列13个氨基酸的不同，SEQ ID NO31和SEQ ID NO6的相应序列之间对应约93.2％的同一性。SEQ ID NO31所示的氨基酸序列与SEQ ID NO10所示从约85至274位氨基酸的TIC417氨基酸序列基本相似，仅包含与SEQ ID NO10类似序列30个氨基酸的不同，SEQ ID NO31和SEQ ID NO10的相应序列之间对应约83.7％的同一性。SEQ IDNO31所示的氨基酸序列与SEQ ID NO8从约85至274位氨基酸所示的TIC401氨基酸序列基本相似，包含与SEQ ID NO8类似序列41个氨基酸的不同，SEQ ID NO31和SEQ ID NO8的相应序列之间对应约78.4％的同一性。
当DNA模板来自菌株EG5858、EG4332和EG5552，与包含SEQID NO11和SEQ ID NO12的引物组(如以上表5所示)一起得到的结果大不相同，这些菌株的DNA每个都产生一个扩增子，当使用相应引物prJWP200和prJWP204的引物组其序列看来相应于TIC407编码序列。TIC407同源物对应的编码序列可能存在于这些菌株的大HindIII片段上，并因此当以tic901作为探针用DNA印迹法进行初筛时不易用于鉴定，结果见表1。
实施例11此实施例说明鉴定独特的TIC901相关RFLP型和芽孢杆菌菌株的杀虫蛋白编码序列，用ELISA检测方法确定其于培养基上清液中产生免疫相关的TIC901细胞外蛋白，但用标准tic901热扩增检测方法，其DNA不能产生可检测的热扩增产物。
如上所述实施例所示，最初的分析是基于检测培养基上清的杀虫活性，苏云金芽孢杆菌在PYG培养基上30℃生长过夜再通过用TIC901特异序列的DNA免疫杂交法检测其中tic901相关序列。分析了几百个苏云金芽孢杆菌菌株的总DNA。产生并比较RFLP图谱。用tic901、tic1201、tic407和tic417特异的引物对这些DNA的热扩增确定了约20到25％含有这种相关序列的Bt菌株。相信一些TIC901相关序列用RFLP和热扩增检测方法未能检出。基于Bt菌株细胞外蛋白图谱使发酵继续到对数晚期并直到平稳期和孢子形成期，用免疫学方法更直接的用于检测产生TIC901相关蛋白的Bt菌株。
收集的Bt培养物以96孔形式排列并作为甘油原种保存于-80℃，这些作为接种物通过转移样品到深孔板(DWB′s，QUIAGEN INC)中进行微量发酵。每个样品在每孔1毫升丰富肉汤培养基(TB)中发酵。DWB用AIRPORE tape sheets(QUIAGEN)密封并在HiGro孵化器(GENOMIC SOLUTIONS/GENOMIC INSTRUMENTATIONSERVICES)中30℃温育300rpm振荡20到45小时。发酵的最后，每毫升25个单位的benzonase核酸酶(SIGMA ALDRICH)加入到肉汤培养物中以降低粘度，并于30℃再温育一个小时。通过在吊桶式转头中1900×g 4℃离心30分钟除去固体，包括细胞和芽孢，并将澄清的上清以200微升量转移到浅96孔板中保存于-80℃，用ELISA进一步分析处理。
发展ELISA方法来鉴定含有TIC901相关蛋白的肉汤上清。96孔NUNC Immuno MaxSorb板每孔100微升缓冲液4℃包被过夜，缓冲液中含有15毫摩尔碳酸钠、35毫摩尔碳酸氢钠、150毫摩尔NaCl、pH9.6以及用1∶1000稀释的反向亲和(reverse-affinity)纯化的兔抗TIC901 IgG抗体的多克隆抗体。用PBST(50mM K/Na磷酸盐、150mM NaCl、0.05％Tween 20，pH7.4)洗孔3次，过量结合位点用250微升1％BSA的PBST溶液室温封阻1小时。去掉封阻缓冲液，每孔加入200微升用含0.2％BSA的PBST以1∶75稀释(体积比体积)的Bt培养上清，4℃温育过夜。每孔用PBST洗3次再每孔加入另外200微升用含0.2％BSA的PBST以1∶2000稀释的生物素标记抗TIC901的多克隆抗体。生物素标记的抗体溶液室温下温育2小时并如上述洗3次。通过每孔200微升1∶3000稀释的HRP偶联链霉亲和素在室温下温育2小时，PBST洗3次再每孔加入100微升过氧化物酶底物TMP，检出生物素标记抗体-TIC901相关蛋白复合物。每孔加入100微升3M磷酸盐溶液终止反应。测量单个孔450纳米波长的吸光度，确定含有TIC901相关蛋白的Bt菌株上清通过阴性对照加上三个标准差的平均吸光度进行确定。
用ELISA方法鉴定的几个菌株当与阴性对照的培养上清比较时，表现出阳性ELISA结果，但当用TIC901、TIC1201、TIC407或TIC417特异扩增引物对时不能产生热扩增产物。来自这样一个ELISA阳性/PCR阴性菌株的基因组DNA先前被指定为苏云金芽孢杆菌EG4653菌株，并在无晶体菌株EG10650中构建了一个基因组质粒表达库。EG10650质粒库来自菌株EG4653的DNA，将其点到膜上并用上述兔抗TIC901 IgG多克隆抗体进行杂交。阳性克隆被进一步纯化并扩增，对在这样一个质粒中存在的DNA插入片段进行测序。从单个开放阅读框中推出一个完整的TIC901同源蛋白。同源蛋白指定为TIC431，其氨基酸序列如SEQ ID NO33所示。SEQ ID NO32包含推出TIC431氨基酸序列的开放阅读框。TIC431氨基酸序列和TIC901及同源蛋白TIC1201、407、417的氨基酸序列比对如图1所示。推出的成熟TIC431m和TIC901m、TIC1201m、TIC407m及TIC417m的比较显示431对407表现出约75％同一性、对901表现出约79％同一性、对1201表现出约80％同一性及对417表现出约95％同一性。因此，预计其他的TIC431同源蛋白对TIC431氨基酸序列会表现从约75到95％的同一性。推出的前体蛋白包括一个预测的约30氨基酸的N端序列，该序列符合表现出共有的II型信号肽酶剪切序列的信号肽。此外，同样或基本相似的氨基酸序列存在于信号肽序列和推出的如SEQ ID NO3344位氨基酸开始的成熟蛋白N端氨基酸之间。如SEQ ID NO23-26和SEQ ID NO27-29所示的热扩增引物，与SEQ ID NO32从约223至249、或从约223至249、或从约439至456、或从约823至846所示核苷酸序列编码的氨基酸序列一致，预期产生的复制子可判断SEQ ID NO32及其他tic901同源杀虫蛋白编码序列的存在。
ELISA方法配合热扩增方法将提供给技术人员鉴定来自芽孢杆菌编码杀虫蛋白的任何核苷酸序列的方法，该蛋白对这里所示的TIC901或TIC901同源氨基酸序列表现约67％到99％或更高氨基酸序列的同一性。
本领域技术人员将认识到用本发明的探针和引物鉴定本发明蛋白的编码序列及鉴定本发明蛋白、基因和其相关蛋白的其他实施方案是可能的。
简而言之，以上说明书描述了本发明的优选实施方案。本领域技术人员将会理解，在不背离本发明的范围和精神并无需大量实验的情况下，本发明可在一个相当大的等价参数范围内执行。虽然结合了其特异实施方案已经对本发明进行了描述，但是可以理解的是它能进一步被修饰。本发明是用于涵盖任何遵循一般发明原则的对本发明的使用、变更或改动。以下所有权利要求提供的元件的各种替换或组合都是可能的并在本发明范围内。本说明书中涉及的所有出版物和专利都通过引用结合至本文，如同各出版物或专利具体而单独声明通过引用结合到本文中。
参考文献Barry et al.，1992，Inhibitors of amino acid biosynthesisStrategies forimparting glyphosate tolerance to crop plants.InBiosynthesis andMolecular Regulation of Amino Acids in Plants.pp.139-145.
Singh，Flores，and Shannon Eds.，American Society of Plant Physiologists，Rockville，Md.
Baum，J.A.；Coyle，D.M.；Gilbert，M.P.；Jany，C.S；Gawron-Burke，C.，1990 Novel cloning vectors for Bacillus thuriragierasis；1983，Appliedand Environmental Microbiology 56(11)3420-3428.
Bevan，Nature 304184-187.
Callis et al.，1987，Genes & amp；Develop.11183-1200.
Crickmore et al.，1998，MicrobioL Molecular Biol.Rev.62，pp.807-813.
DeBarjac and Frachon，1990，Entomophaga 35，pp.233-240.
Diehn et al.，1996，InGenetic Engineering，Ed.J.K.Setlow，PlenumPress，New York，NY，1883-99.
Diehn et al.，1998，Plant Physiology，1171433-1443.
Donovan et al.，1988，Mol.Gen.Genet.214365-372.
Ellis et aL，1987，EMBO Journal 611-16.
Estruch et aL，1996，Proc.Natl.Acad.Sci.U.S.A.，935389-5394.
Fraley et al.，1983，Proc.Natl.Acad.Sci.U.S.A.，804803.
Goding，Monoclonal AntibodiesPrinciples and Practice，2nd eds，Academic Press，NY，1986.
Harlow and Lane，1988，AntibodiesA Laboratory Manual，Cold SpringHarbor Laboratory，Cold Spring Harbor，NY.
Hartley，J.，1988，Mol.Biol.202913.
Herrera-Estrella，1983，Nature 303209-213.
Hess，1987，Intern Rev.CytoL，107367.
Hfte et al.，1989，Microbiol.Rev.53242-255，Horsch et aL，1985，Science，2271229-1231.
Humason，Gretchen L.，1967，Animal Tissue Techniques，W.H.Freemanand Company.
Joshi，1987，Nucl.Acids Res.159627-9640.
Klee，1985，Bio/Technol.3637-642.
Kostichka et al.，1996，J.Bacteriol.1782141-2144.
Kyte and Doolittle，1982，J.Mol.Biol.，157105-132.
Laemmli，1973，Mol.Biol.80575-599.
Lu et al.，2000，J.Plant Phys.，156277-283.
Ma et aL，1988，Nature 334631-633.
Maliga，1993，Trends in Biotechnology 11101-106.
McElroy et al.，1990，Plant Cell 2163-171.
Murray et al.，1989，Nucl.Acids.Res.，17477-498.
Neuhaus et aL，1987，Theor.Appl.Genet.，7530.
Nielsen et al.，1997，Protein Engineering 101-6.
Norton et al.，1985，Plasmid 13211-214.
Odell et aL，1985，Nature 313810-812.
Pena et aL，1987，Nature，325274.
Perlak et al.，1991，Proc.Natl.Acad.Sci.USA，883324-3328，.
Sambrook et al.，1989，Molecular Cloning-A Laboratory Manual，2″d Ed.，Cold Spring Harbor Laboratory，Cold Spring Harbor，New York.
Schnepf et al.，1998，Microbiol.Molec.Biol.Rev.62775-806.
Turner et al.，1993，Endophytesan alternative genome for cropimprovement；Internatioaal Crop Science Congress，Ames，Iowa，USA，14-22 July 1992.，pp.555-560.
Vasil et al.，1989，Plant Phys.911575-1579.
Yanisch-Perron et al，1985，Gene 33103-119.
Zhou et aL，1983，Mol.Cell Biol.，104529-4537.
美国专利6,489,542美国专利6,448,476美国专利6,279,369美国专利6,242,669
美国专利6,204,435美国专利6,107,549美国专利6,063,597美国专利5,888,801美国专利5,872,212美国专利5,877,012美国专利5,866,326美国专利5,849,870美国专利5,837,848美国专利5,759,538美国专利5,689,052美国专利5,569,834美国专利5,500,365美国专利5,424,412美国专利5,349,124美国专利5,229,112美国专利5,135,867美国专利5,080,897美国专利4,935,353美国专利4,695,462
美国专利4,695,455美国专利4,554,101WO96/10083WO94/21795WO95/24492EPO0120516
序列表<110>孟山都技术有限公司(Monsanto Technology LLC)J.A.鲍姆(Baum，James A.)J.C.多诺文(Donovan，Judith C.)W.P多诺文(Donovan，William P.)J.T.恩格尔曼(Engleman，James T.)K.克拉索米尔-奥斯特(Krasomil-Osterfeld，Karina)J.W.皮特金(Pitkin，John W.)J.K.罗伯茨(Roberts，James K.)<120>苏云金芽孢杆菌分泌的杀虫蛋白及其应用<130>38-21(52806)PCT<150>US60/485,483<151>2003-07-07<160>33<170>PatentIn version 3.1<210>1
<211>15<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>1Val Ile Gly Pro Tyr Ala Glu Ser Tyr Ile Asp Arg Val Gln Asp1 5 10 15<210>2<211>45<212>DNA<213>人工序列<220>
<223>编码SEQ ID NO 1的tic基因探针<400>2gtaattggac catatgcaga atcatatatt gatacgagta caaga 45<210>3<211>1253<212>DNA<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220>
<221>CDS<222>(153)..(1253)<223>
<400>3aattatgatt ttaatattct tatgttattc ctataatata caataaaagc ataattatcc60ttcatattat gtttataaat ttaataaaat acataaaaat agagtgttat aatatttttg 120aaagcgttat caagagtgat ggagggataa tt atg aaa aat aga ttt tca aaa 173Met Lys Asn Arg Phe Ser Lys1 5gtg gca tta tgc acc gta ccg att tta atg gtt tct aca ttc gcc agt 221Val Ala Leu Cys Thr Val Pro Ile Leu Met Val Ser Thr Phe Ala Ser10 15 20tca agc atg tca gct ttt gct gca gaa gcc aaa tca cca gat tta aat 269Ser Ser Met Ser Ala Phe Ala Ala Glu Ala Lys Ser Pro Asp Leu Asn25 30 35gta tct caa caa gta ata ggt ccc tat gcc gaa tct tat att gat att 317Val Ser Gln Gln Val Ile Gly Pro Tyr Ala Glu Ser Tyr Ile Asp Ile40 45 50 55gtg cag gat aga atg aaa caa agg gat aag gga tca aaa tta act ggt 365Val Gln Asp Arg Met Lys Gln Arg Asp Lys Gly Ser Lys Leu Thr Gly60 65 70aaa cca ata aat atg caa gaa caa ata ata gat ggg tgg ttt cta gct 413Lys Pro Ile Asn Met Gln Glu Gln Ile Ile Asp Gly Trp Phe Leu Ala75 80 85aga ttt tgg ata ttt aag gat caa aac aat aac cat cag aca aat aga 461Arg Phe Trp Ile Phe Lys Asp Gln Asn Asn Asn His Gln Thr Asn Arg90 95 100ttt ata tcc tgg ttt aaa gat aat att gct agt tca aaa ggg tat aat 509Phe Ile Ser Trp Phe Lys Asp Asn Ile Ala Ser Ser Lys Gly Tyr Asn
105 110 115agt att gcg gag caa atg ggt tta aaa ata gaa gca gaa aac gat atg 557Ser Ile Ala Glu Gln Met Gly Leu Lys Ile Glu Ala Glu Asn Asp Met120 125 130 135gat gta aca aat ata gat tat aca tct aag aca ggc gat acc att tat 605Asp Val Thr Asn Ile Asp Tyr Thr Ser Lys Thr Gly Asp Thr Ile Tyr140 145 150aat ggt att tca gaa ttg aaa aat tat aca gga tca act caa aag atg 653Asn Gly Ile Ser Glu Leu Lys Asn Tyr Thr Gly Ser Thr Gln Lys Met155 160 165aaa aca gat agt ttt caa aga gat tat aca aaa tca gaa tct act tca 701Lys Thr Asp Ser Phe Gln Arg Asp Tyr Thr Lys Ser Glu Ser Thr Ser170 175 180gta act aat gga tta caa tta gga ttt aaa gtt gct gct aaa gga gta 749Val Thr Asn Gly Leu Gln Leu Gly Phe Lys Val Ala Ala Lys Gly Val185 190 195gtt gct ttg gct ggg gca gac ttt gaa acc agt gtt act tat aat cta 797Val Ala Leu Ala Gly Ala Asp Phe Glu Thr Ser Val Thr Tyr Asn Leu200 205 210 215tca act act aca act gaa aca aat aca ata tca gac aag ttt act gtc 845Ser Thr Thr Thr Thr Glu Thr Asn Thr Ile Ser Asp Lys Phe Thr Val220 225 230cca tct caa gaa gtt aca ttg cct cca gga cat aaa gcg ata gtg aaa 893Pro Ser Gln Glu Val Thr Leu Pro Pro Gly His Lys Ala Ile Val Lys235 240 245cat gat tta aga aaa atg gtt tat tct ggt act cat gat cta aag ggt 941His Asp Leu Arg Lys Met Val Tyr Ser Gly Thr His Asp Leu Lys Gly250 255 260gat tta att gtg agt ttt aat gat aaa gag att gta caa aaa ttt att 989Asp Leu Ile Val Ser Phe Asn Asp Lys Glu Ile Val Gln Lys Phe Ile265 270 275tat cca aat tat aga gaa att aat tta tct gat atc cgt gaa act atg1037Tyr Pro Asn Tyr Arg Glu Ile Asn Leu Ser Asp Ile Arg Glu Thr Met
280 285 290 295att gaa att gat gaa tgg aat cat gta aac cct gtg aat ttt tat gaa1085Ile Glu Ile Asp Glu Trp Asn His Val Ash Pro Val Asn Phe Tyr Glu300 305 310tta gtt ggg gtc aaa aat cat ata aaa aat ggt gaa act ttg tat ata1133Leu Val Gly Val Lys Asn His Ile Lys Ash Gly Glu Thr Leu Tyr Ile315 320 325gat act cea gct aaa ttt atg ttt aat ggt gct aat cea tat tat aga1181Asp Thr Pro Ala Lys Phe Met Phe Asn Gly Ala Asn Pro Tyr Tyr Arg330 335 340gca aca ttt aca gaa tac gac ggg aat aat aat cct gtt caa aca aag1229Ala Thr Phe Thr Glu Tyr Asp Gly Asn Asn Asn Pro Val Gin Thr Lys345 350 355gta tta agt gaa aac ttt aaa ttg1253Val Leu Ser Glu Asn Phe Lys Leu360 365<210>4<211>367<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>4Met Lys Asn Arg Phe Ser Lys Val Ala Leu Cys Thr Val Pro Ile Leu1 5 10 15Met Val Ser Thr Phe Ala Ser Ser Ser Met Ser Ala Phe Ala Ala Glu20 25 30Ala Lys Ser Pro Asp Leu Asn Val Ser Gln Gln Val Ile Gly Pro Tyr
35 40 45Ala Glu Ser Tyr Ile Asp Ile Val Gln Asp Arg Met Lys Gln Arg Asp50 55 60Lys Gly Ser Lys Leu Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95Asn Asn His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Ile100 105 110Ala Ser Ser Lys Gly Tyr Asn Ser Ile Ala Glu Gln Met Gly Leu Lys115 120 125Ile Glu Ala Glu Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser130 135 140Lys Thr Gly Asp Thr Ile Tyr Asn Gly Ile Ser Glu Leu Lys Asn Tyr145 150 155 160Thr Gly Ser Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175Thr Lys Ser Glu Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe180 185 190Lys Val Ala Ala Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu195 200 205Thr Ser Val Thr Tyr Asn Leu Ser Thr Thr Thr Thr Glu Thr Asn Thr
210 215 220Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Pro Pro225 230 235 240Gly His Lys Ala Ile Val Lys His Asp Leu Arg Lys Met Val Tyr Ser245 250 255Gly Thr His Asp Leu Lys Gly Asp Leu Ile Val Ser Phe Asn Asp Lys260 265 270Glu Ile Val Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Glu Ile Asn Leu275 280 285Ser Asp Ile Arg Glu Thr Met Ile Glu Ile Asp Glu Trp Asn His Val290 295 300Asn Pro Val Asn Phe Tyr Glu Leu Val Gly Val Lys Asn His Ile Lys305 310 315 320Asn Gly Glu Thr Leu Tyr Ile Asp Thr Pro Ala Lys Phe Met Phe Asn325 330 335Gly Ala Asn Pro Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Gly Asn340 345 350Asn Asn Pro Val Gln Thr Lys Val Leu Ser Glu Asn Phe Lys Leu355 360 365<210>5<211>1621<212>DNA
<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220>
<221>CDS<222>(530)..(1621)<223>
<400>5actagttttt tcataatggc ataagcggga tgatgatctt gttttttacg atgttcaata 60tccaatgtgt gcctttctat atcaatcgca cgatataaat aacactattt ccctttgaat120tttatatagg tttcatctaa ttttcaagac atgtggttgt tttgcgtttt cttcttccaa180atttgataaa tcaagctccc atattcatga atccagcgca taatgattgt gggatgaact240gaaacatcac gatagcttaa agcaaaacga caatagtagc ggacggctac cataataata300tcttgtttga actgtttccc tttaaaatat cacatttgtg attctcctcg atgctttttt360tagagtgtag cttcatctag aacactttgc aatagaacca ttcctttgat atacaattaa420accacattta tccttcatgg aatgtttata tattaaagaa tataaaaaaa catacgatgt480tataattaat ttgaaagcgt taacaaaaat gaatgatgga gggataatt atg aaa tac538Met Lys Tyr1aag ttt tca aaa gtc gtt aag tgt act tta cca gct tta atg att act 586Lys Phe Ser Lys Val Val Lys Cys Thr Leu Pro Ala Leu Met Ile Thr5 10 15aca ttc gtt act cca agt atg gca gtt ttt gcc gca gaa acc aag tcg 634Thr Phe Val Thr Pro Ser Met Ala Val Phe Ala Ala Glu Thr Lys Ser20 25 30 35
cca aat cta aat gca tct caa caa gca ata act cca tat gct gaa tct 682Pro Asn Leu Asn Ala Ser Gln Gln Ala Ile Thr Pro Tyr Ala Glu Ser40 45 50tat att gat act gtt caa gat aga atg aaa caa aga gat agg gaa tca 730Tyr Ile Asp Thr Val Gln Asp Arg Met Lys Gln Arg Asp Arg Glu Ser55 60 65aaa cta act ggt aaa cea ata aat atg caa gaa caa ata ata gat gga 778Lys Leu Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile Ile Asp Gly70 75 80tgg ttt tta gct aga ttc tgg ata ttt aaa gat caa aat aac aat cat 826Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn Asn Asn His85 90 95caa aca aat aga ttt ata tcc tgg ttt aaa gat aat ctt gct agt tcg 874Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Leu Ala Ser Ser100 105 110 115aag ggg tat gac agt ata gca gaa caa atg ggc tta aaa ata gaa gca 922Lys Gly Tyr Asp Ser Ile Ala Glu Gln Met Gly Leu Lys Ile Glu Ala120 125 130tta aat gat atg gat gta aca aat att gat tat aca tct aaa aca ggt 970Leu Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser Lys Thr Gly135 140 145gat acc ata tat aat gga att tct gaa cta aca aat tat aca gga aca1018Asp Thr Ile Tyr Asn Gly Ile Ser Glu Leu Thr Asn Tyr Thr Gly Thr150 155 160acc caa aaa atg aaa acc gat agt ttt caa aga gat tat aca aaa tct1066Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr Thr Lys Ser165 170 175gaa tcc act tca gta aca aat ggg tta caa tta gga ttt aaa gtt gct1114Glu Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe Lys Val Ala180 185 190 195gct aag gga gta gtt gca tta gca ggt gca gat ttt gaa aca agt gtt1162Ala Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu Thr Ser Val200 205 210
acc tat aat tta tca tct act aca act gaa aca aat aca ata tcg gat1210Thr Tyr Asn Leu Ser Ser Thr Thr Thr Glu Thr Asn Thr Ile Ser Asp215 220 225aag ttt act gtt cca tct caa gaa gtt aca tta tcc cca gga cat aaa1258Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Ser Pro Gly His Lys230 235 240gca gtg gtg aaa cat gat ttg aga aaa atg gtg tat ttt ggg act cat1306Ala Val Val Lys His Asp Leu Arg Lys Met Val Tyr Phe Gly Thr His245 250 255gat tta aag ggt gat tta aaa gta ggt ttt aat gat aaa gag att gta1354Asp Leu Lys Gly Asp Leu Lys Val Gly Phe Asn Asp Lys Glu Ile Val260 265 270 275caa aaa ttt att tat cca aat tat aga tca att gat tta tct gat att1402Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Ser Ile Asp Leu Ser Asp Ile280 285 290cgt aaa aca atg att gaa att gat aaa tgg aat cat gta aat acc att1450Arg Lys Thr Met Ile Glu Ile Asp Lys Trp Asn His Val Asn Thr Ile295 300 305gac ttt tat caa tta gtt gga gtt aaa aat cat ata aaa aat ggt gat1498Asp Phe Tyr Gln Leu Val Gly Val Lys Asn His Ile Lys Asn Gly Asp310 315 320act tta tat ata gat acc ccg gcc gaa ttt aca ttt aat gga gct aat1546Thr Leu Tyr Ile Asp Thr Pro Ala Glu Phe Thr Phe Asn Gly Ala Asn325 330 335cca tat tat aga gca aca ttt aca gaa tac gac gag aac gga aat cct1594Pro Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Glu Asn Gly Asn Pro340 345 350 355gtt caa aca aag att tta agt gga aat1621Val Gln Thr Lys Ile Leu Ser Gly Asn360<210>6<211>364
<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>6Met Lys Tyr Lys Phe Ser Lys Val Val Lys Cys Thr Leu Pro Ala Leu1 5 10 15Met Ile Thr Thr Phe Val Thr Pro Ser Met Ala Val Phe Ala Ala Glu20 25 30Thr Lys Ser Pro Asn Leu Asn Ala Ser Gln Gln Ala Ile Thr Pro Tyr35 40 45Ala Glu Ser Tyr Ile Asp Thr Val Gln Asp Arg Met Lys Gln Arg Asp50 55 60Arg Glu Ser Lys Leu Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95Asn Asn His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Leu100 105 110Ala Ser Ser Lys Gly Tyr Asp Ser Ile Ala Glu Gln Met Gly Leu Lys115 120 125Ile Glu Ala Leu Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser130 135 140
Lys Thr Gly Asp Thr Ile Tyr Asn Gly Ile Ser Glu Leu Thr Asn Tyr145 150 155 160Thr Gly Thr Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175Thr Lys Ser Glu Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe180 185 190Lys Val Ala Ala Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu195 200 205Thr Ser Val Thr Tyr Asn Leu Ser Ser Thr Thr Thr Glu Thr Asn Thr210 215 220Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Ser Pro225 230 235 240Gly His Lys Ala Val Val Lys His Asp Leu Arg Lys Met Val Tyr Phe245 250 255Gly Thr His Asp Leu Lys Gly Asp Leu Lys Val Gly Phe Asn Asp Lys260 265 270Glu Ile Val Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Ser Ile Asp Leu275 280 285Ser Asp Ile Arg Lys Thr Met Ile Glu Ile Asp Lys Trp Asn His Val290 295 300Asn Thr Ile Asp Phe Tyr Gln Leu Val Gly Val Lys Asn His Ile Lys305 310 315 320
Asn Gly Asp Thr Leu Tyr Ile Asp Thr Pro Ala Glu Phe Thr Phe Asn325 330 335Gly Ala Asn Pro Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Glu Asn340 345 350Gly Asn Pro Val Gln Thr Lys Ile Leu Ser Gly Asn355 360<210>7<211>1552<212>DNA<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220>
<221>CDS<222>(169)..(1272)<223>
<400>7ctagctgaat atgcagtaga taatgatttt gactatacta atgagatttt ttatgtaata60aaccatattt atccttaaat aaatgttcac atatttaaaa agaataaact accatgcggt 120gctagaatat aaatgagagc gctaacaaaa aataatggag ggataatc atg aaa tac177Met Lys Tyr1aaa tca tca aaa gta gca ata tgt act tta tca gct tta atg ctt tca 225Lys Ser Ser Lys Val Ala Ile Cys Thr Leu Ser Ala Leu Met Leu Ser
5 10 15aca att ggt act tcg agt atg tcc act ttt gct gca gaa aca aca tta 273Thr Ile Gly Thr Ser Ser Met Ser Thr Phe Ala Ala Glu Thr Thr Leu20 25 30 35cca ggt caa act ctt aag gaa caa tca ata acc cca cgt gca gaa tct 321Pro Gly Gln Thr Leu Lys Glu Gln Ser Ile Thr Pro Arg Ala Glu Ser40 45 50tat att gat att gta caa gat aga atg aaa caa agg gat ata gaa tcg 369Tyr Ile Asp Ile Val Gln Asp Arg Met Lys Gln Arg Asp Ile Glu Ser55 60 65aaa cgt act ggt aaa ccg att aat atg caa gaa caa ata ata gat gga 417Lys Arg Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile Ile Asp Gly70 75 80tgg ttt tta gca aga ttc tgg ata ttt aaa gat caa aat aat aac cat 465Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn Asn Asn His85 90 95caa aca aat aga ttc ata aca tgg ttt aaa aat aat gtt gcc agc tca 513Gln Thr Asn Arg Phe Ile Thr Trp Phe Lys Asn Asn Val Ala Ser Ser100 105 110 115aaa ggt tat gag ggt att gca gaa caa atg ggt ttg aaa ata gaa tcg 561Lys Gly Tyr Glu Gly Ile Ala Glu Gln Met Gly Leu Lys Ile Glu Ser120 125 130atg agt gat atg aat gta tcg aat ata aat tat aca ggt aaa aag ggt 609Met Ser Asp Met Asn Val Ser Asn Ile Asn Tyr Thr Gly Lys Lys Gly135 140 145gat act ata tat aat ggc gtt tcg gaa tta gaa aat aaa atg gga aca 657Asp Thr Ile Tyr Asn Gly Val Ser Glu Leu Glu Asn Lys Met Gly Thr150 155 160cct caa aaa atg aaa tca gat agt ttt caa aga gat tat acc aaa tct 705Pro Gln Lys Met Lys Ser Asp Ser Phe Gln Arg Asp Tyr Thr Lys Ser165 170 175caa tca acc tca gta aca aat ggg tta caa tta gga gtt aaa gtt tct 753Gln Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Val Lys Val Ser
180 185 190 195gcc aaa ggt acg gtt gtc tta gga gag gca agc ctt gaa aca agc gtt 801Ala Lys Gly Thr Val Val Leu Gly Glu Ala Ser Leu Glu Thr Ser Val200 205 210act tat aat tta tcg tct act gca act gaa aca gat aca aca tcg gac 849Thr Tyr Asn Leu Ser Ser Thr Ala Thr Glu Thr Asp Thr Thr Ser Asp215 220 225aag ttt act gtc cca tcc caa gaa gtt aca tta cca cca gga cat aaa 897Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Pro Pro Gly His Lys230 235 240gca gta att aag cat gat tta aga aaa atg gtg tat tct ggt acg cat 945Ala Val Ile Lys His Asp Leu Arg Lys Met Val Tyr Ser Gly Thr His245 250 255gac tta aag ggg gat tta aaa gta gct ttt aac gat aaa gca att gta 993Asp Leu Lys Gly Asp Leu Lys Val Ala Phe Asn Asp Lys Ala Ile Val260 265 270 275caa aaa ttt att tat cca aat tat aga tct ata aat tta tct gat att 1041Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Ser Ile Asn Leu Ser Asp Ile280 285 290cgt aaa aca atg aaa gaa att gat gaa tgg aat cat gta aaa ccc att 1089Arg Lys Thr Met Lys Glu Ile Asp Glu Trp Asn His Val Lys Pro Ile295 300 305gat ttt tat caa ctg gtt gga ata aaa aat cat ata aaa aat ggg gat 1137Asp Phe Tyr Gln Leu Val Gly Ile Lys Asn His Ile Lys Asn Gly Asp310 315 320acc tta tat ata gag act cca gct aaa ttt att ttt aat gga gct aat 1185Thr Leu Tyr Ile Glu Thr Pro Ala Lys Phe Ile Phe Asn Gly Ala Asn325 330 335gta tat tat aga gca act ttt aca gaa tat gat aag gat gga aaa cct 1233Val Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Lys Asp Gly Lys Pro340 345 350 355gtt caa ttc aac aaa ttt tta agt gaa aat tac aag tta tagaggaagt 1282Val Gln Phe Asn Lys Phe Leu Ser Glu Asn Tyr Lys Leu
360 365aaagatgccg tagtgagatc gtttcacago tactgagtat tcaaataata cacgggaaaa 1342ttcaccttcc tggaaggacg gatttacttt ttttacggag gaacttgttt tatacatcaa 1402aatgtttttt tatgaggttt gtgtattctt atttgagcct ggaacggaac cattttgagt 1462aagcttaatt tgacttggaa atgtattttt attaccttat tacgtgaaca atggcctata 1522aacgtgccac acaggaatgg gaggacgagt1552<210>8<211>368<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>8Met Lys Tyr Lys Ser Ser Lys Val Ala Ile Cys Thr Leu Ser Ala Leu1 5 10 15Met Leu Ser Thr Ile Gly Thr Ser Ser Met Ser Thr Phe Ala Ala Glu20 25 30Thr Thr Leu Pro Gly Gln Thr Leu Lys Glu Gln Ser Ile Thr Pro Arg35 40 45Ala Glu Ser Tyr Ile Asp Ile Val Gln Asp Arg Met Lys Gln Arg Asp50 55 60Ile Glu Ser Lys Arg Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80
Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95Asn Asn His Gln Thr Asn Arg Phe Ile Thr Trp Phe Lys Asn Asn Val100 105 110Ala Ser Ser Lys Gly Tyr Glu Gly Ile Ala Glu Gln Met Gly Leu Lys115 120 125Ile Glu Ser Met Ser Asp Met Asn Val Ser Asn Ile Asn Tyr Thr Gly130 135 140Lys Lys Gly Asp Thr Ile Tyr Asn Gly Val Ser Glu Leu Glu Asn Lys145 150 155 160Met Gly Thr Pro Gln Lys Met Lys Ser Asp Ser Phe Gln Arg Asp Tyr165 170 175Thr Lys Ser Gln Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Val180 185 190Lys Val Ser Ala Lys Gly Thr Val Val Leu Gly Glu Ala Ser Leu Glu195 200 205Thr Ser Val Thr Tyr Asn Leu Ser Ser Thr Ala Thr Glu Thr Asp Thr210 215 220Thr Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Pro Pro225 230 235 240Gly His Lys Ala Val Ile Lys His Asp Leu Arg Lys Met Val Tyr Ser245 250 255
Gly Thr His Asp Leu Lys Gly Asp Leu Lys Val Ala Phe Asn Asp Lys260 265 270Ala Ile Val Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Ser Ile Asn Leu275 280 285Ser Asp Ile Arg Lys Thr Met Lys Glu Ile Asp Glu Trp Asn His Val290 295 300Lys Pro Ile Asp Phe Tyr Gln Leu Val Gly Ile Lys Asn His Ile Lys305 310 315 320Asn Gly Asp Thr Leu Tyr Ile Glu Thr Pro Ala Lys Phe Ile Phe Asn325 330 335Gly Ala Asn Val Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Lys Asp340 345 350Gly Lys Pro Val Gln Phe Asn Lys Phe Leu Ser Glu Asn Tyr Lys Leu355 360 365<210>9<211>1378<212>DNA<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220>
<221>CDS<222>(215)..(1306)
<223>
<400>9cagtggatag gaatttgttt tcgtgctagg tatcaattta atttgttcta taagataagt60gaagtacgat caaaatgaat acttttgtgt attagatcaa taggtaaaat aataataaat 120tttatatttg aaccttaaaa aattatttaa tcaaatcttt ttcactttaa aaacaaaata 180tccagaaaaa acaatagtta acggagggat aata atg aaa tac aag tca tca aaa 235Met Lys Tyr Lys Ser Ser Lys1 5gta gca atg tgt aca tta tca gct tta atg ctt tcg aca atc gcc act 283Val Ala Met Cys Thr Leu Ser Ala Leu Met Leu Ser Thr Ile Ala Thr10 15 20cca agt ata tct gtt ttc gct gca gaa aca act tcg tca cat gcg gtt 331Pro Ser Ile Ser Val Phe Ala Ala Glu Thr Thr Ser Ser His Ala Val25 30 35act aat cag caa aca att acg cag cgt gca gaa tct tat att gat att 379Thr Asn Gln Gln Thr Ile Thr Gln Arg Ala Glu Ser Tyr Ile Asp Ile40 45 50 55gtg cac aat aga atg aaa caa aga gat att gaa tca aaa atg aca ggt 427Val His Asn Arg Met Lys Gln Arg Asp Ile Glu Ser Lys Met Thr Gly60 65 70aaa tcc att aat atg caa gaa caa ata att gat gga tgg ttt tta gct 475Lys Ser Ile Asn Met Gln Glu Gln Ile Ile Asp Gly Trp Phe Leu Ala75 80 85aga ttt tgg ata ttt aag gat caa aat aat agt cac caa aca aat aga 523Arg Phe Trp Ile Phe Lys Asp Gln Asn Asn Ser His Gln Thr Asn Arg90 95 100ttt att tca tgg ttt aag gat aat ttg gct agc cca gga ggg tat gat 571Phe Ile Ser Trp Phe Lys Asp Asn Leu Ala Ser Pro Gly Gly Tyr Asp105 110 115
agt atc gct gaa cag atg ggc cta aaa gta gca gca tta aat gat atg 619Ser Ile Ala Glu Gln Met Gly Leu Lys Val Ala Ala Leu Asn Asp Met120 125 130 135gat ata tca aat gta aat tat act tct aag aca ggg gat act ata tat 667Asp Ile Ser Asn Val Asn Tyr Thr Ser Lys Thr Gly Asp Thr Ile Tyr140 145 150aat ggt gtt tca gaa tta aaa aat atc aca gga aca act caa aaa atg 715Asn Gly Val Ser Glu Leu Lys Asn Ile Thr Gly Thr Thr Gln Lys Met155 160 165aaa aca gat agt ttt caa aga gat tat aca aaa tcc cag tca act tca 763Lys Thr Asp Ser Phe Gln Arg Asp Tyr Thr Lys Ser Gln Ser Thr Ser170 175 180atc acc aat gga tta caa tta gga ttt aaa gtt tca gct aaa gga ata 811Ile Thr Asn Gly Leu Gln Leu Gly Phe Lys Val Ser Ala Lys Gly Ile185 190 195gtg gcc tta gcc ggt gcg gat ttt gaa gca agt gta aac tat aat tta 859Val Ala Leu Ala Gly Ala Asp Phe Glu Ala Ser Val Asn Tyr Asn Leu200 205 210 215tcc act acc gca act gaa acc aat aca ata tct gat aaa ttt acc gtt 907Ser Thr Thr Ala Thr Glu Thr Asn Thr Ile Ser Asp Lys Phe Thr Val220 225 230cct tca caa gaa gtc aca tta gcg cca gga cat aag gcg atc gta aaa 955Pro Ser Gln Glu Val Thr Leu Ala Pro Gly His Lys Ala Ile Val Lys235 240 245cat agt ttg aag aaa atg gta tac tct gga acg cat gat tta aaa gga1003His Ser Leu Lys Lys Met Val Tyr Ser Gly Thr His Asp Leu Lys Gly250 255 260gat tta aca att act ttt aat gat aag gat tta gtt caa aaa ttt att1051Asp Leu Thr Ile Thr Phe Asn Asp Lys Asp Leu Val Gln Lys Phe Ile265 270 275tat cca aat tat aaa gct att gat tta tct aat att cgt aaa gca atg1099Tyr Pro Asn Tyr Lys Ala Ile Asp Leu Ser Asn Ile Arg Lys Ala Met280 285 290 295
aca gaa att gat gaa tgg aat cat gta aaa cct acc gat ttc tat caa 1147Thr Glu Ile Asp Glu Trp Asn His Val Lys Pro Thr Asp Phe Tyr Gln300 305 310tta gtt ggg aat aaa aat tat ata aaa aac ggg gac act tta tac atc 1195Leu Val Gly Asn Lys Asn Tyr Ile Lys Asn Gly Asp Thr Leu Tyr Ile315 320 325gaa aca cct gct aaa ttc act ttg aat gga ggc aac cct tat tat aca 1243Glu Thr Pro Ala Lys Phe Thr Leu Asn Gly Gly Asn Pro Tyr Tyr Thr330 335 340gca acc ttt acg gaa tat gat gaa aat gga aat caa gtc aaa aca aag 1291Ala Thr Phe Thr Glu Tyr Asp Glu Asn Gly Asn Gln Val Lys Thr Lys345 350 355cgt tta aat aac aaa taagttactt aaaggtaatt cattaacaat gtatccatta 1346Arg Leu Asn Asn Lys360tataattaat ttataaaaat aatgttttaa aa 1378<210>10<211>364<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>10Met Lys Tyr Lys Ser Ser Lys Val Ala Met Cys Thr Leu Ser Ala Leu1 5 10 15Met Leu Ser Thr Ile Ala Thr Pro Ser Ile Ser Val Phe Ala Ala Glu20 25 30Thr Thr Ser Ser His Ala Val Thr Asn Gln Gln Thr Ile Thr Gln Arg
35 40 45Ala Glu Ser Tyr Ile Asp Ile Val His Asn Arg Met Lys Gln Arg Asp50 55 60Ile Glu Ser Lys Met Thr Gly Lys Ser Ile Asn Met Gln Glu Gln Ile65 70 75 80Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95Asn Ser His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Leu100 105 110Ala Ser Pro Gly Gly Tyr Asp Ser Ile Ala Glu Gln Met Gly Leu Lys115 120 125Val Ala Ala Leu Asn Asp Met Asp Ile Ser Asn Val Asn Tyr Thr Ser130 135 140Lys Thr Gly Asp Thr Ile Tyr Asn Gly Val Ser Glu Leu Lys Asn Ile145 150 155 160Thr Gly Thr Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175Thr Lys Ser Gln Ser Thr Ser Ile Thr Asn Gly Leu Gln Leu Gly Phe180 185 190Lys Val Ser Ala Lys Gly Ile Val Ala Leu Ala Gly Ala Asp Phe Glu195 200 205Ala Ser Val Asn Tyr Asn Leu Ser Thr Thr Ala Thr Glu Thr Asn Thr
210 215 220Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Ala Pro225 230 235 240Gly His Lys Ala Ile Val Lys His Ser Leu Lys Lys Met Val Tyr Ser245 250 255Gly Thr His Asp Leu Lys Gly Asp Leu Thr Ile Thr Phe Asn Asp Lys260 265 270Asp Leu Val Gln Lys Phe Ile Tyr Pro Asn Tyr Lys Ala Ile Asp Leu275 280 285Ser Asn Ile Arg Lys Ala Met Thr Glu Ile Asp Glu Trp Asn His Val290 295 300Lys Pro Thr Asp Phe Tyr Gln Leu Val Gly Asn Lys Asn Tyr Ile Lys305 310 315 320Asn Gly Asp Thr Leu Tyr Ile Glu Thr Pro Ala Lys Phe Thr Leu Asn325 330 335Gly Gly Asn Pro Tyr Tyr Thr Ala Thr Phe Thr Glu Tyr Asp Glu Asn340 345 350Gly Asn Gln Val Lys Thr Lys Arg Leu Asn Asn Lys355 360<210>11<211>21<212>DNA
<213>人工序列<220>
<223>探针序列，或与SEQ ID NO 12所示引物一起使用的扩增引物序列，其与SEQ ID NO 3所示438-458的CDS相对应，偏向于第三位含有A或T的芽孢杆菌种基因中优选的密码子<400>11aataataatc atcaaacwaa t 21<210>12<211>21<212>DNA<213>人工序列<220>
<223>探针序列，或与SEQ ID NO 11所示引物一起使用的扩增引物序列，其与SEQ ID NO 3所示978-998位核苷酸相对应，偏向于第三位含有A或T的芽孢杆菌种基因中优选的密码子<400>12attwggataw ataaattttt g 21<210>13<211>1101<212>DNA<213>人工序列<220>
<223>优选用于单子叶植物中编码Bt TIC901氨基酸序列变异体的编码序列<220>
<221>CDS<222>(1)..(1101)<223>
<400>13atg aag aac cgc ttc agc aag gtc gcc ctc tgc acg gtg cct atc ctc 48Met Lys Asn Arg Phe Ser Lys Val Ala Leu Cys Thr Val Pro Ile Leu1 5 10 15atg gtt tct acg ttc gcg tcc agc tcg atg tcc gcg ttc gca gcg gag 96Met Val Ser Thr Phe Ala Ser Ser Ser Met Ser Ala Phe Ala Ala Glu20 25 30gcc aaa agt cct gac ttg aac gtg tcc caa cag gtc ata ggc cct tac 144Ala Lys Ser Pro Asp Leu Asn Val Ser Gln Gln Val Ile Gly Pro Tyr35 40 45gca gaa tct tac atc gac atc gtc cag gac aga atg aag cag aga gac 192Ala Glu Ser Tyr Ile Asp Ile Val Gln Asp Arg Met Lys Gln Arg Asp50 55 60aaa gga tcc aaa ctc act ggc aaa ccc atc aac atg caagag cag atc 240Lys Gly Ser Lys Leu Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80atc gat ggg tgg ttt ctc gca cga ttc tgg att ttc aag gat cag aac 288Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95aat aac cac cag aca aac agg ttc atc tca tgg ttt aag gat aac atc 336Asn Asn His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Ile100 105 110gcc tca tct aag gga tac aac tca ata gcc gaa cag atg ggc ctc aaa 384Ala Ser Ser Lys Gly Tyr Asn Ser Ile Ala Glu Gln Met Gly Leu Lys
115 120 125atc gaa gca gag aat gat atg gac gtg aca aat atc gac tac act agt 432Ile Glu Ala Glu Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser130 135 140aag acc gga gac aca atc tac aac ggc att tcg gaa ctt aaa aac tat 480Lys Thr Gly Asp Thr Ile Tyr Asn Gly Ile Ser Glu Leu Lys Asn Tyr145 150 155 160acg ggc agc acc cag aaa atg aag acc gat agc ttt caa agg gac tac 528Thr Gly Ser Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175aca aaa tcc gag tcg acc tcc gtg acc aat ggc ctc cag ctg ggc ttc 576Thr Lys Ser Glu Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe180 185 190aag gtg gca gca aag ggc gtc gtc gct tta gcc ggc gca gac ttc gag 624Lys Val Ala Ala Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu195 200 205act tcg gtg acc tac aat ctg tct aca act acg act gag acg aac aca 672Thr Ser Val Thr Tyr Asn Leu Ser Thr Thr Thr Thr Glu Thr Asn Thr210 215 220att tcc gac aag ttt acg gtt ccg tct cag gag gtt acg ttc cct cca 720Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Phe Pro Pro225 230 235 240ggc cac aag gca atc gtc aag cac gac ctg agg aaa atg gtc tac agc 768Gly His Lys Ala Ile Val Lys His Asp Leu Arg Lys Met Val Tyr Ser245 250 255ggc acc cat gat ctc aaa ggc gac ctc atc gtg tcg ttc aac gac aag 816Gly Thr His Asp Leu Lys Gly Asp Leu Ile Val Ser Phe Asn Asp Lys260 265 270gag ata gtc cag aag ttc atc tac cca aat tac cgc gac atc aac ctc 864Glu Ile Val Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Asp Ile Asn Leu275 280 285agt gac atc cga gag acc atg atc gag atc gac gag tgg aac cac gtg 912Ser Asp Ile Arg Glu Thr Met Ile Glu Ile Asp Glu Trp Asn His Val
290 295 300aac cct gtc aat ttc tac gaa ctc gta gga gtt aag aac cac atc aag 960Asn Pro Val Asn Phe Tyr Glu Leu Val Gly Val Lys Asn His Ile Lys305 310 315 320aac ggt gaa aca ttg tac atc gac acg ccg gct aag ttc atg ttc aac 1008Asn Gly Glu Thr Leu Tyr Ile Asp Thr Pro Ala Lys Phe Met Phe Asn325 330 335gga gcg aat cct tac tat cga gct acc ttc acg gag tac gat ggc aac 1056Gly Ala Asn Pro Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Gly Asn340 345 350aac aat cct gtt cag acc aag gtg ttg agt gag aat ttc aag ctg 1101Asn Asn Pro Val Gln Thr Lys Val Leu Ser Glu Asn Phe Lys Leu355 360 365<210>14<211>367<212>PRT<213>人工序列<220>
<223>优选用于单子叶植物中编码Bt TIC901氨基酸序列变异体的编码序列<400>14Met Lys Asn Arg Phe Ser Lys Val Ala Leu Cys Thr Val Pro Ile Leu1 5 10 15Met Val Ser Thr Phe Ala Ser Ser Ser Met Ser Ala Phe Ala Ala Glu20 25 30Ala Lys Ser Pro Asp Leu Asn Val Ser Gln Gln Val Ile Gly Pro Tyr
35 40 45Ala Glu Ser Tyr Ile Asp Ile Val Gln Asp Arg Met Lys Gln Arg Asp50 55 60Lys Gly Ser Lys Leu Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95Asn Asn His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Ile100 105 110Ala Ser Ser Lys Gly Tyr Asn Ser Ile Ala Glu Gln Met Gly Leu Lys115 120 125Ile Glu Ala Glu Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser130 135 140Lys Thr Gly Asp Thr Ile Tyr Asn Gly Ile Ser Glu Leu Lys Asn Tyr145 150 155 160Thr Gly Ser Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175Thr Lys Ser Glu Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe180 185 190Lys Val Ala Ala Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu195 200 205Thr Ser Val Thr Tyr Asn Leu Ser Thr Thr Thr Thr Glu Thr Asn Thr
210 215 220Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Phe Pro Pro225 230 235 240Gly His Lys Ala Ile Val Lys His Asp Leu Arg Lys Met Val Tyr Ser245 250 255Gly Thr His Asp Leu Lys Gly Asp Leu Ile Val Ser Phe Asn Asp Lys260 265 270Glu Ile Val Gln Lys Phe Ile Tyr Pro Asn Tyr Arg Asp Ile Asn Leu275 280 285Ser Asp Ile Arg Glu Thr Met Ile Glu Ile Asp Glu Trp Asn His Val290 295 300Asn Pro Val Asn Phe Tyr Glu Leu Val Gly Val Lys Asn His Ile Lys305 310 315 320Asn Gly Glu Thr Leu Tyr Ile Asp Thr Pro Ala Lys Phe Met Phe Asn325 330 335Gly Ala Asn Pro Tyr Tyr Arg Ala Thr Phe Thr Glu Tyr Asp Gly Asn340 345 350Asn Asn Pro Val Gln Thr Lys Val Leu Ser Glu Asn Phe Lys Leu355 360 365<210>15<211>23<212>DNA
<213>人工序列<220>
<223>在热扩增反应中与prJPW152 SEQ ID NO 16偶合的寡核苷酸引物<400>15cctttggcag aaactttaac tcc23<210>16<211>21<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW151 SEQ ID NO 15偶合的寡核苷酸引物<400>16gtgtattctg gtacgcatga c 21<210>17<211>34<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW183 SEQ ID NO 18偶合的寡核苷酸引物
<400>17gccggatccc tagctgaata tgcagtagat aatg34<210>18<211>25<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW186 SEQ ID NO 17偶合的寡核苷酸引物<400>18gtggcacgtt tataggccat tgttc 25<210>19<211>23<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW156 SEQ ID NO 20偶合的寡核苷酸引物<400>19cttttaggcc catctgttca gcg23<210>20<211>26
<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW155 SEQ ID NO 19偶合的寡核苷酸引物<400>20gccttagccg gtgcggattt tgaagc 26<210>21<211>44<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW170 SEQ ID NO 22偶合的寡核苷酸引物<400>21ggagcttatt tgttatttaa acgctttgtt ttgacttgat ttcc 44<210>22<211>39<212>DNA<213>人工序列<220>
<223>在热扩增反应中与prJPW168 SEQ ID NO 21偶合的寡核苷酸引物<400>22gccggatccc agtggatagg aatttgtttt cgtgctagg 39<210>23<211>26<212>DNA<213>人工序列<220>
<223>与SEQ ID NO24和SEQ ID NO25类似的通用正向扩增引物，当与SEQ ID NOSEQ IDNO27-29中任一个以及同源于tic901、1201、407、417或431等的模板DNA一起使用时产生约600-650bp的扩增子<400>23aayatgcarg arcarathat hgaygg 26<210>24<211>23<212>DNA<213>人工序列<220>
<223>与SEQ ID NO23和SEQ ID NO25类似的通用正向扩增引物，当与SEQ ID NOSEQ IDNO27-29中任一个以及同源于tic901、1201、407、417或431等的模板DNA一起使用时产生约600-650bp的扩增子<400>24
aayatgcarg arcarathat hga23<210>25<211>20<212>DNA<213>人工序列<220>
<223>与SEQ ID NO23和SEQ ID NO24类似的通用正向扩增引物，当与SEQ ID NOSEQ IDNO27-29中任一个以及同源于tic901、1201、407、417或431等的模板DNA一起使用时产生约600-650bp的扩增子<400>25aayatgcarg arcarathat20<210>26<211>20<212>DNA<213>人工序列<220>
<223>通用正向扩增引物，当与SEQ ID NOSEQ ID NO27-29中任一个以及同源于tic901、1201、407、417或431等的模板DNA一起使用时产生约395-425bp的扩增子<220>
<221>misc_feature<222>(3)..(3)
<223>肌苷<220>
<221>misc_feature<222>(9)..(9)<223>肌苷<400>26ggngayacna thtayaaygg20<210>27<211>26<212>DNA<213>人工序列<220>
<223>与SEQ ID NO28和SEQ ID NO29类似的通用反向扩增引物<220>
<221>misc_feature<222>(6)..(6)<223>肌苷<220>
<221>misc_feature<222>(24)..(24)<223>肌苷<400>27tarttnggrt adatraaytt ytgnac 26<210>28<211>23<212>DNA<213>人工序列<220>
<223>与SEQ ID NO27和SEQ ID NO29类似的通用反向扩增引物<220>
<221>misc_feature<222>(6)..(6)<223>肌苷<400>28tarttnggrt adatraaytt ytg23<210>29<211>20
<212>DNA<213>人工序列<220>
<223>与SEQ ID NO27和SEQ ID NO28类似的通用反向扩增引物<220>
<221>misc_feature<222>(18)..(18)<223>肌苷<400>29ggrtadatra ayttytgnac20<210>30<211>570<212>DNA<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220>
<221>CDS<222>(1)..(570)<223>
<400>30ttt tta gct aga ttt tgg ata ttt gag gat caa aat aat agt cac caa 48Phe Leu Ala Arg Phe Trp Ile Phe Glu Asp Gln Asn Asn Ser His Gln1 5 10 15aca aat aga ttt att tca tgg ttt aag gat aat att gct agt tca aaa 96Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Ile Ala Ser Ser Lys20 25 30ggg tat aat agt att gcg gag caa atg ggt tta aaa ata gaa gca gaa 144Gly Tyr Asn Ser Ile Ala Glu Gln Met Gly Leu Lys Ile Glu Ala Glu35 40 45aac gat atg gat gta aca aat ata gat tat aca tct aag aca ggc gat 192Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser Lys Thr Gly Asp50 55 60acc att tat aat ggt att tca gaa ttg aaa aat tat aca gga tca act 240Thr Ile Tyr Asn Gly Ile Ser Glu Leu Lys Asn Tyr Thr Gly Ser Thr65 70 75 80caa aag atg aaa aca gat agt ttt caa aga gat tat aca aaa tca gaa 288Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr Thr Lys Ser Glu85 90 95tct act tca gta act aat gga tta caa tta gga ttt aaa gtt gct gct 336Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe Lys Val Ala Ala100 105 110aaa gga gta gtt gct ttg gct ggg gca gac ttt gaa acc agt gtt act 384Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu Thr Ser Val Thr115 120 125tat aat cta tca act act aca act gaa aca aat aca ata tca gac aag 432Tyr Asn Leu Ser Thr Thr Thr Thr Glu Thr Asn Thr Ile Ser Asp Lys130 135 140ttt act gtc cca tct caa gaa gtt aca ttg cct cca gga cat aaa gcg 480Phe Thr Val Pro Ser Gln Glu Val Thr Leu Pro Pro Gly His Lys Ala145 150 155 160ata gtg aaa cat gat tta aga aaa atg gtt tat tct ggt act cat gat 528Ile Val Lys His Asp Leu Arg Lys Met Val Tyr Ser Gly Thr His Asp165 170 175
cta aag ggt gat tta att gtg agt ttt aat gat aaa gag att 570Leu Lys Gly Asp Leu Ile Val Ser Phe Asn Asp Lys Glu Ile180 185 190<210>31<211>190<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>31Phe Leu Ala Arg Phe Trp Ile Phe Glu Asp Gln Asn Asn Ser His Gln1 5 10 15Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Ile Ala Ser Ser Lys20 25 30Gly Tyr Asn Ser Ile Ala Glu Gln Met Gly Leu Lys Ile Glu Ala Glu35 40 45Asn Asp Met Asp Val Thr Asn Ile Asp Tyr Thr Ser Lys Thr Gly Asp50 55 60Thr Ile Tyr Asn Gly Ile Ser Glu Leu Lys Asn Tyr Thr Gly Ser Thr65 70 75 80Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr Thr Lys Ser Glu85 90 95Ser Thr Ser Val Thr Asn Gly Leu Gln Leu Gly Phe Lys Val Ala Ala100 105 110
Lys Gly Val Val Ala Leu Ala Gly Ala Asp Phe Glu Thr Ser Val Thr115 120 125Tyr Asn Leu Ser Thr Thr Thr Thr Glu Thr Asn Thr Ile Ser Asp Lys130 135 140Phe Thr Val Pro Ser Gln Glu Val Thr Leu Pro Pro Gly His Lys Ala145 150 155 160Ile Val Lys His Asp Leu Arg Lys Met Val Tyr Ser Gly Thr His Asp165 170 175Leu Lys Gly Asp Leu Ile Val Ser Phe Asn Asp Lys Glu Ile180 185 190<210>32<211>1095<212>DNA<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220>
<221>CDS<222>(1)..(1092)<223>编码TIC431前体氨基酸序列的序列<400>32atg aaa tac aag tct tca aaa gta gca atg tgt aca tta tcg gct tta 48
Met Lys Tyr Lys Ser Ser Lys Val Ala Met Cys Thr Leu Ser Ala Leu1 5 10 15atg ctt tcg aca atc gcc act cca agt ata tct gtt ttc gct gct gaa 96Met Leu Ser Thr Ile Ala Thr Pro Ser Ile Ser Val Phe Ala Ala Glu20 25 30aca act gca tca cat aag gtt act aat cag caa aca att gca cag cgt 144Thr Thr Ala Ser His Lys Val Thr Asn Gln Gln Thr Ile Ala Gln Arg35 40 45gca gaa tct tat atc gat att gtg cat aat aga atg aaa aaa cga gat 192Ala Glu Ser Tyr Ile Asp Ile Val His Asn Arg Met Lys Lys Arg Asp50 55 60att gaa tca aaa atg aca ggt aaa cct att aat atg caa gaa caa ata 240Ile Glu Ser Lys Met Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80att gat gga tgg ttt tta gct aga ttt tgg ata ttc aag gac caa aat 288Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95aat agt cae caa aca aat aga ttt att tca tgg ttt aaa gat aat tta 336Asn Ser His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Leu100 105 110gct agt cea gga ggg tat aat agt atc gct aaa caa atg ggg tta aaa 384Ala Ser Pro Gly Gly Tyr Asn Ser Ile Ala Lys Gln Met Gly Leu Lys115 120 125ata gaa gta tta aat gat atg gat ata tca aat gta aat tat act tct 432Ile Glu Val Leu Asn Asp Met Asp Ile Ser Asn Val Asn Tyr Thr Ser130 135 140aag aca ggg gat act ata tat aat ggt gtt tcc gaa tta aaa aat atc 480Lys Thr Gly Asp Thr Ile Tyr Asn Gly Val Ser Glu Leu Lys Asn Ile145 150 155 160aca ggt aca act caa aaa atg aaa aca gat agt ttt caa aga gat tat 528Thr Gly Thr Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175aea aaa tca cag tca act tca atc acc aat gga tta caa tta gga ttt 576
Thr Lys Ser Gln Ser Thr Ser Ile Thr Asn Gly Leu Gln Leu Gly Phe180 185 190aaa gtt tct gcc aaa ggg gtg ata gct tta gca gga gca gac ttc gaa 624Lys Val Ser Ala Lys Gly Val Ile Ala Leu Ala Gly Ala Asp Phe Glu195 200 205gca agt gtc aac tat aat tta tcc act acc gca act gaa acc aat ata 672Ala Ser Val Asn Tyr Asn Leu Ser Thr Thr Ala Thr Glu Thr Asn Ile210 215 220ata tct gat aaa ttt acc gtt cct tca caa gaa gtt aca tta gcg cca 720Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Ala Pro225 230 235 240gga cat aag gcg atc gta aaa cat agt tta aag aaa atg gta tac tcc 768Gly His Lys Ala Ile Val Lys His Ser Leu Lys Lys Met Val Tyr Ser245 250 255gga acg cat gat tta aaa gga gat tta aca att act ttt aat gat aag 816Gly Thr His Asp Leu Lys Gly Asp Leu Thr Ile Thr Phe Asn Asp Lys260 265 270gat tta gtt caa aaa ttt att tat cca aat tat aaa gct att gat tta 864Asp Leu Val Gln Lys Phe Ile Tyr Pro Asn Tyr Lys Ala Ile Asp Leu275 280 285tct aat att cgt aaa gca ctg act gaa att gat gaa tgg aat cat gta 912Ser Asn Ile Arg Lys Ala Leu Thr Glu Ile Asp Glu Trp Asn His Val290 295 300aaa cct acc gat ttc tat caa tta gtt ggg aac aaa aat tat ata aaa 960Lys Pro Thr Asp Phe Tyr Gln Leu Val Gly Asn Lys Asn Tyr Ile Lys305 310 315 320aac ggg gac act tta tac atc gaa aca cct gct aaa ttc act ttg aat 1008Asn Gly Asp Thr Leu Tyr Ile Glu Thr Pro Ala Lys Phe Thr Leu Asn325 330 335gga gga aac cct tat tat aca gca acc ttt acg gaa tat gat gaa agt 1056Gly Gly Asn Pro Tyr Tyr Thr Ala Thr Phe Thr Glu Tyr Asp Glu Ser340 345 350gga aat caa gtc aaa aca aag cat tta agt gtc aaa taa 1095
Gly Asn Gln Val Lys Thr Lys His Leu Ser Val Lys355 360<210>33<211>364<212>PRT<213>苏云金芽孢杆菌(Bacillus thuringiensis)<400>33Met Lys Tyr Lys Ser Ser Lys Val Ala Met Cys Thr Leu Ser Ala Leu1 5 10 15Met Leu Ser Thr Ile Ala Thr Pro Ser Ile Ser Val Phe Ala Ala Glu20 25 30Thr Thr Ala Ser His Lys Val Thr Asn Gln Gln Thr Ile Ala Gln Arg35 40 45Ala Glu Ser Tyr Ile Asp Ile Val His Asn Arg Met Lys Lys Arg Asp50 55 60Ile Glu Ser Lys Met Thr Gly Lys Pro Ile Asn Met Gln Glu Gln Ile65 70 75 80Ile Asp Gly Trp Phe Leu Ala Arg Phe Trp Ile Phe Lys Asp Gln Asn85 90 95Asn Ser His Gln Thr Asn Arg Phe Ile Ser Trp Phe Lys Asp Asn Leu100 105 110
Ala Ser Pro Gly Gly Tyr Asn Ser Ile Ala Lys Gln Met Gly Leu Lys115 120 125Ile Glu Val Leu Asn Asp Met Asp Ile Ser Asn Val Asn Tyr Thr Ser130 135 140Lys Thr Gly Asp Thr Ile Tyr Asn Gly Val Ser Glu Leu Lys Asn Ile145 150 155 160Thr Gly Thr Thr Gln Lys Met Lys Thr Asp Ser Phe Gln Arg Asp Tyr165 170 175Thr Lys Ser Gln Ser Thr Ser Ile Thr Asn Gly Leu Gln Leu Gly Phe180 185 190Lys Val Ser Ala Lys Gly Val Ile Ala Leu Ala Gly Ala Asp Phe Glu195 200 205Ala Ser Val Asn Tyr Asn Leu Ser Thr Thr Ala Thr Glu Thr Asn Ile210 215 220Ile Ser Asp Lys Phe Thr Val Pro Ser Gln Glu Val Thr Leu Ala Pro225 230 235 240Gly His Lys Ala Ile Val Lys His Ser Leu Lys Lys Met Val Tyr Ser245 250 255Gly Thr His Asp Leu Lys Gly Asp Leu Thr Ile Thr Phe Asn Asp Lys260 265 270Asp Leu Val Gln Lys Phe Ile Tyr Pro Asn Tyr Lys Ala Ile Asp Leu275 280 285
Ser Asn Ile Arg Lys Ala Leu Thr Glu Ile Asp Glu Trp Asn His Val290 295 300Lys Pro Thr Asp Phe Tyr Gln Leu Val Gly Asn Lys Asn Tyr Ile Lys305 310 315 320Asn Gly Asp Thr Leu Tyr Ile Glu Thr Pro Ala Lys Phe Thr Leu Asn325 330 335Gly Gly Asn Pro Tyr Tyr Thr Ala Thr Phe Thr Glu Tyr Asp Glu Ser340 345 350Gly Asn Gln Val Lys Thr Lys His Leu Ser Val Lys355 360
权利要求
1.一种分离的多核苷酸，所述多核苷酸编码苏云金芽孢杆菌杀虫毒素或其杀虫片段，并且在选自严格杂交条件和特异杂交条件的杂交条件下与一个或多个选自SEQ ID NO2、SEQ ID NO3(tic901)、SEQ ID NO5(tic1201)、SEQ ID NO7(tic407)、SEQ ID NO9(tic417)、SEQ ID NO11、SEQ ID NO12、SEQ ID NO15、SEQ IDNO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ IDNO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ IDNO28、SEQ ID NO29、SEQ ID NO30及SEQ ID NO32的核苷酸序列或其互补序列杂交。
2.权利要求1的分离的多核苷酸，其中所述毒素对鞘翅目害虫有效。
3.权利要求2的分离的多核苷酸，其中所述鞘翅目害虫选自玉米根叶甲和马铃薯甲虫。
4.权利要求3的多核苷酸，其中所述玉米根叶甲选自西部玉米根叶甲、南部玉米根叶甲或北部玉米根叶甲。
5.权利要求1的多核苷酸，其中所述核苷酸序列是SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9和SEQ ID NO32。
6.一种多核苷酸，所述多核苷酸包含编码约34-39kDa对鞘翅目害虫有效的毒素的核苷酸序列，其中所述核苷酸序列已经进行了优化以在植物中表达，且其中所述毒素包含的氨基酸序列选自SEQID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO31和SEQ ID NO33。
7.一种宿主细胞，所述宿主细胞经转化含有编码杀虫蛋白或其杀虫片段的多核苷酸，其中所述多核苷酸包含的核苷酸序列如选自SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO13、SEQ ID NO30和SEQID NO32的序列所示。
8.权利要求7的宿主细胞，其中所述宿主细胞是植物细胞。
9.一种重组细菌，所述重组细菌包含编码杀虫蛋白的分离的多核苷酸，其中所述蛋白包含选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO31和SEQ ID NO33的氨基酸序列。
10.一种控制鞘翅目害虫的方法，所述方法包括用杀虫量的约34-39kDa苏云金芽孢杆菌毒素蛋白或其杀虫片段接触所述害虫，其中所述毒素蛋白选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO31和SEQ ID NO33。
11.一种控制鞘翅目害虫的方法，所述方法包括用杀虫量的约34-39kDa苏云金芽孢杆菌毒素蛋白或其杀虫片段接触所述害虫，其中所述毒素蛋白由核苷酸序列编码，该核苷酸序列为包含选自SEQ IDNO2、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO30和SEQ ID NO32的至少18个连续核苷酸的核苷酸序列或该核苷酸序列在严格杂交条件下与包含所选的至少18个连续核苷酸的核苷酸序列杂交。
12.一种从苏云金芽孢杆菌分离得来的杀虫蛋白，所述杀虫蛋白约34-39kDa并由核苷酸序列编码，该核苷酸序列为包含选自SEQID NO2、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO30和SEQ ID NO32的至少18个连续核苷酸的核苷酸序列或该核苷酸序列在严格杂交条件下与包含所选的至少18个连续核苷酸的核苷酸序列杂交。
13.一种从苏云金芽孢杆菌得来的分离的杀虫蛋白，所述杀虫蛋白约34-39kDa并由核苷酸序列编码，该核苷酸序列为包含选自SEQID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11和SEQ ID NO32的至少18个连续核苷酸的核苷酸序列或该核苷酸序列在严格杂交条件下与包含所选的至少18个连续核苷酸的核苷酸序列杂交，且其中所述苏云金芽孢杆菌选自EG2158、EG6489、EG6561、EG3618、EG6555、EG6618、86833和EG4653。
14.一种检测编码杀虫蛋白的第一核苷酸序列的方法，其中所述第一核苷酸序列在严格杂交条件下与选自EQ ID NO2、SEQ IDNO3(tic901)、SEQ ID NO5(tic 1201)、SEQ ID NO7(tic 407)、SEQID NO9(tic 417)、SEQ ID NO11、SEQ ID NO12、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29、SEQ ID NO30和SEQ ID NO32(tic 431)的第二核苷酸序列或其互补序列杂交。
15.一种核苷酸序列，所述核苷酸序列编码杀虫蛋白或其杀虫片段或同源物，其中所述杀虫蛋白或其杀虫片段或同源物选自SEQ IDNO1、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO31和SEQ ID NO33。
16.一种检测编码杀虫蛋白的第一核苷酸序列的方法，所述方法包括步骤(a)根据样品中包含所述第一核苷酸序列的模板，用包含SEQ ID NO13和SEQ ID NO14所示序列的扩增引物产生扩增子；(b)分离并纯化扩增子；(c)分离并纯化完整的第一核苷酸序列，该序列基于分离并纯化的扩增子序列编码所述杀虫蛋白；(d)根据所述第一核苷酸序列在宿主细胞中表达所述杀虫蛋白，其中所述第一核苷酸序列在严格杂交条件下与选自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO30和SEQ ID NO32的第二核苷酸序列或其互补序列杂交。
17.权利要求16的方法，其中所述宿主细胞选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞。
18.权利要求17的方法，其中所述宿主细胞是植物细胞，选自单子叶植物细胞和双子叶植物细胞。
19.权利要求18的方法，其中所述单子叶植物细胞选自玉米植物细胞、小麦植物细胞、稻植物细胞、燕麦植物细胞、洋葱植物细胞和草植物细胞。
20.权利要求18的方法，其中所述双子叶植物细胞选自棉花植物细胞、油菜植物细胞、大豆植物细胞、果树植物细胞、秋葵植物细胞、胡椒植物细胞、观赏植物细胞、向日葵植物细胞、葫芦植物细胞和瓜植物细胞。
21.一种分离的核酸分子，所述核酸分子包含编码毒素蛋白的多核苷酸序列，其中所述毒素蛋白含有的序列与选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQID NO31和SEQ ID NO33的氨基酸序列的核苷酸序列或对鞘翅目有效的变异体或其部分显示至少约70％的序列同一性。
22.一种分离的核酸分子，所述核酸分子包含编码对鞘翅目害虫有毒蛋白的多核苷酸序列，其中所述多核苷酸序列在严格杂交条件下与选自SEQ ID NO2、SEQ ID NO3(tic901)、SEQ ID NO5(tic1201)、SEQ ID NO7(tic 407)、SEQ ID NO9(tic 417)、SEQ ID NO11、SEQ ID NO12、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24、SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO29、SEQ ID NO30和SEQ ID NO32(tic 431)的核酸序列或其互补序列杂交。
23.权利要求1或5的分离的核酸，其中所述多核苷酸序列分离自细菌。
24.权利要求6的分离的核酸，其中所述多核苷酸序列分离自苏云金芽孢杆菌。
25.一种基本纯化的毒素蛋白，其中所述毒素蛋白包含的序列与选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO31和SEQ ID NO33的氨基酸序列有至少约70％的序列同一性。
26.权利要求25的基本纯化的毒素蛋白，其中所述毒素蛋白包含SEQ ID NO4。
27.一种重组DNA构建体，所述构建体包含编码杀虫蛋白的多核苷酸序列，其中所述多核苷酸序列与SEQ ID NO13有至少约70％同一性，所述杀虫蛋白选自SEQ ID NO4、SEQ ID NO6、SEQ IDNO6、SEQ IDNO10、SEQ ID NO31和SEQ ID NO33所示蛋白的全部或其杀虫片段。
28.权利要求27的重组DNA构建体，其中所述多核苷酸序列如SEQ ID NO3所示。
29.权利要求28的重组DNA构建体，所述构建体还包含操作性连接到所述多核苷酸序列的启动子或部分启动子区域。
30.权利要求29的重组DNA构建体，其中所述启动子是组成型启动子、诱导型启动子或组织特异型启动子。
31.权利要求30的重组DNA构建体，其中所述启动子是花椰菜花叶病毒(CaMV)35S启动子。
32.权利要求31的重组DNA构建体，所述构建体还包含内含子。
33.权利要求32的重组DNA构建体，其中所述内含子是hsp70内含子。
34.权利要求33的重组DNA构建体，所述构建体还包含操作性连接的3’非翻译区域。
35.一种重组宿主细胞，所述重组宿主细胞用权利要求1或27的编码杀虫蛋白的多核苷酸序列转化得到，其中所述重组宿主细胞表达的所述蛋白在氨基酸序列上与选自SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQID NO31和SEQ ID NO33的杀虫蛋白有至少约70％相似性。
36.权利要求35的重组宿主细胞，其中所述重组宿主细胞是植物细胞。
37.一种在植物细胞中表达杀虫蛋白的方法，所述方法包括步骤(a)将核酸序列插入植物细胞基因组，所述核酸序列包含(i)启动子，所述启动子在所述植物细胞中发挥功能并操作性连接到，(ii)结构DNA，所述结构DNA编码选自SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQID NO31、SEQ ID NO33的蛋白，以及与所选蛋白有至少约70％相似性的杀虫蛋白，和(iii)3’非翻译DNA序列，所述序列在植物细胞中发挥功能导致转录终止和聚腺苷酸化；(b)获得所述经转化含有步骤(a)的核酸序列的植物细胞；并(c)从转化的植物细胞再生遗传上转化的表达杀虫量的所述杀虫蛋白的植株。
38.权利要求37的转化植株产生的种子。
39.权利要求38的种子生长的植株。
40.一种生物样品，所述生物样品从植物、组织或种子得来，其中所述样品包含编码选自SEQ ID NO4、SEQ ID NO6、SEQ IDNO8、SEQID NO10、SEQ ID NO31和SEQ ID NO33的杀虫蛋白的核苷酸序列。
41.权利要求40的生物样品，所述生物样品包含编码所述蛋白的转基因植物的植株、组织或种子。
42.权利要求41的生物样品，其中所述样品选自从转基因植物获得的提取物，并且其中所述提取物包含编码选自SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQID NO10、SEQ ID NO31和SEQ ID NO33的蛋白的杀虫片段的核苷酸序列。
43.权利要求42的生物样品，其中所述样品选自玉米面粉、玉米粗粉、玉米糖浆、玉米油、玉米淀粉和以其整体或部分经加工含有玉米副产品的谷类。
44.一种提取物，所述提取物从转基因的玉米植株、组织或种子得来，包含编码选自SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQID NO10、SEQ ID NO31和SEQ ID NO33蛋白的杀虫片段的核苷酸序列。
45.权利要求44的提取物，其中所述序列可在所述提取物中用核酸扩增或核酸杂交方法检测到。
46.权利要求45的提取物，所述提取物包含表达所述蛋白的转基因玉米植物的植株、组织或种子。
47.权利要求46的提取物，其中所述样品选自玉米面粉、玉米粗粉、玉米糖浆、玉米油、玉米淀粉和以其整体或部分经加工含有玉米副产品的谷类。
全文摘要
本发明涉及从苏云金芽孢杆菌和相关菌株分离和鉴定编码分泌到细胞外空间的新杀虫蛋白的核苷酸序列。蛋白分离自苏云金芽孢杆菌和相关菌株的培养物上清，并表现出抗鞘翅目昆虫包括马铃薯甲虫(Lymantria dispar)和南部玉米根叶甲(瓜十一星叶甲(Diabrotica undecempunctata))的杀虫活性。公开了由与所述分离并鉴定的核苷酸序列杂交的核苷酸序列编码的杀虫蛋白。还公开了制造和使用包含本发明新核苷酸序列的转基因细胞和植物的方法。
文档编号C07K14/32GK1849397SQ200480025352
公开日2006年10月18日申请日期2004年7月6日优先权日2003年7月7日
发明者J·A·鲍姆, J·C·多诺文, W·P·多诺文, J·T·恩格尔曼, K·克拉索米尔－奥斯特费尔德, J·W·皮特金, J·K·罗伯茨申请人:孟山都技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.A.鲍姆;J.C.多诺文;W.P.多诺文;J.T.恩格尔曼;K.克拉索米尔-奥斯特费尔德;J.W.皮特金;J.K.罗伯茨
技术所有人：孟山都技术有限公司
我是此专利的发明人

上一篇：TGF－β基因表达抑制剂的制作方法
上一篇：用于治疗疱疹感染的方法和组合物的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、赵老师：1.电化学离子储存和分离技术 2.工业结晶
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。