西红柿斑点枯萎病毒的制作方法

文档序号:158417阅读:522来源:国知局
专利名称:西红柿斑点枯萎病毒的制作方法
Tospovirus属内的病毒感染许多种植物品种,特别是烟草、花生、蔬菜和观赏植物。人们对Tospovirus属内的二种病毒,即西红柿斑点枯萎病毒(TSWV)和无耐性(impatiens)坏死斑点病毒(INSV)已经了解。
西红柿斑点枯萎病毒(TSWV)是一种独特的植物病毒,其核酸-蛋白质复合体是由脂蛋白外壳所包裹,同时也是唯一的thrip传播病毒。这种病毒最近已被划分为布尼安病毒科中的Tospovirus属。TSWV病毒颗粒含有一个29K核蛋白壳蛋白(“NP”或“N”),二个与膜相连的糖蛋白(58K和78K)和一个推测为病毒转录酶的200K大蛋白[参见J.Gen.Virol.712207(1991);Virol.5612(1973);和J.Gen.Virol.36267(1977)]。该病毒基因组包含三个负链(-)RNAs,命名为L RNA(8900个核苷酸)、M RNA(5400个核苷酸)和S RNA(2900个核苷酸)[参见J.Gen.Virol.3681(1977);J.Gen.Virol.5312(1981);和J.Gen.Virol.703469(1989)],其中每个RNA由NP所包裹。通过对三个TSWV分离株所提取的S RNAs进行部分或全长序列分析,表明一个双义基因排列中存在二个开放阅读框(ORF)[参见J.Gen.Virol.711(1990)和J.Gen.Virol.72461(1991)]。较大的开放阅读框位于病毒RNA链上,能够编码一个52K非结构蛋白,而较小ORF位于病毒互补RNA链,通过一个亚基因组RNA翻译29K NP。
双义编码策略也是TSWV M RNA的特征,在其开放阅读框内,编码58K和78K二个与膜相连的糖蛋白。TSWV L RNA已做测序分析,它能编码一个推测为病毒转录酶的200K大蛋白。
以结构蛋白的血清学分析以及对细胞病变结构的形态学分析为基础,二个TSWV血清型,“L”和“I”已被鉴定并描述了特征[参见J.Gen.Virol.71933(1990)和Phytopathology 81525(1991)]。它们有血清学上保守的G1和G2糖蛋白,但是“I”血清型的NP在血清学明显不同于“L”血清型的NP。通过对“L”和“I”血清型的NP进行比较分析,表明在核苷酸和氨基酸水平上分别有62%和67%的一致性[参见J.Gen.Virol.722597(1991)]。
TSWV具有广泛的寄主范围,感染50科中的360多种植物,并导致世界范围内蔬菜和观赏植物的重大经济损失。“L”血清型已广泛发现于大田作物,如蔬菜和杂草,而“I”血清型大多只局限于观赏作物。最近,一种葫芦分离株已被鉴定[参见Plant Disease 681006(1984)]为一种独特的分离株,因为它能系统地感染西瓜和其它葫芦科植物。其NP与两种中任一种血清型的NP在血清学上是不相关的。尽管TSWV病害的传播有时可以通过选育抗性植物或通过使用非遗传学方法来减少,但是,要想通过传统方法来完全控制这种病毒总的来说已被证明是很困难的[参见Plant Disease 73375(1989)]。
自1986年以来,已有大量报道表明,利用病毒外壳蛋白(CP)基因所获得的转基因植物通常能抗该病毒的感染。这种现象常常被称之为外壳蛋白介导保护(CPMP)。保护水平从延缓病症表现至无病症和病毒累积。最近,二例报道[参见Biol.Technology 91363(1991)和Mol.Plant-Microbe Interact.534(1992)]分别表现能表达TSWV的核蛋白壳蛋白(NP)基因的转基因烟草植物能抗同源病毒分离株的感染。不过,由于TSWV具有许多生物多样性分离株,所以,测试转基因植物抗不同的TSWV分离株感染的效果是十分重要的。根据本发明,转基因植物表明能抗“L”血清型的二个异源分离株和“I”血清型的一个分离株,这标志着本发明的的研究结果在以前的报道的基础上有所拓展。我们的结果也表明,对“L”血清型的两个异源分离株的抗性,如果有的话,也主要发现于积累非常低水平NP的植物中,而积累高水平NP的转基因植物能抗“I”血清型的分离株。
不过,尽管积累高水平N蛋白的植物确实表现出延缓病症表达,但是却没有观察到对一种Brazilian分离株的抗性。这种称为TSWV-B的Brazilian分离株具有在血清学上与“L”和“I”血清型明显不同的N蛋白,同时在生物学上又不同于一种葫芦分离株,也就是说TSWV-B不会系统感染甜瓜类或西葫芦。因此,本发明的一方面是通过克隆和测定其S RNA的序列以及与公开的其它TSWV分离株序列进行比较,来描述TSWV-B的特征。
从以下对本发明的详细描述,包括下列实施例、附图和数据,本发明的各种目的将是显而易见的。
在附图中


图1描述了根据本发明从病毒RNA克隆NP基因的策略;
图2描述了根据本发明西红柿斑点枯萎病毒的核蛋白壳蛋白(NP)基因在烟草原生质体中的体内瞬间表达;图3描述了根据本发明已测序的cDNA克隆在TSWV-B S RNA上的位置;图4描述了根据本发明表明TSWV分离株亲缘关系的枝形图(dendogram);图5描述了本文描述过的TSWV分离株的血清学上的亲缘关系;图6描述了转基因植物中核蛋白壳蛋白(NP)积累水平与TSWV分离株的抗性水平的相关性;图7描述了根据本发明的一方面目的导入转基因植物中的TSWV-BL N编码序列;和图8描述了根据本发明的一方面目的,导入植物中的TSWV-BL半N基因片段。
更具体地讲,图2描述了NP基因的瞬间表达,其中利用聚乙二醇(PEG)将构建体导入烟草子叶原生质体中。随后将转化的原生质体培养两天以表达NP基因。然后,从原生质体中提取蛋白质,并利用抗TSWV NP的抗体通过双抗多层酶联免疫吸附分析法(DAS-ELISA)测定NP。NP-和NP+分别代表用质粒pBI525-NP-和pBI525-NP+转化的原生质体。包裹抗体的浓度是5μg/ml,酶连接物稀释为1∶250。加底物后30、60和90分钟记录数据。
在图3中,TSWV-B的一个S RNA图谱下边绘出了5个重叠cDNA克隆。用从被TSWV-B感染过的N.benthamiana植物中分离的双链RNA的随机引物合成这些克隆。
在图4中,利用GCG序列分析软件包装中的聚类(pileup)程序比较序列。水平线与遗传距离成比例,而垂直线是任一长度,并不重要。
更特别的是在图5中,N.benthamiana Domin被TSWV分离株感染[TSWV-BL(一种莴苣分离株),Arkansas,10W pakchoy(TSWV-10W),Begonia和Brazil(TSWV-B)]。一感染的叶盘(0.05g)于12ml的酶连缓冲液中磨碎,然后利用TSWV-BL病毒粒子(BL病毒粒子)或TSWV-BL的NP(BL-NP)或TSWV-I(I-NP)的抗体,通过DAS-ELISA分析之。包裹抗体的浓度为1μg/ml;连接物的稀释对于BL病毒粒子为1∶2000,对于BL-NP为1∶250,而对于I-NP为1∶1000。这些结果是在加底物以后10分钟(BL),50分钟(BL-NP),或30分钟所记录的。
关于图6,利用产生的抗TSWV-BL NP的抗体,通过DAS-ELISA分析了转基因植物的NP累积。加底物后150分钟标明植物,并将转基因植物划分成四类OD405nm不到0.050,OD405nm介于0.050和0.200之间,OD405nm介于0.200和0.400之间以及OD405nm大于0.400。对照NP(-)植物的OD405nm值从0至0.05。用Arkansas(Ark)和10W pakchoy(10W)分离株或Begonia的分离株浸染同种植物,然后于接种后约12天记录每种植物的敏感性。用Arkansas和10W pakchoy的分离株接种51个R1NP(+)植物,以及用Begonia分离株接种139个R1NP(+)植物,然后从中收集结果。线条以上数据代表被测试的R1NP(+)植物的总数。
实施例ITSWV-BL RNAs的分离从Datura stramonium L.中按如下方法纯化TSWV-BL分离株在一个Waring搅拌器中,将感染组织用3体积的缓冲液(0.033MKH2PO4,0.067M K2HPO4,0.01M Na2SO4)磨碎45秒钟。匀浆通过4层被上述缓冲液浸湿的奶酪布过滤,然后于7000rpm离心15分钟。用与原组织等重的0.01M Na2SO3重悬沉淀颗粒,然后再于8000rpm离心15分钟。用原组织重量十分之一的0.01M Na2SO3重悬上清液,然后病毒提取物于9000rpm离心15分钟,再将上清液小心装入10%到40%的蔗糖梯度(用0.01M Na2SO3制作)中。于23000rpm离心35分钟,收集病毒带(弯液面下约3cm处)并用2体积的0.01M Na2SO3稀释,再于27000rpm离心55分钟,收集半纯化的病毒。
实施例IITSWV和病毒RNAs的纯化按照实施例I所描述的方法,从Datura stramonium L.纯化TSWV-BL分离株[参见Plant Disease 74154(1990)]。将纯化的病毒重悬于0.04%皂土、10μg/ml蛋白酶K、0.1M碳酸铵、0.1%(W/V)二乙基二硫代氨基甲酸钠、1mM EDTA和1%(W/V)十二烷基硫酸钠(SDS)的溶液中,于65℃培养5分钟,然后立即用水饱和的苯酚抽提,再用氯仿/异戊醇(24∶1)抽提。最后用2.5体积的乙醇沉淀病毒RNAs并将其溶于重蒸水中。
实施例IIIcDNA和PCR基础上的NP基因克隆依照Gubler和Hoffman[参见Gene 25263(1983)]描述的方法,用随机引物,从纯化的TSWV-BL RNAs中合成第一链cDNA。利用RNase H/DNA聚合酶处理样品生产出第二链cDNA。然后,对所形成的双链cDNA样品利用蔗糖梯度离心进行大小分级、用EcoRI甲基化酶进行甲基化处理、并加上EcoRI接头。cDNA样品经EcoRI酶切消化后,与载体pUC 18的EcoRI位点连接,其5′端磷酸基团经小牛肠碱性磷酸化酶切除。转化大肠杆菌DH5α的感受态细胞(Bethesda Research Laboratories提供),然后从含有50μg/ml氨苄青霉素、IPTG和X-gal的琼脂平板培养基上首先挑选出含有TSWV cDNA插入片段的克隆。利用碱裂解法[参见BRL Focus 117(1989)],从所挑选克隆中分离质粒DNAs,再用EcoRI限制性内切酶消化提取的质粒DNA并将DNA转移至Gene Screen Plus尼龙滤器(DuPont)上,以确定插入片段的大小。利用与TSWV CPNH1 S RNA[参见J.Gen.Virol.71001(1990)]的核苷酸序列(GCAAGTTCTGCGAGTTTTGCCTGCT)互补的寡聚核苷酸(AGCAGGCAAAACTCGCAGAACTTGC)的32P标记物,与含有TSWV-BL S RNA cDNA插入片段的质粒克隆杂交,以鉴定该质粒克隆。在琼脂糖凝胶上鉴定并分析了数个克隆以确定插入片段的大小。发现pTSWVS-23克隆含有最大的cDNA插入片段,长度大约为1.7kb。
利用聚合酶链反应(PCR)技术获得了全长的NP基因。第一链cDNA的合成是在37℃下进行30分钟完成的,其中反应混合液体积为20μl,并利用与TSWV NP基因5′端的S RNA互补(TSWV-CPNH1的核苷酸位置为2751至2773)的寡聚核苷酸引物JLS 90-46(5′->3′)AGCTAACCATGGTTAAGCTCACTAAGGAAAGC(也用于TSWV-10W核蛋白壳基因的合成)。反应混合液含有1.5μg的病毒RNAs、1μg寡聚核苷酸引物、每种dNTP 0.2mM、1×PCR缓冲液(GeneAmp试剂盒,Perkin-Elmer-Cetus)、20U溶于核酸酶抑制剂(Promega)中的RNAs、2.5mM MgCl2和25U AMV逆转录酶(Promega公司)。在95℃加热5分钟并冰浴冷却以终止反应。然后按制造商的说明(Perkin-Elmer-Cetus)用10μl cDNA/RNA杂交反应液经PCR扩增NP基因,其中引物为1μg的寡聚核苷酸引物JLS 90-46和1μg寡聚核苷酸引物JLS 90-47(5′->3′),AGCATTCCATGGTTAACACACTAAGCAAGCAC(也用于TSWV-10W核蛋白壳基因的合成),后者寡聚核苷酸引物与基因3′端非编码区的S RNA相同(即TSWV-CPNH1的核苷酸位置1919至1938)。一圈典型的PCR反应是92℃1分钟(变性)、50℃1分钟(退火)和72℃2分钟(聚合)。反应后的样品直接上样于1.2%的琼脂糖凝胶上进行分离。然后从琼脂糖凝胶中提取分离开的NP基因片段,并经乙醇沉淀后溶于20μl的重蒸水中。
实施例IV植物表达与转化载体的构建经实施例III凝胶分离到的NP基因片段用限制性内切酶NcoI酶切消化,酶切是在50μl的反应缓冲液[50mM Tris-HCl(pH8.0)、10mM MgCl2、0.1M NaCl]中于37℃进行反应3小时,然后直接克隆到经NcoI消化过的植物表达载体pB1525中。所构建的质粒经鉴定后标定为pB1525-NP+[在与花椰菜花叶病毒(CaMV)35S启动子相关的有意义方向上]和pB1525-NP-[在反方向上]。经上述插入NP基因片段的表达盒能否产生NP 是通过NP基因在烟草原生质体中的瞬间表达来确定[按Pang等描述的方法参见Gene 112229(1992)]。由于NP基因含有内源HindIII和EcoRI酶切位点,所以利用HindIII/EcoRI进行部分酶切,将含有NP基因的表达盒从pB1525-NP+上切割下来,然后连接到同样酶切割过的植物转化载体pBIN19(Clontech Laboratories,Inc.)上。形成的载体pBIN19-NP+和对照质粒pBIN19依照Holsters等人描述的方法[参见Mol.Gen.Genet.163181(1978)]转入到根瘤土壤杆菌LBA 4404中去。
按照Siemieniak等人[参见Analyt.Biochem.192441(1991)]描述的双链测序法,利用双脱氧核糖核苷酸法和T7聚合酶(美国生化试剂,SequenaseTM),分析了pTSWV-23和Pb1525-NP+二个克隆中插入片段的核苷酸序列。核苷酸序列是通过分析二条DNA链来确定的,并利用遗传计算机集团(GCG,Madison,W1)的计算机程序将所确定的核苷酸序列与已公开的TSWV分离株CPNH1的序列进行比较分析。
也得到了NP基因在烟草原生质体中的瞬间表达。利用大规模碱法,从克隆pTSWVS-23和pUC18cpphas TSWV-NP(含有PCR加工过的NP基因插入片段)分离质粒DNA。利用NcoI酶消化从克隆pBIS25-NP+上切下PCR加工过的NP基因插入片段以利用可得的侧寡聚核苷酸引物进行测序。表达盒pUC18cpphas与pUC18cpexp相似,只不过前者利用了来自Phaseolus Vulgaris种子贮藏菜豆蛋白基因的ploy(A)加尾信号。这些质粒DNA经Beckman Ti70.1固定角转子超速离心后形成二个CsCl-溴化乙锭梯度条带。利用双脱氧核糖核苷酸和上述描述的双链质粒DNA测序法得到了DNA序列。将核苷酸序列反应液于1米长的恒温(55℃)测序胶上电泳,获得了平均长约750bp的核苷酸序列读数。为确保准确,核苷酸序列是由二个克隆插入片段的二条DNA链来确定的。利用计算机程序(GCG,Madison,WI),将由TSWV-BL S RNA分离株所获得的核苷酸序列信息,按以下提及的办法与TSWV分离株CPNH 1和L3进行了比较分析。
如下所示为克隆cDNA的核苷酸与推导的氨基酸序列和TSWV-BLS RNA的PCR加工的插入片段以及这些序列与TSWV-CPHN1 S RNA的核苷酸序列的比较。利用Siemieniak的双链双脱氧核苷酸测序法测出了TSWV-BL S RNA克隆pTSWVS-23(TSWV-23)和pBI 525-NP+(TSWV-PCR)的核苷酸序列,并将它们的序列与GeneBankAccession No.D 00645中报道的TSWV-CPNH 1 S RNA的核苷酸序列的相关区域进行了比较。TSWV-CPNH 1 S RNA的核苷酸序列已由De Haan(1990)作了报道,并以下序列表示CAAGTTGAAA GCAACAACAG AACTGTAAAT TCTCTTGCAG TGAAATCTCT,50GCTCATGTCA GCAGAAAACA ACATCATGCC TAACTCTCAA GCTTCCACTG100ATTCTCATTT CAAGCTGAGC CTCTGGCTAA GGGTTCCAAA GGTTTTGAAG150CAGGTTTCCA TTCAGAAATT GTTCAAGGTT GCAGGAGATG AAACAAACAA200AACATTTTAT TTATCTATTG CCTGCATTCC AAACCATAAC AGTGTTGAGA250CAGCTTTAAA CATTACTGTT ATTTGCAAGC ATCAGCTCCC AATTCGCAAA300TGCAAAGCTC CTTTTGAATT ATCAATGATG TTTTCTGATT TAAAGGAGCC350TTAACAACTT GTTCATGACC CTTCATACCC CAAAGGATCG GTTCCAATGC400TCTGGCTCGA AACTCACACA TCTTTGCACA AGTTCTTTGC AACTAACTTG450CAAGAAGATG TAATCATCTA CACTTTGAAC AACCTTGAGC TAACTCCTGG500AAAGTTAGAT TTAGGTGAAA GAACCTTGAA TTACAGTGAA GATGCCTACA550AAAGGAAATA TTTCCTTTCA AAAACACTTG AATGTCTTCC ATCTAACACA600CAAACTATGT CTTACTTAGA GAGCATCCAA ATCCCTTCAT GGAAGATGGA650CTTTGCCAGA GGAGAAATTA AAATTTCTCC ACAATCTATT TCAGTTGCAA700AATCTTTGTT AAAGCTTGAT TTAAGCGGGA TCAAAAAGAA AGAATCTAAG750GTTAAGGAAG CGTATGCTTC AGGATCAAAA TAATCTTGCT TTGTCCAGCT800TTTTCTAATT ATGTTATGTT TATTTTCTTT CTTTACTTAT AATTATTTCT850CTGTTTGTCA TCTCTTTCAA ATTCCTCCTG TCTAGTAGAA ACCATAAAAA900CAAAAAATAA AAATGAAAAT AAAATTAAAA TAAAATAAAA TCAAAAAATG 1000AAATAAAAAC AACAAAAAAT TAAAAAACGA AAAACCAAAA AGACCCGAAA 1050GGGACCAATT TGGCCAAATT TGGGTTTTGT TTTTGTTTTT TGTTTTTTGT 1100TTTTTATTTT TTATTTTATT TTTATTTTAT TTTATTTTTA TTTTATTTTT 1150ATTTTATTTA TTTTTTGTTT TCGTTGTTTT TGTTATTTTA TTATTTATTA1200AGCACAACAC ACAGAAAGCA AACTTTAATT AAACACACTT ATTTAAAATT1250TAACACACTA AGCAAGCACA AGCAATAAAG ATAAAGAAAG CTTTATATAT1300TTATAGGCTT TTTTATAATT TAACTTACAG CTGCTTTCAA GCAAGTTCTG1350CGAGTTTTGC CTGCTTTTTA ACCCCGAACA TTTCATAGAA CTTGTTAAGA1400GTTTCACTGT AATGTTCCAT AGCAACACTC CCTTTAGCAT TAGGATTGCT1450GGAGCTAAGT ATAGCAGCAT ACTCTTTCCC CTTCTTCACC TGATCTTCAT1500TCATTTCAAA TGCTTTGCTT TTCAGCACAG TGCAAACTTT TCCTAAGGCT1550TCCTTGGTGT CATACTTCTT TGGGTCGATC CCGAGGTCCT TGTATTTTGC1600ATCCTGATAT ATAGCCAAGA CAACACTGAT CATCTCAAAG CTATCAACTG1650AAGCAATAAG AGGTAAGCTA CCTCCCAGCA TTATGGCAAG TCTCACAGAC1700TTTGCATCAT CGAGAGGTAA TCCATAGGCT TGAATCAAAG GATGGGAAGC1750AATCTTAGAT TTGATAGTAT TGAGATTCTC AGAATTCCCA GTTTCTTCAA1800CAAGCCTGAC CCTGATCAAG CTATCAAGCC TTCTGAAGGT CATGTCAGTG1850CCTCCAATCC TGTCTGAAGT TTTCTTTATG GTAATTTTAC CAAAAGTAAA1900ATCGCTTTGC TTAATAACCT TCATTATGCT CTGACGATTC TTTAGGAATG1950TCAGACATGA AATAACGCTC ATCTTCTTGA TCTGGTCGAT GTTTTCCAGA2000CAAAAAGTCT TGAAGTTGAA TGCTACCAGA TTCTGATCTT CCTCAAACTC2050AAGGTCTTTG CCTTGTGTCA ACAAAGCAAC AATGCTTTCC TTAGTGAGCT2100TAACCTTAGA CATGATGATC GTAAAAGTTG TTATAGCTTT GACCGTATGT2150AACTCAAGGT GCGAAAGTGC AACTCTGTAT CCCGCAGTCG TTTCTTAGGT2200TCTTAATGTG ATGATTTGTA AGACTGAGTG TTAACGTATG AACACAAAAT2250TGACACGATT GCTCT 2265以下是TSWV-CPNH1 S RNA上非结构蛋白基因的部分推导的氨基酸序列,起始于核苷酸序列上的密码子1号碱基,终止于终止密码子783号碱基Gln Val Glu Ser Asn Asn Arg Thr Val Asn Ser Leu Ala Val Lys5 10 15Ser Leu Leu Met Ser Ala Glu Asn Asn Ile Met Pro Asn Ser Gln20 25 30Ala Ser Thr Asp Ser His Phe Lys Leu Ser Leu Trp Leu Arg Val35 40 45Pro Lys Val Leu Lys Gln Val Ser Ile Gln Lys Leu Phe Lys Val50 55 60Ala Gly Asp Glu Thr Asn Lys Thr Phe Tyr Leu Ser Ile Ala Cys65 70 75Ile Pro Asn His Asn Ser Val Glu Thr Ala Leu Asn Ile Thr Val80 85 90Ile Cys Lys His Gln Leu Pro Ile Arg Lys Cys Lys Ala Pro Phe95 100 105Glu Leu Ser Met Met Phe Ser Asp Leu Lys Glu Pro Tyr Asn Ile110 115 120Val His Asp Pro Ser Tyr Pro Lys Gly Ser Val Pro Met Leu Trp125 130 135Leu Glu Thr His Thr Ser Leu His Lys Phe Phe Ala Thr Asn Leu140 145 150Gln Glu Asp Val Ile Ile Tyr Thr Leu Asn Asn Leu Glu Leu Thr155 160 165Pro Gly Lys Leu Asp Leu Gly Glu Arg Thr Leu Asn Tyr Ser Glu170 175 180Asp Ala Tyr Lys Arg Asp Tyr Phe Leu Ser Lys Thr Leu Glu Cys185 190 195Leu Pro Ser Asn Thr Gln Thr Met Ser Tyr Leu Asp Ser Ile Gln200 205 210Ile Pro Ser Trp Lys Ile Asp Phe Ala Arg Gly Glu Ile Lys Ile215 220 225Ser Pro Gln Ser Ile Ser Val Ala Lys Ser Leu Leu Lys Leu Asp230 235 240Leu Ser Gly Ile Lys Lys Lys Glu Ser Lys Val Lys Glu Ala Tyr245 250 255Ala Ser Gly Ser Lys260将以下列出的TSWV-23核苷酸序列与上述给出的TWSV序列进行细致比较后发现,它含有半数的非结构基因和-半的核蛋白壳蛋白基因。AAATTCTCTT GCAGTGAAAT CTCTGCTCAT GTTAGCAGAA AACAACATCA 50TGCCTAACTC TCAAGCTTTT GTCAAAGCTT CTACTGATTC TAATTTCAAG100CTGAGCCTCT GGCTAAGGGT TCCAAAGGTT TTGAAGCAGA TTTCCATTCA150GAAATTGTTC AAGGTTGCAG GAGATGAAAC AAATAAAACA TTTTATTTAT200CTATTGCCTG CATTCCAAAC CATAACAGTG TTGAGACAGC TTTAAACATT250ACTGTTATTT GCAAGCATCA GCTCCCAATT CGTAAATGTA AAACTCCTTT300TGAATTATCA ATGATGTTTT CTGATTTAAA GGAGCCTTAC AACATTATTC350ATGATCCTTC ATATCCCCAA AGGATTGTTC ATGCTCTGCT TGAAACTCAC400ACATCTTTTG CACAAGTTCT TTGCAACAAC TTGCAAGAAG ATGTGATCAT450CTACACCTTG AACAACCATG AGCTAACTCC TGGAAAGTTA GATTTAGGTG 500AAATAACTTT GAATTACAAT GAAGACGCCT ACAAAAGGAA ATATTTCCTT 550TCAAAAACAC TTGAATGTCT TCCATCTAAC ATACAAACTA TGTCTTATTT 600AGACAGCATC CAAATCCCTT CCTGGAAGAT AGACTTTGCC AGGGGAGAAA 650TTAAAATTTC TCCACAATCT ATTTCAGTTG CAAAATCTTT GTTAAATCTT 700GATTTAAGCG GGATTAAAAA GAAAGAATCT AAGATTAAGG AAGCATATGC 750TTCAGGATCA AAATGATCTT GCTGTGTCCA GCTTTTTCTA ATTATGTTAT 800GTTTATTTTC TTTCTTTACT TATAATTATT TTTCTGTTTG TCATTTCTTT 850CAAATTCCTC CTGTCTAGTA GAAACCATAA AAACAAAAAT AAAAATAAAA 900TAAAATCAAA ATAAAATAAA AATCAAAAAA TGAAATAAAA GCAACAAAAA 950AATTAAAAAA CAAAAAACCA AAAAAGATCC CGAAAGGACA ATTTTGGCCA 1000AATTTGGGGT TTGTTTTTGT TTTTTGTTTT TTTGTTTTTT GTTTTTATTT 1050TTATTTTTAT TTTTATTTTT ATTTTATTTT ATTTTATGTT TTTGTTGTTT 1100TTGTTATTTT GTTATTTATT AAGCACAACA CACAGAAAGCA AACTTTAAT 1150TAAACACACT TATTTAAAAT TTAACACACT AAGCAAGCACA AACAATAAA 1200GATAAAGAAA GCTTTATATA TTTATAGGCT TTTTTATAAT TTAACTTACA 1250GCTGCTTTTA AGCAAGTTCT GTGAGTTTTG CCTGTTTTTT AACCCCAAAC 1300ATTTCATAGA ACTTGTTAAG GGTTTCACTG TAATGTTCCA TAGCAATACT 1350TCCTTTAGCA TTAGGATTGC TGGAGCTAAG TATAGCAGCA TACTCTTTCC 1400CCTTCTTCAC CTGATCTTCA TTCATTTCAA ATGCTTTTCT TTTCAGCACA 1450GTGCAAACTT TTCCTAAGGC TTCCCTGGTG TCATACTTCT TTGGGTCGAT 1500CCCGAGATCC TTGTATTTTG CATCCTGATA TATAGCCAAG ACAACACTGA 1550TCATCTCAAA GCTATCAACT GAAGCAATAA GAGGTAAGCT ACCTCCCAGC 1600ATTATGGCAA GCCTCACAGA CTTTGCATCA TCAAGAGGTA ATCCATAGGC 1650TTGAATCAAA GGGTGGGAAG CAATCTTAGA TTTGATAGTA TTGAGATTCT 1700CAGAATTCC 1709以下列出的本发明TSWV-PCR的核酸序列也与上述TSWV序列进行了细致比较,发现该序列含盖了整个核蛋白壳蛋白基因。TTAACACACT AAGCAAGCAC AAACAATAAA GATAAAGAAA GCTTTATATA 50TTTATAGGCT TTTTTATAAT TTAACTTACA GCTGCTTTTA AGCAAGTTCT 100GTGAGTTTTG CCTGTTTTTT AACCCCAAAC ATTTCATAGA ACTTGTTAAG 150GGTTTCACTG TAATGTTCCA TAGCAATACT TCCTTTAGCA TTAGGATTGC 200TGGAGCTAAG TATAGCAGCA TACTCTTTCC CCTTCTTCAC CTGATCTTCA 250TTCATTTCAA ATGCTTTTCT TTTCAGCACA GTGCAAACTT TTCCTAAGGC 300TTCCCTGGTG TCATACTTCT TTGGGTCGAT CCCGAGATCC TTGTATTTTG 350CATCCTGATA TATAGCCAAG ACAACACTGA TCATCTCAAA GCTATCAACT 400GAAGCAATAA GAGGTAAGCT ACCTCCCAGC ATTATGGCAA GCCTCACAGA 450CTTTGCATCA TCAAGAGGTA ATCCATAGGC TTGACTCAAA GGGTGGGAAG 500CAATCTTAGA TTTGATAGTA TTGAGATTCT CAGAATTCCC AGTTTCCTCA 550ACAAGCCTGA CCCTGATCAA GCTATCAAGC CTTCTGAAGG TCATGTCAGT 600GGCTCCAATC CTGTCTGAAG TTTTCTTTAT GGTAATTTTA CCAAAAGTAA 650AATCGCTTTG CTTAATAACC TTCATTATGC TCTGACGATT CTTCAGGAAT 700GTCAGACATG AAATAATGCT CATCTTTTTG ATCTGGTCAA GGTTTTCCAG 750ACAAAAAGTC TTGAAGTTGA ATGCTACCAG ATTCTGATCT TCCTCAAACT 800CAAGGTCTTT GCCTTGTGTC AACAAAGCAA CAATGCTTTC CTTAGTGAGC 850TTAACCAT 858综合分析发现,克隆TSWV-23插入片段重叠了TSWV-PCR插入片段,它们两者代表了本发明TSWV-BL S RNA的2028个核苷酸。本发明的这2028个核苷酸序列含有部分的非结构基因和整个核蛋白壳蛋白基因。两者结合后的序列如下AAATTCACTT GCAGTGAAAT CTCTGCTCAT GTTAGCAGAA AACAACATCA50TGCCTAACTC TCAAGCTTTT GTCAAAGCTT CTACTGATTC TAATTTCAAG 100CTGAGCCTCT GGCTAAGGGT TCCAAAGGTT TTGAAGCAGA TTTCCATTCA 150GAAATTGTTC AAGGTTGCAG GAGATGAAAC AAATAAAACA TTTTATTTAT 200CTATTGCCTG CATTCCAAAC CATAACAGTG TTGAGACAGC TTTAAACATT 250ACTGTTATTT GCAAGCATCA GCTCCCAATT CGTAAATGTA AAACTCCTTT 300TGAATTATCA ATGATGTTTT CTGATTTAAA GGAGCCTTAC AACATTATTC 350ATGATCCTTC ATATCCCCAA AGGATTGTTC ATGCTCTGCT TGAAACTCAC 400ACATCTTTTG CACAAGTTCT TTGCAACAAC TTGCAAGAAG ATGTGATCAT 450CTACACCTTG AACAACCATG AGCTAACTCC TGGAAAGTTA GATTTAGGTG 500AAATAACTTT GAATTACAAT GAAGACGCCT ACAAAAGGAA ATATTTCCTT 550TCAAAAACAC TTGAATGTCT TCCATCTAAC ATACAAACTA TGTCTTATTT 600AGACAGCATC CAAATCCCTT CCTGGAAGAT AGACTTTGCC AGGGGAGAAA 650TTAAAATTTC TCCACAATCT ATTTCAGTTG CAAAATCTTT GTTAAATCTT 700GATTTAAGCG GGATTAAAAA GAAAGAATCT AAGATTAAGG AAGCATATGC 750TTCAGGATCA AAATGATCTT GCTGTGTCCA GCTTTTTCTA ATTATGTTAT800GTTTATTTTC TTTCTTTACT TATAATTATT TTTCTGTTTG TCATTTCTTT850CAAATTCCTC CTGTCTAGTA GAAACCATAA AAACAAAAAT AAAAATAAAA900TAAAATCAAA ATAAAATAAA AATCAAAAAA TGAAATAAAA GCAACAAAAA950AATTAAAAAA CAAAAAACCA AAAAAGATCC CGAAAGGACA ATTTTGGCCA 1000AATTTGGGGT TTGTTTTTGT TTTTTGTTTT TTTGTTTTTT GTTTTTATTT 1050TTATTTTTAT TTTTATTTTT ATTTTATTTT ATTTTATGTT TTTGTTGTTT 1100TTGTTATTTT GTTATTTATT AAGCACAACA CACAGAAAGC AAACTTTAAT 1150TAAACACACT TATTTAAAAT TTAACACACT AAGCAAGCAC AAACAATAAA 1200GATAAAGAAA GCTTTATATA TTTATAGGCT TTTTTATAAT TTAACTTACA 1250GCTGCTTTTA AGCAAGTTCT GTGAGTTTTG CCTGTTTTTT AACCCCAAAC 1300ATTTCATAGA ACTTGTTAAG GGTTTCACTG TAATGTTCCA TAGCAATACT 1350TCCTTTAGCA TTAGGATTGC TGGAGCTAAG TATAGCAGCA TACTCTTTCC 1400CCTTCTTCAC CTGATCTTCA TTCATTTCAA ATGCTTTTCT TTTCAGCACA 1450GTTGCAAACT TTCCTAAGGC TTCCCTGGTG TCATACTTCT TTGGGTCGAT 1500CCCGAGATCC TTGTATTTTG CATCCTGATA TATAGCCAAG ACAACACTGA 1550TCATCTCAAA GCTATCAACT GAAGCAATAA GAGGTAAGCT ACCTCCCAGC 1600ATTATGGCAA GCCTCACAGA CTTTGCATCA TCAAGAGGTA ATCCATAGGC 1650TTGACTCAAA GGGTGGGAAG CAATCTTAGA TTTGATAGTA TTGAGATTCT 1700CAGAATTCCC AGTTTCCTCA ACAAAGCTGA CCCTGATCAA GCTATCAAGC 1750CTTCTGAAGG TCATGTCAGT GGCTCCAATC CTGTCTGAAG TTTTCTTTAT 1800GGTAATTTTA CCAAAAGTAA AATCGCTTTG CTTAATAACC TTCATTATGC 1850TCTGACGATT CTTCAGGAAT GTCAGACATG AAATAATGCT CATCTTTTTG 1900ATCTGGTCAA GGTTTTCCAG ACAAAAAGTC TTGAAGTTGA ATGCTACCAG 1950ATTCTGATCT TCCTCAAACT CAAGGTCTTT GCCTTGTGTC AACAAAGCAA 2000CAATGCTTTC CTTAGTGAGC TTAACCAT 2028通过比较表明,克隆pTSWVS-23的cDNA插入片段包括约760bp的52K蛋白病毒组成基因、完整的基因间区(4926bp)以及450bp的NP基因(约半个NP基因长度)。这个克隆插入片段含有3′端,并恰好位于EcoRI识别位点,这意味着在cDNA克隆过程中会形成不完整的EcoRI甲基化。尽管该克隆不合有完整的TSWV-BL NP基因,但其序列具有相当重要的意义,这是因为它与PCR加工的NP基因序列有450bp的重叠(全长为2028bp的TSWV-BL S RNA位于TSWV的核苷酸序列中)。该TSWV-BL PCR加工的和TSWV-CPNH 1 NP基因之间的序列比较,表明总共有21个核苷酸不同(2.7%),其中8个编码氨基酸替换(3.1%)。由于这个PCR加工的NP基因是通过Taq聚合酶所获得的,而这是公认会形成突变的,所以,可能有些差异是在PCR扩增过程中形成的。不过,这些核苷酸差异中的15个被定位于TSWV-BL cDNA与PCR克隆之间的重叠区内,而且,除一个以外,全部这些核苷酸差异(TSWV的位置1702;TSWV-PCR的位置485)由这两个TSWV-BL S RNA衍生克隆所共享。这一比较清楚地表明,这二个克隆的NP基因区域核苷酸序列的差异性,如果有的话,也不完全是由PCR扩增所形成的。位置1702的核苷酸差异导致了氨基酸由丝氨酸替换亮氨酸,并且甚至这种差异可能是TSWV-BL分离株内缺乏均一性所形成的。
实施例V土壤杆菌介导的转化用含有载体pBIN 19-NP+或对照质粒pBIN 19的土壤杆菌LBA4404(ClonTech)接种烟草var Havana cv 423的叶盘,即浸于含该土壤杆菌的液体培养基中过夜,然后将培养过的叶盘转入不含选择剂的MS培养基中培养3天[参见Science 2271229(1985)]。将转化的细胞团挑选出来,转入含300μg/ml卡那霉素和500μg/ml羧苄青霉素的MS培养基中,以使茎再生。将长出的小植株转入不含激素的培养基中以诱导根的生长。再将生根的转化体转入土壤中并于温室条件下生长。MS培养基含有完全的MS盐(Sigma)、30g/L蔗糖、1mg/L BA和1ml B5维生素[1mg/ml烟酸、10mg/ml硫胺素(HCl)、1mg/ml维生素B6(HCl)及100mg/ml肌醇]。转基因植株进行自花受精,并将所获得的种子在加有卡那霉素的培养基上选择性地萌发。
实施例VI蛋白质的血清学测定利用双抗夹层酶链免疫吸附分析(DAS-ELISA)技术检测了含有TSWV-BL NP多克隆抗体的转基因植株内NP基因的表达。每个样品都是取植株顶部第二叶的叶盘(约0.05克),于3ml酶连接反应缓冲液[磷酸盐缓冲盐水、0.05%吐温20、2%聚乙烯吡咯烷酮40和0.2%卵清蛋白]中磨碎。对于烟草原生质体,离心后的细胞提取物直接用于分析。在做DAS-ELISA前不久,将转基因植株和烟草原生质体的样品稀释10倍和3倍。
为做Western杂交,取叶盘(约0.05克)于0.25毫升2×SDS/样品缓冲液
,并在浓度为2μg/ml用于Western杂交。
利用TSWV-BL病毒粒子或TSWV-BL的NP或TSWV-1所获得的抗体并根据DAS-ELISA技术,对TSWV分离株(TSWV-BL,Arkansas,10W pakchoy,Begonia或Brazil)进行了血清反应分析。
实施例VII用TSWV分离株接种转基因植株用不同的TSWV分离株感染Nicotiana benthamiana Domin制备接种物(Inocula),并将感染的N.benthamiana的植株(接种后1~2周的)的叶片(0.5g)于15ml缓冲液
。Begonia分离株对TSWV-I(“I”血清型)的NP抗体有强烈的反应,但对TSWV-BL NP的抗体无反应,因此它属于“I”血清型。Brazil分离株对TSWV-BL或TSWV-I的NP血清型的抗体无可检测反应,它对TSWV-BL的全病毒粒子抗体反应微弱。而且,这个分离株能在感染的烟草和N.benthamiana叶片上引发整株斑驳病和皱叶病,但不会感染西葫芦或黄瓜,这表明该分离株与葫芦分离亲缘关系远。这些结果表明这个分离株可被看成一个第三血清型。
在含卡那霉素培养基上萌发来自7个R0代株系的小苗,再用上述的TSWV分离株感染接种。从接种后第七天开始每日记录感染的数据。如果病毒症状在未接种感染的叶片上能观察到,则估计用TSWV-BL,Arkansas,10W pakchoy或Brazil分离株接种的植株是易感染的。因为这个分离株不会导致烟草的整株感染,如果在接种感染的叶片上观察到局部损伤,则认为用Begonia分离株接种的植株是易感染的。所有接种过的对照NP(-)R1代植株对这5个分离株感染都表现出敏感性。除接种Begonia的转基因R1代植株在接种叶片上仅产生局部损伤外,它们都是在接种感染12天后表现出整株感染。然而,几乎所有NP(+)R1代植株都是高抗同源分离株TSWV-BL,而很小百分比的NP(+)R1代植株抗异源分离株Arkansas、10W pakchoy和Begonia。另一方面,来自7个转基因植株系的所有NP(+)R1代植株都对Brazil分离株敏感,尽管在一些来自品系NP(+)4的高NP表达NP(+)R1代植株中观察到植株的症状表现有轻微延迟(1~2天)。
抗性R1代植株在其整个生长周期内都未表现出病症。通过对Chenopodium quinoa植株叶片重复接种,检测在17个症状较轻的NP(+)植株的接种过的叶片上病毒的存在。从无症状的NP(+)植株的接种过的叶片上未发现病毒,这意味着病毒在这些NP(+)植株上不能复制或传播。
对转基因植株内NP累积水平与抗异源TSWV分离株的抗性水平之间的关系也做了研究。对上述数据的分析表明,具有低水平NP的R0代植株系所衍生的R1代植株对“L”血清型的异源分离株(Arkansas和10W pakchoy)具有最佳抗性,而具有高水平NP的R0代植株系所衍生的R1代植株抗Begonia分离株,这个分离株属于“I”血清型。例如,平均76%的来自低NP表达水平株系NP(+)2、14和21的接种过的R1代植株抗Arkansas和10W pakchoy分离株的感染,而来自高NP表达水平株系NP(+)4、9和23的类似接种植株,其中只有11%观察到对这些分离株有抗性。另一方面,Begonia分离株感染79%的来自低NP表达水平株系NP(+)2、14和21的R1代植株,但只感染19%来自高NP表达水平株系NP(+)4的R1代植株。
因此,可以得出如下结论表达低水平NP基因的转基因R1代植株对分离株10W pakchoy(“L”血清型)的感染有高度的抗性,但对Begonia分离株(“I”血清型)则没有抗性。相反,NP高表达的R1代植株对Begonia分离株的感染有高度抗性,但不抗10Wpakchoy分离株的感染。
这样,准确定量抗异源分离株的单个植株NP表达水平的关系是相当重要的。本文报导的许多接种实验中,转基团植株的叶片试样是在Arkansas和10W pakchoy分离株接种前取样的。在观察到NP表达水平与抗性水平之间明显相关后,也从Begonia分离株接种的植株的非接种叶片上取样。后一种取样方法可以在没有Begonia分离株感染干扰的情况下进行,这是因为这个分离株在烟草上既不会引发整株感染,也不对TSWV-BL NP抗体有反应。利用分离的TSWV-BL的NP产生的抗体,通过DAS-ELISA技术,分析所有样品有关的NP水平。图5和图6表明在转基因R1代植株(不考虑产生它们的R0代植株系)的NP水平与它们抗Arkansas和10W pakchoy分离株或Begonia分离株之间的关系。几乎所有具有很低或难以检测的ELISA反应(0-0.05 OD405nm)的转基因R1代植株均抗Arkansas和10W pakchoy分离株(“L”血清型)的感染,但对Begonia分离株(“I”血清型)敏感。相反,几乎所有产生高ELISA反应(0.4-1.0 OD405nm)的R1代植株抗Begonia分离株,但对Arkansas和10W pakchoy分离株敏感。
利用一种混合方法,从用TSWV-B感染的N.benthamiana植株中分离双链(ds)RNA,该方法已成功地用于从葡萄卷叶病毒感染的组织中提取dsRNA[参见Acta Horticulturae 18651(1986),和Can.Plant Dis Surv 6893(1988)]。选择dsRNA用于cDNA合成,是因为从这种分离株中分离病毒颗粒还不可能[参见PlantDisease 74154(1990)]。为了构建TSWV-B的S RNA的cDNA文库,从凝胶中分离纯化双链S RNA,然后通过甲基-汞处理变性纯化双链S RNA,再利用随机引物并按Promega提供的cDNA合成程序合成cDNA。所合成的cDNA片段通过一个EcoRI衔接头被克隆到EcoRI消化过的λZAPII(Strategene),然后利用由凝胶纯化的S RNA的反转录所制备的cDNA探针,通过克隆杂交鉴定阳性克隆。在琼脂糖凝胶上分析了许多阳性克隆,其中只有3个含有最大插入片段(L1,L22和L30)的重叠克隆被挑选出来(参见图3),它们覆盖几乎完整的TSWV-B S RNA。
先是通过通用和反向引物,然后是通过内部引物[用于TSWV-B的S RNA的测序],从两条DNA链测定克隆L1、L22和L30的插入片段的核苷酸序列。测序采用Sanger的双脱氧核糖核苷酸法、T7聚合酶(美国生化试剂,SequenaseTM)和Siemieniak描述的双链测序程序[参见Analyt.Biochem.192441(1991)]。这些克隆的测序分析揭示了插入片段分别为1.994kb、2.368kb和1.576kb,而且这些序列代表了S RNA基因组的93%(见图3)。利用GeneticsComputer Group(GCG,Madison,W1)的计算机程序并通过与TSWV分离株CONH 1、L3、I和BL的序列比较,分析了该组装序列。
计算机分析表明2.842kb的组装序列覆盖了完整的52K非结构蛋白基因、完整的基因区域(629kb)和737bp的NP基因(只有N基因39个N端核苷酸未被覆盖)。为获得N基因的这个丢失区域,多聚核苷酸激酶对引物TTCTGGTCTTCTTCAAACTCA(与N基因起始密码子一段62个核苷酸的序列相同)进行末端标记,以筛选上述的cDNA文库。得到5个推定的克隆。5个克隆的序列分析表明,只有克隆S6和S7包含了N基因的39个丢失的核苷酸。S7克隆也包括S RNA的3′末端。
利用5′RACE系统(GIBCO)获得了S RNA的5′末端。将从被TSWV-B感染的烟草中分离的TSWV-B ssRNA和总RNA用于cDNA第一链的合成,该链与TSWV-B S RNA上核苷酸位置746-763的寡聚核苷酸(5′-CTGTAGCCATGAGCAAAG)互补。利用末端脱氧核苷酸转移酶在cDNA第一链的3′端加尾dCTP。加尾cDNA然后通过PCR扩增,使用引物是一个能与多聚尾部退火的锚式(anshor)引物以及一个能与TSWV-B S RNA的核苷酸位置512-529退火的寡聚核苷酸(5′-TTATATCTTCTTCTTGGA)。PCR扩增的片段经凝胶纯化后直接克隆到T载体pT7Blue(Novagen)上,然后测序。利用一个寡聚核苷酸引物测序了8个独立克隆。该引物(5′-GTTCTGAGATTTGCTAGT)紧靠SRNA的5′端区(TSWV-B S RNA的核苷酸位置是40-57)。所得克隆中的6个含有S RNA的5′末端,这些克隆的5′末端核苷酸序列是相同的。这样,TSWV-B S RNA完整的核苷酸序列长度为3049个核苷酸。
这两个克隆,加上以前测序过的三个克隆(L1、L22、L30、S6和S7),覆盖了以上描述的总长为3032个核苷酸。对TSWV-CPNH1和TSWV-I的末端序列进行比较发现,虽然在组装好的序列中未反映出5′末端的18个核苷酸,但是TSWV-B S RNA 3′末端区与TSWV-I S RNA的3′末端区是相同的,并且与TSWV-CPNH1的3′末端区相比,15个核苷酸中仅有1个有差异。TSWV分离株的末端序列的保守性与布尼安病毒科属的其它成员的保守性相一致。这支持了以下假说末端序列有可能形成稳定的碱基对结构,该结构涉及到其复制和包装。
根据本发明TSWV-B(以上讨论过的Brazilian分离株)的SRNA基因组的完整核苷酸序列为AGAGCAATTG GGTCATTTTT TATTCTAAAT CGAACCTCAA CTAGCAAATC 50TCAGAACTGT AATAAGCACA AGAGCACAAG AGCCACAATG TCGACATGCA100TTTATGAATC GATCATTCAG ACAAAGGCTT CAGTTTGGGG ATCGACAGCA150TCTGGTAAGT CCATCGTGGA TTCTTACTGG ATTTATGAGT TTCCAACTGG200TTCTCCACTG GTTCAAACTC AGTTGTACTC TGATTCGAGG AGCAAAAGTA250GCTTCGGCTA CACTTCAAAA ATTGGTGATA TTCCTGCTGT AGAGGAGGAA300ATTTTATCTC AGAACGTTCA TATCCCAGTG TTTGATGATA TTGATTTCAG350CATCAATATC AATGATTCTT TCTTGGCAAT TTCTGTTTGT TCCAACACAG400TTAACACCAA TGGAGTGAAG CATCAGGGTC ATCTTAAAGT TCTTTCTCTT450GCCCAATTGC ATCCCTTTGA ACCTGTGATG AGCAGGTCAG AGATTGCTAG500CAGATTCCGG CTCCAAGAAG AAGATATAAT TCCTGATGAC AAATATATAT550CTGCTGCTAA CAAGGGATGT CTCTCCTGTG TCAAAGAACA TACTTACAAA600GTCGAAATGA GCCACAATCA GGCTTTAGGC AAAGTGAATG TTCTTTCTCC650TAACAGAAAT GTTCATGAGT GGCTGTATAG TTTCAAACCA AATTTCAACC700AGATCGAAAG TAATAACAGA ACTGTAAATT CTCTTGCAGT CAAATCTTTG750CTCATGGCTA CAGAAAACAA CATTATGCCT AACTCTCAAG CTTTTGTTAA800AGCTTCTACT GATTCTCATT TTAAGTTGAG CCTTTGGCTG AGAATTCCAA850AAGTTTTGAA GCAAATAGCC ATACAGAAGC TCTTCAAGTT TGCAGGAGAC900GAAACCGGTA AAAGTTTCTA TTTGTCTATT GCATGCATCC CAAATCACAA950CAGTGTGGAA ACAGCTTTAA ATGTCACTGT TATATGTAGA CATCAGCTTC1000CAATCCCTAA GTCCAAAGCT CCTTTTGAAT TATCAATGAT TTTCTCCGAT1050CTGAAAGAGC CTTACAACAC TGTGCATGAT CCTTCATATC CTCAAAGGAT1100TGTTCATGCT TTGCTTGAGA CTCACACTTC CTTTGCACAA GTTCTCTGCA1150ACAAGCTGCA AGAAGATGTG ATCATATATA CTATAAACAG CCCTGAACTA1200ACCCCAGCTA AGCTGGATCT AGGTGAAAGA ACCTTGAACT ACAGTGAAGA1250TGCTTCGAAG AAGAAGTATT TTCTTTCAAA AACACTCGAA TGCTTGCCAG1300TAAATGTGCA GACTATGTCT TATTTGGATA GCATCCAGAT TCCTTCATGG1350AAGATAGACT TTGCCAGAGG AGAGATCAGA ATCTCCCCTC AATCTACTCC1400TATTGCAAGA TCTTTGCTCA AGCTGGATTT GAGCAAGATC AAGGAAAAGA1450AGTCCTTGAC TTGGGAAACA TCCAGCTATG ATCTAGAATA AAAGTGGCTC 1500ATACTACTCT AAGTAGTATT TGTCAACTTG CTTATCCTTT ATGTTGTTTA 1550TTTCTTTTAA ATCTAAAGTA AGTTAGATTC AAGTAGTTTA GTATGCTATA 1600GCATTATTAC AAAAAATACA AAAAAATACA AAAAAATACA AAAAATATAA 1650AAAACCCAAA AAGATCCCAA AAGGGACGAT TTGGTTGATT TACTCTGTTT 1700TAGGCTTATC TAAGCTGCTT TTGTTTGAGC AAAATAACAT TGTAACATGC 1750AATAACTGGA ATTTAAAGTC CTAAAAGAAG TTTCAAAGGA CAGCTTAGCC 1800AAAATTGGTT TTTGTTTTTG TTTTTTTGTT TTTTGTTTTT TTGTTTTATT 1850TTTATTTTTA GTTTATTTTT TGTTTTTGTT ATTTTTATTT TTATTTTATT 1900TTCTTTTATT TTATTTATAT ATATATCAAA CACAATCCAC ACAAATAATT 1950TTAATTTCAA ACATTCTACT GATTTAACAC ACTTAGCCTG ACTTTATCAC 2000ACTTAACACG CTTAGTTAGG CTTTAACACA CTGAACCTAA TTAAAACACA 2050CTTAGTATTA TGCATCTCTT AATTAACACA CTTTAATAAT ATGCATCTCT 2100GAATCAGCCT TAAAGAAGCT TTTATGCAAC ACCAGCAATC TTGGCCTCTT 2150TCTTAACTCC AAACATTTCA TAGAATTTGT CAAGATTATC ACTGTAATAG 2200TCCATAGCAA TGCTTCCCTT AGCATTGGGA TTGCAAGAAC TAAGTATCTT 2250GGCATATTCT TTCCCTTTGT TTATCTGTGC ATCATCCATT GTAAATCCTT 2300TGCTTTTAAG CACTGTGCAA ACCTTCCCCA GAGCTTCCTT AGTGTTGTAC 2350TTAGTTGGTT CAATCCCTAA CTCCTTGTAC TTTGCATCTT GATATATGGC 2400AAGAACAACA CTGATCATCT CGAAGCTGTC AACAGAAGCA ATGAGAGGGA 2450TACTACCTCC AAGCATTATA GCAAGTCTCA CAGATTTTGC ATCTGCCAGA 2500GGCAGCCCGT AAGCTTGGAC CAAAGGGTGG GAGGCAATTT TTGCTTTGAT 2550AATAGCAAGA TTCTCATTGT TTGCAGTCTC TTCTATGAGC TTCACTCTTA 2600TCATGCTATC AAGCCTCCTG AAAGTCATAT CCTTAGCTCC AACTCTTTCA 2650GAATTTTCTT TTATCGTGAC CTTACCAAAA GTAAAATCAC TTTGGTTCAC 2700AACTTTCATA ATGCCTTGGC GATTCTTCAA GAAAGTCAAA CATGAAGTGA 2750TACTCATTTT CTTAATCAGG TCAAGATTTT CCTGACAGAA AGTCTTAAAG 2800TTGAATGCGA CCTGGTTCTG GTCTTCTTCA AACTCAACAT CTGCAGATTG 2850AGTTAAAAGA GAGACAATGT TTTCTTTTGT GAGCTTGACC TTAGACATGG 2900TGGCAGTTTA GATCTAGACC TTTCTCGAGA GATAAGATTC AAGGTGAGAA 2950AGTGCAACAC TGTAGACCGC GGTCGTTACT TATCCTGTTA ATGTGATGAT 3000TTGTATTGCT GAGTATTAGG TTTTTGAATA AAATTGACAC AATTGCTCT 3049根据本发明,非结构(以上单划线部分)与核蛋白壳蛋白的推导氨基酸序列如下Met Ser Ser Gly Val Tyr Glu Ser Ile Ile Gln Thr Lys Ala Ser5 10 15Val Trp Gly Ser Thr Ala Ser Gly Lys Ser Ile Val Asp Ser Tyr20 25 30Trp Ile Tyr Glu Phe Pro Thr Gly Ser Pro Leu Val Gln Thr Gln35 40 45Leu Tyr Ser Asp Ser Arg Ser Lys Ser Ser Phe Gly Tyr Thr Ser50 55 60Lys Ile Gly Asp Ile Pro Ala Val Glu Glu Glu Ile Leu Ser Gln65 70 75Asn Val His Ile Pro Val Phe Asp Asp Ile Asp Phe Ser Ile Asn80 85 90IleAsn Asp Ser PheLeu Ala Ile Ser Val Cys Ser Asn Thr Val95 100 105Asn Thr Asn Gly Val Lys His Gln Gly His Leu Lys Val Leu Ser110 115 120Leu Ala Gln Leu His Pro Phe Glu Pro Val Met Ser Arg Ser Glu125 130 135Ile Ala Ser Arg Phe Arg Leu Gln Glu Glu Asp Ile Ile Pro Asp140 145 150Asp Lys Tyr Ile Ser Ala Ala Asn Lys Gly Ser Leu Ser Cys Val155 160 165Lys Glu His Thr Tyr Lys Val Glu Met Ser His Asn Gln Ala Leu170 175 180Gly Lys Val Asn Val Leu Ser Pro Asn Arg Asn Val His Glu Trp185 190 195Leu Tyr Ser Phe Lys Pro Asn Glu Asn Gln Ile Glu Ser Asn Asn200 205 210Arg Thr ValAsn Ser Leu Ala Val Lys Ser Leu Leu Met Ala Thr215 220 225Glu Asn Asn Ile Met Pro Asn Ser Gln Ala Phe Val Lys Ala Ser230 235 240Thr Asp Ser His Phe Lys Leu Ser Leu Gln Leu Arg Ile Pro Lys245 250 255Val Leu Lys Gln Ile Ala Ile Gln Lys Leu Phe Lys Phe Ala Gly260 265 270Asp Glu Thr Gly Lys Ser Phe Tyr Leu Ser Ile Ala Cys Ile Pro275 280 285Asn His Asn Ser Val Glu Thr Ala LeuAsn Val Thr ValIle Cys290 295 300Arg His Gln Leu Pro Ile Pro Lys Ser Lys Ala Pro Phe Glu Leu305 310 315Ser Met Ile Phe Ser Asp Leu Lys Glu Pro Tyr Asn Thr Val His320 325 330Asp Pro Ser Tyr Pro Gln Arg Ile Val His Ala Leu Leu Glu Thr335 340 345His Thr Ser Phe Ala Gln Val Leu Cys Asn Lys Leu Gln Glu Asp350 355 360Val Ile Ile Tyr Thr Ile Asn Ser Pro Glu Leu Thr Pro Ala Lys365 370 375Leu Asp Leu Gly Glu Arg Thr LeuAsn Tyr Ser GluAsp Ala Ser380 385 390Lys Lys Lys Tyr Phe Leu Ser Lys Thr Leu Glu Cys Leu Pro Val395 400 405Asn Val Gln Thr Met Ser Tyr Leu Asp Ser Ile Gln Ile Pro Ser410 415 420Trp Lys Ile Asp Phe Ala Arg Gly Glu Ile Arg Ile Ser Pro Gln425 430 435Ser Thr Pro Ile Ala Arg Ser Leu Leu Lys Leu Asp Leu Ser Lys440 445 450Ile Lys Glu Lys Lys Ser Leu Thr Trp Glu Thr Ser Ser Tyr Asp455 460 465Leu Glu;和Met Ser Lys Val Lys Leu Thr Lys Glu Asn Ile Val Ser Leu Leu5 10 15Thr Gln Ser Ala Asp Val Glu Phe Glu Glu Asp Gln Asn Gln Val20 25 30Ala Phe Asn Phe Lys Thr Phe Cys Gln Glu Asn Leu Asp Leu Ile35 40 45Lys Lys Met Ser Ile Thr Ser Cys Leu Thr Phe Leu Lys Asn Arg50 55 60Gln Gly Ile Met Lys Val ValAsn Gln Ser AspPhe Thr Phe Gly65 70 75Lys Val Thr Ile Lys Lys Asn Ser Glu Arg Val Gly Ala Lys Asp80 85 90Met Thr Phe Arg Arg Leu Asp Ser Met Ile Arg Val Lys Leu Ile95 100 105Glu Glu Thr Ala Asn Asn Glu Asn Leu Ala Ile Ile Lys Ala Lys110 115 120Ile Ala Ser His Pro Leu Val Gln Ala Tyr Gly Leu Pro Leu Ala125 130 135Asp Ala Lys Ser Val Arg Leu Ala Ile Met Leu Gly Gly Ser Ile140 145 150Pro Leu Ile Ala Ser Val Asp Ser Phe Glu Met Ile Ser Val Val155 160 165Leu Ala Ile Tyr Gln Asp Ala Lys Tyr Lys Glu Leu Gly Ile Glu170 175 180Pro Thr Lys Tyr Asn Thr Lys Glu Ala Leu Gly Lys Val Cys Thr185 190 195Val Leu Lys Ser Lys Gly Phe Thr Met Asp Asp Ala Gln Ile Asn200 205 210Lys Gly Lys Glu Tyr Ala Lys Ile Leu Ser Ser Cys Asn Pro Asn215 220 225Ala Lys Gly Ser Ile Ala Met Asp Tyr Tyr Ser Asp Asn Leu Asp230 235 240Lys Phe Tyr Glu Met Phe Gly Val Lys Lys Glu Ala Lys Ile Ala245 250 255Gly Val Ala由于以上描述的核蛋白壳蛋白基因是在病毒互补链上,TSWV-B的核蛋白壳蛋白基因如下ATG TCT AAG GTC AAG CTC ACA AAA GAA AAC ATT GTC TCT CTT TTA 45ACT CAA TCT GCA GAT GTT GAG TTT GAA GAA GAC CAG AAC CAG GTC 90GCA TTC AAC TTT AAG ACT TTC TGT CAG GAA AAT CTT GAC CTG ATT 135AAG AAA ATG AGT ATC ACT TCA TGT TTG ACT TTC TTG AAG AAT CGC 180CAA GGC ATT ATG AAA GTT GTG AAC CAA AGT GAT TTT ACT TTT GGT 225AAG GTC ACG ATA AAG AAA AAT TCT GAA AGA GTT GGA GCT AAG GAT 270ATG ACT TTC AGG AGG CTT GAT AGC ATG ATA AGA GTG AAG CTC ATA 315GAA GAG ACT GCA AAC AAT GAG AAT CTT GCT ATT ATC AAA GCA AAA 360ATT GCC TCC CAC CCT TTG GTC CAA GCT TAC GGG CTG CCT CTG GCA 405GAT GCA AAA TCT GTG AGA CTT GCT ATA ATG CTT GGA GGT AGT ATC 450CCT CTC ATT GCT TCT GTT GAC AGC TTC GAG ATG ATC AGT GTT GTT 495CTT GCC ATA TAT CAA GAT GCA AAG TAC AAG GAG TTA GGG ATT GAA 540CCA ACT AAG TAC AAC ACT AAG GAA GCT CTG GGG AAG GTT TGC ACA 585GTG CTT AAA AGC AAA GGA TTT ACA ATG GAT GAT GCA CAG ATA AAC 630AAA GGG AAA GAA TAT GCC AAG ATA CTT AGT TCT TGC AAT CCC AAT 675GCT AAG GGA AGC ATT GCT ATG GAC TAT TAC AGT GAT AAT CTT GAC 720AAA TTC TAT CAA ATG TTT GGA GTT AAG AAA GAG GCC AAG ATT GCT 765GGT GTT GCA TAA 777TSWV-B的完整S RNA全长应是3049个核苷酸,比TSWV-CPNH1的S RNA长134个核苷酸。这一差异主要是因为TSWV-B S RNA的基因间区域拉长了。对TSWV-B S RNA的测序区域分析发现了两个正如以上描述过的开放阅读框,这与其它TSWV分离株的相似。较大的一个位于病毒RNA链,起始于核苷酸位置88,终止于核苷酸位置1491。病毒互补链上较小的一个阅读框由一个起始于核苷酸位置2898的起始密码子和一个核苷酸位置为2122的终止密码子所确定。这二个开放阅读框被一个长为629个核苷酸的基因间区域所分隔开。下表中比较了完整测序的TSWV-B S RNA与其它分离株的sRNA区,表中描述了通过将TSWV-B S RNA排列的核苷酸和氨基酸序列与其它分离株的相应序列比较所得到的同源性百分率
综合53K 蛋白基因基因间区29K 蛋白基因比较ant ntaa nt ntaaB/CPNH1 76.4b80.0 86.1(78.3)c72.4 77.5 91.5(79.1)B/L3 75.8 79.0 89.0(82.0) 76.4 78.0 91.1(79.9)B/BL 76.3 - -72.8 77.6 90.3(79.5)B/I 63.0 - -- 63.1 69.7(55.3)CPNH1/L3 94.8 95.6 92.0(89.4) 89.2 96.8 99.6(98.5)CPNH1/BL 96.4 - -95.9 97.2 98.8(96.9)CPNH1/I 62.7 - -- 60.8 69.5(55.1)L3/BL 95.1 - -92.6 97.3 99.2(98.5)L3/I 60.9 - -- 60.9 69.5(55.1)I/BL 61.7 - -- 60.9 68.8(53.9)a.将分离株TSWV-CPNH1(2.916kb)、TSWV-L3(2.837kb)、TSWV-BL(2.037kb)和TSWV-I(1.144kb)的部分或全长S RNA序列与TSWV-B(3.049kb)的S RNA序列进行比较。b.利用GCG序列分析软件的BESTFIT程序,通过比较它们的核苷酸序列或推导的氨基酸序列,求算出相似程度的百分率。c.括号内是相同的百分率。
如上所描述,用L型分离株(CHNH1、L3和BL)显示了最大的核苷酸序列相似程序(75.8%~76.4%)。从较小的程序上看,在TSWV-B S RNA与被指定为I血清型的TSWV-I S RNA之间存在核苷酸序列相似性(63%)。比较而言,L型分离株(CHPN1、L3和BL)的已测序S RNA区享有94.8%-96.4%的核苷酸序列相似性。
777核苷酸的开放阅读框编码258个氨基酸的N蛋白,该蛋白预计分子量为28700 Da。来自TSWV分离株的N开放阅读框的序列比较反映出,分离株CPNH1,L3和BL的N基因核苷酸序列与TSWV-B的的差异(22%-22.5%)比它们彼此之间的差异(2.7%-3.2%)大得多。与免疫生物学分析结果相一致,CPNH1,L3和BL分离株间的N氨基酸序列彼此间更紧密相关(相似程度为98.8%-99.6%或相同程度为96.9%-98.5%),与TSWV-B相比则差距较远(相似程度为90.3%-91.5%或相同程度为79.1%-79.9%)。而与TSWV-I相比,无论是核苷酸水平上(63.1%)还是氨基酸水平(相似程度为69.7%或相同程度为55.3%)上都是具有较低的同源性。除编码262个氨基酸的TSWV-I的N开放阅读框外,其它分离株的N开放阅读框还编码258个氨基酸。计算机分析认为TSWV-I N开放阅读框的额外残基是由于氨基酸序列插入所致(残基82到84和残基116)。在残基68上发现了一个潜在的N-糖基化位点。
1404个核苷酸的第二个开放阅读框编码467个氨基酸的非结构蛋白,其预计分子量为52566 Da。与TSWV-CPNH 1和TSWV-L 3的同源开放阅读框比较后发现,核苷酸水平上存在80%和79%的相似性,而在氨基酸水平存在86.1%(或78.3%相同)和89%(或82.0%相同)的相似性。该开放阅读框含4个潜在的糖基化位点,位于与TSWV-CPNH 1和TSWV-L 3的恰好相同的位置。
由于几个插入片段之故,TSWV-B S RNA的基因间区分别比TSWV-CPNH 1和TSWV-L 3的对应物长126个和41个核苷酸。通过FOLD程序所做的序列分析表明基因间区域能通过其内部的碱基A富集伸展序列与碱基U富集伸展序列间配对而形成极复杂和稳定的发夹结构,按最小自由能值分析,上述发夹结构与TSWV-CPNH 1和TSWV-L 3所产生的具有相似稳定性。这种内部碱基配对结构可以充当转录终止信号。
上表的结果也反映出TSWV-B的N蛋白受到比52K蛋白更高的选择压力影响;52K蛋白的氨基酸序列间的相似程度较NP氨基酸序列所发现的要低。基因间区域的核苷酸序列差异性最高,这表明这一区域受到较别的遗传区域更低的选择压力。
图4中分析并描述了TSWV-B和其它4个TSWV分离株间的进化关系,其中进化树构成与从这些TSWV分离株所收集到血清学数据的亲缘关系相一致。因此,根据本发明,TSWV-B与L型分离株较之与I-型分离株TSWV-I有更紧密的关系,但与L型分离株的相似程度比L型分离株彼此间的要低。
尽管症状表现稍有延缓,但转基因植株并未表现出TSWV的Brazil分离株抗性。血清学的结果表明这一分离株与“L”和“I”型分离株关系远,并且在生物学上不同于葫芦分离株。因此,Brazil分离株可能仍属于TSWV的另一种血清型。总之,感染结果表明,单个NP基因不可能提供对Tospovirus属内所有分离株的抗性。
根据本发明,产生低或检测不出的ELISA反应(0~0.05OD405nm)的转基因植株,对“L”血清型的异源分离株(Arkansas和10W pakchoy)的感染有抗性,而在积累高水平NP的植株中不抗这些分离株。与对照NP(-)植株的ELISA读数(0.05 OD405nm)相比,这些转基因植株如果有的话也仅产生很少的TSWV-BL NP。检测不到CP累积的转基因植株中观察到类似结果,它们对病毒感染具有很高的抗性。目前,还难于对这一现象的机理作出解释。可能是具有病毒复制特性的转基因植株所产生的CP RNA分子干扰了这种类型的抗性,推测可能是通过与侵害性病毒的负义复制RNA杂交,与必须的宿主因子(如复制酶)结合,或是干扰病毒粒子组装而进行的。
但是应该注意到,对同源TSWV-BL分离株的抗性明显不依赖于NP基因的表达水平。尽管没有测定出TSWV-BL接种的单个R1代植株的相关NP水平,但有理由推测在这些接种的R1代植株(总共测试了145株植株)产生的NP范围为从检测不出到高水平。
与免受“L”血清型的异源分离株的感染之情况相反,在NP高表达的R1代植株中,发现可免受TSWV-I血清型的Begonia分离株的影响。比较“L”血清型的与“I”血清型的NP核苷酸序列发现,在核苷酸和氨基酸水平上分别有62%和67%的相同性。两个血清型的NP基因差异会如此之大,以致于转基因植株所产生的NP(“L”血清型)对于“I”血清型中的感染性Begonia分离株是一个机能障碍型蛋白。如果将这个“缺陷性”的外壳蛋白整合到病毒粒子中去,便会产生有缺陷的病毒,抑制病毒运动或其进一步复制。预期这种类型的相互作用需要高水平NP的保护作用。或者,对Begonia分离株的抗性也可能干扰有病毒复制之R1代植株产生的NP转录本。如果真是这样,要抑制异源病毒复制则可能需要更多的NP转录本(归因于两个NP基因的异源特性)。
尽管对于单个R1代植株的NP水平与对“L”和“I”血清型异源分离株的抗性之间的相互关系的结果还没有明显的解释,但是,由于这些数据来自大量植株(190株),因此认为存在明显的倾向。这样,可以相信,测定单株植株的CP或NP水平可以提供一个更加可靠的方法以确定NP或CP水平与抗性之间的关系。通过数据分析这种形式,结果表明,在每个测试单株中的抗性与NP水平较之于与它们所来自的R0代株系的NP水平有更加紧密的关系。至少,对于烟草中的TSWV-BL NP基因,表现出NP基因在植物染色体中的整合位点可能对病毒抗性并不重要。
依据本发明,也研究了含有TSWV-BL核蛋白壳蛋白基因的转基因R1代和R2代西红柿对下列分离株的反应Brazil(一个亲缘关系远的病毒)、T91(一个亲缘关系近的病毒)和BL(一个同源分离株)。在这些研究中,转基因西红柿(L.esculentum)是通过根瘤土壤杆菌介导的基因转移将西红柿斑点枯萎病毒BL的莴苣分离株的核蛋白壳蛋白(N)基因,利用已发表方法的修改方案[参见PlantCell Reports 581(1986)],转入到萌发的子叶中而产生的。挑选西红柿品系“Geneva 80”作转化材料,是因为该品系含Tm-22基因,这个基因使TMV产生抗性,这样就可能生产一个多病毒抗性品系。
从含卡那霉素的培养基上挑选出转化体,再将生根了的转基因西红柿盆栽并移入温室中。R1和R2代西红柿苗表达了NPT II基因,说明该基因在植物基因组中是多拷贝插入的。相反,只有18%的种苗产生了可检测水平的N蛋白。
测定9个R1代和3个R2代品系对下列三个已描述过的Tospovirus,具体讲为TSWV-BL,TSWV-T91和TSWV-B的抗性。感染是基于对测试株的肉眼观察。除几个带锈色斑的环或昆虫损伤外,在植物看起来健康的情况下,将来自这些植株的提取物接种N.benthamiana以测定病毒是否存在。正如下表所描述的,几乎所有对照西红柿植株表现出典型症状植株矮化、镶嵌黄叶以及皱叶,这些症状是在用TSWV-BL、TSWV-T91或TSWV-B接种3~4周后表现出来的。但是,只有4%的R1与R2代转基因植株被TSWV-BL感染,7%被TSWV-T91感染和45%被TSWV-B感染。表达西红柿斑点枯萎病毒莴苣分离株的核蛋白基因的转基因R1与R2代西红柿中的病毒抗性接种分离株a植物株系TSWV-BLTSWV-T91TSWV-BR1代植株T13-1 0/22 1/26 7/24T13-2 6/20 NTbNTT13-3 2/42 0/20 12/18T13-4 0/25 NT NTT13-9 0/20 NT NTT13-101/50 2/26 11/26T13-110/22 NT NTT13-121/29 NT NTT13-130/22 NT MT总数 10/252 3/72 30/68R2代植株T13-1-7 0/8 2/8 5/8T13-1-9 0/8 1/8 2/8T13-1-11 0/8 1/9 5/9总数 0/24 4/25 12/25对照 92/9551/5352/53a.在一叶到二叶龄阶段,利用5倍、10倍或20倍稀释的N.benthamiana、H423烟草或西红柿的叶提取物接种植物;相同植株在7天后被再接种、再过14天后记录症状表现;表中数据表示为有症状的植株数/被测试的植株数。b.未测试因此,上述描述支持了如下发现表达TSWV-BL N基因的转基因西红柿植株表现出抗TSWV-BL感染,抗与TSWV-BL关系紧密的其它TSWV分离株感染,以及抗关系更远的TSWV-B的感染。
在进一步用另一分离株所做的有限研究中,所有转基因植株抗10W(pakchoy)分离株,而对照则被感染。这些结果表明,转基因西红柿可更好地免受近缘分离株而不是远缘分离株的感染。不象在表达TSWV-BL N基因的转基因烟草和N.benthamiana中,N蛋白表达水平与转基因西红柿中所观察到的保护作用无关。55%转基因西红柿仍抗TSWV-B中的一个远缘分离株,这在转基因烟草和N.benthamiana植株中没有观察到。这些差异可能反映了西红柿本身对Tospoviruses不太敏感。
此外,也研究确定了接种5周和7周后少量植株中病毒的分布。将每株完全伸展叶片的远端半叶磨碎并用来再接种到N.benthamiana上。接种七天后所收集的结果表明,不会从受TSWV-BL、TSWV-T91或TSWV-B接种的无症状转基因植株的任何叶片组织上回收到病毒,证实了以上报导过的肉眼观察结果。在表现出症状的转基因植株上,病毒不是分布在整株上。例如,不能得出最后结论的转基因植株仅在8片叶片中的二片上(植物底部和顶部的第二叶片)肉眼可见含有病毒。相反,病毒在被感染的对照植株的所有叶片上都存在,但不存在于健康对照植株的所有叶片上。
尝试了嫁接接种法以测试如果将病毒导入维管系统后抗性转基因植株是否会受到感染。将已以1∶5,1∶10或1∶20稀释的TSWV-BL、TSWV-T91或TSWV-B接种的R1和R2代植株嫁接到用同样分离株与稀释度感染的对照植株上。31天后,34个转基因植株无症状表现,尽管非转基因植株受到感染。23天后,转基因植株的顶部46cm被修剪掉以诱导新的生长和更多的植物应激反应。尽管在接种后第31天,幼小并旺盛生长的新茎未表现出任何症状,但是,33%、31%和45%的TSWV-BL、TSWV-T91和TSWV-B分别在接种45天后表现出叶片或茎部症状。这些结果表明,一些转基因植株具有耐受性,而其它则对感染具有免疫性。
因此,根据本发明的一个目的,表达TSWV-BL分离株NP基因的转基因植株对同源TSWV-BL分离株及同样血清型(Arkansas和10Wpakchoy)的异源分离株的感染有高度抗性。更具体地说,这种抗性对来自其它血清型的Begonia分离株是有效的。简言之,以上清楚地描述了,表达TSWV-BL核蛋白基因的转基因烟草植株表现出TSWV和INSV抗性并表明这种保护作用是通过核蛋白抗远缘INSV和由核蛋白基因核苷酸序列抗同源与近缘TSWV分离株而介导的。这是首次报道加工过的植株对不同TSWV分离株具有广谱抗性。
尽管外壳蛋白保护作用通常表现感染与症状表现延缓和/或下降(而无免疫性),但本发明提供了相当高百分率的无症状以及无感染性病毒的转基因植株。在温室条件下,这些植株的抗性能在整个植株生长周期内得以维持,更重要的是能如上所述遗传到它们的后代中去。
本发明观察发现,产生少量(如果有的话)TSWV-BL NP的转基因植株,对TSWV相同血清型范围内的同源分离株与其它近缘分离株的感染有很高的抗性,但在这些表达高水平NP基因的转基因植株中未发现有保护作用。
TSWV的生物多样性已有很多记载,并已有报道克服了在栽培品种(如西红柿)中的遗传抗性。因此,培育多种TSWV菌株抗性的转基因植物是极其重要的。本发明表明,有一种方法能够利用病毒NP基因来提供这样的抗性,这种抗性是针对多种TSWV分离株的。所以,本发明所发现的TSWV NP基因的表达能够提供对各种TSWV分离株的高水平抗性,具有十分重要的商业价值。
在另一些研究中,构建了质粒BIN 19-N+并将它按实施例IV转入根瘤土壤杆菌LBA 4404,然后按实施例V转入Nicotianabenthamiana。用寡聚核苷酸引物INSV-A(5′-TACTTATGTAGAACCATGGACAAAGCAAAGATTACCAAGG)和INSV-B(5′-TACAGTGGATCCATGGTTATTTGAAATAATTTATAAAAGCAC),扩增了INSV-Beg和INSV-LI的核蛋白壳基因,扩增是通过双引物分别与INSV分离株的核蛋白壳基因的5′-端编码区和3′端非编码区杂交实现的。扩增的核蛋白壳基因片段依据实施例III纯化,再依照实施例IV酶切消化并测序。
将总共24N+(用pBIN 19-N+转化的)和18N-(用载体pBIN 19转化的)转基因N.benthamiana植株移栽到土壤中并转入温室中生长。在4~5叶龄通过PCR分析证实所有N+系含有N基因序列。通过利用TSWV-BL N蛋白的抗体的DAS-ELISA技术,估测了每个独立的R0代转基因克隆系中N蛋白累积的相对水平。在总共24N+株系中,2个的OD405nm值为0.50-1.00,17个的OD405nm值为0.02-0.10,其余5个的OD405nm值小于0.02。健康的N.benthamiana或转基因N-植株的OD405nm值为0.00-0/02。将全部R0代植株进行了自花授精,并且将以下转基因株系的种子于含卡那霉素(300μg/ml)的筛选培养基上萌发,用于接种分析(1)N--2和N--6,只含载体pBIN 19的对照转基因株系;(2)N+-28,产生难于检测数量的N蛋白(OD405nm=0.005)的转基因株系;(3)N+-21,一个产生低水平N蛋白(OD405nm=0.085)的转基因株系;和(4)N+-34和N+-37,两个累积高水平N蛋白(OD405nm=0.50-1.00)的转基因株系。然后,用Northern杂交技术分析这6个株系,发现N基因的转录本强度与ELISA反应水平密切相关。
通过在含卡那霉素筛选培养基上进行种子萌发,筛选来自这6个R0代株系的转基因种苗,然后用5种Tospoviruses接种这些种苗。如果未接种叶片上观察到病毒症状,就认为接种的R1代植株是敏感的。为排除遗漏的可能性,总是在每次接种转基因N+植株时,使用转基因对照N-植株。此外,总是用每一接种提取物首先接种N+植株然后再用于对照N-植株。现将这些研究结果描述如下表达N.benthamiana斑点枯萎病毒(TSWV)核蛋白壳(N)蛋白基因的R1代植株对接种Tospoviruses的反应受感染植株数/接种植株数bTSWV 分离株INSV分离株R0株系 ELISAaBL 10WBegLITSWV-BN--21-6<0.02 32/3232/32 32/3220/20 32/32N+-28 0.005 16/1616/16 15/16 16/16N+-21 0.085 9/40 17/40 39/4018/20 40/40N+-34 0.715 25/28c28/28 23/28c28/28N+-37 0.510 26/28c22/22 21/28c16/20c22/22a.衍生出R1代植株的R0代株系的ELISA数据b.将被感染的N.benthamiana植株叶提取物稀释30倍,然后用于3-5叶龄植株的3片叶片。每个提取物总是先用于接种N+植株再用于接种对照N-植株。接种后至少二个月每日记录数据,并表示成整株被感染的植株数/接种植株数。c.表明几乎所有敏感的R1代植株均表现出症状表现明显延缓。
正如上表所描述的,所有对照株系N--2和N--6的R1代植株皆于接种所有被测试病毒5~8天后表现出整株症状。没有一个来自株系N+-28的R1代植株生产可检测水平的N蛋白,并且除接种INSV-Beg的一株外,其余皆对这些病毒敏感。接种前取N+-28 R1代植株的叶盘作ELISA分析,清楚地表明,被鉴定具有INSV-Beg抗性表现型的植株确实积累了高水平的N蛋白(OD405nm=0.78,而其余所有N+-28 R1植株的OD405nm小于0.02)。
低N基因表达株系N+-21对同源的(78%)和近缘TSWV-10W(57%)表现出最佳抗性,而对二个INSV分离株则抗性极低(3%和10%);只有三株N+-21植株在接种INSV分离株后出现抗性表型。来自这些INSV抗性N+-21 R1代植株叶的样品得到比敏感的N+-21植株(OD405nm=0.02-0.20)更高的ELISA反应(OD405nm=0.5-1.00)以及更高量的N蛋白。高N基因表达株系N+-34和N+-37对INSV分离株(18%~25%)的抗性最高,其次是对同源TSWV-BL分离株(7%和11%),但没有一个植株有TSWV-10W抗性;不过,被INSV或TSWV-BL感染的N+-34和N+-37 R1代植株确实表现出不同程序地症状表现延迟。从这四个转基因N+株系所得到的R1代植株没有一个有TSWV-B抗性;一些来自N+-34和N+-37株系的R1代植株,其症状表现稍有延迟。
在确定N+R1代植株中的N蛋白生产水平是否与对不同Tospoviruses的抗性相关的研究中,不考虑起始R0代植株,根据接种前采样组织的ELISA反应强度,将前表中接种过的N+R1代植株重新分成四组。表达低水平N蛋白的N+R1代植株(0.02-0.2OD),对TSWV-BL和TSWV-10W表现出高抗性(100%和80%),而对INSV-Beg和INSV-LI都敏感,表明与对照N-植株相比没有明显的症状表现延迟。相反,几乎所有含高水平N蛋白的N+R1代植株(0.20-1.00OD),与对照N-植株相比,在抵御TSWV-BL、INSV-Beg和INSV-LI方面,表现出各种水平的保护作用,从症状表现稍有延迟,直到完全抗性,大部分植株症状表现有不同程度的延迟。但在抗TSWV-10W的高表达体中没有保护作用。此外,不管N基因表达水平如何,N+R1代植株都没有TSWV-B抗性,但生产高水平N蛋白的N+R1代植株中观察到短期延迟症状的表现。所有对照N-R1植株及有难于检测的ELISA反应之转基因N+R1植株(0~0.02OD)对全部测试Tospoviruses都敏感。
还研究了表达TSWV-BL核蛋白壳基因的N.benthamiana原生质体中远缘INSV复制的抑制问题。在这些研究中,用整个INSV-LI病毒粒子感染从三个转基因株系分离到的原生质体,以研究转入基因产物对进入病毒的复制的影响。利用INSV N蛋白特异抗体,通过测定转基因原生质体中感染INSV的N蛋白水平来确定病毒复制。DAS-ELISA分析表明,所给株系的所有后代都是相对均一的,并且几乎所有R1后代都产生与其亲本转基因株系相似的转基因N基因的表达水平。这些结果使得可以在其亲本株系的表达水平的基础上预测R1群体的表达水平。来自低表达株系N+-21 R1代植株的原生质体支持INSV-LI的复制,而来自高表达株系N+-37 R1代植株的原生质体接种42小时后在观察到低水平病毒复制时才表现为支持INSV-LI的复制。通过使用TSWV-BL N蛋白特异抗体的DAS-ELISA在不同时间间隔(如0、19、30和42小时)检测相同的原生质体,以监测转基因的表达水平。不出所料,N+-21 R1代植株原生质体产生相对低的水平(0.338-0.395OD405nm),而N+-37 R1代植株的原生质体产生高水平(0.822-0.865 OD405nm)。并且,各时间点的表达水平是一致的。
在本发明的这一目的中,业已表明积累低量TSWV-BL N蛋白的转基因N.benthamiana植株对同源和近缘(TSWV-10W)分离株有高抗性,而积累高水平TSWV-BL N蛋白的植株对于抵御同源和远缘(INSV-Beg和INSV-LI)病毒,有中等水平的保护作用。更重要的是,这些发现表明转基因N.benthamiana植株(INSV的整株寄主)受到保护以抵御INSV-Beg和INSV-LI分离株。
正如以上所讨论过的,我们已表明表达TSWV N基因的转基因植株抗同源分离株,而表达TSWV-BL N基因的植株能抗TSWV和INSV。也还表明,积累低水平N蛋白的转基因植株对同源和近缘分离株具有最佳抗性,而表达高水平TSWV-BL N蛋白的转基因植株对血清学上远缘的INSV分离株有更高的抗性,这一观察结果使我们对翻译出的N蛋白在所观察的抗同源和近缘分离株的保护作用中的作用产生怀疑,并且推测,在保护作用中涉及的究竟是插入到植株基因组中的N基因本身,还是其转录本。为证实这一假说,生产含无启动子的N基因的或者是表达有义或反义不可翻译N基因编码序列的转基因植株。结果发现,有义和反义不可翻译N基因的RNA提供了抵御同源和近缘分离株的保护作用,而且这些RNA介导的保护作用在合成各种低水平RNA的植物中非常有效,并且是通过抑制病毒复制达到的。
更具体地说,导入转基因植物中的编码序列如图7所示。正如所描述过的,构建体pBIN 19-N含有插入植物转化载体pBIN 19中的无启动子N基因(见实施例IV)。所有其它构建体包括一个双CaMV的35S启动子,苜蓿花叶病毒的一个5′端非翻译前导序列,以及一个胭脂碱合成酶基因的3′端非翻译/多聚腺苷酸序列。pBI525是一个植物表达载体,在本实验中用作对照。pBI525-mN含有N基因的突变(不可翻译)形式;pBI525-asN含有不可翻译N基因的反义形式。用破折号表明了突变N基因5′端的一个核苷酸缺失。ATG密码子下划有一道横线,突变基因中的框内(inframe)终止子用黑体表明。
实施例VIII按如下完成TSWV-BLN基因的针对引物的诱变与克隆按Phytopathology 821223(1992)所描述的方法(该文献全部引入本文)通过反转录和聚合酶链反应合成全长N基因。用寡聚核苷酸引物A(AGCATTGGATCCATGGTTAACACACTAAGCAAGCAC,该引物与TSWV-BL N基因中3′端非编码区的S RNA相同)和引物B(AGCTAATCTAGAACCATGGATGACTCACTAAGGAAAGCATTGTTGC,该引物与N基因5′端的S RNA互补)通过RT-PGR相似地合成不可翻译的N编码序列。在紧跟翻译起始密码子和几个终止密码子之后,后面的寡聚核苷酸引物B含有一个移码突变,以阻断可能的翻译通读。按上述实施例II所述,在1.2%琼脂糖凝胶上纯化完整和突变的N基因片段,然后用凝胶纯化过的完整的和突变的N基因片段用适当的限制性内切酶消化并分别直接克隆到经BamHI/Xbal消化过的植物转化载体pBIN19和经NcoI消化过的植物表达载体pBI525上(按实施例IV方法)。所得质粒经鉴定后并命名为pBIN 19-N,含有完整的,无启动子的N基因,而pBI525-mN与pBI525-asN相对于花椰菜花叶病毒35S启动子,分别在有意义和反义方向上含有突变编码序列。通过在烟草原生质体中瞬间表达分析检测表达盒中突变N编码序列的翻译能力;然后利用HindIII/EcoRI(因为N编码序列含有内源HindIII和ExoRI位点)通过部分酶切从质粒pBI525上将含有义或反义突变N编码序列的表达盒切割下来,并连接到用同种酶切割过的植物表达载体pBIN 19上。利用上述实施例IV中的方法将所得载体以及pBIN19-N转入根瘤土壤杆菌LBA4404中,再用含各种构建体的根瘤土壤杆菌LBA4404接种烟草var Havana cv 423的叶盘,并使所得的转基因植株进行自花授精,并且种子于含卡那霉素的培养基上选择性萌发。
按前述方法对每个R0代转基因株系进行PCR。用寡聚核苷酸引物A和B以确定TSWV-BL N编码序列的存在。将寡聚核苷酸引物35S-启动子(CCCACTATCCTTCGCAAGACCC)与寡聚核苷酸引物A或B结合,以确证插入到植物基因组中的突变N编码序列的方向(相对于CaMV 35S启动子)。利用TSWV-BL N蛋白的多克隆抗体完成DAS-ELISA,以检测转基因植株中的N蛋白。为了通过Northern印迹来估测转基因植株中RNA转录本水平,根据Napoli[见The PlantCell 2279(1990)]方法分离植株总RNA,并于含甲醛的琼脂糖凝胶(10μg/每条带)上分离。然后用溴化乙锭将琼脂糖凝胶染色以确保每条带中植株总RNA的均一性。杂交条件按厂商提供的GeneScreen Plus方法。根据每个印迹中所包括的对照条带的N基因转录本(mN R1代植株产生高水平的N基因转录本),对所产生的杂交信号进行了比较和标准化。产生密度读数(Hewlet ScanJet andImage Analysis Program)在100~150之间的转基因植株被估定为高表达体,而密度读数范围为15~50的转基因植株估定为低表达体。
除标明外,按前述于3~4叶龄阶段所完成的接种,用Tospovirus接种转基因植株。
从表面消毒过的R1代植株叶片中制备出烟草原生质体[参见Z.Pflanzanphysiol.78453(1992)并经修改过]。然后通过PEG方法[参见Plant Mol.Biol.8363(1987)],用0.68 OD260nm的纯化TSWV-BL病毒粒子制品转化分离的原生质体(6×106个原生质体)。转化的原生质体以终浓度为1×106个原生质体/ml转入培养基上并于26℃黑暗培养。经各培养间隔后,用W5溶液冲洗二次培养过的原生质体,并于酶连接缓冲液中通过渗透休克裂解。利用DAS-ELISA,通过测定N蛋白估测了病毒的增殖(复制)。
如前所述,本发明的目的之一表明,不产生或仅产生可检测量N蛋白的转基因烟草具同源和近缘分离株抗性。这一结果表明,所观察到的抗性可能归因于引入的病毒N基因RNA与转基因植株产生的N基因转录本或与N编码序列本身之间的反式相互作用(transinteraction)。为证实核N基因是否起了作用,用四个Tospoviruses(TSWV-BL,TSWV-10W,INSV-Beg和TSWV-B)攻击来自二个P°N株系的转基因P°N R0代株系和R1代植株。只有无病症的植株才被认为是抗性的,而表现出任何症状的植株都被认为是敏感的。所有接种过的R0和R1代植株都对病毒敏感。
为进一步证实在保护作用中涉及N转基因的转录本的可能性,用同源分离株接种大量能产生有义或反义N基因转录本但不产生N蛋白的R0代转基因植株。结果列表如下转基因aN基因b测试的R0接种的c抗性株系形式 RNA水平株系数量株系数量 数量mN H 8 40L 17 16 16nd 4 10asN H 6 30L 9 55nd 1 00P°N nd 12 60a.mN和asN分别代表表达有义和反义不可翻译N基因的植株,P°N代表含无启动子N基因的植株;b.N基因RNA的水平是对每个株系进行Northern印迹而估测的,nd代表未检测的N基因转录本;c.将经TSWV-BL感染的N.benthamiana 30倍稀释的叶提取物在6-7叶龄阶段用于每一植株上的三片叶。每一提取物首先用于全部测试植株然后再用于对照健康植株。接种后45天每日记录数据,并且只有无症状的植株才算是抗性的。
与对照(接种7~9天后形成典型的整株症状)相反,21个mN中16株和8个asN中5株在其整个生长周期中未见症状表现。接种前采叶组织样品所做的Northern印迹分析表明,所有抗性R0代株系产生低水平的有义或反义N基因RNA,而敏感的R0代株系则不产生或产生高水平的RNA。由于该资料表明对TSWV-BL有抗性的转基因植株与它们的N基因转录本的相对水平有关,所以,通过于含卡那霉素的培养基上萌发,筛选出转基因后代,这些后代来自具有高或低水平N基因转录本水平的4个mN和3个asN R0代株系。然后在3~4叶龄阶段,测试这些转基因植株对四个Tospoviruses的抗性,除来自2个asN株系的一些R1代植株是在6~7叶龄阶段进行接种测试。将这些结果汇总列于下表R0株系N基因RNAaISWV-BLTSWV-10WINSV-BegTSWV-B无启动子N基因P°N-1nd 10/10 10/10 10/10 10/10P°N-2nd 15/15 10/10 10/10 10/10N°-3 nd8/86/6 6/66/6不可翻译的N基因mN-2 H 20/20 20/20 20/20 20/20mN-7 H 20/20 20/20 20/20 20/20mN-13 L2/20 4/20 20/20 20/20mN-18 L4/20 1/20 20/20 20/20N°-3 nd 24/24 32/32 24/24 24/24反义N基因asN-1 L20/20b20/2020/20 20/20asN-4 H 20/20 20/20 20/20 20/20(16/16)c(16/16)asN-9 L19/2020/2020/20 20/20(3/41) (5/21)N°-3 nd 16/16 16/16 16/16 16/16(32/32)(20/20)a.衍生出R1代植株的R0株系的Northern分析(见前表);b.划线部分表明大多数敏感的R1代植株表现出明显的症状延缓;c.括号中部分代表在6~7叶龄阶段接种植株得到的接种数据;表中其余数据来自3~4叶龄阶段的接种植株;接种植株接种后45天每日进行观察。
来自高表达体株系mN-2和mN-7的所有R1代植株均对全部测试的Tospoviruses感染敏感,而且,这些植株与对照相比,未表现出症状延迟。相反,来自低表达体株系mN-13和mN-18的大部分R1代植株抗同源(TSWV-BL)和近缘(TSWV-10W)分离株,但对远缘Tospoviruses(INSV-Beg和TSWV-B)的感染没有抗性。来自低表达体R0株系的asN R1植株的抗性明显受到接种用TSWV分离株的影响。只是当接种同源的TSWV-BL或近缘的TSWV-10W分离株时,尽管症状表现有所延迟,但来自低表达体株系asN-1和asN-9的小R1植株(3~4叶龄阶段),除一个以外全部受到感染。相反,大多数来自株系asN-9的大R1植株(6~7叶龄阶段)都抗这两种分离株。相比之下,对照R1植株和来自高表达体株系如asN-4的R1植株,不管测试植株大小如何,对这两种分离物中的任何一种都不表现抗性。反义RNA介导的保护作用对于抗远缘INSV-Beg和TSWV-B分离株的感染无效果。
对以上两表中数据的分析可以认为,有义和反义RNA介导的保护作用只能在N基因的低水平表达体中观察到。产生高水平反义N基因转录本的R1asN植株与对照植株一样是敏感的。相反,asN低表达体在3~4叶龄接种时,表现出症状延迟,而在6~7叶龄接种时,表现出抗性水平增加。
还注意到,在表达不可翻译N编码序列的有义或反义形式的烟草原生质体中抑制病毒复制。在这一情形中,TSWV-BL的全病毒粒子制备物用于转染从转基因株系分离的原生质体,以调查有义或反义N基因转录本对所导入病毒复制的影响。病毒复制是通过测定转染原生质体中导入病毒的N蛋白水平来确定的,从各自产生高水平RNA转录本的植物(mN-7和asN-4)中分离的原生质体,有助于病毒的复制,而来自mN低表达体(mN-18)的原生质体则不能。来自asN低表达体(asN-9)中的原生质体有助于很低水平的病毒复制。
因此,在本发明的这一方面,我们表明表达不可翻译的N基因编码序列的有义或反义形式的转基因植株对同源(TSWV-BL)和近缘(TSWV-10W)分离株有抗性,但 对远缘的Tospoviruses(INSV-Beg和TSWV-B)则没有。下表列出在表达各种形式TSWV-BL N基因的转基因烟草之间对Tospoviruses的抗性比较转基因形式a与TSWV-BL NTospovirus基因b的同源性NmNasNP°NTSWV-BL 100% R R RcSTSWV-10W 99% R R RcSINSV-Beg 60% RcS S STSWV-B 78% S S S Sa.包括表达TSWV-BL的完整N基因(N)的转基因烟草与N。benthamiana植株对接种4种Tospoviruses的反应,并与含有不可翻译的(mN)、反义的(asN)和无启动子的(P°N)N编码序列的转基因植株的接种结果相比较,R=抗性的,S=敏感的b.Phytopathology 821223(1992)和Phytopathology 83728(1993)中报道过的核苷酸序列c.抗性水平可能取决于接种物的浓度。
这些结果证实并拓展了本发明较早提及的关于用TSWW由RNA介导的保护作用。而且,在产生低的而不是高水平N基因转录本的植株中观察到了保护作用,并且尽管本文中较早提到的研究表明产生高水平TSWV-BL N蛋白的烟草植株表现出对INSV-Beg有抗性,但是这个辅助数据表明由于在表达不可翻译N基因的有义或反义形式的转基因植株中未观察到对INSV-Beg的抗性,因此,这样清楚地表明了抗INSV-Beg的保护作用是由于N蛋白的存在而不是N基因转录本存在之故。所以,很明显,根据本发明保护转基因植株不受TSWV和INSVTospoviruses感染涉及两个机制。一个机制涉及到N基因转录本(RNA介导),另一个机制涉及到N蛋白(蛋白介导)。此外,原生质体实验的结果表明,N基因RNA介导的保护作用是通过抑制病毒复制的过程实现的,而且从上表中的数据也可以推测抵御远缘INSV-Beg分离株的保护作用是由TSWV-BI的N蛋白而不是由基因转录本提供的。
最后,完成进一步研究以提供本发明的另一目的一部分Tospovirus的核蛋白基因为转基因植物提供了免受Tospovirus感染的保护作用。以上业已表明N基因RNA保护抵御同源和近缘TSWV分离株感染而N蛋白保护抵御同源植株和远缘INSV分离株感染;N基因RNE介导的保护作用在表达低水平N基因的植株中是有效的,而N蛋白介导的保护作用则需要高水平N蛋白的累积;N基因RNA介导的保护作用是通过抑制病毒复制实现的。基于此前数据,我们接下来开始确定部分N基因是否可能抗病毒感染。我们发现,正如以下所讨论的,表达约一半N基因序列的转基因植株对病毒有抗性。
以下描述TSWV-BL的半个N基因片段的克隆,以便说明本发明的这一最后目的。通过以前描述过的反转录和PCR技术,产生了可翻译和不可翻译N基因的第一与第二半片段。如图8所描述的,由破折号标出了不可翻译的半N基因片段5′端的核苷酸缺失或插入;ATG密码子下划有横线,用黑体标明了紧跟不可翻译半N基因片段的起始密码子之后的全部可能的终止子。
通过RT-PCR合成了N基因的第一半片段,使用引物与TSWV-BL N基因的中心区互补的寡聚核苷酸引物i(5′-TACAGTGGATCCATGGTTAAGGTAATCCATAGGCTTGAC),以及用于可翻译的第一半N基因片段的寡聚核苷酸引物ii(5′-AGCTAAGCATGGTTAAGCTCACTAAGGAAAGCATTGTTGC)或用于不可翻译的第一半N基因片段的寡聚核苷酸引物iii(5′-AGCTAATCTAGAACCATGGATGACTCACTAAGGAAAGCATTGTTGC),其中后二个寡聚核苷酸引物与N基因的5′端相同。相似地,利用RT-PCR生产了N基因的第二半片段,使用引物与TSWV-BL N基因的3′端非编码区互补的寡聚核苷酸引物iV(5′-AGCATTGGATCCATGGTTAACACACTAAGCAAGCAC),以及用于可翻译的第二半N基因片段的寡聚核苷酸引物v(5′-TACAGTTCTAGAACCATGGATGATGCAAAGTCTGTGAGG)或用于不可翻译的第二半N基因片段的寡聚核苷酸引物vi(5′-AGATTCTCTAGACCATGGTGACTTGATGAGCAAAGTCTGTGAGGCTTGC),其中后两个寡聚核苷酸引物与N基因的中心区相同。寡聚核苷酸引物iii在紧跟翻译密码子和几个终止密码子之后含有移码突变,以阻断可能的翻译通读,而寡聚核苷酸引物vi在紧跟翻译起始密码子之后含有几个框内终止密码子。
按前述方法,在1.2%的琼脂糖凝胶上纯化半基因片段,然后用限制性内切酶消化凝胶分离的基因片段并直接克隆到NcoI酶切过的植物表达载体pBI525中。所得的质粒经鉴定后命名为(1)pBI525-1N,含第一半可翻译的N基因;(2)pBI525-1N′,含第一半不可翻译的N基因;(3)pBI525-1N-,于反义方向上含第一半可翻译N基因;(4)pBI525-2N,含第二半可翻译的N基因;(5)pBI525-2n′,含第二半不可翻译的N基因;和(6)pBI525-2N-,于反义方向上含第二半可翻译的N基因。然后,用HindIII/EcoRI消化从质粒pBI525中切下表达盒,并按上述方法连接到已用同样酶切割过的植物转化载体pBIN 19中。用所得的载体以及质粒pBIN 19按Holsters(上文)报道的方法转入根瘤土壤杆菌LBA4404中,再用含各种构建体的根瘤土壤杆菌LBA4404接种N.benthamiana的叶盘。将所获得的转基因植株进行自花授精,按前述方法于含卡那霉素的培养基上使种子选择性萌发。
用PCR和Northern杂交分析转基因植物,按前述方法对每个R0转基因株系进行PCR。用寡聚核苷酸引物i~vi来确定TSWV-BL的N编码序列的存在。同时,将寡聚核苷酸引物35 S-启动子(参见实施例VIII)与上述寡聚核苷酸引物之一结合,以确证插入到植物基因组中的半基因序列的方向(与相对于CaMV 35S启动子)。Northern杂交分析则按实施例VIII描述过的方法进行。
用TSWV(TSWV-BL)的莴苣分离株攻击转基因植株。按前述方法用3~4叶龄阶段的测试植株接种分离株。为避免遗漏的可能性,每次实验都要设立对照植株,而且,用每个接种提取物先接种转基因植株然后再接种对照植株。
本发明这一方面所用的各种构建体用图8来说明。用RT-PCR合成了可翻译和不可翻译的半N基因片段,然后直接克隆到植物表达载体pBI525中。用于由RT-PCR合成不可翻译的半N基因片段的寡聚核苷酸引物iii和vi,在紧跟翻译起始密码子之后有一个突变,所得阅读框含有几个终止密码子以阻断可能的翻译通读。这样,第一和第二半不可翻译的N基因片段应该是都不能在导入植物之后产生截短的N蛋白片段。然后,将可翻译与不可翻译的半N基因片段于有义或反义方向连接到载体pBI525 CaMV 35 S启动子的下游。这样,TSWV-BL的半N编码序列的表达受到一个双CaMV 35 S启动子的调控,该启动子是与表达载体pBI525的苜蓿花叶病毒(ALMV)上非翻译的前导序列融合。利用叠加的双CaMV 35 S启动子元件的表达载体已知比利用单个35 S启动子元件的相似载体能产生更高水平的mRNA转录本。将载体pBI525上的表达盒转移到植物转化载体pBIN 19上。构建的质粒以及对照质粒pBIN 19再转入根瘤土壤杆菌LBA4404中。所得转基因植株的命名如图8所示。
所有抗卡那霉素的转基因株系经PCR证实在预期方向上含有恰当的N编码序列。每个转基因R0株系结出种子,然后用Northern印迹进行分析。结果发现,6个1N中的6个,6个1N′中的4个,6个1N-中的6个,6个2N中的6个,8个2N′中的7个以及7个2N-中的6个转基因R0代株系产生了半N基因RNAs。
用同源分离株TSWV-BL侵染一组转基因R0代植株。只有无症状的植株才算作抗性植株,而表现任何症状(局部损伤或整株感染)的植株都算是敏感性的。所有接种的R0对照植株对病毒都敏感;相反,9个1N′中的2个,6个1N-中的2个,10个2N′中的4个以及8个2N-中的1个R0代株系则发现完全抗病毒感染。尽管没有1N和2N R0代株系表现出高水平抗性,但这些植株中有一些症状显现明显的症状延迟。
让另一组转基因R0代株系生长成熟并结出种子。然后将种子于含卡那霉素的培养基上萌发幼苗,再用TSWV-BL接种。正如下表所示,对照幼苗与一些转基因株系的幼苗都对分离株敏感,而1N-151、1N′-123和2N′-134株系的幼苗则表现出各个水平上的保护作用,范围从症状显现延迟到完全抗性。
感染植物数/接种植物数R0品系 6DPI 15DPI 30DPI对照50/501N-149 17/171N-151 2/20 13/20 17/201N′-12316/20 17/20 17/201N′-12420/201N′-12619/191N--13012/15 15/151N--13218/19 19/192N--15520/202N′-1340/20 10/20 10/202N′-13519/192N--14220/202N--14320/20在上表中,N.benthamiana感染的植物抽提物30倍稀释用于接种3~4片叶子时期的转基因植物,用转基因植物做对照。DPI=接种后的天数。
概括性地讲,本发明的这个方面表现出表达可翻译或不可翻译N基因片段的第一或第二部分的转基因植物对同源的TSWV-BL分离株具有很高的抗性。这一结果证明了N基因的一部分足以产生对病毒的抗性。
如前所述的本发明的核苷酸和氨基酸顺序 列表如下序列表(1)一般信息(i)申请人Dennis Gonsalves和Sheng-Zhi Pang(ii)发明名称西红柿斑点枯萎病毒(iii)序列数目30(2)SEQ ID NO1的信息(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO1AGCAGGCAAA ACTCGCAGAA CTTGC 25(2)SEQ ID NO2的信息(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链
(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO2GCAAGTTCTG CGAGTTTTGC CTGCT 25(2)SEQ ID NO3的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO3AGCTAACCAT GGTTAAGCTC ACTAAGGAAA GC 32(2)SEQ ID NO4的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO4AGCATTCCAT GGTTAACACA CTAAGCAAGC AC 32(2)SEQ ID NO5的信息(i)序列特征
(A)长度2265个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO5CAAGTTGAAA GCAACAACAG AACTGTAAAT TCTCTTGCAG TGAAATCTCT 50GCTCATGTCA GCAGAAAACA ACATCATGCC TAACTCTCAA GCTTCCACTG100ATTCTCATTT CAAGCTGAGC CTCTGGCTAA GGGTTCCAAA GGTTTTGAAG150CAGGTTTCCA TTCAGAAATT GTTCAAGGTT GCAGGAGATG AAACAAACAA200AACATTTTAT TTATCTATTG CCTGCATTCC AAACCATAAC AGTGTTGAGA250CAGCTTTAAA CATTACTGTT ATTTGCAAGC ATCAGCTCCC AATTCGCAAA300TGCAAAGCTC CTTTTGAATT ATCAATGATG TTTTCTGATT TAAAGGAGCC350TTACAACATT GTTCATGACC CTTCATACCC CAAAGGATCG GTTCCAATGC400TCTGGGTCGA AACTCACACA TCTTTGCACA AGTTCTTTGC AACTAACTTG450CAAGAAGATG TAATCATCTA CACTTTGAAC AACCTTGAGC TAACTCCTGG500AAAGTTAGAT TTAGGTGAAA GAACCTTGAA TTACAGTGAA GATGCCTACA550AAAGGAAATA TTTCCTTTCA AAAACACTTG AATGTCTTCC ATCTAACACA600CAAACTATGT CTTACTTAGA CAGCATCCAA ATCCCTTCAT GGAAGATAGA650CTTTGCCAGA GGAGAAATTA AAATTTCTCC ACAATCTATT TCAGTTGCAA700AATCTTTGTT AAAGCTTGAT TTAAGCGGGA TCAAAAAGAA AGAATCTAAG750GTTAAGGAAG CGTATGCTTC AGGATCAAAA TAATCTTGCT TTGTCCAGCT800TTTTCTAATT ATGTTATGTT TATTTTCTTT CTTTACTTAT AATTATTTCT850CTGTTTGTCA TCTCTTTCAA ATTCCTCCTG TCTAGTAGAA ACCATAAAAA900CAAAAAATAA AAATGAAAAT AAAATTAAAA TAAAATAAAA TCAAAAAATG 1000AAATAAAAAC AACAAAAAAT TAAAAAACGA AAAACCAAAA AGACCCGAAA 1050GGGACCAATT TGGCCAAATT TGGGTTTTGT TTTTGTTTTT TGTTTTTTGT 1100TTTTTATTTT TTATTTTATT TTTATTTTAT TTTATTTTTA TTTTATTTTT 1150ATTTTATTTA TTTTTTGTTT TCGTTGTTTT TGTTATTTTA TTATTTATTA 1200AGCACAACAC ACAGAAAGCA AACTTTAATT AAACACACTT ATTTAAAATT 1250TAACACACTA AGCAAGCACA AGCAATAAAG ATAAAGAAAG CTTTATATAT 1300TTATAGGCTT TTTTATAATT TAACTTACAG CTGCTTTCAA GCAAGTTCTG 1350CGAGTTTTGC CTGCTTTTTA ACCCCGAACA TTTCATAGAA CTTGTTAAGA 1400GTTTCACTGT AATGTTCCAT AGCAACACTC CCTTTAGCAT TAGGATTGCT 1450GGAGCTAAGT ATAGCAGCAT ACTCTTTCCC CTTCTTCACC TGATCTTCAT 1500TCATTTCAAA TGCTTTGCTT TTCAGCACAG TGCAAACTTT TCCTAAGGCT 1550TCCTTGGTGT CATACTTCTT TGGGTCGATC CCGAGGTCCT TGTATTTTGC 1600ATCCTGATAT ATAGCCAAGA CAACACTGAT CATCTCAAAG CTATCAACTG 1650AAGCAATAAG AGGTAAGCTA CCTCCCAGCA TTATGGCAAG TCTCACAGAC 1700TTTGCATCAT CGAGAGGTAA TCCATAGGCT TGAATCAAAG GATGGGAAGC 1750AATCTTAGAT TTGATAGTAT TGAGATTCTC AGAATTCCCA GTTTCTTCAA 1800CAAGCCTGAC CCTGATCAAG CTATCAAGCC TTCTGAAGGT CATGTCAGTG 1850CCTCCAATCC TGTCTGAAGT TTTCTTTATG GTAATTTTAC CAAAAGTAAA 1900ATCGCTTTGC TTAATAACCT TCATTATGCT CTGACGATTC TTTAGGAATG 1950TCAGACATGA AATAACGCTC ATCTTCTTGA TCTGGTCGAT GTTTTCCAGA 2000CAAAAAGTCT TGAAGTTGAA TGCTACCAGA TTCTGATCTT CCTCAAACTC 2050AAGGTCTTTG CCTTGTGTCA ACAAAGCAAC AATGCTTTCC TTAGTGAGCT 2100TAACCTTAGA CATGATGATC GTAAAAGTTG TTATAGCTTT GACCGTATGT 2150AACTCAAGGT GCGAAAGTGC AACTCTGTAT CCCGCAGTCG TTTCTTAGGT 2200TCTTAATGTG ATGATTTGTA AGACTGAGTG TTAACGTATG AACACAAAAT 2250TGACACGATT GCTCT 22G5(2)SEQ ID NO6的信息(i)序列特征(A)长度1709个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO6AAATTCTCTT GCAGTGAAAT CTCTGCTCAT GTTAGCAGAA AACAACATCA 50TGCCTAACTC TCAAGCTTTT GTCAAAGCTT CTACTGATTC TAATTTCAAG 100CTGAGCCTCT GGCTAAGGGT TCCAAAGGTT TTGAAGCAGA TTTCCATTCA 150GAAATTGTTC AAGGTTGCAG GAGATGAAAC AAATAAAACA TTTTATTTAT 200CTATTGCCTG CATTCCAAAC CATAACAGTG TTGAGACAGC TTTAAACATT 250ACTGTTATTT GCAAGCATCA GCTCCCAATT CGTAAATGTA AAACTCCTTT 300TGAATTATCA ATGATGTTTT CTGATTTAAA GGAGCCTTAC AACATTATTC 350ATGATCCTTC ATATCCCCAA AGGATTGTTC ATGCTCTGCT TGAAACTCAC 400ACATCTTTTG CACAAGTTCT TTGCAACAAC TTGCAAGAAG ATGTGATCAT 450CTACACCTTG AACAACCATG AGCTAACTCC TGGAAAGTTA GATTTAGGTG 500AAATAACTTT GAATTACAAT GAAGACGCCT ACAAAAGGAA ATATTTCCTT 550TCAAAAACAC TTGAATGTCT TCCATCTAAC ATACAAACCA TGTCTTATTT 600AGACAGCATC CAAATCCCTT CCTGGAAGAT AGACTTTGCC AGGGGAGAAA 650TTAAAATTTC TCCACAATCT ATTTCAGTTG CAAAATCTTT GTTAAATCTT 700GATTTAAGCG GGATTAAAAA GAAAGAATCT AAGATTAAGG AAGCATATGC 750TTCAGGATCA AAATGATCTT GCTGTGTCCA GCTTTTTCTA ATTATGTTAT 800GTTTATTTTC TTTCTTTACT TATAATTATT TTTCTGTTTG TCATTTCTTT 850CAAATTCCTC CTGTCTAGTA GAAACCATAA AAACAAAAAT AAAAATAAAA 900TAAAATCAAA ATAAAATAAA AATCAAAAAA TGAAATAAAA GCAACAAAAA 950AATTAAAAAA CAAAAAACCA AAAAAGATCC CGAAAGGACA ATTTTGGCCA 1000AATTTGGGGT TTGTTTTTGT TTTTTGTTTT TTTGTTTTTT GTTTTTATTT 1050TTATTTTTAT TTTTATTTTT ATTTTATTTT ATTTTATGTT TTTGTTGTTT 1100TTGTTATTTT GTTATTTATT AAGCACAACA CACAGAAAGCA AACTTTAAT 1150TAAACACACT TATTTAAAAT TTAACACACT AAGCAAGCACA AACAATAAA 1200GATAAAGAAA GCTTTATATA TTTATAGGCT TTTTTATAAT TTAACTTACA 1250GCTGCTTTTA AGCAAGTTCT GTGAGTTTTG CCTGTTTTTT AACCCCAAAC 1300ATTTCATAGA ACTTGTTAAG GGTTTCACTG TAATGTTCCA TAGCAATACT 1350TCCTTTAGCA TTAGGATTGC TGGAGCTAAG TATAGCAGCA TACTCTTTCC 1400CCTTCTTCAC CTGATCTTCA TTCATTTCAA ATGCTTTTCT TTTCAGCACA 1450GTGCAAACTT TTCCTAAGGC TTCCCTGGTG TCATACTTCT TTGGGTCGAT 1500CCCGAGATCC TTGTATTTTG CATCCTGATA TATAGCCAAG ACAACACTGA 1550TCATCTCAAA GCTATCAACT GAAGCAATAA GAGGTAAGCT ACCTCCCAGC 1600ATTATGGCAA GCCTCACAGA CTTTGCATCA TCAAGAGGTA ATCCATAGGC 1650TTGAATCAAA GGGTGGGAAG CAATCTTAGA TTTGATAGTA TTGAGATTCT 1700CAGAATTCC 1709(2)SEQ ID NO7的信息(i)序列特征(A)长度260个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑学线形(ii)分子类型肽(xi)序列描述SEQ ID NO7Gln Val Glu Ser Asn Asn Arg Thr Val Asn Ser Leu Ala Val Lys5 10 15Ser Leu Leu Met Ser Ala Glu Asn Asn Ile Met Pro Asn Ser Gln20 25 30Ala Ser Thr Asp Ser His Phe Lys Leu Ser Leu Trp Leu Arg Val35 40 45Pro Lys Val Leu Lys Gln Val Ser Ile Gln Lys Leu Phe Lys Val50 55 60Ala Gly Asp Glu Thr Asn Lys Thr Phe Tyr Leu Ser Ile Ala Cys65 70 75Ile Pro Asn His Asn Ser Val Glu Thr Ala Leu Asn Ile Thr Val80 85 90Ile Cys Lys His Gln Leu Pro Ile Arg Lys Cys Lys Ala Pro Phe95 100 105Glu Leu Ser Met Met Phe Ser Asp Leu Lys Glu Pro Tyr Asn Ile110 115 120Val His Asp Pro Ser Tyr Pro Lys Gly Ser Val Pro Met Leu Trp125 130 135Leu Glu Thr His Thr Sar Leu His Lys Phe Phe Ala Thr Asn Leu140 145 150Gln Glu Asp Val Ile Ile Tyr Thr Leu Asn Asn Leu Glu Leu Thr155 160 165Pro Gly Lys Leu Asp Lau Gly Glu Arg Thr Leu Asn Tyr Ser Glu170 175 180Asp Ala Tyr Lys Atg Asp Tyr Phe Leu Ser Lys Thr Leu Glu Cys185 190 195Leu Pro Ser Ash Thr Gln Thr Met Ser Tyr Leu Asp Ser Ile Gln200 205 210Ile Pro Ser Trp Lys Ile Asp Phe Ala Arg Gly Glu Ile Lys Ile215 220 225Ser Pro Gln Ser Ile Ser Val Ala Lys Ser Lau Leu Lys Leu Asp230 235 240Leu Ser Gly Ile Lys Lys Lys Glu Ser Lys Val Lys Glu Ala Tyr245 250 255Ala Ser Gly Ser Lys260(2)SEQ ID NO8的信息(i)序列特征(A)长度858个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO8TTAACACACT AAGCAAGCAC AAACAATAAA GATAAAGAAA GCTTTATATA 50TTTATAGGCT TTTTTATAAT TTAACTTACA GCTGCTTTTA AGCAAGTTCT 100GTGAGTTTTG CCTGTTTTTT AACCCCAAAC ATTTCATAGA ACTTGTTAAG 150GGTTTCACTG TAATGTTCCA TAGCAATACT TCCTTTAGCA TTAGGATTGC 200TGGAGCTAAG TATAGCAGCA TACTCTTTCC CCTTCTTCAC CTGATCTTCA 250TTCATTTCAA ATGCTTTTCT TTTCAGCACA GTGCAAACTT TTCCTAAGGC 300TTCCCTGGTG TCATACTTCT TTGGGTCGAT CCCGAGATCC TTGTATTTTG 350CATCCTGATA TATAGCCAAG ACAACACTGA TCATCTCAAA GCTATCAACT 400GAAGCAATAA GAGGTAAGCT ACCTCCCAGC ATTATGGCAA GCCTCACAGA 450CTTTGCATCA TCAAGAGGTA ATCCATAGGC TTGACTCAAA GGGTGGGAAG 500CAATCTTAGA TTTGATAGTA TTGAGATTCT CAGAATTCCC AGTTTCCTCA 550ACAAGCCTGA CCCTGATCAA GCTATCAAGC CTTCTGAAGG TCATGTCAGT 600GGCTCCAATC CTGTCTGAAG TTTTCTTTAT GGTAATTTTA CCAAAAGTAA 650AATCGATTTG CTTAATAACC TTCATTATGC TCTGACGATT CTTCAGGAAT 700GTCAGACATG AAATAATGCT CATCTTTTTG ATCTGGTCAA GGTTTTCCAG 750ACAAAAAGTC TTGAAGTTGA ATGCTACCAG ATTCTGATCT TCCTCAAACT 800CAAGGTCTTT GCCTTGTGTC AACAAAGCAA CAATGCTTTC CTTAGTGAGC 850TTAACCAT 858(2)SEQ ID NO9的信息(i)序列特征(A)长度2028个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO9AAATTCTCTT GCAGTGAAAT CTCTGCTCAT GTTAGCAGAA AACAACATCA50TGCCTAACTC TCAAGCTTTT GTCAAAGCTT CTACTGATTC TAATTTCAAG 100CTGAGCCTCT GGCTAAGGGT TCCAAAGGTT TTGAAGCAGA TTTCCATTCA 150GAAATTGTTC AAGGTTGCAG GAGATGAAAC AAATAAAACA TTTTATTTAT 200CTATTGCCTG CATTCCAAAC CATAACAGTG TTGAGACAGC TTTAAACATT 250ACTGTTATTT GCAAGCATCA GCTCCCAATT CGTAAATGTA AAACTCCTTT 300TGAATTATCA ATGATGTTTT CTGATTTAAA GGAGCCTTAC AACATTATTC 350ATGATCCTTC ATATCCCCAA AGGATTGTTC ATGCTCTGCT TGAAACTCAC 400ACATCTTTTG CACAAGTTCT TTGCAACAAC TTGCAAGAAG ATGTGATCAT 450CTACACCTTG AACAACCATG AGCTAACTCC TGGAAAGTTA GATTTAGGTG 500AAATAACTTT GAATTACAAT GAAGACGCCT ACAAAAGGAA ATATTTCCTT 550TCAAAAACAC TTGAATGTCT TCCATCTAAC ATACAAACTA TGTCTTATTT 600AGACAGCATC CAAATCCCTT CCTGGAAGAT AGACTTTGCC AGGGGAGAAA 650TTAAAATTTC TCCACAATCT ATTTCAGTTG CAAAATCTTT GTTAAATCTT 700GATTTAAGCG GGATTAAAAA GAAAGAATCT AAGATTAAGG AAGCATATGC 750TTCAGGATCA AAATGATCTT GCTGTGTCCA GCTTTTTCTA ATTATGTTAT 800GTTTATTTTC TTTCTTTACT TATAATTATT TTTCTGTTTG TCATTTCTTT 850CAAATTCCTC CTGTCTAGTA GAAACCATAA AAACAAAAAT AAAAATAAAA 900TAAAATCAAA ATAAAATAAA AATCAAAAAA TGAAATAAAA GCAACAAAAA 950AATTAAAAAA CAAAAAACCA AAAAAGATCC CGAAAGGACA ATTTTGGCCA 1000AATTTGGGGT TTGTTTTTGT TTTTTGTTTT TTTGTTTTTT GTTTTTATTT 1050TTATTTTTAT TTTTATTTTT ATTTTATTTT ATTTTATGTT TTTGTTGTTT 1100TTGTTATTTT GTTATTTATT AAGCACAACA CACAGAAAGC AAACTTTAAT 1150TAAACACACT TATTTAAAAT TTAACACACT AAGCAAGCAC AAACAATAAA 1200GATAAAGAAA GCTTTATATA TTTATAGGCT TTTTTATAAT TTAACTTACA 1250GCTGCTTTTA AGCAAGTTCT GTGAGTTTTG CCTGTTTTTT AACCCCAAAC 1300ATTTCATAGA ACTTGTTAAG GGTTTCACTG TAATGTTCCA TAGCAATACT 1350TCCTTTAGCA TTAGGATTGG TGGAGCTAAG TATAGCAGCA TACTCTTTCC 1400CCTTCTTCAC CTGATCTTCA TTCATTTCAA ATGCTTTTCT TTTCAGCACA 1450GTGCAAACTT TTCCTAAGGC TTCCCTGGTG TCATACTTCT TTGGGTCGAT 1500CCCGAGATCC TTGTATTTTG CATCCTGATA TATAGCCAAG ACAACACTGA 1550TCATCTCAAA GCTATCAACT GAAGCAATAA GAGGTAAGCT ACCTCCCAGC 1600ATTATGGCAA GCCTCACAGA CTTTGCATCA TCAAGAGGTA ATCCATAGGC 1650TTGACTCAAA GGGTGGGAAG CAATCTTAGA TTTGATAGTA TTGAGATTCT 1700CAGAATTCCC AGTTTCCTCA ACAAGCCTGA CCCTGATCAA GCTATCAAGC 1750CTTCTGAAGG TCATGTCAGT GGCTCCAATC CTGTCTGAAG TTTTCTTTAT 1800GGTAATTTTA CCAAAAGTAA AATCGCTTTG CTTAATAACC TTCATTATGC 1850TCTGACGATT CTTCAGGAAT GTCAGACATG AAATAATGCT CATCTTTTTG 1900ATCTGGTCAA GGTTTTCCAG ACAAAAAGTC TTGAAGTTGA ATGCTACCAG 1950ATTCTGATCT TCCTCAAACT CAAGGTCTTT GCCTTGTGTC AACAAAGCAA 2000CAATGCTTTC CTTAGTGAGC TTAACCAT 2028(2)SEQ ID NO10的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO10TTCTGGTCTT CTTCAAACT CA 22(2)SEQ ID NO11的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO11CTGTAGCCAT GAGCAAAG 18(2)SEQ ID NO12的信息(i)序列特征(A)长度467个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑学线形(ii)分子类型肽(xi)序列描述SEQ ID NO12Met Ser Ser Gly Val Tyr Glu Ser Ile Ile Gln Thr Lys Ala Ser5 10 15Val Trp Gly Ser Thr Ala Ser Gly Lys Ser Ile Val Asp Ser Tyr20 25 30Trp Ile Tyr Glu Phe Pro Thr Gly Ser Pro Leu Val Gln Thr Gln35 40 45Leu Tyr Ser Asp Ser Arg Ser Lys Ser Ser Phe Gly Tyr Thr Ser50 55 60Lys Ile Gly Asp Ile Pro Ala Val Glu Glu Glu Ile Leu Ser Gln65 70 75Asn Val His Ile Pro Val Phe Asp Asp Ile Asp Phe Ser Ile Asn80 85 90Ile Asn Asp Ser Phe Leu Ala Ile Ser Val Cys Ser Asn Thr Val95 100 105Asn Thr Asn Gly Val Lys His Gln Gly His Leu Lys Val Leu Ser110 115 120Leu Ala Gln Leu His Pro Phe Glu Pro Val Met Ser Arg Ser Glu125 130 135Ile Ala Ser Arg Phe Arg Leu Gln Glu Glu Asp Ile Ile Pro Asp140 145 150Asp Lys Tyr Ile Ser Ala Ala Asn Lys Gly Ser Leu Ser Cys Val155 160 165Lys Glu His Thr Tyr Lys Val Glu Met Ser His Asn Gln Ala Leu170 175 180Gly Lys Val Asn Val Leu Ser Pro Asn Arg Asn Val His Glu Trp185 190 195Leu Tyr Ser Phe Lys Pro Asn Glu Asn Gln Ile Glu Ser Asn Asn200 205 210Arg Thr Val Asn Ser Leu Ala Val Lys Ser Leu Leu Met Ala Thr215 220 225Glu Asn Asn Ile Met Pro Asn Ser Gln Ala Phe Val Lys Ala Ser230 235 240Thr Asp Ser His Phe Lys Leu Ser Leu Gln Leu Arg Ile Pro Lys245 250 255Val Leu Lys Gln Ile Ala Ile Gln Lys Leu Phe Lys Phe Ala Gly260 265 270Asp Glu Thr Gly Lys Ser Phe Tyr Teu Ser Ile Ala Cys Ile Pro275 280 285Asn His Asn Ser Val Glu Thr Ala Leu Asn Val Thr Val Ile Cys290 295 300Arg His Gln Leu Pro Ile Pro Lys Ser Lys Ala Pro Phe Glu Leu305 310 315Ser Met Ile Phe Ser Asp Leu Lys Glu Pro Tyr Asn Thr Val His320 325 330Asp Pro Ser Tyr Pro Gln Arg Ile Val His Ala Leu Leu Glu Thr335 340 345His Thr Ser Phe Ala Gln Val Leu Cys Asn Lys Leu Gln Glu Asp350 355 360Val Ile Ile Tyr Thr Ile Asn Ser Pro Glu Leu Thr Pro Ala Lys365 370 375Leu Asp Leu Gly Glu Arg Thr Leu Asn Tyr Ser Glu Asp Ala Ser380 385 390Lys Lys Lys Tyr Phe Leu Ser Lys Thr Leu Glu Cys Leu Pro Val395 400 405Asn Val Gln Thr Met Ser Tyr Leu Asp Ser Ile Gln Ile Pro Ser410 415 420Trp Lys Ile Asp Phe Ala Arg Gly Glu Ile Arg Ile Ser Pro Gln425 430 435Ser Thr Pro Ile Ala Arg Ser Leu Leu Lys Leu Asp Leu Ser Lys440 445 450Ile Lys Glu Lys Lys Ser Leu Thr Trp Glu Thr Ser Ser Tyr Asp455 460 465Leu Glu;(2)SEQ ID NO13的信息(i)序列特征(A)长度258个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑学线形(ii)分子类型肽(xi)序列描述SEQ ID NO13Met Ser Lys Val Lys Leu Thr Lys Glu Asn Ile Val Ser Leu Leu5 10 15Thr Gln Ser Ala Asp Val Glu Phe Glu Glu Asp Gln Asn Gln Val20 25 30Ala Phe Asn Phe Lys Thr Phe Cys Gln Glu Asn Leu Asp Leu Ile35 40 45Lys Lys Met Ser Ile Thr Ser Cys Leu Thr Phe Leu Lys Asn Arg50 55 60Gln Gly Ile Met Lys Val Val Asn Gln Ser Asp Phe Thr Phe Gly65 70 75Lys Val Thr Ile Lys Lys Asn Ser Glu Arg Val Gly Ala Lys Asp80 85 90Met Thr Phe Arg Arg Leu Asp Ser Met Ile Arg Val Lys Leu Ile95 100 105Glu Glu Thr Ala Asn Asn Glu Asn Leu Ala Ile Ile Lys Ala Lys110 115 120Ile Ala Ser His Pro Leu Val Gln Ala Tyr Gly Leu Pro Leu Ala125 130 135Asp Ala Lys Ser Val Arg Leu Ala Ile Met Leu Gly Gly Ser Ile140 145 150Pro Leu Ile Ala Ser Val Aso Ser Phe Glu Met Ile Ser Val Val155 160 165Leu Ala Ile Tyr Gln Asp Ala Lys Tyr Lys Glu Leu Gly Ile Glu170 175 180Pro Thr Lys Tyr Asn Thr Lys Glu Ala Leu Gly Lys Val Cys Thr185 190 195Val Leu Lys Ser Lys Gly Phe Thr Met Asp Asp Ala Gln Ile Asn200 205 210Lys Gly Lys Glu Tyr Ala Lys Ile Leu Ser Ser Cys Asn Pro Asn215 220 225Ala Lys Gly Ser Ile Ala Met Asp Tyr Tyr Ser Asp Asn Leu Asp230 235 240Lys Phe Tyr Glu Met Phe Gly Val Lys Lys Glu Ala Lys Ile Ala245 250 255Gly Val Ala(2)SEQ ID NO14的信息(i)序列特征(A)长度3049个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DAN(xi)序列描述SEQ ID NO14AGAGCAATTG GGTCATTTTT TATTCTAAAT CGAACCTCAA CTAGCAAATC 50TCAGAACTGT AATAAGCACA AGAGCACAAG AGCCACAATG TCATCAGGTG100TTTATGAATC GATCATTCAG ACAAAGGCTT CAGTTTGGGG ATCGACAGCA150TCTGGTAAGT CCATCGTGGA TTCTTACTGG ATTTATGAGT TTCCAACTGG200TTCTCCACTG GTTCAAACTC AGTTGTACTC TGATTCGAGG AGCAAAAGTA250GCTTCGGCTA CACTTCAAAA ATTGGTGATA TTCCTGCTGT AGAGGAGGAA300ATTTTATCTC AGAACGTTCA TATCCCAGTG TTTGATGATA TTGATTTCAG350CATCAATATC AATGATTCTT TCTTGGCAAT TTCTGTTTGT TCCAACACAG400TTAACACCAA TGGAGTGAAG CATCAGGGTC ATCTTAAAGT TCTTTCTCTT450GCCCAATTGC ATCCCTTTGA ACCTGTGATG AGCAGGTCAG AGATTGCTAG500CAGATTCCGG CTCCAAGAAG AAGATATAAT TCCTGATGAC AAATATATAT550CTGCTGCTAA CAAGGGATCT CTCTCCTGTG TCAAAGAACA TACTTACAAA600GTCGAAATGA GCCACAATCA GGCTTTAGGC AAAGTGAATG TTCTTTCTCC650TAACAGAAAT GTTCATGAGT GGCTGTATAG TTTCAAACCA AATTTCAACC700AGATCGAAAG TAATAACAGA ACTGTAAATT CTCTTGCAGT CAAATCTTTG750CTCATGGCTA CAGAAAACAA CATTATGCCT AACTCTCAAG CTTTTGTTAA800AGCTTCTACT GATTCTCATT TTAAGTTGAG CCTTTGGCTG AGAATTCCAA850AAGTTTTGAA GCAAATAGCC ATACAGAAGC TCTTCAAGTT TGCAGGAGAC900GAAACCGGTA AAAGTTTCTA TTTGTCTATT GCATGCATCC CAAATCACAA950CAGTGTGGAA ACAGCTTTAA ATGTCACTGT TATATGTAGA CATCAGCTTC 1000CAATCCCTAA GTCCAAAGCT CCTTTTGAAT TATCAATGAT TTTCTCCGAT 1050CTGAAAGAGC CTTACAACAC TGTGCATGAT CCTTCATATC CTCAAAGGAT 1100TGTTCATGCT TTGCTTGAGA CTCACACTTC CTTTGCACAA GTTCTCTGCA 1150ACAAGCTGCA AGAAGATGTG ATCATATATA CTATAAACAG CCCTGAACTA 1200ACCCCAGCTA AGCTGGATCT AGGTGAAAGA ACCTTGAACT ACAGTGAAGA 1250TGCTTCGAAG AAGAAGTATT TTCTTTCAAA AACACTCGAA TGCTTGCCAG 1300TAAATGTGCA GACTATGTCT TATTTGGATA GCATCCAGAT TCCTTCATGG 1350AAGATAGACT TTGCCAGAGG AGAGATCAGA ATCTCCCCTC AATCTACTCC 1400TATTGCAAGA TCTTTGCTCA AGCTGGATTT GAGCAAGATC AAGGAAAAGA 1450AGTCCTTGAC TTGGGAAACA TCCAGCTATG ATCTAGAATA AAAGTGGCTC 1500ATACTACTCT AAGTAGTATT TGTCAACTTG CTTATCCTTT ATGTTGTTTA 1550TTTCTTTTAA ATCTAAAGTA AGTTAGATTC AAGTAGTTTA GTATGCTATA 1600GCATTATTAC AAAAAATACA AAAAAATACA AAAAAATACA AAAAATATAA 1650AAAACCCAAA AAGATCCCAA AAGGGACGAT TTGGTTGATT TACTCTGTTT 1700TAGGCTTATC TAAGCTGCTT TTGTTTGAGC AAAATAACAT TGTAACATGC 1750AATAACTGGA ATTTAAAGTC CTAAAAGAAG TTTCAAAGGA CAGCTTAGCC 1800AAAATTGGTT TTTGTTTTTG TTTTTTTGTT TTTTGTTTTT TTGTTTTATT 1850TTTATTTTTA GTTTATTTTT TGTTTTTGTT ATTTTTATTT TTATTTTATT 1900TTCTTTTATT TTATTTATAT ATATATCAAA CACAATCCAC ACAAATAATT 1950TTAATTTCAA ACATTCTACT GATTTAACAC ACTTAGCCTG ACTTTATCAC 2000ACTTAACACG CTTAGTTAGG CTTTAACACA CTGAACTGAA TTAAAACACA 2060CTTAGTATTA TGCATCTCTT AATTAACACA CTTTAATAAT ATGCATCTCT 2100GAATCAGCCT TAAAGAAGCT TTTATGCAAC ACCAGCAATC TTGGCCTCTT 2150TCTTAACTCC AAACATTTCA TAGAATTTGT CAAGATTATC ACTGTAATAG 2200TCCATAGCAA TGCTTCCCTT AGCATTGGGA TTGCAAGAAC TAAGTATCTT 2250GGCATATTCT TTCCCTTTGT TTATCTGTGC ATCATCCATT GTAAATCCTT 2300TGCTTTTAAG CACTGTGCAA ACCTTCCCCA GAGCTTCCTT AGTGTTGTAC 2350TTAGTTGGTT CAATCCCTAA CTCCTTGTAC TTTGCATCTT GATATATGGC 2400AAGAACAACA CTGATCATCT CGAAGCTGTC AACAGAAGCA ATGAGAGGGA 2450TACTACCTCC AAGCATTATA GCAAGTCTCA CAGATTTTGC ATCTGCCAGA 2500GGCAGCCCGT AAGCTTGGAC CAAAGGGTGG GAGGCAATTT TTGCTTTGAT 2550AATAGCAAGA TTCTCATTGT TTGCAGTCTC TTCTATGAGC TTCACTCTTA 2600TCATGCTATC AAGCCTCCTG AAAGTCATAT CCTTAGCTCC AACTCTTTCA 2650GAATTTTTCT TTATCGTGAC CTTACCAAAA GTAAAATCAC TTTGGTTCAC 2700AACTTTCATA ATGCCTTGGC GATTCTTCAA GAAAGTCAAA CATGAAGTGA 2750TACTCATTTT CTTAATCAGG TCAAGATTTT CCTGACAGAA AGTCTTAAAG 2800TTGAATGCGA CCTGGTTCTG GTCTTCTTCA AACTCAACAT CTGCAGATTG 2850AGTTAAAAGA GAGACAATGT TTTCTTTTGT GAGCTTGACC TTAGACATGG 2900TGGCAGTTTA GATCTAGACC TTTCTCGAGA GATAAGATTC AAGGTGAGAA 2950AGTGCAACAC TGTAGACCGC GGTCGTTACT TATCCTGTTA ATGTGATGAT 3000TTGTATTGCT GAGTATTAGG TTTTTGAATA AAATTGACAC AATTGCTCT 3049(2)SEQ ID NO15的信息(i)序列特征(A)长度778个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO15ATG CAA CAC CAG CAA TCT TGG CCT CTT TCT TAA CTC CAA 39ACA TTT CAT AGA ATT TGT CAA GAT TAT CAC TGT AAT AGT 78CCA TAG CAA TGC TTC CCT TAG CAT TGG GAT TGC AAG AAC 117TAA GTA TCT TGG CAT ATT CTT TCC CTT TGT TTA TCT GTG 156CAT CAT CCA TTG TAA ATC CTT TGC TTT TAA GCA CTG TGC 195AAA CCT TCC CCA GAG CTT CCT TAG TGT TGT ACT TAG TTG 234GTT CAA TCC CTA ACT CCT TGT ACT TTG CAT CTT GAT ATA 273TGG CAA GAA CAA CAC TGA TCA TCT CGA AGC TGT CAA CAG 312AAG CAA TGA GAG GGA TAC TAC CTC CAA GCA TTA TAG CAA 351GTC TCA CAG ATT TTG CAT CTG CCA GAG GCA GCC CGT AAG 390CTT GGA CCA AAG GGT GGG AGG CAA TTT TTG CTT TGA TAA 429TAG CAA GAT TCT CAT TGT TTG CAG TCT CTT CTA TGA GCT 468TCA CTC TTA TCA TGG TAT CAA GCC TCC TGA AAG TCA TAT 507CCT TAG CTC VAA CTC TTT CAG AAT TTT TCT TTA TCG TGA 546CCT TAC CAA AAG TAA AAT CAC TTT GGT TCA CAA CTT TCA 585TAA TGC CTT GGC GAT TCT TCA AGA AAG TCA AAC ATG AAG 524TGA TAC TCA TTT TCT TAA TCA GGT CAA GAT TTT CCT GAC 663AGA AAG TCT TAA AGT TGA ATG CGA CCT GGT TCT GGT CTT 702CTT CAA ACT CAA CAT CTG CAG ATT GAG TTA AAA GAG AGA 741CAA TGT TTT CTT TTG TGA GCT TGA CCT TAG ACA TGG 778(2)SEQ ID NO16的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO16GTTCTGAGAT TTGCTAGT 18(2)SEQ ID NO17的信息(i)序列特征(A)长度18个碱基对(B)类型核酸
(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO17TTATATCTTC TTCTTGGA 18(2)SEQ ID NO18的信息(i)序列特征(A)长度1401个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO18ATG TCA TCA GGT GTT TAT GAA TCG ATC ATT CAG ACA AAG 39GCT TCA GTT TGG GGA TCG ACA GCA TCT GGT AAG TCC ATC 78GTG GAT TCT TAC TGG ATT TAT GAG TTT CCA ACT GGT TCT 117CCA CTG GTT CAA ACT CAG TTG TAC TCT GAT TCG AGG AGC 156AAA AGT AGC TTC GGC TAC ACT TCA AAA ATT GGT GAT ATT 195CCT GCT GTA GAG GAG GAA ATT TTA TCT CAG AAC GTT CAT 234ATC CCA GTG TTT GAT GAT ATT GAT TTC AGC ATC AAT ATC 273AAT GAT TCT TTC TTG GCA ATT TCT GTT TGT TCC AAC ACA 312GTT AAC ACC AAT GGA GTG AAG CAT CAG GGT CAT CTT AAA 351GTT CTT TCT CTT GCC CAA TTG CAT CCC TTT GAA CCT GTG 390ATG AGC AGG TCA GAG ATT GCT AGC AGA TTC CGG CTC CAA 429GAA GAA GAT ATA ATT CCT GAT GAC AAA TAT ATA TGT GCT 468GCT AAC AAG GGA TCT CTC TCC TGT GTC AAA GAA CAT ACT 507TAC AAA GTC GAA ATG AGC CAC AAT CAG GCT TTA GGC AAA 546GTG AAT GTT CTT TCT CCT AAC AGA AAT GTT CAT GAG TGG 585CTG TAT AGT TTC AAA CCA AAT TTC AAC CAG ATC GAA AGT624AAT AAC AGA ACT GTA AAT TCT CTT GCA GTC AAA TCT TTG663CTC ATG GCT ACA GAA AAC AAC ATT ATG CCT AAC TCT CAA702GCT TTT GTT AAA GCT TCT ACT GAT TCT CAT TTT AAG TTG741AGC CTT TGG CTG AGA ATT CCA AAA GTT TTG AAG CAA ATA780GCC ATA CAG AAG CTC TTC AAG TTT GCA GGA GAC GAA ACC819GGT AAA AGT TTC TAT TTG TCT ATT GCA TGC ATC CCA AAT858CAC AAC AGT GTG GAA ACA GCT TTA AAT GTC ACT GTT ATA897TGT AGA CAT CAG CTT CCA ATC CCT AAG TCC AAA GCT CCT936TTT GAA TTA TCA ATG ATT TTC TCC GAT CTG AAA GAG CCT975TAC AAC ACT GTG CAT GAT CCT TCA TAT CCT CAA AGG ATT 1014GTT CAT GCT TTG CTT GAG ACT CAC ACT TCC TTT GCA CAA 1053GTT CTC TGC AAC AAG CTG CAA GAA GAT GTG ATC ATA TAT 1092ACT ATA AAC AGC CCT GAA CTA ACC CCA GCT AAG CTG GAT 1131CTA GGT GAA AGA ACC TTG AAC TAC AGT GAA GAT GCT TCG 1170AAG AAG AAG TAT TTT CTT TCA AAA ACA CTC GAA TGC TTG 1209CCA GTA AAT GTG CAG ACT ATG TCT TAT TTG GAT AGC ATC 1248CAG ATT CCT TCA TGG AAG ATA GAC TTT GCC AGA GGA GAG 1287ATC AGA ATC TCC CCT CAA TCT ACT CCT ATT GCA AGA TCT 1326TTG CTC AAG CTG GAT TTG AGC AAG ATC AAG GAA AAG AAG 1365TCC TTG ACT TGG GAA ACA TCC AGC TAT GAT CTA GAA 1401(2)SEQ ID NO19的信息(i)序列特征(A)长度777个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO19ATG TCT AAG GTC AAG CTC ACA AAA GAA AAC ATT GTC TCT CTT TTA 45ACT CAA TCT GCA GAT GTT GAG TTT GAA GAA GAC CAG AAC CAG GTC 90GCA TTC AAC TTT AAG ACT TTC TGT CAG GAA AAT CTT GAC CTG ATT135AAG AAA ATG AGT ATC ACT TCA TGT TTG ACT TTC TTG AAG AAT CGC180CAA GGC ATT ATG AAA GTT GTG AAC CAA AGT GAT TTT ACT TTT GGT225AAG GTC ACG ATA AAG AAA AAT TCT GAA AGA GTT GGA GCT AAG GAT270ATG ACT TTC AGG AGG CTT GAT AGC ATG ATA AGA GTG AAG CTC ATA315GAA GAG ACT GCA AAC AAT GAG AAT CTT GCT ATT ATC AAA GCA AAA360ATT GCC TCC CAC CCT TTG GTC CAA GCT TAC GGG CTG CCT CTG GCA405GAT GCA AAA TCT GTG AGA CTT GCT ATA ATG CTT GGA GGT AGT ATC450CCT CTC ATT GCT TCT GTT GAC AGC TTC GAG ATG ATC AGT GTT GTT495CTT GCC ATA TAT CAA GAT GCA AAG TAC AAG GAG TTA GGG ATT GAA540CCA ACT AAG TAC AAC ACT AAG GAA GCT CTG GGG AAG GTT TGC ACA585GTG CTT AAA AGC AAA GGA TTT ACA ATG GAT GAT GCA CAG ATA AAC630AAA GGG AAA GAA TAT GCC AAG ATA CTT AGT TCT TGC AAT CCC AAT675GCT AAG GGA AGC ATT GCT ATG GAC TAT TAC AGT GAT AAT CTT GAC720AAA TTC TAT GAA ATG TTT GGA GTT AAG AAA GAG GCC AAG ATT GCT765GGT GTT GCA TAA 777(2)SEQ ID NO20的信息(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO20TACTTATCTA GAACCATGGA CAAAGCAAAG ATTACCAAGG 40(2)SEQ ID NO21的信息(i)序列特征
(A)长度42个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO21TACAGTGGAT CCATGGTTAT TTCAAATAAT TTATAAAAGC AC 42(2)SEQ ID NO22的信息(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO22AGCATTGGAT CCATGGTTAA CACACTAAGC AAGCAC 36(2)SEQ ID NO23的信息(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO23AGCTAATCTA GAACCATGGA TGACTCACTA AGGAAAGCAT TGTTGC 46(2)SEQ ID NO24的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO24CCCACTATCC TTCGCAAGAC CC 22(2)SEQ ID NO25的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO25TACAGTGGAT CCATGGTTAA GGTAATCCAT AGGCTTGAC 39(2)SEQ ID NO26的信息(i)序列特征(A)长度40个碱基对(B)类型核酸
(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO26AGCTAACCAT GGTTAAGCTC ACTAAGGGAAA GCATTGTTGC 40(2)SEQ ID NO27的信息(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO27AGCTAATCTA GAACCATGGA TGACTCACTA AGGAAAGCAT TGTTGC 46(2)SEQ ID NO28的信息(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO28AGCATTGGAT CCATGGTTAA CACACTAAGC AAGCAC 36(2)SEQ ID NO29的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO29TACAGTTCTA GAACCATGGA TGATGCAAAG TCTGTGAGG 39(2)SEQ ID NO30的信息(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(xi)序列描述SEQ ID NO30AGATTCTCTA GACCATGGTG ACTTGATGAG CAAAGTCTGT GAGGCTTGC 49因此,在我们已经对本发明的优选实施方案进行阐明和描述的时候,应理解为对本发明能够进行改变和修改,所以我们不希望被前述的确切术语所限制,希望我们自己能利用使本发明适合各种不同用途和情况所做的这种改变和变化。这种改变和修改,如,包括结构上相似的核酸序列的替换,其中所述序列与变化的序列间的差异使得用该变化的序列几乎不会带来任何好处(如果有好处的话),也就是说,该序列实质上产生与如前所述相似的结果。因此,由替换、缺失、插入、或增加核苷酸(在核苷酸序列内)或氨基酸(在肽序列内)所致的实质上并不会改变这些序列特别是上面所详述的序列的功能的序列变化被视为是在本发明的范围内。另外,我们意欲将本发明加以修改,将来自不同分离株的N基因放在一单一的盒子(cassette)里,这些基因按照本发明使Tospovirus感染的植物产生抗性或免疫性,用该盒作为一个转基因以使获得Tospoviruses广泛的抗性,特别是对TSWV-BL,TSWV-B和INSV的抗性。相应地,等同物全长范围内的这种变化和改变当然是在等同物的全部范围内,因此也在下面所述的权利要求书的范围之内。
因此,已经对我们的发明和方式及制造和使用它的方法进行了全面、清楚、简明和准确的描述,以便本发明所属领域或与本发明极相近领域的任何技术人员能够制造和使用。
权利要求
1.选自下列的分离的核苷酸序列AAATTCTCTT GCAGTGAAAT CTCTGCTCAT GTTAGCAGAA AACAACATCA50TGCCTAACTC TCAAGCTTTT GTCAAAGCTT CTACTGATTC TAATTTCAAG 100CTGAGCCTCT GGCTAAGGGT TCCAAAGGTT TTGAAGCAGA TTTCCATTCA 150GAAATTGTTC AAGGTTGCAG GAGATGAAAC AAATAAAACA TTTTATTTAT 200CTATTGCCTG CATTCCAAAG CATAACAGTG TTGAGACAGC TTTAAACATT 250ACTGTTATTT GCAAGCATCA GCTCCCAATT CGTAAATGTA AAACTCCTTT 300TGAATTATCA ATGATGTTTT CTGATTTAAA GGAGCCTTAC AACATTATTC 350ATGATGCTTC ATATCCCCAA AGGATTGTTC ATGCTCTGCT TGAAACTCAC 400ACATCTTTTG CACAAGTTCT TTGCAACAAC TTGCAAGAAG ATGTGATCAT 450CTACACCTTG AACAACCATG AGCTAACTCC TGGAAAGTTA GATTTAGGTG 500AAATAACTTT GAATTACAAT GAAGACGCCT ACAAAAGGAA ATATTTCCTT 550TCAAAAACAC TTGAATGTCT TCCATCTAAC ATACAAACTA TGTCTTATTT 600AGACAGCATC CAAATCCCTT CCTGGAAGAT AGACTTTGCC AGGGGAGAAA 650TTAAAATTTC TCCACAATCT ATTTCAGTTG CAAAATCTTT GTTAAATCTT 700GATTTAAGCG GGATTAAAAA GAAAGAATCT AAGATTAAGG AAGCATATGC 750TTCAGGATCA AAATGATCTT GCTGTGTCCA GCTTTTTCTA ATTATGTTAT 800GTTTATTTTC TTTCTTTACT TATAATTATT TTTCTGTTTG TCATTTCTTT 850CAAATTCCTC CTGTCTAGTA GAAACCATAA AAACAAAAAT AAAAATAAAA 900TAAAATCAAA ATAAAATAAA AATCAAAAAA TGAAATAAAA GCAACAAAAA 950AATTAAAAAA CAAAAAACCA AAAAAGATCC CGAAAGGACA ATTTTGGCCA 1000AATTTGGGGT TTGTTTTTGT TTTTTGTTTT TTTGTTTTTT GTTTTTATTT 1050TTATTTTTAT TTTTATTTTT ATTTTATTTT ATTTTATGTT TTTGTTGTTT 1100TTGTTATTTT GTTATTTATT AAGCACAACA CACAGAAAGCA AACTTTAAT 1150TAAACACACT TATTTAAAAT TTAACACACT AAGCAAGCACA AACAATAAA 1200GATAAAGAAA GCTTTATATA TTTATAGGCT TTTTTATAAT TTAACTTACA 1250GCTGCTTTTA AGCAAGTTCT GTGAGTTTTG CCTGTTTTTT AACCCCAAAC 1300ATTTCATAGA ACTTGTTAAG GGTTTCACTG TAATGTTCCA TAGCAATACT 1350TCCTTTAGCA TTAGGATTGC TGGAGCTAAG TATAGCAGCA TACTCTTTCC 1400CCTTCTTCAC CTGATCTTCA TTCATTTCAA ATGCTTTTCT TTTCAGCACA 1450GTGCAAACTT TTCCTAAGGC TTCCCTGGTG TCATACTTCT TTGGGTCGAT 1500CCCGAGATCC TTGTATTTTG CATCCTGATA TATAGCCAAG ACAACACTGA 1550TCATCTCAAA GCTATCAACT GAAGCAATAA GAGGTAAGCT ACCTCCCAGC 1600ATTATGGCAA GCCTCACAGA CTTTGCATCA TCAAGAGGTA ATCCATAGGC 1650TTGAATCAAA GGGTGGGAAG CAATCTTAGA TTTGATAGTA TTGAGATTCT 1700CAGAATTCC 1709;TTAACACACT AAGCAAGCAC AAACAATAAA GATAAAGAAA GCTTTATATA50TTTATAGGCT TTTTTATAAT TTAACTTACA GCTGCTTTTA AGCAAGTTCT 100GTGAGTTTTG CCTGTTTTTT AACCCCAAAC ATTTCATAGA ACTTGTTAAG 150GGTTTCACTG TAATGTTCCA TAGCAATACT TCCTTTAGCA TTAGGATTGC 200TGGAGCTAAG TATAGCAGCA TACTCTTTCC CCTTCTTCAC CTGATCTTCA 250TTCATTTCAA ATGCTTTTCT TTTCAGCACA GTGCAAACTT TTCCTAAGGC300TTCCCTGGTG TCATACTTCT TTGGGTCGAT CCCGAGATCC TTGTATTTTG350CATCCTGATA TATAGCCAAG ACAACACTGA TCATCTCAAA GCTATCAACT400GAAGCAATAA GAGGTAAGCT ACCTCCCAGC ATTATGGCAA GCCTCACAGA450CTTTGCATCA TCAAGAGGTA ATCCATAGGC TTGACTCAAA GGGTGGGAAG500CAATCTTAGA TTTGATAGTA TTGAGATTCT CAGAATTCCC AGTTTCCTCA550ACAAGCCTGA CCCTGATCAA GCTATCAAGC CTTCTGAAGG TCATGTCAGT600GGCTCCAATC CTGTCTGAAG TTTTCTTTAT GGTAATTTTA CCAAAAGTAA650AATCGCTTTG CTTAATAACC TTCATTATGC TCTGACGATT CTTCAGGAAT700GTCAGACATG AAATAATGCT CATCTTTTTG ATCTGGTCAA GGTTTTCCAG750ACAAAAAGTC TTGAAGTTGA ATGCTACCAG ATTCTGATCT TCCTCAAACT800CAAGGTCTTT GCCTTGTGTC AACAAAGCAA CAATGCTTTC CTTAGTGAGC850TTAACCAT 858;AAATTCTCTT GCAGTGAAAT CTCTGCTCAT GTTAGCAGAA AACAACATCA 50TGCCTAACTC TCAAGCTTTT GTCAAAGCTT CTACTGATTC TAATTTCAAG100CTGAGCCTCT GGCTAAGGGT TCCAAAGGTT TTGAAGCAGA TTTCCATTCA150GAAATTGTTC AAGGTTGCAG GAGATGAAAC AAATAAAACA TTTTATTTAT200CTATTGCCTG CATTCCAAAC CATAACAGTG TTGAGACAGC TTTAAACATT250ACTGTTATTT GCAAGCATCA GCTCCCAATT CGTAAATGTA AAACTCCTTT300TGAATTATCA ATGATGTTTT CTGATTTAAA GGAGCCTTAC AACATTATTC350ATGATCCTTC ATATCCCCAA AGGATTGTTC ATGCTCTGCT TGAAACTCAC400ACATCTTTTG CACAAGTTCT TTGCAACAAC TTGCAAGAAG ATGTGATCAT450CTACACCTTG AACAACCATG AGCTAACTCC TGGAAAGTTA GATTTAGGTG500AAATAACTTT GAATTACAAT GAAGACGCCT ACAAAAGGAA ATATTTCCTT550TCAAAAACAC TTGAATGTCT TCCATCTAAC ATACAAACTA TGTCTTATTT600AGACAGCATC CAAATCCCTT CCTGGAAGAT AGACTTTGCC AGGGGAGAAA650TTAAAATTTC TCCACAATCT ATTTCAGTTG CAAAATCTTT GTTAAATCTT700GATTTAAGCG GGATTAAAAA GAAAGAATCT AAGATTAAGG AAGCATATGC750TTCAGGATCA AAATGATCTT GCTGTGTCCA GCTTTTTCTA ATTATGTTAT800GTTTATTTTC TTTCTTTACT TATAATTATT TTTCTGTTTG TCATTTCTTT850CAAATTCCTC CTGTCTAGTA GAAACCATAA AAACAAAAAT AAAAATAAAA900TAAAATCAAA ATAAAATAAA AATCAAAAAA TGAAATAAAA GCAACAAAAA950AATTAAAAAA CAAAAAACCA AAAAAGATCC CGAAAGGACA ATTTTGGCCA 1000AATTTGGGGT TTGTTTTTGT TTTTTGTTTT TTTGTTTTTT GTTTTTATTT 1050TTATTTTTAT TTTTATTTTT ATTTTATTTT ATTTTATGTT TTTGTTGTTT 1100TTGTTATTTT GTTATTTATT AAGCACAACA CACAGAAAGC AAACTTTAAT 1150TAAACACACT TATTTAAAAT TTAACACACT AAGCAAGCAC AAACAATAAA 1200GATAAAGAAA GCTTTATATA TTTATAGGCT TTTTTATAAT TTAACTTACA 1250GCTGCTTTTA AGCAAGTTCT GTGAGTTTTG CCTGTTTTTT AACCCCAAAC 1300ATTTCATAGA ACTTGTTAAG GGTTTCACTG TAATGTTCCA TAGCAATACT 1350TCCTTTAGCA TTAGGATTGC TGGAGCTAAG TATAGCAGCA TACTCTTTCC 1400CCTTCTTCAC CTGATCTTCA TTCATTTCAA ATGCTTTTCT TTTCAGCACA 1450GTGCAAACTT TTCCTAAGGC TTCCCTGGTG TCATACTTCT TTGGGTCGAT 1500CCCGAGATCC TTGTATTTTG CATCCTGATA TATAGCCAAG ACAACACTGA 1550TCATCTCAAA GCTATCAACT GAAGCAATAA GAGGTAAGCT ACCTCCCAGC 1600ATTATGGCAA GCCTCACAGA CTTTGCATCA TCAAGAGGTA ATCCATAGGC 1650TTGACTCAAA GGGTGGGAAG CAATCTTAGA TTTGATAGTA TTGAGATTCT1700CAGAATTCCC AGTTTCCTCA ACAAGCCTGA CCCTGATCAA GCTATCAAGC1750CTTCTGAAGG TCATGTCAGT GGCTCCAATC CTGTCTGAAG TTTTCTTTAT1800GGTAATTTTA CCAAAAGTAA AATCGCTTTG CTTAATAACC TTCATTATGC1850TCTGACGATT CTTCAGGAAT GTCAGACATG AAATAATGCT CATCTTTTTG1900ATGTGGTCAA GGTTTTCCAG ACAAAAAGTC TTGAAGTTGA ATGCTACCAG1950ATTCTGATCT TCCTCAAACT CAAGGTCTTT GCCTTGTGTC AACAAAGCAA2000CAATGCTTTC CTTAGTGAGC TTAACCAT 2028;和AGAGCAATTG GGTCATTTTT TATTCTAAAT CGAACCTCAA CTAGCAAATC 50TCAGAACTGT AATAAGCACA AGAGCACAAG AGCCACAATG TCATCAGGTG 100TTTATGAATC GATCATTCAG ACAAAGGCTT CAGTTTGGGG ATCGACAGCA 150TCTGGTAAGT CCATCGTGGA TTCTTACTGG ATTTATGAGT TTCCAACTGG 200TTCTCCACTG GTTCAAACTC AGTTGTACTC TGATTCGAGG AGCAAAAGTA 250GCTTCGGCTA CACTTCAAAA ATTGGTGATA TTCCTGCTGT AGAGGAGGAA 300ATTTTATCTC AGAACGTTCA TATCCCAGTG TTTGATGATA TTGATTTCAG 350CATCAATATC AATGATTCTT TCTTGGCAAT TTCTGTTTGT TCCAACACAG 400TTAACACCAA TGGAGTGAAG CATCAGGGTC ATCTTAAAGT TCTTTCTCTT 450GCCCAATTGC ATCCCTTTGA ACCTGTGATG AGCAGGTCAG AGATTGCTAG 500CAGATTCCGG CTCCAAGAAG AAGATATAAT TCCTGATGAC AAATATATAT 550CTGCTGCTAA CAAGGGATCT CTCTCCTGTG TCAAAGAACA TACTTACAAA 600GTCGAAATGA GCCACAATCA GGCTTTAGGC AAAGTGAATG TTCTTTCTCC 650TAACAGAAAT GTTCATGAGT GGCTGTATAG TTTCAAACCA AATTTCAACC 700AGATCGAAAG TAATAACAGA ACTGTAAATT CTCTTGCAGT CAAATCTTTG 750CTCATGGCTA CAGAAAACAA CATTATGCCT AACTCTCAAG CTTTTGTTAA 800AGCTTCTACT GATTCTCATT TTAAGTTGAG CCTTTGGCTG AGAATTCCAA 850AAGTTTTGAA GCAAATAGCC ATACAGAAGC TCTTCAAGTT TGCAGGAGAC 900GAAACCGGTA AAAGTTTCTA TTTGTCTATT GCATGCATCC CAAATCACAA 950CAGTGTGGAA ACAGCTTTAA ATGTCACTGT TATATGTAGA CATCAGCTTC1000CAATCCCTAA GTCCAAAGCT CCTTTTGAAT TATCAATGAT TTTCTCCGAT1050CTGAAAGAGC CTTACAACAC TGTGCATGAT CCTTCATATC CTCAAAGGAT1100TGTTCATGCT TTGCTTGAGA CTCACACTTC CTTTGCACAA GTTCTCTGCA1150ACAAGCTGCA AGAAGATGTG ATCATATATA CTATAAACAG CCCTGAACTA1200ACCCCAGCTA AGCTGGATCT AGGTGAAAGA ACCTTGAACT ACAGTGAAGA1250TGCTTCGAAG AAGAAGTATT TTCTTTCAAA AACACTCGAA TGCTTGCCAG1300TAAATGTGCA GACTATGTCT TATTTGGATA GCATCCAGAT TCCTTCATGG1350AAGATAGACT TTGCCAGAGG AGAGATCAGA ATCTCCCCTC AATCTACTCC1400TATTGCAAGA TCTTTGCTCA AGCTGGATTT GAGCAAGATC AAGGAAAAGA1450AGTCCTTGAC TTGGGAAACA TCCAGCTATC ATCTAGAATA AAAGTGGCTC1500ATACTACTCT AAGTAGTATT TGTCAACTTG CTTATCCTTT ATGTTGTTTA1550TTTCTTTTAA ATCTAAAGTA AGTTAGATTC AAGTAGTTTA GTATGCTATA1600GCATTATTAC AAAAAATACA AAAAAATACA AAAAAATACA AAAAATATAA1650AAAACCCAAA AAGATCCCAA AAGGGACGAT TTGGTTGATT TACTCTGTTT1700TAGGCTTATC TAAGCTGCTT TTGTTTGAGC AAAATAACAT TGTAACATGC1750AATAACTGGA ATTTAAAGTC CTAAAAGAAG TTTCAAAGGA CAGCTTAGCC1800AAAATTGGTT TTTGTTTTTG TTTTTTTGTT TTTTGTTTTT TTGTTTTATT 1850TTTATTTTTA GTTTATTTTT TGTTTTTGTT ATTTTTATTT TTATTTTATT 1900TTCTTTTATT TTATTTATAT ATATATCAAA CACAATCCAC ACAAATAATT 1950TTAATTTCAA ACATTCTACT GATTTAACAC ACTTAGCCTG ACTTTATCAC 2000ACTTAACACG CTTAGTTAGG CTTTAACACA CTGAACTGAA TTAAAACACA 2050CTTAGTATTA TGCATCTCTT AATTAACACA CTTTAATAAT ATGCATCTCT 2100GAATCAGCCT TAAAGAAGCT TTTATGCAAC ACCAGCAATC TTGGCCTCTT 2150TCTTAACTCC AAACATTTCA TAGAATTTGT CAAGATTATC ACTGTAATAG 2200TCCATAGCAA TGCTTCCCTT AGCATTGGGA TTGCAAGAAC TAAGTATCTT 2250GGCATATTCT TTCCCTTTGT TTATCTGTGC ATCATCCATT GTAAATCCTT 2300TGCTTTTAAG CACTGTGCAA ACCTTCCCCA GAGCTTCCTT AGTGTTGTAC 2350TTAGTTGGTT CAATCCCTAA CTCCTTGTAC TTTGCATCTT GATATATGGC 2400AAGAACAACA CTGATCATCT CGAAGCTGTC AACAGAAGCA ATGAGAGGGA 2450TACTACCTCC AAGCATTATA GCAAGTCTCA CAGATTTTGC ATCTGCCAGA 2500GGCAGCCCGT AAGCTTGGAC CAAAGGGTGG GAGGCAATTT TTGCTTTGAT 2550AATAGCAAGA TTCTCATTGT TTGCAGTCTC TTCTATGAGC TTCACTCTTA 2600TCATGCTATC AAGCCTCCTG AAAGTCATAT CCTTAGCTCC AACTCTTTCA 2650GAATTTTTCT TTATCGTGAC CTTACCAAAA GTAAAATCAC TTTGGTTCAC 2700AACTTTCATA ATGCCTTGGC GATTCTTCAA GAAAGTCAAA CATGAAGTGA 2750TACTCATTTT CTTAATCAGG TCAAGATTTT CCTGACAGAA AGTCTTAAAG 2800TTGAATGCGA CCTGGTTCTG GTCTTCTTCA AACTCAACAT CTGCAGATTG 2850AGTTAAAAGA GAGACAATGT TTTCTTTTGT GAGCTTGACC TTAGACATGG 2900TGGCAGTTTA GATCTAGACC TTTCTCGAGA GATAAGATTC AAGGTGAGAA 2950AGTGCAACAC TGTAGACCGC GGTCGTTACT TATCCTGTTA ATGTGATGAT 3000TTGTATTGCT GAGTATTAGG TTTTTGAATA AAATTGACAC AATTGCTCT 3049
2.易于被Tospoviruses感染的植物,它有转基因插入到其基因组中,使其具有对Tospoviruses感染的抗性,所述转基因选自TSWV-BL,TSWV-10W,INSV-LI,TSWV-B、Tospovirus的核蛋白基因,所述转基因由TSWV-BL,TSWV-10W,TSWV-B,INSV-Beg和INSV-IL的部分或全长核蛋白基因序列、所述核蛋白基因序列的可翻译或不可翻译序列、和所述核蛋白基因序列的有义或反义基因序列组成。
3.一种使宿主植物具有Tospoviruses感染抗性的方法,包括在宿主植物中插入一转基因,该转基因选自TSWV-BL,TSWV-10W,INSV-Beg,INSV-LI,TSWV-B的核蛋白基因、或来自核蛋白基因的核苷酸序列的混合物。
全文摘要
本发明描述了西红柿斑点枯萎病毒(TSWV)核蛋白壳的核苷酸序列,和含有TSMV分离株的核蛋白壳核苷酸序列的转基因植物表现出对不同血清型的Tospoviruses具有抗性。另外,生产出含有源自莴苣的TSWV分离株核蛋白壳核苷酸序列的转基因植物,该植物(产生少量的核蛋白壳蛋白)表现出对同源和亲缘关系密切的病毒分离株的抗性;而当植物产生大量核蛋白壳蛋白时,该植物对同源分离株和亲缘关系远的无耐性坏死性斑点病毒(INSV)分离株具有适当水平的保护能力。
文档编号A01H5/00GK1118983SQ94191418
公开日1996年3月20日 申请日期1994年1月27日 优先权日1993年1月29日
发明者D·贡萨维斯, S-Z·彭 申请人:康乃尔研究基金会有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1