一种马铃薯M病毒基因组全序列及其应用的制作方法

文档序号:12056447阅读:202来源:国知局

本发明属于植物病毒技术领域,具体涉及一种马铃薯M病毒基因组全序列及其应用。



背景技术:

马铃薯M病毒(Potato virus M, PVM)属于香石竹潜隐病毒属(Carlavirus),电镜观察发现病毒粒子为线状,大小为640×10nm。马铃薯M病毒是通过蚜虫通过非持久性传播方式传播的,它的寄主是茄科和豆科的作物。马铃薯M病毒的病毒基因组为线状+ssRNA,长8.5kb。马铃薯M病毒根据病毒外壳蛋白氨基酸构建的系统进化树或其核苷酸序列相似性(72-82%),分为5个株系,其中病毒编码的223kDa、25kDa、12 kDa、7 kDa、34 kDa(外壳蛋白)、11kDa蛋白与其分离物的核苷酸同源性分别低于72%、75.1%、71.6%、59.1%、94.6%、97%,云南马铃薯分离物属于其中之一。



技术实现要素:

本发明的目的在于提供一种分离的核酸分子;第二目的在于提供所述的核酸分子的用途;第三目的在于提供一种分离的DNA分子。

本发明的第一目的是这样实现的,所述的核酸分子的核苷酸序列如SEQ ID NO:1所示或其反义序列。

在另一类优选例中,所述的核酸分子式DNA或RNA。

本发明的第二目的是这样实现的,所述的核酸分子用于制备检测马铃薯M病毒的引物、探针或试剂盒,或用于制备抗马铃薯M病毒的抗体。

本发明的第三目的是这样实现的,所述的DNA分子为SEQ ID NO:1所示或其反义序列中连续的150~8530个核苷酸所构成。

发明人通过常规的病样总RNA的提取和利用多对简并引物进行RT-PCR扩增、测定了侵染云南马铃薯的马铃薯M病毒基因组全序列。分析发现其基因组为线状、单链正义RNA,不含poly(A)全长8530nt,含6 个开读框(ORF),具香石竹潜隐病毒属(Carlavirus)典型结构特征。序列比较表明它与其他具有全基因组序列的马铃薯M病毒分离物各基因核苷酸相似性在57-75%之间,编码的5个基因其中病毒编码的223kDa、25kDa、12 kDa、7 kDa、34 kDa(外壳蛋白)、11kDa蛋白与其分离物的核苷酸同源性、相似性分别大于等于72%、75.1%、71.6%、59.1%、94.6%、97%,氨基酸序列同源性、相似性分别大于77.9%、83.41%、75.23%、58.5%、97.37%、95.37%的。根据病毒株系分类标准,马铃薯M病毒云南马铃薯分离物属于一个远缘株系。

马铃薯M病毒在马铃薯上引起斑驳、花叶、皱缩、叶片向外卷缩和枝条发育不良,严重影响生长。近年,我国番茄和人参果上有马铃薯M病毒为害的报道,但基因组序列比较分析发现,马铃薯M病毒马铃薯分离物与侵染番茄和人参果的马铃薯M病毒各基因核苷酸和编码蛋白核苷酸序列相似性在59-75%之间,序列差异较大,特异性明显,属于不同的株系。

PCR 和基因芯片诊断是一种快速而准确的检测方法,而这一类的诊断方法依赖于获得特异的基因序列。病毒的致病机制、传播特性的差异也是因为特异的基因序列。

发明人利用生物信息技术包括从NCBI网站上输入关键词香石竹潜隐病毒和马铃薯M病毒,通过检索获得相关核苷酸序列,在通过比对,根据比对结果,设计了用于扩增马铃薯M病毒基因组的简并引物,再利用分子生物学技术包括总RNA提取、RT-PCR、克隆、测序等技术,在中国首次获得了侵染马铃薯的马铃薯M病毒的全基因组序列。在此基础上,完成了本发明。

总体而言,本发明的多核苷酸可以是DNA 形式或RNA 形式。DNA 形式包括cDNA、基因组DNA 或人工合成的DNA。DNA 可以是单链的或是双链的。DNA 可以是编码链或非编码链。

本发明的基因组全长序列或其片段通常可以用PCR 扩增法、重组法或人工合成的方法获得。对于PCR 扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并按本领域技术人员已知的常规方法所制备的cDNA 库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR 扩增,然后再将各次扩增出的片段按正确次序拼接在一起。

第一方面,本发明提供了核酸,该核酸含有在SEQ ID NO :1所示的马铃薯M病毒的基因组核苷酸序列。还提供了含有与本文所公开的核苷酸序列有序列相同性的序列的核酸。根据具体的序列,序列相同性的程度宜大于72% ( 例如72%、75.1%、71.6%、59.1%、94.6%、97%或更高)。这些序列包括例如突变体和等位基因变体。

本发明还提供了包含本文所公开的一种或多种核苷酸序列片段的核酸。这些片段应包含诸序列中至少n个连续的氨基酸,并且根据具体的序列,n 为10 或更高( 例如,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,30,35,40,45,50,60,75,100 或更高)。较佳地,该片段是马铃薯M病毒基因组特有的,换言之在其他生物体的基因组中并不存在。更佳地,该片段是马铃薯M病毒毒株的基因组特有的。本发明还提供了与本文所提供的核酸发生杂交的核酸。杂交条件如本文中所述。

本发明还提供了核酸,该核酸包含与上述序列互补的序列( 例如,用于反义、用于探针、或用于扩增引物)。

当然,本发明的核酸可以用多种方法制备( 例如,化学合成、从DNA 文库、或从生物体本身制得等),并可采用各种形式( 例如单链、双链、载体、探针、引物等)。术语“核酸”包括DNA 和RNA,以及它们的类似物,如含有修饰骨架的那些类似物,还包括肽核酸(PNA) 等。

应理解,因为SEQ ID NO :1 基本上代表了马铃薯M病毒的完整基因组。

本发明还提供了含有本发明的核苷酸序列的载体( 如表达载体、测序载体、克隆载体等) 以及用这些载体转化的宿主细胞。

第二方面,本发明还提供了一种蛋白质,该蛋白质含有本文所示的马铃薯M病毒核苷酸序列中所编码的氨基酸序列。还提供了含有与这些蛋白质有序列相同性的序列的蛋白。根据具体的序列,序列相同性程度宜大于55% ( 例如58.5%、70%、73.3%、77.9%、82.1%、97%或更高)。序列相同性用如上所述的方法确定。这些同源蛋白包括本文所示的马铃薯M病毒核苷酸序列中所编码的突变体和等位基因变体。

本发明还提供了一种蛋白质,该蛋白质含有序列表中所公开的马铃薯M病毒核苷酸序列中所编码的氨基酸序列片段。这些片段应包含诸序列中至少n 个连续的氨基酸,并且根据具体的序列,n 为7 或更高( 例如,8、10、12、14、16、18、20 或更高)。这些片段宜包含该序列的表位。

可用各种测试来评估本发明蛋白的体内免疫原性。例如,蛋白质可以重组表达或者化学合成,并通过免疫印迹用于检测病原。该方法可用于ELISA、Western blot、捕获免疫RT-PCR、免疫电镜等来鉴定检测病原中的马铃薯M病毒。

本发明还提供了编码本发明蛋白的核酸。

第三方面,本发明还提供了含有本发明核酸的核苷酸序列的计算机、计算机存储器、计算机存储介质( 如软盘、硬盘、CD-ROM 等) 和/ 或计算机数据库。较佳地,它含有本文列出的一种或多种马铃薯M病毒核苷酸序列。

这可用于分析本文所列出马铃薯M病毒核苷酸序列。例如,可用于检索以鉴别序列中的开放阅读框(ORF) 或编码序列。

第四方面,本发明提供了鉴别氨基酸序列的方法,它包括步骤:检索本文所列出的马铃薯M病毒核苷酸序列中推定的开放阅读框或蛋白编码序列。类似地,本发明提供了此处所列出的马铃薯M病毒核苷酸序列在检索推定的开放阅读框或蛋白质编码序列中的用途。

开放阅读框或蛋白编码序列分析通常在计算机上用标准的生物信息技术进行。用于分析的典型算法或程序包括但不限于:DNAMAN、DNAstar等软件。

对开放阅读框或蛋白编码序列的检索可包括步骤:检索此处所列出的马铃薯M病毒核苷酸序列中的起始密码子和检索上游序列中的处于读框中终止密码子。中间的密码子就代表了推定的蛋白编码序列。通常,应检索一个序列中6 种可能的读框。

用这种方法鉴别出的氨基酸序列可用任何合适的系统进行表达,以获得蛋白。该蛋白可用于产生抗体,而该抗体识别在鉴别出的氨基酸序列中的表位。这些抗体可用于筛选马铃薯M病毒,以检测是否存在含所鉴别氨基酸序列的蛋白质。

此外,一旦鉴别出ORF 或蛋白编码序列,那么就可将该序列与序列数据库进行比较。序列分析工具可在例如NCBI(http://www.ncbi.nlm.nih.gov) 处找到,例如BLAST,BLAST2,BLASTn,BLASTp,tBLASTn,BLASTx,和tBLASTx 算法。用于比较的合适数据库包括非冗余GenBank,EMBL,DDBJ 和PDB 序列,以及非冗余GenBank CDS 翻译物,PDB,SwissProt,Spupdate 和PIR序列。这种比较可给出蛋白质功能的指示。

氨基酸序列中的疏水区可用以上算法加以预测,例如基于Esposti 等人的统计学研究的算法[″膜蛋白亲水性的关键评价″(Critical evaluation of the hydropathy of membrane proteins)(1990)Eur J Biochem 190 :207-219]。疏水区代表了潜在的跨膜区或疏水性前导序列,这暗示蛋白质可以被分泌或位于表面。这些特性通常是良好免疫原的标志。

类似地,可用PSORT 算法(http://www.psort.nibb.ac.jp) 来预测跨膜区或前导序列,以及用MOTIFS 程序来预测功能区(GCG Wisconsin & PROSITE)。

本发明还提供了一种核酸,该核酸含有本文所列出的马铃薯M病毒核苷酸序列中的开放阅读框或蛋白编码序列。此外,基于本发明所提供的基因组序列,还提供了若干种蛋白质,该蛋白质含有所述开放阅读框或蛋白编码序列所编码的氨基酸序列;编码的氨基酸序列如SEQ ID NO :2所示。

第五方面,本发明提供了结合这些蛋白的抗体。它们可能是多克隆的或单克隆的,可用本领域技术人员已知的任何合适方法制得。

本发明的抗体可以以各种不同方式使用,例如用于证实蛋白质的表达,或用于证实蛋白质表达的场所。例如,标记的抗体( 如荧光标记以用于FACS( 流式细胞分选仪)) 可以与完整的病毒一起孵育,而在病毒表面上存在标记就证实蛋白质的位置。

第六方面,本发明提供了各种方法。

本发明提供了一种生产本发明的蛋白的方法,该方法包括步骤:在诱导蛋白表达的条件下,培育本发明的宿主细胞。一种方法还可包括化学合成蛋白或化学合成( 至少部分合成) 核苷酸。

本发明提供了一种检测本发明的多核苷酸的方法,该方法包括下列步骤:(a) 在杂交条件下使本发明的核酸探针与生物样品接触,形成双链体;和(b) 检测所述双链体。

本发明提供了一种检测本发明的蛋白质的方法,该方法包括下列步骤:(a) 在适合形成抗体- 抗原复合物的条件下使本发明的抗体和生物样品接触;和(b) 检测所述复合物。

第七方面,本发明提供了检测选择性结合于抗原或多肽或蛋白质的抗体的方法,这些抗原或多肽或蛋白质是对马铃薯M病毒的任何毒种或毒株特异性的,较佳地是对马铃薯M病毒毒株特异性的,但更佳地是对马铃薯M病毒特异的。该方法包括步骤:(a) 在适合形成抗体- 抗原复合物的条件下,使本发明抗原或多肽或蛋白质与生物样品接触;和(b) 检测所述复合物。

方法综述

本发明提供了马铃薯M病毒核苷酸序列、和其所编码的氨基酸序列。利用这些所公开的序列,可以产生核酸探针试验和表达盒及载体。蛋白质还可化学合成。表达载体可以转入宿主细胞以产生蛋白。纯化或分离的多肽可用于产生抗体以检测马铃薯M病毒蛋白。而且,宿主细胞或提取物可用于生物试验以分离促效剂和拮抗剂。此外,利用这些序列,人们可检索以鉴定开放读框(ORF) 和鉴定氨基酸序列。蛋白质还可用于免疫原性组合物以及用作疫苗组份。

除非另有描述,本发明的实施将采用分子生物学、微生物学、重组DNA 和免疫学的常规技术,这些均是本领域技术人员所知的。这些技术在下列文献中有全面的描述:例如,Sambrook《分子克隆实验手册》第2 版(1989) ;《DNA 克隆》第I 和II 卷(D.N.Glover编1985) ;《寡核苷酸合成》(M.J.Gait 编,1984) ;《核酸杂交》(B.D.Hames 和S.J.Higgins编.1984) ;《转录和翻译》(B.D.Hames 和S.J.Higgins 编,1984) ;《固定化细胞和酶》(IRL 出版社,1986) ;B.Perbal,《分子克隆实用指南》(1984) ;《酶学方法》系列丛书(Academic Press,Inc.),尤其是154 和155 卷;Mayer 和Walker 编(1987),《细胞和分子生物学的免疫化学方法》(Academic Press,London) ;Scopes,(1987)《蛋白质纯化:原理和实践》第2 版(Springer-Verl ag,N.Y.),以及《实验免疫学手册》I-IV 卷(D.C.Weir 和C.C.Blackwell 编1986)。

在本说明书中采用了核苷酸和氨基酸的标准缩写。

本文引用的所有出版物、专利和专利申请均全部纳入本文作参考。

免疫诊断试验

本发明的马铃薯M病毒抗原或其抗原性片段,可用于免疫试验来检测抗体水平( 或相反,可用抗马铃薯M病毒抗体来检测抗原水平)。根据明确的免疫试验,可以开发重组抗原,以代替侵入性诊断方法。可检测生物学样品( 例如马铃薯样品) 中的马铃薯M病毒 蛋白或其片段的抗体。免疫试验的设计可作很大变化,其各种方案均是本领域中已知的。免疫试验的方案可基于例如竞争性、或直接反应或夹心型试验。方案例如还可采用固体支持物,或可以采用免疫沉淀法。大多数试验涉及采用标记的抗体或多肽;该标记例如可以是荧光标记、化学发光标记、放射活性标记或染料分子。扩增探针信号的试验也是已知的;其例子是采用生物素和亲和素的试验,酶标记的和介导的免疫试验,如ELISA 试验。

将合适的材料( 包括本发明的组合物) 以及进行试验所需的其它试剂和材料( 例如合适的缓冲液、盐溶液等) 和合适的试验说明书包装到合适的容器中,构成适用于免疫诊断且含有适当标记的试剂的试剂盒。

核酸杂交

“杂交”指两个核酸序列相互之间通过氢键而结合。通常,一个序列固定于固体载体,另一个将游离于溶液内。然后,在有利于形成氢键的条件下使两个序列相互接触。影响这种结合的因素包括:溶剂的类型和体积;反应温度;杂交时间;搅拌;封闭液相序列与固体载体非特异性结合的试剂(Denhardt’s 试剂或BLOTTO) ;各序列的浓度;是否使用化合物来增加序列结合的速度( 硫酸葡聚糖或聚乙二醇) ;以及杂交后洗涤条件的严谨程度。见Sambrook 等人[ 同上] 第2 卷,第9 章,9.47 至9.57 页。

“严谨性”指有利于非常相似的序列结合而不利于不同序列结合的杂交反应条件。例如,应选择温度和盐浓度的组合,使温度比所研究的杂交的Tm 计算值低大约120 至200℃。温度和盐浓度常可在前期初步实验中通过经验来确定,在初步实验中,固定在滤膜上的基因组DNA 样品与感兴趣的序列杂交,然后在不同的严谨度条件下洗涤。见Sambrook等人第9.50 页。

在设计杂交实验时,影响核酸杂交的一些因素可以方便地予以改变。杂交和洗涤时的温度以及洗涤时的盐浓度的调节最为简单。随着杂交温度( 即严谨度) 的升高,不同源的链之间发生杂交的可能性变得更少,结果背景值降低。如果放射性标记的探针并非与固定的片段完全同源( 这在基因家族和种间杂交实验中是常见的),则必须降低杂交温度,而背景值将会增加。洗涤温度以类似的方式影响杂交带的强度和背景值的程度。洗涤的严谨性也随盐浓度的降低而升高。

通常,在50%甲酰胺存在下的方便的杂交温度是:对于靶片段同源性达95%至100%的探针而言,是42℃;对于同源性为90%至95%的探针,为37℃;对于同源性为85%和90%的探针,为32℃。对于较低的同源性,应用上述方程式应相应地降低甲酰胺含量和调节温度。如果探针和靶片段之间的同源性是未知的,则最简单的方法是从非严谨的杂交和洗涤条件开始。如果在放射自显影后发现了非特异性的条带或高背景值,则可在高严谨性下洗涤滤膜,并重新曝光。如果曝光所需时间使得该方法不切实际,则应平行测试几种杂交和/ 或洗涤严谨性。

核酸探针试验

采用本发明的核酸探针的方法( 如PCR、分支DNA 探针试验或印迹技术) 能确定cDNA 或mRNA 的存在。如果探针和本发明的序列能形成稳定地足以被检测到的双链体或双链复合物,则称探针与本发明的序列“杂交”。

核酸探针将与本发明的马铃薯M病毒核苷酸序列( 包括有义和反义链) 杂交。尽管有许多不同的核苷酸序列编码该氨基酸序列,但是天然的马铃薯M病毒序列是较佳的,因为它是实际存在于细胞中的序列。mRNA 代表一种编码序列,因此探针应与该编码序列互补;单链cDNA 与mRNA 互补,因此cDNA 探针应与非编码序列互补。

探针的确切长度和序列将取决于杂交条件,如温度、盐浓度等。例如,对于诊断应用,根据分析物序列的复杂程度,核酸探针通常含有至少10-20 个核苷酸,较佳的15-25 个,更佳的至少30 个核苷酸,但是也可短于该长度。短的引物通常需要较低温度,以便和模板形成足够稳定的杂交复合物。

探针可用合成方法产生,例如Matteucci 等人[J.Am.Chem.Soc.(1981)103 :3185]的方法或Urdea 等人[Proc.Natl.Acad.Sci.USA(1983)80 :7461] 的方法,或用市售的自动寡核苷酸合成仪合成。

可以根据偏好选择探针的化学特征。对于某些应用,DNA 或RNA 是合适的。对于其它的应用,可以加入修饰,例如骨架修饰,如硫代磷酸酯或甲基磷酸酯,可用来增加体内半衰期,改变RNA 亲和力,增加核酸酶抗性等[ 例如参见Agrawal 和Iyer(1995)Curr Opin Biotechnol 6 :12-19 ;Agrawal(1996) TIBTECH14 :376-387] ;还可采用类似物如肽核酸[ 例如参见Corey (1997)TIBTECH15 :224-229 ;Buchardt 等人(1993)TIBTECH 11 :384-386]。

另外,聚合酶链反应(PCR) 是另一个熟知的检测少量靶核酸的手段。该试验在Mullis 等人[Meth.Enzymol.(1987)155 :335-350] ;美国专利4,683,195 和4,683,202 中有所描述。用两个“引物”核苷酸与靶核酸杂交,并用来引导反应。引物可包含不与扩增靶序列( 或其互补序列) 杂交的序列,以帮助双链体的稳定性,或例如可插入一个简便的限制性位点。这些序列通常侧接所需的马铃薯M病毒序列。

利用最初的靶核酸作为模板,热稳定的聚合酶能从引物产生靶核酸的拷贝。在聚合酶产生临界量的靶核酸后,它们可用较传统的方法( 如Southern 印迹) 来检测。当采用Southern 印迹方法时,标记的探针将与马铃薯M病毒序列( 如其互补序列) 杂交。

另外,mRNA 或cDNA 也可用Sambrook 等人[ 同上] 描述的传统印迹技术来检测。用凝胶电泳可纯化并分离利用聚合酶从mRNA 产生的mRNA 或cDNA。然后,将凝胶上的核酸印迹到固体载体如硝酸纤维素上。使固体载体与标记的探针接触,然后洗涤除去所有未杂交的探针。然后,检测含有标记探针的双链体。该探针通常用放射活性物质作标记。

基因组序列的应用

基于对马铃薯M病毒基因组全序列的测定,可以了解与该病毒复制、运动及重要调控功能有关的基因结构和功能,找到其分子生理机制以及如何侵染寄主的关键点。

一种应用方法是,构建马铃薯M病毒的全长侵染性克隆,对其基因序列进行突变,再用来侵染寄主植物,根据寄主表现研究其功能;或者是把病毒编码的各个基因构建到其他病毒载体或瞬时表达载体上,通过突变分析其功能。这些方法都是本领域里的常规方法,基于本发明所提供的马铃薯M病毒基因组序列,可以大大方便引物的设计以及克隆的进程。

另一种直接的应用是使用本发明的抗体、引物或探针,来检测样品中是否存在马铃薯M病毒或其遗传物质。

对于抗体而言,这种检测方法包括步骤:

用本发明的核酸序列获得蛋白制备的抗体,可以用于生物样品(马铃薯样品等)进行包括但不限于ELISA、Western blot、捕获免疫RT-PCR、免疫电镜等方法检测。

对于探针而言,这种检测方法包括步骤:

将马铃薯样品或其cDNA或PCR产物与本发明的探针接触,观察是否形成样品-探针复合物,形成了复合物就表示样品中存在马铃薯M病毒或遗传物质。

对于引物而言,这种检测方法包括步骤:

用本发明的特异性引物,对样品进行PCR 反应,观察是否扩增产生了特异性的扩增产物,产生了特异性扩增产物就表示样品中存在马铃薯M病毒或遗传物质。在本发明的一个实例中,马铃薯M病毒的基因组序列是通过如下方法获得的,该方法包括步骤:

1. 分离纯化病样总RNA。

2. 以此RNA 样品为模板,采用逆转录酶合成单链cDNA。继续以此cDNA 为模板,利用本发明公布的简并引物或者基因本发明公布的核酸序列设计的寡核苷酸引物,在DNA 多聚酶的作用下进行PCR 扩增克隆、测序,得到特异片段。

3. 将得到的序列输入计算机,利用软件( 如DNAMAN 软件) 进行拼接,再经后期工作得到完整的病毒基因组全序列。

具体实施方式

下面结合实施例对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。

本发明所述的分离的核酸分子的核苷酸序列如SEQ ID NO:1所示或其反义序列。

所述的核酸分子式DNA或RNA。

所述的分离的核酸分子包括那些与所述的核酸分子编码的5个基因其中病毒编码的223kDa、25kDa、12 kDa、7 kDa、34 kDa(外壳蛋白)、11kDa蛋白与其分离物的核苷酸同源性、相似性分别大于等于72%、75.1%、71.6%、59.1%、94.6%、97%,氨基酸序列同源性、相似性分别大于77.9%、83.41%、75.23%、58.5%、97.37%、95.37%的核酸分子或其反义序列。

本发明所述的分离的核酸分子的用途为所述的核酸分子用于制备检测马铃薯M病毒的引物、探针或试剂盒,或用于制备抗马铃薯M病毒的抗体。

所述的引物长度为15~100个核苷酸。

所述的探针长度为25~5000个核苷酸。

所述的探针长度为50~500个核苷酸。

本发明所述的分离的DNA分子为SEQ ID NO:1所示或其反义序列中连续的150~8530个核苷酸所构成。

所述的DNA分子为SEQ ID NO:1所示或其反义序列中连续的300~8530个核苷酸所构成。

所述的DNA分子为SEQ ID NO:1所示或其反义序列中连续的1000~8530个核苷酸所构成。

下面以具体实施案例对本发明做进一步说明:

实施例1

病样总RNA的提取:

取0.1~0.5g病样,液氮研磨至粉末状,转移置1.5mL的Eppendorf管中(Eppendorf管需预先用液氮冷冻)。用常规或厂商所建议的方法提取病样总RNA。

RT-PCR反应:

设计合成引物:

反转录(Reverse transcription,RT),反应体系为20μL。

PCR:根据以下配制PCR反应溶液(50 μL体系)。

反应条件为:94℃预变性2 min;94℃变性1min,退火温度根据表中特异引物对确定,退火1min,72℃延伸1min,35个扩增循环;最后72℃10 min。反应结束后取5μL反应产物进行0.8%琼脂糖凝胶电泳。

PCR产物回收:

RT-PCR与PCR产物用UNIQ-10柱式PCR纯化试剂盒或UNIQ-10柱式胶回收试剂盒回收,操作步骤按照产品说明书进行。

连接:

转化大肠杆菌感受态细胞,筛选阳性克隆,测序。

实施例2

对马铃薯M病毒基因组序列的验证

根据SEQ ID NO :1 所示的核苷酸序列,按每1200bp 左右长度设计引物,进行PCR 反应,对PCR 产物进行测序验证。结果表明SEQ ID NO :1 的核苷酸序列是正确的。

实施例3

检测马铃薯M病毒的检测试剂盒

利用本发明公布的核苷酸序列,通过原核表达的方式获得目的蛋白,通过免疫家兔获得多克隆抗血清,免疫鼠瘤细胞获得单克隆抗体。用这些抗体进行如下检测。

双抗夹心 ELISA (DAS-ELISA)

包被捕获抗体

每孔加入100μL 包被缓冲液(coating buffer)稀释的捕获抗体,包含阳性、阴性和空白对照对应的孔,37℃放置3h。

包被抗原

将抗体甩去,用PBST洗板4次,拍干。每孔加入100μL的PBST稀释的植物病样粗汁液,同时设置阳性、阴性和空白对照,37℃放置3h。

封闭

将包被抗原甩去,同上洗板4次,每次放置3~5min。每孔加入200μL的封闭液(5%的脱脂牛奶或1%的牛血清白蛋白),37℃放置30min。

包被酶标抗体

将封闭液甩去,拍干不洗板,每孔加入100μL的PBST稀释的酶标抗体,37℃放置3h。

显色

甩去酶标抗体,洗板4次,将底物(对硝基苯磷酸盐)溶于10%的底物缓冲液,100μL/孔,室温显色15-30min。405nm下读OD值。

取马铃薯M病毒感染病样,样品研磨后稀释至10、50、100倍,用上述方法进行检测,结果表明获得的抗体能与感染马铃薯M病毒的样品阳性反应。

实施例4

检测马铃薯M病毒的检测试剂盒基于SEQ ID NO :1 中所示的基因组序列,合成以下PCR 引物和探针:

正义引物 :序列为SEQ ID NO :1 中第1393-1416 位。

反义引物 :序列为SEQ ID NO :1 中第1537-1560 位的互补序列

探针 :序列为SEQ ID NO :1 中第1444-1473 位。

制备试剂盒( 检测50 次),它含有:浓度为100pmol的正义引物50μL,浓度为100pmol的反义引物50μL,浓度为100pmol的探针50μL,RT-PCR反应液2.5ml。

取马铃薯M病毒感染病样,样品研磨后稀释至10、50、100倍,用上述方法进行检测,结果表明该探针能与感染马铃薯M病毒的样品阳性反应。

此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

SEQUENCE LISTING

<110> 云南省农业科学院生物技术与种质资源研究所

<120> 一种马铃薯M病毒基因组全序列及其应用

<130> 2016

<160> 18

<170> PatentIn version 3.3

<210> 1

<211> 8530

<212> DNA

<213> 铃薯M病毒云南分离物

<400> 1

acatggggga taaacaaaca tacaatatct gagcttacac tgcaatatac taccataaag 60

tactatatac agtctaagga atcatggcac tcacatacag aacgccaatg gaagatattg 120

ttaattgctt cgagccagcg actcaggctg tgatagctaa tagtgcagct acgttgtata 180

aaaatttcga ggaacaacac tgccaatatt tcaattacta cttatcgcct tcggcgaaaa 240

ggaaattaag tatggcaggt gtgtacttga gcccatactc cgcagttgtg cactcgcatc 300

tcgtctgcaa aacgttggaa aattatttac tgtacagtgt tttaccgtct tatgtaaatt 360

ctagttttta tttcgtggga atgaaggaaa gaaagctgca actgctaaaa tcaaagtgca 420

agaatttgga tagcgtgcag tgtattaaca ggtacgtaac gagcgctgat agaatgagat 480

acacaaatga ttttgtgcca tatagctcgt atgaacatga agaattggtt cacaagggag 540

gaggcttaga taatgttaca ctcaaaaacc tcgtgggtcc attgagccgc cacaaggcaa 600

agaatctgtt cattcatgac gaactgcatt attggagtag taagacccta atagattttc 660

tggatgttat gcgtccagat aagctattgg ggacggtagt gtacccgccc gaattactct 720

tcaagcaagt tcgcagtttg aacgaatggt gctacacata cgatatagtg ggtgatacat 780

taatgttctt cccagatggt gtgcagggag agggctatca acaaccactg aaaggtggtt 840

acttactgag cgcaaggagc ttgaaattgc cagatggcac gacatacatg gtggatgtgt 900

tgtgcagcaa atttgcgcac catttggtat ccataactaa aggtgaggct gttgcaccca 960

cgcacagagc gtttggcccc ttcgaagcag ttgcgtcaga agctctaacg tcattgagcc 1020

cggactaccc cgtgtgcttc cccgttagct atgaagttgt gaataagata tataggtatc 1080

tgcgcacgct gaaaaaaccg gatgagcaat cagcgatagc caagctcagc caaattatcg 1140

ctgagccatc tggtagggag atagacttcg tggaatgttt tgcacgattg gttatacaca 1200

attcgagcat ttgtgtgaca atcatgcctg agcgattgat agaattcatg ggcacttggc 1260

tgggtaaaat gccatctgtg ttggcgcgca gatttagtag cgtgagggcc gtttgcgtga 1320

acaaatttat caggagcctc aagccttata gtttcacctt gcgcttgaat gatatcacct 1380

ggtggaatct ttgggataac agctttgctt ggttcttcga attggaaacg gctatcgatt 1440

taccagagaa gatggattcg caatttgctg gtggaggtgc aagtctgatg gcacacatca 1500

catcgcagcc ctatgtcgga atgctgccgc ttgcggatag ggggtggaaa ccactgctaa 1560

ttttggaggg agtgcggctg aggtacgcca tacgtaggat gtttctgaga ggtgtctgga 1620

gtgagcacat gagagtcatc tcgaagagtt ttctgctcga gtacgtgagt tccagattgc 1680

agcagagcat attggttgct aggataagca ggacaagttc agtgaagcga atgctccagc 1740

catgggaaat tcttggttat tcgagcgctg aggagttgtt tgacttcatg aggtaccaat 1800

gcaatccaag acttcggcct ttgcactcag agttagggct ggcatggttc ttgcgcgtgg 1860

atagaagtaa tctcaaatgc ttgacgaatt acagcgaggg caagcaagct gtgactgggg 1920

tcgtcactag ttggagggca gtaatccaag agttgggtat taaacgcaaa agcaggtgga 1980

caaggattga ggagctcaaa accggtggag cgcacgccgt ggcgcgcaag atgcatagtt 2040

tggcacccgc tgagataagt gaagtggaag cagctttgag agtggagcta gcagagattg 2100

cctgtgcctg cgggtcggag cacgggcagg gcgttatgct gagtaatgag agcggcctgt 2160

gtgtccgtga ctacatcgca ggtgtgtctg taggtctcta cgcgaggagc caaggtgata 2220

tgcactgggg gagtactgca atcataaata atggatggcc aaagagcttg gacatgtgga 2280

tggatataaa ttctgttgat ccaaaatatg aagtggctgt tcatctgcaa tacggcaagg 2340

aaacgcaagt tgatttggtc ttgcatgaga ttagaggttt ggactacaat ggcggcattg 2400

ttgctgtgaa tttgcgtaaa tgtggtgcat tctcaataag ttgtccgagt ggcgacctcg 2460

cagtgggcgt ggatgggcca catttggtga agatccttgg cgcgaactgt ggtgatcatg 2520

cctgctatat ggtgggactg gaggcagtta atgatgtggt cgtctttgcg atgaggcaga 2580

aatctcgcgc agccgcagag cccatcgttg agctggttgc aagtgaagca cactctgaag 2640

ccgcagagca gaggcggcag gatgctaaag gagtgcgcct cggtggcgtt tggtgcaggg 2700

aaagcgtgtc tgcaagtaat gtggcatata gcagggtcaa ggtgcccgga aatggatcat 2760

gtttttggca cagcgtagca tacttggtgg gcatgcatta catggagtta aaacagttat 2820

gcatgtcgca cgtgtttgat gatgcagcgt tgaacgctga actcgctatg tgcaaggcgc 2880

caggcgcttt tgctaccagt gcagcgatac tctctgcggt cgtgcggctt cgagcggaaa 2940

taagggtgta caattcgaca accggtaggg tgcacacata caccccggag gagaaaacga 3000

tggctctaga tttgtggttg gaagcagaac actatgagcc acaagtgtta agaaatgggt 3060

gtgtgatcga gtctgtcgca caagccttag gcaggaggaa tgcagatgtg ttagctgtaa 3120

tagaggaacg ctgctgcgat gaggttgttg caagtgtgca agctggctgt ggattgaatt 3180

tgcagcatat agagatcgtg ctgcagtgtt ttggcattgt cggtttttgc agcgttgagg 3240

ggaaagaagt ggtgcttaat tctagcggaa aacttgcaac gtgctttaac atagaggatg 3300

agcacatgag ctattgtggt aggcgaaaag atccatgttg cagtttgctg agcggagcaa 3360

agcacggtaa actatttcca gaatctgcat tgctagatct tgagaattgt gggctgtgcg 3420

tggaatttca gcccaattgg acgagggcgg gcattttagc agatagtatg caccagggtg 3480

ctacaggtgt gcttgggtcc gcacttttta acaacaagcg gaatctgcgc gaaaaaattt 3540

cacaagatgg tgtcaggaaa gtgcatgtga tagctggcac tttcggatcc ggaaagagca 3600

ctttgttcaa aaatctgttg gaacgcggag ctggtaagtc tctggatttc gtgtcaccta 3660

ggcgtgcgtt ggctgaggat tttaagaaat ccgtagggat tggcgggaaa gatgggacgt 3720

ccaaagcggg gcaggagaat tggcgtgtga cgaccctaga aacctttttg agtaagattg 3780

aatttctaac tgagggtcag gtggttatct tcgatgagat gcagttgtat ccacctgggt 3840

acttcgacct tgtgttgagt attatgaagg tggaagcacg tgtgtttcta gtcggtgatc 3900

cagcgcagag tgattatgac aatgagaagg atcgcgtagt gcttggagcc atggaagaaa 3960

acgttcaagt gctattggga gcacgtgagt atgcgtacaa ggtgcgaagc cacaggtttt 4020

tgaatagcaa ttacatcggc aggttgccgt gtgagatcgc caaggaggaa tgcacaattg 4080

atgagccgca tgtgttgcgt atgcacctag agaatttgca ggatctgggg gaggaatacc 4140

gagctgttgt gctggttagt tccttcgatg agaaactagt ggtgtgtgcg catttacctg 4200

gtgcgaaggt gctgacattc ggagagagta cgggtttaac attcatgtat ggcacgatct 4260

atgtgtcagc tatctctgag cggactagcg aaaggaggtg ggttacagcc ttaagtaggt 4320

tccgttttaa cttgtgcttt gttaattgta gcggaatgaa ttaccagcaa ttggcgctta 4380

gatacaaggg aagggtgctt gcaaagtttt tgtgcaaaac tgctgagccc aaagatttga 4440

ttgagatgct acccggaagg ccacaattta gaaatgatta cagccgctta ataggaaagg 4500

atgaaggggt gcgggaggag aagctggctg gagacccctg gctgaaaacg atggttaacc 4560

tgtaccaagc gccagatgtg gaagtgatgg agagtcctga aatggtgatg caggaggaat 4620

ggtttcgcac gcatctaccg agggatgagc tggagagcgt gagggctcaa tgggtgcata 4680

agatcatggc aaaggagtat agagaggtgc ggatgggcga catggtgtct gagcaattca 4740

ctgatgatca tacaaagcag ctgggtgcta aacagttgac gaacgcagct gagcgtttcg 4800

agactattta cccgaggcac agagcaagtg atacggtcac gtttctaatg gcggttaaaa 4860

agcgattgag cttttcaaac cctggaaaag agagggggaa gttgttccat gccgcaacct 4920

atggaaaggc cctattgcag gagttcctca agcgtgtgcc gctaaagcca ggtcataacg 4980

cccgctttat ggatgaggca ctgtggaatt ttgaagagaa aaaattgagc aaaagcgcag 5040

caaccatcga gaatcactca gggagatcat gcagggattg gcccatagac gttgcacaga 5100

tcttttccaa gagtcagctg tgtactaaat tcgacaaccg ttttagagtg gctaaggctg 5160

cgcaaagtat tgtgtgtttc cagcacgctg ttttgtgccg ctttgcaccg tacatgcggt 5220

acatcgaaat gaaagtgcac gaggtgcttc caaagaatta ctacatacac tctggaaagg 5280

gacttgagga gctagatgca tgggtaaaga agggtaaatt cgaaggcata tgtacagaat 5340

cggactacga ggcctttgat gcttctcagg atgaatttat catggctttt gagctagaac 5400

tgatgaaatt cctgcgattg ccaaatgatc tgatcgagga ttacaaattc attaaaacga 5460

gtttgggttc aaagctgggc aattttgcta tcatgaggtt ctcgggtgag gcgagcacct 5520

tcttgtttaa cacattggcc aatatgctct tcacctttat gaggtataac attcgcggag 5580

atgagttcat atgcttcgct ggagatgata tgtgcgcgtc caggaggtta caaacaacaa 5640

agaagtttgc acatttcctt gataagctaa agttaaccgc gaaagtgcaa tttgtgaaca 5700

agcccacatt ttgtgggtgg cacttgtgcc ccgatggtat ttacaaaaaa cctcagctcg 5760

tgcttgaaag gatgtgtatt gcccaagaga tcaataacct cataactgcc ttcgacattt 5820

acgccctata ggttgcgtat gcttacaagt tgggtgaaaa agcagttaac aggatggatg 5880

aggaggaggt tgctgcattc tacaattgcg tgagaattat cgtgcggaat aagcacctta 5940

ttcgctctga tgtgaggaaa gtatttgaag tgctttaaat aggtagctta ggtagtgcta 6000

taggtttgaa tatttatgga tgtagtcgta gagttgttgt ataaatacaa gtttgaacgt 6060

ttgcataata aattagcatt tccgattgta gtgcattgtg tgcccggcgc agggaaaagc 6120

agtttgattc gtgagttgct agagttagat agtcgttttt gtgcctacac agctggcgta 6180

gaggatcagc caaggttgag cgggaactgg atcaaaaagt ggaagggcgt cgctactgaa 6240

ggtaagcact tgattttgga cgagtacacg ttgctagttg aagtgccaca ggcattcgca 6300

ttatttggtg atccaattca gtcctgcact ggatctgtac agagcgccga tttcgtgtgt 6360

tcattcagca aaaggtttgg cagtgctaca gggtctctac tgagagagct aggttgggac 6420

attcagagcg agggacctga tctggtgcag gtatctgaca tcttcgtgaa agagccagag 6480

ggagtggttg tatatttcga ggaagaagta ggttgcctgc ttaaggcgca tagtgtggag 6540

gcattcagct tgagtgaaat cgtgggccaa acatttgaag ttgtcacgtt tgtgacctca 6600

gaaaactcgc cagtaatcaa ccgtgcagct gcttatcagt gtatgacaag gcatcgagta 6660

gctcttcaca ttttgtgccc taatgccact tactccgccg cctgatttct caaaggtata 6720

tctttctgca gccgttggtg cgacattggc tgccatagtt tggctgataa caaagagcac 6780

tctacctgcg gttggagata gggaacacaa tttgccacac ggcggttggt atcgagacgg 6840

cacgaagtca gtgttctaca atagtccctg caagctcaac tcgatcgaga gtgggaggtc 6900

acctctactt gggcaaccgt gggctctagt tggtctcttg attgcactca tctgggtgag 6960

tcagagattt agcagttctg gttgcaggag gtgtggaggg caacattcat gattgagcac 7020

atcctcattg gactctcggc tttcttgatt gcgctcttcg taattagtca gaatcagagc 7080

gggtgcacag tgttgatcac gggtgaatca gtaaggttct tggggtgtcc agtaacacaa 7140

gagttcagca aagcggtgtc tgaattaaag ccgatagctt gtgcttcctt taggtctaga 7200

gggtgattcg aaatagtgag tatgggggat cctatggaga aagttgaagc tagcaagaag 7260

gcgagtacat cgcagccggc tcagggcgca agaccgctgc caaaggccac ggattttgat 7320

gtgactgaag atcgcgatgg cgcagatgct cacaatgctg cggacgagga agaatcctcc 7380

ctggaacgta ggttggacag cttacgtgac tttctgcgtg aaaggcgtgg tgcaattcgg 7440

gtgactaatc ctggtttgga aacaggcagg ccaaaattga agctagctga ggatatgcgt 7500

cctgacccga caaacccgta caacaggcct tcaatagaag cgctaagcag gatcaaaccg 7560

atagccatat cgaacaatat ggccacatct gaggacatga tgcgcatata tgtaaatctg 7620

gaaggcctgg gtgtgcctac tgaacacgtg cagcaggtgg tcattcaagc tgtgttgttc 7680

tgcaaagatg ctagcagctc tgtgtacttg gacccgcgtg gttcgttcga gtggcctaga 7740

ggtgccatca cagcggatgc agttcttgcc gtgatgaaga aggacgcgga gactctaagg 7800

agggtttgta ggctatacgc acctgtgacc tggaatcata tgttgactca caactcacct 7860

ccggctgatt gggcagccat gggtttccaa tacgaggaac gctttgctgc attcgactgc 7920

ttcgactacg tcgagaacac agcggccgtg cagccactgg aaggattgat aaggaggccc 7980

actccgagag agaaggttgc tcacaatact cacaaggata tagccttgcg cagtgctaac 8040

cgcaatcagg tgttcagctc tcttagcgcc gaggtgaccg gtggtatgaa tggccccgaa 8100

ctcactaggg atttcgggaa atcgaataac aaatgaagtg tgtgactcga actgctttac 8160

ttgtagctag ggctatgtat ttacattccg gtgtgtttgc gtttgattta gcttatgcaa 8220

tatctaagtg tgcgggcaga ccacttggtg gtggtaagtc caagtatgcg cgccttaggc 8280

gtgctattag tgctggaagg tgccacaggt gctatcgctt gtggccgcct acttcgttta 8340

ctactaggtg tgataataga agttgttttc ctggcattca ttacaatgtg cgcgtggcgc 8400

agtttatcga tgaaggagta actgaggtga tcccttcagt cattcaaaag aatgagtagc 8460

cattaaatcc tatttaatat ataaggtgtg ctactataaa taaaatttgg tttttaagct 8520

atttttagcc 8530

<210> 2

<211> 1963

<212> PRT

<213> ORF1

<400> 2

Met Ala Leu Thr Tyr Arg Thr Pro Met Glu Asp Ile Val Asn Cys Phe

1 5 10 15

Glu Pro Ala Thr Gln Ala Val Ile Ala Asn Ser Ala Ala Thr Leu Tyr

20 25 30

Lys Asn Phe Glu Glu Gln His Cys Gln Tyr Phe Asn Tyr Tyr Leu Ser

35 40 45

Pro Ser Ala Lys Arg Lys Leu Ser Met Ala Gly Val Tyr Leu Ser Pro

50 55 60

Tyr Ser Ala Val Val His Ser His Leu Val Cys Lys Thr Leu Glu Asn

65 70 75 80

Tyr Leu Leu Tyr Ser Val Leu Pro Ser Tyr Val Asn Ser Ser Phe Tyr

85 90 95

Phe Val Gly Met Lys Glu Arg Lys Leu Gln Leu Leu Lys Ser Lys Cys

100 105 110

Lys Asn Leu Asp Ser Val Gln Cys Ile Asn Arg Tyr Val Thr Ser Ala

115 120 125

Asp Arg Met Arg Tyr Thr Asn Asp Phe Val Pro Tyr Ser Ser Tyr Glu

130 135 140

His Glu Glu Leu Val His Lys Gly Gly Gly Leu Asp Asn Val Thr Leu

145 150 155 160

Lys Asn Leu Val Gly Pro Leu Ser Arg His Lys Ala Lys Asn Leu Phe

165 170 175

Ile His Asp Glu Leu His Tyr Trp Ser Ser Lys Thr Leu Ile Asp Phe

180 185 190

Leu Asp Val Met Arg Pro Asp Lys Leu Leu Gly Thr Val Val Tyr Pro

195 200 205

Pro Glu Leu Leu Phe Lys Gln Val Arg Ser Leu Asn Glu Trp Cys Tyr

210 215 220

Thr Tyr Asp Ile Val Gly Asp Thr Leu Met Phe Phe Pro Asp Gly Val

225 230 235 240

Gln Gly Glu Gly Tyr Gln Gln Pro Leu Lys Gly Gly Tyr Leu Leu Ser

245 250 255

Ala Arg Ser Leu Lys Leu Pro Asp Gly Thr Thr Tyr Met Val Asp Val

260 265 270

Leu Cys Ser Lys Phe Ala His His Leu Val Ser Ile Thr Lys Gly Glu

275 280 285

Ala Val Ala Pro Thr His Arg Ala Phe Gly Pro Phe Glu Ala Val Ala

290 295 300

Ser Glu Ala Leu Thr Ser Leu Ser Pro Asp Tyr Pro Val Cys Phe Pro

305 310 315 320

Val Ser Tyr Glu Val Val Asn Lys Ile Tyr Arg Tyr Leu Arg Thr Leu

325 330 335

Lys Lys Pro Asp Glu Gln Ser Ala Ile Ala Lys Leu Ser Gln Ile Ile

340 345 350

Ala Glu Pro Ser Gly Arg Glu Ile Asp Phe Val Glu Cys Phe Ala Arg

355 360 365

Leu Val Ile His Asn Ser Ser Ile Cys Val Thr Ile Met Pro Glu Arg

370 375 380

Leu Ile Glu Phe Met Gly Thr Trp Leu Gly Lys Met Pro Ser Val Leu

385 390 395 400

Ala Arg Arg Phe Ser Ser Val Arg Ala Val Cys Val Asn Lys Phe Ile

405 410 415

Arg Ser Leu Lys Pro Tyr Ser Phe Thr Leu Arg Leu Asn Asp Ile Thr

420 425 430

Trp Trp Asn Leu Trp Asp Asn Ser Phe Ala Trp Phe Phe Glu Leu Glu

435 440 445

Thr Ala Ile Asp Leu Pro Glu Lys Met Asp Ser Gln Phe Ala Gly Gly

450 455 460

Gly Ala Ser Leu Met Ala His Ile Thr Ser Gln Pro Tyr Val Gly Met

465 470 475 480

Leu Pro Leu Ala Asp Arg Gly Trp Lys Pro Leu Leu Ile Leu Glu Gly

485 490 495

Val Arg Leu Arg Tyr Ala Ile Arg Arg Met Phe Leu Arg Gly Val Trp

500 505 510

Ser Glu His Met Arg Val Ile Ser Lys Ser Phe Leu Leu Glu Tyr Val

515 520 525

Ser Ser Arg Leu Gln Gln Ser Ile Leu Val Ala Arg Ile Ser Arg Thr

530 535 540

Ser Ser Val Lys Arg Met Leu Gln Pro Trp Glu Ile Leu Gly Tyr Ser

545 550 555 560

Ser Ala Glu Glu Leu Phe Asp Phe Met Arg Tyr Gln Cys Asn Pro Arg

565 570 575

Leu Arg Pro Leu His Ser Glu Leu Gly Leu Ala Trp Phe Leu Arg Val

580 585 590

Asp Arg Ser Asn Leu Lys Cys Leu Thr Asn Tyr Ser Glu Gly Lys Gln

595 600 605

Ala Val Thr Gly Val Val Thr Ser Trp Arg Ala Val Ile Gln Glu Leu

610 615 620

Gly Ile Lys Arg Lys Ser Arg Trp Thr Arg Ile Glu Glu Leu Lys Thr

625 630 635 640

Gly Gly Ala His Ala Val Ala Arg Lys Met His Ser Leu Ala Pro Ala

645 650 655

Glu Ile Ser Glu Val Glu Ala Ala Leu Arg Val Glu Leu Ala Glu Ile

660 665 670

Ala Cys Ala Cys Gly Ser Glu His Gly Gln Gly Val Met Leu Ser Asn

675 680 685

Glu Ser Gly Leu Cys Val Arg Asp Tyr Ile Ala Gly Val Ser Val Gly

690 695 700

Leu Tyr Ala Arg Ser Gln Gly Asp Met His Trp Gly Ser Thr Ala Ile

705 710 715 720

Ile Asn Asn Gly Trp Pro Lys Ser Leu Asp Met Trp Met Asp Ile Asn

725 730 735

Ser Val Asp Pro Lys Tyr Glu Val Ala Val His Leu Gln Tyr Gly Lys

740 745 750

Glu Thr Gln Val Asp Leu Val Leu His Glu Ile Arg Gly Leu Asp Tyr

755 760 765

Asn Gly Gly Ile Val Ala Val Asn Leu Arg Lys Cys Gly Ala Phe Ser

770 775 780

Ile Ser Cys Pro Ser Gly Asp Leu Ala Val Gly Val Asp Gly Pro His

785 790 795 800

Leu Val Lys Ile Leu Gly Ala Asn Cys Gly Asp His Ala Cys Tyr Met

805 810 815

Val Gly Leu Glu Ala Val Asn Asp Val Val Val Phe Ala Met Arg Gln

820 825 830

Lys Ser Arg Ala Ala Ala Glu Pro Ile Val Glu Leu Val Ala Ser Glu

835 840 845

Ala His Ser Glu Ala Ala Glu Gln Arg Arg Gln Asp Ala Lys Gly Val

850 855 860

Arg Leu Gly Gly Val Trp Cys Arg Glu Ser Val Ser Ala Ser Asn Val

865 870 875 880

Ala Tyr Ser Arg Val Lys Val Pro Gly Asn Gly Ser Cys Phe Trp His

885 890 895

Ser Val Ala Tyr Leu Val Gly Met His Tyr Met Glu Leu Lys Gln Leu

900 905 910

Cys Met Ser His Val Phe Asp Asp Ala Ala Leu Asn Ala Glu Leu Ala

915 920 925

Met Cys Lys Ala Pro Gly Ala Phe Ala Thr Ser Ala Ala Ile Leu Ser

930 935 940

Ala Val Val Arg Leu Arg Ala Glu Ile Arg Val Tyr Asn Ser Thr Thr

945 950 955 960

Gly Arg Val His Thr Tyr Thr Pro Glu Glu Lys Thr Met Ala Leu Asp

965 970 975

Leu Trp Leu Glu Ala Glu His Tyr Glu Pro Gln Val Leu Arg Asn Gly

980 985 990

Cys Val Ile Glu Ser Val Ala Gln Ala Leu Gly Arg Arg Asn Ala Asp

995 1000 1005

Val Leu Ala Val Ile Glu Glu Arg Cys Cys Asp Glu Val Val Ala

1010 1015 1020

Ser Val Gln Ala Gly Cys Gly Leu Asn Leu Gln His Ile Glu Ile

1025 1030 1035

Val Leu Gln Cys Phe Gly Ile Val Gly Phe Cys Ser Val Glu Gly

1040 1045 1050

Lys Glu Val Val Leu Asn Ser Ser Gly Lys Leu Ala Thr Cys Phe

1055 1060 1065

Asn Ile Glu Asp Glu His Met Ser Tyr Cys Gly Arg Arg Lys Asp

1070 1075 1080

Pro Cys Cys Ser Leu Leu Ser Gly Ala Lys His Gly Lys Leu Phe

1085 1090 1095

Pro Glu Ser Ala Leu Leu Asp Leu Glu Asn Cys Gly Leu Cys Val

1100 1105 1110

Glu Phe Gln Pro Asn Trp Thr Arg Ala Gly Ile Leu Ala Asp Ser

1115 1120 1125

Met His Gln Gly Ala Thr Gly Val Leu Gly Ser Ala Leu Phe Asn

1130 1135 1140

Asn Lys Arg Asn Leu Arg Glu Lys Ile Ser Gln Asp Gly Val Arg

1145 1150 1155

Lys Val His Val Ile Ala Gly Thr Phe Gly Ser Gly Lys Ser Thr

1160 1165 1170

Leu Phe Lys Asn Leu Leu Glu Arg Gly Ala Gly Lys Ser Leu Asp

1175 1180 1185

Phe Val Ser Pro Arg Arg Ala Leu Ala Glu Asp Phe Lys Lys Ser

1190 1195 1200

Val Gly Ile Gly Gly Lys Asp Gly Thr Ser Lys Ala Gly Gln Glu

1205 1210 1215

Asn Trp Arg Val Thr Thr Leu Glu Thr Phe Leu Ser Lys Ile Glu

1220 1225 1230

Phe Leu Thr Glu Gly Gln Val Val Ile Phe Asp Glu Met Gln Leu

1235 1240 1245

Tyr Pro Pro Gly Tyr Phe Asp Leu Val Leu Ser Ile Met Lys Val

1250 1255 1260

Glu Ala Arg Val Phe Leu Val Gly Asp Pro Ala Gln Ser Asp Tyr

1265 1270 1275

Asp Asn Glu Lys Asp Arg Val Val Leu Gly Ala Met Glu Glu Asn

1280 1285 1290

Val Gln Val Leu Leu Gly Ala Arg Glu Tyr Ala Tyr Lys Val Arg

1295 1300 1305

Ser His Arg Phe Leu Asn Ser Asn Tyr Ile Gly Arg Leu Pro Cys

1310 1315 1320

Glu Ile Ala Lys Glu Glu Cys Thr Ile Asp Glu Pro His Val Leu

1325 1330 1335

Arg Met His Leu Glu Asn Leu Gln Asp Leu Gly Glu Glu Tyr Arg

1340 1345 1350

Ala Val Val Leu Val Ser Ser Phe Asp Glu Lys Leu Val Val Cys

1355 1360 1365

Ala His Leu Pro Gly Ala Lys Val Leu Thr Phe Gly Glu Ser Thr

1370 1375 1380

Gly Leu Thr Phe Met Tyr Gly Thr Ile Tyr Val Ser Ala Ile Ser

1385 1390 1395

Glu Arg Thr Ser Glu Arg Arg Trp Val Thr Ala Leu Ser Arg Phe

1400 1405 1410

Arg Phe Asn Leu Cys Phe Val Asn Cys Ser Gly Met Asn Tyr Gln

1415 1420 1425

Gln Leu Ala Leu Arg Tyr Lys Gly Arg Val Leu Ala Lys Phe Leu

1430 1435 1440

Cys Lys Thr Ala Glu Pro Lys Asp Leu Ile Glu Met Leu Pro Gly

1445 1450 1455

Arg Pro Gln Phe Arg Asn Asp Tyr Ser Arg Leu Ile Gly Lys Asp

1460 1465 1470

Glu Gly Val Arg Glu Glu Lys Leu Ala Gly Asp Pro Trp Leu Lys

1475 1480 1485

Thr Met Val Asn Leu Tyr Gln Ala Pro Asp Val Glu Val Met Glu

1490 1495 1500

Ser Pro Glu Met Val Met Gln Glu Glu Trp Phe Arg Thr His Leu

1505 1510 1515

Pro Arg Asp Glu Leu Glu Ser Val Arg Ala Gln Trp Val His Lys

1520 1525 1530

Ile Met Ala Lys Glu Tyr Arg Glu Val Arg Met Gly Asp Met Val

1535 1540 1545

Ser Glu Gln Phe Thr Asp Asp His Thr Lys Gln Leu Gly Ala Lys

1550 1555 1560

Gln Leu Thr Asn Ala Ala Glu Arg Phe Glu Thr Ile Tyr Pro Arg

1565 1570 1575

His Arg Ala Ser Asp Thr Val Thr Phe Leu Met Ala Val Lys Lys

1580 1585 1590

Arg Leu Ser Phe Ser Asn Pro Gly Lys Glu Arg Gly Lys Leu Phe

1595 1600 1605

His Ala Ala Thr Tyr Gly Lys Ala Leu Leu Gln Glu Phe Leu Lys

1610 1615 1620

Arg Val Pro Leu Lys Pro Gly His Asn Ala Arg Phe Met Asp Glu

1625 1630 1635

Ala Leu Trp Asn Phe Glu Glu Lys Lys Leu Ser Lys Ser Ala Ala

1640 1645 1650

Thr Ile Glu Asn His Ser Gly Arg Ser Cys Arg Asp Trp Pro Ile

1655 1660 1665

Asp Val Ala Gln Ile Phe Ser Lys Ser Gln Leu Cys Thr Lys Phe

1670 1675 1680

Asp Asn Arg Phe Arg Val Ala Lys Ala Ala Gln Ser Ile Val Cys

1685 1690 1695

Phe Gln His Ala Val Leu Cys Arg Phe Ala Pro Tyr Met Arg Tyr

1700 1705 1710

Ile Glu Met Lys Val His Glu Val Leu Pro Lys Asn Tyr Tyr Ile

1715 1720 1725

His Ser Gly Lys Gly Leu Glu Glu Leu Asp Ala Trp Val Lys Lys

1730 1735 1740

Gly Lys Phe Glu Gly Ile Cys Thr Glu Ser Asp Tyr Glu Ala Phe

1745 1750 1755

Asp Ala Ser Gln Asp Glu Phe Ile Met Ala Phe Glu Leu Glu Leu

1760 1765 1770

Met Lys Phe Leu Arg Leu Pro Asn Asp Leu Ile Glu Asp Tyr Lys

1775 1780 1785

Phe Ile Lys Thr Ser Leu Gly Ser Lys Leu Gly Asn Phe Ala Ile

1790 1795 1800

Met Arg Phe Ser Gly Glu Ala Ser Thr Phe Leu Phe Asn Thr Leu

1805 1810 1815

Ala Asn Met Leu Phe Thr Phe Met Arg Tyr Asn Ile Arg Gly Asp

1820 1825 1830

Glu Phe Ile Cys Phe Ala Gly Asp Asp Met Cys Ala Ser Arg Arg

1835 1840 1845

Leu Gln Thr Thr Lys Lys Phe Ala His Phe Leu Asp Lys Leu Lys

1850 1855 1860

Leu Thr Ala Lys Val Gln Phe Val Asn Lys Pro Thr Phe Cys Gly

1865 1870 1875

Trp His Leu Cys Pro Asp Gly Ile Tyr Lys Lys Pro Gln Leu Val

1880 1885 1890

Leu Glu Arg Met Cys Ile Ala Gln Glu Ile Asn Asn Leu Ile Thr

1895 1900 1905

Ala Phe Asp Ile Tyr Ala Leu Val Ala Tyr Ala Tyr Lys Leu Gly

1910 1915 1920

Glu Lys Ala Val Asn Arg Met Asp Glu Glu Glu Val Ala Ala Phe

1925 1930 1935

Tyr Asn Cys Val Arg Ile Ile Val Arg Asn Lys His Leu Ile Arg

1940 1945 1950

Ser Asp Val Arg Lys Val Phe Glu Val Leu

1955 1960

<210> 3

<211> 229

<212> PRT

<213> ORF2

<400> 3

Met Asp Val Val Val Glu Leu Leu Tyr Lys Tyr Lys Phe Glu Arg Leu

1 5 10 15

His Asn Lys Leu Ala Phe Pro Ile Val Val His Cys Val Pro Gly Ala

20 25 30

Gly Lys Ser Ser Leu Ile Arg Glu Leu Leu Glu Leu Asp Ser Arg Phe

35 40 45

Cys Ala Tyr Thr Ala Gly Val Glu Asp Gln Pro Arg Leu Ser Gly Asn

50 55 60

Trp Ile Lys Lys Trp Lys Gly Val Ala Thr Glu Gly Lys His Leu Ile

65 70 75 80

Leu Asp Glu Tyr Thr Leu Leu Val Glu Val Pro Gln Ala Phe Ala Leu

85 90 95

Phe Gly Asp Pro Ile Gln Ser Cys Thr Gly Ser Val Gln Ser Ala Asp

100 105 110

Phe Val Cys Ser Phe Ser Lys Arg Phe Gly Ser Ala Thr Gly Ser Leu

115 120 125

Leu Arg Glu Leu Gly Trp Asp Ile Gln Ser Glu Gly Pro Asp Leu Val

130 135 140

Gln Val Ser Asp Ile Phe Val Lys Glu Pro Glu Gly Val Val Val Tyr

145 150 155 160

Phe Glu Glu Glu Val Gly Cys Leu Leu Lys Ala His Ser Val Glu Ala

165 170 175

Phe Ser Leu Ser Glu Ile Val Gly Gln Thr Phe Glu Val Val Thr Phe

180 185 190

Val Thr Ser Glu Asn Ser Pro Val Ile Asn Arg Ala Ala Ala Tyr Gln

195 200 205

Cys Met Thr Arg His Arg Val Ala Leu His Ile Leu Cys Pro Asn Ala

210 215 220

Thr Tyr Ser Ala Ala

225

<210> 4

<211> 109

<212> PRT

<213> ORF3

<400> 4

Met Pro Leu Thr Pro Pro Pro Asp Phe Ser Lys Val Tyr Leu Ser Ala

1 5 10 15

Ala Val Gly Ala Thr Leu Ala Ala Ile Val Trp Leu Ile Thr Lys Ser

20 25 30

Thr Leu Pro Ala Val Gly Asp Arg Glu His Asn Leu Pro His Gly Gly

35 40 45

Trp Tyr Arg Asp Gly Thr Lys Ser Val Phe Tyr Asn Ser Pro Cys Lys

50 55 60

Leu Asn Ser Ile Glu Ser Gly Arg Ser Pro Leu Leu Gly Gln Pro Trp

65 70 75 80

Ala Leu Val Gly Leu Leu Ile Ala Leu Ile Trp Val Ser Gln Arg Phe

85 90 95

Ser Ser Ser Gly Cys Arg Arg Cys Gly Gly Gln His Ser

100 105

<210> 5

<211> 65

<212> PRT

<213> ORF4

<400> 5

Met Ile Glu His Ile Leu Ile Gly Leu Ser Ala Phe Leu Ile Ala Leu

1 5 10 15

Phe Val Ile Ser Gln Asn Gln Ser Gly Cys Thr Val Leu Ile Thr Gly

20 25 30

Glu Ser Val Arg Phe Leu Gly Cys Pro Val Thr Gln Glu Phe Ser Lys

35 40 45

Ala Val Ser Glu Leu Lys Pro Ile Ala Cys Ala Ser Phe Arg Ser Arg

50 55 60

Gly

65

<210> 6

<211> 304

<212> PRT

<213> ORF5

<400> 6

Met Gly Asp Pro Met Glu Lys Val Glu Ala Ser Lys Lys Ala Ser Thr

1 5 10 15

Ser Gln Pro Ala Gln Gly Ala Arg Pro Leu Pro Lys Ala Thr Asp Phe

20 25 30

Asp Val Thr Glu Asp Arg Asp Gly Ala Asp Ala His Asn Ala Ala Asp

35 40 45

Glu Glu Glu Ser Ser Leu Glu Arg Arg Leu Asp Ser Leu Arg Asp Phe

50 55 60

Leu Arg Glu Arg Arg Gly Ala Ile Arg Val Thr Asn Pro Gly Leu Glu

65 70 75 80

Thr Gly Arg Pro Lys Leu Lys Leu Ala Glu Asp Met Arg Pro Asp Pro

85 90 95

Thr Asn Pro Tyr Asn Arg Pro Ser Ile Glu Ala Leu Ser Arg Ile Lys

100 105 110

Pro Ile Ala Ile Ser Asn Asn Met Ala Thr Ser Glu Asp Met Met Arg

115 120 125

Ile Tyr Val Asn Leu Glu Gly Leu Gly Val Pro Thr Glu His Val Gln

130 135 140

Gln Val Val Ile Gln Ala Val Leu Phe Cys Lys Asp Ala Ser Ser Ser

145 150 155 160

Val Tyr Leu Asp Pro Arg Gly Ser Phe Glu Trp Pro Arg Gly Ala Ile

165 170 175

Thr Ala Asp Ala Val Leu Ala Val Met Lys Lys Asp Ala Glu Thr Leu

180 185 190

Arg Arg Val Cys Arg Leu Tyr Ala Pro Val Thr Trp Asn His Met Leu

195 200 205

Thr His Asn Ser Pro Pro Ala Asp Trp Ala Ala Met Gly Phe Gln Tyr

210 215 220

Glu Glu Arg Phe Ala Ala Phe Asp Cys Phe Asp Tyr Val Glu Asn Thr

225 230 235 240

Ala Ala Val Gln Pro Leu Glu Gly Leu Ile Arg Arg Pro Thr Pro Arg

245 250 255

Glu Lys Val Ala His Asn Thr His Lys Asp Ile Ala Leu Arg Ser Ala

260 265 270

Asn Arg Asn Gln Val Phe Ser Ser Leu Ser Ala Glu Val Thr Gly Gly

275 280 285

Met Asn Gly Pro Glu Leu Thr Arg Asp Phe Gly Lys Ser Asn Asn Lys

290 295 300

<210> 7

<211> 108

<212> PRT

<213> ORF6

<400> 7

Met Lys Cys Val Thr Arg Thr Ala Leu Leu Val Ala Arg Ala Met Tyr

1 5 10 15

Leu His Ser Gly Val Phe Ala Phe Asp Leu Ala Tyr Ala Ile Ser Lys

20 25 30

Cys Ala Gly Arg Pro Leu Gly Gly Gly Lys Ser Lys Tyr Ala Arg Leu

35 40 45

Arg Arg Ala Ile Ser Ala Gly Arg Cys His Arg Cys Tyr Arg Leu Trp

50 55 60

Pro Pro Thr Ser Phe Thr Thr Arg Cys Asp Asn Arg Ser Cys Phe Pro

65 70 75 80

Gly Ile His Tyr Asn Val Arg Val Ala Gln Phe Ile Asp Glu Gly Val

85 90 95

Thr Glu Val Ile Pro Ser Val Ile Gln Lys Asn Glu

100 105

<210> 8

<211> 19

<212> DNA

<213> 马铃薯M病毒-3-F

<400> 8

gayctsgtgc argtatctg 19

<210> 9

<211> 18

<212> DNA

<213> 马铃薯M病毒-2-R

<400> 9

gttttcccag tcacgact 18

<210> 10

<211> 19

<212> DNA

<213> 马铃薯M病毒-5-F

<400> 10

caagcgtgtg ccgctaaag 19

<210> 11

<211> 18

<212> DNA

<213> 马铃薯M病毒-8-R

<400> 11

ccctctggct ctttcacg 18

<210> 12

<211> 18

<212> DNA

<213> 马铃薯M病毒-9-F

<400> 12

gggcattgca acttaggg 18

<210> 13

<211> 18

<212> DNA

<213> 马铃薯M病毒-10-R

<400> 13

ctcatccata aagcgggc 18

<210> 14

<211> 18

<212> DNA

<213> 马铃薯M病毒-11-F

<400> 14

ggcgcatgtt catgagag 18

<210> 15

<211> 19

<212> DNA

<213> 马铃薯M病毒-12-R

<400> 15

gagatrtcga agcagaarg 19

<210> 16

<211> 24

<212> DNA

<213> 马铃薯M病毒-13-F

<400> 16

gggcccggat aaacaaacat acaa 24

<210> 17

<211> 18

<212> DNA

<213> 马铃薯M病毒-14-R

<400> 17

gcctccacat atttgagc 18

<210> 18

<211> 33

<212> DNA

<213> 马铃薯M病毒-GSP

<400> 18

gattacgcca agcttgtggc ggctcaatgg acc 33

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1