本发明属于植物病毒技术领域,具体涉及一种马铃薯M病毒基因组全序列及其应用。
背景技术:
马铃薯M病毒(Potato virus M, PVM)属于香石竹潜隐病毒属(Carlavirus),电镜观察发现病毒粒子为线状,大小为640×10nm。马铃薯M病毒是通过蚜虫通过非持久性传播方式传播的,它的寄主是茄科和豆科的作物。马铃薯M病毒的病毒基因组为线状+ssRNA,长8.5kb。马铃薯M病毒根据病毒外壳蛋白氨基酸构建的系统进化树或其核苷酸序列相似性(72-82%),分为5个株系,其中病毒编码的223kDa、25kDa、12 kDa、7 kDa、34 kDa(外壳蛋白)、11kDa蛋白与其分离物的核苷酸同源性分别低于72%、75.1%、71.6%、59.1%、94.6%、97%,云南马铃薯分离物属于其中之一。
技术实现要素:
本发明的目的在于提供一种分离的核酸分子;第二目的在于提供所述的核酸分子的用途;第三目的在于提供一种分离的DNA分子。
本发明的第一目的是这样实现的,所述的核酸分子的核苷酸序列如SEQ ID NO:1所示或其反义序列。
在另一类优选例中,所述的核酸分子式DNA或RNA。
本发明的第二目的是这样实现的,所述的核酸分子用于制备检测马铃薯M病毒的引物、探针或试剂盒,或用于制备抗马铃薯M病毒的抗体。
本发明的第三目的是这样实现的,所述的DNA分子为SEQ ID NO:1所示或其反义序列中连续的150~8530个核苷酸所构成。
发明人通过常规的病样总RNA的提取和利用多对简并引物进行RT-PCR扩增、测定了侵染云南马铃薯的马铃薯M病毒基因组全序列。分析发现其基因组为线状、单链正义RNA,不含poly(A)全长8530nt,含6 个开读框(ORF),具香石竹潜隐病毒属(Carlavirus)典型结构特征。序列比较表明它与其他具有全基因组序列的马铃薯M病毒分离物各基因核苷酸相似性在57-75%之间,编码的5个基因其中病毒编码的223kDa、25kDa、12 kDa、7 kDa、34 kDa(外壳蛋白)、11kDa蛋白与其分离物的核苷酸同源性、相似性分别大于等于72%、75.1%、71.6%、59.1%、94.6%、97%,氨基酸序列同源性、相似性分别大于77.9%、83.41%、75.23%、58.5%、97.37%、95.37%的。根据病毒株系分类标准,马铃薯M病毒云南马铃薯分离物属于一个远缘株系。
马铃薯M病毒在马铃薯上引起斑驳、花叶、皱缩、叶片向外卷缩和枝条发育不良,严重影响生长。近年,我国番茄和人参果上有马铃薯M病毒为害的报道,但基因组序列比较分析发现,马铃薯M病毒马铃薯分离物与侵染番茄和人参果的马铃薯M病毒各基因核苷酸和编码蛋白核苷酸序列相似性在59-75%之间,序列差异较大,特异性明显,属于不同的株系。
PCR 和基因芯片诊断是一种快速而准确的检测方法,而这一类的诊断方法依赖于获得特异的基因序列。病毒的致病机制、传播特性的差异也是因为特异的基因序列。
发明人利用生物信息技术包括从NCBI网站上输入关键词香石竹潜隐病毒和马铃薯M病毒,通过检索获得相关核苷酸序列,在通过比对,根据比对结果,设计了用于扩增马铃薯M病毒基因组的简并引物,再利用分子生物学技术包括总RNA提取、RT-PCR、克隆、测序等技术,在中国首次获得了侵染马铃薯的马铃薯M病毒的全基因组序列。在此基础上,完成了本发明。
总体而言,本发明的多核苷酸可以是DNA 形式或RNA 形式。DNA 形式包括cDNA、基因组DNA 或人工合成的DNA。DNA 可以是单链的或是双链的。DNA 可以是编码链或非编码链。
本发明的基因组全长序列或其片段通常可以用PCR 扩增法、重组法或人工合成的方法获得。对于PCR 扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并按本领域技术人员已知的常规方法所制备的cDNA 库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR 扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
第一方面,本发明提供了核酸,该核酸含有在SEQ ID NO :1所示的马铃薯M病毒的基因组核苷酸序列。还提供了含有与本文所公开的核苷酸序列有序列相同性的序列的核酸。根据具体的序列,序列相同性的程度宜大于72% ( 例如72%、75.1%、71.6%、59.1%、94.6%、97%或更高)。这些序列包括例如突变体和等位基因变体。
本发明还提供了包含本文所公开的一种或多种核苷酸序列片段的核酸。这些片段应包含诸序列中至少n个连续的氨基酸,并且根据具体的序列,n 为10 或更高( 例如,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,30,35,40,45,50,60,75,100 或更高)。较佳地,该片段是马铃薯M病毒基因组特有的,换言之在其他生物体的基因组中并不存在。更佳地,该片段是马铃薯M病毒毒株的基因组特有的。本发明还提供了与本文所提供的核酸发生杂交的核酸。杂交条件如本文中所述。
本发明还提供了核酸,该核酸包含与上述序列互补的序列( 例如,用于反义、用于探针、或用于扩增引物)。
当然,本发明的核酸可以用多种方法制备( 例如,化学合成、从DNA 文库、或从生物体本身制得等),并可采用各种形式( 例如单链、双链、载体、探针、引物等)。术语“核酸”包括DNA 和RNA,以及它们的类似物,如含有修饰骨架的那些类似物,还包括肽核酸(PNA) 等。
应理解,因为SEQ ID NO :1 基本上代表了马铃薯M病毒的完整基因组。
本发明还提供了含有本发明的核苷酸序列的载体( 如表达载体、测序载体、克隆载体等) 以及用这些载体转化的宿主细胞。
第二方面,本发明还提供了一种蛋白质,该蛋白质含有本文所示的马铃薯M病毒核苷酸序列中所编码的氨基酸序列。还提供了含有与这些蛋白质有序列相同性的序列的蛋白。根据具体的序列,序列相同性程度宜大于55% ( 例如58.5%、70%、73.3%、77.9%、82.1%、97%或更高)。序列相同性用如上所述的方法确定。这些同源蛋白包括本文所示的马铃薯M病毒核苷酸序列中所编码的突变体和等位基因变体。
本发明还提供了一种蛋白质,该蛋白质含有序列表中所公开的马铃薯M病毒核苷酸序列中所编码的氨基酸序列片段。这些片段应包含诸序列中至少n 个连续的氨基酸,并且根据具体的序列,n 为7 或更高( 例如,8、10、12、14、16、18、20 或更高)。这些片段宜包含该序列的表位。
可用各种测试来评估本发明蛋白的体内免疫原性。例如,蛋白质可以重组表达或者化学合成,并通过免疫印迹用于检测病原。该方法可用于ELISA、Western blot、捕获免疫RT-PCR、免疫电镜等来鉴定检测病原中的马铃薯M病毒。
本发明还提供了编码本发明蛋白的核酸。
第三方面,本发明还提供了含有本发明核酸的核苷酸序列的计算机、计算机存储器、计算机存储介质( 如软盘、硬盘、CD-ROM 等) 和/ 或计算机数据库。较佳地,它含有本文列出的一种或多种马铃薯M病毒核苷酸序列。
这可用于分析本文所列出马铃薯M病毒核苷酸序列。例如,可用于检索以鉴别序列中的开放阅读框(ORF) 或编码序列。
第四方面,本发明提供了鉴别氨基酸序列的方法,它包括步骤:检索本文所列出的马铃薯M病毒核苷酸序列中推定的开放阅读框或蛋白编码序列。类似地,本发明提供了此处所列出的马铃薯M病毒核苷酸序列在检索推定的开放阅读框或蛋白质编码序列中的用途。
开放阅读框或蛋白编码序列分析通常在计算机上用标准的生物信息技术进行。用于分析的典型算法或程序包括但不限于:DNAMAN、DNAstar等软件。
对开放阅读框或蛋白编码序列的检索可包括步骤:检索此处所列出的马铃薯M病毒核苷酸序列中的起始密码子和检索上游序列中的处于读框中终止密码子。中间的密码子就代表了推定的蛋白编码序列。通常,应检索一个序列中6 种可能的读框。
用这种方法鉴别出的氨基酸序列可用任何合适的系统进行表达,以获得蛋白。该蛋白可用于产生抗体,而该抗体识别在鉴别出的氨基酸序列中的表位。这些抗体可用于筛选马铃薯M病毒,以检测是否存在含所鉴别氨基酸序列的蛋白质。
此外,一旦鉴别出ORF 或蛋白编码序列,那么就可将该序列与序列数据库进行比较。序列分析工具可在例如NCBI(http://www.ncbi.nlm.nih.gov) 处找到,例如BLAST,BLAST2,BLASTn,BLASTp,tBLASTn,BLASTx,和tBLASTx 算法。用于比较的合适数据库包括非冗余GenBank,EMBL,DDBJ 和PDB 序列,以及非冗余GenBank CDS 翻译物,PDB,SwissProt,Spupdate 和PIR序列。这种比较可给出蛋白质功能的指示。
氨基酸序列中的疏水区可用以上算法加以预测,例如基于Esposti 等人的统计学研究的算法[″膜蛋白亲水性的关键评价″(Critical evaluation of the hydropathy of membrane proteins)(1990)Eur J Biochem 190 :207-219]。疏水区代表了潜在的跨膜区或疏水性前导序列,这暗示蛋白质可以被分泌或位于表面。这些特性通常是良好免疫原的标志。
类似地,可用PSORT 算法(http://www.psort.nibb.ac.jp) 来预测跨膜区或前导序列,以及用MOTIFS 程序来预测功能区(GCG Wisconsin & PROSITE)。
本发明还提供了一种核酸,该核酸含有本文所列出的马铃薯M病毒核苷酸序列中的开放阅读框或蛋白编码序列。此外,基于本发明所提供的基因组序列,还提供了若干种蛋白质,该蛋白质含有所述开放阅读框或蛋白编码序列所编码的氨基酸序列;编码的氨基酸序列如SEQ ID NO :2所示。
第五方面,本发明提供了结合这些蛋白的抗体。它们可能是多克隆的或单克隆的,可用本领域技术人员已知的任何合适方法制得。
本发明的抗体可以以各种不同方式使用,例如用于证实蛋白质的表达,或用于证实蛋白质表达的场所。例如,标记的抗体( 如荧光标记以用于FACS( 流式细胞分选仪)) 可以与完整的病毒一起孵育,而在病毒表面上存在标记就证实蛋白质的位置。
第六方面,本发明提供了各种方法。
本发明提供了一种生产本发明的蛋白的方法,该方法包括步骤:在诱导蛋白表达的条件下,培育本发明的宿主细胞。一种方法还可包括化学合成蛋白或化学合成( 至少部分合成) 核苷酸。
本发明提供了一种检测本发明的多核苷酸的方法,该方法包括下列步骤:(a) 在杂交条件下使本发明的核酸探针与生物样品接触,形成双链体;和(b) 检测所述双链体。
本发明提供了一种检测本发明的蛋白质的方法,该方法包括下列步骤:(a) 在适合形成抗体- 抗原复合物的条件下使本发明的抗体和生物样品接触;和(b) 检测所述复合物。
第七方面,本发明提供了检测选择性结合于抗原或多肽或蛋白质的抗体的方法,这些抗原或多肽或蛋白质是对马铃薯M病毒的任何毒种或毒株特异性的,较佳地是对马铃薯M病毒毒株特异性的,但更佳地是对马铃薯M病毒特异的。该方法包括步骤:(a) 在适合形成抗体- 抗原复合物的条件下,使本发明抗原或多肽或蛋白质与生物样品接触;和(b) 检测所述复合物。
方法综述
本发明提供了马铃薯M病毒核苷酸序列、和其所编码的氨基酸序列。利用这些所公开的序列,可以产生核酸探针试验和表达盒及载体。蛋白质还可化学合成。表达载体可以转入宿主细胞以产生蛋白。纯化或分离的多肽可用于产生抗体以检测马铃薯M病毒蛋白。而且,宿主细胞或提取物可用于生物试验以分离促效剂和拮抗剂。此外,利用这些序列,人们可检索以鉴定开放读框(ORF) 和鉴定氨基酸序列。蛋白质还可用于免疫原性组合物以及用作疫苗组份。
除非另有描述,本发明的实施将采用分子生物学、微生物学、重组DNA 和免疫学的常规技术,这些均是本领域技术人员所知的。这些技术在下列文献中有全面的描述:例如,Sambrook《分子克隆实验手册》第2 版(1989) ;《DNA 克隆》第I 和II 卷(D.N.Glover编1985) ;《寡核苷酸合成》(M.J.Gait 编,1984) ;《核酸杂交》(B.D.Hames 和S.J.Higgins编.1984) ;《转录和翻译》(B.D.Hames 和S.J.Higgins 编,1984) ;《固定化细胞和酶》(IRL 出版社,1986) ;B.Perbal,《分子克隆实用指南》(1984) ;《酶学方法》系列丛书(Academic Press,Inc.),尤其是154 和155 卷;Mayer 和Walker 编(1987),《细胞和分子生物学的免疫化学方法》(Academic Press,London) ;Scopes,(1987)《蛋白质纯化:原理和实践》第2 版(Springer-Verl ag,N.Y.),以及《实验免疫学手册》I-IV 卷(D.C.Weir 和C.C.Blackwell 编1986)。
在本说明书中采用了核苷酸和氨基酸的标准缩写。
本文引用的所有出版物、专利和专利申请均全部纳入本文作参考。
免疫诊断试验
本发明的马铃薯M病毒抗原或其抗原性片段,可用于免疫试验来检测抗体水平( 或相反,可用抗马铃薯M病毒抗体来检测抗原水平)。根据明确的免疫试验,可以开发重组抗原,以代替侵入性诊断方法。可检测生物学样品( 例如马铃薯样品) 中的马铃薯M病毒 蛋白或其片段的抗体。免疫试验的设计可作很大变化,其各种方案均是本领域中已知的。免疫试验的方案可基于例如竞争性、或直接反应或夹心型试验。方案例如还可采用固体支持物,或可以采用免疫沉淀法。大多数试验涉及采用标记的抗体或多肽;该标记例如可以是荧光标记、化学发光标记、放射活性标记或染料分子。扩增探针信号的试验也是已知的;其例子是采用生物素和亲和素的试验,酶标记的和介导的免疫试验,如ELISA 试验。
将合适的材料( 包括本发明的组合物) 以及进行试验所需的其它试剂和材料( 例如合适的缓冲液、盐溶液等) 和合适的试验说明书包装到合适的容器中,构成适用于免疫诊断且含有适当标记的试剂的试剂盒。
核酸杂交
“杂交”指两个核酸序列相互之间通过氢键而结合。通常,一个序列固定于固体载体,另一个将游离于溶液内。然后,在有利于形成氢键的条件下使两个序列相互接触。影响这种结合的因素包括:溶剂的类型和体积;反应温度;杂交时间;搅拌;封闭液相序列与固体载体非特异性结合的试剂(Denhardt’s 试剂或BLOTTO) ;各序列的浓度;是否使用化合物来增加序列结合的速度( 硫酸葡聚糖或聚乙二醇) ;以及杂交后洗涤条件的严谨程度。见Sambrook 等人[ 同上] 第2 卷,第9 章,9.47 至9.57 页。
“严谨性”指有利于非常相似的序列结合而不利于不同序列结合的杂交反应条件。例如,应选择温度和盐浓度的组合,使温度比所研究的杂交的Tm 计算值低大约120 至200℃。温度和盐浓度常可在前期初步实验中通过经验来确定,在初步实验中,固定在滤膜上的基因组DNA 样品与感兴趣的序列杂交,然后在不同的严谨度条件下洗涤。见Sambrook等人第9.50 页。
在设计杂交实验时,影响核酸杂交的一些因素可以方便地予以改变。杂交和洗涤时的温度以及洗涤时的盐浓度的调节最为简单。随着杂交温度( 即严谨度) 的升高,不同源的链之间发生杂交的可能性变得更少,结果背景值降低。如果放射性标记的探针并非与固定的片段完全同源( 这在基因家族和种间杂交实验中是常见的),则必须降低杂交温度,而背景值将会增加。洗涤温度以类似的方式影响杂交带的强度和背景值的程度。洗涤的严谨性也随盐浓度的降低而升高。
通常,在50%甲酰胺存在下的方便的杂交温度是:对于靶片段同源性达95%至100%的探针而言,是42℃;对于同源性为90%至95%的探针,为37℃;对于同源性为85%和90%的探针,为32℃。对于较低的同源性,应用上述方程式应相应地降低甲酰胺含量和调节温度。如果探针和靶片段之间的同源性是未知的,则最简单的方法是从非严谨的杂交和洗涤条件开始。如果在放射自显影后发现了非特异性的条带或高背景值,则可在高严谨性下洗涤滤膜,并重新曝光。如果曝光所需时间使得该方法不切实际,则应平行测试几种杂交和/ 或洗涤严谨性。
核酸探针试验
采用本发明的核酸探针的方法( 如PCR、分支DNA 探针试验或印迹技术) 能确定cDNA 或mRNA 的存在。如果探针和本发明的序列能形成稳定地足以被检测到的双链体或双链复合物,则称探针与本发明的序列“杂交”。
核酸探针将与本发明的马铃薯M病毒核苷酸序列( 包括有义和反义链) 杂交。尽管有许多不同的核苷酸序列编码该氨基酸序列,但是天然的马铃薯M病毒序列是较佳的,因为它是实际存在于细胞中的序列。mRNA 代表一种编码序列,因此探针应与该编码序列互补;单链cDNA 与mRNA 互补,因此cDNA 探针应与非编码序列互补。
探针的确切长度和序列将取决于杂交条件,如温度、盐浓度等。例如,对于诊断应用,根据分析物序列的复杂程度,核酸探针通常含有至少10-20 个核苷酸,较佳的15-25 个,更佳的至少30 个核苷酸,但是也可短于该长度。短的引物通常需要较低温度,以便和模板形成足够稳定的杂交复合物。
探针可用合成方法产生,例如Matteucci 等人[J.Am.Chem.Soc.(1981)103 :3185]的方法或Urdea 等人[Proc.Natl.Acad.Sci.USA(1983)80 :7461] 的方法,或用市售的自动寡核苷酸合成仪合成。
可以根据偏好选择探针的化学特征。对于某些应用,DNA 或RNA 是合适的。对于其它的应用,可以加入修饰,例如骨架修饰,如硫代磷酸酯或甲基磷酸酯,可用来增加体内半衰期,改变RNA 亲和力,增加核酸酶抗性等[ 例如参见Agrawal 和Iyer(1995)Curr Opin Biotechnol 6 :12-19 ;Agrawal(1996) TIBTECH14 :376-387] ;还可采用类似物如肽核酸[ 例如参见Corey (1997)TIBTECH15 :224-229 ;Buchardt 等人(1993)TIBTECH 11 :384-386]。
另外,聚合酶链反应(PCR) 是另一个熟知的检测少量靶核酸的手段。该试验在Mullis 等人[Meth.Enzymol.(1987)155 :335-350] ;美国专利4,683,195 和4,683,202 中有所描述。用两个“引物”核苷酸与靶核酸杂交,并用来引导反应。引物可包含不与扩增靶序列( 或其互补序列) 杂交的序列,以帮助双链体的稳定性,或例如可插入一个简便的限制性位点。这些序列通常侧接所需的马铃薯M病毒序列。
利用最初的靶核酸作为模板,热稳定的聚合酶能从引物产生靶核酸的拷贝。在聚合酶产生临界量的靶核酸后,它们可用较传统的方法( 如Southern 印迹) 来检测。当采用Southern 印迹方法时,标记的探针将与马铃薯M病毒序列( 如其互补序列) 杂交。
另外,mRNA 或cDNA 也可用Sambrook 等人[ 同上] 描述的传统印迹技术来检测。用凝胶电泳可纯化并分离利用聚合酶从mRNA 产生的mRNA 或cDNA。然后,将凝胶上的核酸印迹到固体载体如硝酸纤维素上。使固体载体与标记的探针接触,然后洗涤除去所有未杂交的探针。然后,检测含有标记探针的双链体。该探针通常用放射活性物质作标记。
基因组序列的应用
基于对马铃薯M病毒基因组全序列的测定,可以了解与该病毒复制、运动及重要调控功能有关的基因结构和功能,找到其分子生理机制以及如何侵染寄主的关键点。
一种应用方法是,构建马铃薯M病毒的全长侵染性克隆,对其基因序列进行突变,再用来侵染寄主植物,根据寄主表现研究其功能;或者是把病毒编码的各个基因构建到其他病毒载体或瞬时表达载体上,通过突变分析其功能。这些方法都是本领域里的常规方法,基于本发明所提供的马铃薯M病毒基因组序列,可以大大方便引物的设计以及克隆的进程。
另一种直接的应用是使用本发明的抗体、引物或探针,来检测样品中是否存在马铃薯M病毒或其遗传物质。
对于抗体而言,这种检测方法包括步骤:
用本发明的核酸序列获得蛋白制备的抗体,可以用于生物样品(马铃薯样品等)进行包括但不限于ELISA、Western blot、捕获免疫RT-PCR、免疫电镜等方法检测。
对于探针而言,这种检测方法包括步骤:
将马铃薯样品或其cDNA或PCR产物与本发明的探针接触,观察是否形成样品-探针复合物,形成了复合物就表示样品中存在马铃薯M病毒或遗传物质。
对于引物而言,这种检测方法包括步骤:
用本发明的特异性引物,对样品进行PCR 反应,观察是否扩增产生了特异性的扩增产物,产生了特异性扩增产物就表示样品中存在马铃薯M病毒或遗传物质。在本发明的一个实例中,马铃薯M病毒的基因组序列是通过如下方法获得的,该方法包括步骤:
1. 分离纯化病样总RNA。
2. 以此RNA 样品为模板,采用逆转录酶合成单链cDNA。继续以此cDNA 为模板,利用本发明公布的简并引物或者基因本发明公布的核酸序列设计的寡核苷酸引物,在DNA 多聚酶的作用下进行PCR 扩增克隆、测序,得到特异片段。
3. 将得到的序列输入计算机,利用软件( 如DNAMAN 软件) 进行拼接,再经后期工作得到完整的病毒基因组全序列。
具体实施方式
下面结合实施例对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
本发明所述的分离的核酸分子的核苷酸序列如SEQ ID NO:1所示或其反义序列。
所述的核酸分子式DNA或RNA。
所述的分离的核酸分子包括那些与所述的核酸分子编码的5个基因其中病毒编码的223kDa、25kDa、12 kDa、7 kDa、34 kDa(外壳蛋白)、11kDa蛋白与其分离物的核苷酸同源性、相似性分别大于等于72%、75.1%、71.6%、59.1%、94.6%、97%,氨基酸序列同源性、相似性分别大于77.9%、83.41%、75.23%、58.5%、97.37%、95.37%的核酸分子或其反义序列。
本发明所述的分离的核酸分子的用途为所述的核酸分子用于制备检测马铃薯M病毒的引物、探针或试剂盒,或用于制备抗马铃薯M病毒的抗体。
所述的引物长度为15~100个核苷酸。
所述的探针长度为25~5000个核苷酸。
所述的探针长度为50~500个核苷酸。
本发明所述的分离的DNA分子为SEQ ID NO:1所示或其反义序列中连续的150~8530个核苷酸所构成。
所述的DNA分子为SEQ ID NO:1所示或其反义序列中连续的300~8530个核苷酸所构成。
所述的DNA分子为SEQ ID NO:1所示或其反义序列中连续的1000~8530个核苷酸所构成。
下面以具体实施案例对本发明做进一步说明:
实施例1
病样总RNA的提取:
取0.1~0.5g病样,液氮研磨至粉末状,转移置1.5mL的Eppendorf管中(Eppendorf管需预先用液氮冷冻)。用常规或厂商所建议的方法提取病样总RNA。
RT-PCR反应:
设计合成引物:
反转录(Reverse transcription,RT),反应体系为20μL。
PCR:根据以下配制PCR反应溶液(50 μL体系)。
反应条件为:94℃预变性2 min;94℃变性1min,退火温度根据表中特异引物对确定,退火1min,72℃延伸1min,35个扩增循环;最后72℃10 min。反应结束后取5μL反应产物进行0.8%琼脂糖凝胶电泳。
PCR产物回收:
RT-PCR与PCR产物用UNIQ-10柱式PCR纯化试剂盒或UNIQ-10柱式胶回收试剂盒回收,操作步骤按照产品说明书进行。
连接:
转化大肠杆菌感受态细胞,筛选阳性克隆,测序。
实施例2
对马铃薯M病毒基因组序列的验证
根据SEQ ID NO :1 所示的核苷酸序列,按每1200bp 左右长度设计引物,进行PCR 反应,对PCR 产物进行测序验证。结果表明SEQ ID NO :1 的核苷酸序列是正确的。
实施例3
检测马铃薯M病毒的检测试剂盒
利用本发明公布的核苷酸序列,通过原核表达的方式获得目的蛋白,通过免疫家兔获得多克隆抗血清,免疫鼠瘤细胞获得单克隆抗体。用这些抗体进行如下检测。
双抗夹心 ELISA (DAS-ELISA)
包被捕获抗体
每孔加入100μL 包被缓冲液(coating buffer)稀释的捕获抗体,包含阳性、阴性和空白对照对应的孔,37℃放置3h。
包被抗原
将抗体甩去,用PBST洗板4次,拍干。每孔加入100μL的PBST稀释的植物病样粗汁液,同时设置阳性、阴性和空白对照,37℃放置3h。
封闭
将包被抗原甩去,同上洗板4次,每次放置3~5min。每孔加入200μL的封闭液(5%的脱脂牛奶或1%的牛血清白蛋白),37℃放置30min。
包被酶标抗体
将封闭液甩去,拍干不洗板,每孔加入100μL的PBST稀释的酶标抗体,37℃放置3h。
显色
甩去酶标抗体,洗板4次,将底物(对硝基苯磷酸盐)溶于10%的底物缓冲液,100μL/孔,室温显色15-30min。405nm下读OD值。
取马铃薯M病毒感染病样,样品研磨后稀释至10、50、100倍,用上述方法进行检测,结果表明获得的抗体能与感染马铃薯M病毒的样品阳性反应。
实施例4
检测马铃薯M病毒的检测试剂盒基于SEQ ID NO :1 中所示的基因组序列,合成以下PCR 引物和探针:
正义引物 :序列为SEQ ID NO :1 中第1393-1416 位。
反义引物 :序列为SEQ ID NO :1 中第1537-1560 位的互补序列
探针 :序列为SEQ ID NO :1 中第1444-1473 位。
制备试剂盒( 检测50 次),它含有:浓度为100pmol的正义引物50μL,浓度为100pmol的反义引物50μL,浓度为100pmol的探针50μL,RT-PCR反应液2.5ml。
取马铃薯M病毒感染病样,样品研磨后稀释至10、50、100倍,用上述方法进行检测,结果表明该探针能与感染马铃薯M病毒的样品阳性反应。
此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
SEQUENCE LISTING
<110> 云南省农业科学院生物技术与种质资源研究所
<120> 一种马铃薯M病毒基因组全序列及其应用
<130> 2016
<160> 18
<170> PatentIn version 3.3
<210> 1
<211> 8530
<212> DNA
<213> 铃薯M病毒云南分离物
<400> 1
acatggggga taaacaaaca tacaatatct gagcttacac tgcaatatac taccataaag 60
tactatatac agtctaagga atcatggcac tcacatacag aacgccaatg gaagatattg 120
ttaattgctt cgagccagcg actcaggctg tgatagctaa tagtgcagct acgttgtata 180
aaaatttcga ggaacaacac tgccaatatt tcaattacta cttatcgcct tcggcgaaaa 240
ggaaattaag tatggcaggt gtgtacttga gcccatactc cgcagttgtg cactcgcatc 300
tcgtctgcaa aacgttggaa aattatttac tgtacagtgt tttaccgtct tatgtaaatt 360
ctagttttta tttcgtggga atgaaggaaa gaaagctgca actgctaaaa tcaaagtgca 420
agaatttgga tagcgtgcag tgtattaaca ggtacgtaac gagcgctgat agaatgagat 480
acacaaatga ttttgtgcca tatagctcgt atgaacatga agaattggtt cacaagggag 540
gaggcttaga taatgttaca ctcaaaaacc tcgtgggtcc attgagccgc cacaaggcaa 600
agaatctgtt cattcatgac gaactgcatt attggagtag taagacccta atagattttc 660
tggatgttat gcgtccagat aagctattgg ggacggtagt gtacccgccc gaattactct 720
tcaagcaagt tcgcagtttg aacgaatggt gctacacata cgatatagtg ggtgatacat 780
taatgttctt cccagatggt gtgcagggag agggctatca acaaccactg aaaggtggtt 840
acttactgag cgcaaggagc ttgaaattgc cagatggcac gacatacatg gtggatgtgt 900
tgtgcagcaa atttgcgcac catttggtat ccataactaa aggtgaggct gttgcaccca 960
cgcacagagc gtttggcccc ttcgaagcag ttgcgtcaga agctctaacg tcattgagcc 1020
cggactaccc cgtgtgcttc cccgttagct atgaagttgt gaataagata tataggtatc 1080
tgcgcacgct gaaaaaaccg gatgagcaat cagcgatagc caagctcagc caaattatcg 1140
ctgagccatc tggtagggag atagacttcg tggaatgttt tgcacgattg gttatacaca 1200
attcgagcat ttgtgtgaca atcatgcctg agcgattgat agaattcatg ggcacttggc 1260
tgggtaaaat gccatctgtg ttggcgcgca gatttagtag cgtgagggcc gtttgcgtga 1320
acaaatttat caggagcctc aagccttata gtttcacctt gcgcttgaat gatatcacct 1380
ggtggaatct ttgggataac agctttgctt ggttcttcga attggaaacg gctatcgatt 1440
taccagagaa gatggattcg caatttgctg gtggaggtgc aagtctgatg gcacacatca 1500
catcgcagcc ctatgtcgga atgctgccgc ttgcggatag ggggtggaaa ccactgctaa 1560
ttttggaggg agtgcggctg aggtacgcca tacgtaggat gtttctgaga ggtgtctgga 1620
gtgagcacat gagagtcatc tcgaagagtt ttctgctcga gtacgtgagt tccagattgc 1680
agcagagcat attggttgct aggataagca ggacaagttc agtgaagcga atgctccagc 1740
catgggaaat tcttggttat tcgagcgctg aggagttgtt tgacttcatg aggtaccaat 1800
gcaatccaag acttcggcct ttgcactcag agttagggct ggcatggttc ttgcgcgtgg 1860
atagaagtaa tctcaaatgc ttgacgaatt acagcgaggg caagcaagct gtgactgggg 1920
tcgtcactag ttggagggca gtaatccaag agttgggtat taaacgcaaa agcaggtgga 1980
caaggattga ggagctcaaa accggtggag cgcacgccgt ggcgcgcaag atgcatagtt 2040
tggcacccgc tgagataagt gaagtggaag cagctttgag agtggagcta gcagagattg 2100
cctgtgcctg cgggtcggag cacgggcagg gcgttatgct gagtaatgag agcggcctgt 2160
gtgtccgtga ctacatcgca ggtgtgtctg taggtctcta cgcgaggagc caaggtgata 2220
tgcactgggg gagtactgca atcataaata atggatggcc aaagagcttg gacatgtgga 2280
tggatataaa ttctgttgat ccaaaatatg aagtggctgt tcatctgcaa tacggcaagg 2340
aaacgcaagt tgatttggtc ttgcatgaga ttagaggttt ggactacaat ggcggcattg 2400
ttgctgtgaa tttgcgtaaa tgtggtgcat tctcaataag ttgtccgagt ggcgacctcg 2460
cagtgggcgt ggatgggcca catttggtga agatccttgg cgcgaactgt ggtgatcatg 2520
cctgctatat ggtgggactg gaggcagtta atgatgtggt cgtctttgcg atgaggcaga 2580
aatctcgcgc agccgcagag cccatcgttg agctggttgc aagtgaagca cactctgaag 2640
ccgcagagca gaggcggcag gatgctaaag gagtgcgcct cggtggcgtt tggtgcaggg 2700
aaagcgtgtc tgcaagtaat gtggcatata gcagggtcaa ggtgcccgga aatggatcat 2760
gtttttggca cagcgtagca tacttggtgg gcatgcatta catggagtta aaacagttat 2820
gcatgtcgca cgtgtttgat gatgcagcgt tgaacgctga actcgctatg tgcaaggcgc 2880
caggcgcttt tgctaccagt gcagcgatac tctctgcggt cgtgcggctt cgagcggaaa 2940
taagggtgta caattcgaca accggtaggg tgcacacata caccccggag gagaaaacga 3000
tggctctaga tttgtggttg gaagcagaac actatgagcc acaagtgtta agaaatgggt 3060
gtgtgatcga gtctgtcgca caagccttag gcaggaggaa tgcagatgtg ttagctgtaa 3120
tagaggaacg ctgctgcgat gaggttgttg caagtgtgca agctggctgt ggattgaatt 3180
tgcagcatat agagatcgtg ctgcagtgtt ttggcattgt cggtttttgc agcgttgagg 3240
ggaaagaagt ggtgcttaat tctagcggaa aacttgcaac gtgctttaac atagaggatg 3300
agcacatgag ctattgtggt aggcgaaaag atccatgttg cagtttgctg agcggagcaa 3360
agcacggtaa actatttcca gaatctgcat tgctagatct tgagaattgt gggctgtgcg 3420
tggaatttca gcccaattgg acgagggcgg gcattttagc agatagtatg caccagggtg 3480
ctacaggtgt gcttgggtcc gcacttttta acaacaagcg gaatctgcgc gaaaaaattt 3540
cacaagatgg tgtcaggaaa gtgcatgtga tagctggcac tttcggatcc ggaaagagca 3600
ctttgttcaa aaatctgttg gaacgcggag ctggtaagtc tctggatttc gtgtcaccta 3660
ggcgtgcgtt ggctgaggat tttaagaaat ccgtagggat tggcgggaaa gatgggacgt 3720
ccaaagcggg gcaggagaat tggcgtgtga cgaccctaga aacctttttg agtaagattg 3780
aatttctaac tgagggtcag gtggttatct tcgatgagat gcagttgtat ccacctgggt 3840
acttcgacct tgtgttgagt attatgaagg tggaagcacg tgtgtttcta gtcggtgatc 3900
cagcgcagag tgattatgac aatgagaagg atcgcgtagt gcttggagcc atggaagaaa 3960
acgttcaagt gctattggga gcacgtgagt atgcgtacaa ggtgcgaagc cacaggtttt 4020
tgaatagcaa ttacatcggc aggttgccgt gtgagatcgc caaggaggaa tgcacaattg 4080
atgagccgca tgtgttgcgt atgcacctag agaatttgca ggatctgggg gaggaatacc 4140
gagctgttgt gctggttagt tccttcgatg agaaactagt ggtgtgtgcg catttacctg 4200
gtgcgaaggt gctgacattc ggagagagta cgggtttaac attcatgtat ggcacgatct 4260
atgtgtcagc tatctctgag cggactagcg aaaggaggtg ggttacagcc ttaagtaggt 4320
tccgttttaa cttgtgcttt gttaattgta gcggaatgaa ttaccagcaa ttggcgctta 4380
gatacaaggg aagggtgctt gcaaagtttt tgtgcaaaac tgctgagccc aaagatttga 4440
ttgagatgct acccggaagg ccacaattta gaaatgatta cagccgctta ataggaaagg 4500
atgaaggggt gcgggaggag aagctggctg gagacccctg gctgaaaacg atggttaacc 4560
tgtaccaagc gccagatgtg gaagtgatgg agagtcctga aatggtgatg caggaggaat 4620
ggtttcgcac gcatctaccg agggatgagc tggagagcgt gagggctcaa tgggtgcata 4680
agatcatggc aaaggagtat agagaggtgc ggatgggcga catggtgtct gagcaattca 4740
ctgatgatca tacaaagcag ctgggtgcta aacagttgac gaacgcagct gagcgtttcg 4800
agactattta cccgaggcac agagcaagtg atacggtcac gtttctaatg gcggttaaaa 4860
agcgattgag cttttcaaac cctggaaaag agagggggaa gttgttccat gccgcaacct 4920
atggaaaggc cctattgcag gagttcctca agcgtgtgcc gctaaagcca ggtcataacg 4980
cccgctttat ggatgaggca ctgtggaatt ttgaagagaa aaaattgagc aaaagcgcag 5040
caaccatcga gaatcactca gggagatcat gcagggattg gcccatagac gttgcacaga 5100
tcttttccaa gagtcagctg tgtactaaat tcgacaaccg ttttagagtg gctaaggctg 5160
cgcaaagtat tgtgtgtttc cagcacgctg ttttgtgccg ctttgcaccg tacatgcggt 5220
acatcgaaat gaaagtgcac gaggtgcttc caaagaatta ctacatacac tctggaaagg 5280
gacttgagga gctagatgca tgggtaaaga agggtaaatt cgaaggcata tgtacagaat 5340
cggactacga ggcctttgat gcttctcagg atgaatttat catggctttt gagctagaac 5400
tgatgaaatt cctgcgattg ccaaatgatc tgatcgagga ttacaaattc attaaaacga 5460
gtttgggttc aaagctgggc aattttgcta tcatgaggtt ctcgggtgag gcgagcacct 5520
tcttgtttaa cacattggcc aatatgctct tcacctttat gaggtataac attcgcggag 5580
atgagttcat atgcttcgct ggagatgata tgtgcgcgtc caggaggtta caaacaacaa 5640
agaagtttgc acatttcctt gataagctaa agttaaccgc gaaagtgcaa tttgtgaaca 5700
agcccacatt ttgtgggtgg cacttgtgcc ccgatggtat ttacaaaaaa cctcagctcg 5760
tgcttgaaag gatgtgtatt gcccaagaga tcaataacct cataactgcc ttcgacattt 5820
acgccctata ggttgcgtat gcttacaagt tgggtgaaaa agcagttaac aggatggatg 5880
aggaggaggt tgctgcattc tacaattgcg tgagaattat cgtgcggaat aagcacctta 5940
ttcgctctga tgtgaggaaa gtatttgaag tgctttaaat aggtagctta ggtagtgcta 6000
taggtttgaa tatttatgga tgtagtcgta gagttgttgt ataaatacaa gtttgaacgt 6060
ttgcataata aattagcatt tccgattgta gtgcattgtg tgcccggcgc agggaaaagc 6120
agtttgattc gtgagttgct agagttagat agtcgttttt gtgcctacac agctggcgta 6180
gaggatcagc caaggttgag cgggaactgg atcaaaaagt ggaagggcgt cgctactgaa 6240
ggtaagcact tgattttgga cgagtacacg ttgctagttg aagtgccaca ggcattcgca 6300
ttatttggtg atccaattca gtcctgcact ggatctgtac agagcgccga tttcgtgtgt 6360
tcattcagca aaaggtttgg cagtgctaca gggtctctac tgagagagct aggttgggac 6420
attcagagcg agggacctga tctggtgcag gtatctgaca tcttcgtgaa agagccagag 6480
ggagtggttg tatatttcga ggaagaagta ggttgcctgc ttaaggcgca tagtgtggag 6540
gcattcagct tgagtgaaat cgtgggccaa acatttgaag ttgtcacgtt tgtgacctca 6600
gaaaactcgc cagtaatcaa ccgtgcagct gcttatcagt gtatgacaag gcatcgagta 6660
gctcttcaca ttttgtgccc taatgccact tactccgccg cctgatttct caaaggtata 6720
tctttctgca gccgttggtg cgacattggc tgccatagtt tggctgataa caaagagcac 6780
tctacctgcg gttggagata gggaacacaa tttgccacac ggcggttggt atcgagacgg 6840
cacgaagtca gtgttctaca atagtccctg caagctcaac tcgatcgaga gtgggaggtc 6900
acctctactt gggcaaccgt gggctctagt tggtctcttg attgcactca tctgggtgag 6960
tcagagattt agcagttctg gttgcaggag gtgtggaggg caacattcat gattgagcac 7020
atcctcattg gactctcggc tttcttgatt gcgctcttcg taattagtca gaatcagagc 7080
gggtgcacag tgttgatcac gggtgaatca gtaaggttct tggggtgtcc agtaacacaa 7140
gagttcagca aagcggtgtc tgaattaaag ccgatagctt gtgcttcctt taggtctaga 7200
gggtgattcg aaatagtgag tatgggggat cctatggaga aagttgaagc tagcaagaag 7260
gcgagtacat cgcagccggc tcagggcgca agaccgctgc caaaggccac ggattttgat 7320
gtgactgaag atcgcgatgg cgcagatgct cacaatgctg cggacgagga agaatcctcc 7380
ctggaacgta ggttggacag cttacgtgac tttctgcgtg aaaggcgtgg tgcaattcgg 7440
gtgactaatc ctggtttgga aacaggcagg ccaaaattga agctagctga ggatatgcgt 7500
cctgacccga caaacccgta caacaggcct tcaatagaag cgctaagcag gatcaaaccg 7560
atagccatat cgaacaatat ggccacatct gaggacatga tgcgcatata tgtaaatctg 7620
gaaggcctgg gtgtgcctac tgaacacgtg cagcaggtgg tcattcaagc tgtgttgttc 7680
tgcaaagatg ctagcagctc tgtgtacttg gacccgcgtg gttcgttcga gtggcctaga 7740
ggtgccatca cagcggatgc agttcttgcc gtgatgaaga aggacgcgga gactctaagg 7800
agggtttgta ggctatacgc acctgtgacc tggaatcata tgttgactca caactcacct 7860
ccggctgatt gggcagccat gggtttccaa tacgaggaac gctttgctgc attcgactgc 7920
ttcgactacg tcgagaacac agcggccgtg cagccactgg aaggattgat aaggaggccc 7980
actccgagag agaaggttgc tcacaatact cacaaggata tagccttgcg cagtgctaac 8040
cgcaatcagg tgttcagctc tcttagcgcc gaggtgaccg gtggtatgaa tggccccgaa 8100
ctcactaggg atttcgggaa atcgaataac aaatgaagtg tgtgactcga actgctttac 8160
ttgtagctag ggctatgtat ttacattccg gtgtgtttgc gtttgattta gcttatgcaa 8220
tatctaagtg tgcgggcaga ccacttggtg gtggtaagtc caagtatgcg cgccttaggc 8280
gtgctattag tgctggaagg tgccacaggt gctatcgctt gtggccgcct acttcgttta 8340
ctactaggtg tgataataga agttgttttc ctggcattca ttacaatgtg cgcgtggcgc 8400
agtttatcga tgaaggagta actgaggtga tcccttcagt cattcaaaag aatgagtagc 8460
cattaaatcc tatttaatat ataaggtgtg ctactataaa taaaatttgg tttttaagct 8520
atttttagcc 8530
<210> 2
<211> 1963
<212> PRT
<213> ORF1
<400> 2
Met Ala Leu Thr Tyr Arg Thr Pro Met Glu Asp Ile Val Asn Cys Phe
1 5 10 15
Glu Pro Ala Thr Gln Ala Val Ile Ala Asn Ser Ala Ala Thr Leu Tyr
20 25 30
Lys Asn Phe Glu Glu Gln His Cys Gln Tyr Phe Asn Tyr Tyr Leu Ser
35 40 45
Pro Ser Ala Lys Arg Lys Leu Ser Met Ala Gly Val Tyr Leu Ser Pro
50 55 60
Tyr Ser Ala Val Val His Ser His Leu Val Cys Lys Thr Leu Glu Asn
65 70 75 80
Tyr Leu Leu Tyr Ser Val Leu Pro Ser Tyr Val Asn Ser Ser Phe Tyr
85 90 95
Phe Val Gly Met Lys Glu Arg Lys Leu Gln Leu Leu Lys Ser Lys Cys
100 105 110
Lys Asn Leu Asp Ser Val Gln Cys Ile Asn Arg Tyr Val Thr Ser Ala
115 120 125
Asp Arg Met Arg Tyr Thr Asn Asp Phe Val Pro Tyr Ser Ser Tyr Glu
130 135 140
His Glu Glu Leu Val His Lys Gly Gly Gly Leu Asp Asn Val Thr Leu
145 150 155 160
Lys Asn Leu Val Gly Pro Leu Ser Arg His Lys Ala Lys Asn Leu Phe
165 170 175
Ile His Asp Glu Leu His Tyr Trp Ser Ser Lys Thr Leu Ile Asp Phe
180 185 190
Leu Asp Val Met Arg Pro Asp Lys Leu Leu Gly Thr Val Val Tyr Pro
195 200 205
Pro Glu Leu Leu Phe Lys Gln Val Arg Ser Leu Asn Glu Trp Cys Tyr
210 215 220
Thr Tyr Asp Ile Val Gly Asp Thr Leu Met Phe Phe Pro Asp Gly Val
225 230 235 240
Gln Gly Glu Gly Tyr Gln Gln Pro Leu Lys Gly Gly Tyr Leu Leu Ser
245 250 255
Ala Arg Ser Leu Lys Leu Pro Asp Gly Thr Thr Tyr Met Val Asp Val
260 265 270
Leu Cys Ser Lys Phe Ala His His Leu Val Ser Ile Thr Lys Gly Glu
275 280 285
Ala Val Ala Pro Thr His Arg Ala Phe Gly Pro Phe Glu Ala Val Ala
290 295 300
Ser Glu Ala Leu Thr Ser Leu Ser Pro Asp Tyr Pro Val Cys Phe Pro
305 310 315 320
Val Ser Tyr Glu Val Val Asn Lys Ile Tyr Arg Tyr Leu Arg Thr Leu
325 330 335
Lys Lys Pro Asp Glu Gln Ser Ala Ile Ala Lys Leu Ser Gln Ile Ile
340 345 350
Ala Glu Pro Ser Gly Arg Glu Ile Asp Phe Val Glu Cys Phe Ala Arg
355 360 365
Leu Val Ile His Asn Ser Ser Ile Cys Val Thr Ile Met Pro Glu Arg
370 375 380
Leu Ile Glu Phe Met Gly Thr Trp Leu Gly Lys Met Pro Ser Val Leu
385 390 395 400
Ala Arg Arg Phe Ser Ser Val Arg Ala Val Cys Val Asn Lys Phe Ile
405 410 415
Arg Ser Leu Lys Pro Tyr Ser Phe Thr Leu Arg Leu Asn Asp Ile Thr
420 425 430
Trp Trp Asn Leu Trp Asp Asn Ser Phe Ala Trp Phe Phe Glu Leu Glu
435 440 445
Thr Ala Ile Asp Leu Pro Glu Lys Met Asp Ser Gln Phe Ala Gly Gly
450 455 460
Gly Ala Ser Leu Met Ala His Ile Thr Ser Gln Pro Tyr Val Gly Met
465 470 475 480
Leu Pro Leu Ala Asp Arg Gly Trp Lys Pro Leu Leu Ile Leu Glu Gly
485 490 495
Val Arg Leu Arg Tyr Ala Ile Arg Arg Met Phe Leu Arg Gly Val Trp
500 505 510
Ser Glu His Met Arg Val Ile Ser Lys Ser Phe Leu Leu Glu Tyr Val
515 520 525
Ser Ser Arg Leu Gln Gln Ser Ile Leu Val Ala Arg Ile Ser Arg Thr
530 535 540
Ser Ser Val Lys Arg Met Leu Gln Pro Trp Glu Ile Leu Gly Tyr Ser
545 550 555 560
Ser Ala Glu Glu Leu Phe Asp Phe Met Arg Tyr Gln Cys Asn Pro Arg
565 570 575
Leu Arg Pro Leu His Ser Glu Leu Gly Leu Ala Trp Phe Leu Arg Val
580 585 590
Asp Arg Ser Asn Leu Lys Cys Leu Thr Asn Tyr Ser Glu Gly Lys Gln
595 600 605
Ala Val Thr Gly Val Val Thr Ser Trp Arg Ala Val Ile Gln Glu Leu
610 615 620
Gly Ile Lys Arg Lys Ser Arg Trp Thr Arg Ile Glu Glu Leu Lys Thr
625 630 635 640
Gly Gly Ala His Ala Val Ala Arg Lys Met His Ser Leu Ala Pro Ala
645 650 655
Glu Ile Ser Glu Val Glu Ala Ala Leu Arg Val Glu Leu Ala Glu Ile
660 665 670
Ala Cys Ala Cys Gly Ser Glu His Gly Gln Gly Val Met Leu Ser Asn
675 680 685
Glu Ser Gly Leu Cys Val Arg Asp Tyr Ile Ala Gly Val Ser Val Gly
690 695 700
Leu Tyr Ala Arg Ser Gln Gly Asp Met His Trp Gly Ser Thr Ala Ile
705 710 715 720
Ile Asn Asn Gly Trp Pro Lys Ser Leu Asp Met Trp Met Asp Ile Asn
725 730 735
Ser Val Asp Pro Lys Tyr Glu Val Ala Val His Leu Gln Tyr Gly Lys
740 745 750
Glu Thr Gln Val Asp Leu Val Leu His Glu Ile Arg Gly Leu Asp Tyr
755 760 765
Asn Gly Gly Ile Val Ala Val Asn Leu Arg Lys Cys Gly Ala Phe Ser
770 775 780
Ile Ser Cys Pro Ser Gly Asp Leu Ala Val Gly Val Asp Gly Pro His
785 790 795 800
Leu Val Lys Ile Leu Gly Ala Asn Cys Gly Asp His Ala Cys Tyr Met
805 810 815
Val Gly Leu Glu Ala Val Asn Asp Val Val Val Phe Ala Met Arg Gln
820 825 830
Lys Ser Arg Ala Ala Ala Glu Pro Ile Val Glu Leu Val Ala Ser Glu
835 840 845
Ala His Ser Glu Ala Ala Glu Gln Arg Arg Gln Asp Ala Lys Gly Val
850 855 860
Arg Leu Gly Gly Val Trp Cys Arg Glu Ser Val Ser Ala Ser Asn Val
865 870 875 880
Ala Tyr Ser Arg Val Lys Val Pro Gly Asn Gly Ser Cys Phe Trp His
885 890 895
Ser Val Ala Tyr Leu Val Gly Met His Tyr Met Glu Leu Lys Gln Leu
900 905 910
Cys Met Ser His Val Phe Asp Asp Ala Ala Leu Asn Ala Glu Leu Ala
915 920 925
Met Cys Lys Ala Pro Gly Ala Phe Ala Thr Ser Ala Ala Ile Leu Ser
930 935 940
Ala Val Val Arg Leu Arg Ala Glu Ile Arg Val Tyr Asn Ser Thr Thr
945 950 955 960
Gly Arg Val His Thr Tyr Thr Pro Glu Glu Lys Thr Met Ala Leu Asp
965 970 975
Leu Trp Leu Glu Ala Glu His Tyr Glu Pro Gln Val Leu Arg Asn Gly
980 985 990
Cys Val Ile Glu Ser Val Ala Gln Ala Leu Gly Arg Arg Asn Ala Asp
995 1000 1005
Val Leu Ala Val Ile Glu Glu Arg Cys Cys Asp Glu Val Val Ala
1010 1015 1020
Ser Val Gln Ala Gly Cys Gly Leu Asn Leu Gln His Ile Glu Ile
1025 1030 1035
Val Leu Gln Cys Phe Gly Ile Val Gly Phe Cys Ser Val Glu Gly
1040 1045 1050
Lys Glu Val Val Leu Asn Ser Ser Gly Lys Leu Ala Thr Cys Phe
1055 1060 1065
Asn Ile Glu Asp Glu His Met Ser Tyr Cys Gly Arg Arg Lys Asp
1070 1075 1080
Pro Cys Cys Ser Leu Leu Ser Gly Ala Lys His Gly Lys Leu Phe
1085 1090 1095
Pro Glu Ser Ala Leu Leu Asp Leu Glu Asn Cys Gly Leu Cys Val
1100 1105 1110
Glu Phe Gln Pro Asn Trp Thr Arg Ala Gly Ile Leu Ala Asp Ser
1115 1120 1125
Met His Gln Gly Ala Thr Gly Val Leu Gly Ser Ala Leu Phe Asn
1130 1135 1140
Asn Lys Arg Asn Leu Arg Glu Lys Ile Ser Gln Asp Gly Val Arg
1145 1150 1155
Lys Val His Val Ile Ala Gly Thr Phe Gly Ser Gly Lys Ser Thr
1160 1165 1170
Leu Phe Lys Asn Leu Leu Glu Arg Gly Ala Gly Lys Ser Leu Asp
1175 1180 1185
Phe Val Ser Pro Arg Arg Ala Leu Ala Glu Asp Phe Lys Lys Ser
1190 1195 1200
Val Gly Ile Gly Gly Lys Asp Gly Thr Ser Lys Ala Gly Gln Glu
1205 1210 1215
Asn Trp Arg Val Thr Thr Leu Glu Thr Phe Leu Ser Lys Ile Glu
1220 1225 1230
Phe Leu Thr Glu Gly Gln Val Val Ile Phe Asp Glu Met Gln Leu
1235 1240 1245
Tyr Pro Pro Gly Tyr Phe Asp Leu Val Leu Ser Ile Met Lys Val
1250 1255 1260
Glu Ala Arg Val Phe Leu Val Gly Asp Pro Ala Gln Ser Asp Tyr
1265 1270 1275
Asp Asn Glu Lys Asp Arg Val Val Leu Gly Ala Met Glu Glu Asn
1280 1285 1290
Val Gln Val Leu Leu Gly Ala Arg Glu Tyr Ala Tyr Lys Val Arg
1295 1300 1305
Ser His Arg Phe Leu Asn Ser Asn Tyr Ile Gly Arg Leu Pro Cys
1310 1315 1320
Glu Ile Ala Lys Glu Glu Cys Thr Ile Asp Glu Pro His Val Leu
1325 1330 1335
Arg Met His Leu Glu Asn Leu Gln Asp Leu Gly Glu Glu Tyr Arg
1340 1345 1350
Ala Val Val Leu Val Ser Ser Phe Asp Glu Lys Leu Val Val Cys
1355 1360 1365
Ala His Leu Pro Gly Ala Lys Val Leu Thr Phe Gly Glu Ser Thr
1370 1375 1380
Gly Leu Thr Phe Met Tyr Gly Thr Ile Tyr Val Ser Ala Ile Ser
1385 1390 1395
Glu Arg Thr Ser Glu Arg Arg Trp Val Thr Ala Leu Ser Arg Phe
1400 1405 1410
Arg Phe Asn Leu Cys Phe Val Asn Cys Ser Gly Met Asn Tyr Gln
1415 1420 1425
Gln Leu Ala Leu Arg Tyr Lys Gly Arg Val Leu Ala Lys Phe Leu
1430 1435 1440
Cys Lys Thr Ala Glu Pro Lys Asp Leu Ile Glu Met Leu Pro Gly
1445 1450 1455
Arg Pro Gln Phe Arg Asn Asp Tyr Ser Arg Leu Ile Gly Lys Asp
1460 1465 1470
Glu Gly Val Arg Glu Glu Lys Leu Ala Gly Asp Pro Trp Leu Lys
1475 1480 1485
Thr Met Val Asn Leu Tyr Gln Ala Pro Asp Val Glu Val Met Glu
1490 1495 1500
Ser Pro Glu Met Val Met Gln Glu Glu Trp Phe Arg Thr His Leu
1505 1510 1515
Pro Arg Asp Glu Leu Glu Ser Val Arg Ala Gln Trp Val His Lys
1520 1525 1530
Ile Met Ala Lys Glu Tyr Arg Glu Val Arg Met Gly Asp Met Val
1535 1540 1545
Ser Glu Gln Phe Thr Asp Asp His Thr Lys Gln Leu Gly Ala Lys
1550 1555 1560
Gln Leu Thr Asn Ala Ala Glu Arg Phe Glu Thr Ile Tyr Pro Arg
1565 1570 1575
His Arg Ala Ser Asp Thr Val Thr Phe Leu Met Ala Val Lys Lys
1580 1585 1590
Arg Leu Ser Phe Ser Asn Pro Gly Lys Glu Arg Gly Lys Leu Phe
1595 1600 1605
His Ala Ala Thr Tyr Gly Lys Ala Leu Leu Gln Glu Phe Leu Lys
1610 1615 1620
Arg Val Pro Leu Lys Pro Gly His Asn Ala Arg Phe Met Asp Glu
1625 1630 1635
Ala Leu Trp Asn Phe Glu Glu Lys Lys Leu Ser Lys Ser Ala Ala
1640 1645 1650
Thr Ile Glu Asn His Ser Gly Arg Ser Cys Arg Asp Trp Pro Ile
1655 1660 1665
Asp Val Ala Gln Ile Phe Ser Lys Ser Gln Leu Cys Thr Lys Phe
1670 1675 1680
Asp Asn Arg Phe Arg Val Ala Lys Ala Ala Gln Ser Ile Val Cys
1685 1690 1695
Phe Gln His Ala Val Leu Cys Arg Phe Ala Pro Tyr Met Arg Tyr
1700 1705 1710
Ile Glu Met Lys Val His Glu Val Leu Pro Lys Asn Tyr Tyr Ile
1715 1720 1725
His Ser Gly Lys Gly Leu Glu Glu Leu Asp Ala Trp Val Lys Lys
1730 1735 1740
Gly Lys Phe Glu Gly Ile Cys Thr Glu Ser Asp Tyr Glu Ala Phe
1745 1750 1755
Asp Ala Ser Gln Asp Glu Phe Ile Met Ala Phe Glu Leu Glu Leu
1760 1765 1770
Met Lys Phe Leu Arg Leu Pro Asn Asp Leu Ile Glu Asp Tyr Lys
1775 1780 1785
Phe Ile Lys Thr Ser Leu Gly Ser Lys Leu Gly Asn Phe Ala Ile
1790 1795 1800
Met Arg Phe Ser Gly Glu Ala Ser Thr Phe Leu Phe Asn Thr Leu
1805 1810 1815
Ala Asn Met Leu Phe Thr Phe Met Arg Tyr Asn Ile Arg Gly Asp
1820 1825 1830
Glu Phe Ile Cys Phe Ala Gly Asp Asp Met Cys Ala Ser Arg Arg
1835 1840 1845
Leu Gln Thr Thr Lys Lys Phe Ala His Phe Leu Asp Lys Leu Lys
1850 1855 1860
Leu Thr Ala Lys Val Gln Phe Val Asn Lys Pro Thr Phe Cys Gly
1865 1870 1875
Trp His Leu Cys Pro Asp Gly Ile Tyr Lys Lys Pro Gln Leu Val
1880 1885 1890
Leu Glu Arg Met Cys Ile Ala Gln Glu Ile Asn Asn Leu Ile Thr
1895 1900 1905
Ala Phe Asp Ile Tyr Ala Leu Val Ala Tyr Ala Tyr Lys Leu Gly
1910 1915 1920
Glu Lys Ala Val Asn Arg Met Asp Glu Glu Glu Val Ala Ala Phe
1925 1930 1935
Tyr Asn Cys Val Arg Ile Ile Val Arg Asn Lys His Leu Ile Arg
1940 1945 1950
Ser Asp Val Arg Lys Val Phe Glu Val Leu
1955 1960
<210> 3
<211> 229
<212> PRT
<213> ORF2
<400> 3
Met Asp Val Val Val Glu Leu Leu Tyr Lys Tyr Lys Phe Glu Arg Leu
1 5 10 15
His Asn Lys Leu Ala Phe Pro Ile Val Val His Cys Val Pro Gly Ala
20 25 30
Gly Lys Ser Ser Leu Ile Arg Glu Leu Leu Glu Leu Asp Ser Arg Phe
35 40 45
Cys Ala Tyr Thr Ala Gly Val Glu Asp Gln Pro Arg Leu Ser Gly Asn
50 55 60
Trp Ile Lys Lys Trp Lys Gly Val Ala Thr Glu Gly Lys His Leu Ile
65 70 75 80
Leu Asp Glu Tyr Thr Leu Leu Val Glu Val Pro Gln Ala Phe Ala Leu
85 90 95
Phe Gly Asp Pro Ile Gln Ser Cys Thr Gly Ser Val Gln Ser Ala Asp
100 105 110
Phe Val Cys Ser Phe Ser Lys Arg Phe Gly Ser Ala Thr Gly Ser Leu
115 120 125
Leu Arg Glu Leu Gly Trp Asp Ile Gln Ser Glu Gly Pro Asp Leu Val
130 135 140
Gln Val Ser Asp Ile Phe Val Lys Glu Pro Glu Gly Val Val Val Tyr
145 150 155 160
Phe Glu Glu Glu Val Gly Cys Leu Leu Lys Ala His Ser Val Glu Ala
165 170 175
Phe Ser Leu Ser Glu Ile Val Gly Gln Thr Phe Glu Val Val Thr Phe
180 185 190
Val Thr Ser Glu Asn Ser Pro Val Ile Asn Arg Ala Ala Ala Tyr Gln
195 200 205
Cys Met Thr Arg His Arg Val Ala Leu His Ile Leu Cys Pro Asn Ala
210 215 220
Thr Tyr Ser Ala Ala
225
<210> 4
<211> 109
<212> PRT
<213> ORF3
<400> 4
Met Pro Leu Thr Pro Pro Pro Asp Phe Ser Lys Val Tyr Leu Ser Ala
1 5 10 15
Ala Val Gly Ala Thr Leu Ala Ala Ile Val Trp Leu Ile Thr Lys Ser
20 25 30
Thr Leu Pro Ala Val Gly Asp Arg Glu His Asn Leu Pro His Gly Gly
35 40 45
Trp Tyr Arg Asp Gly Thr Lys Ser Val Phe Tyr Asn Ser Pro Cys Lys
50 55 60
Leu Asn Ser Ile Glu Ser Gly Arg Ser Pro Leu Leu Gly Gln Pro Trp
65 70 75 80
Ala Leu Val Gly Leu Leu Ile Ala Leu Ile Trp Val Ser Gln Arg Phe
85 90 95
Ser Ser Ser Gly Cys Arg Arg Cys Gly Gly Gln His Ser
100 105
<210> 5
<211> 65
<212> PRT
<213> ORF4
<400> 5
Met Ile Glu His Ile Leu Ile Gly Leu Ser Ala Phe Leu Ile Ala Leu
1 5 10 15
Phe Val Ile Ser Gln Asn Gln Ser Gly Cys Thr Val Leu Ile Thr Gly
20 25 30
Glu Ser Val Arg Phe Leu Gly Cys Pro Val Thr Gln Glu Phe Ser Lys
35 40 45
Ala Val Ser Glu Leu Lys Pro Ile Ala Cys Ala Ser Phe Arg Ser Arg
50 55 60
Gly
65
<210> 6
<211> 304
<212> PRT
<213> ORF5
<400> 6
Met Gly Asp Pro Met Glu Lys Val Glu Ala Ser Lys Lys Ala Ser Thr
1 5 10 15
Ser Gln Pro Ala Gln Gly Ala Arg Pro Leu Pro Lys Ala Thr Asp Phe
20 25 30
Asp Val Thr Glu Asp Arg Asp Gly Ala Asp Ala His Asn Ala Ala Asp
35 40 45
Glu Glu Glu Ser Ser Leu Glu Arg Arg Leu Asp Ser Leu Arg Asp Phe
50 55 60
Leu Arg Glu Arg Arg Gly Ala Ile Arg Val Thr Asn Pro Gly Leu Glu
65 70 75 80
Thr Gly Arg Pro Lys Leu Lys Leu Ala Glu Asp Met Arg Pro Asp Pro
85 90 95
Thr Asn Pro Tyr Asn Arg Pro Ser Ile Glu Ala Leu Ser Arg Ile Lys
100 105 110
Pro Ile Ala Ile Ser Asn Asn Met Ala Thr Ser Glu Asp Met Met Arg
115 120 125
Ile Tyr Val Asn Leu Glu Gly Leu Gly Val Pro Thr Glu His Val Gln
130 135 140
Gln Val Val Ile Gln Ala Val Leu Phe Cys Lys Asp Ala Ser Ser Ser
145 150 155 160
Val Tyr Leu Asp Pro Arg Gly Ser Phe Glu Trp Pro Arg Gly Ala Ile
165 170 175
Thr Ala Asp Ala Val Leu Ala Val Met Lys Lys Asp Ala Glu Thr Leu
180 185 190
Arg Arg Val Cys Arg Leu Tyr Ala Pro Val Thr Trp Asn His Met Leu
195 200 205
Thr His Asn Ser Pro Pro Ala Asp Trp Ala Ala Met Gly Phe Gln Tyr
210 215 220
Glu Glu Arg Phe Ala Ala Phe Asp Cys Phe Asp Tyr Val Glu Asn Thr
225 230 235 240
Ala Ala Val Gln Pro Leu Glu Gly Leu Ile Arg Arg Pro Thr Pro Arg
245 250 255
Glu Lys Val Ala His Asn Thr His Lys Asp Ile Ala Leu Arg Ser Ala
260 265 270
Asn Arg Asn Gln Val Phe Ser Ser Leu Ser Ala Glu Val Thr Gly Gly
275 280 285
Met Asn Gly Pro Glu Leu Thr Arg Asp Phe Gly Lys Ser Asn Asn Lys
290 295 300
<210> 7
<211> 108
<212> PRT
<213> ORF6
<400> 7
Met Lys Cys Val Thr Arg Thr Ala Leu Leu Val Ala Arg Ala Met Tyr
1 5 10 15
Leu His Ser Gly Val Phe Ala Phe Asp Leu Ala Tyr Ala Ile Ser Lys
20 25 30
Cys Ala Gly Arg Pro Leu Gly Gly Gly Lys Ser Lys Tyr Ala Arg Leu
35 40 45
Arg Arg Ala Ile Ser Ala Gly Arg Cys His Arg Cys Tyr Arg Leu Trp
50 55 60
Pro Pro Thr Ser Phe Thr Thr Arg Cys Asp Asn Arg Ser Cys Phe Pro
65 70 75 80
Gly Ile His Tyr Asn Val Arg Val Ala Gln Phe Ile Asp Glu Gly Val
85 90 95
Thr Glu Val Ile Pro Ser Val Ile Gln Lys Asn Glu
100 105
<210> 8
<211> 19
<212> DNA
<213> 马铃薯M病毒-3-F
<400> 8
gayctsgtgc argtatctg 19
<210> 9
<211> 18
<212> DNA
<213> 马铃薯M病毒-2-R
<400> 9
gttttcccag tcacgact 18
<210> 10
<211> 19
<212> DNA
<213> 马铃薯M病毒-5-F
<400> 10
caagcgtgtg ccgctaaag 19
<210> 11
<211> 18
<212> DNA
<213> 马铃薯M病毒-8-R
<400> 11
ccctctggct ctttcacg 18
<210> 12
<211> 18
<212> DNA
<213> 马铃薯M病毒-9-F
<400> 12
gggcattgca acttaggg 18
<210> 13
<211> 18
<212> DNA
<213> 马铃薯M病毒-10-R
<400> 13
ctcatccata aagcgggc 18
<210> 14
<211> 18
<212> DNA
<213> 马铃薯M病毒-11-F
<400> 14
ggcgcatgtt catgagag 18
<210> 15
<211> 19
<212> DNA
<213> 马铃薯M病毒-12-R
<400> 15
gagatrtcga agcagaarg 19
<210> 16
<211> 24
<212> DNA
<213> 马铃薯M病毒-13-F
<400> 16
gggcccggat aaacaaacat acaa 24
<210> 17
<211> 18
<212> DNA
<213> 马铃薯M病毒-14-R
<400> 17
gcctccacat atttgagc 18
<210> 18
<211> 33
<212> DNA
<213> 马铃薯M病毒-GSP
<400> 18
gattacgcca agcttgtggc ggctcaatgg acc 33