高通量鉴定植物病毒的方法及其应用与流程

文档序号：11400850阅读：401来源：国知局

本发明涉及生物技术领域，具体涉及一种高通量鉴定植物病毒的方法及其应用。

背景技术：

病毒(virus)，是一种包被于保护性的蛋白衣壳中的一个基因组核酸分子，可在适宜的寄主细胞内完成自身复制。病毒根据寄主的不同分为植物病毒，动物病毒，和噬菌体等。植物病毒俗称植物上的癌症，其流行和爆发严重威胁生产和人类食品安全。据不完全统计，全世界每年因植物病毒病造成的农业损失占粮食作物总产量的10％。对植物病毒进行快速，准确，大规模的诊断和鉴定，对于病毒病的防控来说是十分重要和紧迫的。传统检测植物病毒的方法包括：血清学检测、电子显微镜观察、指示植物接种、dna扩增和芯片杂交等。但是这些传统方法存在耗时长，效率低，无法快速批量化鉴定等缺点；而且发现病毒的时间较晚，一般等到肉眼可见，或已经出现影响其他发育的症状才进行相应检测。因此，需要开发出新型的高通量鉴定病毒的方法，以避免现有技术中存在的不足。

技术实现要素：

针对现有技术中的缺陷，本发明目的在于提供一种高通量鉴定植物病毒的方法及其应用，以提高鉴定植物病毒的效率和鉴定准确性，从而实现植物病毒的大规模筛查和诊断；方法操作简便，并且成本低，适合广泛使用。

为实现上述目的，本发明提供的技术方案为：

本发明提供了一种高通量鉴定植物病毒的方法，包括如下步骤：s1：提取植物样本的总rna，然后分离获取mrna，将mrna逆转录得到双链cdna，然后扩增，得到dna文库；s2：将dna文库进行转录组测序，获取reads:片段，将reads:片段拼接成较长片段的重叠群(contigs)，然后组装成更长片段的重叠群(scaffolds)；s3：将scaffolds与核酸数据库进行blast比对，获得比对上的第一结果文件；s4：将第一结果文件进行处理，从中提取出第二查询序列(querysequences)；s5：将第二查询序列(querysequences)与核酸数据库进行blast比对，获得比对上的第二结果文件；s6：将第二结果文件进行处理，鉴定出感染相应植物样本的病毒。需要说明的是，s1中，可以采用试剂盒(qiagenrneasyplantminikit)提取发病寄主中(植物叶子)的总rna，然后分离总rna获得mrna，计算rna质量和纯度(od260/280，od260/230)。

在本发明的进一步实施方式中，s4中，处理包括步骤：s401：根据第一结果文件中的gi编号，通过病毒数据库获取病毒的信息；s402：提取第一结果文件中的第一查询序列(querysequences)及其对应的从属序列(subjectsequences)；s403：将s401和s402得到的所有信息注释到第一结果文件中，得到注释的第一结果文件；s404：在注释的第一结果文件中筛选出最小的e-value值对应的第一查询序列(querysequences)，即为第二查询序列(querysequences)。

在本发明的进一步实施方式中，s6中，处理包括步骤：s601：在第二结果文件中筛选出最小的e-value值对应的第二查询序列(querysequences)，得到第三查询序列(querysequences)；s602：根据第三查询序列(querysequences)中对应的gi编号，在核酸数据库中获取物种的信息，并对病毒的信息进行标记；s603：提取s602得到的文件中的查询序列(querysequences)及其对应的从属序列(subjectsequences)，即为第四查询序列(querysequences)及其对应的从属序列(subjectsequences)；s604：将s603得到的所有信息注释到s602得到的文件中，得到注释的第二结果文件。

在本发明的进一步实施方式中，s6中，同时出现在注释的第一结果文件和注释的第二结果文件中的病毒，即为鉴定出感染相应植物样本的病毒。

在本发明的进一步实施方式中，s1中，扩增为进行15个pcr循环扩增。需要说明的是，进行15个pcr循环扩增，文库平均长度大约为322bp。

在本发明的进一步实施方式中，s2中，转录组测序是采用illuminahiseq测序平台进行测序。

在本发明的进一步实施方式中，s2中，reads:片段的长度为84～90bp。需要说明的是，其中，大部分的reads:片段的长度为90bp，少数为84～87bp。

在本发明的进一步实施方式中，s2中，还包括步骤：将获取的reads:片段去除接头和引物，然后进行拼接。需要说明的是，优选还应该去除低质量片段。

在本发明的进一步实施方式中，s2中，拼接是采用soapdenovo-trans软件拼接，scaffolds的长度大于或等于1000bp。需要说明的是，优选对scaffolds长度进行统计，并计算scaffoldn50。

本发明还保护高通量鉴定植物病毒的方法在鉴定植物病毒种类中的应用。

本发明提供的技术方案，具有如下的有益效果：(1)本发明采用二代测序技术进行高通量鉴定植物病毒，效率高，鉴定准确，可以实现植物病毒的大规模筛查和诊断；(2)本发明提供的高通量鉴定植物病毒的方法可在植物早期未出现症状时及时发现感染的病毒，实现病毒的早期筛查和诊断，干预，极大降低了经济利益的损失；(3)本发明提供的高通量鉴定植物病毒的方法操作简便，并且成本低，适合广泛使用。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1为本发明实施例中的高通量鉴定植物病毒的方法的流程示意图；

图2为本发明实施例中的对茄科的scaffold长度进行统计且计算得到的scaffoldn50结果图；

图3为本发明实施例中得到的注释的第一结果文件结果图；

图4为本发明实施例中得到的注释的第二结果文件结果图；

图5为本发明实施例中鉴定出感染相应植物样本的病毒结果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只是作为示例，而不能以此来限制本发明的保护范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。本发明提供的高通量鉴定植物病毒的方法的流程示意图如图1所示。

实施例

以茄科植物蒜芥茄(solanumsisymbriifolium)为例，采用本发明提供的高通量鉴定植物病毒的方法进行植物病毒鉴定，方法具体包括如下步骤。

s1：采用试剂盒(qiagenrneasyplantminikit)提取发病寄主中(植物叶子)的总rna，然后分离总rna获得mrna，计算rna质量和纯度(od260/280，od260/230)。将mrna逆转录得到双链cdna，然后进行15个pcr循环扩增，得到平均长度为322bp的dna文库。

s2：将dna文库采用illuminahiseq测序平台进行转录组测序，获取reads:片段，大部分的reads:片段的长度为90bp，少数为84～87bp。将reads:片段去除接头和引物，然后采用soapdenovo-trans软件将reads:片段拼接成较长片段的重叠群(contigs)，然后组装成更长片段的重叠群(scaffolds)；对茄科的scaffolds长度进行统计，并计算scaffoldn50，结果如图2所示。图2中：第一列为样本编号(sampleid)与种(species)的信息，第二列为n50的值。

s3：将scaffolds与genbank的核酸数据库(nucleotide(nt)database)进行blast比对，获得比对上的第一结果文件和未比对上的结果文件。设置blast的参数：以表格的形式(参数m取值为8)输出结果，并设置参数e，即期望值的取值为1e-5。e值是个统计阈值，意指比对结果中随机偶然性产生的匹配结果不大于1e-5，e值越小结果越可靠。blast是一种局部相似性比对分析工具，比对之后，blast会按照评分高低、序列相似度对结果进行排序。相似性比较低的不会出现在该结果文件中，就是所述的未比对上的结果文件。

s4：对第一结果文件进行处理，包括如下步骤：

s401：根据所述第一结果文件中的gi编号，通过病毒数据库获取病毒的信息；

s402：提取所述第一结果文件中的第一查询序列(querysequences)查询序列及其对应的从属序列；

s403：将所述s401和所述s402得到的所有信息注释到所述第一结果文件中，得到注释的第一结果文件；结果如图3所示。注释的第一结果文件是表格形式的文件，有15列，分别是：querysequence的编号，subjectsequence的编号，同源性(identity)，比对长度，错配数，空位数，querysequence比对起始坐标，querysequence比对终止坐标，subjectsequence比对起始坐标，subjectsequence比对终止坐标，期望值(e-value)，比对得分，querysequence，subjectsequence，病毒注释信息。其中前12列为blast表格式输出文件的原始信息，后三列为根据所述s401，s402注释的信息。

s404：在所述注释的第一结果文件中筛选出最小的e-value值对应的第一查询序列(querysequences)查询序列，即为第二查询序列(querysequences)查询序列，将其保存为fasta格式。

s5：将第二查询序列(querysequences)查询序列与genbank的核酸数据库(nucleotide(nt)database)进行blast比对，获得比对上的第二结果文件和未比对上的结果文件。设置blast的参数：以表格的形式(参数m取值为8)输出结果，并设置参数e，即期望值的取值为1e-5。e值是个统计阈值，意指比对结果中随机偶然性产生的匹配结果不大于1e-5，e值越小结果越可靠。blast是一种局部相似性比对分析工具，比对之后，blast会按照评分高低、序列相似度对结果进行排序。相似性比较低的不会出现在该结果文件中，就是所述的未比对上的结果文件。

s6：将所述第二结果文件进行处理，包括如下步骤：

s601：在所述第二结果文件中筛选出最小的e-value值对应的第二查询序列(querysequences)，得到第三查询序列(querysequences)；

s602：根据所述第三查询序列(querysequences)中对应的gi编号，在核酸数据库中获取物种的信息，并对病毒的信息进行标记；

s603：提取所述s602得到的文件中的查询序列(querysequences)及其对应的从属序列(subjectsequences)，即为第四查询序列(querysequences)及其对应的从属序列(subjectsequences)；

s604：将所述s603得到的所有信息注释到所述s602得到的文件中，得到注释的第二结果文件；结果如图4所示。注释的第二结果文件是表格形式的文件，有15列，分别是：第三querysequence的编号，subjectsequence的编号，同源性(identity)，比对长度，错配数，空位数，第三querysequence比对起始坐标，第三querysequence比对终止坐标，subjectsequence比对起始坐标，subjectsequence比对终止坐标，期望值，比对得分，querysequence，subjectsequence，病毒注释信息。其中前12列为blast表格式输出文件的原始信息，后三列为根据所述s601，s602注释的信息。

对于同时出现在注释的第一结果文件和注释的第二结果文件中的病毒，进行统计，即为鉴定出感染相应植物样本的病毒，具体结果如图5所示。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。在这里示出和描述的所有示例中，除非另有规定，任何具体值应被解释为仅仅是示例性的，而不是作为限制，因此，示例性实施例的其他示例可以具有不同的值。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个以上，除非另有明确具体的限定。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的保护范围当中。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：严志祥;李景伟
技术所有人：郑州云基因数据科技有限公司
我是此专利的发明人

上一篇：人乳头瘤病毒核酸检测试剂盒及其应用的制造方法与工艺
上一篇：一种预应力锚索的内锚固承载体的制造方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。