基于宏基因组学的病毒感染检测及鉴定方法

文档序号:9392033阅读:1898来源:国知局
基于宏基因组学的病毒感染检测及鉴定方法
【技术领域】:
[0001] 本发明涉及病毒的检测与鉴定,具体涉及一种基于宏基因组学和高通量测序的病 毒检测鉴定技术。
【背景技术】:
[0002] 随着人类经济和社会的不断发展,人类的活动范围越来越大,与野生动物的接触 越来越密切、越来越频繁,野生动物携带的病毒直接或通过媒介如蚊子、蜱等传致人的风险 越来越大,构成了人类新发传染病的70%左右。这些新发传染病如2003年中国发生的非 典、2007 -2010年中国发生的新布尼亚病毒导致的疫情、2014年在西非肆虐的埃博拉疫情、 2015年由中东传致韩国的MERS,给病毒感染的检测鉴定技术提出了极大的挑战。由于这 些新发传染病的病原体往往是未知病原,与已知病原的同源性很低,传统的检测方法如基 于已知病毒核酸序列建立的PCR技术、基于已知病毒组分建立的血清学技术等通常都会失 灵。这给新发传染病的及时防控带来了极大的负面影响。
[0003] 基于PCR或者血清学的技术都需要预先已知病毒的信息,或者是核酸序列,或者 是病毒的关键组分,这些技术特点严重限制了它们在新发传染病病原体检测上的应用。另 外一项有希望用于新发传染病病原体检测的技术是在特点的培养基或细胞上对病原体进 行培养,然后提取核酸进行基因组测序。但是这一技术因为三个缺点其应用受到严重限制。 首先,培养基或细胞类型的选择是个难题。由于对新发传染病病原体的认识非常有限甚至 是空白,所以应用这一技术进行新发传染病病原体的检测几乎完全是靠运气。选对了培养 基或细胞类型,可以得到正确的检测结果。选错了培养基或细胞类型就会得到阴性结果。这 一选择难题严重影响了这一检测方法的灵敏度。其次,活的病原体的培养对生物安全防护 水平提出了很高的要求。例如,2003年非典是由SARS冠状病毒导致的,需要达到生物安全 三级(P3)防护水平才能开展病毒培养实验。2014年西非的埃博拉病毒需要生物安全四级 (P4)的防护水平。而具备这些生物安全防护水平的实验室非常有限,严重限制了这一技术 的广泛应用。第三,从培养到提取核酸再到基因组测序整个实验流程耗时长,不能满足传 染病防控的需求。
[0004] 鉴于上述检测技术的局限性,发明新的快速、灵敏、准确、方便的病原体检测技术 势在必行。针对传染病防控的这一特殊需求,我们发明了一套基于宏基因组学的病毒检测 鉴定技术体系。该体系不需要培养病原体,对生物安全防护水平要求低,不限于特定的病 毒种类,可适用于所有已知的和未知远缘的病毒的检测,不限于单一病毒的检测,也可用于 病毒混合感染的检测,对样本的需求量低,检测时间短,检测灵敏,结果可靠,给出的信息全 面。尽管这套技术体系针对传染病的防控而发明,但其应用不限于传染病的防控,可以进一 步拓展到其他方面如临床样本的精准医学分析、动植物样本的微生物组成分析等等。

【发明内容】

[0005] 本发明的目的在于提供一种基于宏基因组学的病毒检测方法。
[0006] 本发明所述的检测方法,包括样本制备、高通量测序、生物信息学分析、结果复核 等四个步骤。
[0007] 具体的,本发明所述的检测方法,包括以下步骤:
[0008] (1)样本制备:基于微量、痕量待检测样本富集、提取病毒核酸构建可用于高通量 测序的核酸库;
[0009] (2)高通量测序:设定辅助基于宏基因组学技术的病毒感染检测的内参、对照;
[0010] (3)生物信息学分析:本系统的主体部分,从高通量测序数据中准确分析样本中 的物种组成,包括远缘未知的病毒组成。
[0011] (4)结果复核:综合多方面信息,对生物信息学分析结果就行遴选、复核。
[0012] 一.样本制备
[0013]其中,步骤(1)所述样本制备:针对微量(彡1ml)、痕量(彡lul)待检测样本,本 发明采用了一套订制的聚合酶链反应(PCR,PolymeraseChainReaction)扩增技术制备高 通量测序所需的核酸文库。
[0014] 具体地,步骤(1)所述样本制备部分包括以下八个步骤:病毒灭活、样本定量、病 毒纯化、背景消除、提取核酸、合成互补DNA(cDNA,complementaryDNA)、等比例扩增、核酸 纯化。
[0015] 第一步,病毒灭活:样本要根据疑似病毒的种类和样本的特点采取通用的或特异 的病毒灭活方法进行灭活。这一步不仅充分保障了实验人员的人身安全,而且简便有效地 降低了病毒检测任务对生物安全防护水平的要求,同时也充分保留了病毒的遗传信息。
[0016] 第二步,样本定量:对样本总量、样本所含病毒载量、病毒核酸量进行初步测定和 估计,从而为后续实验步骤制定详细计划。
[0017] 第三步,病毒纯化:通过超速离心将病毒颗粒进行富集纯化,从而提高病毒序列在 最后结果中所占的比例。
[0018] 第四步,背景消除:在提取病毒核酸前将宿主的DNA和RNA利用DNA酶和RNA酶进 行充分消化。
[0019] 第五步,提取核酸:提取病毒核酸,主要提取病毒的核糖核酸。
[0020] 第六步,合成CDNA:将第五步提取出来的病毒核糖核酸转化成更稳定更易保存的 cDNA〇
[0021] 第七步,等比例扩增:基于聚合酶链反应(PCR)将第六步获得的cDNA进行用随机 引物进行扩增,直到满足下一步高通量测序所要求的上样量。这一步是可选步骤。如果第 六步获得的cDNA量足够进行高通量测序,则直接进入高通量测序环节。
[0022] 第八步,核酸纯化:纯化第六步或第七步获得的病毒核酸用于后续的高通量测序。
[0023] 二.高通量测序
[0024] 其中,步骤2所述高通量测序:根据病毒检测的需求,人工合成序列已知、数量已 知的核酸序列作为样本核酸库的内参;对序列已知并与样本检测平行进行的对照核酸库进 行测序。
[0025] 具体地,步骤(2)所述高通量测序包括三个步骤:构建高通量测序文库、高通量测 序、将图像测序信号转换为核酸序列信息。为提高基于高通量测序的病毒检测技术的准确 性,我们在高通量测序文库构建这一步增加了我们设计的内参样本,以衡量病毒核酸在样 本中的丰度;与样本测序平行,我们增加了对照样本同时进行高通量测序,以评价整个检测 系统的平稳运行,同时为最后结果复核部分提供重要的背景信息。
[0026] 三?生物信息学分析
[0027] 其中,步骤3所述生物信息学分析包括以下8个单元:
[0028] 病原数据库构建系统:从公共生物信息数据库中下载并整理病原体(包括病毒但 不限于病毒)和宿主相关的核酸、蛋白质的序列信息、结构信息、进化信息;
[0029] 高通量测序数据质量控制系统:对高通量测序数据进行质量控制,包括剔除不合 格序列、剪切不合格序列、修正不合格序列等部分;
[0030] 宿主序列去除系统:将高通量测序数据中与宿主基因组、转录组高度同源的序列 去除;
[0031] 宏基因组学拼接系统:将短的、多的高通量测序序列拼接成长的、少的叠连群 (Contig)序列,特别是将短肽拼接为长的蛋白质序列进而进行病毒检测是本发明的一大特 色;
[0032] 序列比对搜索系统:将高通量测序序列或叠连群(Contig)序列与病原数据库进 行比对搜索,找出与查询序列相似或高度同源的数据库条目;
[0033] 物种信息映射系统:根据序列比对搜索结果确定查询序列的物种来源;
[0034] 物种组成分析系统:根据物种信息映射的结果分析样本中的物种组成;
[0035] 多样本物种组成高级分析系统:对多个样本的物种组成进行高级分析如比较相似 性、寻找共同物种组成、寻找差异物种组成、寻找生物标记物等。
[0036] 具体地,步骤(3)所述生物信息学分析包括病原数据库构建系统、高通量测序数 据质量控制系统、宿主序列去除系统、宏基因组学拼接系统、序列比对搜索系统、物种信息 映射系统、物种组成分析系统、多样本物种组成高级分析系统共8个单元组成。这8个功能 单元各司其职共同构成了整个生物信息学分析流程。
[0037] 第一,病原数据库构建系统从公共生物信息学数据库中提取病原体(不限于病 毒)和宿主的序列信息、结构信息、进化信息,然后将这些信息按照信息种类、物种类别整 理成多个宿主数据库、病原体数据库和不同组合的综合库,以供后续序列比对搜索系统使 用。目前参考的公共生物信息学数据库包括美国生物技术信息中心NCBI(http://WWW. ncbi.nlm.nih.gov/)、欧洲生物信息学研究院EBI(http://www.ebi.ac.uk/)、欧洲的基 因组注释数据库ENSEMBL(http://www.ensembl.org/index.html)、欧洲的蛋白质总库 UNIPROT(http://www.uniprot.org/)、蛋白质家族数据库PFAM(http://pfam.xfam.org/)、 RNA家族数据库RFAM(http: //rfam.xfam.org/)、蛋白质结构数据库](http: //www. rcsb.org/pdb
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1