一种基因组重测序分析系统及方法

文档序号:9887971阅读:433来源:国知局
一种基因组重测序分析系统及方法
【技术领域】
[0001]本发明涉及生物信息分析技术领域,尤其涉及一种基因组重测序分析系统及方法。
【背景技术】
[0002 ]生物信息学(Bi ο inf ormati c s)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。
[0003]基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。基因组重测序方向是生物信息学中比较重要的一个分支,已经广泛应用到了农学、医学等领域,并对育种和靶向治疗起到了极具意义的指导作用。
[0004]高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generat1ysequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。高通量测序技术的出现使基因组学数据出现了指数型增长,海量数据的产生给生物信息学带来了极大的挑战,如何快速、高效、准确的完成数据分析,挖掘数据中的科学意义

【发明内容】

[0005]针对现有技术中的缺陷,本发明提供一种基因组重测序分析系统及方法,用于简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。
[0006]第一方面,本发明提供一种基因组重测序分析系统,所述系统包括:
[0007]Web应用单元,用于接收基因组重测序数据和基因组重测序参数,并将所述基因组重测序参数发送至Java交互单元;
[0008]Java交互单元,用于根据所述Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元;
[0009]分析单元,用于根据所述Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
[0010]其中,所述生物信息学软件库,包括:13¥六、8&1]11:0018、6六1'1(、口;^&1(1、13代&1<:dancer、Control_FREEC、SnpEff和blast;
[0011 ] 所述脚本库,包括:SNP检测脚本、InDe I检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
[0012]优选地,所述Java交互单元包括:
[0013]任务调度模块,用于根据所述Web应用单元接收的基因组重测序数据和基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元;
[0014]所述任务调度模块,在基因组重测序过程中,还用于实时监测基因组重测序任务的运行状态及进度。
[0015]优选地,所述Java交互单元还包括:
[0016]结果推送模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的展示指令,将所述分析单元获取的基因组重测序分析结果在Web应用单元进行呈现。
[0017]优选地,所述Java交互单元还包括:
[0018]数据库交互模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的存储指令,将所述分析单元获取的基因组重测序分析结果存储至数据库。
[0019]优选地,所述分析单元包括:
[0020]数据评估模块,用于对所述基因组重测序数据进行质量检测,并根据质量检测结果,判断所述基因组重测序数据是否可以进行基因组重测序;
[0021 ]其中,所述质量检测包括碱基质量分布检测和碱基类型分布检测。
[0022]优选地,所述分析单元还包括:
[0023]序列比对模块,用于将所述数据评估模块评估后的基因组重测序数据与参考基因组分别进行比对率统计、测序深度分布统计、插入片段分布统计,分别得到比对率、基因组覆盖深度、基因组覆盖度;
[0024]所述序列比对模块,还用于过滤评估后的基因组重测序数据中的重复序列,得到过滤后的基因组重测序数据。
[0025]优选地,所述分析单元还包括:
[0026]突变检测模块,用于通过调用所述生物信息学软件库和脚本库,对所述过滤后的基因组重测序数据进行突变检测分析;
[0027]其中所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。
[0028]优选地,所述突变检测模块还用于,
[0029]在突变检测分析过程中,对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区。
[0030]优选地,所述分析单元还包括:
[0031]功能注释模块,在突变检测分析过程中,用于根据功能注释数据库,对突变基因进行功能注释;
[0032]其中,所述功能注释数据库包括GO、C0G\K0G、Pfam、KEGG、NR、SWISS-PROT。
[0033]第二方面,本发明提供一种基因组重测序分析方法,所述方法包括:
[0034]接收基因组重测序数据和基因组重测序参数;
[0035]根据所述基因组重测序参数,生成基因组重测序任务信息;
[0036]根据所述基因组重测序任务信息,通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
[0037]其中,所述生物信息学软件库,包括:13¥4、8&1]11:0018、641'1(4;^&1(1、13代&1<:dancer、Control_FREEC、SnpEff和blast;
[0038]所述脚本库,包括:SNP检测脚本、InDe I检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
[0039]由上述技术方案可知,本发明提供了一种基因组重测序分析系统及方法,通过Web应用单元接收基因组重测序数据和基因组重测序参数,Java交互单元根据Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息,分析单元根据Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果。本发明通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
【附图说明】
[0040]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
[0041]图1为本发明一实施例提供的一种基因组重测序分析系统的结构示意图;
[0042]图2为本发明另一实施例提供的一种基因组重测序分析系统的结构示意图;
[0043]图3为本发明一实施例提供的一种基因组重测序分析方法的流程示意图;
[0044]图4为本发明一实施例中基因组重测序流程示意图。
【具体实施方式】
[0045]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0046]以下对本发明实施例中提及的部分词语进行说明。
[0047]单核苷酸的多态性SNP(Single Nucleotide Polymorphism)是指在基因组上单个核苷酸的变异,包括转换、颠换、缺失和插入,形成的遗传标记,其数量很多,多态性丰富。
[0048]插入缺失标记InDel(Insert1n and Delet1n),指的是两种亲本中在全基因组中的差异,相对另一个亲本而言,其中一个亲本的基因组中有一定数量的核苷酸插入或缺失(Jander et al.,2002)0
[0049]结构变异SV(Structure variat1n
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1