一种高通量测序数据处理及分析流程控制方法

文档序号:6520776阅读:2235来源:国知局
一种高通量测序数据处理及分析流程控制方法
【专利摘要】本发明涉及一种高通量测序数据处理及分析流程控制方法,属于分子生物学【技术领域】。该方法首先生成自定义参数配置文件;在根据用户设定参数后的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件;最终由系统执行批处理可执行文件,实现数据分析流程运作,获得处理结果文件。从而能有效帮助科研人员迅速完成一套标准化的高通量数据分析流程,优化科研人员和数据分析专员的工作时间分配,提升工作效率,降低总体科研成本,且本发明的高通量测序数据处理及分析流程控制方法,其实现方法简便,应用范围较为广泛。
【专利说明】一种高通量测序数据处理及分析流程控制方法
【技术领域】
[0001]本发明涉及分子生物学【技术领域】,特别涉及染色质测序数据分析【技术领域】,具体是指一种高通量测序数据处理及分析流程控制方法。
【背景技术】
[0002]新一代高通量测序技术的出现极大地丰富了人们利用分子生物学手段研究细胞内变化规律的方案。目前诸如 ChIp-seq、RNA-seq、ChIRP-seq、High-C、MeDIP-seq、DNA-seq等在内的众多高通量测序技术,都有相关的分析方法或分析流程供科研人员使用,并总结出相应的数据处理分析的标准流程。但是,如何高效地使用这些标准化的分析流程,如何降低科研人员在数据分析时的重复劳动,降低数据分析的时间成本,目前仍然没有一个有效的解决方案供广大技术从业人员参考,这无形中增加了数据分析人员的工作负担。

【发明内容】

[0003]本发明的目的是克服了上述现有技术中的缺点,提供一种通过不同数据处理模块的选取,帮助科研人员迅速完成一套标准化的高通量数据分析流程,从而优化科研人员和数据分析专员的工作时间分配,提升工作效率,降低总体科研成本,且实现方法简便,应用范围较为广泛的高通量测序数据处理及分析流程控制方法。
[0004]为了实现上述的目的,本发明的高通量测序数据处理及分析流程控制方法包括以下步骤:
[0005](I)系统根据高通量数据处理流程模版生成自定义参数配置文件;
[0006](2)系统根据用户操作,将各参数存入所述的自定义参数配置文件;
[0007](3)系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件;
[0008](4)系统根据用户操作,执行所述的批处理可执行文件,实现数据分析流程运作,获得并输出高通量数据处理结果文件。
[0009]该高通量测序数据处理及分析流程控制方法中,所述的系统根据高通量数据处理流程模版生成自定义参数配置文件具体为:系统根据高通量数据处理流程模版,并结合数据分析流程各处理步骤的关键字段搜索,生成自定义参数配置文件。
[0010]该高通量测序数据处理及分析流程控制方法中,所述的系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件,具体为:系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版,并结合数据分析流程各处理步骤的关键字段搜索,生成与数据分析流程对应的批处理可执行文件。
[0011]采用了该发明的高通量测序数据处理及分析流程控制方法,由于其首先生成自定义参数配置文件;在根据用户设定参数后的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件;最终由系统执行批处理可执行文件,实现数据分析流程运作,获得处理结果文件。从而能有效帮助科研人员迅速完成一套标准化的高通量数据分析流程,优化科研人员和数据分析专员的工作时间分配,提升工作效率,降低总体科研成本,且本发明的高通量测序数据处理及分析流程控制方法,其实现方法简便,应用范围较为广泛。
【专利附图】

【附图说明】
[0012]图1为本发明的高通量测序数据处理及分析流程控制方法的步骤流程图。
[0013]图2为本发明的高通量测序数据处理及分析流程控制方法在实际应用中的流程示意图。
【具体实施方式】
[0014]为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。
[0015]请参阅图1所示,为本发明的高通量测序数据处理及分析流程控制方法的步骤流程图。
[0016]在一种实施方式中,该高通量测序数据处理及分析流程控制方法,如图1所示,包括以下步骤:
[0017](I)系统根据高通量数据处理流程模版生成自定义参数配置文件;
[0018](2)系统根据用户操作,将各参数存入所述的自定义参数配置文件;
[0019](3)系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件;
[0020](4)系统根据用户操作,执行所述的批处理可执行文件,实现数据分析流程运作,获得并输出高通量数据处理结果文件。
[0021]在较优选的实施方式中,所述的步骤(I)具体为:系统根据高通量数据处理流程模版,并结合数据分析流程各处理步骤的关键字段搜索,生成自定义参数配置文件。
[0022]在更优选的实施方式中,所述的步骤(3)具体为:系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版,并结合数据分析流程各处理步骤的关键字段搜索,生成与数据分析流程对应的批处理可执行文件。
[0023]在实际应用中,本发明的高通量测序数据处理及分析流程控制方法的应用流程如图2所示。
[0024]其系统包含I个Python脚本代码和2个高通量数据批处理分析流程模板,脚本和模板的名称如下:
[0025](I)PROGRAM_pipeline_scheduler.py
[0026](2)PIPELINE_ChIP-seq.sh
[0027](3)PIPELINE_MeDIP-seq.sh
[0028]系统脚本的代码编写基于Python语言和Shell命令,可以在Linux和MacOS系统平台下使用。代码运行过程中,耗费系统资源少,能够在任意一台个人PC、工作站和或服务器上进行使用。
[0029]具体的数据处理流程如下:
[0030]该工具的数据处理和分析流程以各类型高通量数据批处理流程模版作为输入文件。
[0031]第一步,基于高通量数据处理流程模版,使用PROGRAM_pipeline_scheduler.py的configuration模式,结合处理步骤的关键词字段搜索,生成相关自定义参数配置文件。
[0032]第二步,用户可以对自定义参数进行逐一设置,并保存修改后的参数配置文件。
[0033]第三步,以修改后的修改后的参数配置文件作为输入,基于高通量数据处理流程模版,使用PROGRAM_pipelinescheduler.py的execute模式,结合处理步骤的关键词字段搜索,生成批处理可执行文件。
[0034]第四步,在系统终端运行新生成的可执行文件,开始流程化运作。
[0035]最终,按照用户所选操作类型,自动化输出相应文本格式结果和图形化。
[0036]此外,该工具包中附带成品化的ChlP-seq高通量数据批处理流程模版文件“PIPELINE_ChIP-seq.sh”和MeDIP-seq高通量数据批处理流程模版文件“PIPELINE_MeDIP-seq.sh”。
[0037]命令行模式下,键入Python PROGRAM_pipeline_scheduler.py命令后,系统会返回一系列详细的参数设置和对应的参数说明,指导数据分析人员正确使用设定参数。其中,参数分为两种类型:必要参数和可选参数。必要参数要求由数据分析人员提供输入值,无默认值。可选参数的默认值有程序内设,分析人员也可以结合实际需求进行调整,具有灵活性。
[0038]利用本发明,能够结合如ChlP-seq数据处理标准化流程、MeDIP-seq数据处理标准化流程等不同类型的高通量数据处理流程,能够单独提取流程中的局部分析模块,并进行模块内规定数据分析流程的快速执行。从而通过不同模块的选取,帮助科研人员迅速完成一套高通量数据的前期reads质控、数据上机比对以及后期的若干分析流程。该工具能够优化科研人员和数据分析专员的工作时间分配,显著提升工作效率。
[0039]采用了该发明的高通量测序数据处理及分析流程控制方法,由于其首先生成自定义参数配置文件;在根据用户设定参数后的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件;最终由系统执行批处理可执行文件,实现数据分析流程运作,获得处理结果文件。从而能有效帮助科研人员迅速完成一套标准化的高通量数据分析流程,优化科研人员和数据分析专员的工作时间分配,提升工作效率,降低总体科研成本,且本发明的高通量测序数据处理及分析流程控制方法,其实现方法简便,应用范围较为广泛。
[0040]在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。
【权利要求】
1.一种高通量测序数据处理及分析流程控制方法,其特征在于,所述的方法包括以下步骤: (1)系统根据高通量数据处理流程模版生成自定义参数配置文件; (2)系统根据用户操作,将各参数存入所述的自定义参数配置文件; (3)系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件; (4)系统根据用户操作,执行所述的批处理可执行文件,实现数据分析流程运作,获得并输出高通量数据处理结果文件。
2.根据权利要求1所述的高通量测序数据处理及分析流程控制方法,其特征在于,所述的系统根据高通量数据处理流程模版生成自定义参数配置文件具体为: 系统根据高通量数据处理流程模版,并结合数据分析流程各处理步骤的关键字段搜索,生成自定义参数配置文件。
3.根据权利要求2所述的高通量测序数据处理及分析流程控制方法,其特征在于,所述的系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版生成与数据分析流程对应的批处理可执行文件,具体为: 系统根据所述的存入参数的自定义参数配置文件和所述的高通量数据处理流程模版,并结合数据分析流程各处理步骤的关键字段搜索,生成与数据分析流程对应的批处理可执行文件。
【文档编号】G06F19/20GK103853938SQ201310610931
【公开日】2014年6月11日 申请日期:2013年11月27日 优先权日:2013年11月27日
【发明者】王立山, 曹鑫恺, 臧卫东, 王媛媛 申请人:上海丰核信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1