生物信息分析工具的制作方法、装置及可存储介质与流程

文档序号:16848226发布日期:2019-02-12 22:30阅读:197来源:国知局
生物信息分析工具的制作方法、装置及可存储介质与流程

本发明涉及生物信息技术分析领域,具体而言,涉及一种生物信息分析工具的制作方法、装置及可存储介质。



背景技术:

随着测序技术的发展,相关测序数据正在以超莫尔定律的速率增长,服务测序数据的生物信息软件被广泛开发。

由于需要处理的测序数据较多,造成当前生物信息软件的业务流程及源码的实现质量较差;那么,提供具有良好的可读性、复用性及可移植性的生物信息分析工具十分重要。



技术实现要素:

本发明实施例至少提供一种生物信息分析工具的制作方法,能够根据不同的生物信息快捷、高效的建立具有良好复用性的分析工具。

上述实施例的具体实现,如下所述。

所述方法包括:

解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;

根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;

配置所述分析模块实施所述分析步骤的执行程序;

在所述实施次序中相邻的两个所述分析模块之间,配置在先次序的分析模块的输出数据流与在后次序的分析模块的输入数据流具有同一接口标准,根据不同的所述接口标准建立所有分析模块的交互链接及执行顺序。

根据所述分析模块的执行程序、参数文件,以及所有所述分析模块的交互链接、执行顺序制作所述生物信息分析工具。

在本实施例中较佳方案是,根据所述分析流程分别建立若干独立的所述实施次序。

在本实施例中较佳方案是,所述输入数据流至少包括原始数据、样本名称、接头信息及日志文件中的一种或多种;

在本实施例中较佳方案是,所述输出数据流至少包括输出路径和/或缓存路径。

在本实施例中较佳方案是,所述参数文件为存储在所述分析模块中config接口的建库类型、最小长度及滑动窗口尺寸中的一种或多种。

在本实施例中较佳方案是,所述方法包括:

解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;

根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;

应用nextflow根据任意所述分析模块之间的实施次序建立一工作流程框架;

在所述工作流程框架内分别匹配不同分析模块的process;

根据所述分析步骤配置实施所述的process的nextflow脚本程序;

根据参数文件在所述process的config接口设置实施参数;

在所述process根据输入数据流配置input,根据输出数据流配置配置output,在实施次序相邻的两个process之间,配置在先次序的process的output与在后次序的process的input具有相同接口标准;

根据接口标准相同的input及output建立任意两个所述process之间的交互链接及执行顺序;

根据所述工作流程框架包括的所述process、所述process配置的执行程序及实施参数、任意所述process的交互连接及执行顺序制作所述生物信息分析工具。

本发明实施例另公开一种可存储介质,用于存储指令,其特征在于,所述指令被处理器执行时实现上述步骤。

本发明实施例另公开一种生物信息分析工具的制作装置,

所述装置包括:

解析模块,解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;

制作模块,应用nextflow根据任意所述分析模块之间的实施次序建立一工作流程框架;在所述工作流程框架内分别匹配不同分析模块的process;根据所述分析步骤配置实施所述的process的nextflow脚本程序;根据参数文件在所述process的config接口设置实施参数;在所述process根据输入数据流配置input,根据输出数据流配置配置output,在实施次序相邻的两个process之间,配置在先次序的process的output与在后次序的process的input具有相同接口标准;根据接口标准相同的input及output建立任意两个所述process之间的交互链接及执行顺序;

封装模块,根据所述工作流程框架包括的所述process、所述process配置的执行程序及实施参数、任意所述process的交互连接及执行顺序制作所述生物信息分析工具。

针对上述方案,本发明通过以下参照附图对公开的示例性实施例作详细描述,亦使本发明实施例的其它特征及其优点清楚。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为实施例方法的流程图;

图2为实施例装置的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本实施例提供一种生物信息分析工具的制作方法。通过本实施例的方法,本实施例将对生物信息的分析流程进行分解,使一个体量较大的执行程序事实上按照对生物信息的分析步骤分割成不同的若干个分析模块;分析模块之间相对独立且功能单一,能够单独运行执行程序,易于管理和使用。不同分析模块之间,仅需要应用如nextflow并结合分析流程对不同分析模块通过定义接口类型进行粘结,实现分析模块的连续。

为了实现上述内容,请参考图1。本实施例以对mrna进行数据分析为例制作模块化的生物信息分析工具,具体包括:

step100、解析对mrna实施数据分析的分析流程为数质控(qc)、基因组比对(mapping)、定量(quantify)、差异分析(diff)、可变剪切(as)、变异检测(snv)及功能富集(go/kegg)等独立的分析步骤及分析步骤之间的实施次序。

step210、根据上述分析步骤分别建立匹配qc、mapping、as、quantify、snv、diff及go/kegg等分析步骤的分析模块。

step220、根据分析步骤对数据的输入、加工及输出,在分析模块配置config接口及抽象的输入数据流、输出数据流及其他参数。

例如,qc分析模块的config接口对应的输入数据流至少包括原始数据、样本名称、接头信息及日志文件,输出数据流至少包括输出路径、缓存路径,其他参数至少包括建库类型、最小长度以及滑动窗口尺寸等。

step310、应用生物信息流程定制工具nextflow建立一工作流程框架并在工作流框架内根据每个分析模块建立独立的process。

nextflow主要是通过定义输入及输出的接口标准,把不同的实施项目即process连接起来,从而实现对生物信息进行数据分析的分析流程。

step320、配置实现process的nextflow脚本,至少包括执行器、环境变量及流程参数等。nextflow脚本的语言优选是groovy语言的扩展集。

step330、根据config接口分别配置与分析模块对应的每个process的上述其他参数。

step340、根据实施次序在process配置符合上述输入接口标准且与抽象的输入数据流对应的input;配置符合上述输出接口标准且与抽象的输出数据流对应的output。

即在相邻实施次序的两个process之间,上一实施次序process的output与下一实施次序process的input的接口标准相同,实现交互链接;

本实施例通过任意两个process之间input及output形成的交互链接,建立所有process之间的交互及执行顺序,进而建立生物信息分析工具的分析流程。

step350、在生物信息分析工具的分析流程及所有process的交互链接和执行顺序建立完成后,即可使用生物信息分析工具执行nextflow_run命令实现对生物信息的分析工作。

通过上述方案,本实施例应用nextflow定义的接口标准快速连接不同process的输入及输出数据流;上述的process能够根据具体的分析步骤在不同语言环境下单独开发,简化了制作流程;同时,本实施例方法制作的生物信息分析工具具备复用性,有效的解决了当前生物信息分析工具存在的开发难度大、复用性差及难以维护困难的问题。

进一步地,本实施例另提供一种计算机可存储介质,用于存储执行上述步骤的计算机指令。

请参考图2,本实施例另公开一种生物信息分析工具的制作装置,包括解析模块、制作模块及封装模块。

解析模块解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意分析步骤的实施次序;根据分析步骤配置分析模块及分析模块的输入数据流、输出数据流及参数文件。制作模块应用nextflow根据任意分析模块之间的实施次序建立一工作流程框架;在工作流程框架内分别匹配不同分析模块的process;根据分析步骤配置实施的process的nextflow脚本程序;根据参数文件在process的config接口设置实施参数;在process根据输入数据流配置input,根据输出数据流配置配置output,在实施次序相邻的两个process之间,配置在先次序的process的output与在后次序的process的input具有相同接口标准;根据接口标准相同的input及output建立任意两个process之间的交互链接及执行顺序。封装模块,根据工作流程框架包括的process、process配置的执行程序及实施参数、任意process的交互连接及执行顺序制作生物信息分析工具。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1