一种线粒体高通量测序数据处理方法及系统与流程

文档序号:11156056阅读:来源:国知局

技术特征:

1.一种线粒体高通量测序数据处理方法,其特征在于,所述方法包括:

S1、对线粒体高通量测序数据来源进行测序鉴定获取数据格式并记录;

S2、对鉴定后的数据进行质控分析判断测序数据质量是否达标,若测序数据质量不达标,则退出处理流程并报告质控未达标;若测序数据质量达标,则执行S3;

S3、根据测序数据的来源对质量达标的测序数据进行序列比对,若序列对比未成功,则退出处理流程并报告序列对比未成功,若序列对比成功,则执行S4;

S4、将对比成功后的测序数据进行基因组学注释。

2.根据权利要求1所述的一种线粒体高通量测序数据处理方法,其特征在于,所述S1的具体实现过程为:

对线粒体高通量测序数据来源进行测序鉴定,若测序数据为fastq格式,则为Illnumina数据,如果为bam格式,则为Ion Torrent数据。

3.根据权利要求2所述的一种线粒体高通量测序数据处理方法,其特征在于,所述S2中若测序数据来源为Illnumina数据,则直接进行质控分析,若测序数据来源为Ion Torrent数据,则将bam格式的文件转换为fastq格式再进行质控分析。

4.根据权利要求3所述的一种线粒体高通量测序数据处理方法,其特征在于,所述S3中序列比对过程为:根据测序数据的来源采用不同序列比对软件将测序后100bp至300bp的测序短片段映射到线粒体基因组上。

5.一种线粒体高通量测序数据处理系统,其特征在于,所述系统包括:

数据来源判断模块,用于对线粒体高通量测序数据来源进行测序鉴定获取数据格式并记录;

原始数据质量检测模块,用于对鉴定后的数据进行质控分析判断测序数据质量是否达标,若测序数据质量不达标,则退出处理流程并报告质控未达标;若测序数据质量达标,则启动序列对比模块;

序列对比模块,用于根据测序数据的来源对质量达标的测序数据进行序列比对,若序列对比未成功,则退出处理流程并报告序列对比未成功,若序列对比成功,则启动基因组学注释模块;

基因组学注释模块,用于将对比成功后的测序数据进行基因组学注释。

6.根据权利要求5所述的一种线粒体高通量测序数据处理系统,其特征在于,所述数据来源判断模块中所述的数据格式为Illnumina数据或Ion Torrent数据,若测序数据为fastq格式,则为Illnumina数据,如果为bam格式,则为Ion Torrent数据。

7.根据权利要求6所述的一种线粒体高通量测序数据处理系统,其特征在于,所述原始数据质量检测模块中,若测序数据来源为Illnumina数据,则直接进行质控分析,若测序数据来源为Ion Torrent数据,则将bam格式的文件转换为fastq格式再进行质控分析。

8.根据权利要求7所述的一种线粒体高通量测序数据处理系统,其特征在于,所述序列对比模块中,根据测序数据的来源采用不同序列比对软件将测序后100bp至300bp的测序短片段映射到线粒体基因组上。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1