一种基因组变异检测方法及检测装置与流程

文档序号:14609707发布日期:2018-06-05 20:34阅读:来源:国知局
一种基因组变异检测方法及检测装置与流程

技术特征:

1.一种基因组变异检测方法,由检测装置执行,其特征在于,包括:

将基因组的多条测序序列分别和参考序列进行双序列比对,得到双序列比对结果;

根据所述双序列比对结果,确定所述基因组的潜在变异区域;

对每个潜在变异区域,在所有测序序列中抽取出处于所述潜在变异区域内的所有测序序列片段,根据所述所有测序序列片段创建迭代DeBruijn图,根据所述迭代DeBruijn图得到N个单倍体;其中,所述N为大于等于1的整数;

对于所述潜在变异区域内的任一测序序列片段,将所述测序序列片段与所述N个单倍体进行SW比对,将所述测序序列片段的最佳单倍体与参考序列片段进行SW比对,得到一组与该测序序列片段对应的SW比对结果;

根据预设变换规则,对每个测序序列片段的SW比对结果进行转换,得到每个测序序列片段与所述参考序列片段的校正对齐结果;所述预设变换规则用于将所述每个测序序列片段与所述参考序列片段对齐;

根据每个测序序列片段与所述参考序列片段的校正对齐结果,确定所述基因组的变异类型。

2.根据权利要求1所述的方法,其特征在于,所述根据所述双序列比对结果,确定所述基因组的潜在变异区域,包括:

根据所述基因组的编码顺序,将所述基因组划分为多个编码区间;

根据所述双序列比对结果,确定所有测序序列的变异类型;

统计每个编码区间内不同变异类型的测序序列的概率分布值;

根据所述编码区间内不同变异类型的测序序列的概率分布值,计算所述编码区间的信息熵;

判断每个编码区间的信息熵是否大于第一阈值,若存在第一编码区间,所述第一编码区间的信息熵大于第一阈值,则确定所述第一编码区间为潜在变异区域。

3.根据权利要求1所述的方法,其特征在于,所述根据所述双序列比对结果,确定所述基因组的潜在变异区域,包括:

根据所述基因组的编码顺序,将所述基因组划分为多个编码区间;

统计每个编码区间内发生变异的测序序列的数量;

判断每个编码区间内发生变异的测序序列的数量是否大于第二阈值;

若存在第一编码区间,所述第一编码区间内发生变异的测序序列的数量大于第二阈值,则确定所述第一编码区间为潜在变异区域。

4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述所有测序序列片段创建迭代DeBruijn图,包括:

a)初始化kmer的值k;

b)从所述所有测序序列当中过滤掉支持数低于设定阈值的kmer,并以所述kmer作为节点,所述过滤后的测序序列上的相邻kmer作为边,创建最初始的DeBruijn图;

c)遍历当前DeBruijn图产生多个contig,过滤出长度大于测序仪读长的contig作为新扩充的测序序列,并删除掉所述所有测序序列中被所述新扩充的测序序列完全包含的测序序列,同时,将k值加1;

d)以所述所有测序序列中剩下的测序序列和所述新扩充的测序序列按照新的k值,以所述kmer作为节点,所述所有测序序列上的相邻kmer作为边创建新的DeBruijn图;其中,所述k值为kmer长度,所述当前DeBruijn图根据所述k值创建;

重复上述c)~d)过程,直至所述k值为预设的最大kmax值,将最大kmax值对应的当前DeBruijn图作为所述最终需要的迭代DeBruijn图。

5.根据权利要求1-4任一项所述的方法,其特征在于,对于任一测序序列片段的SW比对结果,所述SW比对结果包括:该测序序列片段与最佳单倍体进行SW比对后的第一SW比对结果,最佳单倍体与参考序列片段进行SW比对后的第二SW比对结果;所述第一SW比对结果、所述第二SW比对结果由CIGAR表示,所述CIGAR由至少一个包含:系数和比对类型的操作连接而成,所述比对类型包括:匹配/误配M、删除D、插入I中的至少一种或多种;

所述根据预设变换规则,对所述测序序列片段的SW比对结果进行转换,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

获取所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作;

根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果。

6.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为M,所述第一SW比对结果中的第一操作的比对类型为M,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第一SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、且比对类型为M的第二操作作为第二SW比对结果当前新的操作,将所述第二操作与所述下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果;并获取与所述第二SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为M的第三操作作为所述第一SW比对结果当前新的操作,将所述下一操作与所述第三操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将所述第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

7.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为M,所述第一SW比对结果中的第一操作的比对类型为D,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、比对类型为M的操作作为所述第二SW比对结果当前新的操作,将该新的操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将系数为所述第二SW比对结果中的第一操作的系数、比对类型为D的操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为D的操作作为所述第一SW比对结果当前新的操作,将所述下一操作与所述新的操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

8.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为M,所述第一SW比对结果中的第一操作的比对类型为I,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将所述第二SW比对结果中的第一操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

9.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为D,所述第一SW比对结果中的第一操作的比对类型为M,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将与所述第二SW比对结果中的第一操作相邻的下一操作与所述第一SW比对结果中的第一操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

10.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为D,所述第一SW比对结果中的第一操作的比对类型为D,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将与所述第二SW比对结果中的第一操作相邻的下一操作与所述第一SW比对结果中的第一操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

11.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为D,所述第一SW比对结果中的第一操作的比对类型为I,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将系数为所述第一SW比对结果中的第一操作的系数、比对类型为M的操作,以及系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、比对类型为D的操作顺序组合在一起作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将系数为所述第二SW比对结果中的第一操作的系数、比对类型为M的操作,以及系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为I的操作顺序组合在一起作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将系数为所述第二SW比对结果中的第一操作的系数、比对类型为M的操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

12.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为I,所述第一SW比对结果中的第一操作的比对类型为M,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将系数为所述第一SW比对结果中的第一操作的系数、比对类型为I的操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、比对类型为I的操作作为所述第二SW比对结果当前新的操作,将该新的操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为M的操作作为第一SW比对结果当前新的操作,将所述下一操作与该新的操作与作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

13.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为I,所述第一SW比对结果中的第一操作的比对类型为D,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则不输出所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、且比对类型为I的操作作为第二SW比对结果当前新的操作,将该新的操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则不输出所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将所述第二SW比对结果中的第一操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则不输出所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

14.根据权利要求5所述的方法,其特征在于,所述根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果,包括:

若所述第二SW比对结果中的第一操作的比对类型为I,所述第一SW比对结果中的第一操作的比对类型为I,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将所述第二SW比对结果中的第一操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

15.根据权利要求1所述的方法,其特征在于,所述根据每个测序序列片段与所述参考序列片段的校正对齐结果,确定所述基因组的变异类型,包括:

根据所述校正比对结果,对所述潜在变异区域从前到后扫描每一个位置,确定所述潜在变异区域中的变异位置;

判断每个变异位置中每种变异类型的测序序列片段的数量是否大于第三阈值,若存在M种变异类型,所述M种变异类型的测序序列片段的数量均大于第三阈值,则确定所述M种变异类型为所述基因组的变异类型;其中,所述M为大于等于1的整数。

16.一种检测装置,其特征在于,该装置包括:

序列比对单元,用于将基因组的多条测序序列分别和参考序列进行双序列比对,得到双序列比对结果;

确定单元,用于根据所述序列比对单元得到的双序列比对结果,确定所述基因组的潜在变异区域;

创建单元,用于对每个潜在变异区域,在所有测序序列中抽取出处于所述潜在变异区域内的所有测序序列片段,根据所述所有测序序列片段创建迭代DeBruijn图,根据所述迭代DeBruijn图得到N个单倍体;其中,所述N为大于等于1的整数;

SW比对单元,用于对于所述潜在变异区域内的任一测序序列片段,将所述测序序列片段与所述N个单倍体进行SW比对,将所述测序序列片段的最佳单倍体与参考序列片段进行SW比对,得到一组与该测序序列片段对应的SW比对结果;

校正对齐单元,用于根据预设变换规则,对每个测序序列片段的SW比对结果进行转换,得到每个测序序列片段与所述参考序列片段的校正对齐结果;所述预设变换规则用于将所述每个测序序列片段与所述参考序列片段对齐;

所述确定单元,还用于根据每个测序序列片段与所述参考序列片段的校正对齐结果,确定所述基因组的变异类型。

17.根据权利要求16所述的装置,其特征在于,所述确定单元,具体用于:

根据所述基因组的编码顺序,将所述基因组划分为多个编码区间;

根据所述双序列比对结果,确定所有测序序列的变异类型;

统计每个编码区间内不同变异类型的测序序列的概率分布值;

根据所述编码区间内不同变异类型的测序序列的概率分布值,计算所述编码区间的信息熵;

判断每个编码区间的信息熵是否大于第一阈值,若存在第一编码区间,所述第一编码区间的信息熵大于第一阈值,则确定所述第一编码区间为潜在变异区域。

18.根据权利要求16所述的装置,其特征在于,所述确定单元,具体用于:

根据所述基因组的编码顺序,将所述基因组划分为多个编码区间;

统计每个编码区间内发生变异的测序序列的数量;

判断每个编码区间内发生变异的测序序列的数量是否大于第二阈值;

若存在第一编码区间,所述第一编码区间内发生变异的测序序列的数量大于第二阈值,则确定所述第一编码区间为潜在变异区域。

19.根据权利要求16-18任一项所述的装置,其特征在于,所述创建单元,具体用于:

a)初始化kmer的值k;

b)从所述所有测序序列当中过滤掉支持数低于设定阈值的kmer,并以所述kmer作为节点,所述过滤后的测序序列上的相邻kmer作为边,创建最初始的DeBruijn图;

c)遍历当前DeBruijn图产生多个contig,过滤出长度大于测序仪读长的contig作为新扩充的测序序列,并删除掉所述所有测序序列中被所述新扩充的测序序列完全包含的测序序列,同时,将k值加1;

d)以所述所有测序序列中剩下的测序序列和所述新扩充的测序序列按照新的k值,以所述kmer作为节点,所述所有测序序列上的相邻kmer作为边创建新的DeBruijn图;其中,所述k值为kmer长度,所述当前DeBruijn图根据所述k值创建;

重复上述c)~d)过程,直至所述k值为预设的最大kmax值,将最大kmax值对应的当前DeBruijn图作为所述最终需要的迭代DeBruijn图。

20.根据权利要求16-19任一项所述的装置,其特征在于,对于任一测序序列片段的SW比对结果,所述SW比对结果包括:该测序序列片段与最佳单倍体进行SW比对后的第一SW比对结果,最佳单倍体与参考序列片段进行SW比对后的第二SW比对结果;所述第一SW比对结果、所述第二SW比对结果由CIGAR表示,所述CIGAR由至少一个包含:系数和比对类型的操作连接而成,所述比对类型包括:匹配/误配M、删除D、插入I中的至少一种或多种;

所述校正对齐单元,具体用于:

获取所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作;

根据所述预设变换规则,对所述第二SW比对结果中的第一操作、以及所述第一SW比对结果中的第一操作进行比较,得到所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取新的一对Operator,根据所述预设变换规则对这一对新的Operator进行循环迭代计算,得到所述测序序列片段与所述参考序列片段的校正对齐结果。

21.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为M,所述第一SW比对结果中的第一操作的比对类型为M,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第一SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、且比对类型为M的第二操作作为第二SW比对结果当前新的操作,将所述第二操作与所述下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果;并获取与所述第二SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为M的第三操作作为所述第一SW比对结果当前新的操作,将所述下一操作与所述第三操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将所述第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

22.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为M,所述第一SW比对结果中的第一操作的比对类型为D,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、比对类型为M的操作作为所述第二SW比对结果当前新的操作,将该新的操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将系数为所述第二SW比对结果中的第一操作的系数、比对类型为D的操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为D的操作作为所述第一SW比对结果当前新的操作,将所述下一操作与所述新的操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

23.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为M,所述第一SW比对结果中的第一操作的比对类型为I,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将所述第二SW比对结果中的第一操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

24.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为D,所述第一SW比对结果中的第一操作的比对类型为M,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将与所述第二SW比对结果中的第一操作相邻的下一操作与所述第一SW比对结果中的第一操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

25.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为D,所述第一SW比对结果中的第一操作的比对类型为D,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将与所述第二SW比对结果中的第一操作相邻的下一操作与所述第一SW比对结果中的第一操作作为新的一对操作Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

26.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为D,所述第一SW比对结果中的第一操作的比对类型为I,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将系数为所述第一SW比对结果中的第一操作的系数、比对类型为M的操作,以及系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、比对类型为D的操作顺序组合在一起作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将系数为所述第二SW比对结果中的第一操作的系数、比对类型为M的操作,以及系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为I的操作顺序组合在一起作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将系数为所述第二SW比对结果中的第一操作的系数、比对类型为M的操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

27.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为I,所述第一SW比对结果中的第一操作的比对类型为M,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则将系数为所述第一SW比对结果中的第一操作的系数、比对类型为I的操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、比对类型为I的操作作为所述第二SW比对结果当前新的操作,将该新的操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二SW比对结果中的第一操作相邻的下一操作、以及生成新的系数为所述第一SW比对结果中的第一操作的系数与所述第二SW比对结果中的第一操作的系数的差、比对类型为M的操作作为第一SW比对结果当前新的操作,将所述下一操作与该新的操作与作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则将所述第二SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

28.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为I,所述第一SW比对结果中的第一操作的比对类型为D,则比较所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数大,则不输出所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并生成新的系数为所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数的差、且比对类型为I的操作作为第二SW比对结果当前新的操作,将该新的操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数比所述第一SW比对结果中的第一操作的系数小,则不输出所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将所述第二SW比对结果中的第一操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算;

若所述第二SW比对结果中的第一操作的系数与所述第一SW比对结果中的第一操作的系数相等,则不输出所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并获取与所述第二比对结果SW中的第一操作相邻的下一操作、以及获取与所述第一SW比对结果中的第一操作相邻的下一操作,根据所述预设变换规则对这两个下一操作进行计算。

29.根据权利要求20所述的装置,其特征在于,所述校正对齐单元,具体用于:

若所述第二SW比对结果中的第一操作的比对类型为I,所述第一SW比对结果中的第一操作的比对类型为I,则将所述第一SW比对结果中的第一操作作为所述测序序列片段与所述参考序列片段在当前位置的校正对齐结果,并将所述第二SW比对结果中的第一操作与所述第一SW比对结果中的第一操作相邻的下一操作作为新的一对Operator,并根据所述预设变换规则对这一对新的Operator进行计算。

30.根据权利要求16所述的装置,其特征在于,所述确定单元,具体用于:

根据所述校正比对结果,对所述潜在变异区域从前到后扫描每一个位置,确定所述潜在变异区域中的变异位置;

判断每个变异位置中每种变异类型的测序序列片段的数量是否大于第三阈值,若存在M种变异类型,所述M种变异类型的测序序列片段的数量均大于第三阈值,则确定所述M种变异类型为所述基因组的变异类型;其中,所述M为大于等于1的整数。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1