一种基因变异成因分析方法及系统与流程

文档序号:12064124阅读:来源:国知局

技术特征:

1.一种基因变异成因分析方法,其特征在于,包括:

将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片;

对异常读片进行聚类处理;

根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析。

2.根据权利要求1所述的基因变异成因分析方法,其特征在于,所述根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析,包括:

根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,识别出该结构变异的间断点;

基于所述间断点处序列的同源性判断结构变异对应的成因。

3.根据权利要求1所述的基因变异成因分析方法,其特征在于,所述将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片的步骤,包括:

将读片与参考序列进行比对,当至少满足以下一项时,确定为异常读片:映射方向异常;

成对读片比对到不同染色体上;

插入距离异常。

4.根据权利要求1所述的基因变异成因分析方法,其特征在于,所述对异常读片进行聚类处理的步骤包括:

首先将异常测序片段对i的比对位置(POS,PNEXT)记为(xi,yi),并计算异常测序片段对i的比对中间值M(xi,yi)=(xi+yi)/2;

同一类的异常读片满足M(,)-M(,)<Dmax,其中,Dmax=lmax,lmax=max(l1,l2,l3…ln),ln为第n个读片的插入距离,n为自然数;

同一类中的异常读片之间的插入距离还需满足maxij((,)-(,))≤2lmax。

5.一种基因变异成因分析系统,其特征在于,包括:

异常读片判断模块,用于将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片;

聚类处理模块,用于对异常读片进行聚类处理;

成因分析模块,用于根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析。

6.根据权利要求5所述的基因变异成因分析系统,其特征在于,所述成因分析模块包括:

间断点识别单元,用于根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,识别出该结构变异的间断点;

成因分析单元,用于基于所述间断点处序列的同源性判断结构变异对应的成因。

7.根据权利要求5所述的基因变异成因分析系统,其特征在于,所述异常读片判断模块包括:

第一判断单元,用于判断读片与参考序列的映射方向异常;

第二判断单元,用于判断是否成对读片比对到不同染色体上;

第三判断单元,用于判断插入距离异常。

8.根据权利要求5所述的基因变异成因分析系统,其特征在于,所述聚类处理模块包括:

中间值计算单元,用于将异常测序片段对i的比对位置(POS,PNEXT)记为(xi,yi),并计算异常测序片段对i的比对中间值M(xi,yi)=(xi+yi)/2;

聚类第一分类单元,用将异常读片满足M(,)-M(,)<Dmax的读片归为一类,其中,Dmax=lmax,lmax=max(l1,l2,l3…ln),ln为第n个读片的插入距离,n为自然数;

聚类第二分类单元,用于在聚类第一分类单元判断的聚类中,通过是否满足maxij((,)-(,))≤2lmax筛选出最终聚类的异常读片。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1