建立检测微卫星不稳定的基线及模型的方法与应用与流程

文档序号:19422515发布日期:2019-12-14 01:42阅读:来源:国知局

技术特征:

1.一种建立检测微卫星不稳定的基线的方法,其特征在于,所述方法包括:

针对待测样本的测序数据在人类参考基因组上所对应的区域,搜索所述区域内所有可用的微卫星位点;

利用多个对照血细胞样本的测序数据,统计各所述对照血细胞样本中各所述微卫星位点的平均覆盖深度基线,并保留所述平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;

利用各所述候选微卫星位点及所述平均覆盖深度基线,计算多个阳性样本和多个阴性样本各自的测序数据中每个所述候选微卫星位点的平均覆盖深度及peaks数目,并找出所述peaks数目在多个所述阳性样本和多个所述阴性样本中存在显著差异的所述候选微卫星位点,作为检测微卫星位点,各所述检测微卫星位点在多个所述阳性样本和多个所述阴性样本中的平均覆盖深度及peaks数目即形成检测所述微卫星不稳定的基线。

2.根据权利要求1所述的方法,其特征在于,所有可用的所述微卫星位点的最小长度为10bp。

3.根据权利要求1所述的方法,其特征在于,所述深度阈值大于等于30。

4.一种建立检测微卫星不稳定的模型的方法,其特征在于,所述方法包括:

采用权利要求1至3中任一项所述的方法建立检测微卫星不稳定的基线;

利用机器学习算法将所述基线中多个所述阳性样本和多个所述阴性样本中的平均覆盖深度及peaks数目进行建模,得到所述检测微卫星不稳定的模型。

5.根据权利要求4所述的方法,其特征在于,所述机器学习算法为随机森林算法。

6.一种检测微卫星不稳定的模型,其特征在于,所述模型采用权利要求4或5所述的方法建成。

7.一种检测微卫星不稳定的方法,其特征在于,所述方法包括:

根据权利要求1至3中任一项所述的方法中的所述检测微卫星位点,检测待测样本的测序数据中各所述检测微卫星位点的peaks数目;

利用权利要求6所述的检测微卫星不稳定的模型,对所述待测样本的测序数据中各所述检测微卫星位点的peaks数目进行分析,从而得到所述待测样本的微卫星不稳定状态结果。

8.一种建立检测微卫星不稳定的基线的装置,其特征在于,所述装置包括:

微卫星位点搜索模块,用于将待测样本的测序数据与人类参考基因组序列进行比对,得到所有可用的微卫星位点,所述待测样本的测序数据包括所有已知微卫星位点的测序数据;

候选微卫星位点筛选模块,用于利用多个对照血细胞样本的测序数据,统计各所述对照血细胞样本中各所述微卫星位点的平均覆盖深度基线,并保留所述平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;

基线建立模块,用于利用各所述候选微卫星位点及所述平均覆盖深度基线,计算多个阳性样本和多个阴性样本各自的测序数据中每个所述候选微卫星位点的平均覆盖深度及peaks数目,并找出所述peaks数目在多个所述阳性样本和多个所述阴性样本中存在显著差异的所述候选微卫星位点,作为检测微卫星位点,各所述检测微卫星位点在多个所述阳性样本和多个所述阴性样本中的平均覆盖深度及peaks数目形成检测所述微卫星不稳定的基线。

9.一种建立检测微卫星不稳定的模型的装置,其特征在于,所述装置包括:

权利要求8所述的建立检测微卫星不稳定的基线的装置中的微卫星位点搜索模块、候选微卫星位点筛选模块、基线建立模块以及机器学习建模模块,

其中,所述机器学习建模模块用于利用机器学习算法将所述基线中多个所述阳性样本和多个所述阴性样本中的平均覆盖深度及peaks数目进行建模,得到所述检测微卫星不稳定的模型。

10.一种检测微卫星不稳定的装置,其特征在于,所述装置包括:

权利要求8所述的建立检测微卫星不稳定的基线的装置中的微卫星位点搜索模块、候选微卫星位点筛选模块、基线建立模块以及权利要求9所述的建立检测微卫星不稳定的模型的装置中的机器学习建模模块,以及

检测模块,用于检测待测样本的测序数据中各所述检测微卫星位点的peaks数目;

预测模块,用于利用所述检测微卫星不稳定的模型,对所述待测样本的测序数据中各所述检测微卫星位点的peaks数目进行分析,从而得到所述待测样本的微卫星不稳定状态结果。

11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至3中任意一项所述的建立检测微卫星不稳定的基线方法,或者执行权利要求4或5所述的建立检测微卫星不稳定的模型的方法,或者执行权利要求7所述的检测微卫星不稳定的方法。

12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至3中任意一项所述的建立检测微卫星不稳定的基线方法,或者执行权利要求4或5所述的建立检测微卫星不稳定的模型的方法,或者执行权利要求7所述的检测微卫星不稳定的方法。


技术总结
本发明提供了一种建立检测微卫星不稳定的基线及模型的方法与应用。该方法包括:搜索待测样本的测序数据在人类参考基因组上所对应的区域内所有可用的微卫星位点;利用多个对照血细胞样本的测序数据,统计并保留平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;利用各候选微卫星位点及平均覆盖深度基线,计算并找出peaks数目在多个阳性样本和多个阴性样本中存在显著差异的候选微卫星位点,作为检测微卫星位点,各检测微卫星位点在多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目即形成检测微卫星不稳定的基线。该方法不仅提高了测序数据的利用效率,而且提高了检测的灵敏度。

技术研发人员:周涛;陈利斌;郭璟;楼峰;曹善柏
受保护的技术使用者:北京橡鑫生物科技有限公司
技术研发日:2019.09.04
技术公布日:2019.12.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1