预测同源重组修复缺陷的方法、计算设备和介质与流程

文档序号:30623300发布日期:2022-07-02 05:19阅读:来源:国知局

技术特征:
1.一种用于预测同源重组修复缺陷的方法,包括:基于关于待测样本的测序数据与人类参考基因组序列的比对,生成关于待测样本的比对结果数据;基于所述比对结果数据,确定变异位点;基于变异位点,获取人类参考基因组上变异位点所在突变碱基的上游和下游各预定范围内的位点的碱基序列,以便生成背景图谱信息;基于背景图谱信息,生成标签数据,所述标签数据包括多个标签;确定标签与预定数据库的肿瘤突变标签数据之间的相似度,以便生成标签矩阵;以及基于所生成的标签矩阵,预测关于待测样本的同源重组修复缺陷。2.根据权利要求1所述的方法,其中确定标签与预定数据库的肿瘤突变标签数据之间的相似度以便生成标签矩阵包括:计算标签数据所包括的多个标签中的每个标签与预定数据库的每个肿瘤突变标签数据之间的相似度值;比较所计算的相似度,以便确定与每个肿瘤突变标签数据相关的最大的相似度值;以及基于与每个肿瘤突变标签数据相关的最大的相似度值和待测样本标识,生成标签矩阵,所述标签矩阵指示待测样本标识和与待测样本标识相关联的多个标签特征值,多个标签特征值中的每一个标签特征值用于指示与对应的肿瘤突变标签数据相关的最大的相似度值。3.根据权利要求1所述的方法,其中基于所生成的标签矩阵,预测关于待测样本的同源重组修复缺陷包括:基于标签矩阵和待测样本数量,生成输入数据矩阵;确定目标筛选特征百分比;基于输入数据矩阵和目标筛选特征百分比,生成目标输入特征;以及经由经训练的预测模型提取目标输入特征的特征,以便生成关于待测样本的同源重组修复缺陷的预测结果。4.根据权利要求3所述的方法,其中确定目标筛选特征百分比包括:基于筛选特征百分比,针对输入数据矩阵进行筛选,以便获得候选特征值;将候选标签特征值、作为测试集的输入数据矩阵和关于同源重组修复缺陷的分类数据进行拟合,得到拟合模型;计算所述拟合模型的准确率;以及基于拟合模型的准确率和筛选特征百分比,确定目标拟合模型和目标筛选特征百分比。5.根据权利要求4所述的方法,其中确定目标筛选特征百分比包括:确定拟合模型的最大准确率所对应的筛选特征百分比为目标筛选特征百分比。6.根据权利要求1所述的方法,其中基于所生成的标签矩阵,预测关于待测样本的同源重组修复缺陷包括:基于预定数据库的肿瘤突变标签数据与待测样本的关联癌种,确定标签数据中的目标标签特征值;
确定目标标签特征值是否满足预定条件;响应于确定目标标签特征值满足预定条件,确定待测样本存在同源重组修复缺陷;以及响应于确定目标标签特征值未满足预定条件,确定待测样本不存在同源重组修复缺陷。7.根据权利要求1所述的方法,其中基于所述比对结果数据,确定变异位点包括:基于所述比对结果数据,确定候选变异位点;以及基于支持序列数、突变碱基质量值、突变频率和正负链比,过滤所确定的候选变异位点,以便确定变异位点。8.根据权利要求1所述的方法,其中获取人类参考基因组上对应突变碱基的上游和下游各预定范围内的位点碱基序列,以便生成背景图谱信息包括:将所确定的变异位点定位至人类参考基因组序列上,以便获得变异位点所在突变碱基的上游和下游各1bp的位点的碱基序列;以及基于所述碱基序列,生成背景图谱信息。9.根据权利要求1所述的方法,其中基于背景图谱信息,生成标签数据包括:基于背景图谱信息,经由非负矩阵分解,生成标签数据,所述标签数据包括多个标签特征值,所述背景图谱信息指示96种碱基序列的突变频谱。10.根据权利要求1所述的方法,其中所述预定数据库包括30个肿瘤突变标签特征。11.根据权利要求1所述的方法,其中确定目标标签特征值满足预定条件包括:响应于确定以下任一项满足,确定目标标签特征值满足预定条件:标签数据中的各个目标标签特征值均大于或者等于预定阈值;或者标签数据中的各个目标标签特征值分别大于或者等于对应的各个预定阈值。12.一种计算设备,包括:至少一个处理单元;至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行根据权利要求1至11任一项所述的方法的步骤。13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被机器执行时实现根据权利要求1至11中任一项所述的方法。

技术总结
本公开涉及一种用于检测同源重组修复缺陷的方法、计算设备和计算机存储介质。该方法包括:生成关于待测样本的比对结果数据;基于所述比对结果数据,确定变异位点;基于变异位点,获取人类参考基因组上变异位点所在突变碱基的上游和下游各预定范围内的位点的碱基序列,以便生成背景图谱信息;基于背景图谱信息,生成标签数据,所述标签数据包括多个标签;确定标签与预定数据库的肿瘤突变标签数据之间的相似度,以便生成标签矩阵;以及基于所生成的标签矩阵,预测关于待测样本的同源重组修复缺陷。本公开能够有效提高预测同源重组修复缺陷的准确性和全面性。陷的准确性和全面性。陷的准确性和全面性。


技术研发人员:王凯 陈丽娟
受保护的技术使用者:上海至本医学检验所有限公司
技术研发日:2022.03.09
技术公布日:2022/7/1
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1