一种基于批次内校正的CNV检测方法与流程

文档序号:31704751发布日期:2022-10-01 10:23阅读:来源:国知局

技术特征:
1.一种基于批次内校正的cnv检测方法,其特征在于,包括以下步骤:s1、依据样本cnv检测的捕获区域,获取q个分析区域;s2、选取n个样本,并对各样本测序获取测序数据;s3、依据样本的测序数据,获取捕获区域的测序深度,以及样本中各分析区域的测序深度,其中i为样本的第i个分析区域;s4、采用公式计算样本中第i个分析区域的,并计算n个样本的第i个分析区域的中值;s5、采用公式对样本的校正得到,并计算该样本的平均值和;s6、采用样本的和,构建该样本的z-score;s7、根据样本的z-score,判断该样本的捕获区域的cnv的倍数。2.根据权利要求1所述的基于批次内校正的cnv检测方法,其特征在于,步骤s1中,样本q个分析区域的获取方法为:s101、依据样本cnv检测的捕获区域,确定depth统计范围;s102、将捕获区域划分为p个目标分析区域,选取其中q个作为分析区域,p≥q。3.根据权利要求2所述的基于批次内校正的cnv检测方法,其特征在于,p≥q≥30。4.根据权利要求1所述的基于批次内校正的cnv检测方法,其特征在于,步骤s2中,n个样本的选取方法为:将n个样本中无亲缘关系样本的数量记为n1,且n≥n1≥4。5.根据权利要求1所述的基于批次内校正的cnv检测方法,其特征在于,步骤s4中,计算样本中第i个分析区域的前,将样本的测序数据与参考基因组比对,选取该样本中测序数据的比对质量大于等于k的reads,对第i个分析区域的进行统计分析。6.根据权利要求5所述的基于批次内校正的cnv检测方法,其特征在于,k取值为大于等于20。7.根据权利要求1所述的基于批次内校正的cnv检测方法,其特征在于,步骤s5中,样本的平均值的计算方法为:s501、将样本中各分析区域的与预设阈值范围进行比较;s502、选用在预设阈值范围内的分析区域计算平均值。8.根据权利要求7所述的基于批次内校正的cnv检测方法,其特征在于,预设阈值范围为样本的的0.7~1.3倍,其中,为样本的q个分析区域的n的中值。9.根据权利要求1或7或8中任一项所述的基于批次内校正的cnv检测方法,其特征在于,步骤s7中,根据样本的z-score,判断该样本的捕获区域的cnv的倍数的方法为:定义临界值为
±
m,当样本的捕获区域的z-score<﹣m时,则该样本的cnv的倍数小于2,判断该样本的捕获区域的拷贝数为1拷贝或者0拷贝;当样本的z-score>﹢m时,则该样本的捕获区域的cnv的倍数大于2,判断该样本的捕获区域的拷贝数大于等于3;
当﹢m≥样本的z-score≥﹣m时,则该样本的捕获区域的cnv的倍数为2。10.根据权利要求9所述的基于批次内校正的cnv检测方法,其特征在于,m取值为3或2.58。

技术总结
本发明提供了一种基于批次内校正的CNV检测方法,包括选取样本CNV检测的捕获区域及q个分析区域;对n个样本测序获取测序数据;获取样本捕获区域的测序深度以及各分析区域的测序深度;计算样本中第i个分析区域的,并计算n个样本的第i个分析区域的的中值;用中值对样本的校正得到并计算样本的平均值;采用样本的和构建该样本的Z-score;根据样本的Z-score,判断该样本的捕获区域的CNV的倍数。本发明的方法能够在不使用额外参照物的情况下,实现不同长度范围的CNV的检出。的检出。的检出。


技术研发人员:仝微微 刘沙沙 费嘉 刘海娟
受保护的技术使用者:北京中仪康卫医疗器械有限公司
技术研发日:2022.09.01
技术公布日:2022/9/30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1