1.一种检测体细胞突变的方法,其特征在于,包括,
获取第一测序数据,所述第一测序数据包括多个第一读段,所述第一测序数据为待测样本的核酸序列的测定数据;
将所述第一测序数据与参考序列比对,获得第一比对结果;
基于所述第一比对结果,识别出突变位点,所述突变位点包括SNP和INDEL中的至少之一;
比较所述突变位点与正常对照样本的相应突变位点的支持读段数的差异,获得差异显著的突变位点,所述差异显著的突变位点包括差异具有统计意义的突变位点。
2.权利要求1的方法,其特征在于,所述突变位点包括SNP和INDEL。
3.权利要求1或2的方法,其特征在于,所述第一测序数据中的读段的长度不相同。
4.权利要求1或2的方法,其特征在于,去除所述第一比对结果中的重复的第一读段。
5.权利要求1或2的方法,其特征在于,确定所述正常对照样本的相应突变位点,包括,
获取第二测序数据,所述第二测序数据包括多个第二读段,所述第二测序数据为正常对照样本的核酸序列的测定数据,所述第二测序数据与所述第一测序数据等量,任选的,所述第一测序数据和所述第二测序数据都大于100X;
将所述第二测序数据与参考序列比对,获得第二比对结果;
基于所述第二比对结果,识别出所述正常对照样本的相应突变位点。
6.权利要求5的方法,其特征在于,所述比较突变位点与正常对照样本的相应突变位点的支持读段数的差异,获得差异显著的突变位点,包括过滤掉符合以下(a)-(d)任意之一的SNP,
(a)在正常对照样本中没有第二读段比对上,或者比对上的第二读段数目少于10条,
(b)在正常对照样本中的支持读段数不少于5,
(c)在待测样本中的支持读段数少于5,
(d)在正常对照样本中的支持读段数为1-4条,并且与在待测样本中的支持读段数的差异不具统计意义(P>0.005)。
7.权利要求5的方法,其特征在于,所述比较突变位点与正常对照样本的相应突变位点的支持读段数的差异,获得差异显著的突变位点,包括过滤掉符合以下(e)-(h)任意 之一的SNP,
(e)两个相邻SNP之间的距离不超过5bp,
(f)其支持读段中的低比对质量读段的比例超过50%,任选的,低比对质量读段为比对质量小于30的读段,
(g)其位于其支持读段的末端的读段的比例超过50%,任选的,所述读段的末端为从读段的一端的起始核苷酸开始到不大于该读段长度5%的核苷酸的范围,
(h)在距其不大于5bp的范围内其支持读段中包含的同时支持其它类型突变或者存在错配的读段的比例超过50%。
8.权利要求5的方法,其特征在于,所述比较突变位点与正常对照样本的相应突变位点的支持读段数的差异,获得差异显著的突变位点,包括过滤掉符合以下(i)-(k)任意之一的INDEL,
(i)其支持读段同时支持其它一种或多种变异类型,
(j)其支持读段中的低比对质量的读段的比例超过50%,任选的,所述低比对质量读段为比对质量小于30的读段,
(k)其位于其支持读段的末端的读段的比例超过50%,任选的,读段的末端为从该读段的一端的起始核苷酸开始到不大于该读段长度10%的核苷酸的范围。
9.权利要求8的方法,其特征在于,所述比较突变位点与正常对照样本的相应突变位点的支持读段数的差异,获得差异显著的突变位点,包括对位于非同聚体并且符合以下(l)-(o)任意之一的INDEL进行过滤,
(l)在正常对照样本中没有第二读段比对上,或者比对上的第二读段数目少于10,
(m)在正常对照样本中的支持读段数不少于5,
(n)在待测样本中的支持读段数少于5,
(o)在正常对照样本中的支持读段数为1-4,并且与在待测样本中的支持读段数的差异不具统计意义(P>0.005)。
10.权利要求8的方法,其特征在于,所述比较突变位点与正常对照样本的相应突变位点的支持读段数的差异,获得差异显著的突变位点,包括比较待测样本和正常对照样本中的位于同聚体的INDEL的频率的差异,保留待测样本中的频率显著大于正常对照样本的频率的INDEL。
11.一种检测体细胞突变的装置,其特征在于,包括,
数据输入单元,用以输入数据;
数据输出单元,用以输出数据;
处理器,用以执行可执行程序,执行所述可执行程序包括完成权利要求1-10任一方法;以及
存储单元,与所述数据输入单元、数据输出单元和处理器连接,用以存储数据,其中包括所述可执行程序。