染色体比例的修正方法、装置、介质与流程

文档序号:16587415发布日期:2019-01-14 18:38阅读:286来源:国知局
染色体比例的修正方法、装置、介质与流程

本发明涉及基因检测领域,尤其涉及一种染色体比例的修正方法、装置、介质。



背景技术:

如今,人们通常会在胎儿出生前进行产前诊断,以判断胎儿是否存在患有21-三体综合征、18-三体综合征以及13-三体综合征的风险。

现有技术中,进行产前检验时,人们为了避免过大的创伤性,同时保证检测结果较高的准确度,人们通常选择使用无创产前胎儿dna检测技术(non-invasiveprenataltesting,nipt)进行产前检验。nipt技术采用z检验进行结果筛选,通过孕妇的目标染色体,即孕妇的13号染色体、18号染色体和21号染色体比例与参照库的平均13号染色体、18号染色体和21号染色体比例进行比较得出检测结果。

然而,使用无创产前胎儿dna检测技术时,某些情况下,由于dna提取、建库、上机测序、操作人员、仪器和实验室环境等因素存在诸多变量,导致批次内正常样本的13号染色体、18号染色体和21号染色体的比例会与参考库存在差异。这种差异可以表示为一种随机波动,但当此种波动有显著性差异时,其会影响到无创产前检测结果的准确性。



技术实现要素:

本发明解决的技术问题是批次内样本染色体比例与参考库差异过大时,提升该批次样本检测结果的准确性。

为解决上述技术问题,本发明实施例提供一种染色体比例的修正方法,包括:根据预设的参照组内的目标染色体数据,判断样本组内的目标染色体是否正常;将所述样本组内正常的目标染色体数据形成对比组;获取所述参照组内目标染色体的比例与所述对比组内的目标染色体的比例之间的差异值;根据预设的阈值以及所述差异值判断是否对样本组内的目标染色体的比例进行修正;当确定对所述样本组内的目标染色体的比例进行修正时,根据所述参照组内的目标染色体的平均比例与所述对比组内的目标染色体的平均比例得到修正量,使用所述修正量对所述样本组内的目标染色体的比例进行修正。

可选的,获取所述参照组内正常的目标染色体的平均比例;获取所述样本组内各个目标染色体的比例;根据所述参照组内目标染色体的平均比例判断所述样本组内目标染色体的比例是否正常。

可选的,所述参照组内目标染色体的平均比例meank使用以下公式计算:

ratiokm=ri/rc,

meank=∑ratiokm/m;

其中ri为参照组内第m条正常的目标染色体上片段的数目,rc为所述第m条正常的目标染色体对应的所有常染色体上片段的数目,ratiokm为所述第m条目标染色体的比例,m为所述参照组内正常的目标染色体的条数,∑ratiokm为参照组内m条正常的目标染色体的比例的和,1≤m≤m。

可选的,当(ratioln-meank)/sdk<3时,判定所述样本组内第n条目标染色体为正常;其中,ratioln为所述样本组内第n条目标染色体的比例,1≤n≤n,n为所述样本组内的目标染色体的数目,sdk为所述参照组内m条正常的目标染色体的比例的标准差。

可选的,将所述参照组中正常的m条目标染色体的比例作为第一组;将所述对比组中的j条目标染色体的比例作为第二组,j为所述对比组中目标染色体的数目;1≤j≤n;对所述第一组与第二组进行假设检验,计算所述第一组与第二组之间没有差异值的概率。

可选的,若所述第一组与第二组之间没有差异值的概率小于等于预设的阈值,则判定对样本组内目标染色体的比例进行修正。

可选的,所述对比组内目标染色体的平均比例meanj由以下公式计算:

meanj=∑ratiolj/j,

其中,ratiolj为所述对比组中第j条目标染色体的比例,∑ratiolj为对比组中的j条目标染色体的比例的和值;

所述修正量δr由以下公式计算:

δr=meanj-meank,

由以下公式对样本组内目标染色体的比例进行修正:

ratio’ln=ratioln-δr,

其中,ratio’ln为修正后的样本组内目标染色体的比例。

可选的,使用以下公式判断所述样本组内目标染色体是否正常:

当(ratio’ln-meank)/sdk<3时,判定所述样本组内第n条目标染色体为正常。

本发明还提供一种染色体比例的修正装置,包括:第一判断单元,用于根据预设的参照组内的目标染色体数据,判断样本组内的目标染色体是否正常;对比单元,用于将所述样本组内正常的目标染色体数据形成对比组;差异单元,用于获取所述参照组内目标染色体的比例与所述对比组内的目标染色体的比例之间的差异值;第二判断单元,用于根据预设的阈值以及所述差异值判断是否对样本组内的目标染色体的比例进行修正;修正单元,用于当确定对所述样本组内的目标染色体的比例进行修正时,根据所述参照组内的目标染色体的平均比例与所述对比组内的目标染色体的平均比例得到修正量,使用所述修正量对所述样本组内的目标染色体的比例进行修正。

可选的,所述第一判断单元,用于获取所述参照组内正常的目标染色体的平均比例;获取所述样本组内各个目标染色体的比例;根据所述参照组内目标染色体的平均比例判断所述样本组内目标染色体的比例是否正常。

可选的,所述第一判断单元,用于使用以下公式计算所述参照组内目标染色体的平均比例meank:

ratiokm=ri/rc,

meank=∑ratiokm/m;

其中,ri为参照组内第m条正常的目标染色体上片段的数目,rc为所述第m条正常的目标染色体对应的所有常染色体上片段的数目,ratiokm为所述第m条目标染色体的比例,m为所述参照组内正常的目标染色体的条数,∑ratiokm为参照组内m条正常的目标染色体的比例的和,1≤m≤m。

可选的,所述第一判断单元,用于当(ratioln-meank)/sdk<3时,判定所述样本组内第n条目标染色体为正常;其中,ratioln为所述样本组内第n条目标染色体的比例,1≤n≤n,n为所述样本组内的目标染色体的数目,sdk为所述参照组内m条正常的目标染色体的比例的标准差。

可选的,所述差异单元,用于将所述参照组中正常的m条目标染色体的比例作为第一组;将所述对比组中的j条目标染色体的比例作为第二组,j为所述对比组中目标染色体的数目;1≤j≤n;对所述第一组与第二组进行假设检验,计算所述第一组与第二组之间没有差异值的概率。

可选的,所述第二判断单元,用于若所述第一组与第二组之间没有差异值的概率小于等于预设的阈值,则判定对样本组内目标染色体的比例进行修正。

可选的,所述修正单元,用于由以下公式计算所述对比组内目标染色体的平均比例meanj:

meanj=∑ratiolj/j,

其中,ratiolj为所述对比组中第j条目标染色体的比例,∑ratiolj为对比组中的j条目标染色体的比例的和值;

由以下公式计算所述修正量δr:

δr=meanj-meank,

由以下公式对样本组内目标染色体的比例进行修正:

ratio’ln=ratioln-δr,

其中,ratio’ln为修正后的样本组内目标染色体的比例。

可选的,所述修正单元,还用于使用以下公式判断所述样本组内目标染色体是否正常:

当(ratio’ln-meank)/sdk<3时,判定所述样本组内第n条目标染色体为正常。

本发明还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种的染色体比例的修正方法的步骤。

本发明还提供一种染色体比例的修正装置,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时所述处理器执行上述任一种的染色体比例的修正方法的步骤。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

通过将已完成测序的孕有正常胎儿的孕妇的目标染色体的比例作为参照组,使用参照组判断样本组中孕妇的目标染色体是否正常,将样本组中正常的目标染色体作为对比组,根据所述参照组内目标染色体的平均比例与所述对比组内目标染色体的平均比例得到修正量,使用所述修正量对所述样本组内目标染色体的比例进行修正。在对样本组的目标染色体的比例修正后,使得样本组中原本正常的胎儿不会被检验得出患有21-三体综合征、18-三体综合征以及13-三体综合征的风险。

进一步,在对样本组的目标染色体的比例进行修正后,根据参照组对样本组进行检验,得到修正后降低的检验错误的概率。

附图说明

图1是本发明实施例提供的一种染色体比例的修正方法的示意图;

图2是本发明实施例提供的一种染色体比例的修正装置的结构示意图。

具体实施方式

现有技术中,进行产前检验时,人们为了避免过大的创伤性,同时保证检测结果较高的准确度,人们通常选择使用nipt技术进行产前检验。nipt技术采用z检验进行结果筛选,通过孕妇的目标染色体,即孕妇的13号染色体、18号染色体和21号染色体比例与参照库的平均13号染色体、18号染色体和21号染色体比例进行比较得出检测结果。

然而,使用无创产前胎儿dna检测技术时,某些情况下,由于dna提取、建库、上机测序、操作人员、仪器和实验室环境等因素存在诸多变量,导致批次内正常样本的13号染色体、18号染色体和21号染色体的比例会与参考库存在差异。这种差异可以表示为一种随机波动,但当此种波动有显著性差异时,其会影响到无创产前检测结果的准确性。

本发明实施例中,通过将已完成测序的孕有正常胎儿的孕妇的目标染色体的比例作为参照组,使用参照组判断样本组中孕妇的目标染色体是否正常,将样本组中正常的目标染色体作为对比组,根据所述参照组内目标染色体的平均比例与所述对比组内目标染色体的平均比例得到修正量,使用所述修正量对所述样本组内目标染色体的比例进行修正。在对样本组的目标染色体的比例修正后,使得样本组中原本正常的胎儿不会有被检验得出患有21-三体综合征、18-三体综合征以及13-三体综合征的风险。

为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

参阅图1,本发明实施例提供了一种染色体比例的修正方法,其中具体步骤包括:

步骤s101,根据预设的参照组内的目标染色体数据,判断样本组内的目标染色体是否正常。

在具体实施中,参照组可以包括多名孕妇的染色体数据,这些孕妇的染色体数据为在实验室经过检验的数据,且其中包括:已确定其中孕有正常胎儿的孕妇对应的正常的目标染色体数据,以及孕有患三体综合征的胎儿的孕妇对应的目标染色体数据。

在实际应用中,正常的目标染色体即可表征孕妇的染色体呈阴性,孕妇当孕妇的染色体呈阳性时表征孕妇孕有患三体综合征的胎儿。

在具体实施中,参照组中孕妇染色体数据越多,相对应得到的无创检测结果越准确。

在实际应用中,目标染色体可以是13号染色体、18号染色体或21号染色体中的任一个。

在具体实施中,样本组可以由孕妇的染色体数据组成,其中孕妇的目标染色体正常与否未知。

在具体实施中,将样本组中的孕妇的目标染色体数据与参照组中的目标染色体数据相对比,确定样本组中正常的目标染色体。

步骤s102,将所述样本组内正常的目标染色体数据形成对比组。

在具体实施中,将样本组与参照组比对后,选出样本组中所有的正常的目标染色体,并将这些正常的目标染色体形成对比组。

步骤s103,获取所述参照组内目标染色体的比例与所述对比组内的目标染色体的比例之间的差异值。

在具体实施中,染色体比例为某一染色体上的片段(read)数目与该染色体对应的所有常染色体上的片段数目之和的比值。

例如,1号染色体的比例为1号染色体上的片段数目与1-22号所有常染色体上的片段数目之和的比值。

在具体实施中,可以将参照组内的各个目标染色体的比例数据作为一组,将对比组内的各个目标染色体的比例数据作为另一组,获取两组数据之间的差异值。

步骤s104,根据预设的阈值以及所述差异值判断是否对样本组内的目标染色体的比例进行修正。

在具体实施中,阈值可以由临床实验数据确定。

在具体实施中,可以根据获取的差异值与阈值之间的大小关系确定是否对样本组内的目标染色体的比例进行修正。

步骤s105,当确定对所述样本组内的目标染色体的比例进行修正时,根据所述参照组内的目标染色体的平均比例与所述对比组内的目标染色体的平均比例得到修正量,使用所述修正量对所述样本组内的目标染色体的比例进行修正。

在具体实施中,若确定对样本组内的目标染色体比例进行修正时,说明可能由于地区差异等原因,样本组内正常目标染色体的比例与参照组内正常目标染色体的平均比例之间的偏差值过大,过大的偏差值进而导致样本组内某些正常的目标染色体被判定为阳性。

在具体实施中,为了修正样本组内正常的目标染色体的偏差值,根据参照组内的目标染色体的平均比例与对比组内的目标染色体的平均比例得到修正量。在得到修正量之后,可以将样本组内的各个目标染色体的比例减去修正量,完成修正过程。

本发明实施例中,在根据参照组内的目标染色体判断样本组内的目标染色体是否正常的过程中,可以先在参照组中选取正常的目标染色体,获取这些正常的目标染色体的平均比例,并获取样本组内各个目标染色体的比例。之后,根据参照组内正常的目标染色体的平均比例以及样本组内的目标染色体的比例,判断样本组内的目标染色体是否正常。

本发明实施例中,获取参照组内正常目标染色体的平均比例meank的过程为,确定参照组内的m条正常的目标染色体,其中第m条正常的目标染色体的比例ratiokm的计算公式如下:

ratiokm=ri/rc,(1)

其中,ri为第m条正常的目标染色体上片段的数目,rc为所述第m条正常的目标染色体对应的所有常染色体上片段的数目。

在具体实施中,在获取参照组内m条正常目标染色体的比例后,参照组内正常目标染色体的平均比例meank的计算公式如下:

meank=∑ratiokm/m,(2)

其中,∑ratiokm为m条正常的目标染色体的比例之和,1≤m≤m。

在具体实施中,样本组内的n条目标染色体的比例ratioln的获取方法可以参照上述参照组内正常的目标染色体比例的获取方法;1≤n≤n。

本发明实施例中,可以使用z检验算法,根据参照组内的正常目标染色体的平均比例meank来判断样本组的目标染色体是否正常。

在具体实施中,z检验为无创产前检测方法中常用的一种判断目标染色体为阴性或阳性的方法,用户也可以根据实际情况使用其他检验方法判断目标染色体为阴性或阳性。

在具体实施中,使用z检验前获取参照组内m条正常的目标染色体比例的标准差sdk。在本发明实施例中,可以采用如下公式计算z检验:

(ratioln-meank)/sdk,(3)

当z检验得到的值小于3时,则判定第n条目标染色体为正常。

本发明实施例中,挑选出样本组内j条正常的目标染色体作为对比组。

本发明实施例中,将参照组中m条正常的目标染色体比例作为第一组;将对比组中的j条目标染色体的比例作为第二组。

例如,参照组内有3条正常的21号染色体,对应的比例分别为0.1、0.2、0.3,则第一组内的数据为0.1、0.2和0.3。对比组内有3条21号染色体,对应的比例分别为0.1、0.3、0.4,则第二组内的数据为0.1、0.3和0.4。

本发明实施例中,计算所述第一组的数据与第二组的数据之间的差异值。

在具体实施中,可以使用秩和检验计算第一组的数据与第二组的数据之间的差异值。在实际应用中可知,秩和检验是一种假设检验,通过假设两组数据之间没有差异值,可以计算得到两组数据之间没有差异值的概率。

可以理解的是,也可以使用其他算法计算第一组的数据与第二组的数据之间的差异值。

本发明实施例中,在通过假设检验计算得到第一组的数据与第二组的数据之间没有差异值的概率后,若概率小于预设的阈值,则说明两组数据之间的差异值较大,可以对样本组内的目标染色体比例进行修正。

在具体实施中,阈值可以由用户根据实际情况设定。

本发明实施例中,确定对样本组内的目标染色体修正后,可以计算修正量。

本发明实施例中,修正量δr可以由以下公式计算:

δr=meanj-meank,(4)

其中,meanj为对比组内目标染色体的平均比例,meanj=∑ratiolj/j,ratiolj为所述对比组中第j条目标染色体的比例,∑ratiolj为对比组中的j条目标染色体的比例的和值。

本发明实施例中,获取修正量δr后,可以使用修正量对样本组内的目标染色体的比例进行修正。

在具体实施中,可以由以下公式对样本组内目标染色体的比例ratioln进行修正:

ratio’ln=ratioln-δr,(5)

其中,ratio’ln为修正后的样本组内目标染色体的比例。

在具体实施中,在对样本组的目标染色体进行修正后,可以修正样本组内正常孕妇的目标染色体比例与参照组内正常孕妇的目标染色体比例之间的偏差值,使得偏差值在正常范围内,进而使得样本组内的正常孕妇的胎儿不会被检测出患有三体综合征。

本发明实施例中,在获取修正后的样本组内目标染色体的比例ratio’ln后,可以使用以下z检验公式根据ratio’ln重新检测样本组内目标染色体是否正常:

(ratio’ln-meank)/sdk,(6)

当(ratio’ln-meank)/sdk<3时,则所述样本组内第n条目标染色体为正常。

参阅图2,本发明还提供一种染色体比例的修正装置20,包括:

第一判断单元201,用于根据预设的参照组内的目标染色体数据,判断样本组内的目标染色体是否正常;

对比单元202,用于将所述样本组内正常的目标染色体数据形成对比组;

差异单元203,用于获取所述参照组内目标染色体的比例与所述对比组内的目标染色体的比例之间的差异值;

第二判断单元204,用于根据预设的阈值以及所述差异值判断是否对样本组内的目标染色体的比例进行修正;

修正单元205,用于当确定对所述样本组内的目标染色体的比例进行修正时,根据所述参照组内的目标染色体的平均比例与所述对比组内的目标染色体的平均比例得到修正量,使用所述修正量对所述样本组内的目标染色体的比例进行修正。

本发明实施例中,所述第一判断单元201,用于获取所述参照组内正常的目标染色体的平均比例;获取所述样本组内各个目标染色体的比例;根据所述参照组内目标染色体的平均比例判断所述样本组内目标染色体的比例是否正常。

本发明实施例中,所述第一判断单元201,用于使用以下公式计算所述参照组内目标染色体的平均比例meank:

ratiokm=ri/rc,

meank=∑ratiokm/m;

其中,ri为参照组内第m条正常的目标染色体上片段的数目,rc为所述第m条正常的目标染色体对应的所有常染色体上片段的数目,ratiokm为所述第m条目标染色体的比例,m为所述参照组内正常的目标染色体的条数,∑ratiokm为参照组内m条正常的目标染色体的比例的和,1≤m≤m。

本发明实施例中,所述第一判断单元201,用于当(ratioln-meank)/sdk<3时,判定所述样本组内第n条目标染色体为正常;其中,ratioln为所述样本组内第n条目标染色体的比例,1≤n≤n,n为所述样本组内的目标染色体的数目,sdk为所述参照组内m条正常的目标染色体的比例的标准差。

本发明实施例中,所述差异单元203,用于将所述参照组中正常的m条目标染色体的比例作为第一组;将所述对比组中的j条目标染色体的比例作为第二组,j为所述对比组中目标染色体的数目;1≤j≤n;对所述第一组与第二组进行假设检验,计算所述第一组与第二组之间没有差异值的概率。

本发明实施例中,所述第二判断单元204,用于若所述第一组与第二组之间没有差异值的概率小于等于预设的阈值,则判定对样本组内目标染色体的比例进行修正。

本发明实施例中,所述修正单元205,用于由以下公式计算所述对比组内目标染色体的平均比例meanj:

meanj=∑ratiolj/j,

其中,ratiolj为所述对比组中第j条目标染色体的比例,∑ratiolj为对比组中的j条目标染色体的比例的和值;

由以下公式计算所述修正量δr:

δr=meanj-meank,

由以下公式对样本组内目标染色体的比例进行修正:

ratio’ln=ratioln-δr,

其中,ratio’ln为修正后的样本组内目标染色体的比例。

本发明实施例中,所述修正单元205,还用于使用以下公式判断所述样本组内目标染色体是否正常:当(ratio’ln-meank)/sdk<3时,判定所述样本组内第n条目标染色体为正常。

本发明还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种的染色体比例的修正方法的步骤。

本发明还提供一种染色体比例的修正装置,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时所述处理器执行上述任一种的染色体比例的修正方法的步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指示相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1