基于信号谱差异的混合样本单核苷酸多态性的检测方法与流程

文档序号:12167854阅读:来源:国知局

技术特征:

1.一种基于信号谱差异的混合样本单核苷酸多态性的检测方法,其特征在于:包括以下步骤:

第一步:提取野生型样本的DNA和混合样本的DNA,进行聚合酶链式反应,得到单链PCR产物,其中,混合样本包括野生型序列和突变型序列;

第二步:对野生型样本和混合样本的单链PCR产物进行三轮循环的实时合成测序,获得三组信号谱;

第三步:根据三轮测序实验获得的野生型样本与混合样本的信号谱,计算野生型样本与混合样本的信号谱之间的差异,利用枚举方法推断混合样本中可能存在的单核苷酸多态性位点;

第四步:综合分析三轮测序实验所检测出的可能的单核苷酸多态性位点,进行一致性判断,判断混合样本中是否存在单核苷酸多态性位点,如果混合样本中含有单核苷酸多态性位点,则归纳出单核苷酸多态性位点的位置、突变核苷酸及突变核苷酸的比例。

2.根据权利要求1所述的基于信号谱差异的混合样本单核苷酸多态性的检测方法,其特征在于:利用枚举方法推断混合样本中可能存在的单核苷酸多态性位点的步骤如下:

(1)定义每轮测序实验获得野生型样本的信号谱为W=(W1,W2,…,Wn),其中,Wi为野生型样本第i次添加两核苷酸时的信号强度;混合样本的测序信号谱为P=(P1,P2,…,Pn),其中,Pi为混合样本第i次添加两核苷酸时的信号强度;

(2)定义突变型序列的信号谱为M=(M1,M2,…,Mn),其中,突变序列的比例为a,则P=(1-a)W+aM;

(3)实际测序试验中,Wi、Pi服从正态分布:其中,CV为信号强度的变异系数,为信号强度的理论值;

(4)定义差别谱D为混合样本的信号谱P与野生型样本的信号谱W之差,即D=P-W,则结合步骤(2)可得D=a(M-W),枚举野生型序列与突变型序列信号谱之间的差别,计算混合样本中突变序列的比例a;

(5)结合步骤(3)和(4)可得定义Sp来评估所枚举的野生型序列与突变型序列信号谱之间每种差别的可能性,且选择最大Sp值时的差别谱作为野生型序列与突变型序列信号谱之间的差别谱,其中:

<mrow> <msub> <mi>S</mi> <mi>p</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>-</mo> <mrow> <mo>(</mo> <msub> <mover> <mi>P</mi> <mo>&OverBar;</mo> </mover> <mi>j</mi> </msub> <mo>-</mo> <msub> <mover> <mi>W</mi> <mo>&OverBar;</mo> </mover> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <msqrt> <mrow> <mo>(</mo> <msubsup> <mover> <mi>P</mi> <mo>&OverBar;</mo> </mover> <mi>j</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mover> <mi>W</mi> <mo>&OverBar;</mo> </mover> <mi>j</mi> <mn>2</mn> </msubsup> <mo>)</mo> <msup> <mi>CV</mi> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> </mrow>

(6)野生型序列与突变型序列信号谱之间存在五种差别类型:Type-0、Type-1、Type-2、Type-3和Type-4,假设野生型序列与突变型序列之间的不一致延伸发生在第j步循环测序反应过程,定义S为第j步循环测序反应中一致延伸的核苷酸个数,定义函数f(Wj)为根据信号强度Wj计算的延伸核苷酸的个数,可以得出S的表达式和单核苷酸多态性位点的位置L的表达式分别为:

<mrow> <mi>S</mi> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>T</mi> <mi>y</mi> <mi>p</mi> <mi>e</mi> <mo>-</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>T</mi> <mi>y</mi> <mi>p</mi> <mi>e</mi> <mo>-</mo> <mn>2</mn> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <mi>T</mi> <mi>y</mi> <mi>p</mi> <mi>e</mi> <mo>-</mo> <mn>3</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>/</mo> <mover> <mi>a</mi> <mo>^</mo> </mover> </mrow> </mtd> <mtd> <mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>T</mi> <mi>y</mi> <mi>p</mi> <mi>e</mi> <mo>-</mo> <mn>4</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

<mrow> <mi>L</mi> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>S</mi> <mo>+</mo> <mn>1</mn> </mrow>

其中,为突变序列的比例的平均值;

(7)结合步骤(6)检测出的单核苷酸多态性位点的位置L和加入的两核苷酸信息得到突变核苷酸的信息。

3.根据权利要求2所述的基于信号谱差异的混合样本单核苷酸多态性的检测方法,其特征在于:综合分析进行一致性判断的步骤如下:

(1)定义Sc来评价野生型样本的信号谱与混合样本的信号谱之间的一致性,同时定义Sm=Sc-Sp;当突变序列存在时,Sc的值大于Sp,突变序列的比例越高,Sm的值越大;其中:

<mrow> <msub> <mi>S</mi> <mi>c</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <msqrt> <mrow> <msubsup> <mi>P</mi> <mi>j</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>W</mi> <mi>j</mi> <mn>2</mn> </msubsup> </mrow> </msqrt> </mfrac> </mrow>

(2)根据三轮测序实验结果,定义具有最低Sm值的一轮测序实验中的野生型序列与突变型序列的信号谱完全一致,即野生型序列与突变型序列信号谱之间的差别类型为Type-0;

(3)根据另两轮测序实验确定的核苷酸突变位置和突变核苷酸信息是否一致来确定单核苷酸多态性;如果两次推断出的单核苷酸多态性位点的位置一致,则判定混合样本中包含有突变序列,并以两次计算的突变序列比例的平均值作为突变比例的比;根据两次推断出的可能的突变核苷酸的集合,取其交集作为检测出的突变核苷酸;如果两次推断出的单核苷酸多态性位点的位置不一致,则判定混合样本中不包含单核苷酸多态性。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1