通过无方程算法判定实时pcr拐点的制作方法

文档序号:575253阅读:166来源:国知局

专利名称::通过无方程算法判定实时pcr拐点的制作方法通过无方程算法判定实时PCR拐点
背景技术
:本发明总体上涉及处理表示S型曲线或增长曲线的数据的系统和方法,更具体而言涉及测定聚合酶链式反应(PCR)扩增曲线中的特征性循环阈(Ct)值或拐点值或其他增长曲线中拐点值的系统和方法。聚合酶链式反应为酶法合成或扩增确定核酸序列的体外方法。该方法通常使用两个寡聚核苷酸引物,其可与相反链杂交并侧接待扩增的模板或靶DNA序列。引物的延伸由热稳定DNA聚合酶催化。涉及模板变性、引物复性以及复性引物在聚合酶作用下的延伸的重复系列循环得到特异DNA片段的指数积累。在该方法中通常使用荧光探针或标记物辅助检测和定量扩增过程。典型的实时-PCR曲线显示于图l,其中对典型的PCR过程用荧光强度值对循环数作图。在这一情况下,在PCR过程的各个循环监测PCR产物的形成。通常在热循环仪中测定扩增,该热循环仪包括用于测定扩增反应中荧光信号的组件和装置。该类热循环仪的实例为RocheDiagnosticsLightCycler(目录编号20110468)。例如可用荧光标记的杂交探针(只有当它们与靶核酸结合时才会发射荧光信号)或在某些情况下使用与双链DNA结合的荧光染料检测扩增产物。对于典型的PCR曲线,鉴定通常被称作拐点值或循环阈(Ct)值的基线区末端转变点对于了解PCR扩增过程的特性是非常有用的。Ct值可用作PCR方法有效性的量度标准。举例而言,通常测定所有待分析反应的确定信号阈值并且测定靶核酸以及参比核酸例如标准基因或管家基因达到该阈值需要的循环数(Ct)。可基于所获得靶核酸和参比核酸的Ct值测定耙核酸的绝对或相对拷贝数(Gibson等,GenomeResearch6:995-1001;Bieche等,CancerResearch59:2759-2765,1999;WO97/46707;WO97/46712;WO97/46714)。图1中基线区15末端的区20中的拐点值在循环数38区域内。可使用若干现有方法测定PCR曲线的拐点值。举例而言,许多现有方法将拐点的实际数值测定为荧光达到被称作AFL(任意荧光值)的预定水平的值。其他方法使用基于方程的方法测定具有典型双S型曲线的PCR拐点。已证明非常有助于描述S型的方程为双S型方程。已引入了双S型方程的许多实施和处理,例如DSLM(双S型Levenberg-Marquardt)方程、具有基线减法(BLS)、基线除法(BLD)以及基线减法和除法(BLSD)选项的DSML、曲率方程和下列所述的其他方法美国申请序列号11/316,315,2005年12月20日递交;美国申请序列号11/349,550,2006年2月6日递交;美国申请序列号11/458644,2006年7月19日递交;美国申请序列号11/533,291,2006年9月19日递交;以及美国专利申请序列号11/861,188,2007年9月25日递交。然而,如果PCR曲线的几何形状不符合典型的双S型,那么就不再适用基于双S型的方法,因此需要更通用的方法获得拐点或Ct值。因此需要提供可克服上述和其他问题的测定增长曲线尤其是PCR曲线中的拐点值的系统和方法。发明概述本发明提供测定S型或增长曲线转变值,例如PCR扩增曲线的基线区末端或拐点值或Ct值的系统和方法。为了满足测定PCR拐点值例如实时PCR拐点值的通用但强效的方法的需要,许多实施方案利用数据的最大值(例如,曲率、相对曲率、二阶导数或相对二阶导数的最大值)的位置寻找拐点值。这些数值的测定并不需要方程本身,但是使用数值方法。然而许多实施方案使用高斯混合模型,其要求方程与数据拟合从而测定分数拐点值。根据本发明的一方面,提供了计算机实施方法用于测定增长曲线基线区的末端的点。该方法通常包括接收表示增长曲线的数据集(该数据集包括多个数据点,各自具有一对坐标值),数值上测定沿增长曲线的数据点的二阶导数值并测定所测定二阶导数值的最大值。该方法也通常包括计算能拟合已测定二阶导数值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件,并输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。在某些方面,该数据集表示动态聚合酶链式反应(PCR)过程的增长曲线并且其中基线区末端的点表示增长曲线的拐点或循环阈(Ct)值。在某些方面,该方法进一步包括显示所述第一参数值。在某些方面,该回归过程包括Levenberg-Marquardt(LM)回归过程。在某些方面,使用第二最大值作为第二参数的初始条件并且该方法进一步包括输出第二参数。在某些方面该高斯混合模型包括表达式gmm!=£icp(—a)£bcp、2、x-M,其中h为第一参数,其中^和h为附加参数。在某些方面该方法进一步包括测定该曲线是否显示真正的增长,其方式为计算DeltaB统计值,其中'max|线性(x,.)-y,.l-如果m22和中值y,.>0.001.5中,W0否则根据本发明的另一方面,提供了计算机实施方法以测定增长曲线基线区末端的点。该方法通常包括接收表示增长曲线的数据集(该数据集包括多个数据点,各自具有一对坐标值),数值上测定沿增长曲线的数据点的曲率值并测定所测定曲率值的最大值。该方法也通常包括计算能拟合已测定曲率值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件,并输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。在某些方面,该数据集表示动态聚合酶链式反应(PCR)过程的增长曲线,其中基线区末端的点表示增长曲线的拐点或循环阈(Ct)值。在某些方面,该方法进一步包括显示第一参数。在某些方面,该回归过程包括Levenberg-Marquardt(LM)回归过程。在某些方面,使用第二最大值最作为第二参数的初始条件并且该方法进一步包括输出第二参数。在某些方面,该高斯混合模型包括表达式<formula>formulaseeoriginaldocumentpage6</formula>其中^为第一参数,其中^和h为附加在某些在另一方面该方法进一步包括修饰数据集以使所测定曲率值为比例不变方面,该方法进一步包括测定该曲线是否显示真正的增长,其方式为计算DeltaB统计值,射<formula>formulaseeoriginaldocumentpage7</formula>中值如果m22和中值|y,|>0.001<formula>formulaseeoriginaldocumentpage7</formula>0否则另一方面本方法进一步包括数值上测定沿增长曲线的数据点的二阶导数值;测定所测定二阶导数值的最大值;计算能拟合已测定二阶导数值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第二参数的初始条件;并输出第二参数,其中所测定的第二参数表示增长曲线的所述基线区末端。根据本发明另一方面,提供计算机可读介质,其包括用于控制处理器以测定增长曲线基线区末端点的编码。该编码通常包括接收表示增长曲线的数据集的指令(该数据集包括多个数据点,各自具有一对坐标值)以数值上测定沿增长曲线的数据点的二阶导数值并测定所测定二阶导数值的最大值。该编码也通常包括计算能拟合测定二阶导数值的曲线近似值的指令,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件,并输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。在某些方面,该数据集表示动态聚合酶链式反应(PCR)过程的增长曲线并且基线区末端的点表示增长曲线的拐点或循环阈(Ct)值。在某些方面,该回归过程包括Levenberg-Marquardt(LM)回归过程。在某些方面,将第二最大值用作第二参数的初始条件并且该编码进一步包括输出第二参数的指令。在某些方面,该编码进一步包括显示Ct值的指令。在某些方面坐标值对表示已扩增多聚核苷酸的积累和循环数。在某些方面,高斯混合模型包括表达式<formula>formulaseeoriginaldocumentpage7</formula>,其中P工为第一参数,并且其中&和o工为附加参数。在某些方面该方法进一步包括测定该曲线是否显示真正的增长,其方式为计算DeltaB统计值,其中<formula>formulaseeoriginaldocumentpage7</formula>:如果m^2和.f值,y,>0.001<formula>formulaseeoriginaldocumentpage7</formula>根据本发明另一方面,提供计算机可读介质,其包括用于控制处理器以测定增长曲线基线区末端点的编码。该编码通常包括接收表示增长曲线的数据集的指令(该数据集包括多个数据点,各自具有一对坐标值)以数值上测定沿增长曲线的数据点的曲率值并测定所测定曲率值的最大值。该编码也通常包括计算能拟合已测曲率值的曲线近似值的指令,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件,输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。在某些方面,该数据集表示动态聚合酶链式反应(PCR)过程的增长曲线并且其中基线区末端的点表示增长曲线的拐点或循环阈(Ct)值。在某些方面,该回归过程包括Levenberg-Marquardt(LM)回归过程。在某些方面,使用第二最大值作为第二参数的初始条件并且该编码进一步包括输出第二参数的指令。在某些方面该编码进一步包括显示Ct值的指令。在某些方面坐标值对表示已扩增多聚核苷酸的积累和循环数。在某些方面,高斯混合模型包括表达式<formula>formulaseeoriginaldocumentpage8</formula>,其中Pi为第一参数,并且其中&和o工为附加参数。在某些方面,该方法进-DeltaB统计值,其中-步包括测定该曲线是否显示真正的增长,其方式为计算<formula>formulaseeoriginaldocumentpage8</formula>如果mS2和._值,|y,'|>0.001中值|y,.|'■'"'-/'=5..附-10否则根据本发明的另一方面,提供动态聚合酶链式反应(PCR)系统。该系统通常包括动态PCR分析模块,其可生成表示动态PCR扩增曲线的PCR数据集。该数据集通常包括多个数据点,各自具有一对坐标值,其中所述数据集包括含有循环阈(Ct)值的所关注区域内的数据点。该系统也通常包括适合于处理PCR数据集以测定Ct值的智能模块,其方式为数值上测定沿PCR曲线的数据点的二阶导数值,测定所测定二阶导数值的最大值并计算能拟合已测定二阶导数值的曲线近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件。该智能模块也通常适合于输出第一参数,其中所测定的第一参数表示Ct值。在某些方面,该动态PCR分析模块位于动态热循环装置中,并且该智能模块包括与分析模块通信偶合的处理器。在某些方面,该智能模块包括位于计算机系统中的处理器,其经网络连接或直接连接之一与分析模块偶合。在某些方面,该回归过程包括Levenberg-Marquardt(LM)回归过程。在某些方面,该系统进一步包括显示模块,例如监控器、打印机或其他可显示文字和/或图象数据的装置,其中输出包括在显示模块上显示Ct值。在某些方面,第二最大值被用作第二参数的初始条件,并且智能模块可进一步输出第二在某些方面,高斯混合模型包括表达式<formula>formulaseeoriginaldocumentpage8</formula>,其中P工为第一参数,并且其中&和o工为附加参数。在某些方面该方法进一步包括测定该曲线是否显示真正的增长,其方式为计算DeltaB统计值,其中<formula>formulaseeoriginaldocumentpage8</formula>中值如果m》2和.f值,y」>0.001<formula>formulaseeoriginaldocumentpage8</formula>根据本发明的另一方面提供动态聚合酶链式反应(PCR)系统。该系统通常包括动态PCR分析模块,其可生成表示动态PCR扩增曲线的PCR数据集。该数据集通常包括多个数据点,各自具有一对坐标值,其中所述数据集包括含有循环阈(Ct)值的所关注区域内的数据点。该系统也通常包括适合于处理PCR数据集以测定Ct值的智能模块,其方式为数值上测定沿PCR曲线的数据点的曲率值,测定所测定曲率值的最大值并计算能拟合所测定曲率值的曲线近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件。该智能模块也通常适合于输出第一参数,其中所测定的第一参数表示Ct值。在某些方面,该动态PCR分析模块位于动态热循环装置中,并且该智能模块包括与分析模块通信偶合的处理器。在某些方面,该智能模块包括位于计算机系统中的处理器,其经网络连接或直接连接之一与分析模块偶合。在某些方面,该回归过程包括Levenberg-Marquardt(LM)回归过程。在某些方面,该系统进一步包括显示模块,例如监控器、打印机或其他可显示文字和/或图象数据的装置,其中输出包括在显示模块上显示Ct值。在某些方面中,第二最大值被用作第二参数的初始条件,并且智能模块可进一步输出第二参数。在某些方面,高斯混合模型包括表达式广./<formula>formulaseeoriginaldocumentpage9</formula>义—A,其中Pi为第一参数,并且其中&和oi为附加参数。在某些方面该方法进一步包括测定该曲线是否显示真正的增长,其方式为计算DeltaB统计值,其中maxI线性(x,)—y,如果m22和|y,|>0.001值,W0否则参考本说明书其余部分(包括图例和权利要求)将进一步认识到本发明的其他特点和优势。本发明的其他特点和优势以及本发明许多实施方案的结构和操作结合附图详细描述于下文。在附图中,相似的参考编码表示相同或功能相似的元件。附图简述图1显示了典型PCR增长曲线的实例,以荧光强度对循环数作图。图2显示了图1中实时PCR曲线的二阶导数。图3显示了图1中实时PCR曲线的曲率。图4显示了根据一个实施方案测定S型曲线转换值,例如动态PCR扩增曲线的拐点值或Ct值的方法。图5显示了具有多个Ct值的实时PCR曲线的实例。图6显示了图5中实时PCR曲线的二阶导数。图7显示了图5中实时PCR曲线的曲率。图8显示了PCR数据曲线平台区荧光衰减的实例。图9显示了根据一个实施方案的衰减检测工作流程图。图10显示了用于区分曲线的真正增长与平线的五个检测。图11显示了根据一个实施方案测定增长曲线Ct值的方法。图12显示了根据一个实施方案的Ct寻找常规程序的处理步骤。图13显示了在一个实施方案中执行的专家系统检查。图14显示了具有两个拐点的典型实时PCR曲线的实例。图15为显示用于实施本发明方法和系统的软件和硬件资源之间关系的总体块状图的实例。图16为显示热循环装置和计算机系统之间关系的总体块状图的实例。发明详述本发明提供测定S型或增长曲线的转换值,例如PCR扩增曲线的基线区末端或拐点值或Ct值的系统和方法。在某些方面,进行PCR数据集的二阶导数和曲率值的数值测定。使用具有经Levenberg-Marquardt(LM)回归过程测定的参数的高斯混合模型(G匪)函数寻找二阶导数和曲率曲线的近似值。数值上测定的二阶导数值和/或曲率值的最大值用作G匪函数参数的初始条件。所测定的参数提供分数Ct值。接着报告Ct值并可将其显示或用于进一步处理。PCR过程背景下的增长或扩增曲线10的实例显示于图1。如图所示,曲线IO包括延迟期区15以及指数期区25。延迟期区15通常被称作基线或基线区。该曲线10包括连接延迟期和指数期区域的所关注转换区20。区20通常称作拐点或拐点区。拐点区通常限定基线的末端和底层过程(underlyingprocess)的增长或扩增速率的转变。鉴定区20中的特定转变点可用于分析底层过程的行为。在典型的PCR曲线中,鉴定被称作拐点值或循环阈(Ct)值的转变点可用于了解PCR过程的定性和定量特点。例如,Ct值可用于提供对所分析样品中存在的DNA量的定量。通过绘制Log(DNA量)比Ct值的校准曲线进行定量。之后的样品可接着使用Ct值沿着校准曲线直接获得样品中DNA的估计值。Ct值也可用于提供对DNA样品的定性信息。其他可提供相似S型或增长曲线的过程包括细菌过程、酶反应过程和结合过程。例如在细菌生长曲线中所关注的转变点被称作延迟期的时间,A。可产生可根据本发明分析的数据曲线的其他特定过程包括链置换扩增(SDA)过程、核酸序列为基础的扩增(NASBA)过程以及转录介导扩增(TMA)过程。SDA和NASBA过程的实例以及数据曲线可分另U参见Wang,Sha-Sha等,〃HomogeneousReal-TimeDetectionofSingle-NucleotidePolymorphismsbyStrandDisplacementAmplificationontheBDProbeTecETSystem,〃ClinChem200349(10):1599,和Weusten,JosJ.A.M.等,〃PrinciplesofQuantitationofViralLoadsUsingNucleicAcidSequence—BasedAmplificationinCombinationWithHomogeneousDetectionUsingMolecularBeacons,〃NucleicAcidsResearch,200230(6):26。因此,尽管本文件的其余部分将就PCR曲线的适用性讨论本发明的实施方案和各方面,应理解的是本发明可应用于和其他过程相关的数据曲线。如图l所示,典型PCR增长曲线的数据可以二维坐标系统表示,例如,PCR循环数定义x-轴,积累的多聚核苷酸增长的指示物定义y_轴。通常已积累增长的指示物为荧光强度值,因为使用荧光标记可能是最广泛使用的标记方法。然而,应理解的是也可使用其他指示物,取决于所使用的具体标记和/或检测方案。累积信号增长的其他可用指示物的实例包括发光强度、化学发光强度、生物发光强度、磷光强度、电荷转移、电压、电流、功率、能量、温度、粘度、光散射、放射强度、反射率、透光率和吸光度。循环的定义也可包括时间、过程循环、单位操作循环和再生循环。总体过程概述考虑如图1显示的典型实时PCR增长。需要从图1中获得称作Ct或拐点值的数值。根据一个实施方案,可参考图4简要描述测定S型曲线转变值(例如动态PCR扩增曲线的拐点值或Ct值)的方法100。在步骤110中,接收或其他方式获取表示曲线的实验数据集。已作图的PCR数据集的实例显示于图l,其中y-轴和x-轴分别表示荧光强度和循环数。在某些方面,该数据集应包括沿数轴的连续并等间距的数据。在用位于PCR数据获取装置例如热循环仪中的智能模块(例如处理器执行指令)实施方法100的情况下,可在收集数据时实时向智能模块提供数据集,或者可将其储存在存储单元或缓冲区中并在试验完成后提供给智能模块。相似地,数据集可提供给分离系统例如台式计算机系统或其他计算机系统,经网络连接(例如LAN、VPN、内部网、因特网等)或直接连接(例如USB或其他直接有线或无线连接)至获取装置,或提供于携带式介质,例如CD、DVD、软盘等上。在某些方面,该数据集包括具有坐标数值对的数据点(或2-维向量)。对于PCR数据,坐标数值对通常表示循环数和荧光强度值。在步骤110中接收或获取数据集后可分析数据集以测定基线区末端。在步骤120中,对数据进行数字处理以测定导数值和曲率值。通过寻找对应于二阶导数最大值(y_轴)或曲率最大值(y_轴)的(分数)循环数(x-轴)获得这些曲线的Ct或"拐点值"。使用图1显示的数据,二阶导数和曲率的对应图片显示于图2和图3中。在一个实施方案中,通过使用Savitzky-Golay(SG)法获得导数[参见A.Savitzky禾口MarcelJ.E.Golay(1964).SmoothingandDifferentiationofDatabySimplifiedLeastSquaresProcedures.AnalyticalChemistry,36:1627-1639禾口Press,W.H.等,"NumericalRecipesinC,第2片反.,〃Savitzky-GolaySmoothingFilters,Section14.8,650-655]。使用SG_4_4_2设置(意指向左4个点,向右四个点,以及二次多项式)计算一阶和二阶导数。通过以下方程l所示的公式获得曲率。在这一公式中,x表示循环数,y表示荧光值,并且kappa(k)表示曲率。<formula>formulaseeoriginaldocumentpage11</formula>曲率的比例不变量形式(相对曲率)在一些实施方案中,可使用其他方法计算曲率使得结果为比例不变量。比例不变量意指,如果荧光值乘以一个常数,所得Ct值不变。根据一种方法,在计算方程(1)显示的曲率之前用荧光值除以平均荧光值。因此,方程(1)中不使用y,y被yAwn替换,其中少,-士1^根据另一种方法,在计算方程(1)显示的曲率之前用荧光值除以从基线至平台的PCR曲线增长或(最大荧光_最小荧光)。因此,方程(1)中不使用y,y现在被y/AFI替换,其中AFI=中值(最后五个点)-中值(前五个点),或被y/growth替换,其中growth=(最大荧光_最小荧光)。二阶导数的无因次形式(相对二阶导数)除了直接测定二阶导数^f,可通过寻找函数i^的最大值使用二阶导数的无血2少&因次(y中)形式。然而当实时PCR数据不具有典型的双S型时无方程(Equation-Less)法是最有利的。这样的实时PCR曲线显示于图5。具有这一形状的曲线不易用任何分析表达式描述。这一特殊的曲线具有多个拐点和多个Ct值。对应于图5的二阶导数和曲率图显示于图6和图7中。如前文所述,通过测定对应于二阶导数和曲率最大值(如这两幅图所示)的循环数获得Ct值。图5显示的曲线产生两个Ct值。回到图4,在一个实施方案中,在步骤130中测定分数Ct值。为了寻找曲线的最大值,如图2和3以及图6和7所示,在一个实施方案中,将高斯混合模型与该数据拟合。高斯混合模型的平均值对应于最大值,因此为Ct值。在一个实施方案中,通过计算拟合所测定二阶导数值和/或拟合所测定曲率值的曲线近似值计算曲线拟合,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数。在某些方面,使用Levenberg-Marquardt回归过程。在一个实施方案中,对于单峰而言,如方程(2)所示使用一个峰的高斯混合模型。如果存在两个峰,如方程(3)所示使用两个峰的高斯混合模型。系数ii工或(iipii2)的回归值分别对应于一个或两个峰的Ct值。在一个实施方案中使用高斯混合模型,而不采用附加导数寻找最大值,因为更高级的倒数(三阶或四阶)会变得不稳<formula>formulaseeoriginaldocumentpage12</formula>应理解的是本领域技术人员显而易见可使用其他模型/函数而不是高斯混合模型。其他模型的实例包括Bete、Binomial、C塞hy、Chi、ChiSqimre、Exponential、ExtremeValue、FRatio、Gamma、Gumbel、Laplace、Logistic、Maxwell、Pareto、Rayleigh、StudentT和Weibull模型。在一个实施方案中使用Levenberg-Marquardt(LM)方法曲线拟合方程(2)或方程(3)。这一方法的细节可见参考文献[Mor6,J.J.,"TheLevenberg-MarquardtAlgorithm,ImplementationandTheory,"NumericalAnalysis编车茸,Watson,G.A丄ectureNotesinMathematics630,Springer-Verlag,1977]。应理解的是可使用其他熟知的回归方法。一般而言,LM回归法包括需要多种输入并提供输出的算法。在一方面,输入包括待处理的数据集、用于拟合数据的函数(例如高斯混合模型)以及函数的参数或变量的初始估计值。输出包括用于最小化函数和数据集之间距离的一个或多个函数参数的集合。应理解的是可使用本领域技术人员显而易见的其他回归过程。Levenberg-Marquardt方法的一个特点为其要求在进行回归之前对参数值的良好估计。对于参数A(或^,a》和h(或0l,02),在所有情况下可将初始条件设置成等于某一常数(例如1或2)。这些参数通常是不灵敏的并且一般将会聚,与所使用的初始条件无关。参数yj或UpP2)要求应对各曲线测定的更准确的初始条件。在一个实施方案中,使用窗口法计算参数yj或i^,P2)的初始条件,如下文详述。在步骤135中,报告Ct值,例如用于显示或进一步处理。图形显示可由显示装置实现,例如监视屏或打印机,与执行图4分析的系统偶联或可将数据提供给单独的系统用于显示在显示装置上。在一些实施方案中,计算GM^和GMM2参数的R2统计值和/或置信度(例如,95%置信度)区间。这些数值评价曲线拟合的质量并可用于专家系统(描述于下文)中帮助测定所计算的Ct值是否为有效、无效或零(无样品)。这些数值也显示于步骤135中。测定曲线中的最大值在一个实施方案中,在数据集上使用开窗过程以测定参数PpP2的初始条件。为了寻找曲率或二阶导数的最大值,所有负值均以零代替。在一个实施方案中,开窗过程使用以下操作寻找潜在的局部最大值1.从第一个点开始,检测数据集前面若干个(例如五个)点(点1-5)。2.如果中间的y-点不是这五个点中的最大值,那么这五个点中没有潜在最大值。如果中间的y-点是这五个点的最大值并且其值大于O(以避免将具有精确数值O的点的更长序列的中间点加入潜在最大值的集合中),那么存在潜在最大值。将这一点加入潜在最大S的集合中。3.将滑动窗口前进一个点(例如,现在为点2-6),并且重复项目2中的过程,再次仅接受这五个点在指数3的最大值。在整个数据集中继续这一过程。4.如果倒数第二个点的y-值比之前两个点和最后一个点的y-值更高或相等,将这一点加入潜在最大值S集合中。5.检测所得可能最大值的集合S,其表示在指数3的可能最大值的集合,并寻找这一可能最大值S集合(Smax)中的最大值数据点。6.如果Smax等于或小于MaxNoise输入参数(使用者可能输入的或自动检测到的噪音参数),则曲率数据中没有峰值。7.保留这一集合S中其余的可能最大数据点,前提是它们大于SmaxXRelativeMin输入参数并大于AbsoluteMin输入参数。8.如果只剩下一个数据点,那么仅有一个峰,并且该曲线仅具有一个最大值。将这一单峰定义为p、。如果剩下两个点,那么这表示曲线具有两个最大值。如果有多于两个峰,取具有数据集S的最大值的两个峰,将这两者中具有较低循环数的峰报告为P、,将具有较高循环数的峰报告为plv9.ii!的初始条件则为p、并且(iipii2)的初始条件为(p、,pk2)。衰减检测在一些数据中,可能存在平台区强度的衰减。在这些情况下常常需要对这一点做出解释以去除不利作用。举例而言,在图8中可见平台区荧光的衰减。这种平台的存在可引起Ct位移。为了提高准确度,在一个实施方案中,实施去除荧光强度数据衰减区段的自动方法。在某些方面,在计算二阶导数或曲率之前去除衰减平台区。根据一个实施方案的衰减检测工作流程显示于图9。在步骤910中,测定对应于最高荧光强度的循环数。在步骤920中,如果最高荧光强度不在最后三个循环中,评价后续循环(最高值之后)的荧光强度。如果最高荧光强度在最后三个循环中,不进行衰减修正。如果对应于最大荧光的循环之后的循环中的最低荧光强度小于最大荧光强度的95%,那么在步骤930中将二阶多项式与后续循环(最大值之后)中包含的荧光拟合。在步骤940中,测定数据中是否存在显著衰减。在一个实施方案中,如果最高荧光强度的点高于输入参数RV(相对值)的值,将二阶多项式的线性项与荧光强度最大值除以数据点数量的比值乘以常量阈值(例如,_5)后比较。如果线性项小于这一数值,表明存在显著衰减,那么在步骤950中截去对应于最高荧光强度的循环数之后循环的荧光数据;否则数据中不存在衰减并且无需任何处理。根据一个实施方案,使用二阶多项式拟合以测定衰减。在某些方面,可使用方程(4)进行拟合:<formula>formulaseeoriginaldocumentpage14</formula>在方程(4)中,k为对应于最大荧光强度的循环数。因此,如果方程(4)中的q值小于上述产物,那么有必要截去对应于最大荧光强度的循环之后的循环用于下游的准确非线性回归。如果检测出衰减并截去数据,那么荧光向量y、循环数向量x以及荧光向量的长度m对应于截去形式而不是原始的输入。忽略最后三个循环因为不可能拟合少于三个点的二次函数。区分增长与平线在一些数据中可能存在非显著的增长。在这些情况下常常需要解释这一情况以去除不利作用。根据一个实施方案,使用五个检测区分曲线的真正增长与平线,如图io所示。1.在完整或部分RT-PCR曲线上进行线性回归拟合。如果线性回归的R2>0.99,那么认为无增长。2.计算称作DeltaB(如下所示)的统计值,如果0<DeltaB<0.04,那么认为无增长。<formula>formulaseeoriginaldocumentpage14</formula>3.在任一完整RT-PCR曲线上进行二次回归拟合。如果这一二次回归的R2〉0.98,那么该RT-PCR曲线被测定为不具有增长曲线的足够曲率。4.如下计算称作RFI(相对荧光增加)的数值_中銜后5个点]中值[前5个点]在某些方面,在通过基线减法将RT-PCR曲线标准化后计算RFI。如果所测RFI小于输入RFImin值,那么该曲线被称为没有增长。5.如下计算称作AFI(相对荧光增加)的数值AFI=中值[后5个点]-中值[前5个点]在某些方面,在通过基线减法将RT-PCR曲线标准化后计算AFI。如果所测AFI小于输入AFImin值,那么该曲线被称为没有增长。应理解的是可使用一个或多个上文描述的五个检测和/或使用其他检测测定该曲线是否可被认为具有增长。应理解可使用不同的数值,例如,可不使用前五个点或后五个点而使用多于或少于5个点。算法工作流程图11显示了根据一个实施方案测定增长曲线中Ct值的方法。在步骤1110中,进行衰减检测。在这一步骤中,测定荧光衰减并在需要时截去荧光数据。上述参考图9讨论的操作可用于一个实施方案中。在步骤1120中,首先检测数据是否拟合直线,或是否存在可能的增长。如果存在可能增长,那么使用无方程(Equation-Less)模型,藉此计算二阶导数的导数(或相对导数)和曲率(或相对曲率)方程,例如使用Savitzky-Golay方法计算其数值。在步骤1130中,测定CT值。Ct值为PCR荧光模型的二阶导数(相对导数)或曲率(相对曲率)具有其最大值时的分数循环数。在一个实施方案中,通过如上文所述参考图4的一元或两元高斯混合模型的非线性回归以及方程(2)和(3)寻找分数循环数。根据一个实施方案的Ct寻找常规程序的处理步骤总结于图12。在步骤1140中,专家系统处理数据以提供用于降低风险的一系列检查。专家系统检查在一个实施方案中,如图13所示实施专家系统检查。在步骤1310中,该系统验证PCR增长曲线的截距是否在使用者指定的最小值和最大值之间。如果在这一范围之外,那么该曲线被称为是无效的。在一方面,该截距定义为前五个点的中值。在步骤1320中,该系统验证PCR增长曲线的斜率是否在使用者指定的最小值和最大值之间。如果在这一范围之外,那么该曲线被称为是无效的。除了斜率也可使用相对斜率,其中相对斜率=斜率/截距。以这种方式,斜率比较变成比例不变量。在步骤1330中,该系统验证PCR增长曲线的Ct值是否在使用者指定的最小值和最大值之间。如果这些条件任何一个都未被满足,标上旗标。之后这些曲线被称作无效或阴性。实施例图14显示了具有两个拐点的典型实时PCR曲线。顶曲线为原始数据,而底曲线为基线减法后的数据。用算法分析这一数据的二阶导数、相对二阶导数、曲率和相对曲率。分析结果显示于下文的表l。给出两个Ct值,对应于两个存在的拐点。表1:双拐点曲线的算法结果<table>tableseeoriginaldocumentpage16</column></row><table>应理解的是Ct测定过程(包括导数和曲率测定过程)可在运行于计算机系统处理器上的计算机编码中实施。该编码包括控制处理器实施Ct测定过程各方面和步骤的指令。该编码通常保存于硬盘、RAM或可携带介质例如CD、DVD等。相似的,可在PCR装置例如热循环仪中实施该过程,热循环仪包括保存于和处理器偶联的存储单元中的处理器执行指令。包括这些指令的编码可经网络连接或直接连接至编码源或使用可携带介质下载至PCR装置存储单元。本领域技术人员应理解本发明的拐点测定过程可使用多种程序语言编码,例如C、C++、C#、F0rtran、ViSualBasiC等,以及应用例如提供用于数据可视化和分析的预打包常规程序、函数和操作的Mathematics后者的另一个实例为MATLAB⑧。在一些实施方案中根据本发明的方法可通过使用常规个人电脑系统实施,其包括但不限于输入数据集的输入装置,例如键盘、鼠标等;显示曲线区域所关注具体点的显示装置,例如监视器;执行方法中各步骤必需的处理装置,例如CPU;网络界面例如调制解调器、存储数据集的数据存储装置,在处理器上运行的计算机编码等。此外,该方法也可在PCR处理器或PCR系统中实施。根据本发明的系统的实例显示于图15-16。图15显示了解释可用于实施本发明方法和系统的软件和硬件资源之间关系的总体块状图。图16描述的系统包括位于热循环装置中的动态PCR分析模块和作为计算机系统一部分的智能模块。数据集(PCR数据集)经网络连接或直接连接从分析模块转移至智能模块或相反。例如可根据如图4、9、10、12和13尤其是图4、12和13描述的流程图处理数据集。这些流程图便于通过存储于计算机系统的硬件上的软件实施,例如根据图15中描述的流程图。就图15而言,计算机系统(200)可包括接收工具(210),例如用于接收在PCR反应中获得的荧光数据;计算工具(220),用于根据本发明方法处理所述数据;应用工具(230),用于根据计算工具获得的结果替换一部分所述数据;以及显示工具(240),用于在计算机显示器上显示结果。图16显示了热循环装置和计算机系统之间的相互关系。该系统包括位于热循环装置中的动态PCR分析模块以及作为计算机系统一部分的智能模块。数据集(PCR数据集)经网络连接或直接连接从分析模块转移至智能模块或相反。可根据图15通过在处理器上运行并储存于智能模块的存储装置中的计算机编码处理该数据集并且处理之后转移回分析模块的存储装置中,其中经修饰的数据显示于显示装置上。如上所述,本发明系统和方法可用于去除聚合酶链式反应数据中的步骤不连续性。举例而言,当用荧光数据监测聚合酶链式反应时,本发明系统和方法可提供更准确的数据。这些数据不仅可用于监测该反应也可提供技术作用例如定量PCR期间被扩增的靶核苷酸或根据所得数据调节PCR反应条件。尽管以实施例和具体的实施方案的方式描述了本发明,应理解的是本发明不受已公开实施方案的限制。相反,其意在涵盖本领域技术人员显而易见的修改和相似排列。因此,附加权利要求的范围应与最宽泛的解释一致以涵盖所有这些修改和相似排列。权利要求一种测定增长曲线基线区末端的点的计算机实施方法,其包括以下步骤接收表示增长曲线的数据集,所述数据集包括多个数据点,各具有一对坐标值;数值上测定沿增长曲线的数据点的二阶导数值;测定所测定二阶导数值的最大值;计算拟合已测定二阶导数值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件;并且输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。2.权利要求1的方法,其中所述回归过程包括Levenberg-Marquardt(LM)回归过程。3.权利要求1至2中任一项的方法,其中所述第二最大值用作第二参数的初始条件,并且其中所述方法进一步包括输出第二参数。4.权利要求1至3中任一项的方法,其中所述高斯混合模型包括下列表达式<formula>formulaseeoriginaldocumentpage2</formula>其中yi为第一参数,并且其中ai和o工为附加参数。5.权利要求1至4中任一项的方法,其进一步包括通过计算DeltaB统计值测定所述曲线是否显示真正的增长,其中<formula>formulaseeoriginaldocumentpage2</formula>6.—种测定增长曲线基线区末端的点的计算机实施方法,其包括以下步骤接收表示增长曲线的数据集,所述数据集包括多个数据点,各具有一对坐标值;数值上测定沿增长曲线的数据点的曲率值;测定所测定曲率值的最大值;计算拟合已测定曲率值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件;并且输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。7.权利要求6的方法,其中所述回归过程包括Levenberg-Marquardt(LM)回归过程。8.权利要求6或7中任一项的方法,其中所述第二最大值用作第二参数的初始条件,并且其中所述方法进一步包括输出第二参数。9.权利要求6至8中任一项的方法,其中所述高斯混合模型包括下列表达式<formula>formulaseeoriginaldocumentpage2</formula>其中yi为第一参数,并且其中ai和o工为附加参数。10.权利要求6至9中任一项的方法,其进一步包括通过计算DeltaB统计值测定所述曲线是否显示真正的增长,其中<formula>formulaseeoriginaldocumentpage3</formula>如果m^2和.f值<formula>formulaseeoriginaldocumentpage3</formula>否则11.权利要求6至10中任一项的方法,其进一步包括数值上测定沿增长曲线的数据点的二阶导数值;测定所测定二阶导数值的最大值;计算拟合已测定二阶导数值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第二参数的初始条件;并且输出第二参数,其中所测定的第二参数表示所述增长曲线的基线区末端。12.—种计算机可读介质,其包括用于控制处理器以测定增长曲线基线区末端点的编码,所述编码包括以下指令接收表示增长曲线的数据集,所述数据集包括多个数据点,各自具有一对坐标值;数值上测定沿增长曲线的数据点的二阶导数值;测定所测定二阶导数值的最大值;计算拟合已测定二阶导数值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件;并且输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。13.—种计算机可读介质,包括用于控制处理器以测定增长曲线基线区末端点的编码,所述编码包括以下指令接收表示增长曲线的数据集,所述数据集包括多个数据点,各自具有一对坐标值;数值上测定沿增长曲线的数据点的曲率值;测定所测定曲率值的最大值;计算拟合已测定曲率值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件;并且输出第一参数,其中所测定的第一参数表示增长曲线的基线区末端。14.一种动态聚合酶链式反应(PCR)体系,其包括可生成表示动态PCR扩增曲线的PCR数据集的动态PCR分析模块,所述数据集包括多个数据点,各自具有一对坐标值,其中所述数据集包括含有循环阈(Ct)值的所关注区域中的数据点,以及适合于处理PCR数据集以测定Ct值的智能模块,其方式为数值上测定沿PCR曲线的数据点的二阶导数值;测定所测定二阶导数值的最大值;计算拟合已测定二阶导数值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件;并且输出第一参数,其中所测定的第一参数表示Ct值。15.—种动态聚合酶链式反应(PCR)体系,其包括可生成表示动态PCR扩增曲线的PCR数据集的动态PCR分析模块,所述数据集包括多个数据点,各自具有一对坐标值,其中所述数据集包括含有循环阈(Ct)值的所关注区域中的数据点,以及适合于处理PCR数据集以测定Ct值的智能模块,其方式为数值上测定沿PCR曲线的数据点的曲率值;测定所测定曲率值的最大值;计算拟合已测定曲率值的曲线的近似值,其方式为将回归过程应用于高斯混合模型函数以测定该函数的一个或多个参数,其中所述参数包括初始条件,并且其中所述最大值用作第一参数的初始条件;并且输出第一参数,其中所测定的第一参数表示Ct值。全文摘要本发明总体上涉及通过无方程算法判定实时PCR拐点,具体而言涉及测定S型或增长曲线转换值,例如PCR扩增曲线的基线区末端或拐点值或Ct值的系统和方法。文档编号C12Q1/68GK101710363SQ20091017593公开日2010年5月19日申请日期2009年9月11日优先权日2008年9月12日发明者M·蒂茨,R·T·库尼克申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1