利用对于双s形曲率分析的二次方程测试的pcrelbow确定的制作方法

文档序号:6466670阅读:189来源:国知局

专利名称::利用对于双s形曲率分析的二次方程测试的pcrelbow确定的制作方法利用对于双S形曲率分析的二次方程测试的PCRELBOW确定
背景技术
:本发明一般而言涉及处理表现S形或生长曲线的数据的系统和方法。特别的,本发明涉及确定生长曲线数据是否表现或显示有效的或显著的生长,并且如果是这样,确定S形曲线或生长类型曲线的特征性过渡值例如elbow值,所述曲线例如聚合酶链式反应曲线。聚合酶链式反应(PCR)是一种用于酶促合成或扩增给定的核酸序列的体外方法。这种反应典型地利用两种寡核普酸引物,所述引物与相反链杂交并侧面连接待扩增的模板或目标DNA序列。引物的延长通过热稳定DNA聚合酶催化。涉及依靠聚合酶的模板变性,引物退火,和退火引物的延伸的重复系列的循环导致特定DNA片段的指数累积。荧光探针或标记物典型地用于该方法中以帮助扩增过程的检测和定量。典型的实时PCR曲线显示于图1,其中图示了典型PCR过程的焚光强度值vs.循环数。在此例子中,在PCR过程的每个循环中监测PCR产物的形成。扩增通常在热循环器中测量,所述热循环器包括在扩增反应过程中测量荧光信号的组件和装置。所述热循环器的一个例子是RocheDiagnosticsLightCycler(Cat.No.20110468)。扩增产物例如通过荧光标记杂交探针的工具监测,所述探针当与目标核酸结合时仅仅放射荧光信号,或在某些例子中通过荧光染料的方法监测,所述荧光染料结合于双链DNA。对于典型的PCR曲线,在基线区末端鉴定过渡点,其通常表示为elbow值或循环阈(Ct)值,对于了解PCR扩增过程的特征是非常有用的。Ct值可用作PCR过程功效的度量。例如,典型地,确定所有待分析反应的确定的信号阈值,并确定对于目标核酸以及参考核酸例如标准或看家基因到达该阅值所需要的循环数(Ct)。基于对于目标核酸和参考核酸获得的Ct值可确定目标分子的绝对或相对的拷贝数量(Gibson等人,GenomeResearch6:995-1001;Bieche等人,CancerResearch59:2759-2765,1999;WO97/46707;WO97/46712;WO97/46714)。在图1中基线区15末端的区20中的elbow值将在循环数30的区域中。PCR曲线中的elbow值可利用几种现有方法确定。例如,几种现行方法确定当荧光到达被称为AFL(任意荧光值)的预定水平时elbow的实际值作为该值。其它的现行方法可利用当荧光vs.循环数的二阶倒数到达最大值时的循环数。所有这些方法都有缺陷。例如,一些方法对于离群数据(噪声数据)是非常敏感的,并且AFL值方法对于具有高基线的数据集处理得并不好。对于显示于图1的生长曲线,确定基线底部(或基线末端)的传统方法并不令人满意,特别是在高滴度的环境下。而且,这些算法典型地具有许多定义不明确,线性依赖,并且优化如果不是不可能的话通常非常困难的参数。因此,期望提供确定曲线的elbow值的系统和方法,例如S形类型曲线或生长曲线,特别是PCR曲线,其克服了上述和其它问题。也期望首先确定曲线是否显示有效生长或数据是否应该在消耗处理资源之前被抛弃。发明简述本发明提供了新的有效的系统和方法,所述系统和方法用于确定生长曲线的数据是否表现或显示有效的生长,并且如果是这样,确定特征过渡值例如S形或生长类型曲线中的elbow值。在一种实施方式中,本发明的系统和方法对于确定PCR扩增曲线中的循环阈(Ct)值是特别有用的。在某些方面,表现S形或生长类型曲线的数据集被处理以确定数据是否显示显著或有效的生长。在某些方面,确定拟合数据的一次或二次多项式曲线,并且确定曲线拟合的统计学显著性值。如果显著性值超过显著性阈值,数据被认为不表现显著或有效的生长。如果数据不表现显著或有效的生长,数据集可被抛弃。如果显著性值不超过显著性阈值,数据被认为表现显著或有效的生长。如果数据集被确定表现有效的生长,数据被进一步处理以确定S形或生长曲线中的过渡值,例如PCR扩增曲线的基线区末端或elbow值或Ct值。在某些方面,如果表现生长过程的数据曲线被确定超过显著性阈值并且判断为表现有效生长,利用具有通过Levenberg-Marquardt(LM)回归方法确定的参数6的双S形函数寻找拟合数据集的曲线的近似。一旦确定了参数,可利用一种或多种确定的参数规范化曲线。规范化之后,规范化曲线被处理以确定沿着曲线的一些或所有点的曲线曲率,例如,以产生表现PCR数据集的曲率VS.循环数的数据集或绘图。发生最大曲率的循环数对应于PCR数据集的Ct值。曲率和/或Ct值然后一皮返回并可被显示或另外用于进一步处理。根据本发明的一个方面,提供了确定生长过程的数据是否显示显著生长的计算机实施方法。本方法典型地包括接收表现生长过程的数据集,数据集包括多个数据点,每个数据点具有一对坐标值,并计算拟合数据集的曲线,所述曲线包括一种一次或二次多项式。本方法还典型地包括确定曲线的统计学显著性值,确定显著性值是否超过阈值,并且如果没有超过,进一步处理数据集,并且如果超过,显示数据集不具有显著生长和/或抛弃数据集。在一个方面,生长过程是聚合酶链式反应(PCR)过程。此处,进一步处理数据集可包括确定PCR数据集的循环阈值(Ct)。在某些方面,曲线是动力学聚合酶链式反应(PCR)过程的扩增曲线,并且基线区末端的点代表动力学PCR曲线的elbow或循环阈(Ct)值。在一个方面,曲线被处理以确定沿着曲线的某些或所有点的曲率,其中具有最大曲率的点代表Ct值。在某些方面,接受的数据集包括已被处理以去除一种或多种离群点或峰点的数据集。在某些方面,统计学显著性值是RM直,并且阈值大于约0.90。在一个方面,统计学显著性值是RM直,并且阈值为约0.99。在某些实施方式中,本方法进一步包括在计算拟合数据集的曲线之前规范化数据集。在本方法的另一实施方式中,确定Ct值包括通过应用Levenberg-Marquardt(LM)回归方法到双S形函数以确定函数参数而计算拟合数据集的曲线近似;利用确定的参数规范化曲线以产生规范化曲线;和处理规范化曲线以确定最大曲率的点,其中最大曲率的点代表PCR曲线的Ct值。根据本发明的另一方面,提供了包括控制处理器以确定生长过程的数据是否显示显著生长的代码的计算机可读介质。代码典型地包括接收表现生长过程的数据集并计算拟合数据集的曲线的指令,所述数据集包括多个数据点,每个数据点具有一对坐标值,所述曲线包括一种一次或二次多项式。代码还典型地包括指令,所述指令用于确定曲线统计学显著性值,确定显著性值是否超过阔值,并且如果没有超过,进一步处理数据集,并且如果超过,显示数据集不具有显著生长和/或抛弃数据集。在一个方面,生长过程是聚合酶链式反应(PCR)过程。在此,计算机可读介质可进一步包括确定PCR数据集的循环阈'(Ct)值的指令。在另一方面,曲线是动力学聚合酶链式反应(PCR)过程的扩增曲线,并且基线区末端的点代表动力学PCR曲线的elbow或循环阈值(Ct)。在一个方面,曲线被处理以确定沿着曲线的一些或所有点的曲率,其中具有最大曲率的点代表Ct值。在某些方面,统计学显著性值是RM直,并且阈值高于约0.90。在一个方面,统计学显著性值是rM直,并且阈值为约0.90。在计算机可读介质的某些实施方式中,确定Ct值的指令包括下述指令通过应用Levenberg-Marquardt(LM)回归方法到双S形函数以确定函数参数而计算拟合数据集的曲线近似的指令;利用确定的参数规范化曲线以产生规范化曲线的指令;和处理规范化曲线以确定最大曲率点的指令,其中最大曲率点代表PCR曲线的Ct值。在计算机可读介质的其它实施方式中,代码进一步包括在计算拟合数据集的曲线之前规范化数据集的指令。在另一实施方式中,代码进一步包括当生长过程是PCR过程时输出代表Ct值的数据的指令。根据本发明的另一方面,提供了一种动力学聚合酶链式反应(PCR)系统。该系统典型地包括产生表现动力学PCR扩增曲线的PCR数据集的动力学PCR分析模块,包括多个数据点的数据集,每种具有一对坐标值,其中数据集包括在感兴趣的区域的数据点,其包括循环阈值(Ct),和适合于PCR数据集是否显示显著生长的智能模块。智能模块典型地通过计算拟合PCR数据集的曲线并确定曲线的统计学显著性值而处理PCR数据集,所述曲线包括一种一次或二次多项式的曲线。智能模块还典型地通过确定显著性值是否超过阔值而处理PCR数据集,并且如果没有超过,进一步处理PCR数据集,并且如果超过,显示PCR数据集不具有显著生长和/或抛弃PCR数据集。在一个方面,处理数据集进一步包括确定PCR数据集的循环阈(Ct)值。在某些方面,曲线由此被处理以确定沿着曲线的一些或所有点的曲率,其中具有最大曲率的点代表Ct值。在PCR系统的特定实施方式中,确定Ct值包括通过应用Levenberg-Marquardt(LM)回归方法到双S形函数以确定函数参8数而计算拟合数据集的曲线近似;利用确定的参数规范化曲线而产生规范化的曲线;和处理规范化曲线以确定最大曲率点,其中最大曲率点代表PCR曲线的Ct值。在某些方面,统计学显著性值是R"直,并且阈值高于约0.90。在一个方面,统计学显著性值是R值,并且阈值为约0.90。在某些方面,智能模块进一步适于在计算拟合数据集的曲线之前规范化数据集。在PCR系统的特定实施方式中,动力学PCR分析模块位于动力学热循环器装置中并且包括与分析模块可通讯连接的处理器。在PCR系统的某些实施方式中,智能模块包括通过网络连接或直接连接与分析模块连接的位于计算机系统中的处理器。参考本说明书包括附图和权利要求的剩余部分,将认识到本发明的其它特征和优点。本发明进一步的特征和优点,以及本发明不同实施方式的结果和操作,根据附图在下面详细描述。在附图中,相同的参考数表示等同或功能类似的成分。附图简述图1显示了典型PCR生长曲线的一个例子,对于荧光强度vs.循环数作图。图2显示了确定生长曲线的基线区末端,或PCR曲线的Ct值的工艺流程。图3显示了根据本发明的一种实施方式对于峰的鉴定和置换过程的i羊细工艺流牙呈。图4显示了包括参数(a)-(g)的双S形方程式的分解。图5显示了参数(d)对于曲线和(e)的位置,拐点的x值的影响。图5中所有曲线具有除了参数(d)之外相同的参数值。图6显示了对于不同参数集的三种曲线形状的一个例子。图7显示了根据一个方面确定双S形方程式参数(e)和(g)的值。图8显示了对于一种初始参数集的Levenberg-Marquardt回归方法的工艺流程。图9显示了根据一种实施方式确定PCR过程的elbow值的更详细的工艺流程。图10a显示了拟合于利用双S形的实-验数据的典型的生长曲线,并且图10b显示了图10a的双S形曲线的曲率绘图。图11显示了叠加于图10a的生长曲线与最大曲率点相切的圆。图12a显示了生长曲线的数据集的一个例子。图12b显示了图12a的数据集的绘图。图13显示了拟合于图12的数据集的双S形。图14显示了利用方程式(6)的基线扣减方法规范化之后的图12(图13)的数据集(和双S形拟合)。图15显示了规范化了的图14的数据集的曲率vs.循环数的绘图。图16显示了具有最大曲率半径的圆和图14的规范化了的数据集的叠加。图17显示了"慢生长者"数据集的一个例子。图18显示了利用方程式(6)的基线扣减方法规范化之后的图17的数据集和双S形拟合。图19显示了图18的规范化了的数据集的曲率vs.循环数的绘图。图20显示了一组PCR生长曲线的绘图,包括重复运行和阴性样品。图21显示了不包含目标的实时PCR数据信号,并且其具有在可接受范围内的基线截距,斜率和AFI值。图22显示了具有与图21的信号相同的(最大)曲率半径的实时PCR数据信号。图23显示了具有低的(最大)曲率半径的实时PCR数据信号。图24显示了解释软件和硬件资源之间关系的普通方块图。发明详述本发明提供了确定代表S形或生长型曲线的数据是否显示显著的生长的系统和方.法。在某些方面,确定了拟合数据的一次或二次多项式曲线,并且确定了对于曲线拟合的统计学显著性值。如果显著性值超过了显著性阈值,该数据被认为不代表显著或有效的生长。如果数据不代表显著或有效的生长,该数据集可被抛弃。如果显著性数值没有超过显著性阈值,该数据被认为代表了显著或有效的生长。如果该数据集被确定代表了有效生长,该数据被进一步处理以确定S形或生长曲线的过渡数值,例如PCR扩增曲线的基线区末端或elbow值或Ct值。在某些方面,利用了具有通过Levenberg-Marquardt(LM)回归方法确定的参数的双重S形函数,以寻找曲线的近似。一旦确定了参数,可利用一种或多种确定的参数规范化曲线。规范化之后,处理正常曲线以确定沿着曲线的一些或所有点的曲线曲率,例如,以产生代表曲率VS.循环数的数据集或绘图。产生最大曲率的循环数对应于Ct值。Ct值然后^皮返回,并可净皮显示或另外用于其它方法。在本发明的一个示例性实施方式中,本方法可通过利用常规个人计算机系统而实施,所述计算机系统包括但不限于为输入数据集的输入装置,例如键盘,鼠标等;为表现曲线的一个区中特定感兴趣的点的显示装置,例如显示器;实施方法中每个步骤必需的处理装置,例如CPU;网络接口例如调制解调器,储存数据集的数据储存装置,处理器上运行的计算机编码等。而且,本方法还可在PCR装置中实施。图24显示了解释软件和硬件资源关系的普通框图。这一系统可包含一种动力学PCR分析模块,其位于热循环器装置中,以及一种智能模块,其是计算机系统的部分。在此,通过网络连接或直接连接,数据集(PCR数据集)从分析模块传输到智能模块或反之亦然。数据集根据显示于图2或9中的方法被在处理器上运行并储存在智能模块的储存装置中的计算机编码处理,并且处理之后传输回分析模块的储存装置中,其中修正的数据可在显示装置上显示。有效生长的PCR数据的Ct确定在PCR过程的背景中的生长或扩增曲线10的一个例子显示于图1。如所示的,曲线10包括延迟期区15,和指数期区25。延迟期区15通常表示为基线或基线区。所述曲线10包括连接延迟期和指数期区的感兴趣的过渡区20。区20通常表示为elbow或elbow区。Elbow区典型的限定了基线的末端和潜在过程的生长或扩增率的过渡。鉴定区20中特定的过渡点对于分析潜在过程的性能是有用的。在典型的PCR曲线中,鉴定表示为elbow值或循环阈(Ct)值的过渡点对于了解PCR过程的功效特性是有用的。可能提供类似的S形或生长曲线的过程包括细菌过程,酶过程和结合过程。在细菌生长曲线中,例如,感兴趣的过渡点表示为延迟期时间,e。产生可根据本发明分析的数据曲线的其它特定过程包括链置换扩增(SDA)过程,基于核酸序列的扩增(NASBA)过程和转录介ii导扩增(TMA)过程。SDA和NASBA过程的例子和数据曲线可分别在Wang,Sha陽Sha,等人,"HomogeneousReal-TimeDetectionofSingle-NucleotidePolymorphismsbyStrandDisplacementAmplificationontheBDProbeTecETSystem",ClinChem200349(10):1599,和T\Veusten,Jos丄A.M.,等人,"PrinciplesofQuantitationofViralLoadsUsingNucleicAcidSequence-BasedAmplificationinCombinationWithHomogeneousDetectionUsingMolecularBeacons",NucleicAcidsResearch,200230(6):26中找到。因而,尽管本文献的剩余部分将讨论本发明对于PCR曲线的实用性的实施方式和方面,应该认识到本发明可应用于其它过程相关的数据曲线中。如图l所示,典型PCR生长曲线的数据可表示在二维坐标系中,例如,PCR循环数定义x-轴,累积多核普酸生长指标定义y-轴。典型地,如图1所示,累积生长的指标是荧光强度值,因为荧光标记物的利用也许是最广泛应用的标记方案。然而,应理解其它指标也可根据利用的特定标记和/或监测方案而利用。其它有用的累积信号生长的指标包括发光强度,化学发光强度,生物发光强度,磷光强度,电荷传输,电压,电流,功率,能量,温度,粘性,光散射,放射强度,反射率,透射率和吸光率。循环的定义也可包括时间,过程循环,单位操作循环和再生循环。一般方法概述根据本发明,确定单S形曲线中的过渡值的方法100的一种实施方式可参考图2简要描述,所述过渡值例如动力学PCR扩增曲线的elbow值或Ct值。在步骤110中,接受或获取表现曲线的实验数据集。绘制的PCR数据集的一个例子显示于图1,其中y-轴和x-轴分别代表PCR曲线的荧光强度和循环数。在某些方面,数据集应该包括沿着轴线连续和等距的数据。在方法100在位于PCR数据获取装置例如热循环器中的智能模块(例如,处理器执行指令)中实施的例子中,数据集可当数据被收集时实时提供给智能模块,或它可被储存在记忆单元中或緩沖器中并在实验结束之后提供给智能单元。类似的,数据集可提供给分离的系统例如台式电脑系统或其它电脑系统,通过网络连接(例如,LAN,VPN,intranet,Internet等)或直接连接(例如,USB或其它直接有线或无线连接)到需要的装置上,或提供到便携式介质上,例如CD,DVD,软盘等。在某些方面,数据集包括具有一对坐标值(或2维矢量)的数据点。对于PCR数据,该对坐标值典型地代表循环数和荧光强度值。在数据集在步骤110中接受或获取之后,数据集可被分析以确定基线区的末端。在步骤120中,计算了曲线的近似(approximation)。在这一步骤中,在一种实施方式中,利用具有通过Levenberg-Marquardt(LM)回归方法或其它回归方法确定的参数的双S形曲线函数以寻找表现数据集的曲线的近似。近似据说是"稳健"的,因为离群点和峰(spike)点对于曲线拟合的质量具有最小的影响。图13,其将在下面进行讨论,图示了接受的数据集和该数据集的通过根据本发明利用Levenberg-Marquardt回归方法确定双S形曲线函数参数的稳健近似的绘图的例子。在某些方面,数据集中的离群点和峰点在处理数据集之前被除去或被替换以确定基线区的末端。峰的除去可在在步骤110中获取数据集之前或之后进行。图3图示了鉴定和替换表现PCR或其它生长曲线的数据集中的峰点的工艺流程。确定和除去或替换峰点的方法的更详细的描迷可见于US2007-0148632。在步骤130中,步骤120中确定的参数用于使曲线规范化,例如,去除基线斜率(slope),下面将进行更详细的描述。这种方式的规范化允许确定Ct值而不用需要确定或特定化曲线的基线区的末端或基线底部位置。在步骤140中,规范化的曲线然后被处理以确定Ct值,这将在下面更i羊细的讨i仑。LM回归方法图3的步骤502到524,如下面将讨论的,图示了逼近数据集的曲线并确定拟合函数的参数的工艺流程(步骤120)。这些参数可用于规范化曲线(步骤130),例如,修饰或去除数据集的基线斜率,所迷数据集表现S形或生长类型曲线例如根据本发明的一种实施方式的PCR曲线。当数据集被处理以产生具有去除的或替换的峰点的修饰的数据13集时,修饰的无峰数据集可根据步骤502到524被处理以鉴定拟合函数的参数。在所示的一种实施方式中,利用了Levenberg-Marquardt(LM)方法计算数据集的稳健曲线近似。LM方法是非线性回归方法,它是最小化非线性函数和数据集的距离的迭代技术。该方法表现为类似于最速下降方法和Gauss-Newton方法的结合当当前近似拟合不好时,它表现得像最速下降方法(更慢但更可靠的收敛),但当当前近似变得更精确时,它将表现得像Gauss-Newton方法(更快但更不可靠的收敛)。LM回归方法广泛地应用于解决非线性回归问题。通常,LM回归方法包括需要多种输入并提供输出的算法。在一个方面,输入包括待处理的数据集,用于拟合数据的函数,和对于函数的参数或变量的初始推测。输出包括最小化函数和数据集的距离的函数的参数集。根据一种实施方式,拟合函数是以下形式的双S形<formula>formulaseeoriginaldocumentpage14</formula>(1)选择这一方程式作为拟合函数是基于其灵活性和拟合典型PCR曲线或其它曲线可能采取的不同曲线形状的能力。本领域技术人员将认双S形方程式(1)具有7个参数a,b,c,d,e,f和g。方程式可被分解为一个常数,一个斜率和一个双S形的和。双S形自身是两个S形的相加。图4显示了双S形方程式(1)的分解。参数d,e,f和g决定了两个S形的形状。为显示它们对于最终曲线的影响,考虑单S形<formula>formulaseeoriginaldocumentpage14</formula>,(2)其中参数d决定了曲线的"锐度",参数e决定了拐点的X值。图5显示了参数d对于曲线和参数e对于拐点x值位置的影响。下面的表1描述了参数对于双S形曲线的影响。表l:双S形参数描述参数对曲线的影响ax-0时的y^直b基线和畔斜(plateauslope)c曲线的AFId第一S形的"锐度,,(见图5)e第一S形的拐点位置(见图5)f第二S形的"锐度,,g第二S形的拐点位置在一个方面,双S形方程式的"锐度"参数d和f应为受限的,以防止曲线采取不现实的形状。因此,在一个方面,d<-l或d>l.l或f<-l或f〉1.1的任何迭代被认为是不成功的。在其它方面,可利用对于参数的其它限制。因为Levenberg-Marquardt算法是一种迭代算法,典型地需要对于待拟合的函数的参数的初始猜测。初始猜测越好,近似将越好并且算法收敛向局部极小的可能性也越小。由于双S形函数的复杂性和PCR曲线或其它生长曲线的多种形状,对于每种参数的一种初始猜测对于防止算法有时收敛向局部极小可能是不充分的。因此,在一个方面,多套(例如,三或更多)初始参数被输入并且保持最佳的结果。在一个方面,大多数参数在利用的多套参数中保持恒定;仅仅参数c,d和f对于多种参数集中的每种是不同的。图6显示了对于不同参数集的三种曲线形状的例子。这三套参数的选择对于表现PCR数据的曲线的三种可能的不同形状是指示性的。应理解可处理多于三套的参数,并保留最佳结果。如图3所示,LM方法的初始输入参数在步骤510中鉴定。这些参数可通过操作者输入或^L计算出。根据一个方面,根据如下面讨论的步骤502,504和506确定或设置参数。初始参数(a)的计算参数(a)是基线的高度;它的值对于所有套初始参数是相同的。在一个方面,步骤504中参数(a)指派为数据集中第3低的y-轴值,例如,荧光值。这提供了稳健的计算。在其它方面,当然,参数(a)可根据期望指派为任何其它荧光值,例如最低y-轴值,第二低值,等。初始参数(b)的计算参数(b)是基线和坪的斜率。它的值对于所有套的初始参数是相同的。在一个方面,由于理想地不应有任何斜率,在步骤502中指派给(b)固定值0.01。在其他方面,参数(b)可指派不同的数值,例如,在0到大约0.5之间的数值。初始参数(c)的计算参数(c)表示坪的高度减去基线高度,其表示为绝对荧光的增加,或AFI。在一个方面,对于第一套参数,c=AFI+2,然而对于最后两套参数,c=AFI。这显示于图6中,其中对于最后两套参数,c=AFI。对于第一套参数,c=AFI+2。这种变化归因于由第一套参数模拟的曲线形状,其没有坪。参数(d)和(f)的计算参数(d)和(f)限定了两个S形的锐度。由于没有产生基于这些参数的曲线近似的方法,在一个方面,在步骤502中应用了三个固定代表性数值。应理解其他的固定或非固定数值可用作参数(d)和/或(f)。这些参数对模拟了遇到的PCR曲线的最普遍形状。下面的表2显示了图6中所示的不同套参数的(d)和(f)的值。表2:参数d和f的值参数套数d值f值10.10.721.00.430.350.25参数(e)和(g)的计算:在步骤506中,参数(e)和(g)被确定。参数(e)和(g)限定了两个S形的拐点。在一个方面,它们在所有初始参数集中都采取相同值。参数(e)和(g)可具有相同或不同值。为找到近似,在一个方面,利用了超过平均强度的第一点的x值(其不是峰),所述强度例如荧光。根据本方面确定(e)和(g)的值的方法显示于图7并在下面进行讨论。根据本方面确定参数(e)和(g)和其他参数的值的方法可在US2007-0148632中找到。参考图7,初始地,确定曲线平均值(例如,荧光强度)。接下来,鉴定超过平均值的第一数值点。然后确定是否a.该点不位于曲线开始附近,例如在开始5个循环内;b.该点不位于曲线末端附近,例如在最后5个循环内;和c.该点附近的衍生点(例如,在它周围2个点的范围)不显示任何表征的改变。如果它们显示了,该点很可能是峰点并且因而应被拒绝。下面的表3显示了根据一个方面用于图6中的起始参数值的例子。表3:起始参数值起始参数套123a值第三低的荧光值第三低的焚光值第三低的荧光值bit0.010.010.01c值第三高的荧光值-a+2第三高的荧光值-a+2第三高的荧光值-a+2d值0.11.00.35e值超过荧光平均值的第一超过荧光平均值的第一超过荧光平均值的第一非峰点的X非峰点的X非峰点的Xf值0.70.40.25g值超过荧光平均值的第一超过荧光平均值的第一超过荧光平均值的第一非峰点的X非峰点的X非峰点的X回到图3,一旦在步骤510中设置了所有参数,利用输入数据集,函凄史和参数进4亍LM方法520。传统地,Levenberg-Marquardt方法用于解决非线性最小二乘方问题。传统的LM方法计算定义为曲线近似和数据集之间方差之和的距离测度。然而,当最小化方差之和时,给予了离群数重要的地位,因为它们的距离比非峰数据点距离大,经常导17致不相称的曲线或不理想的曲线。因此,根据本发明的一方面,近似和数据集之间的距离通过最小化绝对误差之和而被计算,因为这不会给予离群数重要的地位。在这一方面,近似和数据之间的距离通过下式给出^巨离-Zly炎凝一少迷似I.(3)如上所述,在一个方面,多套(例如,三套)起始参数中的每种被输入和处理并且最佳结果被保存,如步骤522和524所示的,其中最佳结果是提供式(3)中最小或最低距离的参数集。在一个方面,大多数参数在多套参数中保持恒定;仅仅c,d和f对于每套参数可以是不同的。应该理解可利用任何数目的起始参数集。图8显示了根据本发明对于一套参数的LM方法520的工艺流程。如上面所解释的,Levenberg-Marquardt方法可表现为类似最速下降方法或类似Gauss-Newton方法。它的表现依赖于阻尼因子X。X越大,Levenberg-Marquardt方法表J见为越类4以最速下降方法,另一方面,X越小,Levenberg-Marquardt方法表J见为越类4以Gauss-Newton方法。在一个方面,X起始于0.001。应该认识到X可起始于任何ft值,例如从大约0.000001到大约1.0。如前所述,Levenberg-Marquardt方法是一种迭^FU支术。才艮据——个方面,如图8所示,在每次迭代中进行下列步骤1.计算先前近似的Hessian矩阵(H)。2.计算先前近似的转置Jacobian矩阵(J7)。3.计算先前近似的距离矢量(d)。4.Hessian矩阵对角线被当前阻尼因子X增广(augment):I=肌(4)5.求解增广方程"=力(5)6.增广方程的解x被加到函数的参数中。7.计算新的近似和曲线之间的距离。8.如果与新的参数集的距离比与先前参数集的距离更小,迭代被认为是成功的。"呆持或储存新的参数集。,降低阻尼因子人,例如,降低10个因子。如果与新的参数集的距离比与先前参数集的距离更大*迭代被认为是不成功的。,抛弃新的参数集。*增加阻尼因子人,例如,增加10个因子。在一个方面图8的LM方法迭代直到达到下述标准之一1.迭代进行特定数目N的次数。第一标准防止了算法无限迭代。例如,在示于图10的一个方面,缺省的标准值N是100。如果可以收敛,100次迭代对于算法的收敛是充分的。通常,N可在低于10到100或更多的范围内变动。2.两个成功的迭代之间的距离之间的差别比例如0.0001的阈值小。当差别非常小时,理想的精确度可获得,并且持续迭代是无意义的,因为这种处理不会变得显著更好。3.阻尼因子人超过了特定值,例如,大于1020。当X非常大时,该算法不会比目前处理收敛得更好,因此持续迭代是无意义的。通常,特定化值可以是比1020显著更小或更大。规范化(Normalization)确定参数之后,在一种实施方式中,利用一种或多种确定的参数规范化曲线(步骤130)。例如,在一个方面,曲线可通过减去曲线的线性生长部分被规范化或调整为具有0基线斜率。数学上,这显示为新数据(BLS):数据-(a+bx),(6)其中新数据(BLS)是基线扣减之后规范化了的信号,例如,线性生长或基线斜率被减去或除去的数据集(数据)。参数a和b的值是通过利用LM方程式将曲线回归而确定的数值,x是循环数。因而,对于沿着x-轴的每种数据值,常数a和斜率b乘以x值从数据中减去以产生具有0基线斜率的数据曲线。在某些方面,在将LM回归应用到数据集以确定规范化参数之前将峰点从数据集中除去。在另一方面,曲线可根据下式被规范化或调整为具有0斜率新数据(BLSD)-(数据-(a+bx))/a,(7a)其中新数据(BLSD)是基线扣减并相除(withdivision)之后规范化的信号,例如,线性生长或基线斜率被扣减或去除并且结果除以a的数据集(数据)。参数a和b的值通过利用LM方程式回归曲线而确定,并且x是循环数。因而,对于沿着x-轴的每种数据值,常数a和斜率b乘以x值从数据中减去并且结果除以参数a的值以产生具有0基线斜率的数据曲线。在一个方面,方程式(7a)对于参数"a"^1是有效的,在参数"a"<1的例子中,利用下式新数据(BLSD)二数据-(a+bx).(7b)在某些方面,在将LM回归方法应用到数据集以确定规范化参数之前峰点从数据集中去除。在另一方面,曲线可根据下式被规范化或调整新数据(BLD)二数据/a,(8a)其中新数据(BLD)是基线相除之后的规范化了的信号,例如,数据集(数据)除以参数a。参数a和b的值通过利用LM方程式回归曲线而确定,x是循环数。在一个方面,方程式(8a)对于参数"a"2l是有效的,在参数"a"<1的例子中,利用下式新数据(BLD)-数据+(l-a).(8b)在某些方面,在将LM回归方法应用到数据集以确定规范化参数之前峰点从数据集中除去。在另一方面,曲线可根据下式被规范化或调整新数据(PGT)=(数据-(a+bx))/c,(9a)其中新数据(PGT)是基线扣减并相除之后的规范化了的信号,例如,线性生长或基线斜率被扣减或去除并且结果除以c的数据集(数据)。参数a,b和c的值通过利用LM方程式回归曲线而确定,x是循环数。因此,对于沿着x-轴的每种数据值,常数a和斜率b乘以x值从数据中减去并且结果除以参数c的值以产生具有0基线斜率的数据曲线。在一个方面,方程式(9a)对于参数"c,,2l是有效的,在参数"c"<1和"c"^0的例子中,利用下式新数据(PGT)-数据-(a+bx).(9b)在某些方面,在将LM回归方法应用到数据集以确定规范化参数之前峰点从数据集中去除。本领域技术人员将认识到其他规范化方程式可利用通过Levenberg-Marquardt或其他回归方法确定的参数用于^见范化和/或修正基线。曲率确定利用方程式(6),(7),(8)或(9)或其他规范化方程式规范化曲线之后,Ct值可被确定。在一种实施方式中,曲率确定过程或方法如将参考图9描述的那样被应用于规范化曲线,其显示了确定动力学PCR曲线中的elbow值或Ct值的工艺流程。在步骤910中,获取数据集。在确定方法在位于例如热循环器的PCR数据获取装置中的智能模块(例如,处理器执行指令)中实施的例子中,当收集数据时可将数据集实时提供给智能模块,或它可被储存在记忆单元或緩沖器中并在试验完成之后提供给模块。类似地,数据集可提供给分离的系统例如台式电脑,21通过网络连接(例如,LAN,VPN,intranet,Internet,等)或直接连接(例如,USB或其他直接有线或无限连接)到获取装置,或提供到便携式媒介例如CD,DVD,软盘等。数据集被接受或获取之后,在步骤920中确定曲线近似。在这一步骤中,在一种实施方式中,通过LevenbergMarquardt回归方法确定的参数的双S形函数被用于找寻表现数据集的曲线的近似。另外,在参考图3描述的步骤920之前峰点可从数据集中去除。例如,在步骤910中获取的数据集可以是峰点已经被去除的数据集。在步骤930中,曲线被规范化。在某些方面,利用上述方程式(6),(7),(8)或(9)规范化曲线。例如,基线可利用双S形方程式参数被设置为0曲率,所述参数在步骤920中如上面每个方程式(6)—样扣减基线斜率而确定。在步骤940中,将一种方法应用于规范化曲线以确定沿着规范化曲线的点的曲率。曲率vs.循环数的绘图可^皮返回和/或显示。最大曲率的点对应于elbow或Ct值。在步骤950中,结果^皮返回,例如到进行分析的系统中,或到需要分析的分离的系统中。在步骤960中,Ct值被显示。另外的数据例如整个数据集或曲线近似也可被显示。图表显示可用显示装置实施,例如显示器或打印机,与实施图9的分析的系统配对,或者数据可提供到用于在显示装置上呈现的分离系统上。根据一种实施方式,为获得曲线的Ct值,确定最大曲率。在一个方面,对于规范化曲线上的一些或所有点确定曲率。曲率vs.循环数的绘图可被显示。曲线的曲率通过下式给出广々、乂「1、「3/21+、t&y对于半径圆,通过下式给出少(x)=Va2-乂2方程式(11)的曲率是kappa(x)=-(l/a)。因而,曲率的半径等于曲率的副倒数。由于圆的半径是恒定的,其曲率通过-(l/a)给出。现在考虑图10b,其为图10a的PCR数据集的拟合的曲率的绘图。Ct值可被认为在最大曲率的位置发生,其发生于循环数Ct=21.84时。这种Ct值令人满意地与图10a所示PCR生长曲线相比4交。在最大曲率时(对应于Ct值21.84)的曲率半径是半径=1/0.2818=3.55循环。图10aPCR生长曲线中叠加的这种半径圆显示于图11。如图ll所示,对应于最大曲率的半径圆代表了当保持与曲线相切时在PCR曲线的生长区开端可被叠加的最大圆。具有小(最小)的曲率半径的曲线可具有陡的生长曲线,而具有大(最大)的曲率半径的曲线可具有扁的(shallow)生长曲线。如果曲率半径极其大,这可能显示没有明显信号的曲线,例如不显著的生长或无效的生长。在一种实施方式中,然而,如下面将更详细的讨论的,提供了一种生长有效测试确定数据集是否显示了显著或有效的生长。如果发现数据集具有统计学显著的生长,可应用曲率分析算法以确定Ct值。如果不是,数据集可i支抛弃和/或无效生长的指示可^:返回。在计算曲率中需要的方程式(1)的双S形的第一和第二导数(derivative)如下所示。第一导数丄=6+-^-^+-^-(12)血++力)2+d("))2(l+e-方程式(13):第二导数2("J2e—一心血21+(l+e2e-2/(,—g)/2/2-。l+e实施例图12a显示了生长曲线的原始数据的一个例子。将双S形/LM方法应用于显示于图12b的原始数据绘图产生了如下表4所示的方程式(1)的7个参数值:表431.銜b0.009310.3421d0.7B58:35,9f0.1081.,..……g.…….:49.1鹏拟合于显示于图12的数据的双S形显示于图13,显示出对于数据点非常精确的评价。这些数据然后根据方程式(6)(基线扣减)被规范化以获得示于图14的图。图14中所示的实线是方程式(1)到数据集的双S形/LM应用,其已根据方程式(6)被规范化。图15显示了对于图14的规范化曲线的曲率vs.循环数的绘图。曲率最大值发生于循环数34.42,曲率为0.1378。因而,Ct=34.42基于最大曲率的循环数,曲率半径=1/0.1378=7.25。曲率半径圆与规范化数据集的叠加显示于图16。"慢生长者"数据集的一个例子显示于图17。与该数据集的双S形拟合和利用基线扣减的规范化,方程式(6),产生了图18所示的拟合结果。对应的曲率绘图显示于图19。最大曲率发生于循环数25.90,曲率=0.00109274,对应于曲率半径=915。这种大的曲率半径传达出这可能是一种慢生长者数据集。作为另一个例子,考虑示于图20的PCR生长曲线的集。利用现有方法("阈")vs.利用基线扣减并相除(BLSD-方程式(7))的曲率方法获得的Ct值的比较显示于下表5。表5:Ct值<table>tableseeoriginaldocumentpage25</column></row><table><formula>formulaseeoriginaldocumentpage26</formula>(2)方程式(15)的曲率然后如方程式(16)给出<formula>formulaseeoriginaldocumentpage26</formula>(3)曲率函数,方程式U6),在x=0时具有最大值,因此暗示没有具有对二次函数很好的曲线拟合的PCR信号的限定的elbow值。因而,在一种实施方式中,如果数据集在统计学显著性边缘之内拟合一次或二次多项式,该数据集被确定为缺乏显著的生长。根据一种实施方式,处理一种生长过程的数据集以确定该数据是否显示了显著的生长。开始,计算拟合数据集的一次或二次多项式曲线(例如,利用方程式(14))并且然后确定曲线拟合的统计学显著性值。在某些方面,统计学显著性是R2值。如果统计学显著性值不超过阈值,可判断数据集显示出统计学显著性或有效生长并且数据集被进一步处理,例如确定Ct值。在一个方面,R阈值是约0.90;如果R2阈值超过0.90,可判断数据集是无效的,例如,缺少显著生长。在另一方面,R阈值为0.99。应理解R2阈值可设置为在大约0.90到0.99之间的值,或阈值可以高于0.99,或甚至低于0.90。如果这种统计学显著性值不超过阈值,可判断数据集显示出不显著,或无效的生长。显示数据集不具有显著生长的信息可被返回和/或数据集可被抛弃。实施例图21显示了不包含目标,并且具有在可接受范围内的基线截距,斜率和AFI值的实时PCR数据信号。方程式(IO),(12),和(13)的曲率算法显示Ct值是12.94并且(最大)曲率半径(ROC)是481。当应用生长有效性测试时,数据被确定为具有不充分的生长或不充分的曲率,意味着信号拟合具有超过例如R2〉0.90的阈值的统计学显著性值的一阶或二阶二次函数。图22显示另一种也具有ROC为481的实时PCR数据信号;在此例子中,R值比阈值小得多,例如,0.99,因此本方法继续计算Ct值。方程式(10),(12)和(13)的曲率算法正确地显示了最大曲率半径,并且因而Ct值发生于循环38.7。比较图21与图22,很明显ROC值单独对于鉴定曲线是否显示出有效生长是不充分的。此处两种信号都具有相同最大ROC,然而一种具有有效生长并且另一种不具有。图23显示了另一种实时PCR信号。将ROC算法应用于确定Ct值产生了在循环30.3时的Ct值并具有(最大)ROC71。应用生长有效性测试显示存在不显著,或无效的生长。因而,在这种小得多的(最大)ROC,信号是无效的,显示存在低的(最大)ROC并且其自身对于断言曲线无效是不充分的。应该理解生长有效性测试和Ct确定方法,包括曲线拟合和曲率确定方法,可在计算机系统的处理器上的计算机代码运行中实施。代码的处理器的指令。代;马^l地储存在硬盘,RAM或便携式;质例如CD:DVD等中。类似的,本方法可在例如热循环器的PCR装置中实施,所述装置包括储存在连接到处理器上的记忆单元的处理器执行指令。包括所述指令的代码可如公知的那样通过网络连接或直接连接到代码源或利用便携式介质下载到PCR装置记忆单元。本领域技术人员应理解本发明的elbow确定方法可利用多种编程语言以及应用软件编码,所述语言例如C,C++,C#,Fortran,Visua旧asic等,所述应用软件例如Mathematica,其提供用于数据可视化和分析的预打包途径,函数和程序。后者的另一种例子是^1八丁1^\8@。尽管本发明已通过实施例和特定实施方式进行了描述,应理解本发明不限于公开的实施方式。相反,本发明有意覆盖对于本领域技术人员来说明显的多种修饰和类似安排。因此,所附权利要求的范围应作最宽解释以包括所有修饰和类似安排。在说明书附图中,图3描绘的是峰鉴定和置换过程流程图。图4描绘的是双S形分解。图5描绘的是S形参数。图6描绘的是初始参数形状。图7描绘的是参数e和g计算流程图。图8描绘的是Levenberg-Marquardt方法流程图。图10a描绘的是PCR数据。图10b描绘的是曲率。图ll描绘的是曲率半径。图12a描绘的是原始数据。图12b描绘的是原始数据。图13描绘的是原始数据和双S形拟合。图14描绘的是规范化的数据和双S形拟合。图15描绘的是曲率绘图。图16描绘的是曲率半径。图17描绘的是原始数据。图18描绘的是基线扣减和双S形。图19描绘的是曲率绘图。图20描绘的是原始数据集。权利要求1.确定生长过程数据是否显示显著生长的方法,所述方法包括-接收表现生长过程的数据集,所述数据集包括多个数据点,每个数据点具有一对坐标值;-计算拟合数据集的曲线,所述曲线包括一种一次或二次多项式;-确定所述曲线的统计学显著性值;-确定显著性值是否超过阈值;和-如果没有超过,进一步处理所述数据集;和-如果超过,显示所述数据集不具有显著生长和/或抛弃所述数据集。2.权利要求1的方法,其中统计学显著性值是rM直,并且其中阈值是大约0.90或更高。3.权利要求l的方法,其中生长过程是聚合酶链式反应(PCR)过程。4.权利要求3的方法,其中处理数据集还包括确定PCR数据集的循环阈(Ct)值。5.权利要求l的方法,其中确定Ct值包括-通过应用Levenberg-Marquardt(LM)回归方法到双S形函数以确定函数参数而计算拟合数据集的曲线近似;-利用确定的参数规范化曲线以产生规范化的曲线,和-处理规范化的曲线以确定最大曲率点,其中最大曲率点代表PCR曲线的Ct值。6.权利要求1的方法,进一步包括在计算拟合数据集的曲线之前规范化数据集。7.计算机可读介质,其包括控制处理器以确定生长过程数据是否显示显著生长的代码,所述代码包括下述指令-接收表现生长过程的数据集的指令,所述数据集包括多个数据点,每个数据点具有一对坐标值;-计算拟合数据集的曲线的指令,所述曲线包括一种一次或二次多项式;-确定所述曲线的统计学显著性值的指令;-确定显著性值是否超过阈值的指令;和-如果没有超过,进一步处理数据集的指令;和-如果超过,显示数据集不具有显著生长和/或抛弃数据集的指令。8.权利要求7的计算机可读介质,其中统计学显著性值是RM直,并且其中阈值是大约0.90或更高。9.权利要求7的计算机可读介质,其中生长过程是聚合酶链式反应(PCR)过程。10.权利要求9的计算机可读介质,其中处理数据集的指令还包括确定PCR数据集的循环阈(Ct)值的指令。11.权利要求IO的计算机可读介质,其中确定Ct值的指令包括下列指令-通过应用Levenberg-Marquardt(LM)回归方法到双S形函数以确定函数参数而计算拟合数据集的曲线近似的指令;-利用确定的参数规范化曲线以产生规范化的曲线的指令,和-处理规范化的曲线以确定最大曲率点的指令,其中最大曲率点代表PCR曲线的Ct值。12.动力学聚合酶链式反应(PCR)系统,其包含-产生表现动力学PCR扩增曲线的PCR数据集的动力学PCR分析模块,所述数据集包括多个数据点,每个数据点具有一对坐标值;和-适于处理PCR数据集以确定PCR数据集是否显示显著生长的智能模块,通过-计算拟合PCR数据集的曲线,所述曲线包括一种一次或二次多项式;-确定所述曲线的统计学显著性值;-确定显著性值是否超过阈值;和-如果没有超过,进一步处理PCR数据集;和-如果超过,显示PCR数据集不具有显著生长和/或抛弃PCR数据集。13.权利要求12的PCR系统,其中统计学显著性值是R"直,并且其中阈值是大约0.90或更高。14.权利要求12的PCR系统,其中进一步处理数据集包括确定PCR数据集的循环阈(Ct)值。15.权利要求14的PCR系统,其中确定Ct值包括-通过应用Levenberg-Marquardt(LM)回归方法到双S形函数以确定函数参数而计算拟合数据集的曲线近似;-利用确定的参数规范化曲线以产生规范化的曲线,和-处理规范化的曲线以确定最大曲率点,其中最大曲率点代表PCR曲线的Ct值。全文摘要本发明涉及利用对于双S形曲率分析的二次方程测试的PCRELBOW确定。确定生长曲线数据是否表现或显示有效或显著生长的系统和方法。表现S形或生长类型曲线的数据集,例如PCR曲线,被处理以确定数据是否显示显著或有效的生长。确定拟合数据的一次或二次多项式曲线,并且确定曲线拟合的统计学显著性值。如果显著性值超过显著性阈值,数据被认为不表现显著或有效生长。如果数据不表现显著或有效生长,数据集可被抛弃。如果显著性值没有超过显著性阈值,数据被认为表现显著或有效生长。如果数据集被确定为表现有效生长,该数据被进一步处理以确定S形或生长曲线的过渡值,例如PCR扩增曲线的基线区末端或elbow值或Ct值。文档编号G06F19/00GK101526476SQ20081014974公开日2009年9月9日申请日期2008年9月25日优先权日2007年9月25日发明者A·萨内,R·T·库尼克申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1