分析试样内靶分析物的方法及装置与流程

文档序号:20708169发布日期:2020-05-12 16:45阅读:368来源:国知局
分析试样内靶分析物的方法及装置与流程
本发明涉及分析试样内靶分析物的方法及装置。
背景技术
:为了核酸扩增而普遍使用的聚合酶链反应(polymersechainreacion,pcr)包括双链dna的改性、向dna模板的的寡核苷酸引物的退火及基于dna聚合酶的引物延伸的反复循环过程(mullis等,美国专利第4683195号、第4683202号及第4800159号;saikietal.,science230:1350-1354(1985))。实时聚合酶链反应(real-timepcr)为用于在试样实时检测靶核酸分子的基于聚合酶链反应的技术中的一种。为了检测特定靶分析物,实时聚合酶链反应利用与靶分子的量成比例来发生可检测的荧光信号的信号发生单元。获取包含各个测定位置及在上述测定位置中的信号值的数据集。荧光信号的强度与靶分子的量成比例。从数据集获取表示测定位置与荧光信号的强度关系的扩增曲线(amplificationcurve)或扩增轮廓曲线(amplificationprofilecurve)。通常,基于实时聚合酶链反应的扩增曲线分为基础线(baseline)区域、指数(exponential)区域、停滞(plateau)区域。指数区域为与聚合酶链反应扩增产物的增加成比例来释放的荧光信号增加的区域,停滞区域为聚合酶链反应扩增产物的增加及荧光信号的释放达到饱和状态而无法再增加荧光信号的区域。基础线区域为在聚合酶链反应初期循环中几乎没有荧光信号的变化的区域。在基础线区域中,聚合酶链反应产物所释放的荧光信号并不充分达到能够被检测的程度,因此,作为反应试样自身的荧光信号和测定系统自身的荧光信号的背景信号(backgroundsignal)可占据基础线区域的荧光信号的大部分。已开发了从实时聚合酶链反应的数据判断是否存在靶分析物的扩增的多种方法。例如,利用阈值(thresholdvalue)的方法。利用阈值的方法预先确定与需要分析的所有方法的特定的信号阈值(adefinedsignalthresholdforallreacionstobeanalyzed),判断数据集的信号值是否达到(reach)或超过(exceed)上述特定的信号阈值的方法。但是,利用特定的信号阈值来判断是否扩增有可能具有如下的判断错误,即,(i)非正常信号值或噪音信号值达到阈值而发生的假阳性判断,而并非为基于扩增的信号值;(ii)基于基线(baselining)错误的假阴性判断;以及(ⅲ)基于非正常信号值或噪音信号值的错误的(ct,cyclethreshold)值的算出。并且,利用阈值的方法存在为了导出适用于各个反应的特定的信号阈值而需要大量收集实际反应数据集的问题。jeffreylerner在美国授权专利第8560247号中揭示了如下的方法,即,获取对数据匹配的函数,根据上述函数的斜率(slope)是否大于最大扩增斜率界限(maximumamplificationslopebound)来确定是否存在跳跃错误(jumperror)。在上述方法中,当计算匹配数据的函数时,计算与在基础线区域中的一部分数据匹配的函数,而并非计算与整个数据匹配的函数。在上述方法中,若与数据匹配的基础线区域的函数的斜率大于最大扩增斜率界限,则确定为存在跳跃错误。因此,上述方法无法利用函数的最大扩增斜率来确定试样内是否存在靶分析物,仅可确定跳跃错误的存在与否。ronaldt.kurnik等揭示了如下的判断,即,判断美国公开专利第2009-0119020号中的如聚合酶链反应曲线的成长曲线(growthcurve)的数据是否有效(valid)或者是否显著(significant)成长。上述方法将数据与二次函数匹配来获取匹配的二次函数,在求出二次函数的统计学有意义的值(例如,r-square值)之后,判断统计学有意义的值是否大于预先确定的特定阈值(例如,0.90-0.99)。在上述方法中,在统计学有意义的值大于预先确定的阈值的情况下,确定为在数据中不存在有效或显著的成长(growth)。上述方法揭示了如下的结构,即,数据与二次函数越准确地匹配,靶分析物不存在的概率越高,因此,在r-square(r2)值大于阈值的情况下,将丢弃(discard)数据。但是,在上述方法中,利用二次函数的匹配来仅确定靶分析物不存在,为了判断靶分析物的存在,需要实施求出循环阈值的额外的步骤。作为用于判断在从实时聚合酶链反应获取的数据中是否存在有意义的靶分析物的扩增的方法,需要更加有效的方法。利用荧光信号的试样的分析如下进行。首先,通过led等的光源来向发光体供给能量,通过所接受的能量,在发光体的电子处于激活的状态并回到基态的过程中,发光体将释放(emit)特定波长的光。分析设备利用光二极管(photodiode)或ccd等来将特定波长的光变为电信号并提供试样分析所需要的信息。即使在试样中发生相同量的发光体,因设备之间光源(例如,led)等的光亮的差异(unevenillumination)、广电变换装置的性能偏差(variation),每个分析设备也将提供不同的信号值。将设备之间的信号差异称为设备间信号偏差。不仅是设备间信号偏差,而且通过单一的相同分析设备,对相同种类、相同量的靶分析物实施的多个反应的分析结果有可能具有信号偏差。这是因为如执行反应的设备上的反应容器的位置差异、反应混合物组成或浓度的细微差异的多种反应环境的差异。将在相同设备内的反应中的信号差异称为设备内信号偏差。为了测定数据的准确、可靠性高的分析,需要解决如信号偏差的问题,为了解决问题而使用多种方法。作为最基本的方法,利用硬件校准方法。例如,当生产分析设备时,如led光源的强度的各个分析设备的一部分部件的特性将被校准或调解,以减少对于相同试样的设备之间的信号偏差并维持在适当范围。另一方法为利用基准染色剂(referencedye)的方法。在反应中一同包含生成规定量的信号的基准染色剂(例如,roxtm或fluorescein),来利用从基准染色剂发生的信号来校准在试样中发生的信号。以往的方法具有几种限制。硬件校准在准确度方面存在限制,为了去除因分析设备的老化而发生的偏差而需要追加进行校准。此外,硬件校准仅可减少设备之间的信号偏差,而无法减少设备内信号偏差。利用基准染色剂的信号的校准将增加每次反应的成本,在各个反应中所利用的基准染色剂中的量及质的偏差(variation)有可能引起其他误差(error)。并且,基准染色剂的利用可以增加上述基准染色剂与在反应混合物中确定靶分析物的存在所利用的其他染色剂(dye)之间的干扰现象的可能性。尤其,在利用多个染色剂且需要检测这些荧光的多重聚合酶链反应中,干扰现象为极为重要的问题。并且,若为了信号校准而分配一个染色剂及一个检测通道,则可以同时检测一个少量的靶,因此,在产品竞争力侧面存在严重的缺陷。因此,需要开发在没有对于硬件的直接控制或不追加使用基准染色剂的情况下,可校准数据集并可减少设备之间及设备内信号偏差的新方法。另一方面,为了实时聚合酶链反应数据的准确且有再现性(repeatability)的分析,将所获取的扩增曲线的一般化(normalization)的过程极为重要。所获取的扩增曲线通过识别基础线区域的过程及去除基础线区域的背景信号(backgroundsignal)的过程实现一般化。背景信号(backgroundsignal)当发生聚合酶链反应时反应条件及环境的变化,因此,每次反应都不相同,频频发生与试样内的核算量无关的基础线移动(baselinedrift)。基础线移动将反应之间的扩增曲线的比较变得艰难,在检测靶核酸的过程中会轻松导致假阳性、假阴性结果。因此,在分析聚合酶链反应数据的过程中,需要基于基础线区域的设定及基础线来校准试验数据。以往的一种方法如下,即,将聚合酶链反应初期循环中的任意循环区域(例如,3-15循环)确定为基础线,或者,试验人员分析扩增曲线,将开始任意扩增之前的特定循环区域设定为基础线。以往的另一种方法如下,即,生成扩增曲线的二次微分(secondderivative)来将具有特征的点作为基础线的末端来确定基础线区域(美国专利授权公报第8219324号)。以往的方法具有几种缺点。在将所有基础线确定为任意循环区域的方法中,每次反应可以校准不同背景信号的变化,但是,在发生基础线移动的情况下并不适合。并且,扩增区域的开始根据存在于初期试样的靶核酸的量不同,因此,在预先确定基础线区域的情况下,将预先确定的基础线区域一律适用于多种样品并不优选。在试验人员任意确定基础线区域的情况下,即使是相同扩增曲线,根据进行分析的试验人员,基础线区域设定也将会改变,根据试验人员的确定,实际扩增产物的量也将改变,因此,很难导出可靠性结果。或者,根据以往的方法,基础线通过复杂的算法确定,算法需要并未明确定义的众多参数,很难实现最优化。因此,为了算出客观且准确的试验结果,各个样品需要提供客观基础线区域设定的新的扩增曲线校准方法。为了靶核酸序列的检测,普遍使用通过实时方式监控靶扩增病检测靶核酸序列的实时检测方法。通常,实时检测方法使用与靶核酸序列特异性杂交的标记的探针或引物。标记作为利用标记的探针与靶核酸序列之间的杂交的方法的例,利用具有发夹结构的双重标记的探针的molecularbeacon方法(tyagietal.,naturebiotechnologyv.14march1996)、hybeacon方法(frenchdjetal.,mol.cellprobes,15(6):363-374(2001))、利用通过供体及受体分别标记的2个探针的杂交探针方法(bernadetal,147-148clinchem2000;46)及利用单一标记的寡核苷酸的lux方法(美国专利第7537886号)。并且,利用基于双重标记的探针和dna聚合酶的5'核酸酶活性的上述探针的切割的taqman方法(美国专利第5210015号及第5538848号)广泛应用于本发明的
技术领域
中。作为利用标记的引物的方法的例,包括sunrise引物方法(nazarenkoetal,2516-2521nucleicacidsresearch,1997,v.25no.12及美国专利第6117635号,scorpion引物方法(whitcombeetal,804-807,naturebiotechnologyv.17august1999及美国专利第6326145)及tsg引物方法(wo2011/078441)。作为代替性方法,提出了利用根据靶核酸序列的存在形成的二聚物的实时检测方法。即,invader分析(美国专利第5691142号、第6358691号及第6194149号)、探测和标记寡核苷酸切割和延伸(ptoce,ptocleavageandextension)方法(wo2012/096523)、探测和标记寡核苷酸切割和延伸依赖信号寡核苷酸杂交(pce-sh,ptocleavageandextension-dependentsignalingoligonucleotidehybridization)方法(wo2013/115442)、探测和标记寡核苷酸切割和延伸依赖非杂交(pce-nh,ptocleavageandextension-dependentnon-hybridization)方法(pct/kr2013/012312)。在以往的实时检测工法中,与靶扩增有关或无关的信号扩增工序中,在一个选择的检测温度条件下检测从荧光标记生成的信号。根据以往的实时检测技术,当在单一反应容器内中利用单一类型的标记来检测多个靶核酸序列时,无法区分对靶核酸序列生成的信号。因此,在以往的实时检测工法中,通常,为了检测多个靶核酸序列而利用不同类型的标记。利用tm差异的熔解分析在利用单一类型的标记的情况下也可以检测多个靶核酸序列。但是,与实时技术相比,熔解分析消耗更长的时间,在靶序列越增加,具有不同tm的探针的设计越艰难的点上存在严重的缺陷。因此,若要开发不依赖熔解分析的在单一反应容器内利用单一类型的标记及单一类型的探测器检测多个靶核酸序列的方法,则可提供得到显著提高的便利性、费用效果及有效性检测多个靶核酸序列。并且,若将上述方法与其他检测方法(例如,熔解分析)相组合,则能够以显著提高的效率在单一反应容器内利用单一类型的标签检测多个靶核酸序列。整个说明书参照多个论文及发明文献并表示其引用。所引用的论文及专利文献的揭示内容全部作为参照包含在本说明书中,使得本发明所属
技术领域
的水平及本发明的内容变得更加明确。技术实现要素:技术问题本发明人员为了开发可在从信号发生反应获取的数据集中没有错误地(尤其,没有假阳性)分析靶分析物的技术而倾尽了努力。尤其,本发明人员为了可读用于在核酸扩增反应获取循环阈值的基于阈值(threshold)的设定的以往方法的问题及缺点而倾尽了努力。结果,本发明人员查明了对于从信号发生反应获取的数据集或加工的数据集(processeddataset)的非线性函数的匹配准确度(fittingaccuracy)可以为能够确定试样内靶分析物的存在或不存在的指标(indicator)。尤其,本发明人员查明了即使没有在核酸扩增反应获取循环阈值的阈值的设定,也可以利用匹配准确度来确定靶分析物的存在或不存在,并查明了可解决上述以往的问题。因此,本发明的目的在于,提供试样内靶分析物的分析方法。本发明的再一目的在于,提供试样内靶分析物的分析装置。本发明的另一目的在于,提供用于执行试样内靶分析物的分析的计算机可读记录介质。本发明的其他目的及优点通过以下的实施例、发明要求保护范围及附图变得更加明确。解决问题的手段i.利用非线性函数来分析试样内靶分析物的方法根据本发明的一实施方式,本发明提供包括如下步骤的试样内靶分析物的分析方法:获取与上述靶分析物有关的数据集的步骤,上述数据集从利用信号发生单元的信号发生反应获取,包含具有循环号码及信号值的多个数据位置;校准上述数据集的步骤;生成对于校准的上述数据集的非线性函数的步骤;确定对于校准的上述数据集的上述非线性函数的匹配准确度的步骤;以及利用上述匹配准确度来确定上述试样内靶分析物的存在或不存在的步骤。本发明为“分析靶分析物的方法”,分析结果最终用于靶分析物的检测,因此,也可以为“靶分析物的分析方法”或“靶分析物的检测方法”。图3为本发明的方法的流程图。参照图3,按各个步骤详细说明本发明的方法如下。获取与靶分析物有关的数据集(步骤310)根据本发明,获取与靶分析物有关的数据集。上述数据集从对于利用信号发生单元的上述靶分析物的信号发生反应获取,上述数据集包含具有循环号及信号值的多个数据点。在本说明书中,术语“靶分析物(targetanalyte)”包含多种物质(例如,如化合物的生物物质及非生物物质),具体地,为生物物质,更具体地,为核酸分子(例如,dna及rna)、蛋白质、肽、碳水化合物、脂质、氨基酸、生物化合物、激素、抗体、抗原及代谢物质。最具体地,靶分析物为靶核酸分子。在本说明书中,术语“靶核酸分子”、“靶核酸”、“靶核酸序列”或“靶序列”为需要分析、检测或定量的核酸序列。靶核酸序列可以为单链或双链。靶核酸序列包含在试样内初期存在的序列和在反应过程中生成的序列。靶核酸序列包含dna(gdna及cdna)、rna分子及这些的混合体(嵌合核酸)。上述序列可以为单链或双链形态。作为起始物质,在上述核酸序列为双链的情况下,可以将上述双链改性成单链或部分单链。改性过程可通过现有技术实施,例如,热量、碱、甲酰胺、尿素及乙醛酸处理、酶法(例如,解旋酶作用)及结合蛋白,但并不局限于此。例如,改性可通过80-105℃的温度进行热处理来实现。这种处理的一般方法揭示在josephsambrook,等,molecularcloning,alaboratorymanual,coldspringharborlaboratorypress,coldspringharbor,n.y.(2001)。靶核酸序列均包含任何自然(naturallyoccurring)原核细胞核酸、真核细胞(例如,原生动物和寄生动物、菌类、酵母、高等植物、低等动物以及包括哺乳动物和人类的高级动物)核酸、病毒(例如,疱疹病毒、hiv、流感病毒、爱泼斯坦-巴尔病毒、肝炎病毒、脊髓灰质炎病毒等)核酸或类病毒核酸。靶核酸序列包含可通过重组方法或化学合成法制备或可制备的核酸分子。因此,靶核酸序列可以存在或不存在于自然界。靶核酸序列包含公知或非公知的序列。在本说明书中,术语“试样”包含生物学试样(例如,细胞、组织及体液)及非生物试样(例如,食物、水及土壤),例如,上述生物学试样为病毒、细菌、组织、细胞、血液(包括全血、血浆和血清)、淋巴、骨髓、唾液、痰(sputum)、拭子(swab)、吸入液(aspiration)、牛奶、尿液、粪便、眼液、精液、脑提取液、脊髓液、关节液、胸腺液、支气管洗液、腹水及羊水。在靶分析物为靶核酸分子的情况下,上述试样可经过核酸提取(nucleicacidextract0ion)过程(参照:sambrook,j.etal.,molecularcloning.alaboratorymanual,3rded.coldspringharborpress(2001))。上述核酸提取过程可根据试样的种类改变。并且,在上述提取的核酸为rna的情况下,可追加经过用于合成cdna的逆转录(reversetranscription)过程(参照:sambrook,j.etal.,molecularcloning.alaboratorymanual,3rded.coldspringharborpress(2001)。在本说明书中,“信号发生反应”为依赖于试样内靶分析物的特性(properties)来发生信号的反应。例如,上述特性为靶分析物的活性、量或存在(或不存在),具体地,为试样内靶分析物的存在或不存在。本发明的信号发生反应包括生物反应及化学反应。上述生物反应包括如聚合酶链反应、实时聚合酶链反应、微阵列及侵染(invader)分析的遗传分析过程、免疫学分析过程及细菌生长分析。上述化学反应包括具有化学物质的生成、变化或破坏的化学分析过程。根据本发明的一实例,信号发生反应为遗传学分析过程。根据本发明的一实例,上述信号发生反应为核酸扩增反应、酶反应或微生物生长。信号发生反应伴随信号变化。在本说明书中,术语“信号”意味着可测定的输出(output)。信号发生反应的进行程度通过测定信号来评价。信号值或信号变化起到指示靶分析物的特性,具体地,定性或定量指示存在或不存在的指示者作用。上述信号变化包括信号的增加和减少。在本说明书中,术语“信号发生单元”为在表示需要分析的靶分析物的特性,具体地,表示存在或不存在的信号的发生所使用的物质。本发明公开了多种信号发生单元。信号发生单元包含标记。上述标记包含荧光标记、发光标记、化学发光标记、电化学标记及金属标记。包含单一标记或施主分子(donormolecule)及受体分子(acceptormolecule)的相互作用的双重标记能够以与一个以上的寡核苷酸相结合的形态使用。或者,嵌入染料(intercalatingdye)自身也可以知道作为信号发生单元的作用。上述信号发生单元为了发生信号而可以追加包含具有核酸切割活性的酶(例如,具有5'核酸切割活性的酶或具有3'核酸切割活性的酶)及寡核苷酸(例如,引物及探针)。在作为信号发生单元起到作用的寡核苷酸的例中,包含与靶核酸序列特异性杂交的寡核苷酸(例如,探针及引物)。在与靶核酸序列杂交的探针或引物被切割而释放片段的情况下,作为信号发生单元起到作用的寡核苷酸包含与上述片段特异性杂交的捕获寡核苷酸。在与上述捕获寡核苷酸杂交的片段延伸来形成延伸链的情况下,作为信号发生单元起到作用的寡核苷酸包含与上述延伸链特异性杂交的寡核苷酸。作为信号发生单元起到作用的寡核苷酸包含与上述捕获寡核苷酸特异性杂交的寡核苷酸。而且,作为信号发生单元起到作用的寡核苷酸包含这些的组合。根据本发明的一实例,上述信号发生单元包含荧光标记。更具体地,上述信号发生单元包含具有荧光单一标记或施主分子及受体分子的相互作用性双重标记(例如,包含荧光报道分子及淬灭分子的相互作用性双重标记)。已知利用上述信号发生单元来发生表示靶分析物,尤其,靶核酸分子的存在的信号的多种方法。上述方法包括如下方法,即,taqman探针方法(美国专利第5210015号)、分子信标法(tyagi等,naturebiotechnology,14(3):303(1996)),蝎子(scorpion)方法(whitcombe等,naturebiotechnology17:804-807(1999)),日出(sunrise或amplifluor)方法(nazarenko等,nucleicacidsresearch,25(12):2516-2521(1997),及美国专利第6117635号),lux方法(美国专利第7537886号),cpt(duckp,等.biotechniques,9:142-148(1990)),lna方法(美国专利第6977295号),plexor方法(sherrillcb,等,journaloftheamericanchemicalsociety,126:4550-4556(2004)),hybeacons方法(d.j.french,等,molecularandcellularprobes(2001)13,363-374及美国专利第7348141号),双重标记的自我猝灭的探针方法(dual-labeled,self-quenchedprobe;美国专利第5876930号),杂交探针方法(bernardps,etal.,clinchem2000,46,147-148),探测和标记寡核苷酸切割和延伸方法(wo2012/096523),探测和标记寡核苷酸切割和延伸依赖信号寡核苷酸杂交方法(wo2013/115442),探测和标记寡核苷酸切割和延伸依赖非杂交方法(pct/kr2013/012312)及cer方法(wo2011/037306)。根据本发明的一实例,上述信号发生反应为通过上述靶核酸分子的扩增或没有扩增地扩增信号值的反应。在本说明书中,术语“扩增反应”为增加或减少信号的反应。根据本发明的一实例,上述扩增反应为依赖于靶分析物的存在来通过上述信号发生单元发生的信号的增加(或扩增)反应。这种扩增反应可以伴随或不伴随靶分析物(例如,核酸分子)的扩增。更具体地,在本发明中,扩增反应为伴随靶分析物的扩增的信号的扩增反应。根据本发明的一实例,在用于使表示靶分析物(例如,靶核酸分子)的存在的信号扩增的扩增反应可通过使靶核酸分子将会扩增,且使信号也将扩增的方法实施(例如,实时聚合酶链反应方法)。或者,上述扩增反应可通过不使靶分析物扩增而仅使信号扩增的方法实施[例如,cpt方法(duckp,etal.,biotechniques,9:142-148(1990)),侵染检测(invaderassay)(美国专利第6358691号及第6194149号)]。靶分析物,尤其,靶核酸分子可通过多种方法扩增。例如,已知对于靶分析物的扩增的多种方法,上述方法包括聚合酶链反应、连接酶链反应(ligasechainreaction(lcr))(美国专利第4683195号及第4683202号;聚合酶链反应protocols:aguidetomethodsandapplications(innisetal.,eds,1990))、链置换扩增(stranddisplacementamplification(sda))(walker,etal.nucleicacidsres.20(7):1691-6(1992);walkerpcrmethodsappl3(1):1-6(1993))、转录介导扩增(transcription-mediatedamplification)(phyffer,etal.,j.clin.microbiol.34:834-841(1996);vuorinen,etal.,j.clin.microbiol.33:1856-1859(1995))、基于核酸序列扩增(nucleicacidsequence-basedamplification(nasba))(compton,nature350(6313):91-2(1991))、滚环扩增(rollingcircleamplification,rca)(lisby,mol.biotechnol.12(1):75-99(1999);hatchetal.,genet.anal.15(2):35-40(1999))及qb复制酶(q-betareplicase)(lizardietal.,bioltechnology6:1197(1988)),但并不局限于此。根据本发明的一实例,上述扩增反应伴随靶分析物(具体地,靶核酸分子)的扩增并使信号扩增。根据本发明的一实例,上述扩增反应根据聚合酶链反应或实时聚合酶链反应实施。根据本发明的一实例,上述信号发生单元依赖于二聚物的形成来生成信号。与信号发生单元一同使用的表现“依赖于二聚物的形成来生成信号”意味着所检测的信号依赖于两个核酸分子的结合或分离来提供。具体地,信号通过依赖于与上述靶核酸序列特异性杂交的介导寡核苷酸(mediationoligonucleotide)的切割来形成的二聚物生成。在本说明书中,术语“介导寡核苷酸”为介导不包含靶核酸序列的二聚物的生成的寡核苷酸。根据本发明的一实例,上述介导寡核苷酸自身的切割不生成信号,通过上述切割形成的片段在上述介导寡核苷酸的杂交及切割之后参与用于生成信号的连续反应。根据本发明的一实例,上述介导寡核苷酸包含与靶核酸序列杂交并切割来释放片段,以此介导二聚物的生成的寡核苷酸。具体地,上述片段在捕获寡核苷酸(captureoligonucleotide)中,通过上述片段的延伸介导二聚物的生成。根据本发明的一实例,上述介导寡核苷酸包含(i)具有与上述靶核酸序列互补性杂交核苷酸序列的3’-靶部位(targetingportion)及具有与上述靶核酸序列非互补性杂交的序列的5’-标记部位(taggingportion)。根据本发明的一实例,介导寡核苷酸的切割释放片段,上述片段与捕获寡核苷酸特异性杂交并在上述捕获寡核苷酸上延伸。根据本发明的一实例,与靶核酸序列杂交的介导寡核苷酸被切割来释放片段,上述片段与捕获寡核苷酸特异性杂交,上述片段延伸来形成延伸链,在上述延伸链及上述捕获寡核苷酸之间形成二聚物来提供表示上述靶核酸序列的存在的信号。发生依赖于二聚物的形成的信号的信号发生单元的代表例为探测和标记寡核苷酸切割和延伸方法(wo2012/096523)。根据本发明的一实例,上述信号发生单元依赖于检测寡核苷酸的切割来生成信号。具体地,上述信号通过上述检测寡核苷酸的杂交及上述检测寡核苷酸的切割在靶核酸序列生成。在靶核酸序列中,基于上述检测寡核苷酸的杂交及上述检测寡核苷酸的切割的信号可通过包括taqman探针方法(美国专利第5210015号及第5538848号)的多种方法生成。通过扩增反应获取的数据集包含扩增循环或循环号。在本说明书中,术语“循环”为在伴随规定条件的变化的多个测定过程中的上述条件的变化单位。例如,上述规定条件的变化为温度、反应时间、反应次数、浓度、ph和/或测定对象(例如,靶核酸分子)的复制次数等的增加或减少。因此,循环可以为时间(time)或过程(process)循环、单位操作(unitoperation)循环及再生产(reproductive)循环。作为一例,在测定基于基质的浓度的酶的基质分解能力的情况下,改变基质浓度来测定多次酶的基质分解程度之后,以此分析酶的基质分解能力。在此情况下,规定条件的变化为基质浓度的增加,所使用的基质浓度增加单位被设定为一个循环。作为另一例,在核酸的等温扩增反应(isothermalamplification)的情况下,可通过改变反应时间来多次测定一个试样,在此情况下,反应时间为条件的变化,反应时间单位被设定为一个循环。更具体地,术语“循环”为在反复规定过程的反应或以规定时间间隔基准反复进行反应的情况下的上述反复的一个单位。作为一例,在聚合酶链反应的情况下,一个循环意味着包括靶核酸分子的改性步骤(denaturation)、上述靶核酸分子及引物的之间的退火(杂交)步骤及引物的延伸步骤(extension)的反应单位。在此情况下,规定条件的变化为反应的反复次数的增加,包括上述一系列步骤的反应的反复单位对应一个循环。通过信号发生反应获取的数据集包含具有循环号及信号值的多个数据点。在本发明中,术语“信号的值”或“信号值”意味着在信号发生反应的循环中实质测定的信号的值(例如,信号的强度)或其的变形值。上述变形值可包含所测定的信号值的数学加工的值。所测定的信号值的数学加工的值的例可以包含所测定的信号值的对数值或导函数值(derivatives)。所测定的信号值的导函数值可以包含多重导函数值。在本说明书中,术语“数据点(datapoint)”意味着包含循环号及信号值的一个坐标值(acoordinatevalue)。术语“数据”意味着构成数据集的所有信息。例如,扩增反应的循环及信号值为数据。信号发生反应,尤其,通过扩增反应获取的多个数据点可通过在二维直角坐标系中呈现的坐标值表示。在上述坐标值中,x轴为扩增反应的对应的循环数,y轴为在对应循环中测定或加工的信号值。在本说明书中,术语“数据集”为多个上述数据点的集合。例如,数据集可以包含作为从利用信号发生单元的信号发生反应(例如,扩增反应)直接获取的数据点的集合的源数据集(rawdataset)。择一性地,可以为通过包含从上述信号发生反应直接获取的多个数据点的集合的数据集的变形获取的变形的数据集。上述数据集可包含从信号发生反应获取的多个数据点或其的变形的多个数据点的一部分或全部。数据集可以被绘图,可以从上述数据集获取的扩增曲线。根据本发明的一实例,本发明的方法追加包括实施用于获取数据集的信号发生反应的步骤。校准数据集(步骤320)上述步骤校准数据集。校准的数据集可将数据集标准化(标准化过程)来生成,或者去除(噪音去除过程)包含在数据集的噪音来提供。根据一实例,数据集利用标准化过程及噪音去除过程来校准。标准化过程可以在噪音去除过程之前或之后实施。(a)数据集的标准化数据集可通过公知的多种方法标准化。根据一实例,上述数据集的标准化通过本发明人员开发的在wo2017/086762中揭示的基于特定背景信号的标准化方法实施。在利用非线性匹配函数的本发明的方法适用上述基于特定背景信号的标准化方法,本发明所属
技术领域
的普通技术人员参照wo2017/086762及本发明的说明书轻松实施。以下将详细说明上述基于特定背景信号的标准化方法。根据一实例,上述数据集的标准化包括如下的步骤:利用在(i)基准循环中的信号值或(ii)在上述基准循环中的上述信号值的变形值来生成标准化系数的步骤;以及将上述标准化系数适用于上述数据集的信号值来生成校准的上述数据集,数据集可通过第一数据集标记,标准化的数据集可通过第二数据集标记。(a-1)生成标准化系数利用(i)在基准循环中的信号值或(ii)在基准循环中的信号值的变形值来生成标准化系数。在基准循环中的信号值可以为标准化系数。将在基准循环中的信号值适用于数据集的信号值来将数据集标准化。在一例中,可将数据集的信号值分为在基准循环中的信号值。在利用在基准循环中的信号值的变形值来生成标准化系数的情况下,可利用在基准循环中的信号值与基准值之间的关系来确定标准化系数。基准循环中的信号值与基准值之间的关系可以为基准循环中的信号值与基准值的差异。具体地,基准循环中的信号值与基准值的差异为基准循环中的信号值与基准值的比例(ratio)。根据一实例,利用变形值来将数据集标准化可以为通过变形值划分数据集的信号值。根据一实例,基准循环为一个循环或多个循环。具体地,数据集的5循环可以被选为基准循环。择一性地,4循环、5循环及6循环可被选为上述基准循环。在基准循环为多个循环的情况下,在多个循环中的信号值的平均值可作为在基准循环中的信号值使用。基准循环可以为在信号发生反应中未检测到信号扩增的循环。例如,在通过核酸扩增反应获取的数据集的情况下,基准循环可选自基础线区域。根据本发明的一实例,信号发生反应为包括基础线区域和信号扩增区域的反应,基准循环位于基础线区域。本发明的基准循环可以为第50循环、第40循环、第30循环、第20循环、第19循环、第18循环、第17循环、第16循环、第15循环、第14循环、第13循环、第12循环、第11循环、第10循环、第9循环或第8循环以下。具体地,基准循环可以为1-30循环、2-30循环、2-20循环、2-15循环、2-10循环、2-8循环、3-30循环、3-20循环、3-15循环、3-10循环、3-9循环、3-8循环、4-8循环或5-8循环中的一个循环。根据本发明的一实例,上述基准循环为一个循环。并且,上述基准循环可包括两个以上的循环,在基准循环中的信号值包括多个信号值。例如,第4循环、第5循环及第6循环可以被指定为基准循环,可将在基准循环中的信号值的平均值用为用于提供标准化系数的信号值。作为标准化系数,可以直接利用在基准循环中的信号值,并且,也可以利用在基准循环中的信号值的变形值。根据一实例,变形值可通过确定在基准循环中的信号值与基准值之间的关系来提供。在变形值通过在基准循环中的信号值与基准值的比例(ratio)确定的情况下,变形值可通过以下的数学式1提供。数学式1变形值=在基准循环中的信号值/基准值例如,基准循环为第5循环,第5循环中的信号值为13285相对荧光单位,当基准值为9000相对荧光单位时,变形值可以为1.48。基准值可以任意定义。具体地,基准值为在并非为0或1的实数中任意确定的值。根据一实例,基准值在多个循环中的信号值的平均值±标准偏差范围内确定。根据本发明的一实例,基准值如下确定,(i)通过对于基准总信号变化值(referencetotalsignalchangevalue)的标准数据集的纵信号变化值(totalsignalchangevalue)的比例确定,上述标准数据集通过对于已知浓度的靶分析物的信号发生反应获取,(ii)通过标准数据集确定。具体地,利用对于基准总信号变化值的标准数据集的总信号变化值的比例来校准标准数据集的基准循环的信号值,从校准的标准数据集的基准循环的信号值确定基准值。在一例中,校准的标准数据集的基准循环的信号值被确定为基准值。标准数据集为通过对于已知浓度的靶分析物的信号发生反应获取的数据集。根据本发明的一实例,上述数据集利用总信号变化值进行校准。在本说明书中,术语“总信号变化值(totalsignalchangevalue)”为在数据集中(增加或减少的)的信号变化量。在数据集的一区间确定总信号变化值的情况下,在数据集的一区域中的最初循环及最后循环中的信号值的差异或在在数据集的一区域中的最大信号值与最小信号值的差异被确定为总信号变化值。在信号发生反应相同的条件下,在利用相同浓度的靶分析物来实施的情况下,相同总信号变化值可以从相同或不同的装置理论性算出。因此,在以总信号变化值为基准校准数据集的情况下,多个数据集之间的偏差将会减少。根据本发明的一实例,基准总信号变化值为通过与靶分析物有关的数据集单独的信号发生反应获取的标准数据集的总信号变化值。本发明的基准总信号变化值可以从通过对于已知浓度的靶分析物的信号发生反应获取的数据集确定。可通过划分以基准值进行标准化的在数据集中的基准循环的信号值来提供标准化系数。(a-2)将标准化系数适用于数据集将标准化系数适用于数据集来生成标准化的数据集。将标准化系数适用于数据集的方式多种多样。在将标准化系数通过比例确定的情况下,标准化系数如数学式2适用来生成标准化的数据集。数学式2第二数据集的信号值=第一数据集的信号值/标准化系数在数学式2中,第一数据集为标准化之前的数据集,第二数据集为标准化之后的数据集。根据本发明的一实例,上述信号发生反应包含在另一反应环境中对于相同靶分析物的多个信号发生反应,上述数据集为多个数据集,多个上述数据集从多个上述信号发生反应的多个集获取,上述基准循环或上述基准循环和上述基准值相同地适用于多个上述数据集。根据一实例,多个上述信号发生反应在包括不同的多个设备、不同的多个反应管或容器、不同的多个试样、不同量的靶分析物或不同的多个引物或探针的其他反应环境中实施。根据一实例,校准的上述数据集(i)通过在上述数据集适用上述标准化系数来生成标准化的数据集,或者(ii)对上述数据集或上述标准化的数据集进行基线来生成。(b)在上述数据集中去除噪音(b-1)基线(b-1-a)以往基线方法根据本发明的一实例,上述数据集或标准化的数据集可以为了从上述数据集或标准化的数据集去除背景信号而进行基线。基础线扣除的数据集(baselinesubtracteddataset)可通过本发明所属
技术领域
的多种方法获取(美国专利第8560247号及wo2016/052991)。(b-1-b)利用具有对称轴的二次函数来进行基线上述接近法为由本发明人员开发的新的基线方法。包含标准化之前的数据集及标准化之后的数据集的数据集可利用具有对称轴的二次函数来进行基线。利用二次函数来对数据集进行基线意味着通过在数据集扣除二次函数来校准数据集。二次函数的生成确定二次函数的对称轴,确定匹配区间,在匹配区间内可以实施数据集与二次函数的匹配。二次函数的对称轴能够以信号发生反应的最终循环确定。二次函数为y=a(x-b)2+c形态的函数。b为二次函数的对称轴。根据本发明的一实例,二次函数的对称轴可以在最终循环±10、最终循环±8、最终循环±6、最终循环±5、最终循环±3、最终循环±2或最终循环±1的范围确定。基于二次函数的匹配区间可通过多种方法确定。首先,匹配区间可以为在从开始匹配循环至预先设定的最小匹配循环的区域中确定。开始匹配循环可以为0循环、1循环、2循环、3循环、4循环、5循环、6循环、7循环、8循环或9循环。最小匹配循环可以为7循环、8循环、9循环、10循环、11循环、12循环、13循环、14循环、15循环、16循环、17循环、18循环、19循环、20循环或21循环。择一性地,当确定匹配区间时,可以使用二次函数。在匹配区间的确定所使用的二次函数被标记为第一二次函数,在数据集的校准所使用的二次函数被标记为第二二次函数。第一二次函数在整个区间中与数据集匹配,第二二次函数在匹配区间中与数据集匹配。并且,第一二次函数不具有对称轴,第二二次函数具有对称轴。匹配区间的最终循环以(i)当第一二次函数最小时的循环(cmin)和/或(ii)最小匹配循环为基础确定。例如,匹配区间的最终循环通过在(i)cmin去除n[n为0或正整数(具体地,1-5的整数)]的循环和(ii)最小匹配循环(mfc)中大的循环确定。在确定的上述匹配区间内,数据集或标准化的数据集与具有对称轴的二次函数匹配,之后,通过具有对称轴的二次函数扣除基础线。(b-2)扣除阴性对比组可从数据集扣除阴性对比组(negativecontrol)来在数据集中去除噪音。在用于阴性对比组的信号发生反应的反应物中,用于进行反应的必要成分没有1个以上的试验组。例如,在核酸扩增反应中,阴性对比组为没有靶分析物、引物或聚合酶的试验组。或者,阴性对比组为仅具有缓冲液的试验组。具体地,在本发明中所利用的阴性对比组为具有用于在核酸扩增反应中除靶核酸分子之外的核酸扩增的成分的试验组。阴性对比组的扣除可以从与靶分析物的数据集的信号值扣除阴性对比组的信号值来实施。具体地,与靶分析物有关的数据集的信号值和阴性对比组的信号值在相同反应及测定环境下获取,例如,是在一个相同扩增及分析装置中的相同反应运行(run)中获取的信号值。生成对于校准的数据集的非线性函数(步骤330)对于校准的数据集的非线性函数(non-linearfunction)以匹配函数生成。在本步骤中,可根据非线性回归分析方法实施。多种以往的非线性回归分析方法可用于本发明(参照:seber,g.a.f.;wild,c.j.(1989).nonlinearregression.newyork:johnwileyandsons)。例如,多项函数、指数函数、对数函数、三角函数或s型函数可作为非线性函数使用。根据本发明的一实例,在本发明中利用的非线性函数为s型函数。在本说明书中,术语“s型函数”为可呈现s型形态的曲线的函数,包括逻辑函数、gompertz函数或chapman函数。生成与校准的数据集匹配的非线性函数。生成非线性函数意味着确定与校准的数据集最相同(或最好呈现的)的非线性函数。本步骤基本通过非线性回归分析方法实施。在本发明的一实例中,上述非线性函数可以为包括通过以下数学式3表示的4个参数的s型函数。数学式3在上述数学式中,f(x)为匹配函数,表示s型函数,x为上述信号发生反应的循环号,a1、a2、a3及a4分别表示上述s型函数的参数。根据一实例,在上述数学式3中,a1为背景信号值,a2-a1为最大信号值与背景信号值之间的差异,a3为确定s型函数的拐点(inflectionpoint)的x值的参数,a4为确定s型函数的锐度(sharpness)的参数,a3及a4为合并确定s型函数的形态(shape)的参数。s型函数的生成可以为通过反复计算确定a1、a2、a3及a4的过程。非线性函数的生成可以在上述数据集的校准后或之前实施。具体地,上述非线性函数的生成在上述数据集的校准后实施。确定非线性函数的匹配准确度(步骤340)在生成非线性函数之后,确定对于校准的数据集的非线性函数的匹配准确度。在本说明书中,术语“匹配准确度”包含(a)非线性函数与实际测定值(数据集或校准的数据集)的接近程度,即,匹配的优秀度(goodnessoffit)及(b)原因变数(explanatoryvariable)对预测反应变数(responsevariable)的有用性值。通常,匹配的优秀度为x2值(chisquarevalue),预测有用性值为r2值。根据本发明的一实例,匹配准确度为对于校准的数据集的非线性函数的x2值(chisquarevalue)或r2值。更具体地,上述匹配准确度为r2值。r2值可利用数学式4来计算。数学式4适用于整个循环。数学式4yi:数据集的各个循环中的信号值fi:s型函数的各个循环中的函数值ym:数据集的信号值的平均值l:匹配区间的最后循环n:整个循环的数数学式4表示相对于数据集的全部分散的误差(error)的分散。误差为数据集与s型函数的差异。在数学式4中,数据集可以为标准化的数据集或标准化及基线的数据集。利用匹配准确度来确定靶分析物的存在或不存在(步骤350)利用对于校准的数据集的非线性函数的匹配准确度来确定试样内靶分析物的存在或不存在。本发明的特征中的一种为将非线性函数的匹配准确度用成确定靶分析物的存在与否的直接指标。试样内靶分析物的存在与否利用(具体地,直接利用)非线性函数的匹配准确度来确定,这确定靶分析物的存在与否,尤其,不利用循环阈值,而是仅利用上述匹配准确度或者一同利用上述匹配准确度与其他基准(具体地,与非线性匹配函数有关的多个参数)。具有在核酸扩增曲线适用s型函数的现有技术,但不具有将非线性函数的匹配准确度用成确定靶分析物的存在与否的直接指标的例。例如,如上所述,美国公开专利第2009/0119020号利用s型函数的r2值来确定数据组是否呈现显着或有效增长。根据美国公开专利第2009/0119020号的使用说明,利用匹配函数的r2值仅可确定靶分析物的不存在。为了确定靶分析物的存在,在美国公开专利第2009/0119020号中需要获取多个循环阈值的追加步骤。本发明直接利用非线性函数的匹配准确度(例如,r2值),在没有多个循环阈值的帮助的情况下,可以确定试样内靶分析物的存在或不存在。并且,在美国公开专利第2009/0119020号中,在多个r2值大于阈值(例如,0.90-0.99)的情况下,数据集并不呈现出显着或有效增长,即,表示试样内靶分析物的不存在。这种接近法与在匹配准确度(例如,r2值)大于阈值(例如,0.90-0.99)的情况下,确定为靶分析物的存在的后述本发明的方法的一实例相反。根据本发明的一实例,确定上述靶分析物的存在或不存在的步骤通过对匹配准确度与匹配准确度有关阈值进行比较来实施。更具体地,确定上述靶分析物的存在或不存在的步骤通过评价上述匹配准确度是否大于上述阈值来实施。在匹配准确度大于阈值的情况下,可确定靶分析物存在于试样内。在匹配准确度为上述阈值以下的情况下,可确定靶分析物不存在于试样内。在作为匹配准确度利用r2值的情况下,阈值为0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98或0.99。靶分析物的存在或不存在仅可利用非线性函数的匹配准确度来确定。择一性地,尤其,靶分析物的存在或不存在不利用循环阈值,而是利用匹配准确度和追加基准(具体地,与非线性匹配函数有关的参数)来确定。根据一实例,上述试样内靶分析物的存在或不存在的确定追加利用选自由(i)上述数据集、校准的上述数据集或上述非线性函数的变位及(ii)上述非线性函数的最大斜率组成的组中的至少一个参数来实施。根据一实例,上述试样内靶分析物的存在或不存在的确定追加利用选自由(i)包含上述数据集、校准的上述数据集或上述4个参数的s型函数的变位及(ii)包含上述4个参数的s型函数的最大斜率及a4组成的组中的至少一个参数来实施。追加的考虑事项(considerations)确定试样内靶分析物的不存在尤其有用。非线性函数的匹配准确度为起到确定靶分析物的存在或不存在的唯一指标的作用,但是,追加考虑事项可用于更加有效地过滤不包含靶分析物的阴性样品。并且,与阴性样品有关的多个信号值呈现出理论上较低的匹配准确度。但是,时而具有高的匹配准确度。因此,需要过滤掉有可能导致假阳性结果的阴性样品。上述数据集,校准的上述数据集或上述非线性函数的变位用于确定试样内靶分析物的不存在。在本说明书中,术语“变位”为在数据集中的信号变化程度,具体地,从基准信号值的信号变化程度。其中,基准信号值可以为最小的信号值、第一个循环信号值、基础线区域的平均信号值或扩增区域开始点中的信号值。在计算变位的过程中,最终信号值可以为最大的信号值、最终循环的信号值或停滞(plateau)区域的平均信号值。通过多种方式实施考虑或利用变位来确定靶分析物的存在或不存在。例如,在数据集的变位小于与变位有关的阈值的情况下,上述数据集可以被判断为阴性。在信号发生反应为扩增反应的情况下,与变位有关的阈值为相对荧光单位(rfu,relativefluorescenceunit)70、80、90、100、110、120、130、140或150。并且,其他考虑要素为非线性函数的最大斜率。对于阳性试样的扩增曲线包括信号值剧增的扩增区间,对于阴性试样的扩增曲线没有信号值剧增的扩增区间。因此,可考虑非线性函数的最大斜率来判断对于试样的靶分析物的阳性及阴性。根据本发明的一实例,本发明的方法包括:生成上述非线性函数的最大斜率的步骤;以及对上述最大斜率与阈值进行比较来确定为上述试样内上述靶分析物不存在的步骤。计算非线性函数的最大斜率的方法多种多样。例如,对非线性函数进行微分,将微分的非线性函数的最大值确定为最大斜率。与最大斜率有关的阈值可通过多种方式设定。例如,阈值能够以分析多个试样的结果为基础设定。例如,可分析阳性或阴性预先确定的多个试样中的非线性函数的最大斜率,并可选择适当的阈值。例如,与最大斜率有关的阈值为10-50、20-50、30-50、10-40、20-40或30-40,尤其,为20-40。在非线性函数的最大斜率为阈值以上的情况下,确定为试样内靶分析物存在,在上述最大斜率小于阈值的情况下,确定为试样内靶分析物不存在。并且,其他追加考虑要素为表示非线性函数的形态的参数。在本发明的一实例中,利用表示非线性函数的形态的参数来确定靶核酸序列是否存在。具体地,利用作为包含4个参数的s型函数的数学式3的a4。在a4用于确定试样内靶分析物存在或不存在的情况下,与a4有关的阈值可以被设定为0.07、0.08或0.09。若a4大于阈值,则将数据集判断为非正常信号,并确定为靶分析物不存在于试样内。根据本发明的一实例,本发明的方法追加包括在上述非线性匹配函数适用信号阈值来获取循环阈值的步骤。本发明可以不利用信号阈值(即,循环阈值)并确定试样内靶分析物的存在或不存在,但是,对试验人员来说,有可能需要循环阈值。例如,在需要靶分析物的定量信息的情况下,一般需要循环阈值。为了增加本发明方法的分析可靠性,确定试样内靶分析物的存在或不存在可一同使用非线性函数的匹配准确度和循环阈值。例如,仅在非线性匹配函数的匹配准确度大于与匹配准确度有关的阈值,不仅如此,在循环阈值大于与循环阈值有关的阈值的情况下,确定为靶分析物存在于试样内。ⅱ.利用非线性函数的试样内靶分析物的分析装置及计算机可读记录介质根据本发明的再一实施方式,本发明提供包括如下部件的试样内靶分析物的分析装置:存储器;以及处理器,上述存储器存储与上述靶分析物有关的数据集,利用上述数据集从利用信号发生单元的信号发生反应获取,包含具有循环号及信号值的多个数据点,上述处理器校准上述数据集,生成对于校准的上述数据集的非线性函数,确定对于校准的上述数据集的上述非线性函数的匹配准确度,利用上述匹配准确度确定上述试样内靶分析物的存在或不存在。根据本发明的另一实施方式,本发明提供非暂时性(non-transitory)计算机可读记录介质,包括多个指示,上述多个指示体现用于执行方法的处理器,上述方法包括:获取与上述靶分析物有关的数据集的步骤,上述数据集从利用信号发生单元的信号发生反应获取,包含具有循环号码及信号值的多个数据位置;校准上述数据集的步骤;生成对于校准的上述数据集的非线性函数的步骤;确定对于校准的上述数据集的上述非线性函数的匹配准确度的步骤;以及利用上述匹配准确度来确定上述试样内靶分析物的存在或不存在的步骤。上述本发明的记录介质、装置计算机程序用于在计算机中实施本发明的方法,这些之间的相同内容为了避免基于反复记载的本说明书的过度复杂性而省略对其的记载。当通过处理器执行时,多个程序指示使处理器执行上述本发明的方法。执行本发明的方法的多个程序指示可以包括如下指示:(i)校准上述数据集的指示;(ii)生成对于校准的上述数据集的非线性函数的指示;(iii)确定对于校准的上述数据集的上述非线性函数的匹配准确度的指示;以及(iv)利用上述匹配准确度来确定上述试样内靶分析物的存在或不存在的指示。本发明的方法在处理器中执行,上述处理器可以为如独立执行型计算机(standalonecomputer)、网络附着计算机或实时聚合酶链反应装置的存在于数据获取装置的处理器。计算机可读记录介质包括本发明所属
技术领域
的存储介质,例如,cd-r、cd-rom、dvd、闪存、软盘、硬盘、便携式硬盘、usb、磁带、minidisc、非易失性存储卡、eeprom、光盘、光存储介质、ram、rom、系统存储设备、网络服务器,但并不局限于此。数据集可通过多种方式收集。例如,数据集可通过存在于聚合酶链反应数据收集装置的处理器收集。数据集可以实时向处理器提供,或者存储于存储单元或缓冲器并在完成试验之后向处理器提供。类似地,数据集可通过与上述收集装置的网络连接(例如,lan、vpn、网络及内联网)或直接连接(例如,usb或其他直接有线连接或无线连接)向如台式计算机系统的额外的系统提供。或者,可向如cd、dvd、软盘及便携式硬盘的便携式介质提供。类似地,数据集可通过网络连接(例如,lan、vpn、网络、内联网及无线通信网络)向如笔记本或台式计算机系统的客户连接的服务器系统提供。体现执行本发明的处理器的多个指示可包含在逻辑系统。上述指示虽然可以向软件记录介质(例如,便携式硬盘、usb、软盘、cd及dvd)提供,可下载且可存储于存储模块(例如,如硬盘驱动器或逻辑或附着ram或rom的其他存储器)。执行本发明的计算机代码可通过如c、c++、java、visualbasic、vbscript、javascript、perl及xml的多种代码语言执行。并且,多种语言及协议可用于本发明的数据和指令的外部及内部存储和传递。根据本发明的一实例,本发明的装置可包括能够收容试样及信号发生单元的反应容器、调节上述反应容器的温度的温度调节单元和/或检测在循环号中的信号的探测器。计算机处理器可以被构建成一个处理器进行上述所有操作。择一性地,处理单元可以被构建成多个处理器执行各个操作。根据本发明的一实例,处理器可以在用于靶分析物(例如,靶核酸分子)的检测的以往的装置(例如,实时聚合酶链反应装置)安装软件来体现。ⅲ.利用二次函数来分析试样内靶分析物的方法根据本发明的另一实施方式,本发明提供包括如下步骤的试样内靶分析物的分析方法:获取与上述靶分析物有关的数据集的步骤,上述数据集从利用信号发生单元的信号发生反应获取,包含具有循环号及信号值的多个数据点;在上述数据集的基础线区域的匹配区间生成与上述数据集匹配的二次函数的步骤;以及在上述数据集扣除上述二次函数来校准上述数据集的步骤。在本发明的第一个及第三个实施方式之间的相同的内容为了避免本说明书的过度复杂性而省略对其的记载。本发明人员为了克服上述现有技术的问题及缺点,尤其,基于在核酸扩增反应用于获取循环阈值的阈值设定的以往的问题而倾尽了努力。结果,本发明人员说明了对于从信号发生反应获取的数据集的匹配函数的多种参数,具体地,当匹配二次函数最小时的循环(cmin)、x2的系数或匹配准确度可以为确定靶分析物的存在或不存在的指标。并且,本发明人员为了改善以往的基础方法而倾尽了努力,可以在匹配区间中,利用与数据集匹配的二次函数来有效且轻松地进行基线。本发明通过分析靶分析物的方法表现,也可通过对于靶分析物有关的数据集进行基线的方法表现。获取对于靶分析物数据集本步骤可参照在本发明的第一个实施方式中记载的内容说明。生成与数据集匹配的二次函数作为匹配函数,对于数据集的二次函数在上述数据集的基础线区域的匹配区间中生成。为了进行匹配,本发明可利用多种以往的非线性回归分析方法(参照:seber,g.a.f.;wild,c.j.(1989).nonlinearregression.newyork:johnwileyandsons)。本步骤可参照利用与具有上述对称轴的二次函数的基线有关的内容来说明。包含校准前后的数据集的数据集可以与二次函数匹配。根据一实例,上述二次函数具有对称轴。根据一实例,上述二次函数的对称轴以信号发生反应的最终循环为基础确定。更具体地,上述二次函数的对称轴在最终循环±10、最终循环±8、最终循环±6、最终循环±5、最终循环±3、最终循环±2或最终循环±1的范围内确定。二次函数的生成可确定二次函数的对称轴,确定匹配区间,在上述匹配区间中将上述数据集与上述二次函数匹配来实施。二次函数可通过y=a(x-b)2+c表现(a为x2的系数,b为对称轴,c为y轴截距)。匹配区间可以在数据集的基础线区域内确定。上述匹配区间可通过多种方法确定。首先,匹配区间可预先确定。根据一实例,匹配区间为从开始匹配循环至最小匹配循环。根据本发明的一实例,在上述数据集的变位大于与上述变位有关的阈值的情况下,上述匹配区间为从开始匹配循环至最小匹配循环。更具体地,在数据集的最大值与最小值之间的差异大于固定阈值(例如,相对荧光单位100、200、300或400)的情况下,或者,数据集的最终值与初始值的差异大于规定阈值(例如,相对荧光单位0)的情况下,上述匹配区间在从开始匹配循环至最小匹配循环的区间确定。开始匹配循环可以为0循环、1循环、2循环、3循环、4循环、5循环、6循环、7循环、8循环或9循环。最小匹配循环可以为7循环、8循环、9循环、10循环、11循环、12循环、13循环、14循环、15循环、16循环、17循环、18循环、19循环、20循环或21循环。根据本发明的一实例,匹配区间为数据集的1-20循环、2-20循环、3-20循环、4-20循环、5-20循环、6-20循环、1-18循环、2-18循环、3-18循环、4-18循环、5-18循环、6-18循环、1-16循环、2-16循环、3-16循环、4-16循环、5-16循环、6-16循环、1-14循环、2-14循环、3-14循环、4-14循环、5-14循环、1-12循环、2-12循环、3-12循环或4-12循环。第二,匹配区间可利用二次函数确定。在本说明书中,用于确定匹配区间的二次函数被命名为第一二次函数,用于校准的数据集的二次函数被命名为第二二次函数。根据一实例,在上述方法中,在生成二次函数的步骤之前,追加包括在整个区间生成与上述数据集匹配的第一二次函数的步骤,而且,上述匹配区间(具体地,上述匹配区间的最终循环)以上述第一二次函数具有最小信号值的循环(cmin)为基础确定。第一二次函数不具有对称轴,第二二次函数具有对称轴。上述匹配区间的最终循环以(i)第一二次函数为最小时的循环(cmin)和/或(ii)最小匹配循环为基础确定。例如,匹配区间的最终循环通过在(i)cmin中去除n[n为0或正整数(具体地,1-5的整数)]的循环和(ii)最小匹配循环(mfc)中大的循环确定。在数据集中扣除二次函数来校准数据集上述数据集通过在上述数据集中扣除上述二次函数来校准。根据一实例,上述方法追加包括:确定对于校准的上述数据集的上述二次函数的匹配准确度的步骤;以及利用上述匹配准确度来确定试样内靶分析物的存在或不存在的步骤。对于上述二次函数的匹配准确度可在上述匹配区间中确定。上述数据集及二次函数之间的匹配准确度利用在匹配区间中的多个信号值来确定。根据本发明的一实例,上述匹配准确度为与上述数据集和上述二次函数有关的x2值(chisquarevalue)或r2值,更具体地,为r2值。r2值可利用数学式5计算。数学式5数学式5表示相对于数据集的全部分散的误差(error)的分散。误差为数据集与二次函数的差异。yi为在数据集的各个循环中的信号值。fi为二次函数的值。ym为数据集的平均值。l为匹配区间的最终循环。s为匹配区间的开始循环。l-s为匹配区间的长度。n为整个循环的数。本发明的特征中的一种如下,即,将二次函数的匹配准确度用成靶分析物的分析,尤其,确定靶分析物的存在或不存在,尤其,确定不存在的直接指标。如本发明人员所知(toourbestknowledge),不具有将二次函数的匹配准确度用成在匹配区间中确定靶分析物是否不存在的直接指标的例。根据本发明的一实例,在确定试样内靶分析物的存在或不存在的步骤中,若匹配准确度小于阈值,则确定为试样内不存在靶分析物。如上所述,匹配准确度可被用于确定靶分析物的存在或不存在,尤其,可被用于确定不存在的直接指标,因此,可通过比较阈值与匹配准确度来简单确定靶分析物的不存在。与在匹配区间中的匹配准确度有关的阈值可以为本发明所属
技术领域
中通常利用的阈值。例如,作为匹配准确度,在利用r2值的情况下,阈值可以为0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96或0.97。并且,试样内靶分析物的存在或不存在能够以(i)第一二次函数具有最初信号值的循环(cmin)和/或(ii)第一二次函数的x2的系数为基础确定。根据本发明的一实例,上述确定为试样内靶分析物不存在的确定。根据本发明的一实例,在确定上述靶分析物不存在的步骤中,在上述cmin大于上述阈值的情况下,确定为试样内不存在靶分析物。本发明的特征中的一种如下,上述cmin被用成确定靶分析物不存在的直接指标。具有在核酸扩增曲线适用匹配函数的现有文献,不具有将上述cmin用成确定靶分析物的不存在的直接指标的例。如上所述,可将上述cmin用成确定靶分析物的不存在的直接指标,因此,上述靶分析物的不存在可以对上述阈值于cmin进行比较来轻松确定。阈值,例如,为循环27、28、29、30、31、32、33、34、35、36、37、38、39或40。择一性地,在确定试样内靶分析物的存在或不存在的步骤中,通过评价第一二次函数的x2的系数是否小于0来确定上述试样内靶分析物是否存在。如本发明人员所知(toourbestknowledge),可以将第一二次函数的x2的系数小于0的数据集全部处理成阴性结果。如上所述,上述cmin、第一二次函数的x2的系数及第二二次函数的匹配准确度可被用成确定试样内靶分析物的不存在的指标。ⅳ.本发明与mudt技术的组合本申请人员开发了在单一反应容器中利用单一类型的探测器来检测多个靶核酸序列的mudt技术(wo2015/147412)。在mudt技术中,具有相对低的检测温度的靶核酸序列的存在通过(i)在相对高的检测温度及相对低的检测温度条件下均检测的信号及(ii)在其他检测温度条件下呈现出信号的变化关系的基准值确定。在第一靶核酸序列为具有相对高的检测温度的靶核酸序列,第二靶核酸序列为具有相对低的检测温度的靶核酸序列的情况下,利用与第一靶核酸序列有关的基准值去除与第一靶核酸序列有关的信号,由此,与第二靶核酸序列有关的信号从在相对低的检测温度条件下检测的信号提取。对无法通过以往的单一类型的探测器区别的单独获取与第一靶核酸序列有关的信号及与第二靶核酸序列有关的信号的方法与以往方法进行比较,mudt技术得到显著的改善。尤其,在从均包含具有相对高的检测温度的靶核酸序列及具有相对低的检测温度的靶核酸序列的样品(相同感染样品)提取与靶核酸序列的信号的过程中,上述方法呈现出相当的准确度。利用非线性匹配函数的本发明可以与mudt技术良好的组合。根据一实例,上述数据集包含(i)作为在相对高的检测温度条件下检测的信号的与第一靶核酸序列有关的信号和/或(ii)从在相对低的检测温度条件下检测的信号提取的与第二靶核酸序列有关的信号,而且,上述第一靶核酸序列及上述第二靶核酸序列从一个反应容器检测。根据一实例,上述与第一靶核酸序列有关的信号及上述与第二靶核酸序列有关的信号通过如下步骤获取:步骤(a),在上述反应容器中,与上述试样一同培养能够发生与上述第一靶核酸序列有关的信号的第一信号发生单元及能够发生与上述第二靶核酸序列有关的信号的第二信号发生单元,在上述相对高的检测温度及上述相对低的检测温度条件下检测信号,上述第一靶核酸序列及第二靶核酸序列通过相应的信号发生单元检测,在上述第一靶核酸序列不存在于上述试样中的情况下,上述第一信号发生单元在上述相对高的检测温度及上述相对低的检测温度条件下发生信号,在上述第二靶核酸序列存在于上述试样中的情况下,在上述相对低的检测温度条件下发生信号;步骤(b),在上述相对低的检测温度条件下检测的信号是否满足通过第一阈值或第一信号变位定义的第一基准,当在上述相对低的检测温度条件下检测的信号满足上述第一基准时,进行下一个步骤(c),当在上述相对低的检测温度条件下检测的信号不满足上述第一基准时,确定为上述第一靶核酸序列及上述第二靶核酸序列不存在于上述试样中,不进行下一个步骤(c);以及步骤(c),利用(i)用于从在上述相对低的检测温度条件下检测的信号去除与上述第一靶核酸序列有关的信号的基准值及(ii)在上述相对低的检测温度条件下检测的信号来从在上述相对低的检测温度条件下检测的信号提取与上述第二靶核酸序列有关的信号。根据一实例,上述与第二靶核酸序列有关的信号通过以下数学式6提供。数学式6与第二靶核酸序列有关的信号=[在相对低的检测温度条件下检测的信号]-[(在相对高的检测温度条件下检测的信号)×(与第一靶核酸序列有关的基准值)]在本说明书中所使用的术语“具有相对高的检测温度的靶核酸序列”意味着可以在2个检测温度中的相对高的检测温度条件下发生信号,也可以在相对低的检测温度条件下发生信号的靶核酸序列。相反,“具有相对低的检测温度的靶核酸序列”意味着在2个检测温度中的相对低的检测温度条件下发生信号,在相对高的检测温度条件下不发生信号的靶核酸序列。相对高的检测温度为可生成与具有相对高的检测温度的靶核酸序列有关的信号的温度,相对低的检测温度可以为均生成与具有相对低的检测温度的靶核酸序列有关的信号及与具有相对高的检测温度的靶核酸序列有关的信号的温度。相对高的检测温度可以通过第一检测温度表现,相对低的检测温度可以通过第二检测温度表现。根据一实例,可确定执行检测的相对高的检测温度和相对低的检测温度。例如,相对高的检测温度和相对低的检测温度可以分别确定为72℃和60℃。之后,构建适合上述检测温度的信号发生单元。根据一实例,当上述信号发生单元通过依赖于二聚物的形成的方式发生信号时,上述检测温度可通过调节上述二聚物的tm值来控制。在信号通过依赖于靶核酸序列的存在来形成的二聚物生成的情况下,上述信号的检测在通过调节二聚物的tm值来确定的温度条件下成功执行。例如,在信号通过探测和标记寡核苷酸切割和延伸方法方法生成的情况下,信号的检测在通过调节探测和标记寡核苷酸片段在cto上延伸而成的延伸二聚物的tm值来确定的温度条件下成功执行。基准值为用于从在相对低的检测温度条件下检测的信号去除与第一靶核酸序列有关的信号的值。在本发明的一实例中,基准值为当在相对高的检测温度和相对低的检测温度条件下存在试样内第一靶核酸序列时,呈现出通过第一信号发生单元提供的信号的变化关系的值。根据本发明,上述非线性匹配函数对与第二靶核酸序列有关的提取的信号生成。ⅴ.利用二次函数来分析试样内靶分析物的方法根据本发明的另一实施方式,本发明提供包括如下部件的试样内靶分析物的分析装置:存储器;以及处理器,上述存储器存储与上述靶分析物有关的数据集,上述数据集从利用信号发生单元的信号发生反应获取,包含具有循环号及信号值的多个数据点,上述处理器在上述数据集的基础线区域的匹配区间生成对上述数据集匹配的二次函数,在上述数据集扣除上述二次函数来校准上述数据集。根据本发明的另一实施方式,本发明提供计算机可读记录介质,包括多个指示,上述多个指示体现用于执行方法的处理器,上述方法包括:获取与上述靶分析物有关的数据集的步骤,上述数据集从利用信号发生单元的信号发生反应获取,包含具有循环号码及信号值的多个数据位置;在上述数据集的基础线区域的匹配区间中生成对于上述数据集的二次函数的步骤;以及在上述数据集扣除上述二次函数来校准上述数据集的步骤。上述本发明的记录介质、装置及计算机程序用于在计算机中实施上述部分ⅲ及ⅳ的本发明的方法,这些之间相同的内容的记载为了避免因反复记载而引起的本说明书的过度的复杂性而省略。vi.本发明的具体实例详细说明本发明的具体实例如下。图1示出分析一实施例的靶分析物的装置。参照图1,分析系统包括扩增装置110及分析装置120。分析系统可确定试样内靶分析物的存在或不存在并向使用人员显示结果。扩增装置110为执行核酸扩增反应、酶反应或微生物生长的装置。例如,在扩增装置110执行核酸扩增反应的情况下,扩增装置110可反复执行增加及减少多个试样的温度的动作。扩增装置110可在每个循环测定从多个试样发生的信号来获取数据集。扩增装置110可通过电缆130或者通过无线与分析装置120相连接。扩增装置110通过有线或无线向分析装置120传送所获取的数据集。分析装置120从扩增装置110获取数据集。分析装置120分析数据集来确定试样内是否存在靶分析物。换句话说,分析装置120确定试样的阳性或阴性。分析装置120包括显示装置124。显示装置120显示数据集,或者通过图表显示浮动的数据集。显示装置124可显示s型函数或步骤函数等。并且,显示装置124可显示是否存在靶分析物,可以显示每个试样的检测结果。分析装置120可以读取(read)包含在记录介质122的数据集。记录介质122可存储数据集,或者可以存储分析装置120中使用的程序等。记录介质可以为cd或usb等。图2为用于说明一实施例的分析装置的结构图。参照图2,分析装置200包括处理器210、存储器220及显示装置230。存储器220存储从扩增装置110接收的数据集。存储器220可存储处理器210中处理的数据。例如,存储器220可存储数据集、标准化的数据集、经基线的基础集、校准的数据集、非线性函数、匹配准确度及阈值等。图2中,存储器220与处理器210单独构成并示出,但存储器220也可以与处理器210通过一个装置体现。例如,存储器220可以为在处理器210内部的如缓存的存储器。处理器210可利用数据集来确定试样内是否存在靶分析物。处理器210可利用非线性函数来计算数据集和非线性函数的匹配准确度,可根据匹配准确度的大小确定靶分析物的存在或不存在。图2示出分析装置200包括一个处理器210,但分析装置200可以包括一个以上的处理器210。显示装置230可通过处理器210的控制显示图标、表格或文本等。例如,显示装置230可通过图标显示数据集、非线性函数等。显示装置230可通过表格显示容器的信息。显示装置230可通过文本显示匹配准确度、阳性/阴性等。图4为用于说明一实施例的确定靶分析物存在或不存在的方法的流程图。参照图4,分析装置200可对匹配准确度与阈值进行比较来确定靶分析物的存在或不存在。图4的步骤可以在图3的步骤340之后执行。换句话说,分析装置200可在步骤340中确定匹配准确度,在步骤410中对匹配准确度与阈值进行比较。在步骤410中,分析装置200确定匹配准确度是否大于阈值。若匹配准确度大于阈值,则上述处理器进行步骤420,若匹配准确度不大于阈值,则上述处理器进行步骤430。阈值可利用试验数据确定,作为一例,阈值可被设定为0.9。在步骤420中,分析装置200确定为试样内存在靶分析物。匹配准确度大于阈值意味着非线性函数为与扩增曲线相同或类似的形态。扩增曲线为当试样内存在靶分析物时获取的曲线的一般形态。换句话说,若存在试样内靶分析物,则反复复制靶分析物,因此,从试样获取如二次函数或指数函数增加的形态的信号。因此,在数据集的形态为扩增曲线的形态的情况下,非线性函数与数据集为类似的形态,匹配准确度也将提高。在步骤430中,分析装置200确定为试样内不存在靶分析物。匹配准确度小于阈值意味着非线性函数从扩增曲线脱离。换句话说,若试样内不存在靶分析物,则不发生复制靶分析物的反应。因此,数据集与非线性函数为不同形态,匹配准确度也将降低。图5为用于说明在试样内存在靶分析物的情况下利用匹配准确度来进行分析的方法的图。图5中,校准的数据集510通过虚线表示,非线性函数520通过实线表示。校准的数据集510为(循环、信号值)的坐标值的集合(不连续数据),因此,通过虚线表示。非线性函数520可以为数学式3的s型函数。非线性函数520为连续函数,因此通过实线表示。分析装置200匹配校准的数据集510与非线性函数520。匹配意味着搜索(search)与校准的数据集510最类似的非线性函数520,或者确定非线性函数520的多个参数(parameters)。非线性函数520可通过最小二乘法生成。换句话说,分析装置200为了将非线性函数520与校准的数据集510的误差最小化而反复修改非线性函数520的多个参数的过程。当非线性函数520与校准的数据集510的误差最小时,分析装置200确定非线性函数520的多个参数。分析装置200计算具有所确定的多个参数的非线性函数520和校准的数据集510的r2值。分析装置200根据r2值的大小确定靶分析物的存在或不存在(阳性/阴性)。r2值可利用数学式4计算。参照图5,非线性函数520的r2值为0.9985。阈值被设定为0.9。因此,r2值大于阈值,因此,分析装置200确定为试样内存在靶分析物(阳性)。分析装置200可根据分析结果在显示装置230显示存在或阳性(positive)的文本。图6为用于说明利用最大斜率来确定靶分析物存在或不存在的方法的流程图。分析装置200可利用非线性函数的最大斜率来确定试样内靶分析物的不存在。图6的步骤可以在图3的步骤350执行之后执行,或者图3的步骤330执行之后执行。在步骤1410中,分析装置200生成非线性函数的最大斜率。分析装置200可对非线性函数进行微分,可将微分的非线性函数的最大值确定为最大斜率。在步骤1420中,分析装置200判断非线性函数的最大斜率是否大于与最大斜率有关的阈值。若最大斜率大于阈值,则分析装置200进行步骤1430,若最大斜率不大于阈值,则进行步骤1440。阈值可被设定为20至40之间。在步骤1430中,分析装置200确定为试样内存在靶分析物。非线性函数的最大斜率大于阈值,因此,分析装置200可判断为发生对于靶分析物的扩增反应。在步骤1440中,分析装置200确定为试样内不存在靶分析物。非线性函数的最大斜率不大于阈值,因此,分析装置200可判断为不发生对于靶分析物的扩增反应。图7为用于说明在存在试样内靶分析物的情况下利用最大斜率进行分析的方法的图。图7中,分析装置200生成非线性函数1510的最大斜率。图7中,非线性函数1510的最大斜率为50。分析装置200判断最大斜率是否大于阈值。图7中,阈值被设定为30,非线性函数1510的最大斜率50大于阈值30。因此,分析装置200确定为试样内存在靶分析物(阳性)。若在试样内存在靶分析物,则如图7的非线性函数1510,存在信号值急剧增加的区间。若存在信号值急剧增加的区间,则分析装置200可确定为试样内存在靶分析物。图8为用于说明通过基于特定背景信号的标准化方法将数据集标准化的方法的图。参照图8,确定与数据集1900有关的基准循环及在基准循环中的信号值。若确定在基准循环中的信号值,则利用在基准循环中的信号值或在基准循环中的信号值的变形值来生成标准化系数。在利用在基准循环中的信号值来生成标准化系数的情况下,在基准循环中的信号值自身可以为标准化系数。因此,将在基准循环中的信号值适用于数据集1900的信号值来将数据集1900标准化。在利用在基准循环中的信号值的变形值来生成标准化系数的情况下,可利用在基准循环中的信号值与基准值之间的关系来确定标准化系数。在基准循环中的信号值与基准值之间的关系可以为在基准循环中的信号值与基准值的差异。在一例中,在基准循环中的信号值与基准值的差异为与基准值有关的在基准循环中的信号值的比例(ratio)。基准循环为任意确定的循环,在基准循环中的信号值为数据集1900的信号值。如图8所示,基准循环在数据集1900的多个循环中确定,在基础线区域中确定。drfu表示数据集1900的变位。数据集1900的变位可通过数据集的信号值中的最大值与最小值的差异或最终值与初始值的差异计算。基础线区域为不发生对于靶分析物的扩增的区域,信号扩增区域为发生对于靶分析物的扩增的区域。基准循环可选自基础线区域的循环中。在一例中,基准循环可以为4循环。图8示出基准循环为一个的情况,基准循环可以为2以上的循环。在选择多个基准循环的情况下,确定在多个基准循环中的多个信号值,利用多个信号值来确定标准化系数。图9为用于说明对于非线性函数的特性的图。对于非线性函数2000的特性用于确定试样内靶分析物的存在或不存在。具体地,对于非线性函数2000的多个特性可以与各个特性的规定阈值进行比较,比较结果用于确定试样内靶分析物的存在或不存在。本发明生成作为连续函数的非线性函数2000,因此,可以将在一部分扩增区间发生的跳跃错误或噪音的影响最小化。根据本发明的一实例,本发明并不根据非线性函数500的变位是否大于信号阈值来确定靶分析物的存在或不存在。代替利用反应的一个基准或特性,本发明提取非线性函数500的多个特性并分析上述特性来确定试样内靶分析物的存在。以往的方法以数据集是否大于阈值为基准确定靶分析物的存在或不存在,因此,数据集的各个信号值对靶分析物的存在或不存在的确定产生影响。因此,校准去除跳跃错误或噪音的数据集,并适当设定阈值极为重要,在并未正常进行对于数据集的校准的情况或并未精确地设定阈值的情况下,存在假阳性或假阴性的危险。本发明利用与数据集或标准化的数据集匹配的非线性函数2000,因此,可轻松提取对于非线性函数2000的多个特性。换句话说,非线性函数2000为连续函数,且通过数学式表示,因此,可以轻松且准确地提取包括非线性函数2000的变位、最大斜率及参数在内的用于确定靶分析物存在或不存在的非线性函数2000的多个特性。非线性函数2000为与标准化的数据集相匹配的函数。图9所示的数学式为非线性函数2000的一例,是s型函数的一种形态。图9所示的s型函数包含4个参数(a1,a2,a3,a4)。s型函数包含5个以上的参数,或者可以包含3个以下的参数。非线性函数2000的特性包含多个参数(a1,a2,a3,a4)、变位(drfu)、最大斜率(df)或r2。最大斜率通过一阶导数最大值表示(fdm,firstderivativemaximum)。非线性函数2000的变位可以为非线性函数2000的最大值与最小值的差异或初始值与最终值的差异。在一例中,非线性函数2000的变位可通过a2-a1计算。非线性函数2000的变位可以与变位有关阈值进行比较。例如,与变位有关的阈值为70、80、90、100、110、120、130或140。与变位有关的阈值的单位可以为相对荧光单位。在非线性函数2000的变位小于与变位有关的阈值的情况下,可确定为试样内不存在靶分析物。参数a3为非线性函数2000的拐点。df为非线性函数2000的最大斜率。df可以为在a3中的斜率。非线性函数2000的最大斜率可以与最大斜率有关阈值进行比较。例如,最大斜率有关阈值为20、21、22、23、24、25、26、27、28、29、30、31或32。在非线性函数2000的最大斜率小于最大斜率有关阈值的情况下,可确定为试样内不存在靶分析物。在本发明的一实例中,可利用二次函数来确定试样内靶分析物的存在或不存在。生成对于数据集的二次函数。在整个区间(整个循环)中利用与数据集的匹配来生成二次函数。在整个区间中匹配的二次函数可通过第一二次函数标记。本发明为了进行匹配而可以利用多种以往的非线性回归分析方法(参照:seber,g.a.f.;wild,c.j.(1989).nonlinearregression.newyork:johnwileyandsons)。第一二次函数为y=ax2+bx+c的形态的函数。以当第一二次函数最小时的循环(cmin)或第一二次函数的x2的系数为基础确定试样内靶分析物的存在或不存在。在本发明的一实例中,可利用二次函数来确定试样内靶分析物的存在或不存在。在以数据集的基础线区域的循环为基础确定的匹配区间中生成对于数据集的二次函数。二次函数为在匹配区间内与数据集匹配的函数。在整个区间中匹配的二次函数能够以第一二次函数标记,在匹配区间中匹配的二次函数以第二二次函数标记。在匹配区间中确定对于第二二次函数的匹配准确度。利用匹配准确度来确定试样内上述靶分析物的存在或不存在。图10为利用二次函数的本发明一实施例的流程图。在步骤2110中,获取与靶分析物有关的数据集。本步骤可参照上述方法所记载的内容来说明。在步骤2120中,生成对于数据集的第一二次函数。在整个区间(整个循环)中,利用与数据集匹配来生成第一二次函数。本发明为了进行匹配而可以利用多种以往的非线性回归分析方法(参照:seber,g.a.f.;wild,c.j.(1989).nonlinearregression.newyork:johnwileyandsons)。第一二次函数为y=ax2+bx+c的形态的函数。在步骤2130中,在匹配区间中生成对于数据集的第二二次函数。匹配区间以当第一二次函数最小时的循环(cmin)或基础线区域的循环为基础确定。在本说明书中,提及匹配区间并使用的术语“以基础线区域的循环为基础确定”意味着选择基础线区域的整个循环或一部分循环来用成匹配区间。作为匹配区间,基础线区域的循环可在通过以往的方法(例如,美国专利第8560247号及wo2016/052991)或根据经验确定的基础线区域中选择整个或一部分循环。在生成第一二次函数且为最小值时的循环(cmin)为阈值以上或x2的系数大于0的情况下,在匹配区间生成第二二次函数。匹配区间能够以数据集的基础线区域的循环为基础确定。择一性地,匹配区间以当第一二次函数最小时的循环(cmin)为基础确定。提及匹配区间并使用的术语“以当第一二次函数最小时的循环(cmin)为基础确定”意味着匹配区间的最终循环(endcycle)以cmin或cmin周边的循环(具体地,cmin±5循环内的循环)来确定。匹配区间被确定为从上述开始匹配循环至最终循环,最终循环可被确定为以当第一二次函数最小时的循环(cmin)为基础确定的循环。第二二次函数包括一次函数、多次函数(例如,二次函数及三次函数)及指数函数的多种函数。可利用线性或非线性回归分析方法来确定与数据集最相同的第二二次函数。根据本发明的一实例,代替第二二次函数,可以使用指数函数。第二二次函数为y=a(x-b)2+c形态的函数。指数函数为y=d(ea(b-x))+c形态的函数。b为第二二次函数或指数函数的对称轴。生成与在数据集的基础线区域中的信号值匹配的指数函数,从数据集扣除指数函数来生成校准的数据集。在步骤2140中,在匹配区间中确定对于第二二次函数的匹配准确度(fittingaccuracy)。数据集与第二二次函数之间的匹配准确度利用在匹配区间内的信号值来确定。本发明的特征中的一种如下,即,将第二二次函数的匹配准确度用作靶分析物的分析的直接指标。在步骤2150中,利用匹配准确度来确定试样内靶分析物的存在或不存在。图11为用于说明本发明一实施例的数据集的校准方法的流程图。在步骤2210中,获取与靶分析物有关的数据集。本步骤可参照上述方法所记载的内容来说明。在步骤2220中,生成对于数据集的第一二次函数。第一二次函数为在整个区间与数据集匹配的二次函数。在步骤2230中,在以数据集的基础线区域的循环为基础确定的匹配区间中生成对于数据集的第二二次函数。第二二次函数为在匹配区间中与数据集匹配的二次函数。在步骤2240中,从数据集的信号值扣除第二二次函数的值来校准数据集。图12为用于说明利用第一二次函数来设定匹配区间的方法的图。分析装置以当第一二次函数2320最小时的循环(cmin)为基础设定匹配区间。数据集2310从信号发生反应获取。数据集2310从扩增装置获取,或者可通过校准从扩增装置获取的数据集来获取。例如,在相同通道中,在高温及低温检测温度条件下获取数据集,可通过从在低温检测温度条件下获取的数据集扣除在高温检测温度条件下获取的数据集来获取数据集2310。并且,扩增装置可以考虑多个通道之间的干扰来校准数据集来输出校准的数据集。第一二次函数2320通过与数据集2310的匹配确定。分析装置在具有3个参数的二次函数(y=ax2+bx+c)和数据集2310适用最小二乘法来生成对于数据集2310的第一二次函数2320。分析装置在生成第一二次函数2320之后,确定当第一二次函数2320最小时的循环(cmin)。分析装置可通过对第一二次函数2320进行微分来确定cmin。图12示出对于第一二次函数2320的cmin为10的情况。若cmin小于阈值,则分析装置利用cmin来设定匹配区间。分析装置可利用cmin来确定匹配区间的最终循环。在一例中,分析装置可将cmin、cmin-1、cmin-2、cmin-3、cmin-4或cmin-5来确定匹配区间的最终循环。或者,分析装置可将cmin、cmin+1、cmin+2、cmin+3、cmin+4或cmin+5确定为匹配区间的最终循环。若cmin为10,阈值为30,则cmin小于阈值,因此,分析装置利用cmin来确定匹配区间的最终循环。分析装置可利用cmin和最小匹配循环来确定匹配区间的最终循环。在一例中,最小匹配循环可在10、9、8、7、6、5循环中确定。最小匹配循环可根据扩增反应的最终循环确定。分析装置旋转cmin、cmin-1、cmin-2、cmin-3、cmin-4或cmin-5中的一个值,将在所选择的值和最小匹配循环中的大的值确定为匹配区间的最终循环。若最小匹配循环为9,cmin为10,则分析装置可以将9和10中大的10确定为匹配区间的最终循环。分析装置设定开始匹配循环。开始匹配循环为匹配区间的最小循环。匹配区间为从最小循环至最大循环。开始匹配循环可根据扩增反应的最终循环确定。在一例中,若产品的最大循环为40循环,则开始匹配循环可以为0、1、2循环。在一例中,若产品的最大循环大于40循环,则开始匹配循环可以为4、5、6、7循环。图13为用于说明利用当第一二次函数最小时的循环(cmin)来确定试样内靶分析物不存在的方法的图。分析装置确定cmin,若cmin大于阙值,则确定为试样内不存在靶分析物。第一二次函数2420通过与数据集2410匹配确定。分析装置在具有三个参数的二次函数(y=ax2+bx+c)和数据集2410适用最小二乘法来生成对于数据集2410的第一二次函数2420。图13中,数据集2410为阴性试样,循环越增加,信号值的大小越小。因此,对于数据集2410的第一二次函数2420也将减少。当第一二次函数2420最小时的循环(cmin)为40。当第一二次函数2420最小时的循环(40循环)大于阈值(30循环),因此,分析装置确定为试样内不存在靶分析物。本发明可通过数据集合第一二次函数最小时的循环(cmin)确定试样内是否存在靶分析物。因此,如以往的方法,没有校准数据集并利用阈值来获取循环阈值的步骤,可以准确、迅速且简单地确定试样内靶的不存在。图14为用于说明利用第二二次函数和数据集的匹配准确度来确定试样内靶分析物不存在的方法的图。分析装置利用第一二次函数2510来设定匹配区间。分析装置生成对于数据集2500的第一二次函数2510。分析装置计算当第一二次函数2510最小时的循环(cmin)。当第一二次函数2510最小时的循环(10循环)小于阈值(30循环),因此,分析装置以当第一二次函数2510最小时的循环(cmin)或基础线区域的循环为基础来确定匹配区间。分析装置在匹配区间中生成与数据集2500匹配的第二二次函数2520。分析装置在匹配区间中确定对于第二二次函数2520的匹配准确度。图14中,匹配准确度利用r2值,r2值为0.7925。r2值小于阈值(0.85),因此,分析装置确定为试样内不存在靶分析物。本发明可以将当对于数据集的第一二次函数2510最小时的循环(cmin)或基础线区域的循环用成第二二次函数2520的匹配区间,将匹配准确度用成确定靶分析物分析,尤其,用成检测靶分析物不存在的直接指标,从而,在没有假阳性及假阴性,尤其,没有假阳性的情况下分析靶分析物。图15为用于说明利用第二二次函数来设定基础线的方法的图。分析装置可以将第二二次函数2620设定为基础线。分析装置利用第一二次函数2610设定匹配区间。分析装置生成对于数据集2600的第一二次函数2610。分析装置计算当第一二次函数2610最小时的循环(cmin)。当第一二次函数2610最小时的循环(9循环)小于阈值(30循环),因此,分析装置以当第一二次函数2610最小时的循环(cmin)或基础线区域的循环为基础来确定匹配区间。分析装置在匹配区间中执行对于数据集2600的匹配。分析装置在匹配区间中生成与数据集2600匹配的第二二次函数2620。分析装置在匹配区间中确定对于第二二次函数2620的匹配准确度。分析装置利用在匹配区间中的数据集2600的信号值和第二二次函数2620的函数值来确定匹配准确度。图15中,匹配准确度利用r2值,r2值为0.7925。r2值大于阈值(0.85),因此,分析装置将第二二次函数2620确定为基础线。当确定第二二次函数2620时,利用匹配区间内的数据集2600的信号值,若将第二二次函数2620设定为基础线,则在整个循环中利用第二二次函数2620的函数值。分析装置在整个循环中,可从数据集2600的信号值扣除第二二次函数2620的函数值来校准数据集2600。分析装置可通过分析校准的数据集来确定试样内靶分析物的存在或不存在。本发明具有如下优点,即,即使没有如阴性对比组的额外的分析物的分析,也能够仅通过分析数据集2600来设定基础线。图16为以mudt技术为基础的本发明的方法的流程图。参照图16,按各个步骤详细说明本发明的方法如下。在步骤2710中,在2种不同的温度条件下检测信号。在相对低的检测温度及相对高的检测温度条件下检测信号。在步骤2720中,评价在相对低的检测温度条件下检测的信号。确定在相对低的检测温度条件下检测的信号是否满足通过第一阈值定义的第一基准。当在相对低的检测温度条件下检测的信号满足第一基准时,进行步骤2730,当在相对低的检测温度条件下检测的信号不满足第一基准时,确定为第一靶核酸序列及第二靶核酸序列不存在于试样内,并不进行步骤2730。在相对低的检测温度条件下检测的信号不满足第一基准意味着试样内不存在第一靶核酸序列及第二靶核酸序列。因此,无需实施步骤2730,因此结束步骤。在相对低的检测温度条件下检测的信号满足第一基准意味着第一靶核酸序列或第二靶核酸序列有可能存在于试样内,因此,进行下一步骤。即使在相对低的检测温度条件下检测的信号满足第一基准,也并不意味着2个靶核酸序列中的1个以上的靶核酸序列存在于试样内。第一基准可以通过第一阈值定义。在本步骤中所使用的“第一阈值”是为了确定在相对低的检测温度条件下检测的信号的显著性而使用的阈值。“第二阈值”是为了确定与第二靶核酸序列有关的信号的显著性而使用的阈值。“第三阈值”是为了确定与第一靶核酸序列有关的信号的显著性而使用的阈值。“第三阈值”也可以是为了确定在相对高的检测温度条件下检测的信号的显著性而使用的阈值。信号的显著性意味着在特定温度条件下生成的信号与特定阈值相比是否以显著的水平生成。信号的显著性可通过为了区分通过特定信号发生单元生成的信号与除此之外的信号而设定的适当的阈值判断。具体地,用于判断信号的显著性的阈值通过并不来自关注的核酸序列的信号,例如,可排除背景信号或噪音信号等的任意值设定。作为一个例,随着进行扩增反应,在信号扩增的情况下,若信号为阈值以上,则可确定为信号显著。多个阈值(第一阈值、第二阈值及第三阈值)可根据通常的阈值设定方法确定。例如,多个阈值可考虑背景信号、灵敏度、标记特性、探测器的信号变化(signalvariation)或误差范围来确定。多个阈值可设定在信号发生反应的指数区域(exponentialregion)。多个阈值可被设定为不大于信号发生反应的停滞区域(plateauregion)的信号值且大于基础线区域(baselineregion)的信号值。或者,多个阈值可被设定为在扩增曲线中扣除基础线的基础线区域的信号值的标准偏差乘上规定值(例如10)的值。多个阈值可由探测器自动或实施人员直接设定。例如,第一阈值可以为100相对荧光单位。在步骤2730中,提取与第二靶核酸序列有关的信号。在步骤2720中,当在相对低的检测温度条件下检测的信号满足第一基准时,提取与第二靶核酸序列有关的信号。本发明的特征中的一种如下,即,即使在相对高的检测温度条件下检测的信号不满足第三基准,也实施提取与第二靶核酸序列有关的信号的步骤。在本发明中,当在相对高的检测温度条件下检测的信号不满足第三基准时,即,与在相对高的检测温度条件下检测的信号无关地,实施提取信号的步骤2730。在本发明中,将利用在2个不同的检测温度条件下检测的信号和基准值来提取与特定靶核酸序列有关的信号的过程称为“信号提取过程(signalextractionprocess)”。在步骤2740中,评价与第二靶核酸序列有关的信号。识别所提取的与第二靶核酸序列有关的信号是否满足通过第二阈值或第二信号变位定义的第二基准。当与第二靶核酸序列有关的信号满足第二基准时,确定为第二靶核酸序列存在于试样内。当与第二靶核酸序列有关的信号不满足第二基准时,确定为第二靶核酸序列不存在于试样内。第二基准通过第二阈值或第二信号变位定义。在适用非线性函数匹配方法之前,与第二靶核酸序列有关的信号可利用二次函数校准,可利用二次函数和第二靶核酸序列有关信号之间的匹配准确度来确定第二靶核酸序列的不存在。在执行匹配之前,分析装置设定对于与第二靶核酸序列有关的信号的基础线,可在与第二靶核酸序列有关的信号扣除基础线来生成校准的与第二靶核酸序列有关的信号。分析装置可在校准的与第二靶核酸序列有关的信号适用非线性函数匹配方法。在本发明的一实例中,分析装置设定匹配区间,在匹配区间中生成与第二靶核酸序列有关信号匹配的二次函数来将二次函数设定为基础线。匹配区间可以为预先设定的区间。在一例中,匹配区间可被设定成从4循环至12循环。分析装置通过匹配生成与从4循环至12循环的信号值最相同的二次函数。在此情况下,二次函数可具有对称轴,对称轴可以在信号发生反应的最终循环±10、最终循环±8、最终循环±6、最终循环±5、最终循环±3、最终循环±2或最终循环±1的范围中选择。分析装置匹配校准的数据集(或校准的第二靶核酸序列有关信号)与非线性函数,可利用所匹配的非线性函数与校准的数据集之间的匹配准确度来确定第二靶核酸序列的存在或不存在。在步骤2750中评价与第一靶核酸序列有关的信号。分析装置识别在相对高的检测温度条件下检测的信号是否满足通过第三阈值或第三信号变位定义的第三基准。当在相对高的检测温度条件下检测的信号满足第三基准时,确定为第一靶核酸序列存在于试样内,当在相对高的检测温度条件下检测的信号不满足第三基准时,确定为第一靶核酸序列不存在于试样内。在本发明的一实例中,即使在相对高的检测温度条件下检测的信号满足第三基准,为了最终确认第一靶核酸序列存在于试样内而可以使用非线性函数匹配方法。步骤2750可以在步骤2710及步骤2720之间、步骤2720及步骤2730之间、步骤2730及步骤2740之间或步骤2740之后实施。发明的效果概述本发明的特征及优点如下:(a)在本发明中,将对于数据集的非线性函数的匹配准确度作为靶分析物分析,尤其,作为靶分析物的检测的直接指标来利用,在没有假阳性及假阴性,尤其,没有假阳性的情况下可以检测靶分析物。(b)在通过核酸扩增反应检测靶核酸序列的本发明的实例中,本发明并不设定用于获取循环阈值的阈值,可以准确、迅速且简单地确定试样内靶的存在或不存在。(c)在通过核酸扩增反应检测靶核酸序列的本发明的实例中,除非线性匹配函数的匹配准确度之外,可利用确定(i)数据集、校准的数据集或非线性匹配函数的变位、(ii)非线性匹配函数的非线性匹配函数的最大斜率及(iii)非线性匹配函数的形态的参数(尤其,包括4个参数的s型函数的a4)检测靶核酸序列,由此,可以完美地去除在多种临床试样中呈现的错误的靶确定,尤其,假阳性。(d)在本发明中,与考虑特定信号之的现有技术不同,如变位、最大斜率及形态确定性参数的用于确定靶分析物的存在或不存在的参数所适用的多个阈值考虑数据组的信号图案(例如,核酸扩增反应的数据集)来设定。在这方面,在本发明中,具有无需每次试验、每次反应、每个产品、每个装置设定具体阈值的优点。例如,若预先在核酸扩增反应的数据集设定适合的阈值,则设定的阈值可适用于之后的所有核酸扩增反应。或者,每种试样分别设定阈值,所设定的阈值可适用于利用之后的对应试样的所有核酸扩增反应。例如,若预先设定对于利用粪便(stool)的核酸扩增反应的阈值,则所设定的阈值可适用于利用之后的粪便试样的所有核酸扩增反应。(e)在本发明中,基本上利用信号模式来分析靶分析物,而并非利用信号的强度,因此,可以显著减少噪音影响。(f)在利用sbn技术的一实例中,非线性匹配函数适用于利用标准化系数标准化的数据集。(g)在利用sbn技术的一实例中,本发明通过更便利的方式校准数据集,可大幅度减少设备之间及设备内信号偏差。利用sbn技术标准化的数据集通过极为便利的方法设定与非线性匹配函数的参数有关的多个阈值。(h)在本发明中,分析标准化的数据集的形态(shape)是否与典型的扩增曲线的形态相同来确定靶分析物的存在或不存在,因此,因噪音或跳跃错误而判断为假阳性的可能性极低。(i)根据一实例,本发明分析非线性匹配函数的最小的两个特性来导出检测结果,而并非利用一个特性,因此,可以减少假阳性或假阴性结果。(j)在利用sbn技术的一实例中,利用适当基准值来进行数据标准化的本发明有利于减少信号发生单元(例如,引物及探针)的量。(k)在一实例中,本发明将当对于数据集的第一二次函数最小时的循环用为检测靶分析物的不存在的直接指标,从而,可以没有假阳性及假阴性,尤其,没有假阳性地分析靶分析物。(l)在一实例中,本发明可将(i)当对于数据集的第一二次函数最小时的循环或(ii)基础线区域的循环作为第二二次函数的匹配区间利用,将第二二次函数的匹配准确度用为确定靶分析物的不存在的直接指标,从而,可以没有假阳性及假阴性,尤其,没有假阳性地分析靶分析物。(m)在一实例中,本发明可将能够以(i)当对于数据集的第一二次函数最小时的循环或(ii)基础线区域的循环为基础确定的第二二次函数用于校准数据集。(n)与考虑特定信号值的现有技术不同,与当对于数据集的第一二次函数最小时的循环有关阈值及与第二二次函数的匹配准确度有关阈值考虑数据集(例如,核酸扩增反应的数据集)的信号模式来设定。在这方面,本发明具有无需每次试验、每次反应、每个产品、每个装置具体设定阈值的优点。附图说明图1示出分析一实施例的靶分析物的装置。图2为用于说明一实施例的分析装置的结构图。图3为用于说明一实施例的靶分析物的分析方法的流程图。图4为用于说明确定一实施例的靶分析物存在或不存在的方法的流程图。图5为用于说明在存在试样内靶分析物的情况下利用匹配准确度来进行分析的方法的图。图6为用于说明利用最大斜率来确定靶分析物存在或不存在的方法的流程图。图7为用于说明在存在试样内靶分析物的情况下利用最大斜率来进行分析的方法的图。图8为用于说明利用基于特定背景信号的标准化方法来将数据集标准化的方法的图。图9为用于说明与非线性函数有关的特性的图。图10为利用二次函数的本发明一实施例的流程图。图11为用于说明校准本发明一实施例的数据集的方法的流程图。图12为用于说明利用第一二次函数来设定匹配区间的方法的图。图13为用于说明利用cmin来确定试样内靶分析物不存在的方法的图。图14为用于说明利用第二二次函数和数据集的匹配准确度来确定试样内靶分析物不存在的方法的图。图15为用于说明利用第二二次函数来设定基础线的方法的图。图16为用于说明基于mudt技术的本发明的方法的流程图。图17至图20为示出对于未标准化的数据集的分析结果的图。图21至图24为示出对于标准化的数据集的分析结果的图。具体实施方式以下,通过实施例,更详细地说明本发明。这些实施例仅用于更加具体地说明本发明,根据本发明的主旨,本发明的范围并不局限于这些实施例对本发明所属
技术领域
的普通技术人员来说是显而易见的。实施例实施例1:胃肠道感染病毒的检测数据集的获取为了检测作为急性腹泻的主要原因的诺如病毒(norovirus)gi、诺如病毒gii、腺病毒(adenovirus)和轮状病毒(rotavirus)而使用seegene公司的allplextmgi-virusassay。利用cfx96tm实时聚合酶链反应检测系统(bio-rad),对30个样品执行核酸扩增反应。核酸扩增反应通过反复在95℃的温度条件下执行10秒钟,在60℃的温度条件下执行1分钟,在72℃的温度条件下执行30秒钟的条件执行,总共执行45循环。利用探测和标记寡核苷酸切割和延伸方法(wo2012/096523)及mudt(wo2015/147412)技术从cfx96获取数据集。上述数据集包含与所有扩增循环有关的信号值。如以下表1,30个样品为通过临床试验确认阳性或阴性的多个样品(20个阳性样品,10个阴性样品)。样品1、样品2、样品3、样品6及样品7为感染诺如病毒gii的样品,样品9、样品10、样品11、样品13及样品14为感染腺病毒的样品,样品16、样品17、样品19、样品20及样品21为感染诺如病毒gi的样品,样品24、样品26、样品27、样品28及样品29为感染轮状病毒的样品。表1样品1阳性样品11阳性样品21阳性样品2阳性样品12阴性样品22阴性样品3阳性样品13阳性样品23阴性样品4阴性样品14阳性样品24阳性样品5阴性样品15阴性样品25阴性样品6阳性样品16阳性样品26阳性样品7阳性样品17阳性样品27阳性样品8阴性样品18阴性样品28阳性样品9阳性样品19阳性样品29阳性样品10阳性样品20阳性样品30阴性校准的数据集的获取为了校准数据集而执行阴性对比组扣除(negativecontrolsubtraction)。阴性对比组没有添加试样,仅包含allplextmgi-virusassay的结构(component)。当执行对于多个样品的核酸扩增反应时,在相同板一同执行阴性对比组的扩增反应来获取与阴性对比组有关的数据集。在各个循环中,从数据集的信号值扣除阴性对比组的信号值来获取校准的数据集。对各个样品执行阴性对比组扣除并获取校准的数据集。确定利用s型函数匹配的靶核酸分子的存在或不存在(a)s型匹配函数的获取对从各个样品获取的校准的数据集,利用包含4个参数的数学式3执行了与s型函数的匹配。适用lm算法(levenberg–marquardt算法;christiankanzowetal.,jcam,172(2):375(2004))来获取与校准的数据集匹配的s型函数。(b)基于s型函数的变位的阴性第一次过滤利用s型函数的变位来过滤阴性样品。s型匹配函数的变位通过计算s型匹配函数的最大相对荧光单位与最小相对荧光单位的差异来获取。对所计算的变位与变位有关阈值(相对荧光单位100)进行比较来对阴性样品进行过滤。将上述匹配的s型函数的变位为100(相对荧光单位)以下的产品确定为阴性。5个样品的s型函数的变位为100(相对荧光单位)以下,并作为阴性过滤(样品5、样品8、样品12、样品23及样品25)(表2)。表2(c)基于s型匹配函数的最大斜率的阴性第二次过滤利用s型匹配函数的最大斜率,对剩余25个样品执行第二次阴性过滤。最大斜率通过对各个样品的s型匹配函数进行微分来计算(即,与上述s型函数有关的一阶导数最大值(fdm,thefirstderivativemaximum))。与最大斜率有关的阈值被设定为28。如表3所示,4个样品(样品15、样品18、样品22及样品30)的s型函数的最大斜率小于28,因此,将4个样品作为阴性过滤。表3(d)基于匹配准确度r2值的阳性或阴性样品的最终确定对除被确定为阴性的9个样品之外的剩余21个样品计算了匹配准确度。匹配准确度利用r2值。r2值利用数学式4计算。与r2值有关的阈值被设定为0.87。r2值为0.87以下的样品被确定为阴性。如表4所示,在21个样品中,与1个样品有关的r2值小于0.87,从而被确定为阴性样品(样品4)。剩余20个样品的r2值大于0.87,从而被确认为阳性样品。表4样品r2值样品r2值样品r2值样品10.998样品110.962样品210.998样品20.997样品12-样品22-样品30.994样品130.993样品23-样品40.203样品140.994样品240.999样品5-样品15-样品25-样品60.992样品160.996样品260.993样品70.992样品170.993样品270.994样品8-样品18-样品280.995样品90.997样品190.999样品290.998样品100.998样品200.999样品30-实施例2:基于现有技术的胃肠道感染病毒的检测(对于实施例1的比较实施例)数据集的获取通过与实施例1相同的过程和获取数据集。校准的数据集的获取通过nearestneighborsmoothing算法(winfriedstuteetal.,journalofmultivariateanalysis,34:61(1990))去除噪音。执行线性回归至源数据集(rawdataset)的差异为基准阈值以上的循环来获取基础线,通过基础线扣除来获取校准的数据集。利用与循环阈值有关的阈值来确定靶核酸分子的存在或不存在判断校准的上述数据集是否大于与多个循环阈值有关的阈值来判断对各个样品的阳性或阴性。在校准的数据集中存在大于阈值的信号值,则上述样品被判断为阳性,若没有大于阈值的信号值,则上述样品被判断为阴性。多个循环阈值的阈值对诺如病毒gi、诺如病毒gii、腺病毒和轮状病毒使用120、120、60、120。表5样品1阳性样品11阳性样品21阳性样品2阳性样品12阴性样品22阴性样品3阳性样品13阳性样品23阴性样品4阳性样品14阳性样品24阳性样品5阳性样品15阴性样品25阴性样品6阳性样品16阳性样品26阳性样品7阳性样品17阳性样品27阳性样品8阳性样品18阴性样品28阳性样品9阳性样品19阳性样品29阳性样品10阳性样品20阳性样品30阴性如表5所示,分析成7个阴性及23个阳性。23个阳性样品中的3个样品(样品4、样品5及样品8)在临床试验结果被确认为阳性样品。因此,与本发明相比,适用阈值的现有技术导出假阳性结果的可能性更大。实验结果适用本发明和以往方法来分析30个样品。样品总共30个,通过临床试验,阳性样品为20个,阴性样品为10个。表6如表6所示,通过现有技术,对3个样品导出假阳性结果。但是,在本发明中,30个样品均呈现出与临床试验结果相同的分析结果。因此,根据本发明的分析方法,能够在没有设定用于获取循环阈值的阈值的情况下,准确、迅速且简单地确定试样内靶核酸分子的存在或不存在。实施例3:利用数据集的标准化方法及非线性匹配函数的试样内靶分析物的分析方法根据基于特定背景信号的标准化化方法(sbn,specificbackgroundsignal-basednormalization),通过标准化方法校准数据集之后,根据本发明的方法,利用非线性匹配函数分析是否存在试样内靶分析物。获取数据集实施对于4个靶核酸序列的实时聚合酶链反应。利用3台cfx96实时聚合酶链反应装置(bio-rad)来同时扩增4个靶核酸序列,对各个靶核酸序列,将taqman探针用成信号发生单元来执行50次扩增循环。利用相同靶核酸序列以相同浓度包含的样品,在各个装置、各个通道的96个容器中,在相同条件下执行了96个反应,由此,获取了12组(3个装置×4个通道)的数据集。表7数据集的标准化适用各个装置、各个通道的基准值来校准数据集。利用对于基准总信号变化值(referencetsc;r-tsc)的各个装置、各个通道的数据集的总信号变化值的比例来确定各个装置、各个通道的基准值。基准总信号变化值对所有装置、通道以相对荧光单位5000任意确定,数据集的总信号变化值以各个装置、各个通道的96个反应的平均值为基准确定。按上述比例校准上述数据集的基准循环的信号值,将上述基准循环的校准的信号值用成基准值来适用于从对应装置的对应通道获取的数据集。在以下步骤1至步骤3中,从各个装置、各个通道的数据集确定基准值,在步骤4中,利用确定的上述各个装置、各个通道的基准值校准上述数据集。步骤1将基准循环确定为数据集的5循环,将上述5循环的信号值用于基准值的确定。并且,数据集的总信号变化值在最后第50循环中的信号值扣除在基准循环中的信号值来计算。tsc及基准循环的信号值整理于表8中。表8步骤2将与上述算出的总信号变化值一同在各个装置和通道中用于确定基准值的基准总信号变化值(referencetsc;r-tsc)指定为相对荧光单位5000。步骤3利用上述总信号变化值、基准循环的信号值和基准总信号变化值来如下算出适用于各个装置的基准值。基准值=各个数据组的基准循环的信号值/(总信号变化值/基准总信号变化值)可用于数据集的校准的基准值如表9确定。表9步骤4利用确定的上述基准值来将12个组的数据集如下标准化。在各个容器的数据集中,利用基准循环的信号值和在上述步骤3中确定的基准值来计算标准化系数(normalizationcoefficient)。标准化系数=基准循环的信号值÷基准值使用标准化系数来在所有循环中将信号值标准化,从而对12个组获取标准化的数据集。标准化的信号值(相对荧光单位)=数据集的信号值(相对荧光单位)÷标准化系数基线实施了对于12个组的数据集合标准化的数据集的基线。利用具有对称轴的二次函数来执行基线。二次函数使用y=a(x-50)2+c的形态。对于基线的匹配区间被确定为从4循环至12循环。生成与从4循环制12循环的数据集的信号值匹配的二次函数。从数据集的信号值扣除二次函数的值来获取12组的基线的数据集合12组的标准化及基线的数据集。作为非线性匹配函数获取s型函数的对12个组的基线的数据集(参照图17至图20)及12组的标准化及基线的数据集(图21至图24),利用包含4个参数的数学式3的s型函数来执行与s型函数的匹配。如实施例1计算了r2值、变位值及最大斜率。确定靶核酸分子的存在或不存在为了确定试样内靶分析物的是否存在,将与在s型函数中的4个参数、变位、r2及最大斜率的阈值如下设定。变位≥相对荧光单位100;r2≥0.9;最大斜率≥50及a4<2.0。在均满足4个基准的情况下,确定为靶分析物存在于试样内。在不满足4个基准中的一个的情况下,确定为靶分析物不存在于试样内。对于12个组的标准化的数据集的非线性匹配函数的分析结果,均满足4个基准,从而确定为在12个试样内均存在靶分析物。表10因此,可将数据集标准化并进行基线之后,通过非线性匹配函数进行分析来确定试样内靶分析物的存在或不存在。在需要利用与循环阈值有关的阈值来进行定量分析的情况下,本发明可适用非线性匹配函数将数据集的噪音信号标准化,可通过基于特定背景信号的标准化方法来使变位标准化,因此,无需考虑各个装置或各个通道的信号差异,可以轻松或均匀地设定与其他多个装置或多个通道有关的阈值。图17至图20分别示出与通道1(fam)、通道2(hex)、通道3(calred610)及通道4(quasar670)有关的未被标准化的数据集的结果。如图17至图20所示,在对于未被标准化的数据集的非线性匹配函数中,表示装置之间信号变化量差异的变动系数(coefficientofvariation,cv)为49.5%、51.1%、44.7%及62.6%,可以确认偏差较大。图21至图24分别示出与通道1(fam)、通道2(hex)、通道3(calred610)及通道4(quasar670)有关的标准化的数据集的结果。如图21至图24所示,在标准化的数据集的非线性函数中,装置之间的信号变化量变动系数为2.7%、4.0%、5.3%、3.7%,可以确认偏差显著减少。使用作为在所有装置及通道中相同的阈值的相对荧光单位110来从上述非线性函数曲线计算并比较循环阈值的结果,当未使用标准化方法时,循环阈值的变动系数为5.7%,当适用标准化方法时,循环阈值的变动系数为1.6%,可以确认非线性匹配方法与基于特定背景信号的标准化方法一同提供装置及通道之间的变动(variation)大幅度减少的定量数据(例如,循环阈值)。表11至表18表示图17至图24的数据。表11表12表13表14表15表16表17表18min.:最小(minimum)max.:最大(maximum)range:max-minsd:标准偏差(standarddeviation)cv:变动系数(coefficientofvariation)sbn:基于特定背景信号的标准化(specificbackgroundsignal-basednormalization)表19有趣的是,当通过基于特定背景信号的标准化方法调节信号强度来实现标准化时,与s型函数的基本形态有关的参数a3、a4及作为匹配准确度的r2值不发生变化,这并不会对如通过适用基于特定背景信号的标准化方法来利用r2值的阳性或阴性试样的确定的本发明的非线性匹配分析结果及利用参数a4的非正常信号检测产生影响。因此,与利用非线性匹配函数的本发明的方法联动来适合使用上述基于特定背景信号的标准化方法。实施例4:呼吸道感染病毒ⅰ的检测数据集的获取为了检测作为呼吸道感染的主要原因的流感病毒(flua及flub)及3种流感a亚型(h1,h1pdm09及h3)而使用seegene公司的allplextmrespiratorypanel1。利用cfx96tm实时聚合酶链反应检测系统(bio-rad)来对10个样品执行核酸扩增反应。核酸扩增反应通过反复在95℃的温度条件下执行10秒钟,在60℃的温度条件下执行1分钟以及在72℃的温度条件下执行10秒钟的条件执行,总共进行45循环。适用探测和标记寡核苷酸切割和延伸方法(wo2012/096523)及mudt(wo2015/147412)技术来从cfx96获取数据集。数据集包含与所有扩增循环有关的信号值。如以下的表20所示,10个样品为通过临床试验确认阳性或阴性的样品(5个阳性样品,5个阴性样品)。样品1为感染流感病毒a的样品,样品2为感染流感病毒b的样品,样品4为感染流感病毒flua-h1的样品,样品7及8为感染流感病毒a-h3的样品。表20样品1阳性样品6阴性样品2阳性样品7阳性样品3阴性样品8阳性样品4阳性样品9阴性样品5阴性样品10阴性生成对于数据集的第一二次函数将多个样品的数据集与第一二次函数进行了匹配。第一二次函数使用y=ax2+bx+c。数据集和第一二次函数的匹配适用lm算法(levenberg–marquardt算法;christiankanzowetal.,jcam,172(2):375(2004))。利用第一二次函数的阴性过滤(a)利用第一二次函数的系数的阴性第一次过滤表21样品x2的系数样品x2的系数样品11.808样品6-0.079样品20.240样品70.481样品3-0.011样品80.748样品40.866样品90.025样品50.262样品100.032在10个样品中,对于2个样品的第一二次函数的x2的系数小于0,将2个样品(样品3、样品6)作为阴性过滤。(b)利用第一二次函数的cmin的阴性第二次过滤表22样品cmin样品cmin样品120样品6-样品223样品71样品3-样品816样品420样品917样品534样品1045在10个样品中,2个样品具有30以上的cmin,将2个样品(样品5、样品10)作为阴性过滤。在以cmin为基础确定的匹配区间中生成对于数据集的第二二次函数对通过利用第一二次函数的阴性过滤的数据集,利用cmin值来确定匹配区间。将最小匹配循环确定为12,在cmin为12以下的情况下,将匹配区间确定为从1循环至12循环,在cmin大于12的情况下,将匹配区间确定为从1循环至cmin循环,在数据集的匹配区间生成第二二次函数。第二二次函数为具有循环50的对称轴的函数,使用y=a(x-50)2+c的形态。在匹配区间,数据集合第二二次函数的匹配适用lm算法。利用第二二次函数的阴性过滤阴性过滤的结果整理在以下表23中。表23样品r2样品r2样品10.993样品6-样品20.93173样品70.999样品3-样品80.999样品40.996样品9-0.131样品5-样品10-在基于第一二次函数的阴性过滤中,对出被确定为阴性的4个样品之外的剩余6个样品计算匹配准确度(r2值)。匹配准确度在匹配区间内,利用数据集和第二二次函数来计算。r2值利用数学式5计算,与r2值有关的阈值适用0.9。因此,将r2值小于0.9的样品确定为阴性。如表23所示,在6个样品中,与1个样品有关的r2值小于0.9,从而被确认为阴性样品(样品9)。剩余5个样品的r2值大于0.9,从而,从数据集的信号值扣除第二二次函数的值来校准数据集。并且,计算通过对于校准的数据集的s型匹配函数确定的匹配准确度(r2值)的结果,在样品1、样品2、样品4、样品7及样品8的情况下,r2值为0.9以上,从而被确定为阳性样品。试验结果适用本发明来分析10个样品。其中,利用第一二次函数的x2的系数来将2个样品判断为阴性,当第一二次函数最小时,利用循环(cmin)来将2个样品判断为阴性。利用与数据集有关的第二二次函数的匹配准确度来将1个样品判断为阴性。与剩余5个样品的数据集利用第二二次函数校准。因此,根据本发明的分析方法,可利用当第一二次函数的x2的系数和/或第一二次函数最小时的循环(cmin)以及对于数据集的第二二次函数的匹配准确度来迅速且简单地确定试样内靶的不存在。并且,根据本发明的分析方法,可利用第二二次函数来校准数据集并生成去除噪音的数据集。实施例5:检测呼吸道感染病毒ⅱ数据集的获取为了检测作为呼吸道感染的主要原因的流感病毒(flua)及流感病毒a亚型(h1pdm09及h3)而使用seegene公司的allplextmrespiratorypanel1。利用cfx96tm实时聚合酶链反应检测系统(bio-rad)来对4个样品执行核酸扩增反应。核酸扩增反应通过反复在95℃的温度条件下执行10秒钟、在60℃的温度条件下执行1分钟以及在72℃的温度条件下执行10秒钟的条件执行,总共进行了45循环。适用探测和标记寡核苷酸切割和延伸方法(wo2012/096523)及mudt(wo2015/147412)技术来从cfx96获取数据集。数据集包含所有扩增循环中的在相对低的检测温度60℃及相对高的检测温度72℃的所有信号。如以下表24,4个样品为通过临床试验确认阳性或阴性的多个样品(3个阳性样品、1个阴性样品)。样品1为感染流感病毒a(72℃)的样品,样品3为流感病毒a亚型(60℃),样品4为感染流感病毒a-h3(72℃)的样品。样品4包含在60℃的温度条件下与内部对照组(internalcontrol)的信号值。表24样品在60℃中的检测结果在72℃中的检测结果样品1阴性阳性样品2阴性阴性样品3阳性阴性样品4阳性阳性利用与60℃数据集有关的变位的阴性过滤表25变位通过在最终循环中的信号值与在具有最小信号强度的循环中的信号值(最小信号值)之间的差异计算。样品2中,变位不大于阈值100(相对荧光单位),从而作为阴性过滤。在60℃温度条件下检测的信号中去除与第一靶核酸序列有关的信号利用(i)用于去除与第一靶核酸序列有关的信号的基准值及(ii)在相对低的检测温度条件下检测的信号从在相对低的检测温度条件下检测的信号提取与第二靶核酸序列有关的信号。与第二靶核酸序列有关的信号=[在60℃温度条件下检测的信号]-[(在72℃的相对高的检测温度跳进下检测的信号)×(与第一靶核酸序列有关的基准值)]与第一靶核酸序列有关的基准值根据检测通道改变,样品1、样品3及样品4的基准值分别为1.3、1.2及1.8。利用信号变位的阴性过滤表26与第二靶核酸序列有关的信号为从在60℃温度条件下检测的信号提取的信号。在3个样品中,对于1个样品(样品1),与第二靶核酸序列有关的嘴周45循环中的信号值与最小信号值之间的差异并不大于阈值100(相对荧光单位),从而将与样品1有关的第二靶核酸序列作为阴性过滤。在匹配区间中生成对于信号的二次函数将与第一靶核酸序列有关的信号及与第二靶核酸序列有关的信号与二次函数进行匹配。匹配区间被设定为4循环至12循环,二次函数的对称轴被设定为循环50。匹配利用lm算法执行。利用二次函数的匹配准确度的阴性过滤表27在信号变位过滤中,对除被确定为阴性的一个样品(样品1)之外的剩余样品,在匹配区间利用二次函数来计算匹配准确度(r2值)。r2值利用数学式5计算,与r2值有关的阈值适用0.9。具有0.9以下的r2值的多个样品被确定为阴性。如表27所示,从上述数据集的信号值扣除二次函数的值来校准具有大于0.9的r2值的多个样品的数据集。利用非线性匹配函数的阴性过滤表28(a)生成s型函数利用包含4个参数的数学式3的s型函数来实施校准的上述数据集与s型函数的匹配。适用lm算法来生成与校准的数据集匹配的s型函数。(b)基于s型匹配函数的变位的阴性第一次过滤利用s型函数的变位来对阴性样品进行过滤。s型匹配函数的变位通过计算s型匹配函数的最大信号值与最小信号值之间的差异来获取。对所计算的变位与变位有关阈值(100相对荧光单位)进行比较来对多个阴性样品进行过滤。与所有样品有关的变位均大于阈值100。(c)基于s型匹配函数的最大斜率的阴性第二次过滤利用s型匹配函数的最大斜率来实施阴性第二次过滤。最大斜率通过对各个样品的s型匹配函数进行微分来计算。与最大斜率有关的阈值被设定为30。如图28所示,对样品3的与第一靶核酸序列有关的信号,s型匹配函数的最大斜率小于30,因此,将样品3的第一靶核酸序列作为阴性过滤。(d)基于匹配准确度r2值的阳性或阴性样品的最终确定匹配准确度利用r2值。r2值利用数学式4计算。与r2值有关的阈值为0.9。r2值大于0.9的样品被确定为阳性。试验结果适用与mudt技术一同利用非线性匹配函数的本发明来分析4个样品。将在相对低的检测温度条件下检测的信号的变位小于阈值(100相对荧光单位)的1个样品(样品2)作为阴性过滤。样品2被确定为均不存在第一靶核酸序列及第二靶核酸序列。对除样品2之外的3个样品提取与第二靶核酸序列有关的信号,对与第一靶核酸序列有关的信号的变位及与第二靶核酸序列有关的信号的变位及阈值(100相对荧光单位)进行了比较。将变位不大于阈值的样品1的与第二靶核酸序列有关的信号作为阴性过滤。生成对于未作为阴性过滤的信号的s型函数,将与s型函数的最大斜率不大于阈值30的样品3的第一靶核酸序列有关的信号作为阴性过滤。计算s型函数与信号之间的r2值,剩余所有信号的r2值大于阈值0.9,因此,作为阳性过滤。根据本发明的分析方法,对在相对低的检测温度条件下检测的信号的变位与阈值进行比较来确定具有不同检测温度的2个靶核酸序列的不存在。根据本发明的分析方法,与在相对高的检测温度条件下检测的信号的变位无关地提取与第二靶核酸序列有关的信号,由此,可确定第二靶核酸序列的存在或不存在。根据本发明的分析方法,可利用s型匹配函数来确定第一靶核酸序列及第二靶核酸序列的存在或不存在。以上,详细说明了本发明的特定部分,本发明所属
技术领域
的普通技术人员知道这种具体说明仅是优选的实例,本发明的范围并不局限于此。因此,本发明的实质范围通过发明要求保护范围和等同内容定义。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1