用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法

文档序号:406973阅读:530来源:国知局
专利名称:用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法
技术领域
本发明提供一种用于在测序技术中确定并使用最有利的核苷酸浓度的系统和方法。更具体来说,本发明是基于检测腺苷三磷酸双磷酸酶和DNA聚合酶的特定于物种的酶促效率,以便作为获得通过至少部分地基于酶促效率调节相应的核苷酸物种的浓度而实现的最优测序性能的措施。
背景技术
合成测序(SBS)通常指的是用于确定核酸样本中的一种或更多种核苷酸的身份或序列构成的方法,其中所述方法包括逐步合成与将要确定其核苷酸序列构成的模板核酸分子互补的多核苷酸分子的单链。举例来说,SBS技术通常如下操作在相应的序列位置处,将单核酸(其也被称作核苷酸)物种添加到与模板分子的核酸物种互补的初生多核苷酸分子。通常利用本领域内已 知的各种方法来检测将核酸物种添加到初生分子中,其中包括(但不限于)检测响应于焦磷酸盐分子的释放而发出的光的所谓焦磷酸测序方法、检测响应于氢离子的释放的PH改变的方法或者比如采用可逆终止子的那些的荧光检测方法。添加核苷酸物种的处理通常是迭代性(^iterative)的,直到合成与模板互补的完整的(即所有序列位置都被表示)或者所期望的序列长度为止。在美国专利号6,274,320,7, 211,390、7,244,559,7, 264,929和7,335,762中描述了 SBS技术的一些例子,其中的每一篇出于所有目的被全文合并在此以作参考。在SBS的一些实施例中,将寡核苷酸引物(primer)设计成退火到与样本模板分子相关联的预定互补序列。在存在核酸聚合酶的情况下为引物/模板络合物给出核苷酸物种。如果所述核苷酸物种与对应于样本模板分子上的直接邻近寡核苷酸引物的3’末端的序列位置的核酸物种互补,则聚合酶将利用所述核苷酸物种延伸引物。可替换地,在一些实施例中,为引物/模板络合物同时给出多个感兴趣的核苷酸物种(通常是A、G、C和T),并且在样本模板分子上的直接邻近寡核苷酸引物的3’末端的对应序列位置处互补的核苷酸物种被合并。在任一个所描述的实施例中,核苷酸物种可能被化学阻滞(比如在3’-0位置处)以防止进一步延伸,并且需要在下一轮合成之前解除阻滞。如前所述,可以通过本领域内已知的多种方法来检测对于核苷酸物种的合并,例如通过检测焦磷酸盐(PPi)的释放(在美国专利号6,210,891,6, 258,568和6,828,100中描述了例子,其中的每一篇出于所有目的被全文合并在此以作参考)、通过检测氢的释放或者通过与核苷酸结合的可检测标签。可检测标签的一些例子包括(但不限于)质量标记以及荧光或化学发光标签。在典型的实施例中,例如通过酶促降解和清洗去除未被合并的核苷酸。特别在清洗效率低的情况下,可以通过添加腺苷三磷酸双磷酸酶来实现对于自由核苷酸的酶促去除。本领域普通技术人员将认识到,腺苷三磷酸双磷酸酶对于自由核苷酸的工作是通过打断dNTP分子的分子键,从而产生单磷酸核苷酸和无机磷酸盐(Pi)。因此,诸如ATP之类的dNTP被分解成dNMP (或者在ATP的情况下是AMP)和2个Pi分子。在其中使用了可检测标签的实施例中,通常将必须在后面的合成循环之前解除其活性(例如通过化学裂解或光致漂白)。随后可以利用另一个核苷酸物种或者感兴趣的多个核苷酸物种对模板/聚合酶络合物中的下一个序列位置进行查询,正如前面所描述的那样。核苷酸物种添加、引物延伸、信号采集、多余核苷酸分子降解以及清洗的迭代导致确定模板链的核苷酸序列。在SBS的典型实施例中,在任一次测序反应中同时对大量或众多基本上完全相同的模板分子(例如103、104、IO5UO6或IO7个分子)进行分析,以便获得强到足以进行可靠检测的信号。对于低信噪比要求与给定反应的群体中的基本上所有模板分子相关联的初生分子的所谓“同质延伸”。这里所使用的术语“同质延伸”通常指的是延伸反应的关系或相位,其中前面所描述的每一个基本上完全相同的模板分子同质地施行反应中的相同步骤。举例来说,与模板分子的群体相关联的每一项延伸反应当其在对于每一个相关联的模板分子的相同序列位置处施行相同的反应步骤时可以被描述为彼此同相或者处于相位同步。本领域普通技术人员将认识到,聚合酶延伸反应可能导致每一个群体中的一小部分模板分子失去或脱离与所述群体中的其余模板分子的相位同步,(也就是说,与模板分子的所述部分相关联的反应或者提前于或者落后于所述群体上的测序反应游程(run)中的其他模板分子(在Ronaghi, M.的“Pyrosequencing sheds light on DNA sequencing,,GenomeRes. 11,3-11,(2001年)中描述了一些例子,其出于所有目的被全文合并在此以作参考))。举例来说,聚合酶没有能够将一个或更多核苷酸物种正确地合并到一个或更多初生分子中以便把序列延伸一个位置,将导致每一项后续反应所处的序列位置落后于所述群体的其余部分的序列位置并且与之异相。这种效应在这里被称作“不完整延伸”(IE)。可替换地,通过在提前于群体的其余部分的序列位置并且与之异相的序列位置处合并一个或更多核苷酸物种而导致的初生分子的不正确延伸在这里被称作“前推(carry forward)”(CF)。CF与IE的组合效应在这里被称作CAFIE。在下面的专利申请中描述了用于校正CAFIE错误的系统和方法的例子2007年2月15日提交的标题为“System and Method For CorrectingPrimer Extension Errors in Nucleic Acid Sequence Data (用于校正核酸序列数据中的引物延伸错误的系统和方法)”的美国专利申请序列号12/224,065和2001年3月8日提交的标题为 “System and Method to Correct Out of Phase Errors in DNA SequencingData by Use of Recursive Algorithm (通过使用递归算法来校正DNA测序数据中的异相错误的系统和方法)”的13/043,063 ;其中的每一项出于所有目的被全文合并在此以作参考。关于不完整延伸的问题,可能存在促成IE的几种可能的机制,所述机制可能单独发生或者以某种组合发生。促成IE的可能机制的一个例子可以包括缺少为模板/聚合酶络合物的子集给出的核苷酸物种。促成IE的可能机制的另一个例子可以包括聚合酶分子的子集没有能够合并被正确地给出以供合并到初生分子中的核苷酸物种。促成IE的可能机制的另一个例子可以包括在模板/聚合酶络合物处缺乏聚合酶活性。关于CF的问题,可能存在促成CF的几种可能的机制,所述机制可能单独发生或者以某种组合发生。举例来说,一种可能的机制可以包括从前一个循环遗留下的多余核苷酸物种。在该例中,其结果可能包括一小部分“A”核苷酸物种存在于“G”核苷酸物种循环中,从而在模板分子中的对应序列位置处存在互补的“T”核苷酸物种的情况下会导致一小部分初生分子的延伸。导致前推效应的可能机制的另一个例子可以包括聚合酶错误,比如核苷酸物种被错误地合并到不与模板分子上的核苷酸物种互补的初生分子中。因此应当认识到,为了使得引入CAFIE相位同步错误的可能性最小化,非常希望在流动中给出核苷酸物种的浓度,其被优化成高到足以使得聚合酶可以在短时间段期间高效地将核苷酸物种合并到模板分子群体的所有成员,而与此同时还被优化成低到足以使得诸如腺苷三磷酸双磷酸酶之类的降解酶在合并时段之后与多余核苷酸发生反应并且使其无法被聚合酶合并。还应当认识到,酶的效率可以特定于每一个核苷酸物种,其中一种酶对于一个物种可能更加高效并且对于另一个物种效率较低。因此,下面的能力将是特别有利的对于聚合酶和腺苷三磷酸双磷酸酶二者确定特定于物种的酶促效率,并且在通过合成反应进行的测序中采用每一个核苷酸物种的作为对于该物种的合并和降解效率之间的优化平衡的浓度。

发明内容
本发明的实施例涉及分子生物学。更具体来说,本发明的实施例涉及基于特定于物种的酶促效率(特别是腺苷三磷酸双磷酸酶和DNA聚合酶的效率)来调整用在测序方法中的每一个核苷酸物种的浓度的方法和系统,以便达到任何给定SBS游程的最优测序性能。描述了用于优化测序性能的方法的一个实施例,其包括以下步骤对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶被引入反应环境以便降解未被合并的核苷酸物种分子;以及检测响应于核苷酸物种的合并的信号。此外描述了用于优化测序性能的方法的一个实施例,其包括以下步骤将多个相对浓度的核苷酸物种引入到包括聚合酶、腺苷三磷酸双磷酸酶和某一物种的模板核酸分子的某一类型的反应环境中,以便 产生所述物种的模板核酸分子的未经校正的序列构成;根据所述物种的模板核酸分子的未经校正的序列构成和参考序列构成对于每一个核苷酸物种确定完成(completion)效率值和前推值;以及利用特定于核苷酸物种的完成效率值和特定于核苷酸物种的前推值对于多个核酸物种当中的每一个识别出特定于物种的浓度,其中对所述特定于物种的浓度进行优化,以便最小化由所述类型的反应环境中的测序反应所产生的错误。在一些实现方式中,所述方法还包括利用所述类型的反应环境执行测序反应的步骤,其中所述测序反应包括以下步骤在特定于物种的浓度下将每一个核酸物种迭代地递送到包括第二物种模板核酸分子和聚合酶的所述类型的反应环境,其中在递送核酸物种的迭代之间将腺苷三磷酸双磷酸酶递送到反应环境;以及检测响应于由聚合酶合并核酸物种而生成的多个信号。此外描述了用于优化测序性能的系统的一个实施例,所述系统包括计算机和测序仪器,所述计算机包括存储在其上的可执行代码,其中所述可执行代码施行包括以下步骤的方法对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;以及利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度,其中确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡;所述测序仪器施行包括以下步骤的方法在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及检测响应于核苷酸物种的合并的信号。前面的实施例和实现方式不一定彼此包含或排斥,并且可以按照没有冲突并且另为可能的任意方式相组合,而不管其是与同一个还是不同的实施例或实现方式相关联地给出的。对于一个实施例或实现方式的描述不意图关于其他实施例和/或实现方式进行限制。此外,在本说明书中的其他地方描述的任何一项或更多项功能、步骤、操作或技术在替换的实现方式中可以与在概要中描述的任何一项或更多项功能、步骤、操作或技术相组合。因此,前面的实施例和实现方式是说明性而非限制性的。因此,本发明的第一方面被限定为一种用于优化测序性能的方法,其包括以下步骤
a)对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;
b)利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;
c)在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及
d)检测响应于核苷酸物种的合并的信号。确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡。可以利用米氏方程(Michaelis-Menten equation)计算特定于核苷酸物种的降解速率。

所述多个核苷酸物种可以包括dTTP、dCTP、dGTP、dATP和/或a -thio_dATP。可以对于dCTP物种来归一化对于每一个核苷酸物种的浓度,所述dCTP物种在各核苷酸物种当中包括最低浓度和活性值。对于多个或者甚至每一个核苷酸物种的浓度可以彼此不同。可以通过在反应环境中把每一个核苷酸物种的浓度保持足够时间从而使得在通过腺苷三磷酸双磷酸酶降解之前发生合并来优化合并效率。可以基于核苷酸物种与核酸模板物种的互补性来在一个或更多处将核苷酸物种的分子合并到初生分子中。前面公开的方法还可以包括从检测到的信号生成序列读取的步骤,其中序列读取包括所述物种的模板核酸分子的序列构成。本发明的第二方面被限定为一种用于优化测序性能的方法,其包括以下步骤
a)将多个相对浓度的核苷酸物种引入到包括聚合酶、腺苷三磷酸双磷酸酶和某一物种的模板核酸分子的某一类型的反应环境中,以便产生所述物种的模板核酸分子的未经校正的序列构成;
b)根据所述物种的模板核酸分子的未经校正的序列构成和参考序列构成来对于每一个核苷酸物种确定完成效率值和前推值;以及
c)利用特定于核苷酸物种的完成效率值和特定于核苷酸物种的前推值对于多个核酸物种当中的每一个识别出特定于物种的浓度,其中对所述特定于物种的浓度进行优化,以便最小化由所述类型的反应环境中的测序反应所产生的错误。在一个实施例中,所述方法还包括以下步骤
d)利用所述类型的反应环境执行测序反应,其中所述测序反应包括以下步骤1、在特定于物种的浓度下将每一个核酸物种迭代地递送到包括第二物种模板核酸分子和聚合酶的所述类型的反应环境,其中在递送核酸物种的迭代之间将腺苷三磷酸双磷酸酶递送到反应环境;以及
i1、检测响应于由聚合酶合并核酸物种而生成的多个信号。如果包括步骤d),则可以在特定于核苷酸物种的浓度下把腺苷三磷酸双磷酸酶递送到反应环境。反应环境的类型可以包括布置在平面基质(substrate)上的阱(well),其中所述平面基质包括多个阱。所述相对浓度包括第一百分比的A核苷酸物种浓度和T核苷酸物种浓度相对于第二百分比的G核苷酸物种浓度和C核苷酸物种浓度。如果是这种情况,则可以根据所述物种的模板核酸分子的序列 构成来定义第一百分比和第二百分比,其中所述序列构成是AT富集或GC富集。类似于前面公开的本发明的第一方面,所述多个核苷酸物种可以包括dTTP、dCTP、dGTP、dATP和/或a -thio-dATP。可以对于dCTP物种来归一化对于每一个核苷酸物种的浓度,所述dCTP物种在各核苷酸物种当中包括最低浓度和活性值。在第三方面,本发明针对一种用于施行前面公开的新方法的系统和仪器。更精确地说,本发明提供一种用于优化测序性能的系统或仪器,其包括
a)包括存储在其上的可执行代码的计算机,其中所述可执行代码施行包括以下步骤的方法1、对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;
i1、利用特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度,其中确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡;以及
b)施行包括以下步骤的方法的测序仪器1、在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及
i1、检测响应于核苷酸物种的合并的信号。


通过下面结合附图做出的详细描述将会更加清楚地认识到前述和其他特征。在附图中,相似的附图标记指代相似的结构、元件或方法步骤,并且附图标记的最左一位数字指代所提到的元件第一次出现在其中的附图编号(例如元件160第一次出现在图1中)。但是所有这些惯例意图是典型性或说明性而非限制性的。图1是处于计算机控制下的测序仪器和反应基质的一个实施例的功能方框图。
具体实施例方式正如下面将要更加详细地描述的那样,当前描述的发明的实施例包括一种用于在测序技术中针对特定于物种的酶促效率调整核苷酸物种的浓度的系统和方法。具体来说,本发明的实施例涉及基于SBS系统的酶(即腺苷三磷酸双磷酸酶和DNA聚合酶)的反应速率来优化核苷酸浓度。a、一般性描述
术语“流图”通常指的是通过SBS方法(特别是基于焦磷酸盐的测序方法,其也被称作“焦磷酸测序”)生成的序列数据的图形表示,并且更加特别地可以被称作“裂解色谱图”。这里使用的术语“读取”或“序列读取”通常指的是从单个核酸模板分子或者由所述模板核酸分子的多个基本上完全相同的拷贝构成的群体获得的整个序列数据。这里使用的术语“游程”或“测序游程”通常指的是在对于一个或更多模板核酸分子的测序操作中施行的一系列测序反应。这里使用的术语“流动”通常指的是典型地作为把流体溶液引入到包括模板核酸分子的反应环境的迭代过程的一部分的单个循环,其中所述溶液可以包括用于添加到初生分子或其他试剂的核苷酸物种,比如可以在测序过程中采用的或者用以减少来自核苷酸物种的先前流动的遗留物或噪声效应的缓冲剂、清洗溶液或酶。这里使用的术语“流动循环”通常指的是其中在所述循环期间把包括某一核苷酸物种的流体流动一次的顺序的一系列流动(也就是说一个流动循环可以包括按照T、A、C、G核苷酸物种的次序的顺序添加,但是其他序列组合也被视为所述定义的一部分)。通常来说,流动循环是重复循环,其在各个循环之间具有相同的流动序列。这里使用的术语“读取长度”通常指的是可以对其进行可靠地测序的模板分子的长度上限。存在许多促成系统和/或过程的读取长度的因素,其中包括(但不限于)模板核酸分子中的GC含量的程度。这里使用的术语“测试片段”或“TF”通常指的是可以出于质量控制、校准或者其他有关目的而被采用的具有已知序列构成的核酸元素。这里使用的术语“引物”通常指的是在一定条件下充当DNA合成的发起点的寡核苷酸,在所述条件下,在适当的温度下并且在适合的缓冲剂中引发与核酸链互补的引物延伸产物的合成。引物优选地是单链脱氧寡核苷酸。“初生分子”通常指的是通过合并与模板分子中的对应核苷酸物种互补的核苷酸物种而由与模板相关的DNA聚合酶延伸的DNA链。术语“模板核酸”、“模板分子”、“目标核酸”或“目标分子”通常指的是作为从中生成序列数据或信息的测序反应的对象的核酸分子。这里使用的术语“核苷酸物种”通常指的是通常被合并到初生核酸分子中的包括嘌呤(腺嘌呤、鸟嘌呤)和嘧啶(胞嘧啶、尿嘧啶、胸腺嘧啶)的核酸单体的身份。这里使用的术语“单体重复”或“均聚物”通常指的是包括相同核苷酸物种的两个或更多序列位置(即重复的核苷酸物种)。这里使用的术语“同质延伸”通常指的是延伸反应的关系或相位,其中由基本上完全相同的模板分子构成的群体的每一个成员正同质地施行反应中的相同延伸步骤。这里使用的术语“完成效率”通常指的是在给定流动期间被正确地延伸的初生分子的百分比。这里使用的术语“不完整延伸比率”通常指的是没有被正确地延伸的初生分子的数目与所有初生分子的数目的比值。这里使用的术语“基因组库”或“散弹枪基因库”通常指的是从有机体或个体的整个基因组(即基因组的所有区段)导出和/或代表所述整个基因组的分子集。这里使用的术语“扩增子”通常指的是所选择的扩增产物,比如从聚合酶链反应或连接酶链反应技术产生的那些扩增产物。这里使用的术语“变异体”或“等位基因”通常指的是各自编码类似的序列构成的多个物种当中的一个,但是所述多个物种彼此又有一定程度的区别。所述区别可以包括相关领域普通技术人员所知的任何类型的变化,其中包括(但不限于)例如单核苷酸多态性(SNP)之类的多态性、插入或删除(插入/删除事件的组合也被称作“indels (插入删除)”)、重复序列(其也被称作串联重复)的数目的差异、以及结构变化。这里使用的术语“等位基因频率”或“等位基因的频率”通常指的是由特定变异体构成的一个群体当中的所有变异体的比例。这里使用的术语“关键序列”或“关键元素”通常指的是与已知位置处(即通常被包括在所连接的适配子元素中)的模板核酸分子相关联的包括已知序列构成的核酸序列元素(其通常具有大约4个序列位置(即TGAC)或者核苷酸物种的其他组合),其被采用作为针对从模板分子生成的序列数据的质量控制参考。如果序列数据在正确的位置处包括与关键元素相关联的已知序列构成,则其通过质量控制。这里使用的术语“关键通过(keypass)”或“关键通过阱”通常指的是在反应阱中对于具有已知序列构成的完全长度核酸测试序列(即前面提到的“测试片段”或“TF”)的测序,其中把从TF序列和/或与TF相关联或者处于与目标核酸相关联的适配子中的关键序列导出的序列的精度与TF和/或关键序列的已知序列构成进行比较,并且将其用来测量测序的精度以及用于质量控制。在典型的实施例中,测序游程中的阱的总数的一定比例将是关键通过阱,其在一些实施例中可以是区域性分布的。这里使用的术语“钝性末端”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是其一端终结于一对互补核苷酸碱基物种的线性双链核酸分子,其中一对钝性末端通常对于彼此连接是相容的。这里使用的术语“粘性末端”或“突出”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是在分子的一条链的末端具有一个或更多未配对核苷酸物种的线性双链核酸分子,其中所述未配对核苷酸物种可以存在于任一条链上并且包括单个碱基位置或多个碱基位置(其有时也被称作“黏性末端”)。 这里使用的术语“SPRI”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是“固相可逆固定(Solid Phase Reversible Immobilization)”的专利技术,其中在存在微珠的情况下并且在特定的缓冲剂条件下选择性地沉淀目标核酸,其中所述微珠常常被羧化并且是顺磁性的。所沉淀的目标核酸固定到所述微珠上并且保持与之结合,直到根据操作员的需要通过洗脱缓冲剂去除为止(DeAngelis, Margaret Μ.等人的“Solid-Phase Reversible Immobilization for the Isolation of PCR Products,,(Nucleic Acids Res,1995年,Vol. 23:22,4742-4743),其出于所有目的被全文合并在此以作参考)。这里使用的术语“羧化”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是通过添加至少一个羧基来修改例如微粒子之类的材料。羧基是COOH或C00-。这里使用的术语“顺磁性”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是材料的特性,其中只有在存在外加磁场的情况下所述材料才具有磁性,并且一旦去除了外加磁场之后就不再保留任何磁化。这里使用的术语“微珠”或“微珠基质”通常指的是具有任何便利的尺寸、具有不规则或规则形状的任何类型的固相颗粒,并且其是从许多已知材料制作的,比如纤维素、纤维素衍生物、丙烯酸树脂、玻璃、硅胶、聚苯乙烯、明胶、聚乙烯基吡咯烷酮、乙烯基与丙烯酰胺的共聚物、与二乙烯基苯等等交联的聚苯乙烯(如在Merrifield, Biochemistry 1964, 3, 1385-1390中所描述的那样)、聚丙烯酰胺、乳胶、聚苯乙烯、右旋糖苷、橡胶、硅、塑料、硝化纤维、自然海绵、硅胶、可控孔度玻璃、金属、交联的右旋糖苷(例如Sephadex )琼脂糖凝胶(Sepharose )以及本领域技术人员所知的其他固相微珠支持物。这里使用的术语“反应环境”通常指的是通常可以在其中发生反应的一定体积的空间,反应物被至少暂时性地包含或局限在其中从而允许检测至少一种反应产物。反应环境的例子包括(但不限于)小容器、管、瓶以及平面或非平面基质上的一个或更多凹窝、阱或腔室。下面将总体上描述与样本准备和处理、序列数据生成以及序列数据分析相关联的系统和方法的一些示例性实施例,其中一部分或全部可经得起检验地用于这里所描述的发明的实施例。具体来说,将描述用于准备模板核酸分子、扩增模板分子、生成特定于目标的扩增子和/或基因组库的系统和方法、测序方法和仪器以及计算机系统的实施例。在典型的实施例中,应当把从实验或诊断样本导出的核酸分子从其未经处理的形式准备及处理成可经得起检验地用于高吞吐量测序的模板分子。处理方法对于不同应用可以不同,从而得到包括各种特性的模板分子。举例来说,在高吞吐量测序的一些实施例中,优选地生成模板分子,其序列或读取长度至少与特定测序方法可以为之准确地产生序列数据的长度相当。在该例中,所述长度可以包括下述范围大约25-30个碱基对、大约50-100个碱基对、大约200-300个碱基对、大约350-500个碱基对、大约500-1000个碱基对、多于1000个碱基对或者可经得起检验地用于特定测序应用的其他长度。在一些实施例中,利用本领域普通技术人员所知的若干方法对来自样本(比如基因组样本)的核酸进行分段。在优选实施例中,所述方法对核酸进行随机分段(即不针对特定序列或区段进行选择)并且可以包括被称为雾化或超声降解方法的那些。但是应当认识到,可以采用其他分段方法以用于分段目的,比如利用限制内切核酸酶进行消化。此外在该例中,一些处理方法可以采用本领域内已知的尺寸选择方法来选择性地分离出具有所期望的长度的核酸片段。此外,在一些实施例中优选地把附加的功能元素与每一个模板核酸分子相关联。可以针对多种功能采用所述元素,其中包括(但不限于)用于扩增和/或测序方法的引物序列、质量控制元素(即,比如关键元素或者其他类型的质量控制元素)、对例如与来源或患者的样本的各种关联进行编码的唯一标识符(其也被称作复用标识符或“MID”)或者其他功能元素。举例来说,所描述的发明的一些实施例包括把具有已知的并且可识别的序列构成的MID元素的一个或更多实施例与样本相关联,并且把MID元素的实施例与来自相关联的样本的模板核酸分子相耦合。来自若干不同样本的耦合了 MID的模板核酸分子被聚集到单个“复用”样本或构成中,其随后可以被高效地处理以便产生对于每一个耦合了 MID的模板核酸分子的序列数据。将对于每一种模板核酸的序列数据去卷积,以便识别出耦合了 MID元素的序列构成以及与所识别出的来源样本的关联。在该例中,复用的构成可以包括来自大约384个样本、大约96个样本、大约50个样本、大约20个样本、大约16个样本、大约12个样本、大约10个样本或者其他数目的样本的代表。每一个样本可以与研究情境中的不同的实验条件、治疗、物种或个体相关联。类似地,每一个样本可以与诊断情境中的不同的组织、细胞、个体、条件、药物或其他治疗相关联。相关领域的普通技术人员将认识到,前面列出的样本的数目是为了举例的目的,并且因此不应当被视为进行限制。在优选实施例中,每一个MID元素的序列构成很容易识别,并且对于从测序过程引入的错误具有抗性。MID元素的一些实施例包括与自然出现的序列具有最低序列相似性的核酸物种的唯一序列构成。可替换地,MID元素的实施例可以包括与自然出现的序列的某种程度的序列相似性。此外,在优选实施例中,每一个MID元素相对于模板核酸分子的某一特征和/或耦合到模板分子的适配子元素的位置是已知的。令每一个MID具有已知的位置对于在序列数据中找到MID元素、以及针对可能的错误解释MID序列构成以及与来源样本的后续关联都是有用的。 举例来说,可以用作针对MID元素的位置关系的锚定的一些特征可以包括(但不限于)模板分子的长度(也就是说已知MID元素与5’或3’末端相距如此多个序列位置)、诸如关键元素之类的可辨识序列标记以及/或者其位置与MID元素邻近的一个或更多引物元素。在该例中,关键和弓I物元素通常包括已知的序列构成,其在复用构成中的不同样本之间通常不发生变化,并且可以被采用作为搜索MID元素的位置参考。由应用135实施的分析算法可以在计算机130上执行,以便分析对于每一个耦合了 MID的模板所生成的序列数据,从而识别出更加容易辨识的关键和/或引物元素,并且从这些位置进行外推从而识别出被推测为包括MID元素的序列的序列区段。应用135随后可以处理所推测出的区段以及可能在侧翼区段中离开一定距离的序列构成,从而确实识别出MID元素及其序列构成。所描述的其中一些或所有功能元素可以被组合到适配子元素中,其在特定处理步骤中被耦合到核苷酸序列。举例来说,一些实施例可以把包括互补序列构成的引物序列元素或区段关联到被采用于扩增和/或测序的引物序列。此外,相同的元素可以被采用于被称为“链选择”以及把核酸分子固定到固相基质的那些。在一些实施例中,两组引物序列区段(在下文中称作引物序列A和引物序列B)可以被采用于链选择,其中只把具有引物序列A的一份拷贝和引物序列B的一份拷贝的单链选择并且包括作为所准备的样本。在替换的实施例中,适配子元素的设计特性消除了对链选择的需要。在用于扩增和固定的方法中可以采用相同的引物序列,其中例如可以把引物序列B固定在固体基质上,并且从该处延伸扩增产物。在下面的专利申请中描述了用于分段、链选择以及添加功能元素和适配子的样本处理的附加实例2004年I月28日提交的标题为“Method for preparingsingled-stranded DNA libraries (用于准备单链DNA库的方法)”的美国专利申请序列号10/767,894 ;2008 年 5 月 29 日提交的标题为 “System and Method for Identificationof Individual Samples from a Multiplex Mixture (用于从复用混合物中识别单独样本的系统和方法)”的美国专利申请序列号12/156,242 ;以及2009年2月23日提交的标题为“System and Method for Improved Processing of Nucleic Acids for Production ofSequencable Libraries (用于改进对于核酸的处理以便产生可测序库的系统和方法)”的美国专利申请序列号12/380,139,其中的每一篇出于所有目的被全文合并在此以作参考。 将描述用于施行模板核酸分子的扩增以便生成由基本上完全相同的拷贝构成的群体的系统和方法的各个实例。本领域普通技术人员将会看到,在SBS的一些实施例中,在把一个或更多核苷酸物种合并到与模板分子的一份拷贝相关联的每一个初生分子中时,希望生成每一个核酸元素的许多拷贝以便生成更强的信号。在本领域内已经知道许多用于生成核酸分子的拷贝的技术,比如例如利用被称为细菌载体的扩增、“滚动圆(RollingCircle)”扩增(在合并于前文中以作参考的美国专利号6,274,320和7,211,390中做了描述)以及聚合酶链反应(PCR)方法的那些,其中的每一种技术都适于与这里所描述的本发明一起使用。特别可经得起检验地用于高吞吐量应用的一种PCR技术包括被称为乳剂PCR方法(其也被称作emPCR 方法)的那些。乳剂PCR方法的典型实施例包括产生两种不相混物质的稳定乳剂,从而产生可以在其中发生反应的水的液滴。具体来说,可经得起检验地用在PCR方法中的乳剂的水的液滴可以包括作为液滴(其也被称作不连续相)悬浮或散布在另一种流体(比如通常包括某种类型的油的疏水流体,其也被称作连续相)中的第一流体(比如基于水的流体)。可以采用的油的例子包括(但不限于)矿物油、基于硅酮的油或者氟化油。此外,一些乳剂实施例可以采用用来稳定乳剂的表面活性剂,其对于诸如PCR之类的特定处理方法可能特别有用。表面活性剂的一些实施例可以包括硅酮或氟化表面活性剂当中的一种或更多种。举例来说,可以采用一种或更多种非离子表面活性剂,其中包括(但不限于)山梨糖醇酐单油酸酯(其也被称作Span 80)、聚氧乙烯山梨醇酐单油酸酯(其也被称作Tween 80),或者在一些优选实施例中包括聚二甲基硅氧烷共聚醇(其也被称作AbiI EM90)、聚硅氧烷、聚烷基聚醚共聚物、聚甘油酯、泊洛沙姆以及PVP/十六烷共聚物(其也被称作单聚物U-151),或者在更加优选的实施例中包括环戊硅氧烷中的高分子量硅聚醚(其也被称作可以从Dow Corning获得的DC 5225C)。乳剂的液滴还可以被称作隔室、微胶囊、微反应器、微环境或者相关领域内所常用的其他名称。水的液滴的尺寸范围可以取决于乳剂组分或成分的构成、包含在其中的内容以及所采用的形成技术。所描述的乳剂产生可以在其中施行化学反应(比如PCR)的微环境。举例来说,施行所期望的PCR反应所必需的模板核酸和所有试剂都可以被封装并且化学隔离在乳剂的液滴中。在一些实施例中可以采用附加的表面活性剂或其他稳定剂以便促进液滴的附加稳定性,正如前面所描述的那样。可以利用所述液滴执行PCR方法所典型的热循环操作以便扩增所封装的核酸模板,从而导致生成包括模板核酸的许多基本上完全相同的拷贝的群体。在一些实施例中,液滴内的群体可以被称作“克隆隔离”、“隔室化”、“隔绝”、“封装”或“局部化”的群体。此外在该例中,所描述的其中一些或所有液滴还可以封装诸如微珠之类的固体基质,以便附着模板和模板的扩增拷贝、与模板互补的扩增拷贝或其组合。此外,可以允许所述固体基质附着其他类型的核酸、试剂、标签或者其他感兴趣的分子。
在乳剂破裂和微珠恢复之后,在典型的实施例中可能还希望“富集”在其上固定了模板核酸分子的基本上完全相同的拷贝的成功地扩增的群体的微珠。举例来说,用于富集“DNA阳性”的微珠的处理可以包括把引物物种杂交到通常在适配子序列中找到的已固定的扩增拷贝的自由末端上的区段,利用聚合酶居间促成的延伸反应延伸引物,以及将引物结合到诸如磁性或琼脂糖微珠之类的富集基质。可以对包括微珠的溶液施加选择性条件,比如磁场或离心作用,其中富集磁珠对所述选择性条件做出响应并且与“DNA阴性”的微珠分离(即不具有或者只有很少已固定拷贝)。可用于当前描述的本发明的乳剂的实施例可以包括非常高密度的液滴或微胶囊,从而允许按照大规模并行的方式施行所描述的化学反应。在美国专利号7,638,276、7,622,280,7, 842,457和7,927,797以及美国专利申请序列号11/982,095中描述了对于扩增所采用的乳剂及其在测序应用中的使用的附加实例,其中的每一篇出于所有目的被全文合并在此以作参考。此外,有时被称作超深测序的实施例生成用于测序的特定于目标的扩增子,其可以与当前描述的本发明一起采用,其包括使用各组特定的核酸引物以扩增来自包括目标核酸的样本的一个或多个所选目标区段。此外,样本可能包括由已知或疑似包含序列变异体的核酸分子构成的群体,其中包括与研究或诊断用途相关联的序列构成,在这种情况下可以采用引物来扩增序列变异体在样本中的分布并且提供对其的理解。举例来说,可以施行一种用于通过对于核酸样本中的多个等位基因的特定扩增和测序来识别序列变异体的方法。首先通过一对PCR引物对核酸进行扩增,所述PCR引物被设计成扩增围绕感兴趣区段或者核酸群体所共有的片段的区段。随后在单独的反应容器(比如前面描述的基于乳剂的容器)中对PCR反应的每一项产物(第一扩增子)进行进一步的单独扩增。对各自从第一扩增子群体当中的一个成员导出的所得到的扩增子(其在这里被称作第二扩增子)进行测序,并且序列集被用来确定所存在的一种或更多种变异体的等位基因频率。很重要的是,所述方法不需要关于所存在的变异体的先前知识,并且可以通常识别出在核酸分子的群体中以<1%的频率存在的变异体。所描述的特定于目 标的扩增和测序方法的一些优点包括高于先前所获得的灵敏度水平。此外,对于采用高吞吐量测序仪器的实施例,比如例如对于采用由454 LifeSciences Corporation提供的被称为PicoTiterPlate 阵列(其有时也被称作PTP 平板或阵列)阱的那些的实例实施例,可以采用所描述的方法对于每次游程或实验为超过100000个、超过300000个、超过500000个或者超过1000000个核酸区段生成序列构成,并且这可以至少部分地取决于用户优选项,比如通过使用密封垫等而实现的通道配置等等。此外,所描述的方法提供对于可以代表等位基因变异体的1%或更少的低丰度等位基因的灵敏检测。所述方法的另一个优点在于生成包括所分析区段的序列的数据。很重要的是,不需要具有关于所分析的基因座的序列的先验知识。在下面的专利申请中描述了用于测序的特定于目标的扩增子的附加实例2005年 4 月 12 日提交的标题为 “Methods for determining sequence variants usingultra-deep sequencing (利用超深测序来确定序列变异体的方法)”的美国专利申请序列号 11/104,781 ;2008 年 3 月 14 日提交的标题为 “System and Method for Detection ofHIV Drug Resistant Variants(用于检测对HIV药物具有抗性的变异体的系统和方法)”的PCT专利申请序列号US 2008/003424;以及2009年6月17日提交的标题为“System andMethod for Detection of HIV Tropism Variants (用于检测HIV向性变异体的系统和方法)”的美国专利号7,888,034,其中的每一篇出于所有目的被全文合并在此以作参考。此外,测序的实施例还可以包括Sanger类型的技术、通常被称作杂交测序(SBH)的技术、连接测序(SBL)或者合并测序(SBI)技术。此外,测序技术可以包括被称为聚合酶克隆测序技术;纳米孔、波导和其他单分子检测技术;或者可逆终止子技术的那些。如前所述,一种优选的技术可以包括合成测序方法。举例来说,一些SBS实施例对由核酸模板的基本上完全相同的拷贝构成的群体进行测序,并且通常采用一种或更多种寡核苷酸引物,所述寡核苷酸引物被设计成退火到样本模板分子或者附着到模板分子的一个或更多适配子的预定互补位置。在存在核酸聚合酶的情况下为引物/模板络合物给出核苷酸物种。如果所述核苷酸物种与对应于样本模板分子上的直接邻近寡核苷酸引物的3’末端的序列位置的核酸物种互补,则聚合酶将利用所述核苷酸物种延伸引物。可替换地,在一些实施例中,为引物/模板络合物同时给出多个感兴趣的核苷酸物种(通常是A、G、C和T),并且在样本模板分子上的直接邻近寡核苷酸引物的3’末端的对应序列位置处互补的核苷酸物种被合并。在任一个所描述的实施例中,核苷酸物种都可能被化学阻滞(比如在3’ -O位置处)以防止进一步延伸,并且需要在下一轮合成之前解除阻滞。还应当认识到,向初生分子的末端添加核苷酸物种的处理与前面针对向引物末端进行添加所描述的处理基本上相同。

如前所述,可以通过本领域内已知的多种方法来检测对于核苷酸物种的合并,例如通过使用酶促反应处理产生光来检测焦磷酸盐(PPi)的释放或者通过检测pH改变(在美国专利号6,210,891,6, 258,568和6,828,100中描述了例子,其中的每一篇出于所有目的被全文合并在此以作参考),或者通过与核苷酸结合的可检测标签。可检测标签的一些例子包括(但不限于)质量标记以及荧光或化学发光标签。在典型的实施例中,例如通过清洗来去除未被合并的核苷酸。此外,在一些实施例中,可以对未被合并的核苷酸进行酶促降解,比如例如利用腺苷三磷酸双磷酸酶或焦磷酸酶进行降解,正如在2008年6月27日提交的标题为 “System and Method for Adaptive Reagent Control in Nucleic AcidSequencing (用于核酸测序中的自适应试剂控制的系统和方法)”的美国专利申请序列号12/215,455 和 2009 年 I 月 29 日提交的标题为“System and Method for Improved SignalDetection in Nucleic Acid Sequencing (用于改进核酸测序中的信号检测的系统和方法)”的12/322,284中所描述的那样,其中的每一篇出于所有目的被全文合并在此以作参考。在其中使用可检测标签的实施例中,通常将必须在后面的合成循环之前解除其活性(例如通过化学裂解或光致漂白)。随后可以利用另一个核苷酸物种或者感兴趣的多个核苷酸物种对模板/聚合酶络合物中的下一个序列位置进行查询,正如前面所描述的那样。核苷酸添加、延伸、信号采集以及清洗的重复循环导致确定模板链的核苷酸序列。继续该例,通常在任一次测序反应中同时对大量或众多基本上完全相同的模板分子(例如103、104、IO5UO6或IO7个分子)同时进行分析,以便获得强到足以进行可靠检测的信号。此外,在一些实施例中可能有利的是改进测序过程的读取长度能力和质量,这是通过采用可以被称作“配对末端”的测序策略而实现的。举例来说,测序方法的一些实施例在可以从中生成高质量且可靠的读取的分子总长度方面受到限制。换句话说,取决于所采用的测序实施例,对于可靠读取长度的序列位置总数不可以超出25、50、100或500个碱基。配对末端测序策略通过对分子的每一个末端(其有时被称作“标记”末端)单独进行测序而扩展了可靠读取长度,其中所述分子在通过中心处的接头序列联结的每一个末端处包括原始模板核酸分子的一个片段。各模板片段的原始位置关系是已知的,并且因此可以把来自各序列读取的数据重组成具有更长的高质量读取长度的单一读取。在标题为“Paired endsequencing (配对末端测序)”的美国专利号7,601, 499和2009年I月28日提交的标题为“Paired end sequencing (配对末端测序)”的美国专利申请序列号12/322,119中描述了配对末端测序实施例的其他实例,其中的每一篇出于所有目的被全文合并在此以作参考。SBS设备的一些实例可以实施前面描述的其中一些或所有方法,并且可以包括诸如以下各项的检测器件中的一项或更多项用于光学检测的共焦类型体系结构或者电荷耦合器件(即CCD摄影机),用于针对离子或化学品检测的离子敏感场效应晶体管(其也被称作“ ISFET ”)或化学品敏感场效应晶体管(其也被称作“ ChemFET ”),微流体腔室或流动单元,反应基质,以及/或者泵浦和流量阀。以基于焦磷酸盐的测序为例,一种设备的实施例可以采用产生固有地低水平背景噪声的化学发光检测策略。在一些实施例中,用于测序的反应基质可以包括诸如载玻片类型基质的平面基质、ISFET或者在一些实施例中可以包括阱类型结构的波导类型反应基质。此外,反应基质可以包括如前所述的能够从454 Life Sciences Corporation获得的被称为PTP 阵列的那些,其由光纤面板形成,所述光纤面板被酸蚀刻以便产生成千上万个或更多的非常小的阱,其中使得每一个阱能够容纳一个由基本上完全相同的模板分子构成的群体(也就是说,一些优选实施例在70x75mm的PTP 阵列上包括大约330万个阱,其中阱间距为35 μ m)。在一些实施例中,由基本上完全相同的模板分子构成的每一个群体可以被布置在诸如微珠之类的固体基质上,它们中的每一个可以被布置在所述阱的其中一个中。举例来说,一种设备可以包括用于向PTP平板支架提供流体试剂的试剂递送元件,以及允许收集从PTP平板上的每一个阱发出的光的光子的CCD类型检测器件。在2005年8月30日提交的标题为 “THIN-FILM COATED MICROffELL ARRAYS AND METHODS OF MAKING SAME (涂覆有薄膜的微阱阵列及其制作方法)”的美国专利号7,682,816中描述了包括用于改进信号辨识的特性的反应基质的一个例子,该专利出于所有目的被全文合并在此以作参考。在美国专利号7,323,305和7,575,865中描述了用于施行SBS类型测序和焦磷酸盐测序的设备和方法的其他实例,二者都被合并于前文中以作参考。此外,还可以采用使得一项或更多项样本准备处理自动化的系统和方法,比如前面描述的emPCR 处理。举例来说,可以采用自动化系统来提供针对生成用于emPCR处理的乳剂、施行PCR热循环操作以及对成功准备的核酸分子群体进行富集以供测序的高效解决方案。在 2005 年 I 月 28 日提交的标题为“Nucleic acid amplification with continuousflow emulsion (利用连续流动乳剂的核酸扩增)”的美国专利号7,927,797中描述了自动化样本准备系统的实例,其出于所有目的被全文合并在此以作参考。此外,本发明的当前描述的实施例的系统和方法可以包括利用为了在计算机系统上执行而存储的计算机可读介质来实施某种设计、分析或其他操作。举例来说,下面详细描述了利用SBS系统和方法处理所检测到的信号和/或分析所生成的数据的几个实施例,其中所述处理和分析实施例是在计算机系统上实施的。
用于当前描述的本发明的计算机系统的一个示例性实施例可以包括任何类型的计算机平台,比如工作站、个人计算机、服务器或者任何其他现有的或未来的计算机。但是本领域的普通技术人员将认识到,这里所描述的前面提到的计算机平台被特别配置成施行所描述的发明的专门操作,而不被视为通用计算机。计算机通常包括已知的组件,比如处理器、操作系统、系统存储器、存储器存储器件、输入-输出控制器、输入-输出器件以及显示器件。相关领域的普通技术人员还将理解的是,计算机可以有许多可能的配置和组件,并且还可以包括高速缓冲存储器、数据备份单元以及许多其他器件。显示器件可以包括提供视觉信息的显示器件,该信息通常可以在逻辑和/或物理方面被组织成像素阵列。还可以包括一个接口控制器,其可以包括用于提供输入和输出接口的多种已知的或未来的软件程序当中的任一种。举例来说,接口可以包括为用户提供一项或更多项图形表示的通常被称为“图形用户接口”(其常被称作GUI)的那些。通常使得接口能够接受利用相关领域的普通技术人员所知晓的选择或输入装置所给出的输入。在相同的或替换的实施例中,计算机上的应用可以采用包括被称为“命令行接口”(其常被称作CLI)的那些的接口。CLI通常在应用与用户之间提供基于文本的交互。通常来说,命令行接口通过显示器件作为文本行呈现输出以及接收输入。举例来说,一些实现方式可以包括被称为“外壳”的那些,比如相关领域的普通技术人员所知晓的Unix Shell,或者采用诸如Microsoft. NET框架的面向对象类型的编程体系结构的Microsoft WindowsPowershell ο相关领域的普通技术人员将认识到,接口可以包括一个或更多⑶1、CLI或其组
口 O处理器可以包括商业上能够买到的处理器,比如Intel Corporation制造的Celeron 、Core 或 Pentium 处理器,Sun Microsystems 制造的 SPARC 处理器,AMD 公司制造的Athlon 、S empronTM、Phenom 或Opteron 处理器,或者其可以是现在或者将来可以获得的其他处理器的其中一款。处理器的一些实施例可以包括被称为多核处理器并且/或者被允许在单核或多核配置中采用并行处理技术的那些。举例来说,多核体系结构通常包括两个或更多处理器“执行核”。在该例中,每一个执行核可以作为一个独立的处理器运作,从而允许对于多个线程的并行执行。此外,相关领域的普通技术人员将认识到,处理器可以被配置在通常被称为32或64位体系结构的那些中,或者现在已知的或未来可能开发出的其他体系结构配置中。处理器通常会执行操作系统,其例如可以是来自Microsoft Corporation的Windows 类型操作系统(比如 Windows XP、Windows Vista 或者 Windows _7),来自 AppleComputer Corp.的 Mac OS X 操作系统(比如 Mac OS X vl0.6“Snow Leopard,,操作系统),可以从许多销售商处获得或者可以被称作开放源码的Unix 或Linux类型操作系统,其他的或未来的操作系统,或者前述各项的某种组合。操作系统按照众做周知的方式与固件和硬件接合,并且促进处理器协调及执行可以用多种编程语言编写的各种计算机程序的功能。操作系统通常与处理器协作来协调及执行计算机的其他组件的功能。操作系统还全部根据已知的技术来提供调度、输入-输出控制、文件和数据管理、存储器管理以及通信控制和有关服务。系统存储器可以包括多种已知的或未来的存储器存储器件当中的任一种。实例包括任何通常可以获得的随机存取存储器(RAM)、诸如驻留硬盘或磁带之类的磁性介质、诸如读和写紧致盘之类的光学介质或者其他存储器存储器件。存储器存储器件可以包括多种已知的或未来的器件当中的任一种,其中包括紧致盘驱动器、磁带驱动器、可移除硬盘驱动器、USB或闪存驱动器或者软盘驱动器。这些类型的存储器存储器件通常从程序存储介质(未示出)读取和/写入到程序存储介质(未示出),所述程序存储介质例如分别是紧致盘、磁带、可移除硬盘、USB或闪存驱动器或者软盘。这些程序存储介质或者现在使用中的或后来可能开发出的其他程序存储介质当中的任一项都可以被视为计算机程序产品。应当理解的是,这些程序存储介质通常存储计算机软件程序和/或数据。计算机软件程序(其也被称作计算机控制逻辑)通常被存储在系统存储器中和/或与存储器存储器件相结合地使用的程序存储器件中。在一些实施例中,计算机程序产品被描述为包括其中存储有控制逻辑(包括程序代码的计算机软件程序)的计算机可用介质。当由处理器执行时,所述控制逻辑使得处理器施行这里所描述的功能。在其他实施例中,一些功能主要是例如利用硬件状态机而在硬件中实施的。相关领域技术人员将很容易认识到实施硬件状态机从而施行这里所描述的功倉泛。输入-输出控制器可以包括用于接受以及处理来自用户(不管其是人类还是机器、本地的还是远程的)的信息的多种已知器件当中的任一种。这样的器件例如包括调制解调器卡、无线卡、网络接口卡、声卡或者用于多种已知的输入器件当中的任一种的其他类型的控制器。输出控制器可以包括用于向用户(不管其是人类还是机器、本地的还是远程的)呈现信息的多种已知显示器件当中的任一种的控制器。在当前描述的实施例中,计算机的各功能元件通过系统总线彼此进行通信。计算机的一些实施例可以利用网络或者其他类型的远程通信与一些功能元件进行通信。相关领域技术人员将认识到,仪器控制和/或数据处理应用如果是用软件实施的话则可以被加载到系统存储器和/或存储器存储器件中并且从系统存储器和/或存储器存储器件执行。仪器控制和/或数据处理应用的全部或部分还可以驻留在存储器存储器件的只读存储器或类似器件中,这样的器件不要求首先通过输入-输出控制器加载仪器控制和/或数据处理应用。相关领域技术人员将会理解的是,仪器控制和/或数据处理应用或者其一些部分可以由处理器按照已知的方式加载到系统存储器或高速缓冲存储器或者这二者中以利于执行。此外,计算机可以包括存储在系统存储器中的一个或更多库文件、实验数据文件以及互联网客户端。举例来说,实验数据可以包括与一项或更多项实验或化验有关的数据,比如所检测到的信号值或者与一项或更多项SBS实验或处理相关联的其他值。此外,互联网客户端可以包括被实现为利用网络访问另一台计算机上的远程服务的应用,并且例如可以包括通常被称为“Web浏览器”的那些。在该例中,一些通常采用的web浏览器包括可以从 Microsoft Corporation 获得的 Microsoft Internet Explorer 8、从 MozillaCorporation 获得的 Mozilla Firefox 3.6、从 Apple Computer Corp.获得的 Safari 4、从Google Corporation获得的Google Chrome或者本领域内当前已知的或未来将要开发的其他类型的web浏览器。此外,在相同的或其他实施例中,互联网客户端可以包括被实现为通过网络访问远程信息的专门化软件应用或者可以是所述专门化软件应用的一个元件,比如用于生物应用的数据处理应用。网络可以包括本领域的普通技术人员所公知的许多种类型的网络当中的一种或更多种。举例来说,网络可以包括局域网或广域网,其采用通常被称为TCP/IP协议套的那些来进行通信。网络可以包括通常被称作因特网的世界范围的互连计算机网络系统,或者还可以包括各种内联网体系结构。相关领域的普通技术人员还将认识到,联网环境中的某些用户可能优选地采用通常被称为“防火墙”(其有时也被称作分组过滤器或边界保护器件)的那些来控制去往以及来自硬件和/或软件系统的信息业务。举例来说,防火墙可以包括硬件或软件元件或者其某种组合,并且通常被设计成实施用户(诸如例如网络管理员等等)所设置的安全性策略。b、当前描述的本发明的实施例
如前所述,所描述的本发明的实施例针对用于基于在DNA测序技术中采用的一种或更多种酶的特定于物种的效率来优化引入到反应环境中的核苷酸物种的浓度的改进的系统和方法。在典型的测序实施例中,可以采用使得一个或更多处理步骤自动化的一个或更多仪器元件。举例来说,可以利用仪器化来执行测序方法的实施例,从而自动化并且实施其中一些或所有处理步骤。图1提供了对于需要捕获光学信号的测序过程的测序仪器100的说明性实例,其通常包括光学子系统和流体子系统以用于执行发生在反应基质105上的测序反应和数据捕获。但是应当认识到,对于需要其他数据捕获模式(例如pH、温度、电化学等等)的测序过程来说,可以采用相关领域 普通技术人员所知晓的对于所述数据捕获模式的子系统。举例来说,可以由用户101或某种自动化实施例将模板分子的样本加载到反应基质105中,随后利用测序仪器100按照大规模并行方式进行测序,以便产生代表每一个模板分子的序列构成的序列数据。很重要的是,用户101可以包括任何下面这样的用户,其包括(但不限于)独立研究者、技师、临床医师、大学或企业实体。被采用来执行测序过程的测序仪器100的实施例可以包括流体子系统中的各种流体组件、光学子系统中的各种光学组件或者场效应晶体管类型的检测组件(例如ISFET或ChemFET)和pH检测的情况下的相关联子系统,以及未在图1中示出但是为本领域普通技术人员所知且常用的附加组件,其中可以包括用于对一些功能进行本地控制的微处理器和/或微控制器组件。在一些实施例中,可以可选地利用样本准备仪器180按照自动化或部分自动化的方式准备用于测序的样本,其中样本准备仪器180被配置成施行对于利用仪器100进行测序所必需的一部分或全部准备。此外,如图1中所示,测序仪器100可以操作链接到一个或更多外部计算机组件(比如计算机130),其例如可以执行能够提供对于一项或更多项仪器(比如测序仪器100或样本准备仪器180)的指令控制和/或数据分析功能的系统软件或固件(比如应用135)。计算机130可以附加地通过网络150操作连接到其他计算机或服务器,从而可以允许对仪器系统进行远程操作以及向能够进行存储和处理的系统导出大量数据。在该例中,测序仪器100和/或计算机130可以包括前面总体上描述的实施例的其中一些或所有组成部分和特性。相关领域的普通技术人员将认识到,采用一种或更多种酶的典型测序系统的性能对于用在相关联的方法中的各种酶的效率是敏感的,比如例如用在一些合成测序方法中的聚合酶和/或腺苷三磷酸双磷酸酶的效率。举例来说,在2008年6月27日提交的标题为“System and Method For Adaptive Reagent Control in Nucleic Acid Sequencing (用于核酸测序中的自适应试剂控制的系统和方法)”的美国专利申请序列号12/215,455中描述了自适应地调节反应环境中的腺苷三磷酸双磷酸酶的浓度以便获得所期望的总体腺苷三磷酸双磷酸酶活性水平的实施例,其出于所有目的被全文合并在此以作参考。还应当认识到,任何特定酶的效率可以取决于若干因素,其中包括(但不限于)酶的氨基酸序列构成(特别是赋予酶活性特性的区段)以及反应环境中的周围条件。举例来说,聚合酶通常可以包括大约120000单位/mg的特定活性,其中“一个单位”通常指的是将在65°C下在30分钟内把IOnmol的dNTP合并到不溶于酸的材料中的聚合酶的数量。此外,用于合并核苷酸的各种聚合酶物种以及用于消化核苷酸的腺苷三磷酸双磷酸酶物种的效率可以根据存在于反应环境中的核苷酸物种而不同。在一些测序系统实施例中,通常按照循环的方式把核苷酸物种溶液(dTTP、a-thio-dATP或者在一些实施例中是dATP、dCTP和dGTP)引入到反应环境中(即按照前面描述的那样通过“流动”引入),其间则是腺苷三磷酸双磷酸酶溶液的流动。在一些实施例中,通过在测序过程期间进入到反应基质上的各个反应环境(即比如前面描述的PicoTiterPlate类型基质的各讲)中的核苷酸物种流动,建立特定于每一个核苷酸物种的腺苷三磷酸双磷酸酶的稳态浓度。可以利用被称为米氏(Michaelis-Menten)动力学的那些来计算特定于核苷酸物种的稳态腺苷三磷酸双磷酸酶浓度,以便基于存在简单动力学条件的假设以数学方式近似酶的动力学特性。米氏方程使用随着核苷酸物种而不同的常数值,并且包括米氏常数(Michaelis constant) Km和反应环境中的酶活性的最大速率Vmax。举例来说,在下面的表I中列出了使用在测序系统的一种实现方式中的对于腺苷三磷酸双磷酸酶的常数值。表1:腺苷三磷酸双磷酸酶对于多种核苷酸的酶动力学
权利要求
1.一种用于优化测序性能的方法,包括以下步骤 a)对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率; b)利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度; c)在包括聚合酶和物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入所述反应环境以便降解未被合并的核苷酸物种分子;以及 d)检测响应于所述核苷酸物种的合并的信号。
2.权利要求1的方法,其中 确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡。
3.权利要求1的方法,其中 利用米氏方程来计算特定于核苷酸物种的降解速率。
4.权利要求1的方法,其中 对于dCTP物种来归一化对于每一个核苷酸物种的浓度,所述dCTP物种在各核苷酸物种当中包括最低浓度和活性值。
5.权利要求1的方法,其中 对于多个核苷酸物种的浓度彼此不同。
6.权利要求1的方法,其中 对于每一个核苷酸物种的浓度彼此不同。
7.权利要求1的方法,其中 通过在反应环境中把每一个核苷酸物种的浓度保持足够时间从而使得在通过腺苷三磷酸双磷酸酶降解之前发生合并来优化合并效率。
8.权利要求1的方法,其中 基于核苷酸物种与核酸模板物种的互补性在一个或更多处将核苷酸物种的分子合并到初生分子中。
9.权利要求1的方法,还包括 e)根据检测到的信号生成序列读取,其中所述序列读取包括所述物种的模板核酸分子的序列构成。
10.一种用于优化测序性能的方法,包括以下步骤 a)将多个相对浓度的核苷酸物种引入到包括聚合酶、腺苷三磷酸双磷酸酶和物种的模板核酸分子的一种类型的反应环境中,以便产生所述物种的模板核酸分子的未经校正的序列构成; b)根据所述物种的模板核酸分子的未经校正的序列构成和参考序列构成对于每一个核苷酸物种确定完成效率值和前推值;以及 c)利用特定于核苷酸物种的完成效率值和特定于核苷酸物种的前推值对于多个核酸物种当中的每一个识别出特定于物种的浓度,其中对所述特定于物种的浓度进行优化,以便最小化由所述类型的反应环境中的测序反应所产生的错误。
11.权利要求10的方法,还包括 d)利用所述类型的反应环境执行测序反应,其中所述测序反应包括以下步骤.1、在特定于物种的浓度下将每一个核酸物种迭代地递送到包括第二物种模板核酸分子和聚合酶的所述类型的反应环境,其中在递送核酸物种的迭代之间将腺苷三磷酸双磷酸酶递送到所述反应环境;以及` i1、检测响应于由所述聚合酶合并核酸物种而生成的多个信号。
12.权利要求11的方法,其中 在特定于核苷酸物种的浓度下把腺苷三磷酸双磷酸酶递送到所述反应环境。
13.权利要求10的方法,其中 所述相对浓度包括第一百分比的A核苷酸物种浓度和T核苷酸物种浓度相对于第二百分比的G核苷酸物种浓度和C核苷酸物种浓度。
14.权利要求13的方法,其中 根据所述物种的模板核酸分子的序列构成来定义第一百分比和第二百分比,其中所述序列构成是AT富集或GC富集。
15.一种用于优化测序性能的系统,包括 a)计算机,其包括存储在其上的可执行代码,其中所述可执行代码施行包括以下步骤的方法1、对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率; ` i1、利用所述特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度,其中确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡;以及 b)施行包括以下步骤的方法的测序仪器1、在包括聚合酶和物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入所述反应环境以便降解未被合并的核苷酸物种分子;以及 i1、检测响应于核苷酸物种的合并的信号。
全文摘要
描述了一种用于优化测序性能的方法的一个实施例,其包括以下步骤对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及检测响应于核苷酸物种的合并的信号。
文档编号C12Q1/68GK103038365SQ201180025207
公开日2013年4月10日 申请日期2011年5月19日 优先权日2010年5月21日
发明者J.M.布鲁内尔, A.d.A.卡普里奥, 陈怡儒, S.M.克拉克, X.V.戈梅斯, V.马克希贾尼, 黃昭泰 申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1