纯化和利用来自超嗜热菌的无机焦磷酸酶的系统和方法

文档序号:406899阅读:389来源:国知局

专利名称::纯化和利用来自超嗜热菌的无机焦磷酸酶的系统和方法
技术领域
:本发明提供了纯化和利用无机焦磷酸酶的系统、方法、试剂和试剂盒。更具体地,本发明涉及无机焦磷酸酶的有效分离及其在核酸扩增和测序技术中的用途。
背景技术
:许多扩增和测序策略采用聚合酶用于将核苷酸种类(nucleotidespecies)添加至新合成的核酸分子。通常理解的是,对于聚合酶掺入的每种核苷酸种类,焦磷酸分子(通常也被称为“PPi”)和氢分子被释放进反应环境中。这可以是采用非常小的反应环境的扩增和测序策略中的非常重要的考虑,因为经过聚合酶的许多掺入事件,PPi分子在反应环境中聚集,达到一定浓度,在该浓度时PPi对聚合酶掺入核苷酸种类的能力具有抑制作用。此外,存在依赖于检测PPi释放的能力的测序技术。例如,可以采用测定释放的PPi的相对量或PPi浓度的改变来表示与模板分子的序列位置的核苷酸种类互补的核苷酸种类的掺入。检测或测定的模式可以包括反应环境中PH的改变,或者通过产生对于每个掺入的核苷酸分子的光的光子的酶级联反应,这通常被称为“焦磷酸测序(Pyrosequencing)”。在本例子中,测定的PPi的程度与掺入的核苷酸分子的数量是直接成比例的,因此,对于此处所述的测序策略非常重要的是,在核苷酸引入步骤(即下面进一步讨论的核苷酸流(nucleotideflow))中检测的PPi是该步骤期间从该特定的核苷酸掺入所释放的结果,而不是来自前一步骤的残留分子。因此,降低PPi的浓度或将其从反应环境完全去除的策略在所述的扩增和测序背景中是非常期望的。通常,这可以通过使用与PPi分子反应并使之特异性降解的焦磷酸酶(PPi-ase)来完成。以前鉴定的分离的焦磷酸酶试剂的形式包括源自超好热性古细菌(Thermococcus7iiora7i5·)的种类,可以从NewEnglandBiolabs,Inc.(也被称为NEB,IpswichMassachusetts)获得。然而,仍然需要表现出用于在扩增和测序技术中使用所需的特征的其它分离的焦磷酸酶试剂种类。发明概述本发明的实施方案涉及核酸序列的测定。更具体而言,本发明的实施方案涉及用于校正在通过边合成边测序(sequencingbysynthesis(SBS))的核酸测序期间获得的数据中的错误的方法和系统。描述了核酸的实施方案,其包括编码超嗜热菌(Aae)焦磷酸酶蛋白的核酸SEQIDN0:1或3。在优选的实施方案中,核酸编码His标签。在进一步优选的实施方案中,核酸编码BCCP生物素化位点。此外,描述了使用分离的焦磷酸酶蛋白的测序方法的实施方案,其包括如下步骤在包含源自超嗜热菌(Aquifexaeolicus)物种的酶蛋白SEQIDNO:2或4的反应环境中进行测序反应,其中所述酶蛋白包括焦磷酸酶活性。在优选的实施方案中,酶蛋白结合于珠子。在进一步优选的实施方案中,酶蛋白通过生物素连接结合于珠子。在仍进一步优选的实施方案中,使用体内过程将生物素有效地偶联于蛋白。在仍进一步优选的实施方案中,酶蛋白是热稳定的。在仍进一步优选的实施方案中,在多个反应环境中同时进行多个测序反应。上述实施方案和实施方式不必彼此包容或排斥,可以以不冲突的以及可能的其它任何方式组合,无论它们是否与相同的或不同的实施方案或实施方式存在。实施方案或实施方式的描述并不意在限制其它实施方案和/或实施方式。而且,在本说明书中其它地方所述的任何一种或多种功能、步骤、操作或技术可以在其它实施方式中与摘要中所述的任何一种或多种功能、步骤、操作或技术相结合。因此,上述的实施方案和实施方式是说明性的而非限制性的。附图简要说明当与附图相结合时,可以从下面详细的描述中更清楚地理解上述的进一步的特征。在附图中,相同的参照数表示相同的结构、元件或方法步骤,参照数的最左边的数字表示参照元件首次出现的图中的数字(例如,元件160首先出现在图I中)。然而,所有这些规则的本意是典型性的或说明性的,而非限制性的。图I是在计算机控制下的测序仪和反应底物的一种实施方案的功能方框图2是超嗜热菌焦磷酸酶融合分子的一种实施方案的简化的图例;图3A和3B是超好热性古细菌(7Iitoralis)的一种实施方案和超嗜热菌焦磷酸酶的一种实施方案的活性水平的比较的简化的图例;图4是超嗜热菌焦磷酸酶的一种实施方案所示的热稳定性的简化的图例;图5A和5B是用结合于珠子的超好热性古细菌焦磷酸酶的一种实施方案和超嗜热菌焦磷酸酶的一种实施方案在珠子上从大肠杆菌获得的测序结果的比较的简化的图例;图6A和6B是用结合于珠子的超好热性古细菌焦磷酸酶的一种实施方案和超嗜热菌焦磷酸酶的一种实施方案在珠子上从空肠弯曲菌Γ6;获得的测序结果的比较的简化的图例;和图7A和7B是用结合于珠子的超好热性古细菌焦磷酸酶的一种实施方案和超嗜热菌焦磷酸酶的一种实施方案在珠子上从极端嗜热菌Γ7获得的测序结果的比较的简化的图例。发明的详细描述正如下面将更详细描述的,本发明的实施方案包括用于源自超嗜热菌的焦磷酸酶的纯化的分离的核酸序列、蛋白序列和/或产物、表达系统、方法和试剂盒以及该酶的用途。具体而言,本发明的实施方案涉及编码焦磷酸酶的分离的焦磷酸酶核酸序列以及由其衍生的融合序列,该融合序列包括实现处理步骤如纯化和/或生物素化的一个或多个元件,尤其可用于核酸模板分子的扩增以及可用于高通量核酸测序技术中。a.P、体术语“流程图(flowgram)”通常是指SBS方法、尤其是基于焦磷酸盐的测序方法(也被称为“焦磷酸测序”)产生的序列数据的图示,可以更特异性地称为“焦磷酸图(pyrogram)”。此处所用的术语“阅读(read)”或“序列阅读(sequenceread)”通常是指从单一核酸模板分子或者模板核酸分子的多个基本上相同的拷贝的群体获得的整个序列数据。此处所用的术语“运行(run)”或“测序运行(sequencingrun)”通常是指在一个或多个模板核酸分子的测序操作中进行的一系列测序反应。此处所用的术语“流(flow)”通常是指将溶液添加至包含模板核酸分子的环境的一系列或重复的循环,其中所述溶液可以包括用于添加至新生分子或其它试剂如缓冲液或酶的核苷酸种类,该缓冲液或酶可以用于测序反应中,或用于从核苷酸种类的前面的流循环中减少延滞效应(carryovereffects)或噪声效应(noiseeffects)。此处所用的术语“流循环(flowcycle)”通常是指一系列连续的流,其中在循环期间核苷酸种类流动一次(即,流循环可以包括以Τ、A、C、G核苷酸种类的顺序的连续添加,尽管其它序列的组合也被认为是定义的一部分)。通常,流循环是从循环到循环具有相同流的序列的重复循环。此处所用的术语“阅读长度(readlength)”通常是指可以被可靠地测序的模板分子的长度的上限。有许多对系统和/或方法的阅读长度有贡献的因素,包括但不限于模板核酸分子中的GC含量的程度。此处所用的术语“测试片段(testfragment)”或“TF”通常是指已知序列组成的核酸元件,该元件可以用于质量控制、校准或其它相关的目的。此处所用的术语“引物”通常是指在一定条件下作为DNA合成的起始点的寡核苷酸,在该条件下,在合适的温度以及在适当的缓冲液中诱导与核酸链互补的引物延伸产物的合成。引物优选单链寡脱氧核糖核苷酸。“新生分子”通常是指通过核苷酸种类的掺入由模板依赖性DNA聚合酶所延伸的DNA链,该DNA链与模板分子中相应的核苷酸种类互补。此处所用的术语“模板核酸”、“模板分子”、“目标核酸”或“目标分子”通常是指作为测序反应的主题的核酸分子,从该测序反应产生序列数据或信息。此处所用的术语“核苷酸种类”通常是指通常被掺入新生的核酸分子的核酸单体的特性,包括嘌呤(腺嘌呤、鸟嘌呤)和嘧啶(胞嘧啶、尿嘧啶、胸腺嘧啶)。此处所用的术语“单体重复”或“均聚物(homopolymers)”通常是指包含相同的核苷酸种类(即,重复的核苷酸种类)两个或更多个序列位置。此处所用的术语“均匀的延伸”通常是指延伸反应的关系或阶段,其中基本上相同的模板分子群体中每个成员在反应中均匀地执行相同的延伸步骤。此处所用的术语“完成效率”通常是指在给定的流期间被正确延伸的新生分子的百分比。此处所用的术语“不完全延伸率”通常是指没有被正确延伸的新生分子的数量与所有新生分子的数量的比值。此处所用的术语“基因组文库”或“鸟枪文库(shotgunlibrary)”通常是指来源于和/或代表有机体或个体的完整基因组(即,基因组的所有区域)的分子的集合。此处所用的术语“扩增子”通常是指选择的扩增产物,如由聚合酶链式反应或连接酶链式反应技术产生的那些。此处所用的术语“变异体”或“等位基因”通常是指各自编码相似的序列组成但彼此具有差异度的多个种类之一。这种区别可以包括相关领域普通技术人员已知的任何类型的遗传变异,其包括但不限于,多态性如单核苷酸多态性(SNPs)、插入或缺失(缺失/插入事件的组合也被称为“indels”)、重复序列的数量的差异(也被称为串联重复)以及结构上的差异。此处所用的术语“等位基因频率(allelefrequency)”或“等位基因的频率(allelicfrequency)”通常是指在由特定变异体组成的群体中的所有变异体的比例。此处所用的术语“关键序列”或“关键元件”通常是指与在已知位置中的模板核酸分子(即,通常包括在连接的适配子元件(adaptorelement)中)相关的核酸序列元件(典型地约4个序列位置,即,TGAC或核苷酸种类的其它组合),包括用作为用于由模板分子产生的序列数据的质量控制参照的已知序列组成。如果序列数据包括与正确位置中的关键元件相关的已知序列组成,则该序列数据通过质量控制。此处所用的术语“关键通过(keypass)”或“关键通过孔(keypasswell)”通常是指在反应孔中已知序列组成(即,上面所指的“测试片段”或“TF”)的全长核酸测试序列的测序,其中将源自与TF相关或在适配子中与目标核酸相关的TF序列和/或关键序列的序列的准确性与TF和/或关键序列(Key)的已知序列组成相比较,并用于测序的准确性的测定并用于质量控制。在典型的实施方案中,在测序运行中孔的总数的比例是关键通过孔,在一些实施方案中,其可以区域分布。此处所用的术语“平末端”与相关领域普通技术人员的理解相一致地解释,通常是指具有以一对互补的核苷酸碱基种类终止的末端的线性双链核酸分子,其中一对平末端通常彼此兼容用于连接。此处所用的术语“粘性末端(stickyend)”或“突出部分(overhang)”与相关领域普通技术人员的理解相一致地解释,通常是指在分子的一条链的末端具有一个或多个未配对的核苷酸种类的一条线性双链核酸分子,其中未配对的核苷酸种类可以存在于任一链上,包括单一的碱基位置或多个碱基位置(有时也被称为“粘性末端(cohesiveend)”)。此处所用的术语“SPRI”与相关领域普通技术人员的理解相一致地解释,通常是指“固相可逆的固定(SolidPhaseReversibleImmobilization)”的专利技术,其中在珠子存在的情况下在特异性缓冲液条件下选择性地沉淀核酸,其中所述珠子经常是羧基化的并且是顺磁性的。沉淀的目标核酸固定到所述珠子并保持结合,直到根据操作者的需求通过洗脱缓冲液去除(DeAngelis,MargaretΜ.等Solid-PhaseReversibleImmobilizationfortheIsolationofPCRProducts.NucleicAcidsRes(1995),Vol.23:22;4742-4743)。此处所用的术语“羧基化的”与相关领域普通技术人员的理解相一致地解释,通常是指通过增加至少一个羧基的材料如微颗粒的修饰。羧基是C00H或C00-。此处所用的术语“顺磁性的”与相关领域普通技术人员的理解相一致地解释,通常是指材料的特征,其中所述材料的磁性仅仅在存在外部应用的磁场的情况下发生,一旦去除外部施加的磁场,就不保留任何的磁化。此处所用的术语“珠子”或“珠子基质”通常是指任何类型的微粒,其中术语“微粒”是指任何方便大小、不规则的或规则的形状的任何材料,其由任意数量的已知材料如纤维素、纤维素衍生物、丙烯酸树脂、玻璃、硅胶、聚苯乙烯、明胶、聚乙烯基吡咯烷酮、乙烯酰胺和丙烯酰胺的共聚合物,与二乙烯基苯或类似物交联的聚苯乙烯(例如,在Merrifield,Biochemistry1964,3,1385-1390中所述的)、聚丙烯酰胺、胶乳凝胶、聚苯乙烯、葡聚糖、橡胶、硅、塑料、硝基纤维素、天然海绵、硅胶、控制微孔玻璃、金属、交联的葡聚糖(例如,Sephadex)、琼脂糖凝胶(Sepharose)以及本领域技术人员已知的其它固相珠子载体。此处所用的术语“反应环境”通常是指其中通常可以发生反应的空间的体积,其中至少暂时地包含或封闭反应物从而允许至少一种反应产物的检测。反应环境的例子包括但不限于反应皿(cuvettes)、管、瓶,以及平面的或非平面的基质上的一个或多个凹陷、孔或室。下面总体描述了与样品制备和处理、序列数据的生成以及序列数据的分析相关的一些系统和方法的示例性实施方案,其中的一些或全部适合与本发明的实施方案使用。尤其描述了用于制备模板核酸分子、扩增模板分子、产生目标特异性扩增子和/或基因组文库的系统和方法、测序方法和仪器以及计算机系统的示例性实施方案。在典型的实施方案中,应当制备源自实验或诊断样品的核酸分子,并处理为适合用于高通量测序的模板分子。处理方法从应用到应用可能变化,导致产生包含各种特性的模板分子。例如,在一些高通量测序的实施方案中,优选产生具有至少与特定的测序方法可以准确产生序列数据的长度相当的序列或阅读长度的模板分子。在本例子中,长度可以包括的范围为约25-30碱基对、约50-100碱基对、约200-300碱基对、约350-500碱基对、约500-1000碱基对、大于1000碱基对,或者适合用于特定测序应用的其它长度。在一些实施方案中,用本领域普通技术人员已知的多种方法将来自样品、如基因组样品的核酸片段化。在优选的实施方案中,将核酸随机片段化(即不选择特定序列或区域)的方法可以包括雾化或超声方法。然而,可以理解的是,可以采用其它的片段化方法用于片段化目的,如用限制性核酸内切酶消化。而且,在本实施方案中,一些处理方法可以采用本领域中已知的大小选择方法以选择性地分离所需长度的核酸片段。而且,在一些实施方案中优选将额外的功能元件与每个模板核酸分子结合。可以采用用于多种功能的元件,包括但不限于,用于扩增和/或测序方法的引物序列,质量控制元件(即,如关键元件或其它类型的质量控制元件),编码如与来源(origin)或患者的样品的各种结合的唯一标识符(uniqueidentifiers)(也称为多倍标识符(multiplexidentifier)或“MID”)或其它功能元件。例如,所述发明的一些实施方案包括将具有已知且可识别的序列组成的MID元件的一种或多种实施方案与样品相结合,并且将MID元件的实施方案与来自关联样品的模板核酸分子相偶联。将MID偶联的来自多份不同样品的模板核酸分子合并进单一的“多倍的”样品或组合物中,可以将该样品或组合物有效地处理以产生对于每个MID偶联的模板核酸分子的序列数据。将对于每个模板核酸的序列数据去卷积(de-convoluted)以鉴定偶联的MID元件的序列组成以及与标识的来源的样品的结合。在本实施方案中,多倍的组合物可以包括来自约384份样品、约96份样品、约50份样品、约20份样品、约16份样本、约12份样品、约10份样品或其它数量的样品的代表。每份样品可以在研究背景中与不同的实验条件、治疗、种类或个体相结合。类似地,每份样品可以在诊断背景中与不同的组织、细胞、个体、条件、药物或其它治疗相结合。相关领域普通技术人员将会理解,上面列举的多种样品是为了举例的目的,因此不应被认为是限制性的。在优选的实施方案中,每种MID元件的序列组成是容易识别的,可以耐受从测序方法引入的误差。MID元件的一些实施方案包括与天然存在的序列具有最小的序列相似性的核酸种类的独特的序列组成。或者,MID元件的实施方案可以包括与天然存在的序列的一些程度的序列相似性。而且,在优选的实施方案中,相对于模板核酸分子和/或偶联于模板分子的适配子元件一些特征,每种MID元件的位置是已知的。具有每种MID的已知位置对于在发现序列数据中的MID元件和解释MID序列组成用于可能的误差以及随后与来源的样品相几何是有用的。例如,可用作与MID元件的位置关系的锚(anchors)的一些特征可以包括但不限于,模板分子的长度(即,已知MID元件是从5’或3’末端的如此多的序列位置),可辨识的序列标记如位于MID元件邻近处的关键元件和/或一种或多种引物元件。在本例子中,关键和引物元件通常包括已知的序列组成,该序列组成在多倍的组合物中在样品至样品之间通常是不同的,可以被用作用于搜索MID元件的位置参照。可以在计算机130上执行由应用(Application)135实施的分析算法以分析对于每个MID偶联的模板的产生的序列数据从而鉴定更容易识别的关键和/或引物元件,并从这些位置推断以鉴定被假定包括MID元件序列的序列区域。然后,应用135可以处理假定区域以及侧翼区域中可能离开一些距离的序列组成从而阳性鉴定MID元件及其序列组成。可以将一些或全部所述的功能元件组合进适配子元件,该适配子元件在某些处理步骤中被偶联于核苷酸序列。例如,一些实施方案可以结合起始序列元件或区域,该起始序列元件或区域包括与用于扩增和/或测序的引物序列互补的序列组成。而且,可以采用相同的元件用于“链选择(strandselection)”以及核酸分子到固相基质的固定。在一些实施方案中,可以采用两组起始序列区域(以下被称为起始序列A和起始序列B)用于链选择,其中作为制备的样品选择并包括仅仅具有一个拷贝的起始序列A和一个拷贝的起始序列B的单一链。在另外的实施方案中,适配子元件的设计特征消除了对链选择的需要。可以在用于扩增和固定的方法中采用相同的起始序列区域,其中,例如,可以将起始序列B固定在固体基质上并由其延伸扩增的产物。用于片段化、链选择和功能元件和适配子的添加的其它例子描述于美国专利申请序列号No.10/767,894,题为“Methodforpreparingsingle-strandedDNAlibraries”,2004年I月28日提交;美国专利申请序列号No.12/156,242,题为“SystemandMethodforIdentificationofIndividualSamplesfromaMultiplexMixture,,,2008年5月29日提交;以及美国专利申请序列号No.12/380,13,题为“SystemandMethodforImprovedProcessingofNucleicAcidsforProductionofSequencableLibraries”,2009年2月23日提交。本发明描述了用于实施模板核酸分子的扩增以产生基本上相同拷贝的群体的系统和方法的各种实施方案。对于普通技术人员显而易见的是,在SBS的一些实施方案中,当一种或更多种核苷酸种类被掺入与模板分子的一个拷贝相关联的每种新生分子中时,需要产生许多拷贝的每种核酸元件以产生更强的信号。有许多本领域已知的技术用于产生核酸分子的拷贝,如,例如,用细菌载体进行扩增,“滚环”扩增(描述于美国专利Nos.6,274,320和7,211,390)和聚合酶链式反应(PCR)方法,每种技术都适合用于与本发明使用。一种尤其适合用于高通量应用的PCR技术包括乳液PCR方法(也被称为emPCR方法)。乳液PCR方法的典型实施方案包括产生其中产生水滴的两种不相混的物质的稳定乳液,该水滴内发生反应。具体而言,适合用于在PCR方法中使用的乳液的水滴可以包括第一流体,如在另一种流体如疏水性流体(也被称为连续相)(通常包括一些类型的油)作为液滴(也被称为不连续相)悬浮或分散的基于水的流体。可以采用的油的例子包括但不限于,矿物油、基于硅酮的油或氟化油。而且,一些乳剂的实施方案可以采用用于稳定乳液的表面活性剂,这尤其可用于特异性处理方法如PCR。表面活性剂的一些实施方案可以包括一种或更多种的硅酮或氟化表面活性剂。例如,可以采用一种或多种非离子型表面活性剂,其包括但不限于山梨醇单油酸酯(也被称为Span80)、聚氧化乙烯山梨醇单油酸酯(也被称为Tween80),或者在一些优选的实施方案中,二甲基硅氧烷共聚多元醇(也被称为AbilEM90)、聚硅氧烷、聚烷基聚醚共聚物、聚甘油酯、泊洛沙姆和PVP/十六烷共聚物(也称为作为UnimerU-151),或者在更优选的实施方案中,环戊硅氧烷中的高分子量的聚硅氧烷聚醚(也被称为DC5225C,可从DowCorning获得)。乳液的液滴也可以被称为隔室、微胶囊、微反应器、微环境,或者在相关领域中常用的其它名称。水滴的大小范围可以取决于乳液组分或组合物的组成,其中包含的内容以及采用的形成技术。所述乳液产生微环境,其中可以进行化学反应如PCR。例如,可以将进行期望的PCR反应所需的模板核酸和所有试剂密封并化学隔离在乳液的液滴中。在一些实施方案中可以采用额外的表面活性剂或其它稳定剂以促进上述液滴的额外的稳定性。可以用液滴进行PCR方法典型的热循环操作以扩增被密封的核酸模板,导致产生包含模板核酸的许多基本上相同的拷贝的群体。在一些实施方案中,液滴内的群体可被称为“克隆地分离的”、“隔室化的”、“隔离的”,“密封的”或“局域化的”群体。而且,在本例子中,所述液滴的一些或所有可以进一步密封固体基质如用于结合模板和模板的扩增拷贝、与模板互补的扩增的拷贝或者其组合的固体基质如珠子。而且,可以使固体基质能够用于结合其它类型的核酸、试剂、标签或其它感兴趣的分子。可以与本发明使用的乳液的实施方案可以包括非常高密度的液滴或微胶囊,其可以使所述化学反应以大规模并行的方式进行。用于扩增的乳剂的其它例子以及它们用于测序应用的用途描述于美国专利Nos.7,638,276-J,622,280-J,842,457和7,927,797。而且,有时被称为超深度测序(Ultra-DeepSequencing)的实施方案产生用于测序的目标特异性扩增子,该扩增子可以与本发明使用,本发明包括使用特异性核酸引物组从包含目标核酸的样品中扩增选择的一个或多个目标区域。而且,样品可以包括已知或怀疑包含序列变异体的核酸分子的群体,所述序列变异体包括与研究或诊断实用性相关的序列组成,其中可以采用所述引物扩增样品中的序列变异体并提供对其分布的观察。例如,可以实施用于通过特异性扩增鉴定序列变异体并对核酸样品中多个等位基因测序的方法。核酸首先经受用一对PCR引物的扩增,该PCR引物被设计用来扩增感兴趣的区域周围的区域或者核酸群体共有的区段。随后在单独的反应器如上述基于液滴的反应器中进一步单独扩增PCR反应(第一扩增子)的每种产物。对获得的扩增子(此处被称为第二扩增子)(每种源自第一扩增子群体的一个成员)测序,用序列的集合来确定存在的一种或多种变异体的等位基因频率。重要的是,该方法不要求存在的变异体的以前的知识,通常可以鉴定在核酸分子的群体中以〈1%的频率存在的变异体。所述目标特异性扩增和测序方法的一些优势包括比以前获得的更高水平的灵敏度。而且,采用高通量测序仪器的实施方案,如例如采用454LifeSciencesCorporation提供的孔的PicoTiterPlate阵列(有时也被称为PTP板或阵列)的实施方案,所述方法可用于产生每次运行或实验超过100,000、超过300,000、超过500,000或超过1,000,000个核酸区域的序列组成,其可能,至少部分,取决于用户的偏好,如由垫片(gaskets)的使用帮助的道的配置(laneconfigurations),等。而且,所述方法提供了可能代表I%或更少变异体的低丰度的等位基因的检测灵敏度。该方法的另一个优势包括产生包含分析的区域的序列的数据。更重要的是,没有必要具有被分析的基因座的序列的已有知识。用于测序的目标特异性扩增子的其它例子描述于美国专利申请序列号No.11/104,781,题为“Methodsfordeterminingsequencevariantsusingultra-deepsequencing”,2005年4月12日提交;PCT专利申请序列号No.US2008/003424,题为“SystemandMethodforDetectionofHIVDrugResistantVariants”,2008年3月14日提交;以及美国专利号No.7,888,034,题为“SystemandMethodforDetectionofHIVTropismVariants,,,2009年6月17日提交。而且,测序的实施方案可以包括Sanger型技术,通常被称为边杂交边测序(SequencingbyHybridization,SBH)的技术,边连接边测序(SequencingbyLigation,SBL),或边掺入边测序(SequencingbyIncorporation,SBI)技术。而且,测序技术可以包括polony测序技术;纳米孔(nanopore),波导(waveguide)和其它单分子检测技术;或者可逆的终止子技术。如上所述,优选的技术可以包括边合成边测序方法。例如,一些SBS实施方案对核酸模板的基本上相同的拷贝的群体测序,并且通常采用一种或多种被设计用来与样品模板分子的预定且互补的位置的退火的寡核苷酸引物或者一种或多种结合至模板分子的适配子。在核酸聚合酶存在的情况下,引物/模板复合体与核苷酸种类共存。如果核苷酸种类与对应于样品模板分子上直接相邻于寡核苷酸引物的3’末端的序列位置的核酸种类是互补的,然后聚合酶将以核苷酸种类延伸引物。另外,在一些实施方案中,一旦引物/模板复合体与多种感兴趣的核苷酸种类(通常为A、G、C和T)共存,则掺入与样品模板分子上直接相邻于寡核苷酸引物的3’末端的对应序列位置互补的核酸种类。在任一所述的实施方案中,可以化学阻断核苷酸种类(如在3’-O位置)以防止进一步延伸,需要在下一轮合成前去阻断(deblock)。也可以理解的是,将核苷酸种类添加至新生分子的末端的过程与上面所述的用于添加至引物的末端的过程是基本上相同的。如上所述,可以通过本领域已知的多种方法检测核苷酸种类的掺入,例如通过用产生光的酶反应过程检测焦磷酸盐(PPi)的释放,或者通过检测PH改变(例如,描述于美国专利Nos.6,210,891;6,258,568;和6,828,100中的例子),或者通过结合至核苷酸的可检测的标记。可检测的标记的一些例子包括但不限于质量标签和荧光或化学发光标记。在典型的实施方案中,例如通过洗漆,去除未掺入的核苷酸。而且,在一些实施方案中,未掺入的核苷酸可以经受酶降解,如,例如,用三磷酸腺苷双磷酸酶(apyrase)或焦磷酸酶降解,如描述于美国专利申请序列号Nos.12/215,455,题为“SystemandMethodforAdaptiveReagentControlinNucleicAcidSequencing,,,2008年6月27日提交;和12/322,284,题为“SystemandMethodforImprovedSignalDetectioninNucleicAcidSequencing”,2009年I月29日提交。在其中使用可检测的标记的实施方案中,通常必须在接下来的合成循环之前将它们失活(例如通过化学裂解或光漂白)。然后可以用如上所述的下一个核苷酸种类或者感兴趣的多种核苷酸种类查询模板/聚合酶复合体中的下一个序列位置。核苷酸添加、延伸、信号采集以及洗涤的重复循环导致模板链的核苷酸序列的确定。继续本例子,通常在任一测序反应中同时分析大量或大群的基本上相同的模板分子(例如,103、104、105、IO6或IO7个分子)以获得强度足够用于可靠的检测的信号。此外,一些实施方案中,通过采用“配对末端(paired-end)”测序策略对于改善测序方法的阅读长度能力和质量是有利的。例如,测序方法的一些实施方案对于可以产生高质量且可靠的阅读的分子的总长度有限制。换言之,根据采用的测序实施方案,对于可靠的阅读长度的序列位置的总数不超过25、50、100或500个碱基。配对末端测序策略通过单独对分子的每个末端(有时被称为“标签”末端)测序而延伸可靠的阅读长度,该末端包括由接头序列在中间连接的每个末端的初始模板核酸分子的片段。模板片段的初始的位置关系是已知的,因此,可以将来自序列阅读的数据重新组合进具有更长高质量阅读长度的单一阅读中。配对末端测序实施方案的进一步例子描述于美国专利号No.7,601,499,题为“Pairedendsequencing”;以及描述于美国专利申请序列号No.12/322,119,题为“Pairedendsequencing”,2009年I月28日提交。SBS装置的一些例子可以实施一些或所有上面所述的方法,可以包括一种或多种检测设备如电荷耦合设备(即,CCD相机)或共焦型架构、微流体腔室或流动室、反应底物和/或泵和流量阀。列举基于焦磷酸盐的测序的例子,装置的实施方案可以采用产生固有的低水平的背景噪声的化学发光检测策略。在一些实施方案中,用于测序的反应底物可以包括平面基质如平板型基质(slidetypesubstrate)、离子敏感场效应晶体管(Ion-SensitiveFieldEffectTransistor,也被称为“ISFET”)或者在一些实施方案中可以包括孔型结构的波导型(waveguidetype)反应底物。而且,反应底物可以包括上面所述的从454LifeSciencesCorporation获得的PTP阵列,该阵列由光纤面板(fiberopticfaceplate)形成,将该面板酸蚀刻以产生几十万或更多个非常小的孔,使每个孔能够容纳基本上相同的模板分子的群体(即,一些优选的实施方案在孔至孔间距为35μπι的70X75mmPTP阵列上约3.3百万个孔)。在一些实施方案中,可以将基本上相同的模板分子的每个群体配置到固体基质如珠子上,可以将其中每个基质配置到所述孔之一中。例如,装置可以包括用于将流体试剂提供至PTP板支持物的试剂递呈元件以及CXD型检测装置,该CXD型检测装置能够收集PTP板上每个孔发出的光的光子。具有改进的信号识别的特性的反应基质的例子描述于美国专利号No.7,682,816,题为“THIN-FILMCOATEDMICROffELLARRAYSANDMETHODSOFMAKINGSAME”,2005年8月30日提交。用于执行SBS型测序和焦磷酸盐测序的装置和方法的进一步的例子描述于美国专利Nos.7,323,305和7,575,865。此外,可以采用使一种或多种样品制备方法自动化的系统和方法,如上所述的emPCR方法。例如,可以采用自动化系统以提供用于产生用于emPCR处理的乳液、实施PCR热循环操作和富集用于测序的核酸分子的成功制备的群体的有效解决方案。自动化的样品制备系统的例子描述于美国专利号No.7,927,797,题为“Nucleicacidamplificationwithcontinuousflowemulsion”,2005年I月28日提交。而且,本发明目前描述的实施方案的系统和方法可以包括用被储存用于在计算机系统上实施的计算机可读介质而执行一些设计、分析或其它操作。例如,下面详细描述了一些用SBS系统和方法处理检测的信号和/或分析产生的数据的实施方案,其中处理和分析实施方案在计算机系统中是可以执行的。用于与本发明使用的计算机系统的示例性实施方案可以包括任何类型的计算机平台如工作站、个人计算机、服务器或者任何其它现在或未来的计算机。然而,本领域普通技术人员可以理解的是,此处所述的上述计算机平台被专门配置用于实施本发明的专门操作,不被视为通用目的计算机。计算机通常包括已知组件,如处理器、操作系统、系统存储器、存储器存储设备、输入-输出控制器、输入输出设备和显示设备。相关领域普通技术人员还可以理解的是,有许多可能的计算机的配置和组件,还可以包括超高速缓冲存储器、数据备份单元和许多其它设备。显示设备可以包括提供视觉信息的显示设备,该信息通常可以被逻辑和/或物理地组织为像素阵列。也可以包括接口控制器,其可以包括各种已知或未来用于提供输入和输出接口的软件程序。例如,接口可以包括“图形用户接口(GraphicalUserInterfaces)”(经常被称为GUI),其向用户提供一种或多种图形表示。通常用相关领域普通技术人员已知的选择或输入的方式使接口接受用户输入。在相同或替代的实施方案中,计算机上的应用程序可以采用包括“命令行接口(commandlineinterfaces)”(经常被称为CLI)的接口。CLI通常提供应用程序和用户之间的基于文本的互动。通常,命令行接口通过显示设备以文本行(linesoftex)提供输出并接收输入。例如,一些实施方式可以包括相关领域普通技术人员已知的“shell”如UnixShells,或采用面向对象类型的编程架构如Microsoft.NET框架的MicrosoftWindowsPowershellο相关领域普通技术人员将会理解,接口可以包括一种或多种⑶I的接口、CLI的接口或其组合。处理器可以包括商业上可以获得的处理器如Intel公司制造的Celeron、Core或Pentium处理器,SunMicrosystems制造的SPARC处理器,AMD公司制造的Athlon、Sempron,Phenom或Opteixm处理器,或者它可以是现在或未来获得的其它处理器。处理器的一些实施方案可以包括Multi-core处理器和/或能够以单核或多核的配置采用并行处理技术。例如,多核架构通常包括两种或更多种处理器“执行核心”。在本例子中,每个执行核心可以作为实施多线程并行执行的独立处理器。此外,相关领域普通技术人员可以理解,处理器可以被配置在32或64位架构或者现在已知或可以在将来开发的其它构架配置中。处理器通常执行一个操作系统,例如来自微软公司的Windows型操作系统(如ffindowsXP>WindowsVista或Windows_7);来自苹果计算机公司的MacOSX操作系统(如MacOSXvlO.6“SnowLeopard”操作系统);从许多供应商获得的Unix或Linux-型操作系统或者开放源码;另一种或未来的操作系统;或者其一些组合。操作系统与固件和硬件以众所周知的方式接口,帮助处理器协调并执行以多种编程语言编写的各种计算机程序的功能。通常与处理器配合的操作系统协调并执行计算机的其它组件的功能。操作系统还提供了安排(scheduling)、输入-输出控制、文件和数据管理、存储器管理和通信控制和相关服务,所有都与已知技术一致。系统存储器可以包括任何多种已知或未来的存储器存储设备。例子包括任何通常获得的随机存取存储器(RAM)、磁性介质,如现存的硬盘或磁带(residentharddiskortape),光学介质如读写光盘(readandwritecompactdisc),或其它存储器存储设备。存储器存储设备可以包括任何多种已知或未来的设备,包括光盘驱动器、磁带驱动器、可移动硬盘驱动器、USB或闪存驱动器或软盘驱动器。这种类型的存储器存储设备通常从程序存储介质(未表示)读出和/或写入,分别如,光盘、磁带、可移动硬盘、USB或闪存驱动器或软盘。任何这些程序存储介质或现在在使用或可能开发的其它介质都可以认为是计算机程序产品。可以理解的是,这些程序存储介质通常存储计算机软件程序和/或数据。计算机软件程序,也被称为计算机控制逻辑,通常存储于和程序存储装置结合使用的系统存储器和/或存储器存储设备。在一些实施方案中,描述了包括具有存储在其中的控制逻辑(计算机软件程序,包括程序代码)的计算机可用介质的计算机程序产品。当由处理器执行时,控制逻辑导致处理器执行此处所述的功能。在其它实施方案中,用例如硬件状态机器(hardwarestatemachine)首先在硬件中执行一些功能。为了执行此处所述的功能而执行硬件状态机器对于相关领域的技术人员而言是显而易见的。输入-输出控制器可以包括用于接收并处理来自用户的信息的任何多种已知的设备,无论是人还是机器,无论是本地的还是远程的。这种设备包括,例如,调制解调器卡、无线卡、网络接口卡、声卡,或者用于任何多种已知输入设备的其它类型的控制器。输出控制器可以包括任何多种已知用于将信息呈现给用户的显示设备的控制器,无论是人还是机器,无论是本地的还是远程的。在本实施方案中,计算机的功能元件通过系统总线(systembus)彼此相互通信。计算机的一些实施方案可以用网络或其它类型的远程通信与一些功能元件通信。对于相关领域中技术人员显而易见的是,如果在软件中执行,可以将仪器控制和/或数据处理应用程序装载进并从系统存储器和/或存储器存储设备执行。所有或部分的仪器控制和/或数据处理应用程序也可以存在于存储器储存设备的只读存储器(read-onlymemory)或类似的设备,这种设备不需要首先通过输入-输出控制器装载仪器控制和/或数据处理应用程序。对于相关领域中技术人员可以理解的是,可以由处理器以已知的方式将仪器控制和/或数据处理应用程序或它的部分装载进系统存储器或超高速缓冲存储器或两者,这对于执行是有利的。而且,计算机可以包括一种或多种文库文件、实验数据文件和存储在系统存储器中的互联网客户。例如,实验数据可以包括与一个或多个实验或测试相关的数据,如检测的信号值,或与一个或多个SBS实验或方法相关的数值。此外,互联网客户可以包括用网络能够能够访问另一台计算机上的远程服务的应用程序,可以例如包括“Web浏览器”。在本实施例中,一些常用的Web浏览器包括从微软公司获得的MicrosoftInternetExplorer8,苹果计算机公司的Safari4,Mozilla公司的MozillaFirefox3.6,Google公司的GoogleChrome,或者本领域现在已知的或者未来开发的其它类型的Web浏览器。而且,在相同的或其它实施方案中,互联网客户可以包括或者可以是能够通过网络访问远程信息的专门软件应用程序的一个元件,如用于生物应用的数据处理应用程序。网络可以包括本领域普通技术人员众所周知的许多不同类型的网络中的一种或多种。例如,网络可以包括采用TCP/IP协议组来通信的局域或广域网络。网络可以包括通常被称为互联网的互联的计算机网络的全球系统,或者也可以包括各种内联网架构(intranetarchitectures)。相关领域普通技术人员还可以理解,网络环境中的一些用户可能优选采用“防火墙”(有时也被称为PacketFilters或BorderProtectionDevices)以控制进出硬件和/或软件系统的信息。例如,防火墙可以包括硬件或软件元件或其一些组合,通常被设计为执行用户如例如网络管理员等落实的安全策略。b.本发明的实施方案如上所述,本发明的实施方案涉及与超嗜热菌(Aquifexaeo/icm,有时也被称为“Aae”)焦磷酸酶相关的改进的系统、方法和试剂盒及该酶的用途。相关领域普通技术人员将会理解,超嗜热菌是一种通常在水温可以达到85_95°C的海底火山或温泉附近发现的嗜热细菌°Hoe等(Hyang-SookHoe,Hyun-KyuKim,Suk-TaeKwon,ExpressioninEscherichiacolioftheThermostableInorganicPyrophosphatasefromtheAquifexaeolicusandPurificationandCharacterizationoftheRecombinantEnzyme,ProteinExpressionandPurification,Vol23,Issue2,Nov2001,Pages242-248)已经描述了超嗜热菌产生的分离的焦磷酸酶,该酶在高温下表现出非常高水平的热稳定性和效率,该特性对于PCR以及尤其是测序应用通常被认为是非常有利的。本发明包括编码从超嗜热菌分离的焦磷酸酶的核苷酸和蛋白序列,该酶在PCR和测序技术通常采用的温度时耐受变性并在所述温度时具有明显的酶活性。描述的本发明的实施方案还包括一种或多种额外的功能元件,该元件可以帮助蛋白的进一步的修饰和/或改善蛋白的处理效率。在典型的测序实施方案中,可以采用使一种或多种处理步骤自动化的一种或多种元件。例如,可以用自动化并实施一些或所有的处理步骤的仪器实施测序方法的实施方案。图I提供了测序仪100的说明性例子,对于需要捕获光信号的测序方法,该测序仪通常包括用于实施测序反应和发生在反应基质105上的数据捕获的光学子系统和流体子系统。然而,可以理解的是,对于需要其它数据捕获模式(即,pH、温度、电化学,等)的测序方法,可以采用相关领域普通技术人员已知的数据捕获的模式的子系统。例如,可以由用户101或一些自动化的实施方案将模板分子的样品装载到反应基质105上,然后用测序仪100以大规模并行的方式测序以产生代表每种模板分子的序列组成的序列数据。重要的是,用户101可包括任何用户,如包括但不限于独立研究人员、技术人员、临床医生、大学或企业实体。用于实施测序方法的测序仪100的实施方案可以包括流体子系统中的各种流体组件、光学子系统中的各种光学组件,以及图I中未显示的额外组件,所述额外组件可以包括用于一些功能的本地控制的微处理器和/或微控制器组件。在一些实施方案中,可以任选地使用样品制备仪180以自动或半自动的方式制备样品,该样品制备仪180被配置为实施一些或所有必要的制备用于用仪器100进行测序。而且,如图I中所示,测序仪100可以可操作地连接至一个或多个外部计算机部件如计算机130,该计算机部件可以例如执行系统软件或固件如应用135,该系统软件或固件可以提供对一个或多个仪器如测序仪100或样品制备仪180和/或数据分析功能的指导控制。计算机130可以通过网络150被额外地可操作地连接至其它计算机或服务器,这可以帮助仪器系统的远程操作以及将大量数据输出至能够存储和处理存储和处理的系统。在本例子中,测序仪100和/或计算机130可以包括上面总体所述的实施方案的一些或所有的组件及特性。如上所述,本发明的一个方面包括编码超嗜热菌焦磷酸酶的核酸序列和相应的氨基酸序列。如上所述,在一些实施方案中,添加其它功能元件以改善酶蛋白的处理和分离也是有利的。一种尤其有用的策略包括使酶蛋白体内生物素化的元件。本领域普通技术人员可以理解,生物素是对于感兴趣的元件如核酸、蛋白、底物等的优选分离非常有用的分子生物学工具,进一步可以理解的是,通常采用基于体外的方法将一种或多种生物素元件与蛋白或核酸结合,这通常需要更多处理步骤,因此比此处所述的体内方法效率更低。在一些实施方案中,生物素的使用对于将目标分子如例如超嗜热菌焦磷酸酶蛋白隔离在可以在基质(其包含多个单独的反应环境)上实施的测序方法中使用的基质如上面所述的PTP基质是有用的。例如,可以优选将超嗜热菌焦磷酸酶生物素化以便与珠子基质反应并结合于珠子基质如从JSR公司获得的MagnosphereMS300Streptavidin包被的珠子。然而,可以理解的是,对于一些应用则不需要生物素化。例如,在上面所述的emPCR方法中或者对于在测序流循环(sequencingflowcycle)期间在流中引入试剂的应用,贝Ij不需要采用生物素化的焦磷酸酶。然而,在本例子中,生物素化的焦磷酸酶仍然可以用于所述方法中。可以通过将生物素羧基载体蛋白(也被称为BCCP)结构域加入融合序列而完成实现体内生物素化的一种方式。其它元件也可以包括如6-组氨酸部分(也被称为His标签),该标签进一步实现了使用亲和柱(即,如Ni2+亲和柱)的“一步”纯化。图2提供了超嗜热菌焦磷酸酶和其它功能元件如焦磷酸酶205、BCCP207和His209的一种可能配置的说明性例子。例如,正如本领域普通技术人员所理解的,可以通过使用BCCP结构域将亲和标签与分子结合,该结构域提供了用于蛋白的体内表达和大肠杆菌连接酶对蛋白生物素化的位点。在本例子中,可以将包含编码超嗜热菌焦磷酸酶和相关的功能元件的核酸序列的质粒转化进大肠杆菌细胞并在培养基中生长以产生许多拷贝。然后可以收获并裂解细胞,用识别His标签的亲和柱收集表达的蛋白。在一些实施方案中,BCCP结构域还可以包括抑制蛋白产物生物素化的单一的序列位置的“点突变”。例如,BCCP结构域可以包括将赖氨酸氨基酸改变为丙氨酸的点突变,其阻止了产生蛋白的生物素化,这对于在更需要溶液相的焦磷酸酶的实施方案中的用途更加适用。图3A和3B提供了体外生物素化的超好热性古细菌焦磷酸酶与体内生物素化的超嗜热菌焦磷酸酶的实施方案的酶活性的比较的说明性例子,其中固定在珠子基质上的超嗜热菌焦磷酸酶蛋白的特异性活性等于或大于珠子固定的超好热性古细菌焦磷酸酶蛋白的特异性活性。本发明的实施方案可以包括以下序列中的一个或多个SEQIDNO:I:编码超嗜热菌-BCCP融合蛋白的核苷酸序列。ATCjCXjCiGGTTC'TC^^TC^ATCATrATC'ATCATGCiTATCiGCTAOC'ATCKiAACj{^XK;(^4Cj('AGCACICXJ<jAAAT('ACTI'(j(]TCAC'A'FC0TA(XnTCXC(CiATG(niX+iGTAC+lTTC:l"M+X'GCACr(+rAA(i(XX'G^^^^T(\4TCX)AAGTCCi0TC'A0AAACiTC'AACGT(iGGfXjATACrCTGTCC,AT€ΧΤ{4Λ(1;·\Κ}ΑΑΑΛΤ0ΛΤ€ΛΛΓ('Λ<1ΛΤΓ0ΛΑ€(Χι0ΑΓΑΑΑΤ("ΓGGmCttnTi4AAfiC-\ArrC加11tiACGA0CC0CTGGT€GTC*AirGA0GGATCCGA0CTCGA(]ATCTGCAGCATO<3QC1'ACXjACCAGrrGCCGCCGGGC3AAAAATCCGCCCGAAGAC-ATTTACGTCGTAATTGAAATTCCTCAGGCjAAGTGCGOTTAAGT,ν:·A,MTTCACAAAC14TACX5GG,備I'Τ1;^Χ3θΑΤΤΑ€ΤΑΤΤΧΤΤΓΑΑΤΤΑ(;(;0'ΓΓΤ€ΤΤ€ΧΓΓΑ0Α·CjCTTCj(X;C3ACGACCjOACjACX'C*CCjTr(jAr{iT!rrr(jTCATATC*AA(jA权利要求1.核酸,其包含编码超嗜热aeolicus)焦磷酸酶的核酸SEQIDNO:1或3。2.权利要求I的核酸,其中所述核酸编码His标签。3.权利要求I的核酸,其中所述核酸编码BCCP生物素化位点。4.用分离的焦磷酸酶蛋白测序的方法,其包括如下步骤在包含源自超嗜热菌物种的酶蛋白SEQIDNO:2或4的反应环境中进行测序反应,其中所述酶蛋白包括焦磷酸酶的活性。5.权利要求4的方法,其中所述酶蛋白结合于珠子。6.权利要求5的方法,其中所述酶蛋白通过生物素连接结合于珠子。7.权利要求6的方法,其中使用体内过程将所述生物素有效地偶联于蛋白。8.权利要求4的方法,其中所述酶蛋白是热稳定的。9.权利要求4的方法,其中在多个反应环境中同时进行多个测序反应。全文摘要本发明提供了编码超嗜热菌焦磷酸酶蛋白的核酸SEQIDNO1或3的核酸,酶蛋白SEQIDNO:2或4,以及用分离的超嗜热菌焦磷酸酶蛋白测序的方法。文档编号C12N9/14GK102858965SQ201180021792公开日2013年1月2日申请日期2011年4月28日优先权日2010年4月30日发明者D.格拉塔洛,K.H.林克,L.皮诺,P.桑冈,S.G.舍诺伊申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1