制备性体外克隆的方法与流程

文档序号:14112295阅读:517来源:国知局
制备性体外克隆的方法与流程

相关申请

本申请要求2011年6月15日提交的美国临时申请序列号61/497,506的权益,其通过引用全文纳入本文。

发明领域

本文提供涉及从核酸序列群选择靶核酸序列的方法。更具体地,提供从核酸序列文库分离出感兴趣的靶序列核酸序列的方法。



背景技术:

克隆核酸并从密切相关但非靶标序列分离出靶序列的方法已经成为常用的分子生物学手段。这些常用方法通常涉及将序列混合物与制得的载体片段整合以制备质粒。随后将所述质粒引入细菌细胞(转化),其通常使所述菌株具有抗生素抗性。选择菌株细胞并将细胞适当稀释至琼脂平板上,能够鉴定由携带个体序列的个体细菌细胞生长而来的菌落,所携个体序列来自初始混合物。对这些菌落进行后续操作能够从库中的非靶标序列鉴定出靶序。

这些常用方法是有缺陷的。其过程缓慢,细胞菌株的转化和随后的菌落生长通常需要过夜。然后,每个菌落必须单独分离并在液体培养基中生长。另一个缺点是转化相对昂贵。

有限稀释技术已被用于从汇集的细胞悬液分离单个细胞,以及dna分子计数。基本方法涉及测定细胞数目或dna浓度、稀释至非常低的浓度,和等分至分开的孔内以使细胞或dna分子的数目小于每孔一个。随后的细胞分裂或dna扩增(如通过pcr)应显示所述孔对于初始空白、接种了一个细胞或分子,和接种了多个细胞或分子的孔的泊松分布。



技术实现要素:

本发明的方面涉及具有预确定序列的靶核酸分子的分离。在一些实施方式中,所述方法包括以下步骤:提供包含多个不同核酸分子的核酸分子群;提供多个寡核苷酸标签;使所述寡核苷酸标签连接多个核酸分子的一个末端从而生成核酸-寡核苷酸标签分子的亚群;使用与多个寡核苷酸标签互补的引物扩增所述多个核酸-寡核苷酸标签分子;以及分离所述核酸-寡核苷酸标签分子亚群中的至少一个靶核酸-寡核苷酸标签分子。

在一些实施方式中,所述方法还包括对至少一个分离的靶核酸-寡核苷酸标签分子测序并鉴定所述靶核酸。在一些实施方式中,所述测序步骤通过高通量测序进行。在一些实施方式中,所述方法还包括扩增至少一个靶核酸-寡核苷酸标签分子。

在一些实施方式中,所述分离步骤通过有限稀释法进行。在一些实施方式中,扩增所述靶核酸-寡核苷酸标签分子。

本发明的一些方面涉及分离靶核酸的方法,所述方法包括(a)提供包含多个不同核酸分子的群;(b)提供多个微粒,其中各微粒的表面固定有与所述核酸分子的部分互补的寡核苷酸序列;(c)形成与所述微粒上的互补性寡核苷酸序列杂交的核酸分子群;以及(d)分离至少一个靶核酸分子。在一些实施方式中,各微粒的表面具有单个互补性序列。在一些实施方式中,所述互补性寡核苷酸序列是相同的。而在其它实施方式中,所述互补性寡核苷酸序列是不同的。在一些实施方式中,所述多个核酸分子在一个末端包含寡核苷酸标签。在一些实施方式中,所述多个核酸分子可具有相同的寡核苷酸标签或不同的寡核苷酸标签。在一些实施方式中,所述分离步骤通过有限稀释法进行。在一些实施方式中,所述方法还包括扩增至少一个靶分子。

本发明的一些方面涉及分离靶核酸的方法,所述方法包括(a)提供包含多个不同核酸分子的群;(b)提供所述核酸分子群的稀释物;(c)将所述核酸分子群分离成样品,所述样品包含单个分子或较小数量的分子;(d)扩增所述单个分子从而形成经扩增的核酸分子;(e)可任选地在不含核酸分子的样品中重复步骤(c)和(d);以及(f)分离至少一个靶核酸分子。在一些实施方式中,所述靶核酸分子具有预确定的序列。在一些实施方式中,所述方法还包括对至少一个靶核酸分子测序。

附图简要说明

图1说明通过增加有限稀释进行体外克隆的非限制性示例方法。

图2说明使用带有供核酸附着的单配体位点的珠子进行体外克隆的非限制性示例方法。

图3说明使用条形码序列(barcodesequence)文库进行体外克隆的非限制性示例方法。

具体实施方式

本发明的方面涉及从包含多个不同核酸序列的库中分析和分离至少一个具有预确定序列的核酸分子的方法与组合物。在本发明的一些方面中,核酸序列库包含感兴趣核酸序列的变体和/或长度与感兴趣的核酸序列相似的核酸序列。本发明的方面对从核酸序列群(例如核酸序列文库)分离感兴趣的核酸序列而言尤为有用。

本文所提供技术的方面对提高核酸合成和装配反应的准确度、产量、通量和/或成本效率而言是有用的。在一些实施方式中,本文公开的方法对分离核酸序列用于装配具有预定序列的核酸分子而言尤为有用。本文中所用的术语“核酸”、“多核苷酸”、“寡核苷酸”可互换使用,并且指天然产生或合成的核苷酸的聚合形式。本发明的寡核苷酸和核酸分子可由天然产生的核苷酸形成,例如形成脱氧核糖核酸(dna)或核糖核酸(rna)分子。或者,所述天然产生的寡核苷酸可包含结构修饰以改变其性质,如肽核酸(pna)或锁核酸(lna)。采用天然发生或合成的碱基固相合成寡核苷酸和核酸分子为本领域所熟知。应理解所述术语包括由核苷酸类似物制得的和适用于所述实施方式的rna或dna的等同物、类似物,单链或双链多核苷酸。可用于本发明的核苷酸包括,例如,天然产生的核苷酸(如核糖核苷酸或脱氧核糖核苷酸),或核苷酸的天然或合成修饰形式,或人造碱基。本文所用的术语单体指一组小分子中的成员,所述小分子可连接在一起以形成寡聚物、聚合物或由两个或多个成员组成的化合物。聚合物内单体的特定顺序在本文中被称作所述聚合物的“序列”。单体的组包括但不限于,例如,常见l-氨基酸的组、d-氨基酸的组、合成的和/或天然的氨基酸的组、核苷酸的组和戊糖及己糖的组。本文所述的本发明的方面主要关于寡核苷酸的制备,但可容易地应用于其它聚合物例如肽或多肽、多糖、磷脂、杂聚物、聚酯、聚碳酸酯、聚脲、聚酰胺、聚乙烯亚胺、聚亚芳基硫醚、聚硅氧烷、聚酰亚胺、聚乙酸酯或其它聚合物的制备。

如本文所用,术语“预定序列”或“预确定序列”可互换使用,并且表示所述聚合物的序列在合成或组装所述聚合物前是已知且已选定的。具体而言,本文所述的本发明的方面主要关于核酸分子的制备,所述寡核苷酸或多核苷酸的序列在合成或组装所述核酸分子前是已知且已选定的。在本文提供的技术的一些实施方式中,使用固定化的寡核苷酸或多核苷酸作为物质来源。在多种实施方式中,本文所述的方法使用寡核苷酸,其序列是基于待合成的最终多核苷酸构建体的序列来确定的。在一个实施方式中,寡核苷酸是短核酸分子。例如,寡核苷酸的长度可以是10至约300个核苷酸、20至约400个核苷酸、30至约500个核苷酸、40至约600个核苷酸或大于约600个核苷酸。但也可使用更短或更长的寡核苷酸。寡核苷酸可被设计为不同长度。在一些实施方式中,可将多核苷酸构建体的序列分为多条较短序列,所述较短序列可使用本文所述的方法平行合成并组装成单个或多个所需的多核苷酸构建体。在一些实施方式中,所述组装过程可包括数个平行和/或连续的反应步骤,其中多个不同核酸或寡核苷酸得以合成或固定化、引物延伸并结合以组装(例如,如本文所述通过延伸或连接)形成较长的核酸产物,以用于进一步组装、克隆或其它应用。

在一些实施方式中,根据本文公开方法制备的核酸分子可用于核酸组装和包含具有预定序列变化的核酸文库的组装。本文提供的组装策略可用于生成代表感兴趣的多种不同核酸序列的很大的文库。在一些实施方式中,核酸文库是序列变体的文库。序列变体可以是单个天然产生的蛋白质编码序列的变体。然而,在一些实施方式中,序列变体可以是多个不同的蛋白质编码序列的变体。因此,本文所提供的技术的一个方面涉及精确的高密度核酸文库的组装。本文所提供的技术的方面还提供精确的高密度核酸文库。高密度核酸文库可包括超过100个不同的序列变体(例如约102至103;约103至104;约104至105;约105至106;约106至107;约107至108;约108至109;约109至1010;约1010至1011;约1011至1012;约1012至1013;约1013至1014;约1014至1015;或更多不同的序列),其中所述不同序列有高比例的特定序列而非随机序列(如所述序列中大于约50%、大于约60%、大于约70%、大于约75%、大于约80%、大于约85%、大于约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高比例是感兴趣的预定序列)。

在一些实施方式中,本文所提供的方法和装置使用固定化于表面或基质的寡核苷酸(例如,支持物结合的寡核苷酸)。支持物结合的寡核苷酸包括,例如,与寡核苷酸构建体互补的寡核苷酸、锚着子寡核苷酸和/或间隔子寡核苷酸。如本文所用,术语“支持物”、“基质”和“表面”可互换使用并表示多孔或无孔的溶剂不溶性材料,在所述材料上合成或固定有聚合物如核酸。本文所用的“多孔”指所述材料带有基本均一直径(例如在纳米范围内)的孔。多孔材料包括纸、合成滤器等。在此类多孔材料中,反应在所述孔内发生。所述支持物可以是多种形状中的任意一种,如排针状、条状、板状、盘状、杆状、弯曲状、圆柱结构、颗粒状(包括珠子、纳米颗粒)等。所述支持物可具有可变宽度。所述支持物可以是亲水性的或能够呈现亲水性。所述支持物可包括无机粉末,如二氧化硅、硫酸镁和铝;天然聚合材料,尤其是纤维素材料和纤维素源性的材料,如含纤维的纸,例如滤纸、层析纸等;合成或修饰的天然产生的聚合物,如硝化纤维素、醋酸纤维素、聚氯乙烯、聚丙烯酰胺、交联葡聚糖、琼脂糖、聚丙烯酸酯、聚乙烯、聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二酯)、尼龙、聚(乙酸丁烯酯)、聚偏二氟乙烯(pvdf)膜、玻璃、受控多孔玻璃、磁控多孔玻璃、陶瓷、金属等;可单独使用或与其它材料联用。在一些实施方式中,寡核苷酸以阵列的形式合成。例如,在常用支持物上原位合成单链寡核苷酸,其中每条寡核苷酸被合成在基质上的分离或不连续的构造(或点)上。在优选实施方式中,使单链寡核苷酸结合到所述支持物或构造的表面。本文中所使用的术语“阵列”指用于储存、扩增和释放寡核苷酸或互补性寡核苷酸以供进一步反应的不连续构造的排列。在一个优选实施方式中,所述支持物或阵列是可寻址的:所述支持物在其上特定的预定位置(即一个“地址”)包括两个或多个离散的可寻址构造。因此,所述阵列的每个寡核苷酸分子都被定位在所述支持物上的一个已知且确定的位置。各寡核苷酸的序列均可通过其在所述支持物上的位置来确定。所述阵列可包括构造间区域。构造间通常不在其表面上带有任何寡核苷酸,并且符合惰性间隔。

在一些实施方式中,寡核苷酸被连接、点样、固定、表面结合、支持或合成在所述表面或阵列的不连续构造上。可使寡核苷酸共价连接至所述表面或沉积在所述表面上。阵列可以是构建的、定制的或购自商业供货商(如安捷伦(agilent)、昂飞(affymetrix)、nimblegen)。本领域熟知多种构建方法,例如无掩膜阵列合成器、使用掩膜的光定向法、流道法、点样法等。在一些实施方式中,可使用无掩膜阵列合成器(mas)在固体支持物上合成构建和/或选择寡核苷酸。无掩膜阵列合成器在例如pct申请号wo99/42813和相应的美国专利号6,375,903中有描述。已知无掩膜仪器的其它示例,其可制造自定义的dna微阵列,其中所述阵列中的各构造具有所需序列的单链dna分子。用于合成寡核苷酸的其它方法包括,例如,使用掩膜的光定向法、流道法、点样法、基于排针的方法和使用多种支持物的方法。举例来说,用于合成寡核苷酸的使用掩膜的光定向法(如vlsipstm法)在美国专利号5,143,854、5,510,270和5,527,681中有描述。这些方法涉及激活固体支持物的预定区域并随后使所述支持物接触预先选择的单体溶液。可通过掩膜以光源照射来激活选定区域,大体上以集成电路制造中所用的光刻技术的方式进行。所述支持物的其它区域保持非活性,因为光照被掩膜所阻挡,从而它们保持了被化学保护的状态。因此,光照图案确定了支持物的哪一部分会与特定单体反应。通过重复激活不同预定区域的组并使不同单体溶液接触所述支持物,可在所述支持物上形成聚合物的多样化阵列。可任选地使用其它步骤,如从所述支持物清洗未反应的单体溶液。其它适用方法包括机械技术,如美国专利号5,384,261中所述的那些。适用于在单个支持物上合成寡核苷酸的其它方法在例如美国专利号5,384,261中有描述。例如,试剂可通过以下方式递送至支持物:(1)在预设区域上确定的通道内流动或(2)在预定区域上“点样”。也可采用其它方式,以及点样和流动的结合。在各示例中,当单体溶液被递送至不同反应位点时,所述支持物的某些激活区域与其它区域机械分离。流道法涉及,例如,微流体系统以控制寡核苷酸在固体支持物上的合成。例如,通过在所述支持物表面形成供合适试剂流动或安置的流道,可在固体支持物的选定区域合成多样化的聚合物序列。用于在固体支持物上制备寡核苷酸的点样法涉及通过直接使试剂沉积在选定区域内的方式以相对小量递送试剂。在一些步骤中,可用溶液喷涂或以其它方式覆盖整个支持物表面,前提是如此操作更为有效。可通过在区域间移动的分液器使精确度量的单体溶液分装液逐滴沉积。基于排针在固体支持物上合成寡核苷酸的方法在例如美国专利号5,288,514中有描述。基于排针的方法使用带有多个排针或其它延伸部的支持物。各排针被同时插入托盘中的个体试剂容器内。96排针的阵列通常与96个容器的料盘如96孔微量滴定盘一同使用。各料盘均装有特定试剂,用于单个排针上的特定化学反应中偶联。因此,所述料盘常包含不同的试剂。由于已对化学反应进行优化以使每个反应都能在相对相似的反应条件组下进行,使得多种化学偶联步骤的同时进行成为可能。

在另一个实施方式中,可在多个支持物上合成或固定多个寡核苷酸。一个示例是基于珠子的合成方法,其在例如美国专利号5,770,358、5,639,603和5,541,061中有描述。为在珠子上合成分子(诸如寡核苷酸),将大量珠子悬浮在容器内的适当运载体(如水)中。所述珠子具有可选的间隔分子,所述间隔分子具有活性位点,其可任选地复合有保护基团。在所述合成的每一步中,所述珠子均被分入多个容器内用于耦合。在新生寡核苷酸链被去保护后,向各容器添加不同的单体溶液,从而在给定容器内的所有珠子上发生相同的核苷酸加成反应。然后使用过量试剂清洗所述珠子,并入单个容器内,混合并重新分配至另一批容器内以准备下一轮的合成。应注意,由于开始阶段使用了大量珠子,同样将会有大量珠子随机分布在所述容器内,经过碱基的多轮随机添加后每一个珠子均带有在其表面合成的独特寡核苷酸序列。单个珠子可采用只有该珠子上的双链寡核苷酸才有的序列标记,以在使用过程中进行鉴定。

可使用下文文献中所述的光定向法、流道及点样法、喷墨法、基于排针的方法和基于珠子的方法使预先合成的寡核苷酸和/或多核苷酸序列与支持物连接或进行原位合成:mcgall等(1996)proc.natl.acad.sci.u.s.a.93:13555;syntheticdnaarraysingeneticengineering(《遗传工程学中的合成dna阵列》),卷号20:111,普莱南出版社(plenumpress)(1998);duggan等(1999)nat.genet.s21:10;microarrays:makingthemandusingtheminmicroarraybioinformatics(《微阵列:其在微阵列生物信息学中的制备和使用》),剑桥大学出版社(cambridgeuniversitypress),2003;美国专利申请公开号2003/0068633和2002/0081582;美国专利号6,833,450、6,830,890、6,824,866、6,800,439、6,375,903和5,700,637;以及pct公开号wo04/031399、wo04/031351、wo04/029586、wo03/100012、wo03/066212、wo03/065038、wo03/064699、wo03/064027、wo03/064026、wo03/046223、wo03/040410和wo02/24597;上述公开内容出于所有目的通过引用全文纳入本文。在一些实施方式中,使预先合成的寡核苷酸与支持物连接或使用点样法合成,其中通过在区域间移动的分液器(如喷墨)使单体溶液逐滴沉积。在一些实施方式中,使用,例如,机械波驱动分液器将寡核苷酸点样在支持物上。

在一方面,本发明涉及在固体支持物上生成具有预定序列的靶多核苷酸的方法。在一些实施方式中,合成的多核苷酸的长度可以是至少约1、2、3、4、5、8、10、15、20、25、30、40、50、75或100千碱基(kb),或1兆碱基(mb),或更长。

在一些方面,本发明涉及生成高保真多核苷酸的方法。在示例性的实施方式中,合成的多核苷酸的组合物包括至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、50%、60%、70%、80%、90%、95%或更多的无错误拷贝(例如,具有未偏离预定序列的序列)。无错误拷贝的百分比计为所述组合物中无错误拷贝的数量与组合物中意图具有正确的(例如预确定或预定的)序列的多核苷酸总拷贝数的比。

本发明的一些方面涉及用于高保真多核苷酸装配的寡核苷酸的制备。本发明的方面有利于增加核酸装备过程的生产速率和/或减少用以生成正确装配核酸的步骤数或试剂量。在某些实施方式中,本发明的方面有利于在自动化核酸装配条件下减少各正确核酸装配所需的时间、步骤数、试剂量和其它因素。因此,本发明的这些和其它方面有利于减少一个或多个核酸装配过程的成本和时间。

应意识到,核酸(或核酸文库或已装配的核酸)序列可能包含一些错误,这些错误由寡核苷酸合成、核酸合成引入的序列错误和/或装配反应期间的装配错误造成。在一些实施方式中,在一些核酸中可能存在不需要的序列。例如,文库中序列的0%~50%(如小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%或小于1%)可能是不需要的序列。在一些实施例中,具有预定序列(或正确序列)的核酸可被选择性分离。本文所用的术语“选择性分离”可涉及将所需多核苷酸与其它核酸物理分离,所述分离通过选择性物理移动所需多核苷酸以及使感兴趣的多核苷酸除外的其它多核苷酸选择性失活、破坏、释放或去除来进行。

本文提供用于从核酸序列库选择性分离正确核酸序列与不正确核酸序列的装置和方法。可通过选择性分离,如选择性分离、移动或转移所需的正确核酸序列来使所述正确序列与其它不正确序列分离。或者,可以选择性地去除具有不正确序列的多核苷酸。

根据本发明的一些方法,可先稀释核酸序列(寡核苷酸构建体、装配中间体或所需的已装配的靶核酸)以获得靶多核苷酸的克隆群(即包含单一靶多核苷酸序列的群)。本文所用的“克隆核酸”或“克隆群”或“克隆多核苷酸”可互换使用并表示核酸的克隆分子群,即彼此基本或完全相同的核酸或多核苷酸。因此,所述基于稀释的方案提供了彼此间相同或基本相同的核酸分子群。在一些实施方式中,多核苷酸被连续稀释。在一些实施方式中,所述装置具有连续稀释功能。在一些实施方式中,装配产物被连续稀释以生成核酸的克隆群。在一些实施方式中,可在稀释步骤前评估分子的浓度和数目并计算稀释比以产生克隆群。在一个示例性实施方式中,可通过至少2、至少3、至少4、至少5、至少6、至少7、至少10、至少20、至少50、至少100、至少1,000等因数稀释装配产物。

本领域技术人员应理解,遵循统计学泊松分布的传统有限稀释技术经常是耗时的。由泊松分布所决定,有限稀释会导致单击(single-hit)(如每个孔一个克隆)。然而,如果样品很大,单个孔中会出现数目不定的克隆(如双击(two-hit)),并且需要多轮稀释以确保单克隆性。本发明的方面涉及以比有限稀释法更有效的方式制备性分离核酸分子的方法。

在本发明的一些方面,通过改进的有限稀释技术分选核酸序列。具体而言,在一些实施方式中,所述方法使用反馈回路以在有限稀释的泊松分布的基础上提高分离效率。在一些实施方式中,本文公开的过程是迭代过程。所述过程可使用荧光信号作为鉴定空白样品的反馈机制,从而能进行比泊松有限稀释更有效的体外克隆。

在一些实施方式中,稀释核酸序列库以形成核酸分子的混合物或稀释溶液。所述核酸分子被分离成包含单个或较少数目分子的样品。例如,稀释溶液可用于接种平板上的各孔以使平板(如96孔板)上的单个孔内装有至少一个分子。可对所有样品运行定量pcr(qpcr)反应的循环,使初始时以单个分子形式接种的样品(如孔)的鉴定能够进行。可通过荧光来确定每个样品中核酸序列的存在。由于初始稀释所设定的方式,很少量的样品(如孔)用多分子形式初始接种。如图1,步骤1所示,荧光读取显示在少量孔(孔f,图1,步骤1)中存在扩增产物。然后可对不含任何核酸分子的已接种样品(孔a-e,图1)补充稀释溶液(步骤3,图1)并再次进行定量pcr。如图1、步骤4所示,荧光读取显示在越来越多的孔(孔b、c和f)中存在扩增产物。可重复该过程直至基本上所有样品或孔均包含核酸分子的扩增群。

在本发明的一些方面中,特异性杂交可用作鉴定和/或获取感兴趣的核酸的方法。在本发明的一些方面,可使用具有连接核酸用的单一配体位点的固体支持物(例如微粒或珠子)以获取单个核酸分子。所述单一配体位点可以是与待分析核酸序列的序列部分互补的寡核苷酸序列,或与所述核酸序列所连接的寡核苷酸标签互补的寡核苷酸序列。多个核酸序列中的各核酸可标记有不同的寡核苷酸标签或同一寡核苷酸标签。例如,所述多个核酸序列中的核酸序列可连接单一寡核苷酸标签。而在其它实施方式中,提供多个寡核苷酸标签。在一些实施方式中,每个寡核苷酸标签的长度一致。在一些实施方式中,所述寡核苷酸标签的长度为至少4个核苷酸、至少20个核苷酸、至少20个核苷酸、至少30个核苷酸或至少40个核苷酸。

在一些实施方式中,提供在其上固定有互补序列的固体支持物。互补序列可以是与所述寡核苷酸标签互补的序列或与所述多个核苷酸序列中的部分互补的序列。寡核苷酸序列可与所述固体支持物的表面共价或非共价连接。在一些实施方式中,所述固体支持物可以是珠子、微粒、平板、膜、阵列等。在优选实施方式中,所述固体支持物是微粒或珠子。所述珠子的尺寸范围通常介于直径1m至1000m之间。可选择珠子的尺寸以便于珠子的操作。在一些实施方式中,使所述互补序列连接至所述固体支持物。但在其它实施方式中,使与所述寡核苷酸标签互补的序列如本文所述在固体支持物上合成。在一些实施方式中,所述固体支持物由受控孔玻璃、核苷衍生的cpg、纤维素、尼龙、丙烯酸共聚物、右旋糖苷、聚苯乙烯、磁珠等制成。在一些实施方式中,所述固体支持物是多孔的。所述珠子的孔径通常介于500至1000埃之间。但在其它实施方式中,所述固体支持物是无孔的。

在优选实施方式中,可使用各珠子上均带有与所述寡核苷酸标签互补的单一互补序列的珠子群,从而该群中的各珠子均能够获取单一核酸分子。如图2(步骤1)所示,在适宜互补序列杂交的条件下,使核酸分子与包含单一配体位点(如单一互补序列)的珠子混合。可使其上连接了核酸序列的多个珠子悬浮并分离入多个样品(如在微量滴定板的多个孔中,图2、步骤2)。在一些实施方式中,可对珠子进行有限稀释或用本文公开的方法处理而使其分散并分离,例如各孔包含单个珠子。可使用引物对固定在所述经分离珠子上的核酸序列进行扩增。

在一些实施方式中,获得克隆群之后扩增所述靶多核苷酸。在一些实施方式中,所述靶多核苷酸的5’末端或3’末端或上述两个末端可包含通用(所有寡核苷酸共有)、半通用(至少部分寡核苷酸共有)或个体或独有的引物(对各寡核苷酸均特异)的结合位点。如本文所用,术语“通用”引物或引物结合位点指用于扩增寡核苷酸的序列是所有寡核苷酸共有的,从而可使用单一的通用引物组扩增所有这类寡核苷酸。在其它情况下,寡核苷酸包含独特的引物结合位点。本文所用的术语“独特的引物结合位点”指选择性扩增寡核苷酸子集的一组引物识别序列。但在其它情况下,靶核酸分子同时包含通用和独特的扩增序列,其也可任选地被依序使用。

在一些实施方式中,引物/引物结合位点可被设计为临时性的。例如,可通过化学切割、基于光的切割或酶切割来去除临时引物。例如,引物/引物结合位点可被设计为包含限制性内切核酸酶切割位点。在一个示例性实施方式中,引物/引物结合位点包含供于ii型限制性内切核酸酶的结合和/或切割位点。在这种情况下,可设计扩增序列,以使所需寡核苷酸组一旦扩增达到足够的量,所述扩增序列即可通过使用识别该寡核苷酸内部的ii型限制性内切核酸酶序列的适当的ii型限制性内切核酸酶而被切割。在一些实施方式中,扩增后,所述核酸库可与一种或多种内切核酸酶接触以生成双链断裂,从而去除引物/引物结合位点。在某些实施方式中,可通过相同或不同的限制性内切核酸酶来移除正向和反向引物。可使用任何类型的限制性内切核酸酶从核酸序列上去除引物/引物结合位点。许多具有特定结合和/或切割位点的限制性内切核酸酶是市售可得的,例如来自neb公司(newenglandbiolabs)(马萨诸塞州贝弗利)。

在某些示例性实施方式中,可检测标签可用于检测本文所述的一个或多个核苷酸和/或寡核苷酸。在一些实施方式中,可检测标签可用来检测经扩增的分子,例如在定量pcr之后。可检测标志物的示例包括各种放射性部分、酶、辅基、荧光标志物、发光标志物、生物发光标志物、金属微粒、蛋白质-蛋白质结合对、蛋白质-抗体结合对等。荧光蛋白的示例包括但不限于,黄色荧光蛋白(yfp)、绿色荧光蛋白(gfp)、青色荧光蛋白(cfp)、伞形酮、荧光素、异硫氰酸荧光素、罗丹明、二氯三嗪基胺荧光素、丹磺酰氯、藻红蛋白等。生物发光标志物的示例包括但不限于,荧光素酶(如细菌、萤火虫、叩头虫等)、萤光素、水母发光蛋白等。具有视觉可检测信号的酶系统的示例包括但不限于,半乳糖苷酶、葡萄糖醛酸酶、磷酸酶、过氧化物酶、胆碱脂酶等。可识别的标志物还包括放射性化合物,如125i、35s、14c或3h。可识别的标志物可从多种来源市售获得。所述寡核苷酸探针或核苷酸优选采用四种不同的荧光团来荧光标记,每个荧光团与一种特定碱基或核苷酸相关联。

在本发明的一些方面中,确定一个或多个核酸分子的序列和/或选择性分离具有感兴趣的正确序列的核酸分子。这通常可通过常规或新一代基本测序技术实现。在一些实施方式中,提供使用高通量测序来验证核酸序列的方法。在一些实施方式中,核酸分子通过合成来测序。序列确定可通过任何可用的允许单个分子序列查询(“单分子测序”)的方法来完成,无论这种方法是直接的或是通过查询单分子所得的核酸扩增群(“聚合酶克隆测序”)实现的。所述序列确定方法可以是非破坏性的,意思是指序列确定的目标是鉴定后续可用的寡核苷酸。聚合酶扩增和测序的方法已有描述,例如美国专利申请号2005-0079510和2006-0040297;mitra等(2003)analyticalbiochemistry320:55-65;shendure等(2005)science309:1728-1732;和margulies等(2005)nature437:376-380,上述各文献的公开内容均通过引用全文纳入本文。如shendure等(2005)science309:1729所述,聚合酶克隆扩增可涉及,例如原位聚合酶克隆、原位滚环式扩增、桥式pcr、微微量滴定pcr(picotiterpcr)或乳液pcr。一般而言,待扩增的寡核苷酸制备为包括引物结合位点,无论是在开始合成时作为其序列的一部分或者是通过后续连接带有引物结合位点的接头分子。在一些实施方式中,在测序之前,可将所述寡核苷酸固定在固体支持物上的不同位置(如预定的、可寻址的位置或随机位置)。例如在来自454生命科学公司(454lifesciences)的基因组测序器20系统中,使来自聚合酶克隆扩增的珠子沉积于光纤片的孔中。在shendure法中,将来自聚合酶克隆扩增的珠子在5%丙烯酰胺凝胶中倾注在玻璃盖玻片上以形成约30微米厚的圆形凝胶,得到无序单层。

在本发明的一些方面中,所述方法涉及使用鉴定寡核苷酸标签(本文中也称为条形码)的文库。在一些实施方式中,所述寡核苷酸标签的长度可根据待分析核酸群的复杂程度而变化。一般而言,较长的寡核苷酸序列标签会允许较大的寡核苷酸序列群。在一些实施方式中,条形码间彼此至少有两个核苷酸不同。在优选实施方式中,使用寡核苷酸标签文库的部分并使其以化学计量学的方式与所述群(或库)中多个核酸序列的一个末端连接,从而从所述群中多个核酸中的较小样品(即亚群)得以条形码化。例如,如图3所示,所述核酸群可包含x个核酸分子,并可提供复数m个核酸标签,其中m小于x。在使所述寡核苷酸标签连接至所述核酸分子后,所得的亚群将包含m个条形码化的核酸分子,剩余的核酸分子不带有寡核苷酸标签(“未条形码化”)。在一些实施方式中,可加入对已知组n的特定条形码序列具有特异性的n条引物,其中n小于m。在适当条件下加入对所述寡核苷酸标签或条形码具有特异性的引物导致所述引物与其特异性结合位点的杂交,并允许特异性扩增所述亚组n的条形码化核酸序列。

在一些实施方式中,使所述条形码或寡核苷酸标签连接至核酸序列群的亚群的末端,从而形成核酸序列-寡核苷酸标签偶联物。例如,可使用ta克隆技术来连接条形码或寡核苷酸标签。所述技术依赖不同核酸序列(如寡核苷酸标签序列和感兴趣的核酸序列)上的腺嘌呤(a)和胸腺嘧啶(t)在连接酶存在时杂交并连接在一起的能力。在一些实施方式中,使用会在3’末端优先添加a的taq聚合酶来扩增寡核苷酸标签序列或待分析的核酸序列。在一些实施方式中,使在3’末端含a的序列杂交并连接至5’末端含t的序列。

基于条形码文库的规模,预期每条条形码序列只在亚群中出现一次,从而确保克隆性。随后可使用已知特定条形码序列组(即子集库)的引物扩增所述条形码化的亚群,其代表所述核酸亚群的所需取样(或子集)。

此时,已扩增的子集群可随后分离入样品(如等分进入孔中)并扩增。在一些实施方式中,可使用对个体条形码序列具有特异性的引物来从核酸分子的原始群中制备性地克隆单个分子。本领域技术人员应理解,本文所述的直接克隆方法的效率可能会受泊松统计的限制,这归因于任何特定条形码作为混合物中核酸分子的连接产物准确出现一次的可能性的平衡。为将效率提升超越泊松统计,可采用其它操作,例如对扩增后的子集群测序。由于已连接的条形码可用于高通量新一代测序上的多路测序,可确定所述混合物中每个核酸分子及其连接的条形码的序列。随后可使用测序数据从所述混合物确定感兴趣的靶分子,并鉴定其在子集库中连接的条形码。随后可从单孔内的子集库选择性扩增这些靶分子,通过克隆将它们与混合物中的非靶序列分离。

等同形式

本发明提供了用于高保真基因装配的新方法和装置等。虽然已经讨论了主题发明的特定实施方式,但上述说明书是说明性的而非限制性的。在阅读了该说明书之后,本发明的多种变化形式对本领域技术人员而言显而易见。本发明的全部范围的确定应参考权利要求,连同其等同形式的全部范围,以及说明书,连同此类变化形式。

参考文献的引用

本文引用了国际申请号2009年8月27日申请的pct/us2009/055267、2010年11月25日申请的pct/us2010/057405、2010年11月19日申请的pct/us2010/057392、2010年11月03日申请的pct/us2010/055298、2011年1月06日申请的pct/us2011/020335、2011年5月13日申请的pct/us2011/36433、2010年11月12日申请的美国临时申请61/412,937、2010年11月30日申请的美国临时申请61/418,095以及2011年3月23日申请的美国临时申请61/466,814、题为“核酸合成的方法与装置(methodsanddevicesfornucleicacidssynthesis)”。本文提到的所有出版物、专利和序列数据库条目均通过引用全文纳入本文,如同每个单个出版物或专利均被特定地及单个地表示为参考文献的引用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1