用邻接标签序列复制dna用于基因组和表观基因组测序的制作方法

文档序号:10525718阅读:371来源:国知局
用邻接标签序列复制dna用于基因组和表观基因组测序的制作方法
【专利摘要】本文提供了用于从模板多核苷酸精确测序和检测表观遗传信息的方法和设备。也提供了用于长片段链置换扩增多核苷酸的方法、具有用于多步处理的选择性可渗透屏障的微流体设备,和使用微流体设备进行多核苷酸扩增的方法。
【专利说明】用邻接标签序列复制DNA用于基因组和表观基因组测序
相关申请的交叉引用
本申请要求2013年11月15日提交的美国申请号61/904,637的优先权,其内容通过参考以其整体并入本文。
发明背景
本公开属于DNA扩增和测序,以及微流体处理设备的领域。理想地,基因组测序可以低成本实现单细胞的基因组和表观基因组序列的100%精确度和端对端邻接(end-to-endcontiguity)。
不清楚目前的纳米孔测序技术是否能够以低成本实现快速从头基因组测序(de novogenome sequencing)的测序序列(read)长度、精确度和通量(Branton等2008 ; Cherf等2012;Clarke等2009;Kumar等2012;Manrao等2012;McNalIy等2010;WalIace等2010;Wanunu2012)。由于将DNA捕获至纳米孔中的低效率(Branton等2008 ;Wanunu等2010),在没有一些样品制备(包括片段化和扩增)的情况下,对单细胞的基因组测序是不可行的。主要基于通过使用DNA聚合酶的合成进行测序的当代测序仪就测序通量和精确度而言是引人注意的(例如对于Illumina HiSeq 2500,每次运行接近I万亿碱基,对于大部分测序序列具有99.9%的原始精确度(raw accuracy)),尽管相对短的测序序列(几百碱基或更短)。每碱基(per-base)测序成本也已经明显地快速下降。但是,许多技术挑战仍待克服,以就每碱基精确度、组装的邻接和单倍型(haplotype)的完全分型(phasing)而言,达到用于个性化医疗的基因组序列的质量(Baker等2012;Marx 2013)。
首先,使用通过这些高通量测序仪产生的短测序序列(数百碱基或更短),用具有高度重复性的序列进行基因组的组装非常具有挑战性(Baker等2012 ;Bradnam等2013; Li等2010 ;Marx 2013 ; Salzberg等2012;Treangen等2012)。以完全单倍型分辨率(resolut1n),从头测序和二倍体基因组的组装更加困难。第二,通过目前的测序技术可实现的精确度仍然相对较低(一千万中I个错误的一致性误差率是最佳报道(Peters等2012))。测序错误主要是由于测序化学的限制,其最多具有99.9%的原始测序序列精确度(即错误率是10—3),以及通过样品制备过程,尤其是通过DNA聚合酶的DNA扩增,引入的错误,所述DNA扩增通常的错误率不大于10-6。
单细胞从头基因组测序甚至更具有挑战性,因为当前的技术需要来自许多细胞(取决于平台,20-10,000个)等同物的DNA输入(Kalisky等2011)。但是,对单细胞的基因组测序的能力在基础生物医学研究中具有非常重要的应用,并且在临床实践中对基因组测序的应用甚至具有更大的影响(Kalisky等2011)。例如,这允许综合表征引起正常细胞分化和疾病,比如癌症的细胞异质性(Ma等2012 ;Navin等2011、Navin等2011、Potter等2013 ;Powell等2012),使用循环肿瘤细胞或细针活组织检查、突变检测而早期检测癌症(Lu等2012 ;Wang等2012),用于通过对在IVF诊所中植入之前从早期人胚胎提取的单细胞的全基因组测序而进行遗传筛选(Lorthongpanich等2013 ;Martin等2013; Zhang等2013)。在后者的情况下,仅仅一个或非常少几个细胞是可用的,并且测序和单倍型精确度是最重要的,因为结果将直接影响新生儿的生命。需要以最高的精确度鉴定母本和父本染色体的两个等位基因的遗传缺陷。
在从头单细胞基因组测序之前,可扩增基因组DNA。理想地,使用的方法以全覆盖和非常小的偏差从细胞扩增整个基因组。数种技术可用于该目的。常用的MDA(多重置换扩增)方法(Dean等2002 ;Lage等2003)通常导致非常大的覆盖偏差,具有多达四个数量级的变异,以及某些序列的频繁丢失。用于单细胞全基因组扩增的MALBAC(多次退火环状循环扩增,Multiple Annealing and Looping Based Amplificat1n Cycles)(Lu等2012;Zong等2012)和MIDAS(MIcrowell置换扩增系统)(GoIe等,Nature B1tech,印刷中)是较好的(Fan等2011、Gole等Nature B1tech.1n press、Zong等2012),但是就序列覆盖度和偏差以及扩增错误(突变和嵌合体的产生)而言,它们仍具有局限性,这是成问题的。这些导致不完全的组装、浪费以及更高的测序成本(高一个或多个数量级),原因是需要许多倍的覆盖度,以获取低丰度序列。许多突变和嵌合体也导致组装和测序错误(Lasken等2007 ;Voet等2013)。另夕卜,这些技术都未提供分辨单倍型的机制。
这些技术至少在概念上源自开创性的滚环扩增(RCA)技术(Lizardi等1998)。通过RCA扩增基本上是无错误的,因为通过滚环链置换机制,使用高保真DNA聚合酶,由单引物重复复制相同的初始环状DNA模板。我们已经开发了不依赖于序列和长度的线性DNA扩增的方法,其使用切割内切核酸酶介导的链置换扩增(nicking endonuclease-mediated stranddisplacement amplificat1n) (Joneja等2011)。使用切割内切核酸酶是不理想的,因为基因组中有许多识别序列。本文所述的长片段链置换扩增(Long Range StrandDisplacement Amplificat1n,LR-SDA)技术被设计,从而通过使用独特的机制来克服上述限制。LR-SDA与其他方法截然不同,因为从反应溶液中去除了游离引物并且在过程中不产生游离3’端,防止了嵌合体形成。LR-SDA能够实现在非常长的重叠片段中进行DNA的基本上无错误的扩增,其利于基因组序列的精确测序和单倍型分型(haplotyping)。
新一代的测序技术已经实现了以空前的高通量和精确度进行DNA测序,并且也已经大大降低了每个碱基的测序成本。需要的是下述能力:获取邻接信息以重新分型单倍型并且组装基因组,以及提高一致性测序序列精确度,达到可以以无错误地完全端对端组装对基因组测序的程度。

【发明内容】

本文提供了一种技术平台,其包括新方法和装置,用于以完全的单倍型分辨率和超高精确度对单细胞进行从头基因组测序。策略是用成对的邻接标签序列复制DNA区段,以实现确定地组装,和测序并且独立地组装相同DNA分子的两条链,以改提高精确度。该平台的核心部分是称为“标签序列化邻接复制(Barcoding Contiguity Replicat1n,BCR)''的技术。在BCR中,双链DNA分子的两条链均以区段被复制,并且区段与独特的邻接标签序列硬连接。不像之前的方法,复制不需要对初始DNA分子片段化或任何其他损伤。一旦具有标签序列的区段被测序,简单查找区段两端的成对的标签序列便允许确定地连接区段,从而分别组装每条链而不必依赖于重叠序列的比对。相同DNA分子的两条链的独立测序以及组装提供了冗余信息,用于纠正错误和填充缺口,显著改善了单倍型分辨的组装的质量和测序精确度。第二个技术是称为长片段链置换扩增(LR-SDA)的新方法,用于以全覆盖度和低偏差对单细胞进行无错误的全基因组扩增,其也不需要片段化或损伤初始DNA。由染色体的两条链复制的长重叠单链产物用于进给BCR测序管道(pipeline)。第三个有效的技术是微流体处理器,其被开发来使BCR和LR-SDA自动化,从而测序就绪(sequencing-ready)文库可由单细胞,或包含细胞或基因组材料,比如RNA或DNA的任何样品制备,用于使用现有高通量测序平台进行脱设备(off-device)测序。
本公开的方法能够实现具有任何长度的DNA区段的复制和在任何两个相邻区段的末端添加独特的标签序列对,而不片段化初始DNA分子。本公开的方法允许扩增基因组DNA的两条链以及随后由每条链区段复制具有邻接标签序列的扩增产物。标签序列允许以长片段或甚至100%邻接从头组装整个单独的DNA分子或染色体。因此,使用可提供足够的测序序列长度以对复制的区段以及区段两端的独特标签序列测序或可从每一片段两端和相邻部分测序的任何测序技术,本公开的方法能够实现对基因组和表观基因组的从头测序。
用于片段化DNA同时用成对的末端标签序列标记DNA的仅有的现有技术依赖于使用酶,尤其是转座酶来片段化和标记DNA( Steemers,F.等,“Linking sequence reads usingpaired code tags”,公开号WO 2012/061832 Al,【公开日】:2012年5月10日)。构建序列邻接的其他方法主要依赖于稀释DNA片段或分子,和随后比对测序的DNA片段或分子,这对于具有重复序列的二倍体基因组(例如人基因组)是成问题的,或者对于多倍体基因组(例如植物云杉)甚至是更有问题的。在本公开的方法中,初始DNA从不被片段化和损伤。相同的DNA分子可被使用多次和随后的表观基因组测序或其他方法。
本公开的方法提供了相对于现有技术的许多优势。(I)可以以用邻接信息标签序列化(barcoded)的区段复制初始DNA,而不用片段化或损伤初始DNA,并且该方法可重复多次。(2)两条链被独立地复制和标签序列化。因此,可独立地测序和组装双链DNA的两条链。这明显提高测序精确度和以长片段邻接或以整体对DNA分子或染色体测序的能力。(3)本公开的方法允许在对基因组测序之后以及基因组DNA已经被处理(例如通过焦亚硫酸氢盐(disulfite)处理)之后对表观基因组测序,以检测化学修饰。(4)本公开的方法能够实现靶DNA的线性扩增,而不片段化或损伤初始DNAJ5)本公开的方法对于从单细胞进行基因组和表观基因组测序是理想的。(6)公开的微流体设备能够实现方法的自动化。(7)本公开的方法能够制备DNA样品,包括扩增和测序文库构建,用于任何测序平台,包括Illumina HiSeq和MySeq平台、Life Technologies 1n Torrent平台、Pacific B1sciences SMRT平台、纳米孔测序以及可能出现的其他平台。(8)公开的具有聚合物屏障的微流体设备对于某些离子和分子(例如,Na+、核苷酸或短寡核苷酸)是选择性可渗透的,并且能够实现多步物理、化学和生物化学过程在仅仅一个或少数几个微流体室中进行。这样的微流体设备可用于例如重复变性、杂交、引物延伸和DNA合成,以及涉及多种试剂交换和洗涤的其他试验。
【附图说明】
图1.用于单细胞的从头基因组测序的BCR技术。其图解了一对同源亲本染色体如何被测序,其中单倍型被分辨。CBdPCB1,:具有互补序列的邻接标签序列对。每个复制的区段在3’和5’端具有两个标签序列。通过成对的标签序列给出了区段之间的连接性。例如,通过查找片段末端的标签序列并且将它们如下分选,可简单地组装父本染色体的顶链:--cb2—(CB2’一 CB5) —(CB5’一 CBs)—CBs’一等。在该例子中,BCR允许以完全的邻接组装两个亲本同源单倍染色体的四条单链,产生完全单倍型分辨率和高的每碱基测序精确度。示意图也图解了核酸的标签序列化邻接复制的一般程序以及如何将该方法应用至核酸测序。核酸包括双链脱氧核糖核酸(DNA)、核糖核酸(RNA)和DNA/RNA混合物,以及单链DNA和RNA。如果核酸是DNA,则DNA聚合酶用于复制靶分子。如果核酸是RNA,则逆转录酶用于复制靶分子。为了清楚起见,双链靶DNA (d sDNA)用于此处的图解。由邻接标签序列编码的双向引物用于阐释一般程序。详细程序需要下述步骤:I)使双链DNA分子变性,以分开两条互补链。2)使分开的链与具有标签序列的寡核苷酸引物池杂交,所述引物各自包含经通用连接体序列与独特的邻接标签序列连接的引物。具有标签序列引物的例子描述在图2中。3)使杂交引物延伸,以使用没有链置换能力的聚合酶复制靶DNA分子区段,以到达邻近下游引物的5’端。然后,将复制的片段的3’端连接至邻近下游具有标签序列的双向引物的5’端。4)使具有标签序列的复制的邻接DNA片段与初始靶DNA分开并且将其找回(retrieved)。如果需要,重复步骤2至步骤4期望的次数。组合所有的DNA片段并且使用高通量DNA测序平台测序。5)使用邻接标签序列(并且,如果需要,使用重叠序列)将序列组装成单独的单链DNA。使用来自两条单独的链的冗余序列纠正由于测序和复制错误而产生的错误。比对两条互补链,以重构整个初始DNA分子或基因组。
图2.邻接标签序列化引物和连接信息。该图阐释了邻接标签序列的两个设计实施例以及如何通过独特的标签序列对提供邻接连接信息的构思。(A)双向标签序列。(B)单向标签序列。每个邻接标签序列经连接体序列连接至引物。可也包括接头序列。每个邻接标签序列具有独特的序列,长度通常在6至30个碱基之间,这取决于具体的应用。提供标签序列,作为具有大量独特的不同序列的寡核苷酸池,所述独特的不同序列使用I至4个碱基(A、C、G和T,或其他核苷酸类似物)的混合物在沿着序列的每个位置被化学合成。标签序列总是成对出现,其由独特的序列和其反向互补序列组成。每个引物具有随机或半随机序列之一,所述随机或半随机序列也是使用I至4个碱基(A、C、G和T,或其他核苷酸类似物)的混合物在沿着序列的每个位置被化学合成。引物的长度可以不同,但是通常在6至20个碱基之间。(C).每对标签序列提供由靶分子复制的两个相邻DNA区段的连接信息。可通过匹配在每个区段两端的标签序列与具有反向互补标签序列的区段,简单地彼此连接复制的DNA区段。在该例子中,CBi ’和CBi邻接标签序列对将区段1-Ι连接至区段i,其接着通过CBj ’和CBj邻接标签序列对连接至区段i+1。
图3.具有成对标签序列的随机引物的合成。标签序列成对出现,每对由一条独特的序列和其反向互补序列组成。可在使用之前产生标签序列对,或可在BCR过程中复制互补的标签序列。(A)合成双向随机引物。可以化学合成所有的寡核苷酸。如所示,使所有的寡核苷酸杂交,以形成组装体。如下进行互补标签序列的复制和连接:1)与连接体杂交的序列用作引物,以通过DNA聚合酶合成反向互补标签序列;2)将延伸的产物连接至接头序列。(B)合成单向随机引物。在该情况下,将标签序列对之一连接至用于复制靶DNA的引物。在该例子中,连接体被设计为具有一段均聚物A碱基(例如30个A)。使引物(例如25个T)与用作DNA聚合酶弓I物的多聚腺甘酸段杂交。然后,通过DNA聚合酶来酶复制标签序列。然后,使用DNA连接酶(例如T4DNA连接酶)将复制的标签序列连接至接头序列。用于复制标签序列的连接体寡核苷酸可被设计为包含利于其随后去除的特征,例如,用于通过USER酶进行酶降解的若干dU。(C)合成具有发夹结构的邻接标签序列化双向引物。在该情况下,通过发夹结构连接互补的邻接标签序列对。发夹序列可用作接头。化学或酶可切割的碱基比如dU碱基可被加入到发夹序列的中间,用于随后化学或酶切割发夹结构。例如,在dU碱基处的切割可通USER酶实现。
图4.用于BCR的双向和单向方法。一般而言,优选添加接头和其他序列至标签序列化引物,以利于和简化下游处理,比如扩增和测序。(A)双向引物方法。每条随机引物由通过标签序列对保持在一起的两条序列以及其他序列,比如连接体和接头序列组成。引物用于使用没有任何链置换能力的DNA聚合酶复制DNA区段。然后,将每个复制的区段的3’端通过连接而连接至下游相邻区段的5’端。(B)单向引物方法。每条随机引物由仅仅一条序列组成并且经短的多聚T(例如25个T)连接至标签序列和其他序列。引物用于复制DNA。然后,末端脱氧核糖核苷酸转移酶(TdT)用于将短的多聚腺甘酸尾添加至复制片段的3’端。然后,多聚腺甘酸用作引物,以通过DNA聚合酶复制连接体。然后,连接体通过连接而被连接至标签序列。可选地,具有链置换能力的DNA聚合酶用于通过链置换DNA合成而复制连接体和标签序列。
图5.使用双向方法的BCR的例子。(A)由作为模板的phiX174ssDNA组成的模型系统用于进行BCR反应。双向(BP)引物由通过标签序列保持在一起的两个9-碱基序列和测序接头组成。一条寡核苷酸是34个碱基长,而另一条是37个碱基长。下游引物是30个碱基长,其5’被磷酸化。(B)引物与模板杂交。对于引物延伸DNA合成,使用T4DNA聚合酶如下进行反应:120C,1min; 20 °C,1min ;然后37 °C,2min。对于延伸加连接反应,然后,与T4DNA聚合酶一起添加T4DNA连接酶,并且在延伸合成之后,反应在20°C继续进行I小时。在由P1、BP和P2引物复制之后,由BP引物产生65碱基的片段(红色框)、由Pl产生143碱基的片段,和由P2产生长的产物。连接产生两个产物,Pl和BP之间的131碱基的片段,以及BP和P2之间的另一非常长的片段。(C)使用与BP引物并列的上游20碱基引物(连接I和连接2)以及BP引物的5’端部分(连接3)的简单连接。可观察到,产生了 57碱基的产物。BP引物比双向引物的单5 ’端部分更有效地连接。20mer跑出凝胶而未显示在凝胶上。
图6.回收产物的方法和多循环BCR。使用接头上的内置(built in)引物,通过简单的链置换DNA合成,从初始DNA分子剥离复制的片段。亲和性标签,比如生物素可被连接至接头引物,以通过亲和性捕获回收BCR产物同时留下初始DNA分子,用于另一轮的BCR。
图7.长片段链置换扩增(LR-SDA)的基本原理。该示意图阐释了称为长片段链置换扩增(LR-SDA)的方法,用于复制长DNA分子,而不用片段化或损伤初始DNA分子。整个过程需要下述步骤:I)使双链DNA分子变性,并且使随机引物以期望的平均间隔在控制条件下杂交至分离的ssDNA。通过使用适当浓度或适量的总引物来控制相邻的杂交引物之间的平均距离。距离可在100至2000个碱基之间,或,如果需要,则更长。2)在杂交的引物使用DNA聚合酶延伸短距离之后,去除过多的未杂交的引物。使用具有高持续合成能力和强链置换能力的DNA聚合酶或不同DNA聚合酶的组合,以重叠片段复制靶DNA。非常长的片段是期望的。平均长度可以是50,000个碱基或更多。3)将复制的长重叠DNA片段与初始DNA模板分开并且收集。这可通过使用变性剂(例如甲酰胺,KOH)或加热,或变性剂和加热二者,使双链区域变性而进行。随机引物可被设计为在5’端包含亲和性标签(例如生物素),以便所有复制的片段均携带亲和性标签。然后,通过亲和性捕获将片段与初始靶DNA分开。用于该目的的方法和设备描述在图8中。如果需要,LR-SDA法可重复期望的次数,并且所有的扩增产物可被组合。
图8.用于单细胞基因组和表观基因组测序的BCR工作流程和微流体处理器。左:工作流程。右上:具有流体通道(中心“I”线)和阀门以及阀门线(水平延伸线)的处理器的照片。右下:具有4个处理室的区域的图解。粗虚线:PDMS层上的流体通道。细黑线:另一PDMS层上的阀门和控制线。PBl至PB4:具有各种渗透性和表面功能的聚合物屏障。Cl至C4:处理室。El至E4:在结合PDMS层的玻璃或硅片上制备的电极。如显示的,该原型具有32个入口 /出口和4个处理室。根据需要,其可被扩展而包括另外的模块,比如流体动力学细胞陷阱(cell trap)模块和分馈(fract1nat1n)模块。
图9.通过电场和流体动力学流用于单细胞陷阱的微流体设备。(A)具有4个聚合物屏障的设备。(B)HeLa细胞的运输和捕获。(C)流体动力学单细胞陷阱。(D)在收缩通道(constrict1n channel)的开口处捕获单个HeLa细胞。(E)以稍微不同的尺寸捕获HeLa细胞。(F):使用有限元分析(finite element analysis)计算建模流体流(COMSOL)。大部分流体流线(streamline)被引导至捕获位点。一旦单细胞进入并且被捕获,流线则重定向至旁路路径。
图10.用于使用可渗透的聚合物屏障的多步骤处理的微流体设备。(Α)λ基因组DNA通过电场的快速捕获、释放和运输。释放DNA并且以一组速度(group velocity)运输,因为自由溶液(free-solut1n)中的DNA的电泳移动性是非长度依赖性的。(B)使用具有不同渗透性的聚合物操作核酸。使用不同浓度的PA (19:1丙烯酸酰胺:双)和PEG-DA:19%PA+1% PEG-DA、15 % PA+5 % PEG-DA和20 %PA+10% PEG-DA形成三种聚合物。30_mer寡核苷酸可通过19:1和15:5聚合物运输但是不能被20:10聚合物运输,而76-碱基tRNA可通过19:1聚合物运输但是不能被15:5和20:10聚合物运输。显示来自影片的快照。这表明30-mer可与76-mer tRNA分开。除了具有各种浓度和比例的丙烯酸酰胺单体和交联剂的聚丙烯酰胺类聚合物之外,可使用其他聚合物比如琼脂糖。可定制聚合物屏障的孔隙率或渗透率,以符合具体试验的要求。
图11.用于基因组测序的LR-SDA和BCR。该示意图阐释LR-SDA如何可用于从全基因组扩增基因组DNA,以产生长的重叠DNA片段,其然后用于BCR和基因组测序。
图12.用于表观基因组测序的BCR。该示意图阐释用于DNA的标签序列化邻接复制的一般程序,和该方法如何应用于表观基因组测序。该程序需要下述步骤:(I)使用如图1中描述的BCR方法对靶DNA/基因组测序并且组装。(2)根据任何标准方法,用亚硫酸氢盐处理初始靶DNA。亚硫酸氢盐处理将未甲基化的胞嘧啶(C)转化成尿嘧啶(U),同时甲基化的胞嘧啶(Cm)保持完整。(3)然后对亚硫酸氢盐处理的基因组DNA进行BCR并且使用高通量DNA测序平台对产物测序。使用邻接标签序列(并且,如果需要,使用重叠序列的比对)将序列组装成分开的单链DNA。使用冗余序列纠正由于测序和复制错误而导致的错误。比对两条互补链,以重建整个DNA分子或基因组。可通过使用来自两条单独的链的冗余信息,进行进一步的错误纠正。最后,通过比较亚硫酸氢盐处理的序列组装体与初始未处理的序列组装体,解码甲基化的C序列,或表观基因组序列。
发明详述
1.介绍
本公开解决了从头基因组测序中的三个主要挑战:I)单倍型分型和基因组组装、2)精确度和3)单细胞测序。BCR技术的关键构思阐释在图1中。首先,分离双链染色体DNA分子的两条链,并且使其与连接独特的邻接标签序列的随机引物池杂交。引物延伸,以复制初始DNA分子。然后,将每个复制的区段的3’端通过连接或其他机制连接至相邻区段的5’端。这样,区段与独特的成对连接性标签序列硬连接。一旦找回具有标签序列的区段并且使用高通量测序平台对其测序,那么简单查找在区段两端的成对标签序列允许确定地连接区段,从而分别组装每条链的整个序列,而不用依赖于重叠序列的比对。相同DNA分子的两条链的独立测序和组装提供了用于纠正错误和填充缺口的冗余信息,明显提高了单倍型分辨的组装的质量和测序精确度。
BCR技术固有地以非常低的样品输入(优选来自单细胞或少数几个细胞)而最佳地工作,因此对于单细胞的从头基因组测序是理想的,因为有限的输入使得对所有具有标签序列的区段进行测序从而不中断地端对端组装染色体的每条链所需的覆盖深度最小化。实践中,期望在一个反应中复制整个染色体而没有任何缺口是不切实际的,因为引物杂交潜在的低效和随机性。幸运地,初始DNA分子从不被片段化,从而可进行多轮BCR。至少,有足够的覆盖度来构建长片段支架序列(scaffold),以利于单倍型分辨的组装。考虑到这些,用我们的LR-SDA技术增强了 BCR方法,用于以全覆盖度和低偏差进行单细胞的基本上无错误的全基因组扩增。由染色体的两条链复制的长重叠单链产物可用于进给BCR测序管道,以提供大量原始测序读数。而且,我们不必排除使用序列比对,因为大部分序列可通过简单的比对而相对容易地被组装。
已经提议了成对的编码标记策略(Steemers等2012)。在提议的转座酶标记策略中,使用携带独特的成对标签序列标签的工程化的转座酶,将成对的编码标签插入基因组DNA中。基因组DNA被片段化或破坏。除了序列偏好的已知问题,还需要大量的输入材料(10,000或更多个细胞)。我们的BCR技术以根本不同和更理想的方式实施成对的编码标签策略。值得注意的是,其明显的优势是不用片段化初始DNA分子和低样品输入,其直接导致成本节省和更高质量的组装,因为找回具有成对的标签序列标签的片段需要的测序覆盖的深度明显降低。考虑到测序深度,找回具有成对的邻接标签序列的任何序列的概率与使用的细胞的数量或DNA分子的拷贝数成反比。
使用微流体处理器最佳实施BCR。本文公开了新的微流体技术,其使得下一代微流体设备成为可能(Lee等2013)。在微流体通道期望的位置制备具有分子光滑表面的选择性可渗透的聚合物屏障。可渗透的聚合物屏障允许通过电场快速操作细胞和生物分子,以及无缝(seamless)实施多步骤过程,比如单微流体室中的酶反应、洗涤、溶液交换和生物分子分离。也公开了整合的微流体平台,其用于使BCR和LR-SDA用于对单细胞进行从头基因组测序。也公开了在具有选择性可渗透的聚合物屏障的微流体设备中,使用聚合酶链式反应(等温),扩增DNA的方法。
I1.定义
除非另外定义,否则本文使用的技术和科学术语具有如本领域技术人员通常理解的相同意思。见,例如,Lackie,Dict1nary of Cell and Molecular B1logy,Elsevier(2007年第4片反);Sambrook等,Molecular Cloning ,A Laboratory Manual ,Cold Springs HarborPress(Cold Springs Harbor,NY 1989)。与本文所述的方法、设备和材料类似或等同的任何方法、设备和材料可用于本发明的实施。提供下述定义,以利于理解本文频繁使用的某些术语,而并不意味着限制本公开的范围。
模板多核苷酸是用作例如通过DNA或RNA聚合酶复制的模板的多核苷酸。模板多核苷酸可以是基因组RNA或DNA、质粒或任何来源的多核苷酸。模板多核苷酸可以是双链的或单链的。双链模板多核苷酸可在复制之前被变性。 如本文所使用,术语“复制”、“扩增”、“聚合”、“延伸”等术语是指制备至少一个拷贝的模板多核苷酸或其互补序列。单独的核苷酸被聚合而形成多核苷酸,通常经酶促。DNA和RNA聚合酶通常依赖于引物,并且使开始形成的多核苷酸链从杂交至模板多核苷酸的引物延伸。化学合成可也用于产生随机序列或期望序列的多核苷酸。
亲和性试剂(affinity reagent)指特异性结合其相关亲和性试剂并且可用于将与亲和性试剂连接的靶分子(例如,核酸)与非靶物质分离的任何试剂。例子包括生物素和链霉抗生物素、均聚物核酸(例如,多聚腺苷酸和多聚T序列段)、多聚组氨酸和镍、GST和谷胱甘肽、抗体和抗原(和其特异性结合片段)、受体和配体(和特其异性结合片段)等。
术语“特异性”、“特异性结合”和类似术语指这样的分子,所述分子(例如,多核苷酸或亲和性试剂)相比与非靶化合物结合,以至少2倍更大亲和性,例如,至少任意4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、25倍、50倍、或100倍更大的亲和性结合其靶。例如,相比与非靶序列结合,特异性结合给定靶序列的引物或亲和性试剂通常以至少2倍更大的亲和性结合靶序列。在多核苷酸的情况下,通过互补百分数和互补区域的长度确定特异性。
“标签序列邻接复制引物”或“BCR引物”指本文所述的单向或双向多核苷酸双链体。BCR弓丨物包括标签序列、一条或两条引物序列(分别针对单向或双向),任选的接头,和任选地连接要素的连接体序列。BCR引物可形成发夹。例如,在BCR引物“顶部”的链(例如,标签序列或接头链)可通过连接体连接。BCR引物在本文也指寡核苷酸对或双链体DNA组装体。
如本文所使用,术语“单向”指具有仅仅一条引物序列(即,在双链体DNA组装体的一条链上)的BCR引物。引物可具有待通过聚合酶延伸的游离3’端,或待连接从邻近BCR引物延伸的多核苷酸的游离5’端。“单向”可也指其中BCR引物的仅仅一条链被整合到延伸的多核苷酸中的方法。术语“双向”指具有两条引物序列的BCR引物,一条引物序列在双链体DNA组装体的一条链上。双向BCR引物因此具有待延伸的游离3 ’端,和用于连接延伸的多核苷酸的游离5’端。“双向”可也指其中BCR引物的两条链被整合到延伸的多肽中的方法。
术语“接头”指可用于分离,或作为扩增或测序引物的模板的已知序列。典型地,接头包括约4-50、8-20或10-25个核苷酸。接头可也连接至亲和性试剂。
术语“标签序列”指用于鉴别多核苷酸序列在模板多核苷酸上的相对位置的独特的多核苷酸序列(例如,4-25、10-22、5-15个核苷酸)。该术语可指单链多核苷酸的双链体,或双链体的任一单独的互补链。
“核酸”或“寡核苷酸”或“多核苷酸”指共价连接在一起的至少两个核苷酸。术语核苷酸通常指单体。寡核苷酸(例如,引物)的长度通常从约5、6、7、8、9、10、12、15、25、30、40、50或更多个核苷酸上至约100个核苷酸。核酸和多核苷酸是具有任何长度的聚合物,所述长度包括更长的长度,例如,200、300、500、1000、2000、3000、5000、7000、10,000 等。核酸一般包含磷酸二酯键,但是在一些情况下,包括核酸类似物,所述核酸类似物可具有交替的骨架,包括,例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚氨基磷酸酯(O-methylphophoroamidite)键(见Eckstein,01igonucleotides and Analogues: APractical Method,Oxford University Press);和肽核酸骨架和键。其他类似物核酸包括具有正骨架、非离子骨架和非核糖骨架的那些,包括美国专利号5,235,033和5,034,506以及ASC Symposium Series 580,Carbohydrate Modificat1ns in Antisense Research,Sanghui&Cook编辑,6和7章中描述的那些。包含一个或多个碳环糖的核酸也包括在核酸的一个定义中。可出于各种原因修饰核糖-磷酸骨架,例如,以增加这样的分子在生理学环境中或作为生物芯片上的探针的稳定性和半衰期。可制备天然存在的核酸和类似物的混合物,可选地,可制备不同核酸类似物的混合物,以及天然存在的核酸和类似物的混合物。
术语“探针”或“引物”或“引物序列”指与感兴趣的多核苷酸(例如,模板多核苷酸、接头等)杂交的一个或多个核酸片段。探针或引物可以具有任何长度,这取决于其将应用的具体的技术。例如,PCR引物,或用于启动聚合的引物通常长度是4-40或10-30个核苷酸,而核酸探针通常更长并且长度可大于100个核苷酸。探针或引物可以是未标记的或标记的(例如,用亲和性试剂或可检测的标签标记)。本领域技术人员可调整与靶向的多核苷酸杂交的引物或探针的长度和复杂性,以针对提供最佳杂交和针对给定杂交程序的信号产生,并且提供必要的分辨率和严格性。本领域技术人员将认识到,具体引物和探针的精确序列可在一定程度上被修饰,或不与靶向的多核苷酸完全互补,但是保持结合(例如,特异性杂交)至靶向的多核苷酸的能力。例如,可产生具有随机序列的引物,并且用于以比与已知序列100%互补的引物更低的严格性与未知的序列杂交。
“缺乏链置换活性”的核酸聚合酶指随着其沿着模板多核苷酸移动而基本上不能置换现有封阻链(blocking strand)的聚合酶。例子包括T4、T7、工程化的嗜热Phus1r^PQ5DNA聚合酶。本领域技术人员理解,术语“缺乏(lacking)”很少是绝对的,因此,缺乏链置换活性的聚合酶可在某些条件下以14-1O12例子中一个的概率置换封阻核苷酸。另一方面,具有链置换活性的核酸聚合酶随着其沿着模板多核苷酸移动而置换现有封阻链。例子包括BstDNA聚合酶(大片段)、Phi29DNA聚合酶和测序酶V2.0。
可渗透的聚合物屏障指这样的聚合物基质,所述聚合物基质通过简单的扩散或在电泳力下,对某些化学实体或分子是选择性可渗透的,但是对大分子是较不可渗透的或不可渗透的。例子是通过聚合19%丙烯酰胺单体和I %N,N’_亚甲基双丙烯酰胺交联单体产生的20%的聚丙烯酰胺的聚合凝胶基质。这样的聚合物对于小的无机和有机离子(例如,钠离子、氯化物离子、三(羟甲基)氨基甲烷、2-(N-吗啉代)乙磺酸离子)和小的聚合电解质(例如,6-20mer寡核苷酸)是可渗透的,但是对于大的生物分子,比如1000核苷酸长的DNA分子是非常不或几乎不可渗透的。聚合物通常通过聚合单体和交联剂产生。单体包括但不限于丙烯酰胺、丙烯酸、乳酸和它们的衍生物。交联剂包括但不限于N,N’_亚甲基双丙烯酰胺、具有各种长度(PEG-DA)的聚乙烯连接体的二丙烯酸酯和双丙烯酰胱胺。单体和交联剂也可以是包含官能团的衍生物,包括但不限于伯氨基(-冊2)、羧基(-C00H)、巯基(-SH)、叠氮基(-N3)、炔基、生物素、马来酰亚胺等。具有不同孔隙率或渗透率的聚合物屏障可由本领域技术人员通过改变单体和交联剂的浓度而制备。例如,可使用5 %、10 %、15 %、20 %、25 %、30 %、40%或更高浓度的聚丙烯酰胺,同时丙烯酰胺与双丙烯酰胺的比例的范围是从100:1、50:
1、40:1、30:1、25:1、20:1、10:1、5:1、1:1至0:1。
II1.BCR化学(BCR Chemistry)
如图1中阐释,BCR过程是相对直接的。要考虑的关键要素包括:(I)具有独特的邻接标签序列的引物的设计和合成、(2)基因组DNA的复制、(3)标签序列的连接或复制、(4)BCR产物的找回和测序和(5)使用成对的标签序列标签进行序列组装。
A.用邻接标签序列和BCR方法设计和合成引物
首先,标签序列的总数需要足以使每一标签序列对是独特的。假设以平均长度为600个碱基的区段复制的120亿碱基(1.2xl01()碱基)的二倍体人基因组(每个同源染色体对中4条链的几乎所有碱基),则待复制的区段的总数是2千万(2xl07)。如果我们提供一百万倍过量的标签序列,则需要的独特编码(code)的总数是2xl013(?30皮摩尔)。实践中,可能没必要使用如此大的过量。即使这样,该大量的独特编码可使用具有随机序列的22-碱基长的寡核苷酸编码(422 = 1.8xl013)。使用l-μ摩尔级(scale)的寡核苷酸合成,可非常便宜(〈$100)地产生上述量的30,000倍。具有随机序列的10至25-碱基长的寡核苷酸可用于编码标签序列。第二,具有随机序列的引物用于与靶DNA杂交,以进行复制。在大部分全基因组扩增策略,比如]\?从和00?-?0?(4?^8011等2008汀61611丨118等1992)中,长度是6至15个碱基的随机引物是常用的。我们的设计根据用于复制和标签序列连接的机制而受到限制。可通过许多方法设计和合成具有邻接标签序列的引物。两个设计实施例描绘在图2A和图2B中。图2C图解了如何通过邻接标签序列对提供连接信息。在该例子中,成对的标签序列CB1’和CB1提供了用于将复制区段1-Ι连接至复制区段i的物理连接信息,复制区段i进而又通过另一对标签序列CBj,和CBj连接至复制区段i+Ι。
可由本领域技术人员产生具有标签序列的引物。图3中示意性描述了用于合成引物的两种方法。可相对容易地合成具有邻接标签序列的引物。所有的寡核苷酸可被合成化学。通过酶DNA合成,使用与常用连接体序列杂交的常用引物,复制标签序列。来自3’端的两个或更多个碱基被设计为包含硫代磷酸酯,而不是通常的磷酸二酯键,以使它们抵抗通过DNA聚合酶的3’至5’核酸外切酶校正活性而导致的移除。可类似地设计接头序列。随机引物的长度的范围是6至12个碱基。虽然不是绝对必要的,但是可添加连接体和接头序列(例如Illumina接头),以利于下游处理。连接体序列可也用于指示或追踪DNA链。应理解,也可使用其他方法。
用于BCR的两种方法阐释在图4中。每种方法都具有优势和劣势。双向方法提供了实施上更大的的简单化。复制和连接可在一个步骤中进行。因为每条随机引物均由两条随机序列组成,总体引发序列的有效长度可能更长,并且两条序列不完美的杂交可能是问题。BCR化学的效率取决于引物设计、杂交过程和随后的酶反应。我们用该方法的初步研究显示了成功。另一方面,单向方法提供了较简单的引物设计。与MDA类似,6至9个碱基长的随机引物将有效发挥作用。25-至30-碱基长的多聚T可用作连接体。挑战是克服在通过TdT添加多聚腺甘酸尾以借助于DNA合成引发标签序列复制过程中的低效和变化。虽然通过TdT进行多核苷酸加尾是常用的技术,但是在3’-凹入端添加多核苷酸不是非常有效的方法,并且影响BCR化学的效率。可进一步优化和改善该化学的效率。应理解,其他方法可也用于实施BCR构思。
在BCR中,使用的DNA聚合酶不应具有任何链置换能力。许多聚合酶,包括嗜温T4和T7DNA聚合酶和工程化的嗜热Phus1n和Q5DNA聚合酶可用于该应用。偶然地,这些聚合酶具有3 ’ -5 ’校正活性和高保真度(错误率为?10—6,与phi29DNA聚合酶类似)。大部分DNA聚合酶和连接酶(例如T4DNA连接酶)可有效使用短至6个碱基的引物。
一种考虑是标签序列和接头序列是否明显改变引物的性能,比如杂交和酶的利用。为了研究该问题,由5.4kb单链环形phiX174病毒粒子DNA和连接至标签序列和接头序列的短寡核苷酸引物组成的简单的模型系统用于测试方法。如图5中显示,引物可有效被DNA聚合酶和DNA连接酶使用并且双向方法很有效。对于单向方法,如上面提到的,通过TdT添加多核苷酸不是如此有效。类似的简单模型系统可用于研究BCR化学的各种引物设计和酶反应。
B.产物回收和多循环BCR
可设计引物,以利于产物的简单回收。如图6中显示,使用phi29DNA聚合酶的简单的链置换反应将产物转化成dsDNA并且将其从模板剥离。然后通过连接在如本文所描述的微流体处理器的聚合物屏障表面上的链霉抗生物素捕获产物。一旦回收了产物,初始DNA被运输回来,用于另一轮的BCR。对单细胞进行两个循环或更多循环的BCR。目的是三重的:I)补偿由于引物杂交的随机性而导致的低效和变化,2)增加用于下游处理和测序的模板的数量,3)提供更多冗余,用于更高精确度。但是,考虑到测序覆盖的深度,循环数可限于数个循环(2-10),以使具有成对的标签序列的片段的回收最大化。
C.单细胞的全基因组BCR
可使用由合成寡核苷酸和短的DNA模板组成的简单模型系统,然后连续稀释phiX174ssDNA,来优化BCR化学。在该情况下,BCR化学的表征在IlluminaMySeq或其他高通量测序平台上需要少于单条带(lane)。各种引物设计和BCR化学可被非常广泛和便宜地表征。通过一组标准评估BCR化学的性能:I)沿着DNA分子的BCR片段的长度和位置分布,2)覆盖百分数,3)具有匹配的成对标签序列的片段的百分数,和(4)可通过成对的标签序列的简单的查找和分选而组装的重叠群(contig)的长度。一旦BCR化学被确认,利用微流体处理器,方案用于单个人细胞的全基因组BCR,在这第V和VI部分更详细描述。
D.BCR的概述
本文提供了复制模板多核苷酸的方法,其不片段化或损伤模板多核苷酸。在一些实施方式中,该方法包括(a)使模板多核苷酸与多个寡核苷酸对接触,其中每个寡核苷酸对的每个成员包括独特的标签序列,其与其在寡核苷酸对的另一成员上的互补序列杂交,并且其中寡核苷酸对之一或两者包括与模板多核苷酸杂交的引物序列,(b)使模板多核苷酸和多个寡核苷酸对与缺乏链置换活性的聚合酶和对于聚合必要的试剂接触,和(c)允许多核苷酸链从引物序列的3’端延伸,以产生延伸的多核苷酸,其包括标签序列、引物序列和与模板多核苷酸互补的序列,从而复制模板多核苷酸。在一些实施方式中,每个成员进一步包括接头序列,其任选地连接至亲和性试剂。在一些实施方式中,每个成员进一步包括至少一种连接体序列。在一些实施方式中,寡核苷酸对通过连接体连接,以在相对引物序列的端上形成发夹。在一些实施方式中,如果双向引物用于复制,则步骤(C)进一步包括通过酶或化学连接将延伸的多核苷酸连接至相邻的下游具有标签序列的引物,或者如果单向具有标签序列的引物用于复制,则通过添加短的均聚物多核苷酸,使用末端脱氧核糖核苷酸转移酶以引发在单向引物上的序列,并且使用DNA聚合酶合成互补的标签序列和接头序列,将延伸的多核苷酸连接至相邻的下游具有标签序列的引物。
在一些实施方式中,方法进一步包括(d)收集延伸的多核苷酸(例如,使用亲和性试剂或根据尺寸,例如使用如本文所描述的微流体设备)。在一些实施方式中,方法进一步包括
(e)对延伸的多核苷酸测序。在一些实施方式中,方法进一步包括(f)基于独特的标签序列组装延伸的多核苷酸的序列。
在一些实施方式中,方法进一步包括在步骤(a)之前,使模板多核苷酸变性。在一些实施方式中,方法进一步包括允许多个寡核苷酸对与模板多核苷酸杂交,并且在步骤(a)和
(b)之间洗掉未杂交的寡核苷酸对。 在一些实施方式中,模板多核苷酸是基因组DNA。在一些实施方式中,方法进一步包括检测基因组DNA上甲基化的或其他化学修饰的核苷酸。
在一些实施方式中,寡核苷酸对的两个成员均包括与模板多核苷酸杂交的引物序列。在一些实施方式中,寡核苷酸对的一个成员包括与模板多核苷酸杂交的引物序列。在一些实施方式中,引物序列是随机引物序列。本领域技术人员认识到,在使用随机引物的情况下,寡核苷酸对的仅仅一条引物序列将与模板多核苷酸杂交。在一些实施方式中,引物不是随机的,但是被设计为与模板上已知的序列杂交。
在一些实施方式中,接头序列与预定的引物序列互补(例如,用于检测、测序或扩增)。
IV.用于全基因组扩增的LR-SDA化学
[0056]LR-SDA技术被设计为通过使用独特机制克服用于单细胞的全基因组扩增的现有方法,包括之前描述的DOP-PCR、MDA、MALBAC和MIDAS,的许多限制。LR-SDA的基本原理阐释在图7中。首先,引物沿着ssDNA在单个事件中杂交。通过高保真DNA聚合酶,来自多个引物的长片段链置换导致多次扩增每条序列。已知,SDA是较不序列依赖性的,因此全基因组可非常均匀地被扩增。第二,由初始DNA分子复制长的线性s sDNA产物,从而不再传播由DNA聚合酶产生的错误(错误率是?1x10—6)。假设聚合酶错误是随机分布的,它们可使用冗余覆盖度度来纠正,导致基本上无错误的扩增(三重覆盖的一致性错误率〈10—18)。第三,因为不存在游离引物并且不产生游离3’端(产物仅仅具有游离的5’端),所以不产生嵌合体。第四,通过间隔随机引物和扩增时间,可在一定程度上控制产物的重叠覆盖和长度。基于我们使用环状DNA模板(相当于无限长的线性DNA)的经验,在I小时内可容易产生长达50至10kb的单链产物。如果引物以500个碱基的平均距离间隔开和平均产物长度是50,000个碱基,则实现100倍扩增。最后,因为初始DNA分子没有被片段化,因此,如果需要,可进行多循环的LR-SDA0
LR-SDA与其他方法的根本上不同在于从反应溶液去除了游离引物并且在过程中不产生游离3’端,防止了嵌合体形成。但是,为了确保随机引物的初始杂交,必须使用大量过量的引物。过多引物的去除对于实践上的实施是挑战。本文所述的具有聚合物屏障的微流体技术的开发部分受该复杂性的激发(Lee等2013)。利用这种突破的微流体技术,LR-SDA可实现单细胞全基因组扩增。引物设计是本领域已知的。而且,为了利于下游处理,亲和性标签(例如生物素)和任选的接头序列可连接至6至12个碱基长的随机引物,在3’端的最后两个碱基处具有抗内切核酸酶硫代磷酸二酯键。Phi29DNA聚合酶和/或测序酶V2.0可用于链置换合成。环状phiX174病毒粒子DNA模板可用作模型系统,以优化化学。可通过碱凝胶电泳和单分子拉伸(stretching)和成像初始分析LR-SDA产物。方案可用于单个人细胞的LR-SDA。可通过单分子拉伸和成像量化产物长度和分布。qPCR可用于分析随机选择的基因组的区域,以量化均勾性和覆盖度。LR-SDA可被开发为用于许多应用的单机(stand-alone)技术。在本文中,其用于通过实现无错误的全基因组扩增来强化BCR化学。关于使用微流体处理器的单细胞的全基因组LR-SDA的进一步的实验细节描述在V.3部分中。
本文提供了用于扩增模板多核苷酸的方法,其不片段化或损伤模板多核苷酸。在一些实施方式中,方法包括(a)使模板多核苷酸与多个引物接触,(b)使模板多核苷酸和多个引物与具有链置换活性的聚合酶和对于聚合必要的试剂接触,和(C)允许多核苷酸链从与模板多核苷酸杂交的多个引物中的至少一个多个引物的3’端延伸,以产生伸长的扩增产物,从而扩增模板多核苷酸。
在一些实施方式中,方法进一步包括在步骤(a)之前使模板多核苷酸变性。在一些实施方式中,方法进一步包括允许多个引物与模板多核苷酸杂交,并且在步骤(a)和(b)之间洗掉未杂交的引物。在一些实施方式中,步骤(C)包括允许延伸达预定的时间,以产生部分伸长的扩增产物,洗掉未杂交的引物,添加具有链置换活性的聚合酶和对于聚合必要的试剂,和允许延伸继续。
在一些实施方式中,引物是随机引物。在一些实施方式中,每条引物被连接至亲和性试剂。在一些实施方式中,方法进一步包括亲和纯化伸长的扩增产物。在一些实施方式中,方法进一步包括基于尺寸分离伸长的扩增产物(例如,使用如本文所描述的微流体设备、电泳或层析法)。在一些实施方式中,在通过亲和纯化或分离去除伸长的扩增产物之后重复步骤
(a)-(c)。在一些实施方式中,具有与模板上已知的序列杂交的序列的引物可用于选择性扩增。
V.实现单细胞基因组的从头测序的微流体平台
示例性BCR工作流程描述在图8中。使用全自动微流体处理器是理想的,为了如下若干原因:I)实现自动单细胞捕获和运输;2)通过降低表面与材料比,使样品损失最小化;3)通过使用小的反应体积,使反应效率最大化(Marcy等2007) ;4)实现不适宜或难以在管中进行的多步过程;5)消除由于操作人员而导致的差异;和6)加速过程和减少试剂和劳动力成本。可使用具有聚合物屏障的微流体处理器(图9和图10)(Lee等2013)。所有的过程可在单个处理器中进行,在扩增步骤之前不需要样品转移,实现了以无缝的和自动方式由单细胞快速、有效和可靠地制备测序就绪的文库。
A.微流体处理器:总体设计、制造和操作。
已经设计了具有聚合物屏障的原型微流体处理器,以使从单细胞捕获、LR-SDA和BCR、至IjPCR和测序文库制备的整体工作流程能够在单紧凑设备中进行。设备由载玻片(1x50x75mm3),和一个用于阀门和一个用于流体通道的两个聚二甲基娃氧烧(PDMS)层组成。制备阀门和通道层并且结合在一起,以及使用标准PDMS技术将其与载玻片结合(Lee等2013 ;Unger等2000)。如图8中阐释,在设备的中心是具有有期望的选择性渗透性和功能的聚合物屏障的4个处理室,能够使多步骤程序在单个微流体隔室中进行。可制备不同的聚合物微观结构,并且使用Lee等2013中报道的技术原位进一步官能化,以及任选地使用仅仅一个阀门或不用阀门而制备具有分子光滑表面的聚合物微观结构。例如,聚合物屏障I(PBl)可被设计为具有非常高的密度和高度交联的聚合物,其仅仅对于小的带电种类,比如离子和游离核苷酸是可渗透的,并且主要用于捕获和快速释放细胞和DNA,而PB2被设计为仅仅对于短的寡核苷酸(例如〈100碱基)是可渗透的,用于快速去除游离引物。PB3可用链霉抗生物素官能化,用于BCR产物回收,而PB4被设计为用于分馏等。通过化学或光化学启动的聚合,由在期望的位置使用阀门或其他机制捕获的单体溶液原位形成聚合物微观结构。作为单体的丙烯酰胺、双丙烯酰胺和聚乙烯二丙烯酸酯(PEG-DA)和交联剂的组合是有效的。通过改变单体和交联剂的浓度调整聚合物的渗透率。高密度聚合物通常由40 %丙烯酰胺、2 %双丙烯酰胺和20%PEG-DA形成。PEG-DA用于在屏障的表面上暴露PEG部分,以防止非特异性结合和表面污垢。这样的高密度聚合物的孔尺寸是数纳米级别的或更小,对小离子仍是可渗透的,但是实际上对于更短的寡核苷酸不可渗透。通过水溶液和Ar气体之间的界面形成聚合物,产生分子光滑的表面。更小的孔尺寸和光滑表面对于防止DNA分子的捕获、最小化样品损失是重要的。因此,为了快速捕获和有效释放DNA,使用具有PEG连接体的高密度聚合物。我们也证明I )20-30%的聚合物通常对于去除短的引物和多达100个碱基长的寡核苷酸是有效的,和2)10-20%的聚合物块(polymer plugs)对于分馈和尺寸选择是理想的。取决于应用,可使用各种浓度的其他聚合物,和各种比例的交联剂。各种表面涂层(例如,具有生物素、短寡核苷酸、PEG部分、伯胺基团等)可用于减少非特异性结合,或参与官能团的亲和性捕获或添加。
为了施加电场或电势,将Pt电线插入流体流动槽(f 1wce11)的入口 /出口,并且跨过选择性电极对施加期望的电势。也可设计电极(PtSAu)并且在处理器的玻璃基板上制作,与我们常规用于细胞、微珠和生物分子的芯片上的电场操作类似(Barbee等2009 !Barbee等2010; Hsiao等2010)。对于温度控制和快速热循环,可使用经计算机和定制软件控制的具有Pel tier热电设备的高性能定制装置(Barbee等2011)。使用一组电磁阀(solenoid valve)和定制的电子系统以及软件包装,通过气压驱动PDMS阀门致动和流体流动。软件和硬件可升级,以包括更多的电磁阀,以致动整个过程。另外,为了简化微流体处理器的操作,可构建平台,其中预先配置的流体(管连接)和电子(电接触)与处理器相互作用(interface),以允许设备可靠的装载和操作。设备可进一步扩展,以根据需要包括另外的模块,比如流体动力学细胞陷阱模块和分馏以及样品回收模块。微流体设备可由塑料、玻璃、硅、金属或其他非PDMS弹性体或柔性聚合物制作。
B.使用聚合物屏障的单细胞捕获和多步骤处理。
我们已经证实了使用电场和流体动力学单细胞捕获快速运输和捕获细胞的能力(图9)(Lee等2013)。为了简单,电场可用于捕获单细胞。流体动力学单细胞陷阱可也并入设备中,以易于自动化,因为适当设计的陷阱确保了接近100%有效的单细胞捕获以及允许去除无细胞DNA。我们也已经证明了多步骤方法可在单个室中进行,以及带电的生物分子的电泳运输而不用溶液流动(图9)。可通过使用聚合物凝胶块的电泳进行DNA分馏。
通过使溶液流过或流入室中进行洗涤和溶液交换,同时通过电场使DNA分子保持在高密度聚合物的表面上,除非另外指明。在任何反应之前,简单地通过反转电场,使DNA分子从表面释放至室的中心。所有的阀门根据需要保持打开或闭合。
为了更好地理解其如何工作,如下详细描述大体过程。图8中显示的双向方法(图4)和处理器用于阐释该方法。(I)使用电场将单细胞捕获在室Cl中。当保持电场时,使裂解液和DNA变性溶液(例如200mMK0H+20mMEDTA+l %SDS)流入室中,以裂解细胞和使双链染色体DNA分子分离。通过快速洗涤去除裂解液和细胞碎片,同时在室中保持电场。(2)使BCR引物流入室中,并且通过在期望的温度(例如12°C)孵育允许其与ssDNA杂交。任选地,可在低温(例如O0C )使用室C2中的PB2经电泳去除过多的引物。(3)使包含dNTP ’ s、ATP和DNA聚合酶和连接酶(例如T4DNA聚合酶和连接酶)的反应混合物流入室中,以使用期望的温度曲线(例如,在4°C、12°C、25°C、然后37°C各自2分钟,用于合成,和在22°C 15分钟,用于连接)进行BCR反应。
(4)快速洗涤之后,使包含phi29DNA聚合酶和dNTP’s的缓冲液流入室中,以进行链置换合成,以从初始DNA模板剥离产物。(5)通过使用电极EI和E3转移DNA分子,将生物素化的BCR产物捕获在共价连接至聚合物(PB3)表面的链霉抗生物素上。然后,将初始染色体DNA分子转移回到室Cl,用于其他轮的BCR反应。(6)混合所有的BCR产物并且通过PCR使用室C3中的Illumina测序引物扩增。(7)使用室C4中的PB4去除过多的PCR引物,然后使用常规的流体流动或电泳转移来找回。使用IlluminaMySeq或H1-Seq系统,或其他高通量测序平台,比如Pacific B1sciences ’ SMRT,1n Torrent Proton Systems(离子激流质子系统)和454/Roche Pyrosequencer,对文库测序。
C.微流体设备的概述
本文提供了用于进行需要试剂交换、洗涤等的多步方法的微流体设备。在一些实施方式中,微流体设备包括(a)至少一个室,(b)与至少一个室可操作地连接的多个流体通道,(C)至少一个聚合物屏障,其将至少一个室的内部与(i)多个流体通道之一以及(ii)被配置为在流体通道和室中产生电场的电极分离,其中至少一个室包括至少一个阀门,每个阀门将至少一个室的内部与未通过聚合物屏障与至少一个室分开的多个流体通道中的一个分开。聚合物屏障是半渗透性的(例如,对于离子或核苷酸单体),并且被设计为具有尺寸截止,从而当电极在(b)(i)和室中的流体通道中产生电场时,大于尺寸截止的核酸保留在至少一个室中。
在一些实施方式中,微流体设备由载片(例如,玻璃或塑料)、包围流体通道的聚合物层和包围至少一个室的聚合物层形成。在一些实施方式中,聚合物是PDMS(聚二甲基硅氧烷)。
在一些实施方式中,微流体设备包括2-100个室,例如,2、3、4、5、6、7、8、9、10或更多个室,其每个具有至少一个聚合物屏障和至少一个阀门。在一些实施方式中,微流体设备包括至少一个不包括聚合物屏障的另外的室。
在一些实施方式中,独立地选择每个室中聚合物屏障的尺寸截止。在一些实施方式中,至少一个聚合物屏障的尺寸截止在电极在流体通道和室中产生电场时保留所有核酸。在一些实施方式中,至少一个聚合物屏障的尺寸截止保留大于30个核苷酸的核酸。在一些实施方式中,至少一个聚合物屏障的尺寸截止保留大于100个核苷酸的核酸。在一些实施方式中,至少一个聚合物屏障的尺寸截止保留大于500个核苷酸的核酸。
在一些实施方式中,至少一个聚合物屏障包括丙烯酰胺、双丙烯酰胺和PEG-DA。在一些实施方式中,至少一个聚合物屏障被涂布以亲和性试剂。
进一步提供了包括4_108(例如,100-106)个微流体设备的微流体阵列。
D.单细胞的全基因组LR-SDA
这需要若干步骤。(I):如上述进行细胞捕获和DNA变性。(2)使随机引物流入室中,并且通过在期望的温度或温度曲线(例如12°C或30至4°C )孵育允许其与ssDNA杂交。(3)允许缓冲液中包含DNA聚合酶(例如T4DNA Po I)和dNTP ’ s的反应混合物流入室中,并且在低温(例如4-12°C)孵育短时间段,以使引物延伸短的距离,(4)使用室C2中的PB2在低温(例如0-40C )经电泳去除过多的引物。(5)使包含DNA聚合酶和dNTP’s的新的反应混合物流入室中,以在30-32°C进行LR-SDA。(5)通过在50至200mM K0H/20mM EDTA中流动使LR-SDA分子与初始DNA分子分离;(6)通过使用电极El和E3转移DNA分子,将生物素化的BCR产物捕获在与聚合物(PB3)的表面共价连接的链霉抗生物素上。然后,将初始染色体DNA分子转移回到室Cl,用于其他轮的LR-SDA反应或其他方法。(7)然后,在室C3中对LR-SDA产物进行BCR反应,随后在室C4中进行PCR扩增,并且如上述测序。图11中阐释了使用LR-SDA预扩增DNA,用于随后BCR和基因组测序。如果BCR未被整合至该方法中,则LR-SDA产物可被找回,用于随后的处理和应用。相同的方法可用于从大于一个细胞或病毒粒子扩增基因组材料。 本文提供了使用如本文所描述的具有选择性可渗透的聚合物屏障的流体设备,用于扩增(例如,等温或多温度扩增)多核苷酸的方法。在一些实施方式中,该方法包括:(a)将靶多核苷酸捕获在聚合物屏障的表面上,(b)使捕获的多核苷酸在变性条件下,例如在存在20mM至200mM的氢氧化钾或SM尿素的情况下,与引物对接触,(c)通过用适于杂交的缓冲液替换变性化学物质使引物与模板杂交,同时多核苷酸模板和引物通过电场保留在聚合物表面上,(d)使引发的模板多核苷酸与聚合酶和对于聚合必要的试剂接触,(e)允许多核苷酸链从引物序列的3’端延伸至多核苷酸模板的末端,和根据需要多次(f)重复(a)至(e),以扩增模板多核苷酸。在一些实施方式中,多个引物对用于扩增多个模板多核苷酸。在一些实施方式中,使用的DNA聚合酶具有强的链置换能力和防错误读取能力。在一些实施方式中,靶多核苷酸长度的范围是50碱基至100,000碱基(例如,50-200、100-500、50-1000)或更长。
E.单细胞的从头基因组测序
我们已经使用HeLa细胞作为开发我们的单细胞微流体技术的模型。使用F粘粒文库,已经以长片段单倍型分辨率对HeLa细胞的基因组进行测序(Adey等2013)。也可使用EBV转化的类淋巴母细胞细胞系GM2043 I,并且其已经使用多个平台被测序,包括Comp IeteGenomics的标准短测序序列和LFR(Drmanac等;Peters等2012)、对外显子组和BAC克隆的Illumina SBS短测序序列(Lo等2013;Peters等2012)。其他测序细胞类型可也用于测试。本公开的方法可用于对任何类型的遗传物质(例如,病毒或细胞遗传物质)测序。
V1.用于单细胞从头表观基因组测序的BCR和LR-SDA
由于BCR技术若干非常独特的特征,其对于单细胞表观基因组(例如,甲基化组)测序是理想的。首先,在该过程中,初始DNA分子从不被损伤或片段化。如之前描述的,可首先获得具有高精确度和单倍型分辨率的基因组序列。这用作组装甲基化组或表观基因组的蓝本或参考。然后,具有化学修饰碱基的初始DNA分子用于表观基因组测序。DNA损伤和片段化是与亚硫酸氢盐处理DNA相关的最常见问题。在没有来自相同细胞的相同基因组作为参考的情况下,重建表观基因组是不可行的。本文公开的方法避免了该问题。第二,因为独立地复制、测序和组装两条链,冗余信息可用于纠正由于化学转换过程中的任何低效导致的错误。第三,通过使用LR-SDA预先扩增初始的和转换的DNA,可明显改善序列覆盖度。图12中阐释了基本概念。
本文提供了对化学修饰的多核苷酸测序的方法,包括:(a)在不片段化或损伤初始修饰的多核苷酸的情况下,通过BCR复制修饰的多核苷酸,(b)对BCR产物测序和组装多核苷酸的序列,而不需要有关对碱基的化学修饰的信息,(c)通过化学或酶方式转化多核苷酸中修饰的碱基,例如通过用亚硫酸氢盐和其他化学物质处理,以将未甲基化的C(胞嘧啶)碱基转化成U(尿嘧啶)碱基,或用甲基化敏感的限制性内切核酸酶处理,(d)复制和测序转化的多核苷酸,(e)通过比对转化的序列与(b)中测定的参考序列,用有关修饰碱基的信息确定初始修饰的多核苷酸的序列。在一些实施方式中,待确定的修饰的碱基是甲基化的或羟甲基化的胞嘧啶碱基。
本文所述的实施例和实施方式是仅仅为了示意性目的并且本领域技术人员可想到其各种修饰或改变,并且这些包括在本申请的精神和范围内以及所附的权利要求的范围内。本文引用的所有的申请、专利、专利申请和数据库实体通过引用以它们的整体为了所有的目的而并入本文。 VI1.应用
本公开能够实现下述方法和装置。
1.一种方法,其称为“标签序列邻接复制” (BCR),用于复制具有邻接标签序列的核酸,而不用片段化或损伤初始核酸分子。
2.BCR方法提供复制的DNA序列的物理连接性信息,以简化序列组装,而不需要大量的计算,其中通过简单的查找和排序测序的DNA区段上的邻接标签序列而连接或组装序列。
3.包括两个短的核酸(或类似物)序列的双向BCR引物,每个序列连接至一对标签序列之一,所述一对标签序列是互补的并且形成双链体DNA组装体,其中两个短的核酸序列是随机的或对靶序列是特异性的。
4.包括短的核酸(或类似物)的单向BCR引物,所述短的核酸(或类似物)连接至一对标签序列之一,所述一对标签序列是互补的并且形成双链体DNA组装体。
5.单向BCR引物,其包括连接至标签序列的短的核酸(或类似物),和任选地其他连接体和接头序列。
6.双向引物的双链体组装体,每条链独立地包括用于下游处理,包括回收BCR产物、扩增和测序的序列或元件。
7.用于BCR引物的标签序列,包括DNA和/或RNA和/或核酸类似物序列,其长度是4、5、6、
7、8、9、10、11、12、13、14、15、16、17、18、19、20 碱基或更长。
8.用于作为BCR引物双链体一部分与靶序列(例如,模板多核苷酸)杂交的核酸序列,其中核酸包括DNA和/或RNA和/或核酸类似物,其长度是4、5、6、7、8、9、10、11、12、4_25、10-30个碱基或更长。
9.具有独特的标签序列的BCR引物池,其具有等摩尔比的11-1O5、15-1O50,12-1O20,105-101Q、101Q-102Q、12q-1O25或更多独特的序列或的分子种类。
10.具有独特标签序列的BCR引物池,其具有限定摩尔比的1l-1O^lO5-1O5tMO2-1O'105-101Q、101Q-102Q、12q-1O25或更多的独特序列或分子种类。
11.通过化学和酶合成构建BCR引物的方法,其中互补的标签序列通过酶DNA合成来复制,随后进行连接。
12.不需要片段化或损伤初始分子的用于核酸区段的BCR的单向方法,其中单链靶分子与单向引物杂交并且使用DNA聚合酶或没有任何链置换能力的聚合酶以区段进行复制;通过末端脱氧核糖核苷酸转移酶用均聚物尾部(例如6_20T’s)延伸每个复制的片段的3’端;并且与均聚物尾部互补的序列用于从邻近的下游引物引发互补的标签序列的合成。
13.不需要片段化或损伤初始分子的用于核酸区段的BCR的双向方法,其中具有标签序列的单链靶分子与双向引物杂交并且使用DNA聚合酶或没有任何链置换能力的聚合酶以区段复制,然后使用DNA或RNA连接酶将每个复制片段的3’端连接至邻近下游双向引物的5’端。
14.不要片段化或损伤初始分子的用于核酸区段的BCR的双向方法,其中具有标签序列的单链靶分子与双向引物杂交并且中使用DNA聚合酶或没有任何链置换能力的聚合酶以区段复制,然后通过化学反应比如点击化学(例如商业上可得自Jena B1science或LifeTechnologies的试剂盒)或硫碘代亲核置换将每个复制片段的3’端连接至邻近下游双向引物的5’ 端(见,例如,Montanari等(1993) J.0rg.Chem.58:5628)。 15.通过链置换合成使用来自连接至BCR引物的双链体组装体的引物,回收BCR产物的方法。
16.用于多循环BCR的方法,其中对相同的靶DNA或RNA分子进行多轮BCR。
17.—种方法,其称为“长片段链置换(LR-SDA)”,用于以均匀覆盖度基本上无错误地扩增DNA,其中分离的单链DNA分子与随机的或半随机引物杂交并且使用DNA聚合酶或具有强的链置换能力和高的持续合成能力的聚合酶通过长片段链置换DNA合成进行复制,以产生非常长的重叠单链DNA片段。
18.LR-SD方法,其中随机引物包括DNA和/或RNA和/或核酸类似物序列,其长度为4、5、6、7、8、9、10、11、12、4-20、10-30、15-30 个碱基或更长。
19.LR-SD方法,其中随机引物由DNA和/或RNA和它们的类似物序列组成,其长度为4、5、
6、7、8、9、10、11、12、4-20、10-30、15-30个碱基或更长,其连接至接头序列,用于下游处理比如亲和性捕获、扩增和测序。
20.LR-SD方法,其中在杂交的随机引物已经被延伸短的距离,例如约20、10-200、约30、40、50、10-50、51-100、101-200、50-500个碱基或更长之后,去除游离引物。
21.LR-SD方法,其中通过在控制条件下杂交引物,引物间隔的平均距离是20-50、50-500、51-100、101-200、201-500、501-1000、1001-10,000、10,001-100,000个碱基或更长。
22.LR-SD方法,其中扩增的单链分子的平均长度是50-1000、100-1000、1001-2000、2001-5000、5001-10,000、100001-100,000个碱基或更长。
23.LR-SD方法,其中通过使用与亲和性标签比如生物素连接的引物回收扩增的分子,并且通过亲和性捕获捕获标记的扩增分子,例如,通过抗生物素蛋白捕获生物素化的分子。
24.多循环LR-SD方法,其中对相同的靶DNA分子进行多轮LR-SDA。
25.来自LR-SDA的单链产物在BCR和随后测序中的用途。
26.具有聚合物屏障的微流体处理器,用于操作细胞和生物分子。
27.具有聚合物屏障的微流体处理器,用于在单个或若干微流体室中的多步骤处理,包括酶反应、生物分子捕获和分离。
28.微流体处理器,能够实现自动单细胞捕获、DNA提取和复制/扩增,以及测序文库构建,用于单细胞的基因组和表观基因组测序。
29.用于单细胞的表观基因组测序的方法和设备,其中首先测序基因组并且使用BCR或LR-SDA/BCR方法组装,然后用亚硫酸氢盐处理初始DNA分子并且对处理的DNA分子测序,以及使用BCR或LR-SDA/BCR方法组装。
30.用于单细胞的从头基因组和甲基化组测序的方法和装置,其中捕获单细胞并且使用BCR或LR-SDA/BCR方法测序。
31.用于单倍型分辨率的方法,其中通过BCR独立地复制、测序和组装来自双链染色体对的个体链。
32.用于基因组测序中错误纠正的方法,用于精确的基因组测序,其中独立地分开双链DNA分子的两条链、对其复制、测序和组装,并且来自互补链的冗余信息用于错误纠正,明显改善单倍型和测序精确度。
引用的参考文献
Adey,A,Burton,JN,Kitzman,JO,Hiatt,JB,Lewis,AP,Martin,BK,Qiu,RL,Lee,C andShendure,J.2013.The haplotype-resolved genome and epigenome of the aneuploidHeLa cancer cell line.Nature 500:207-+.Arneson,N,Hughes,S,Houlston,R and Done,S.2008.Whole-Genome Amplificat1nby Degenerate Oligonucleotide Primed PCR(DOP-PCR).CSH Protoc 2008:pdbprot4919.Baday,M,Hastie,A,Cravens,A,Kudeki,DEjXiaojM and Selvin,P.2012.AdvanceHigh Resolut1n DNA Mapping Technique to Identify GenomicVariat1ns.B1physical Journal 102:420a_420a.Baker,S,Joecker,A,Church,G,Snyder,M,West,J,Salzberg,S,Worthey,E,Smith,T,WangjJ and Reid,JG.2012.Genome interpretat1n and assembly-recent progressand next steps.Nat B1technol 30:1081-1083.Barbee,KD,Chandrangsu,M and Huang,X.2011.Fabricat1n of DNA polymer brusharrays by destructive micropatterning and rolling—circleampIificat1n.MacromoI B1scill:607-617.Barbee,KD,Hsiao,AP,Heller,MJ and Huang,X.2009.Electric field directedassembly of high-density microbead arrays.Lab Chip 9:3268-3274.Barbee,KD,Hsiao,AP,Ro IIer,EE and Huang,X.2010.Multiplexed proteindetect1n using antibody-conjugated microbead arrays in a microfabricatedelectrophoretic device.Lab Chip 10:3084-3093.Bradnam,KR,Fass,JN, Alexandrov, A,Baranay,P,Bechner,M, BiroI,I,Boisvert,S,Chapman,JA,Chapuis,G,Chikhi,R et al.2013.Assemblathon 2:evaluating de novomethods of genome assembly in three vertebrate species.Gigascience 2:10.Branton,D,Deamer,DW,MarziaIi,A,BayIey,H,Benner,SA,ButIer,T,Di VentrajMjGaraj,S,Hibbs,A,Huang,X et al.2008.The potential and challenges of nanoporesequencing.Nat B1technol 26:1146-1153.Campbe 11,PJ,Stephens,PJ,Pleasance,ED,0’ Meara,S,Li,H,Santarius,T,Stebbings,LA,Leroy,C,Edkins,S,Hardy,C et al.2008.1dentificat1n ofsomatically acquired rearrangements in cancer using genome-wide massivelyparallel paired—end sequencing.Nature Genetics 40:722-729.Carnevali,P,Baccash,J,Halpern,AL, Nazarenko,I,Ni I sen,GB,Pant,KP,Ebert,JC,Brownley,A,Morenzoni,M,Karpinchyk,V et al.2011.Computat1nal techniques forhuman genome resequencing using mated gapped reads.J Comput B1l 19:279-292.Cherf,GM,Lieberman,KR,Rashid,H,Lam,CE,Karplus,K and Akeson,M.2012.Automated forward and reverse ratcheting of DNA in a nanopore at 5-Aprecis1n.Nat B1technol 30:344-348.Clarke,J,Wu,HC,Jayasinghe,L,PateI,AjReidjS and Bayley,H.2009.Continuousbase identificat1n for singIe—mo I ecuIe nanopore DNA sequencing.NatNanotechnol 4:265-270.Dean,FB,Hosono,S,Fang,LjWujXjFaruqi,AF,Bray-Ward,P,Sun,Z,Zong,Q,Du,Y,Du,Jet al.2002.Comprehensive human genome amplificat1n using multipledisplacement ampIificat1n.Proc Natl Acad Sci USA 99:5261-5266.Dong,Y,Xie,M,Jiang,Y,Xiao,NQ,Du,XY,Zhang,WG,Tosser-Klopp,G,Wang,JH,Yang,SjLiangjJ et al.2013.Sequencing and automated whole-genome optical mapping ofthe genome of a domestic goat(Capra hircus).Nature B1technology 31:135-141.Drmanac,R,Sparks,AB,Callow,MJ,Halpern,AL,Burns,NL,Kermani,BG,Carnevali,P,Nazarenko,I,Nilsen,GB,Yeung,G et al.2009.Human genome sequencing usingunchained base reads on self-assembling DNA nanoarrays.Science327:78-81.Fan,HC,Wang,J,Potanina,A and Quake , SR.2011.Whole-genome molecularhaplotyping of single cells.Nature b1technology 29:51-57.Gole,JjGore,AjRichardsjAjChiujY-JjFungjH-LjBushmanjDjChiangjH-1, Chun,J,Lo,Y-H and ZhangjK-Nature B1tech.1n press.Massively parallel polymerasecloning and genome sequencing of single cells using nano litermicrowells.Nature B1technology
Hastie,AR,Dong,LL,Smith,A,Finklestein,J,Lam,ET,Huo,NX,Cao,H,Kwok,PY,Deal,KRjDvorakjJ et al.2013.Rapid Genome Mapping in Nanochannel Arrays for HighlyComplete and Accurate De Novo Sequence Assembly of the Complex Aegilopstauschii Genome.PLoS One 8:
Hsiao,AP,Barbee ,KD and Huang,X.2010.Microfluidic Device for Capture andIsolat1n of Single Cells.Proc Soc Photo Opt Instrum Eng 7759:
Joneja,A and Huang,X.2011.Linear nicking endonuclease-mediated strand—displacement DNA amplificat1n.Anal B1chem 414:58-69.KaliskyjTjBlaineyjP and Quake,SR.2011.Genomic Analysis at the Single-CellLevel.Annual Review Genetics,Vol 45 45:431-445.KaliskyjT and Quake , SR.2011.Single-cell genomics.Nature Methods 8:311 —
314.Karow,J.(2013),In Sequence.Genomeffeb.Kitzman,JO,Mackenzie,AP,Adey,A,Hiatt,JB,Patwardhan,RP,Sudmant,PH,Ng,SB,Alkan,C,Qiu,R,Eichler,EE et al.2011.Haplotype-resolved genome sequencing of aGujarati Indian individual.Nature b1technology 29:59-63.Kumar,S,Tao,C,Chien,M,Hellner,B,BalijepalIi,A,Robertson,Jff,Li,ZjRussojJJjReiner,JE,Kasianowicz,JJ et al.2012.PEG-1abeled nucleotides and nanoporedetect1n for single molecule DNA sequencing by synthesis.Sci Rep 2:684.Lage,JM,Leamon,JH,Pejovic,T,Hamann,S,Lacey,M,Dillon,D,Segraves,R,VossbrinckjBjGonzalez,AjPinkel,D et al.2003.Whole genome analysis of geneticalterat1ns in small DNA samples using hyperbranched strand displacementamplificat1n and array-CGH.Genome Res 13:294-307.Lam,ET,Hastie,A,Lin,C,Ehrlich,D,Das,SK,Austin,MD,Deshpande,P,Cao,H,Nagarajan,NjXiao,M et al.2012.Genome mapping on nanochannel arrays forstructural variat1n analysis and sequence assembly.Nature B1technology 30:771-776.LaskenjRS.2013.Single-cell sequencing in its prime.Nature B1technology31:211-212.LaskenjRS and Stockwell,TB.2007.Mechanism of chimera format1n during theMultiple Displacement Amplificat1n react1n.BMC B1technol 7:19.Lee,HS,Chu,WK,Zhang,K and Huang,X.2013.Microfluidic devices withpermeable polymer barriers for capture and transport of b1molecules andcells.Lab Chip 13:3389-3397.Li,RQ,Zhu,HM,Ruan,J,Qian,WB,Fang,XD,Shi,ZB,Li,YR,Li,ST,Shan,G,Kristiansen,K et al.2010.De novo assembly of human genomes with massivelyparallel short read sequencing.Genome Research 20:265-272.Lizardi,PM,Huang,X,Zhu,Z,Bray-ffard,P,Thomas,DC and Ward,DC.1998.Mutat1ndetect1n and singIe—mo I ecuIe counting using isothermal rolling—circleampIificat1n.Nat Genet 19:225-232.Lo,C,Liu,R,Lee,J,Robasky,K,Byrne,SjLucchesi,C,Aach,J,Church,G,Bafna,V andZhangjK.2013.0n the design of clone-based haplotyping.Genome b1logy 14:R100.Lorthongpanich,C,Cheow,LF,Balu,S,Quake,SR,Knowles,BB,Burkholder,WF,SolterjD and Messerschmidt,DM.2013.Single-Ce11 DNA-Methylat1n AnalysisReveals Epigenetic Chimerism in Preimplantat1n Embryos.Science 341:1110—1112.Lu,SJ,Zong,CH,Fan,W,Yang,MY,Li,JS,Chapman,AR,Zhu,P,Hu,XS,Xu,LY,Yan,LY etal.2012.Probing Me1tic Recombinat1n and Aneuploidy of Single Sperm Cells byWhole-Genome Sequencing.Science 338:1627-1630.MajQCjEnnisjCA and Aparic1,S.20I2.0pening Pandora’s Box—the new b1logyof driver mutat1ns and clonal evolut1n in cancer as revealed by nextgenerat1n sequencing.Curr Opin Genet Dev 22:3-9.Manrao,EA,Derrington,IM,Laszlo,AH,Langford,Kff,Hopper,MK,GiIlgren,N,PavlenokjMjNiederweis,M and Gundlach,JH.2012.Reading DNA at single-nucleotideresolut1n with a mutant MspA nanopore and phi29 DNA polymerase.NatB1technol 30:349-353.MarcyjYjIshoeyjTjLaskenjRSjStockwell,TB,WaIenz,BP,Halpern,AL,Beeson,KY,Goldberg , SM and Quake,SR.2007.Nanol iter reactors improve multipledisplacement amplificat1n of genomes from single cells.PLoS Genet 3:1702—1708.Martin,J,Cervero,AjMirjP,Martinez-Conejero,JA,PelIicer,A and Simon,C.2013.The impact of next-generat1n sequencing technology on preimplantat1ngenetic diagnosis and screening.Fertil Steril 99:1054—1061 el053.Marx,V.2013.Next-generat1n sequencing:The genome jigsaw.Nature 501:263—268.McNally,B,Singer,A,Yu,Z,Sun ,Y,Weng,Z and MellerjA.2010.0pticalrecognit1n of converted DNA nucleotides for singIe~molecule DNA sequencingusing nanopore arrays.Nano Lett 10:2237-2244.Nagano,T,Lubling,Y,Stevens,TJ,Schoenfelder,S,Yaffe,E,DeanjWjLaue,ED,Tanay,A and Fraser,P.2013.Single-cell H1-C reveals cell—to—cell variabilityin chromosome structure.Nature 502:59-+.Navin,N and Hicks ,J.2011.Future medical applicat1ns of single-celIsequencing in cancer.Genome Medicine 3:
Navin,N,KendalI,J,Troge,J,Andrews,P,Rodgers,L,McIndoo,J,Cook,K,Stepansky,A,Levy ,D,Esposito ,D et al.2011.Tumour evolut1n inferred by single-celIsequencing.Nature 472:90-94.Peters,BA,Kermani,BG,Sparks,AB,Alferov,0,Hong,P,Alexeev,A,Jiang,Y,Dahl,F,Tang,YT,Haas,J et al.2012.Accurate whole-genome sequencing and haplotypingfrom 10 to 20 human cells.Nature 487:190-195.Peters,BA,Kermani,BG,Sparks,AB,Alferov,0,Hong,P,Alexeev,A,Jiang,Y,Dahl,F,Tang,YT,Haas,J et al.2012.Accurate whole-genome sequencing and haplotypingfrom 10 to 20 human cells.Nature 487:190-195.Potter,NE,Ermini,L,PapaemmanuiI,EjCazzanigajGjVijayaraghavanjGjTitleyj I,Ford,A,CampbelI,P,Kearney,L and Greaves,M.2013.Single cell mutat1nalprofiling and clonal phylogeny in cancer.Genome Res
Powell,AA,Talasaz,AH,Zhang,HY,Coram,MA,Reddy,A,Deng,GjTelli,ML,Advani,RH,CarlsonjRffjMollickjJA et al.2012.Single Cell Profiling of Circulating TumorCells: Transcript1nal Heterogeneity and Diversity from Breast Cancer CellLines.PLoS One 7:
SalzbergjSLjPhillippyjAMjZiminjAjPuiujDjMagocjTjKorenjSjTreangenjTJjSchatz,MC,Delcher,AL,Roberts,M et al.2012.GAGE: A critical evaluat1n ofgenome assemblies and assembly algorithms.Genome Research 22:557-567.Schmitt,MW,Kennedy,SR,Salk,JJ,Fox,EJ,Hiatt,JB and Loeb,LA.2012.Detect1nof ultra-rare mutat1ns by next-generat1n sequencing.Proc Natl Acad Sci U SA 109:14508-14513.Steemers,FJ,Gunderson,K,Royce,T,PignatelIi,NjGoryshin,IY,Carucc1,N,Maffi tt,M,Jendrisak,J,Amini,S,Kaper,F et al., inventors;11lumina Inc.,assignee.Linking sequence reads using paired code tags.Patent Applicat1nNumber,PCT/US2012/059642.WIPO Publicat1n NumberjWO 2012/061832 AljMay 10,2012.SukjEKjMcEwenjGKjDuitamajJjNowickjKjSchulz,S,Palczewski,S,Schreiber,S,Holloway,DT,McLaughlin,S,Peckham,H et al.2011.A comprehensively molecularhaplotype-resolved genome of a European individual.Genome research 21:1672-1685.Tabor,S and RichardsonjCC.1989.Selective inactivat1n of the exonucleaseactivity of bacter1phage T7 DNA polymerase by in vitro mutagenesis.J B1lChem 264:6447-6458.Telenius,H,Carter,NP,Bebb,CE,Nordenskjold,M,Ponder,BA and Tunnacliffe,A.1992.Degenerate oligonucleotide-primed PCR!general amplificat1n of targetDNA by a single degenerate primer.Genomics 13:718-725.Treangen,TJ and Salzberg,SL.2012.Repetitive DNA and next-generat1nsequencing:computat1nal challenges and solut1ns.Nature Reviews Genetics 13:36-46.Unger,MA,Chou,HP,Thorsen,T, Scherer , A and Quake , SR.2000.Monolithicmicrofabricated valves and pumps by multilayer soft lithography.Science 288:113-116.Voet,T,Kumar,P,Van Loo,P,Cooke,SLjMarshall,JjLinjMLjEsteki,MZ,Van der AajN,Mateiu,L,McBride,DJ et al.2013.Single-cell paired—end genome sequencingreveals structural variat1n per cell cycle.Nucleic Acids Research 41:6119-6138.Voet,T,Kumar,P,Van Loo,P,Cooke,SL,MarshalI,JjLinjMLjZamani Esteki,MjVander Aa,NjMateiu,LjMcBride,DJ et al.2013.SingIe-cell paired—end genomesequencing reveals structural variat1n per cell cycle.Nucleic Acids Res 41:6119-6138.Wallace,EVjStoddart,D,Heron,AJ,Mikhai1va,E,MagliajG,Donohoe,TJ andBayley,H.2010.1dentificat1n of epigenetic DNA modificat1ns with a proteinnanopore.Chem Commun(Camb)46:8195-8197.Wang,JB,Fan,HC,Behr,B and Quake,SR.2012.Genome-wide Single-Cell Analysisof Recombinat1n Activity and De Novo Mutat1n Rates in Human Sperm.Cell 150:402-412.ffanunu,M.2012.Nanopores:A journey towards DNA sequencing.Phys Life Rev 9:125-158.Wanunu,M,Morrison,W,Rabin,Y,Grosberg,AY and Meller,A.2010.Electrostaticfocusing of unlabelled DNA into nanoscale pores using a salt gradient.NatNanotechnol5:160-165.Zhang,C,Chen,S,Yin,X,Pan,X,Lin,G,Tan,Y,Tan,K,Xu,Z,Hu,P,Li,X et al.2013.Asingle cell level based method for copy number variat1n analysis by lowcoverage massively parallel sequencing.PLoS One 8:e54236.Zong,C,Lu,S,Chapman,AR and Xie,XS.2012.Genome-wide detect1n of single-nucleotide and copy-number variat1ns of a single human cell.Science 338:1622-1626.
【主权项】
1.一种用于对模板多核苷酸测序的方法,所述方法包括: (a)使所述模板多核苷酸与多个寡核苷酸对接触,其中每个寡核苷酸对的每个成员包括(i)接头序列,(ii)独特的标签序列,其与所述寡核苷酸对的另一成员上的互补序列杂交,并且其中所述寡核苷酸对中之一或两者包括(iii)与所述模板多核苷酸杂交的引物序列; (b)使所述模板多核苷酸和多个寡核苷酸对与缺乏链置换活性的聚合酶和对于聚合必要的试剂接触;和 (c)使得多核苷酸链从所述引物序列的3’端延伸,以产生包括组分(i)-(iii)和与所述模板多核苷酸互补的序列的延伸的多核苷酸; (d)收集所述延伸的多核苷酸; (e)对所述延伸的多核苷酸测序;和 (f)基于独特的标签序列组装所述延伸的多核苷酸的序列,从而对所述模板多核苷酸测序, 其中所述方法不包括使所述模板多核苷酸片段化或去除所述模板多核苷酸上的表观遗传标记物。2.权利要求1所述的方法,进一步包括在步骤(a)之前使所述模板多核苷酸变性。3.权利要求1或2所述的方法,进一步包括使得所述多个寡核苷酸对与所述模板多核苷酸杂交,并且在步骤(a)和(b)之间洗掉未杂交的寡核苷酸对。4.前述权利要求任一项所述的方法,其中所述寡核苷酸对的每个成员进一步包括(iv)至少一种连接体序列,并且所述延伸的多核苷酸包括组分(i)-(iv)和与所述模板多核苷酸互补的序列。5.前述权利要求任一项所述的方法,其中所述模板多核苷酸是基因组DNA。6.权利要求5所述的方法,进一步包括检测所述基因组DNA上的甲基化的碱基。7.前述权利要求任一项所述的方法,其中所述寡核苷酸对的两个成员均包括(iii)与所述模板多核苷酸杂交的引物序列。8.前述权利要求任一项所述的方法,其中所述引物序列(iii)是随机引物序列。9.前述权利要求任一项所述的方法,其中所述接头序列与预定的引物序列互补。10.前述权利要求任一项所述的方法,其中所述接头序列连接至亲和性试剂。11.一种扩增模板多核苷酸的方法,所述方法包括: (a)使所述模板多核苷酸与多个引物接触; (b)使所述模板多核苷酸和多个引物与具有链置换活性的聚合酶和对于聚合必要的试剂接触; (c)使多核苷酸链从与所述模板多核苷酸杂交的所述多个引物中的至少一个引物的3’端延伸,以产生伸长的扩增产物,从而扩增所述模板多核苷酸。12.权利要求11所述的方法,进一步包括在步骤(a)之前使所述模板多核苷酸变性。13.权利要求11或12所述的方法,进一步包括使所述多个引物与所述模板多核苷酸杂交,并且在步骤(a)和(b)之间洗掉未杂交的引物。14.权利要求11-13任一项所述的方法,其中步骤(c)包括使延伸进行预定的时间,以产生部分伸长的扩增产物,洗掉未杂交的引物,添加具有链置换活性的聚合酶和对于聚合必要的试剂,并且使延伸继续。15.前述权利要求任一项所述的方法,其中所述引物是随机引物。16.权利要求11-15任一项所述的方法,其中所述引物连接至亲和性试剂。17.权利要求16所述的方法,进一步包括亲和纯化所述伸长的扩增产物。18.权利要求11-15任一项所述的方法,进一步包括基于尺寸分离所述伸长的扩增产物。19.权利要求17或18所述的方法,进一步包括在通过亲和纯化或分离去除所述伸长的扩增产物之后重复步骤(a)-(c)。20.权利要求11-19任一项所述的方法,其中所述模板多核苷酸是基因组DNA。21.—种微流体设备,其包括: (a)至少一个室; (b)与所述至少一个室可操作地连接的多个流体通道; (C)至少一个聚合物屏障,其将所述至少一个室与(i)所述多个流体通道之一和(ii)被配置为在所述流体通道和室中产生电场的电极分开; 其中所述至少一个室包括至少一个阀门,每个阀门将所述至少一个室与未通过所述聚合物屏障与所述至少一个室分开的所述多个流体通道之一分开,和 其中所述聚合物屏障是半渗透的并且具有尺寸截止,以便当所述电极在所述流体通道和室中产生电场时,大于尺寸截止的核酸保留在所述至少一个室中。22.权利要求21所述的微流体设备,其包括2-10个室,每个室包括至少一个聚合物屏障和至少一个阀门。23.权利要求22所述的微流体设备,其中每个室中的所述聚合物屏障的所述尺寸截止被独立地选择。24.权利要求21-23任一项所述的微流体设备,其中所述至少一个聚合物屏障的尺寸截止在所述电极在所述流体通道和室中产生电场时保留所有核酸。25.权利要求21-23任一项所述的微流体设备,其中所述至少一个聚合物屏障的尺寸截止保留长于30个核苷的核酸。26.权利要求21-23任一项所述的微流体设备,其中所述至少一个聚合物屏障的尺寸截止保留长于100个核苷的核酸。27.权利要求21-26任一项所述的微流体设备,其中所述至少一个聚合物屏障包括丙烯酸酰胺、双丙烯酸酰胺和PEG-DA。28.权利要求21-27任一项所述的微流体设备,其中所述至少一个聚合物屏障被涂布以亲和性试剂。
【文档编号】C12Q1/68GK105899682SQ201480072855
【公开日】2016年8月24日
【申请日】2014年11月13日
【发明人】黄晓华
【申请人】加利福尼亚大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1