用于降低插入偏好的转座酶组合物的制作方法

文档序号:13348245阅读:211来源:国知局
用于降低插入偏好的转座酶组合物的制作方法

相关申请

本申请要求于2014年11月5日提交的美国临时申请号62/075,713和于2015年10月16日提交的美国临时申请号62/242,935的优先权。这些申请的全部内容通过引用并入本文。

发明背景

转座酶可用于体外转座系统。它们允许基因组dna的大规模片段化(fragmentation)和标签化(tagging),并且可用于自靶dna制备带标签的dna片段的文库用于核酸分析方法,如下一代测序和扩增方法。仍然需要转座酶组合物和标签片段化(tagmentation)方法,其具有改进的性质并产生带标签的dna片段,所述带标签的dna片段定性和定量地代表产生它们的样品中的靶核酸。

发明概述

本文中呈现了用于核酸的标签片段化的方法和组合物。令人惊讶地,本文中提供的转座酶组合物和标签片段化方法具有改善的特性,包括例如产生带标签的dna片段,所述带标签的dna片段定性和定量地代表产生它们的样品中的靶核酸。

因而,本文中呈现的一个实施方案是序贯标签片段化的方法,其包括:(a)提供第一转座体,所述第一转座体包含具有第一标签片段化概况(profile)的第一转座酶;(b)在适合于标签片段化的条件下结合靶核酸与所述第一转座酶,从而生成标签片段化核酸;(c)在适合于标签片段化的条件下组合标签片段化核酸与第二转座体,所述转座体包含具有标签片段化概况的第二转座酶。在一些实施方案中,第一标签片段化概况和第二标签片段化概况是不同的。在一些实施方案中,方法包含步骤(b)和(c)之间的清洗步骤以基本上分开标签片段化核酸与步骤(b)中使用的反应缓冲液。在一些实施方案中,清洗步骤包括使标签片段化核酸结合到固体支持物。在一些实施方案中,固体支持物包含珠。在一些实施方案中,固体支持物包含旋转柱。在一些实施方案中,第一转座体和第二转座体具有不同插入偏好。在一些实施方案中,步骤(c)包括将第二转座体添加到包含第一转座体的反应混合物。

本文中还呈现了标签片段化的方法,其包括:(a)提供第一转座体,所述第一转座体包含具有第一标签片段化概况的第一转座酶;(b)提供第二转座体,所述第二转座体包含具有第二标签片段化概况的第二转座酶;(c)在适合于标签片段化的条件下组合靶核酸与第一转座体和第二转座体,从而生成标签片段化核酸。

在一个方面,本文中公开了序贯标签片段化的方法。方法包括提供第一转座体。第一转座体包含具有第一标签片段化概况的第一转座酶。在适合于标签片段化的条件下使靶核酸与第一转座酶组合,从而生成标签片段化核酸。在适合于标签片段化的条件下使标签片段化核酸与第二转座体组合。第二转座体包含具有第二标签片段化概况的第二转座酶。

一个或多个实施方案的细节在附图和下面的描述中阐述。其它特征、目的和优点将从说明书和附图以及权利要求书中变得显而易见。

附图简述

图1显示了使用不同浓度的转座体制备的ez-tn5tm和ez-tn5tm+mos1标签片段化dna文库中的独特分子的数目的柱状图。

图2显示了图1的标签片段化文库中的插入物大小的柱状图。

图3显示了图1的标签片段化文库中的百分比at退出(dropout)和百分比gc退出的柱状图。

图4显示了使用不同标签片段化缓冲液配制剂制备的标签片段化dna文库中的独特分子的数目的图。

图5显示了图4的标签片段化文库中的插入物大小的柱状图;

图6显示了图4的标签片段化文库中的百分比at退出和百分比gc退出的柱状图。

图7显示了使用不同浓度的转座体制备的ts-tn5059+mos1标签片段化文库中的读段的总数目和多样性的柱状图。

图8显示了图7的标签片段化文库中的插入物大小的柱状图。

图9显示了图7的标签片段化文库中的百分比at退出和百分比gc退出的柱状图。

图10显示了mos1+tn5序贯标签片段化dna文库中的独特分子的数目的图。

图11显示了图10的标签片段化文库中的插入物大小的图;

图12显示了图10的标签片段化文库中百分比at退出和百分比gc退出的图。

图13显示了使用不同浓度的转座体制备的mos1+tn5标签片段化dna文库中的独特分子的数目的柱状图;以及

图14显示了图13的标签片段化文库中百分比at退出和百分比gc退出的柱状图。

图15显示了hypermutm转座子序列。

图16显示了hypermutm转座子和使用的各种引物的序列。

图17显示了在不同浓度的hypermutm转座体时噬菌体基因组的片段化产物的琼脂糖凝胶电泳分析。

图18显示了在用hypermutm转座体的标签片段化后标签片段化大肠杆菌(e.coli)染色体的pcr扩增产物的琼脂糖凝胶电泳分析。

图19显示了使用hypermutm标签片段化的大肠杆菌染色体的测序运行的统计量。

图20显示了使用hypermutm对大肠杆菌染色体的标签片段化后的片段长度分布。

图21显示了单独的tn5、单独的hypermutm、单独的trueseq、或hypermutm和tn5的组合的覆盖的一致性。

图22a-d显示了truseq、hypermutm和tn5(nextera)的序列偏好并且与参照标签片段化比较。参照研究中使用的dna是大肠杆菌dna。在x轴上显示了%gc,并且在y轴上显示了频率。图22a是比较参照与使用3.2nghypermutm得到的标签片段化结果。图22b是比较参照与使用1ngnextera(tn5)和3.2nghypermutm得到的标签片段化结果。图22c是比较参照与truseq法。图22d是比较参照与truseq法、用nextera和hypermutm的标签片段化。

图23显示了通过使用hypermutm和nextera转座体序贯标签片段化制备序列文库的例示性方案。

图24显示了使用mos-1标签片段化,接着通过tstn5059/nextera标签片段化得到的作为%gc函数的标准化覆盖的分数的图。实验包括两种不同工作流程,一种在两个标签片段化步骤之间具有清洁步骤,而另一种中在两个标签片段化步骤之间通过稀释调节缓冲液。

图25显示了使用tstn5059/nextera标签片段化,接着通过mos-1标签片段化得到的作为%gc函数的标准化覆盖的分数的图。

图26显示了使用各种浓度的mos-1和tstn5059/nextera酶的各种组合得到的覆盖一致性的图。

图27显示了使用tstn5059/nextera和mos-1的各种组合得到的标签片段化文库中百分比at退出和百分比gc退出的柱状图。

图28显示了柱状图,其显示了使用不同浓度的转座体制备的ts-tn5059/nextera+mos1标签片段化文库中的多样性。

发明详述

令人惊讶地,本文中提供的转座酶组合物和标签片段化方法具有改善的特性,包括例如产生带标签的dna片段,所述带标签的dna片段定性和定量地代表产生它们的样品中的靶核酸。

令人惊讶且出乎意料地,本发明的发明人已经发现了使用具有两种或更多种不同标签片段化概况的两种或更多种转座体提供了靶dna的更一致的标签片段化。发明人还已经发现了使用两种或更多种转座体在转座酶的标签片段化概况具有不同插入偏好(insertionbiases),如不同at和gc退出率(dropoutrate)时是特别有利的。

本文中提供的方法和组合物与如2014年10月9日提交并且题目为“modifiedtransposasesforreductionofinsertionbias”(其内容通过引用完整并入本文)的u.s.62/062,006的公开内容中更为详细描述的转座酶和方法一起是有用的。

本文中提供的方法和组合物与u.s.2010/0120098和2014/0194324(其内容通过引用完整并入本文)的公开内容中更为详细描述的转座酶和方法一起也是有用的。

在一个方面,本文中公开的方法包括序贯标签片段化,其包括:(a)提供第一转座体,所述第一转座体包含第一转座子和具有第一标签片段化概况的第一转座酶;(b)在适合于标签片段化的条件下组合靶核酸与所述第一转座酶,从而生成第一标签片段化核酸;(c)在适合于标签片段化的条件下结合所述第一标签片段化核酸与第二转座体,所述转座体包含第二转座子和具有第二标签片段化概况的第二转座酶,从而生成第二标签片段化核酸。

在一些实施方案中,方法包含步骤(b)和(c)之间的清洗步骤以基本上分开标签片段化核酸与步骤(b)中使用的反应缓冲液。在一些实施方案中,清洗步骤包括使标签片段化核酸结合到固体支持物。在一些实施方案中,固体支持物包含珠。在一些实施方案中,固体支持物包含旋转柱。在一些实施方案中,步骤(c)包括将第二转座体添加到包含第一转座体的反应混合物。在一些实施方案中,在第二转座体与第一标签片段化核酸组合期间一种或多种第一转座酶保持与第一标签片段化核酸结合。

在一个方面,本文中公开了制备测序文库的方法。方法包括提供第一转座体,所述第一转座体包含第一转座子和具有第一标签片段化概况的第一转座酶,其中在第一固体支持物上固定化第一转座体。在适合于标签片段化的条件下使靶核酸与第一转座酶组合,从而生成第一标签片段化核酸。在适合于标签片段化的条件下使标签片段化核酸与第二转座体组合,所述第二转座体包含第二转座子和具有第二标签片段化概况的第二转座酶,从而生成第二标签片段化核酸,并且创建测序文库。

在一个方面,本文中公开了制备测序文库的方法。方法包括提供第一转座体,所述第一转座体包含第一转座子和具有第一标签片段化概况的第一转座酶。在适合于标签片段化的条件下使靶核酸与第一转座酶组合,从而生成第一标签片段化核酸。在适合于标签片段化的条件下使第一标签片段化核酸与第二转座体组合,所述第二转座体包含第二转座子和具有第二标签片段化概况的第二转座酶,其中在第二固体支持物上固定化所述第二转座体,从而生成第二标签片段化核酸,并且创建测序文库。

在一个方面,本文中公开了制备测序文库的方法。方法包括提供第一转座体,所述第一转座体包含第一转座子和具有第一标签片段化概况的第一转座酶。在适合于标签片段化的条件下使靶核酸与第一转座酶组合,从而生成第一标签片段化核酸。在适合于标签片段化的条件下使第一标签片段化核酸与第二转座体组合,所述转座体包含第二转座子和具有第二标签片段化概况的第二转座酶,从而创建测序文库。

在一个方面,本文中公开了制备测序文库的方法。方法包括提供第一转座体,所述第一转座体包含第一转座子和具有第一标签片段化概况的第一转座酶。在适合于标签片段化的条件下使靶核酸与第一转座酶组合,从而生成第一标签片段化核酸。基本上分开第一标签片段化核酸和用于第一标签片段化反应的反应缓冲液。然后,在适合于标签片段化的条件下使第一标签片段化核酸与第二转座体组合,所述第二转座体包含第二转座子和具有第二标签片段化概况的第二转座酶,从而生成第二标签片段化核酸。扩增第二标签片段化核酸,从而生成测序文库。在一些实施方案中,任选地,扩增第一组标签片段化核酸。

在另一个方面,本文中公开的方法包括标签片段化,其包括:(a)提供第一转座体,所述第一转座体包含第一转座子和具有第一标签片段化概况的第一转座酶;(b)提供第二转座体,所述第二转座体包含第二转座子和具有第二标签片段化概况的第二转座酶;(c)在适合于标签片段化的条件下组合靶核酸与第一转座体和第二转座体,从而生成标签片段化核酸。在一些实施方案中,同时添加第一和第二转座体。

在一些实施方案中,第一转座体的第一转座子包含第一衔接头,并且第二转座体的第二转座子包含第二衔接头。在一些实施方案中,第一和第二衔接头是不同的。在一些实施方案中,第一和第二衔接头包含选自下组的序列:条形码、引物结合序列、限制性内切核酸酶位点、和独特的分子索引。

在一些实施方案中,在第二固体支持物上固定化第一转座体、第二或转座体、或这两种转座体。例示性固体支持物包括但不限于珠、流动池表面、旋转柱、柱基质。在一些实施方案中,第一表面和第二支持物是不同的。在一些实施方案中,第一和第二固体支持物是珠。在一些实施方案中,在固体支持物上固定化第一转座体。在一些实施方案中,固体支持物上固定化的第一转座体保持与标签片段化靶核酸结合,并且使用固体支持物(例如链霉亲合素珠、磁性珠等)从溶液中分开第一标签片段化核酸。

在上述方面的一些实施方案中,在接触第二转座体前扩增第一标签片段化核酸。在上述方面的一些实施方案中,扩增第二标签片段化核酸。在一些实施方案中,实施两组扩增。在第一组扩增中,扩增第一标签片段化核酸。在第二组扩增中,进一步扩增第二标签片段化核酸。

在一些实施方案中,第一标签片段化概况和第二标签片段化概况是不同的。在一些实施方案中,第一转座酶和第二转座酶具有不同插入偏好。在一些实施方案中,第一标签片段化和第二概况具有不同at退出率。在一些实施方案中,第一和第二标签片段化概况具有不同gc退出率。在一些实施方案中,与第二标签片段化概况相比,第一标签片段化概况具有更高的gc退出率。在一些实施方案中,与第二转座酶相比,第一转座酶对富含at的区域具有更大的插入偏好。在一些实施方案中,与第一标签片段化概况相比,第二标签片段化概况具有更高的at退出率。在一些实施方案中,与第一转座酶相比,第二转座酶对富含gc的区域具有更大的插入偏好。

在一些实施方案中,与第二标签片段化概况相比,第一标签片段化概况具有更高的at退出率。在一些实施方案中,与第二转座酶相比,第一转座酶对富含gc的区域具有更大的插入偏好。在一些实施方案中,与第一标签片段化概况相比,第二标签片段化概况具有更高的gc退出率。在一些实施方案中,与第二转座酶相比,第二转座酶对富含at的区域具有更大的插入偏好。

在一些实施方案中,稀释用于第一标签片段化反应的反应缓冲液以允许与第二转座体的标签片段化反应。在一些实施方案中,将用于第一标签片段化反应的反应缓冲液稀释到至少1.5倍、2倍、2.5倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、12.5倍、15倍、20倍、25倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍、125倍、200倍、250倍、300倍或更多。在一些实施方案中,第一标签片段化核酸在稀释期间仍然在固体支持物上固定化。在一些实施方案中,第一标签片段化核酸在稀释期间保持与一种或多种第一转座酶结合。在一些实施方案中,第一标签片段化核酸保持与一种或多种第一转座体结合,并且在固体支持物上固定化第一转座体,从而固定化第一标签片段化核酸。

在一些实施方案中,第一和第二转座体对于特定的基因组具有不同的标签片段化概况。

在一些实施方案中,用于第一标签片段化反应的第一转座酶是mos-1,并且用于第二标签片段化反应的第二转座酶是tn5转座酶(例如eztn5tm、nexterav2、或ts-tn5059)。

在一个实施方案中,用于第一标签片段化反应的第一转座酶是tn5转座酶(例如eztn5tm、nexterav2、或ts-tn5059),并且用于第二标签片段化反应的第二转座酶是mos1转座酶以生成标签片段化dna文库。在一个例子中,在使用tn5的第一标签片段化反应后立即实施使用mos1的第二标签片段化反应(即,在第二标签片段化反应前不使用清洁步骤从dna除去tn5)。

在另一个实施方案中,本发明的方法使用利用mos1转座酶的第一标签片段化反应,接着是样品清洁步骤和使用tn5转座酶(例如eztn5tm、nexterav2、或ts-tn5059)的第二标签片段化反应以生成标签片段化dna文库。在一个例子中,样品清洁步骤是使用dnaclean&concentratortm试剂盒(zymoresearch)实施的dna清洁步骤。在此清洁步骤中,将mos1变性,并且从dna除去。在另一个例子中,使用agencourtampure珠(beckmancoulter,inc.)实施样品清洁步骤。在此例子中,清洁步骤是缓冲液更换步骤,其中mos1转座体保持与dna结合。

在另一个实施方案中,本发明的方法使用利用mu或hypermutm转座酶的第一标签片段化反应,接着是样品清洁步骤和使用tn5转座酶(例如eztn5tm、nexterav2、或ts-tn5059)的第二标签片段化反应以生成标签片段化dna文库。在一个例子中,样品清洁步骤是使用dnaclean&concentratortm试剂盒(zymoresearch)实施的dna清洁步骤。在此清洁步骤中,将mu或hypermutm变性,并且从dna除去。在另一个例子中,使用agencourtampure珠(beckmancoulter,inc.)实施样品清洁步骤。在此例子中,清洁步骤是缓冲液更换步骤,其中mu或hypermutm转座酶仍然与dna结合。图23显示了通过使用hypermutm和nextera转座体的序贯标签片段化制备序列文库的例示性方案。首先将输入dna进行使用个别带标签的“mu-nextera”复合物的标签片段化。然后,经由pcr扩增此文库,从而在扩增的反应中将每个片段呈现多次。用基础nextera试剂盒在以酶为限制因素的浓度方案中经由第二轮标签片段化扩增文库。这确保每个单一分子在最小限度上用nextera复合物标签片段化以保留最大连续性(continuity)信息。然后,对生成的文库测序。已经从相同扩增子生成的所有nextera-片段的确共享相同的条形码(或末端标签),其可以在最终的装配(assembly)中使用。

在一些实施方案中,第一和第二转座酶的量可以是相同的。在一些实施方案中,第一和第二转座酶的量可以是不同的。

在一个实施方案中,方法用于使用微生物样品的宏基因组学。

针对宏基因组学(meta-genomics)和微生物组(microbiome)的序贯标签片段化

可以将序贯标签片段化(以所有其形式)应用于微生物样品,用于宏基因组学应用。在一些例子中,单一转座酶的性能受到其偏好和靶dna的序列含量(sequencecontext)高度影响。若样品含有具有不同dna样品组成的多种种类,则标签片段化可以对于一些比对于其它表现更好。某些种类的基因组dna可以以相对较大或小得多的片段结束,这使其在流动细胞上的呈现倾斜。这将导致缺少宏基因组学信息。在极端情况下,某些种类在流通池上可能没有任何呈现。

使用序贯标签片段化可以有助于降低总体标签片段化偏好。特别地,可以应用不同比率的两种酶来调整(tweak)用于各种基因组组成的文库制备。具有不同酶比率的多重序贯标签片段化可以应用于同一样品。这有助于在微生物组样品中捕获更广泛的物种。例如,样品可以分成多个较小的样品,并在每个上应用具有不同酶比率的序贯标签片段化。不同比率的酶可以有助于更好地捕获微生物组样品中不同种类的测序数据。

此外,可以基于片段大小分布来建立快速筛选。微生物组样品(来自某一来源,如肠)可以分成较小尺寸的样品,可以将具有不同酶比率的多重序贯标签片段化应用于每个,并且每个的片段大小分布可以存储为基线。来自同一来源的样品可以通过相同的过程,并且片段大小分布的主要变化可以指向微生物组的主要变化。这可以用于快速测试以查看来自某一来源的微生物组菌群是否在变化。

如本文中使用,术语“标签片段化”是指包含转座酶和转座子末端序列的转座体复合物对dna的修饰,其中转座子末端序列还包含衔接头序列。标签片段化导致同时的dna片段化和衔接头连接到双链体片段的两条链的5'末端。

在纯化步骤以除去转座酶后,可以将另外的序列添加到衔接片段(adaptedfragment)的末端,例如通过pcr、连接或本领域技术人员已知的任何其它合适的方法。

本发明的方法可以使用任何转座酶,其可以接受转座酶末端序列并使靶核酸片段化,附着转移的末端而不是非转移的末端。“转座体”至少由转座酶和转座酶识别位点组成。在一些称为“转座体”的此类系统中,转座酶可以与转座子识别位点形成功能性复合物,其能够催化转座反应。转座酶或整合酶可以结合转座酶识别位点,并在有时称为“标签片段化”的过程中将转座酶识别位点插入靶核酸中。在一些此类插入事件中,可以将转座酶识别位点的一条链转移到靶核酸中。

在标准样品制备方法中,每个模板在插入物的任一端含有衔接头,并且通常需要多个步骤,既修饰dna或rna又纯化修饰反应的期望产物。这些步骤在将衔接片段添加到流动池中之前在溶液中进行,在流动池它们通过引物延伸反应而与表面偶联,所述引物延伸反应将杂交的片段复制到共价附着到表面的引物的末端。然后,这些“接种(seeding)”模板通过几个扩增循环产生复制模板的单克隆簇。

可以通过使用转座酶介导的片段化和标签化,使准备好用于簇形成和测序的溶液中将dna转化为衔接头修饰的模板需要的步骤的数目最小化。

在一些实施方案中,基于转座子的技术可以用于使dna片段化,例如如nexteratmdna样品制备试剂盒(illumina,inc.)的工作流程中所例示的,其中可以通过工程化转座体使基因组dna片段化,所述工程化转座体使输入dna同时片段化和标签化(“标签片段化”),从而创建在片段的末端包含独特的衔接头序列的片段化核酸分子的群体。

一些实施方案可以包括使用超活性(hyperactive)tn5转座酶和tn5型转座酶识别位点(goryshinandreznikoff,j.biol.chem.,273:7367(1998)),或mua转座酶和包含r1和r2末端序列的mu转座酶识别位点(mizuuchi,k.,cell,35:785,1983;savilahti,h,etal.,emboj.,14:4893,1995)。与超活性tn5转座酶(例如ez-tn5tm转座酶,epicentrebiotechnologies,madison,wis.)形成复合物的示例性转座酶识别位点。

可以与本文提供的某些实施方案一起使用的转座系统的更多实例包括金黄色葡萄球菌(staphylococcusaureus)tn552(colegioetal.,j.bacteriol.,183:2384-8,2001;kirbycetal.,mol.microbiol.,43:173-86,2002)、ty1(devine&boeke,nucleicacidsres.,22:3765-72,1994和国际公开文本wo95/23875)、转座子tn7(craig,nl,science.271:1512,1996;craig,nl,综述于:currtopmicrobiolimmunol.,204:27-48,1996)、tn/o和is10(klecknern,etal.,currtopmicrobiolimmunol.,204:49-82,1996)、mariner转座酶(lampedj,etal.,emboj.,15:5470-9,1996)、tc1(plasterkrh,curr.topicsmicrobiol.immunol.,204:125-43,1996)、p元件(gloor,gb,methodsmol.biol.,260:97-114,2004)、tn3(ichikawa&ohtsubo,jbiol.chem.265:18829-32,1990)、细菌插入序列(ohtsubo&sekine,curr.top.microbiol.immunol.204:1-26,1996)、逆转录病毒(brown,etal.,procnatlacadsciusa,86:2525-9,1989)、和酵母的反转录转座子(retrotransposon)(boeke&corces,annurevmicrobiol.43:403-34,1989)。更多例子包括is5、tn10、tn903、is911和转座酶家族酶的工程化形式(zhangetal.,(2009)plosgenet.5:e1000689.epub2009oct.16;wilsonc.etal(2007)j.microbiol.methods71:332-5)。此外,本文中提供的方法和组合物与弧菌属(vibrio)物种,包括哈氏弧菌(vibrioharveyi)的转座酶一起是有用的,如us2014/0093916和2012/0301925的公开内容中更详细阐述的,其各自通过引用整体并入本文。

简言之,“转座反应”是下述反应,其中在随机位点处或在几乎随机的位点处将一个或多个转座子插入靶核酸。转座反应中的基本成分是转座酶和dna寡核苷酸,其表现出转座子的核苷酸序列,包括转移的转座子序列及其互补物(即非转移转座子末端序列)以及形成功能性转座或转座体复合物所需要的其它成分。dna寡核苷酸还可以根据需要或期望进一步包含另外的序列(例如衔接头或引物序列)。

添加到核酸的5'和/或3'末端的衔接头可以包含通用序列。通用序列是两种或更多种核酸分子共同的,即共享的核苷酸序列的区域。任选地,两种或更多种核酸分子也具有序列差异的区域。因此,例如,5'衔接头可以包含相同或通用的核酸序列,并且3'衔接头可以包含相同或通用的序列。可以存在于多个核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单一通用引物复制或扩增多种不同序列。

如本文中使用,术语“至少一部分”和/或其语法等同物可以指全量的任何分数。例如,“至少一部分”可以指全量的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%、99.9%或100%。

如本文中使用,术语“约”意指+/-10%。

固体支持物

在一些实施方案中,固体支持物或其表面是非平面的,如管或容器的内表面或外表面。在一些实施方案中,固体支持物是流动池的表面。在一些实施方案中,固体支持物包括微球或珠。本文中的“微球”或“珠”或“颗粒”或语法等同物是指小的离散颗粒。合适的珠组成包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、顺磁材料、氧化钍溶胶(thoriasol)、碳石墨(carbongraphite)、二氧化钛、胶乳或交联葡聚糖,如sepharose、纤维素、尼龙、交联胶束和特氟隆(teflon),以及本文概述的用于固体支持物的任何其它材料都可以使用。来自bangslaboratories,fishersind.的“微球检测指南(microspheredetectionguide)”是有用的指南。在某些实施方案中,微球是磁性微球或珠。在一些实施方案中,珠可以进行颜色编码。例如,可以使用来自luminex,austin,tx的微球。

珠不需要是球形的;可以使用不规则的颗粒。或者/另外,珠可以是多孔的。珠的尺寸范围为纳米,即100nm到毫米,即1mm,优选约0.2微米至约200微米的珠,特别优选约0.5至约5微米的珠,尽管在一些实施方案中,可以使用更小或更大的珠。在一些实施方案中,珠的直径可以是约1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15、或20μm。

条形码

通常,条形码可以包括可用于鉴定一种或多种特定核酸的一种或多种核苷酸序列。条形码可以是人工序列,或者可以是在转座期间产生的天然存在的序列,如在以前并置的dna片段末端的相同的侧翼基因组dna序列(g-码)。在一些实施方案中,条形码是人工序列,其对于靶核酸来说是非天然的,并且用于鉴定靶核酸或确定靶核酸的连续性信息。

条形码可以包含至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个连续核苷酸。在一些实施方案中,条形码包含至少约10、20、30、40、50、60、7080、90、100或更多个连续的核苷酸。在一些实施方案中,包含条形码的核酸群体中的条形码的至少一部分是不同的。在一些实施方案中,条形码的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%是不同的。在更多此类实施方案中,所有条形码是不同的。可以随机或非随机生成包含条形码的核酸群体中的不同条形码的多样性。

在一些实施方案中,转座子序列包括至少一种条形码。在一些实施方案中,诸如包括两种不连续转座子序列的转座体,第一转座子序列包含第一条形码,并且第二转座子序列包含第二条形码。在一些实施方案中,转座子序列含有包含第一条形码序列和第二条形码序列的条形码。在前述一些实施方案中,可以鉴定或指定第一条形码序列以与第二条形码序列配对。例如,可以使用包括已知相互配对的多个第一和第二条形码序列的参考表,使已知的第一条形码序列与已知的第二条形码序列配对。

在另一个例子中,第一条形码序列可以包括与第二条形码序列相同的序列。在另一个例子中,第一条形码序列可以包括第二条形码序列的反向互补物。在一些实施方案中,第一条形码序列和第二条形码序列是不同的。第一和第二条形码序列可以包括双码(bi-code)。

在本文所述的组合物和方法的一些实施方案中,条形码用于制备模板核酸。如将理解的,大量可用的条形码允许每个模板核酸分子包含独特的鉴定。模板核酸混合物中每个分子的独特鉴定可用于多种应用。例如,可以应用独特鉴定的分子来在具有多个染色体的样品中、在基因组中、在细胞中、在细胞类型中、在细胞疾病状态和物种中,例如在单倍型测序中、在亲本等位基因识别中、在宏基因组测序和基因组样品测序中鉴定个别的核酸分子。

例示性条形码序列包括但不限于tatagcct、atagaggc、cctatcct、ggctctga、aggcgaag、taatctta、caggacgt、和gtactgac。

靶核酸

靶核酸可以包括任何感兴趣的核酸。靶核酸可以包括dna、rna、肽核酸、吗啉代核酸、锁定核酸、二醇核酸、苏糖核酸,核酸的混合样品、多倍性dna(即植物dna),其混合物及其杂合体。在优选的实施方案中,使用基因组dna或其扩增的拷贝作为靶核酸。在另一个优选的实施方案中,使用cdna、线粒体dna或叶绿体dna。

靶核酸可以包含任何核苷酸序列。在一些实施方案中,靶核酸包含均聚物(homopolymer)序列。靶核酸还可以包括重复序列。重复序列可以是多种长度中的任一种,包括例如2、5、10、20、30、40、50、100、250、500或1000个核苷酸或更多。可以将重复序列连续或非连续重复多次中的任一种,包括例如2、3、4、5、6、7、8、9、10、15或20次或更多。

本文中描述的一些实施方案可以利用单一靶核酸。其它实施方案可以利用多个靶核酸。在此类实施方案中,多个靶核酸可以包括多个相同的靶核酸、其中的一些靶核酸相同的多个不同的靶核酸,或其中的所有靶核酸不同的多个靶核酸。可以以多重形式进行利用多个靶核酸的实施方案,使得将试剂同时递送至靶核酸,例如在一个或多个室中或在阵列表面上。在一些实施方案中,多个靶核酸可以包括基本上全部特定生物体的基因组。多个靶核酸可以包括特定生物体基因组的至少一部分,包括例如基因组的至少约1%、5%、10%、25%、50%、75%、80%、85%、90%、95%或99%。在具体实施方案中,部分可以具有基因组的至多约1%、5%、10%、25%、50%、75%、80%、85%、90%、95%或99%的上限。

可以从任何来源获得靶核酸。例如,靶核酸可以由从单一生物体获得的核酸分子或从包含一种或多种生物体的天然来源获得的核酸分子的群体制备。核酸分子的来源包括但不限于细胞器、细胞、组织、器官、生物体、单细胞、或单细胞器。可用作靶核酸分子来源的细胞可以是原核生物(细菌细胞,例如埃希氏菌属(escherichia)、芽孢杆菌属(bacillus)、沙雷氏菌属(serratia)、沙门氏菌属(salmonella)、葡萄球菌属(staphylococcus)、链球菌属(streptococcus)、梭菌属(clostridium)、衣原体属(chlamydia)、奈瑟球菌属(neisseria)、密螺旋体属(treponema)、支原体属(mycoplasma)、疏螺旋体属(borrelia)、军团菌属(legionella)、假单胞菌属(pseudomonas)、分枝杆菌属(mycobacterium)、幽门螺杆菌属(helicobacter)、欧文氏菌属(erwinia)、土壤杆菌属(agrobacterium),根瘤菌属(rhizobium)和链霉菌属(streptomyces));古菌(archeaon),诸如泉古菌门(crenarchaeota)、纳古菌门(nanoarchaeota)或广古菌门(euryarchaeotia);或真核生物如真菌(例如酵母)、植物、原生动物和其它寄生物,和动物(包括昆虫(例如果蝇属种(drosophilaspp.))、线虫(例如秀丽隐杆线虫(caenorhabditiselegans))和哺乳动物(例如,大鼠、小鼠、猴、非人灵长类和人)。可以使用本领域熟知的各种方法对靶核酸和模板核酸富集某些感兴趣的序列。在国际公开号wo/2012/108864(其通过引用完整并入本文)中提供这些方法的实例。在一些实施方案中,在制备模板文库的方法期间可以进一步富集核酸,例如,可以在插入转座体前、在插入转座体后和/或核酸扩增后对核酸富集某些序列。

另外,在一些实施方案中,靶核酸和/或模板核酸可以是高度纯化的,例如在用本文中提供的方法使用前,核酸可以是至少约70%、80%、90%、95%、96%、97%、98%、99%或100%不含污染物的。在一些实施方案中,使用本领域已知的维持靶核酸的质量和大小的方法是有益的,例如可以使用琼脂糖塞进行靶dna的分离和/或直接转座。也可以在细胞中、用细胞群体、裂解物和非纯化的dna直接进行转座。

在一些实施方案中,靶核酸可以来自单细胞。在一些实施方案中,靶核酸可以来自福尔马林固定的石蜡包埋(ffpe)组织样品中。在一些实施方案中,靶核酸可以是交联核酸。在一些实施方案中,靶核酸可以与核酸交联。在一些实施方案中,靶核酸可以与蛋白质交联。在一些实施方案中,靶核酸可以是无细胞的核酸。例示性无细胞核酸包括但不限于无细胞dna、无细胞肿瘤dna、无细胞rna和无细胞肿瘤rna。

在一些实施方案中,可以从生物样品或患者样品获得靶核酸。如本文中使用,术语“生物样品”或“患者样品”包括诸如组织和体液的样品。“体液”可以包括但不限于血液、血清、血浆、唾液、脑脊液、胸膜液、泪、乳导管液(lactalductfluid)、淋巴、痰液、尿液、羊水和精液。样品可以包含“无细胞”的体液。“无细胞体液”包括小于约1%(w/w)的全细胞材料。血浆和血清是无细胞体液的实例。样品可以包括天然或合成来源的样本(即,制成无细胞的细胞样品)。

如本文中使用,术语“血浆”是指在血液中发现的无细胞液。可以通过本领域已知的方法(例如离心,过滤等)从血液中除去全细胞物质从血液获得“血浆”。

使用方法

本文中呈现的转座酶可用于测序程序,如体外转座技术。简言之,体外转座可以通过使转座体复合体和目标dna的接触来引发。可以容易地适用于本公开的转座酶的例示性转座程序和系统例如在wo10/048605;us2012/0301925;us2013/0143774(其各自的全部内容通过引用并入本文)中描述。

例如,在一些实施方案中,本文中呈现的转座酶可用于从包含任何感兴趣的dsdna的靶dna生成带标签的dna片段文库的方法(例如用作下一代测序或扩增模板),所述方法包括:在一定条件下在体外转座反应将靶dna与至少一种转座酶和与转座酶形成转座复合体的转座子末端组分一起温育足够的时间,所述转座子末端组分包含(i)转移的链,其表现出转移的转座子末端序列和任选地转移的转座子末端序列的另外的序列5',和(ii)非转移的链,其表现出与转移的转座子末端序列互补的序列,其中发生多次靶dna的插入,其中每次导致包含转移链或由转移链组成的第一标签连接到靶dna中核苷酸的5'末端,从而使靶dna片段化并生成退火的5'-带标签的dna片段的群体,其每个在5'末端具有第一标签;然后将5'-带标签的dna片段的3'末端连接到第一标签或第二标签,从而生成带标签的dna片段的文库(例如包含带标签的环状ssdna片段或5'-和3'-带标签的dna片段(或“双带标签的dna片段”))。

如本文中使用,术语“多样性”是指文库中独特分子的数目。在一些实施方案中,多样性是文库的多样性(复杂性)的指示。

如本文中使用,“插入物大小”是指文库的平均片段大小。在测定测序的插入物的长度后,基于测序数据测定模式和平均插入物大小。在一些实施方案中,使用bioanalyzer测定片段大小。

如本文中使用,“gc退出”是指从标签片段化文库中丢弃(缺乏)的基因组中的富含gc的区域的百分比。

如本文中使用,“at退出”是指从标签片段化文库中丢弃(缺乏)的基因组中的富含at的区域的百分比。

如本文中使用,术语“插入偏好”是指转座酶对插入位点的序列偏好。例如,如果多核苷酸样品中a/t/c/g的背景频率是同等分布的(25%a、25%t、25%c、25%g),则转座酶结合位点或切割位点处一种核苷酸超过其它三种的任何过度呈现(over-representation)反映了该位点处的插入偏好。可以使用本领域已知的多种方法中的任一种测量插入偏好。例如,可以对插入位点进行测序,并且可以比较插入位点中每个位置处的任何特定核苷酸的相对丰度。

除非另有规定,术语“一个”或“一种”贯穿本申请表示“一个/种或多个/种”。

实施例

实施例1

tn5和mos1序贯标签片段化

tn5标签片段化,接着进行mos1标签片段化

在一些实验中,使用tn5转座体(例如eztn5tm、nexterav2、或ts-tn5059)的第一标签片段化反应和使用mos1转座体的第二标签片段化反应生成标签片段化dna文库。在一个例子中,在使用tn5的第一标签片段化反应后立即进行使用mos1的第二标签片段化反应(即,在第二标签片段化反应之前不使用清除步骤从dna中除去tn5)。所用的tn5酶是来自nexterav2试剂盒的eztn5,tn5,或突变体ts-tn5059。

为了评估使用tn5和mos1转座体的序贯标签片段化对文库输出和测序度量(sequencingmetrics)的影响,使用蜡状芽孢杆菌(bacilluscereus)基因组dna构建了标签片段化dna文库。对于每个序贯标段片段化文库,通过在总反应体积50μl中混合20μl蜡状芽孢杆菌基因组dna(50ng)、25μl2x标准标签片段化缓冲液(2xtd;20mmtris乙酸盐,ph7.6,10mmmgcl2和20%二甲基甲酰胺(dmf))和各种浓度的ez-tn5tm转座体(epicentre)实施第一标签片段化反应。使用终浓度3、6、12、25、50和100nm的ez-tn5tm转座体。在55℃温育反应5分钟。第一标签片段化反应完成后,进行了使用mos1转座体的第二标签片段化反应。以终浓度20和100nm使用mos1转座体。使用mos1的反应还包括添加终浓度200mm的nacl。在30℃温育反应60分钟。

对于每个tn5对照文库,通过在总反应体积50μl中混合20μl蜡状芽孢杆菌基因组dna、25μl2x标准标签片段化缓冲液和5μlez-tn5tm(25nm)或nexterav2(25nm)转座体进行标签片段化反应。在55℃温育反应5分钟。

在标签片段化反应后,根据标准nexteratm样品制备方案(在标签片段化反应后)处理样品,通过合成测序(sbs)测序文库,并通过标准下一代测序分析工具评估。还在bioanalyzer上对每个文库中的片段大小分布进行了评估。

图1显示了使用不同浓度的转座体制备的ez-tn5tm和ez-tn5tm+mos1标签片段化dna文库中的独特分子的数目的柱状图100。文库中独特分子的数目是文库多样性(复杂性)的指标。图上的每个柱形代表标签片段化文库。对照文库(即使用25nmez-tn5tm或nexterav2转座体的标准反应条件制备的文库)由“std”指定。使用不同浓度的ez-tn5tm制备的文库由“eztn5-酶浓度”指定。例如,柱状图100中的第三条柱形标记为“eztn5-100nm”,并且指定使用终浓度100nm的ez-tn5tm制备的文库。使用利用ez-tn5tm,接着用mos1的序贯标签片段化制备的文库用“eztn5-酶浓度-mos1-酶浓度”指定。例如,柱状图100中的第九条柱形标记为“eztn5-100nm-mos1-20nm”,并且指定使用终浓度100nm的ez-tn5tm,随后使用终浓度20nm的mos1标签片段化制备的文库。所有文库都使用标准缓冲液配制剂制备。线110指示在tn5标签片段化dna文库中获得的多样性的标准水平。

数据显示,与对照文库和使用ez-tn5tm单独制备的文库相比,使用12nm-50nm的ez-tn5tm和20nm的mos1序贯标签片段化制备的标签片段化文库具有更高的平均多样性。例如,与对照文库或使用ez-tn5tm单独制备的文库相比,“eztn5-25nm-mos-20nm”文库的多样性具有约两倍的增加。

图2显示了图1的标签片段化文库中的插入物大小的柱状图200。从sbs数据产生每个标签片段化文库的中值数值和模式数值。由于从sbs数据产生中值和模式数值,仅呈现那些在簇扩增过程中扩增并且测序的那些插入物。从每个标签片段化样品中的片段大小分布的bioanalyzer迹线产生“ba”值。由于从bioanalyzer迹线产生“ba”值,呈现了标签片段化反应中产生的所有片段(即,可能不在sbs数据中呈现的较大片段)。该数据显示了在使用不同浓度的转座体制备的文库中的插入物大小上存在有可变性。数据还显示了在“eztn5-25nm-mos1-20nm”(其是具有最高多样性水平的文库(图1))中,插入物大小与“eztn5-25nm”文库中的插入物大小大致相同。

图3显示了图1的标签片段化文库中百分比at退出和百分比gc退出的柱状图300。at退出可以定义为标签片段化文库中不存在的基因组中的富含at的区域的百分比。gc退出可以定义为标签片段化文库中不存在的基因组中的富含gc的区域的百分比。线310指示在标准tn5标签片段化反应中获得的at退出的标准阈值。在标准tn5标签片段化反应中,通常观察不到gc退出。数据显示,使用不同转座体浓度制备的百分比at和gc退出存在可变性。数据还显示,在“eztn5-25nm-mos-20nm”(其是具有最高多样性水平的文库(图1))中,百分比at和gc退出率实质性低于对照文库,例如“eztn5-std-bcereus”,“nexterav2-std-bcereus”和“eztn5-25nm”中的百分比退出。

为了评价标签片段化缓冲液组成对文库输出和测序度量的影响,采用标准标签片段化缓冲液的改良配制剂制备了蜡状芽孢杆菌标签片段化文库。缓冲液配制剂是如下标准缓冲液(td)(10mmtris乙酸盐,ph7.6,5mmmgcl2和10%dmf);锰缓冲液(mn;10mmtris乙酸盐,ph7.6,5mmmncl2和10%dmf);钴缓冲液(co;10mmtris乙酸盐,ph7.6,5mmcocl2和10%dmf);和镍缓冲液(ni;10mmtris乙酸盐,ph7.6,5mmnicl2和10%dmf)。

图4显示了使用不同标签片段化缓冲液配制剂制备的标签片段化dna文库中的独特分子的数目的图400。使用标准标签片段化缓冲液和转座体体积(5μl=25nm转座体)制备的对照文库指定为“eztn5-std-bcereus”和“nexterav2-std-bcereus”。使用不同体积(即分别为10μl或15μl;或分别为50nm和75nm)的nexterav2转座体和标准标签片段化缓冲液配制剂制备的文库由“nexterav2-10μl”和“nexterav2-15μl”指定。使用改良的(例如mn、co或ni)标签片段化缓冲液配制剂制备的nexterv2文库由“nexterav2-modification”或“nexterav2-modification-μl”指定,其中“μl”指定反应中使用的转座体体积。使用利用nexterav2(25nm)和mos1的序贯标签片段化制备的文库由“nexterav2–mbpmos1–20nm–mn”指定,其中20nm是mos1转座体的浓度,并且“mn”是锰缓冲液配制剂。将序贯标签片段化文库反应重复三次(n=3),并且单独的文库称为a、b或c。

数据显示了使用包含cocl2的标签片段化缓冲液制备的nexterav2-标签片段化文库与不添加cocl2的缓冲液(即标准标签片段化缓冲液和包含mncl2或nicl2的缓冲液)中制备的文库相比具有更高的多样性。数据也显示了使用利用mn缓冲液中的nexterav2和mos1的序贯标签片段化制备的文库与在mn缓冲液中单独使用nexterav2制备的标签片段化文库相比具有更高的多样性。

图5显示了图4的标签片段化文库中的插入物大小的柱状图500。数据显示了使用包含cocl2或nicl2的标签片段化缓冲液制备的nexterav2-标签片段化文库中的插入物大小与使用标准或mn缓冲液配制剂制备的标签片段化文库相比相对更大。数据还显示了在“nexterav2–mbpmos1–20nm–mn”序贯标签片段化文库中,插入物大小与nextarav2对照文库(“nexterav2–std–bcereus”)和mn缓冲液中制备的nexterav2文库(“nexterav2–mn”)大致相同。

现在参考图4和图5,数据还显示,在使用mn缓冲液配制剂制备的序贯标签片段化文库(nexterav2–mbpmos1–20nm–mn)中,文库多样性增加(相对于对照水平),而文库中的插入物大小保持大致相同(相对于对照水平)。

图6显示了图4的标签片段化文库中的百分比at退出和百分比gc退出的柱状图600。数据显示了在使用mn缓冲液制备并且用nexterv2和mos1序贯标签片段化的文库(即“eztn5–25nm–mos1-20nm”)中,与使用单独的nexterav2和标准标签片段化缓冲液(即“nexterav2–std–bcereus”)或mn缓冲液(“nexterav2–mn)制备的文库相比,存在有百分比at退出的实质性降低和百分比gc退出的略微升高。

现在参考图4至图6,数据显示了在使用mn缓冲液配制剂制备的序贯标签片段化文库(nexterav2–mbpmos1–20nm–mn),文库多样性(图4)是增加的,而文库中的插入物大小(图5)仍然大致相同,并且百分比at退出(图6)实质性降低。

在另一个例子中,使用tn5转座体ts-tn5059和mos1产生序贯标签片段化蜡状芽孢杆菌文库。在此例子中,使用终浓度40nm、80nm和240nm的ts-tn5059进行第一标签片段化反应。使用终浓度10和20nm的mos1进行第二标签片段化反应。所有文库都使用标准缓冲液配制剂制备。使用mos1的反应还包括添加终浓度200mm的nacl。在标签片段化反应后,根据标准的nexteratm样品制备方案进行处理样品。通过在miseq仪器(illumina,inc.)上的sbs评估文库。还在bioanalyzer上评估每种文库中的片段大小分布。

图7显示了使用不同浓度的转座体制备的ts-tn5059+mos1标签片段化文库中的读段总数和多样性的柱状图700。读段总数是来自流动池的读段的总数。多样性是文库中的独特分子的数目,并且用作文库复杂性的指示。图上的每对柱形代表标签片段化文库。使用利用ts-tn5059和mos1的序贯标签片段化制备的文库通过“ts-tn5059–酶浓度–mos1–酶浓度”指定。使用eztn5tm和nexterav2制备比较对照文库(例如“eztn5–std–bcereus”和“nexterav2–std–bcereus”)。“nexterav2–ssb–bcereus”指定使用标准体积(5μl)转座体制备的文库,但是包括另外的10μlssb稀释剂。“nexterav2–15μl–bcereus”指定使用15μl(75nm)nexterv2转座体制备的文库。使用标准缓冲液配制剂制备所有文库。

数据显示,与eztn5tm和nexterav2对照文库中的多样性相比,ts-tn5059–240nm–mos1–20nm文库中的多样性更高。

图8显示了图7的标签片段化文库中的插入物大小的柱状图800。此图显示了mos1浓度对最终插入物大小的影响。范围10–20nm的mos1浓度对插入物大小没有重大影响。图9显示了图7的标签片段化文库中百分比at退出和百分比gc退出的柱状图900。数据显示了一般地,使用序贯标签片段化制备的文库与nexterav2对照文库相比存在有百分比at退出的实质性降低和百分比gc退出的略微升高。例如,与nexterav2–std–bcereus文库相比,ts-tn5059–40nm–mos1–20nm中的百分比at退出是实质性降低的,并且百分比gc退出略微升高。

实施例2

用mu转座体复合物生成测序文库

hypermutm(epicentre,madison,wi),一种用于生成测序文库的突变体mu转座酶。hypermutm转座酶,一种超活性酶,其保留mua转座酶的高度随机插入特征,但是比可购自其它供应商的酶具有多至少50倍的体外活性。在mu转座后,转座子臂(即ri和rll)与任何附着的序列一起将转移到模板dna,同时片段化该模板。图15-16中显示了hypermutm转座子序列和引物序列。使用的tn5酶是来自nexterav2试剂盒的eztn5,tn5。

评估mu转座体的活性

在约50kb噬菌体基因组上评估hypermutm转座体的标签片段化能力。以增加浓度的hypermutm转座体在ta缓冲液中在37℃实施标签片段化反应1小时。通过琼脂糖凝胶电泳分析片段化产物,并且图17中显示了结果。

使用hypermutm复合物使大肠杆菌染色体标签片段化,并且扩增标签片段化片段以引入测序衔接头。使用p5-muts和p7-muts引物实施25个pcr循环。通过琼脂糖凝胶电泳分析pcr产物,并且在图18中显示。用不同量的输入dna观察到pcr产物。

对pcr扩增的标签片段化dna的分析

在gaiix(2x35bp)上使用3.2ngdna进行配对末端测序。在ga上的单道上对样品测序。读数总数为30,071,951,并且<2000bp的独特读段的数目为4,599,874。图19中显示了测序运行的统计数据。测序片段的平均大小比nextera长得多,并且接近800bp,如图20中所示。

与tn5相比,hypermutm的测序运行的一致性更好。与单独的hypermutm或tn5相比,hypermutm及tn5的测序运行的一致性更好。测序运行的一致性与truseq相当。图21中显示了结果。对hypermutm观察到的gc偏好与tn5相似,并且在图22中显示。

实施图1-5中列出的实验以表征tn5标签片段化缓冲液组成和反应条件对文库输出和测序度量的影响。具体地,在图1-3中列出的实验中,将mos-1添加到tn5标签片段化反应。使用的tn5酶是来自nexterav2试剂盒的eztn5,tn5或突变体ts-tn5059。

在图4和5中列出的实验中,首先进行mos-1标签片段化反应,并且清洗标签片段化dna以从第一反应除去标签片段化缓冲液。随后,使用tn5酶(来自nexterav2试剂盒的eztn5,tn5或突变体ts-tn5059)使标签片段化dna进一步标签片段化。测试的各种清洗方法包括ampure珠和zymo清洁和浓缩器试剂盒(zymocleanandconcentratorkit)(zymo)。

为了评估标签片段化缓冲液组成和反应条件对文库输出和测序度量的影响,使用蜡状芽孢杆菌基因组dna构建了tn5标签片段化dna文库。使用蜡状芽孢杆菌基因组dna的25ng输入制备每种标签片段化文库。蜡状芽孢杆菌的基因组含量为约40%gc和约60%at。

将标签片段化缓冲液制备为2x配制剂。对于每个文库,通过在总反应体积50μl中将20μl蜡状芽孢杆菌基因组dna(25ng)、25μl2x标签片段化缓冲液和5μl酶(10xts-tn5059或10xts-tn5)混合进行标签片段化反应。在55℃温育反应5分钟。在标签片段化反应后,根据标准的nexteratm样品制备方案处理样品。在miseq装置上使用illumina的sbs(合成测序)化学对文库测序。测序运行是使用v2miseq试剂盒的2x71个循环。在bioanalyzer中评估每个文库中的片段大小分布。

实施例3

溶液中的tn5和mos1序贯标签片段化

tn5转座酶在含有>50mmnacl的缓冲液中具有降低的活性,而mos1转座酶在含有<150mmnacl的缓冲液中具有降低的活性。可以实施序贯标签片段化以优化两种酶的活性。

tn5标签片段化,接着进行mos1标签片段化

使用标准nexteratm(epicentre,madison,wi)标签片段化,其使用nextera文库制备方案中规定的条件和缓冲液进行。在初始tn5标签片段化后,将反应温度降低到<30℃。然后,将浓缩的nacl添加到反应至终浓度150-300mm。然后,将mos1转座体添加到标签片段化反应,并且在30℃温育反应。一旦完成标签片段化,使用ampuretm珠(beckmancoulter,ca,usa)或zymoclean&concentratortm筒(zymoresearch,irvine,ca)清洁反应。在nexteratm文库制备方案中规定了关于经由pcr添加衔接头和最终清洁和大小选择的剩余方案。

mos1标签片段化,接着清洁以除去高盐缓冲液,接着进行tn5标签片段化

使用标准nexteratm(epicentre,madison,wi)缓冲液,其中包含150-300mmnacl用于mos1最佳活性。然后,将mos1添加到反应,并且于30℃温育。在标签片段化后,使用ampuretm珠(beckmancoulter,ca,usa)或zymoclean&concentratortm筒(zymoresearch,irvine,ca),或用于dna纯化的相似方法清洁反应。然后,使用经清洁的片段化的dna材料作为用于使用tn5或tn5突变体转座体的二次标签片段化的dna输入。在第二标签片段化后,使用ampuretm珠(beckmancoulter,ca,usa)或zymoclean&concentratortm筒(zymoresearch,irvine,ca),或类似的方案清洁反应。在nexteratm文库制备方案(epicentre,madison,wi)中规定了关于经由pcr添加衔接头和最终的清洁和大小选择的剩余方案。

mos1标签片段化,接着稀释以减少高盐缓冲液,接着tn5标签片段化

使用标准nexteratm(epicentre,madison,wi)缓冲液,其中包含150-300mmnacl用于mos1最佳活性。然后,将mos1添加到反应,并且于30℃温育。在标签片段化后,用反应缓冲液稀释反应以将nacl浓度降低到≤50mm。然后,将tn5添加到标签片段化反应,并且于≤55℃温育。在第二标签片段化后,使用ampuretm珠(beckmancoulter,ca,usa)或zymoclean&concentratortm筒(zymoresearch,irvine,ca),或类似的dna纯化方法清洁反应。在nexteratm文库制备方案(epicentre,madison,wi)中规定了关于经由pcr添加衔接头和最终的清洁和大小选择的剩余方案。

贯穿本申请,已经提及了各种出版物、专利和/或专利申请。这些出版物的全部内容通过引用在此并入本申请中。

术语包括在本文中意图是开放式的,不仅包括所述元件,而且还包括任何另外的元件。

已经描述了许多实施方案。然而,应当理解,可以进行各种修改。因此,其它实施方案在所附权利要求书的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1