用于基于呈球状形式的大小来选择多核苷酸的方法与流程

文档序号:23628461发布日期:2021-01-12 10:42阅读:116来源:国知局
用于基于呈球状形式的大小来选择多核苷酸的方法与流程

本发明总体上涉及选择多核苷酸的方法。本发明总体上还涉及表征多核苷酸的方法,以及涉及用于选择多核苷酸的试剂盒。该方法特别适合于选择用于测序应用,诸如纳米孔测序的多核苷酸。



背景技术:

基于大小的多核苷酸的选择对于许多应用,诸如对dna和rna进行测序是重要的。存在广泛应用中的快速且廉价的多核苷酸表征、鉴定、扩增和测序技术的需要。多核苷酸的长度可以有助于多核苷酸的鉴定。多核苷酸的长度和完整性也可以影响下游鉴定、扩增或测序应用的成功和迅速性。许多高通量dna测序仪需要一定大小的插入文库以获得最佳性能。对于多核苷酸大小选择非常重要的应用的其他实例包括确保正确的pcr产物形成、基因分型、dna指纹分析、基因谱分析、以及例如在多核苷酸的酶消化之后提取限定大小的片段。

常规上通过凝胶电泳检测不同大小的dna。手动凝胶电泳方法具有许多缺点。例如,在商业上有用的规模上实现高通量分离所需的设备可能是昂贵的和/或复杂的;允许使用凝胶电泳对dna进行处理所需的处理步骤可能会有污染或降解dna样品的风险;和/或过程可能涉及使用有害化学物质,诸如常规用于对dna进行染色的溴化乙锭。已经开发了可以分离和选择在100bp与50kb之间的期望大小范围的dna的自动电泳仪器,但是它们是复杂且昂贵的。

在不同反应条件下的功能化顺磁性二氧化硅颗粒可以用于dna大小选择。通常,这些方法仅允许长度<1kb的dna的分离。使用固体基质的尺寸排阻方法也可以使用,但同样,这些方法通常用于从1000kb+片段中去除短<1kb的dna片段。因此,这些方法通常不适合处理更长的dna样品。

用于基于大的dna分子的大小选择的常规技术的常见的关键问题是大的dna分子在操作期间易于剪切。剪切是由于溶液流动期间的应力而产生的,并且在小型化系统中会增加。当操作大的dna分子时,dna的剪切代表一个严重的问题。

因此,需要一种简单有效的方法来分离不同大小的dna分子。特别需要分离dna分子同时避免或减轻剪切作用的方法。本文提供的方法解决了这一需要,以及旨在解决与常规分离技术相关的上述问题的一些或全部。



技术实现要素:

发明人设计了从包括多核苷酸的混合物的样品中选择多核苷酸的简单且有效的方法。发明人发现呈球状形式的多核苷酸可以容易地以稳健且可再现的方式进行大小选择。因此,发明人开发了基于呈球状形式的多核苷酸的大小选择多核苷酸的方法。本文提供的方法可以用于选择期望长度的多核苷酸。发明人开发的方法与常规的大小选择技术(例如,上文列出的那些)有很大不同,常规的大小选择技术通常依赖于呈非球状形式的多核苷酸。令人惊讶地,发明人进一步发现,相对于在未进行大小选择的样品上获得的数据,通过选择呈球状形式的多核苷酸,可以从所述进行大小选择的样品获得的表征数据(例如测序数据)的质量得到改善。不受理论的束缚,发明人相信,这样的益处可以至少部分地通过避免剪切并因此获得高质量的同源多核苷酸样品而产生。

因此,本文提供了用于选择多核苷酸的方法,所述方法包括:

i)提供包括多核苷酸的混合物的样品;以及

ii)基于呈球状形式的多核苷酸的大小来选择多核苷酸。

优选地,所述方法包括包括最初处理所述样品,使得所述样品中的多核苷酸采用球状形式和/或在选择步骤(ii)之后,优选地处理所述选择的多核苷酸,使得所述选择的多核苷酸采用非球状形式。优选地,选择所述多核苷酸包括通过滤器过滤所述样品。所述样品可以,例如:

a)包括pcr反应的产物;和/或

b)包括dna文库;和/或

c)包括基因组dna;和/或

d)包括内切核酸酶消化的产物。

还提供了表征多核苷酸的方法,所述方法包括:

i)进行如本文描述的用于选择多核苷酸的方法;

ii)使跨膜孔与所述选择的多核苷酸接触;

iii)施加跨所述跨膜孔的电势差;以及

iv)进行一种或多种测量,这些测量指示相对于跨膜孔移动的多核苷酸的一种或多种特征,以及从而表征所述多核苷酸。

进一步提供了用于分离多核苷酸的试剂盒,所述试剂盒包括滤器、如本文描述的凝聚介质,并且任选地进一步包括如本文描述的延伸介质。

附图说明

应当理解,附图仅用于说明目的,而不旨在限制。

图1示出了根据本文提供的方法对多核苷酸进行大小选择的示意图。步骤1示出了包括多核苷酸的混合物的多核苷酸样品。在图1中,样品中的多核苷酸最初呈非球状(线性)形式(图1)。在本文提供的方法中,样品中的多核苷酸可以替代地最初呈球状形式。可以例如通过使多核苷酸与凝聚介质接触来处理多核苷酸,使得样品中的多核苷酸采用球状形式(图2)。然后可以选择呈球状形式的多核苷酸,例如通过使多核苷酸与虚线表示的滤器接触(图3),并使未选择的多核苷酸穿过滤器,使得选择的多核苷酸被滤器保留(图4)。为了避免疑问,并且如本文中更详细地描述的,选择多核苷酸的其他选择手段和其他配置也根据本文提供的方法。例如,本文提供的方法还提供了从样品中选择多核苷酸,使得选择的多核苷酸穿过滤器,而未选择的多核苷酸被滤器保留。如果需要,可以分离由此选择的呈球状形式的多核苷酸(图5)。选择的多核苷酸可以任选地被处理,使得选择的多核苷酸采用非球状形式(图6)。

图2示出了在0.75%的醋酸锂琼脂糖凝胶上分析的dna的对照(泳道1)和进行大小选择的馏分(泳道2-9),其中在250v下运行15分钟,并使用sybr金可视化。结果在实施例1中描述。

图3示出了通过对人男性基因组dna测序而确定的碱基对(y轴)的加权平均读取长度的n50和n75值(x轴)。深灰色条表示从未根据本文提供的方法进行大小选择的对照dna获得的数据。浅灰色条表示从已根据本文提供的方法进行大小选择的dna获得的数据。结果在实施例2中描述。

图4示出了对人男性基因组dna进行测序所记录的平均读取长度。将表示碱基对(x轴)中的平均读取长度的条带与每个条带中的命中数(即记录的数据量;y轴)作图。深灰色条表示从未根据本文提供的方法进行大小选择的对照dna获得的数据。浅灰色条表示从已根据本文提供的方法进行大小选择的dna获得的数据。结果在实施例3中描述。

图5示出了从对人dna(gm12878)测序记录的平均读取长度。以碱基对为单位的平均读取长度(x轴)与记录的数据量;y轴)作图。深灰色:从未根据本文提供的方法进行大小选择的对照dna获得的数据。浅灰色:从已根据本文提供的方法进行大小选择的dna获得的数据。结果在实施例4中描述。

具体实施方式

应当理解,所公开的方法和产品的不同应用可以针对本领域的特定需求。还应当理解,本文所用的术语仅出于描述方法和产品的特定实施方式的目的,而不旨在进行限制。

另外,如在本说明书和所附权利要求中所使用的,除非内容另外明确指明,否则单数形式的“一种(a)”、“一个(an)”以及“所述(the)”均包括复数对象。因此,例如,提及“多核苷酸(apolynucleotide)”包括两个或更多个多核苷酸,提及“跨膜孔(atransmembranepore)”包括两个或更多个孔,等等。

本文引用的所有出版物、专利和专利申请,无论是上文还是下文,均通过引用整体并入本文。

通用方法

发明人设计了用于选择多核苷酸的方法,所述方法包括:

i)提供包括多核苷酸的混合物的样品;以及

ii)基于呈球状形式的多核苷酸的大小来选择多核苷酸。

球状形式和非球状形式

多核苷酸可以呈多种形式存在。多核苷酸可以呈球状形式或非球状形式存在。非球状形式也称为线性形式、盘绕形式、松弛形式和/或延伸形式。球状形式也称为凝聚形式、压缩形式和/或紧密堆积形式。如本领域技术人员应当理解的,相对于呈球状形式时,呈非球状形式的多核苷酸是延伸的。相对于非球状多核苷酸,球状多核苷酸是高度凝聚的。呈球状形式的多核苷酸可以例如采用紧密堆积的结构,例如多核苷酸的链可以呈六边形紧密堆积的形式布置。替代地,球状形式可以不那么严格地排序。有益地,呈球状形式的多核苷酸对沉淀和/或聚集具有弹性,并且可以以相对稳健的方式进行操作。

当呈球状形式时,给定多核苷酸的大小将取决于呈非球状形式的多核苷酸的长度。已经示出,可以操纵例如由peg诱导的球状形式的dna分子。例如,毛细管已用于使用非球状多核苷酸难以实现的球形多核苷酸的操纵。然而,先前尚未实现基于呈球状形式的多核苷酸的大小的多核苷酸的选择。发明人现已认识到,可以通过选择具有期望大小的呈球状形式的多核苷酸来从包括这样的多核苷酸和具有期望大小的多核苷酸的混合物中选择呈非球状形式的期望大小的一种或多种多核苷酸,并且已经开发了本文提供的方法以便以这种方式选择多核苷酸。

发明人已经认识到,大的多核苷酸在操作期间易于剪切。如上文解释的,剪切是由于溶液流动期间的应力而产生的,并且在小型化系统中会增加。当操作大的多核苷酸分子时,剪切代表一个严重的问题。当使用常规技术选择多核苷酸的大小时,剪切是一个特别的问题,尤其是因为这样的技术通常涉及将包含待选择的多核苷酸的样品移液。用于这样的移液的移液管通常具有非常小的孔径,并且在由此操纵的多核苷酸上引起大的剪切力,从而导致破裂。本文提供的方法旨在解决这一问题。发明人进一步认识到,当多核苷酸为球状形式时,剪切被抑制。优选地,因此,提供的方法涉及选择呈球状形式的多核苷酸,其中所述球状形式是其中所述多核苷酸耐剪切的凝聚形式。

选择

选择方法用于区分具有呈球状形式的不同大小的多核苷酸。可以组合进行许多不同的选择。在一种实施方式中,该方法选择多核苷酸,然后可以基于其长度来分离和/或选择性地修饰该多核苷酸。优选地,该方法用于选择长的多核苷酸。选择的多核苷酸的长度可以根据期望而变化。可以调整方法,使得选择期望长度的多核苷酸。例如,方法可以用于选择具有的长度为至少1kb,例如至少10kb、诸如至少50kb、例如至少100kb、例如至少1,000kb、诸如至少10,000kb、例如至少100,000kb、诸如至少200,000kb、例如至少250,000kb的多核苷酸。

方法可以用于选择落入特定“窗口”内的多核苷酸。例如,方法可以进行两次或更多次以选择在限定的长度范围内的多核苷酸,即通过去除短于期望的长度的多核苷酸,以及然后除去长于期望长度的多核苷酸,或反之亦然。

最初处理

在方法的步骤(i)中,样品中的多核苷酸最初可以是非球状形式,例如,延伸形式。替代地,样品中的多核苷酸最初可以是球状形式。优选地,在方法中,在方法的步骤(i)中,样品中的多核苷酸最初是延伸形式。当样品中的多核苷酸最初是非球状形式时,该方法的步骤(i)可以进一步包括处理样品,使得样品中的多核苷酸采用球状形式。

可以通过任何适当的处理步骤将多核苷酸从非球状形式转化为球状形式。优选地,在方法中,可以使呈非球状形式的多核苷酸与凝聚介质接触以采用球状形式。合适的凝聚介质在本文中进一步描述。多核苷酸从非球状形式向球状形式的转变可以描述为转变,因为它可以由聚合物和盐诱导。

进一步处理

在方法的步骤(ii)中基于呈球状形式的多核苷酸的大小来选择多核苷酸之后,选择的多核苷酸在其选择之后最初呈球状形式。对于一些应用,保留选择的多核苷酸呈球状形式是优选的。例如,如果需要对选择的多核苷酸进行进一步的操纵,并且这样的操纵使选择的多核苷酸易于剪切,则这种可以是优选的。对于其他应用,选择的多核苷酸呈非球状形式是优选的。这例如对于表征选择的多核苷酸可以是优选的。本文更详细地描述了可以对选择的多核苷酸进行的示例性表征步骤。

对于期望选择的多核苷酸呈非球状形式的应用,因此处理选择的多核苷酸是必要的。因此,方法可以优选地进一步包括:

iii)处理选择的多核苷酸,使得选择的多核苷酸采用非球状形式。

可以通过任何适当的处理步骤将多核苷酸从球状形式转化为非球状形式。优选地,在该方法中,可以使选择的呈球状形式的多核苷酸与延伸介质接触以采用非球状形式。合适的延伸介质在本文中进一步描述。

选择的多核苷酸的长度可以根据期望而变化。因此,在该方法中,选择的多核苷酸优选地比未选择的多核苷酸更长或更短。更优选地,选择的多核苷酸比未选择的多核苷酸长。例如,选择的多核苷酸具有的长度优选地可以为至少1kb、10kb、50kb、100kb、1,000kb或10,000kb,并且未选择的多核苷酸具有的长度优选可以为至多10,000kb、1,000kb、100kb、50kb、10kb或1kb。

滤器

本文提供的方法可以包括通过用滤器过滤样品来选择多核苷酸。

该方法可以包括通过使样品穿过滤器来选择多核苷酸,使得选择的多核苷酸被滤器保留,而未选择的多核苷酸穿过滤器。这样的方法可能特别适合于从包括大的多核苷酸和小的多核苷酸的样品中选择大的多核苷酸。

替代地,该方法可以包括通过使样品穿过滤器来选择多核苷酸,使得选择的多核苷酸穿过滤器,而未选择的多核苷酸被滤器保留。这样的方法可能特别适合于从包括小的多核苷酸和大的多核苷酸的样品中选择小的多核苷酸。

在进一步替代方案中,选择多核苷酸可以涉及通过滤器保留选择的多核苷酸,并进一步保留穿过滤器的选择的多核苷酸。当样品既包括小的多核苷酸以及又包括较大的多核苷酸并且期望单独选择小的多核苷酸和较大的多核苷酸时,这样的方法可能特别适用。

在本文提供的方法中,通常使用滤器从样品中选择多核苷酸。滤器通常是半渗透性介质,并且通常是多孔的。流体可以穿过滤器的孔,而固体则根据其相对于滤器的孔径的大小而被保留。小于滤器的孔径的颗粒可以穿过滤器,而大于滤器的孔径的颗粒则被滤器保留。优选地,在该方法中,可以对被滤器保留的多核苷酸进行干燥,例如通过使滤器与空气或其他气体流接触来对滤器进行干燥。可以使用任何气体。优选的气体包括空气、氮气、氩气等。

在这些方法中,可以使用任何合适的滤器。本领域技术人员将能够容易地根据样品和待选择的多核苷酸的性质选择适当的滤器。

可以基于其孔径选择在方法中使用的滤器。本领域技术人员将能够根据样品和待选择的多核苷酸的性质选择适当的孔径。优选地,滤器的孔径可以为从约0.01μm至约100μm,例如从约0.01μm至约25μm;诸如从0.01μm至约5μm;更优选从约0.1μm至约1μm,例如从约0.2μm至约0.6μm,例如从约0.4至约0.5μm。具有根据这些方法使用的适当大小的滤器可以从供应商诸如康宁(corning)(美国)商购获得,并且例如可获得的孔径包括0.1μm、0.2μm、0.45μm;5μm等。

滤器可以例如是膜滤器。膜滤器可以以任何合适的配置使用。例如,膜滤器可以用作“瓶顶”滤器或针筒式滤器。在本文提供的方法中,针筒式滤器是优选的。针筒式滤器可以从例如康宁(美国)商购,也可以出于预期的应用而专门制造。优选地,针筒式滤器具有的死体积小于100μl,更优选地小于50μl,例如小于20μm,更优选小于10μl。

适用于本文提供的方法的针头(例如,当滤器为针筒式滤器时)包括具有的体积为约0.1ml至约25ml或约50ml,诸如从0.1至约5ml或10ml,优选地,从约1ml至约2ml的针头。可以使用任何合适的针头材料。优选的针头外壳材料包括那些耐样品中多核苷酸吸附的材料。优选的针头外壳材料包括玻璃和聚合物材料。用作针头外壳的优选的聚合物材料包括聚苯乙烯(ps)、丙烯酸共聚物(ac)、聚氯乙烯(pvc)和聚丙烯(pp)。

膜滤器可以由任何合适的材料制成。优选的材料包括聚合物。滤器可以优选地由多糖(包括改性的多糖)或合成聚合物制成。优选地,滤器材料包括以下或由以下组成:硝酸纤维素、乙酸纤维素、尼龙、聚醚砜、再生纤维素和/或聚四氟乙烯。更优选地,滤器材料包括以下或由以下组成:尼龙、乙酸纤维素、聚醚砜或再生纤维素,再更优选地,滤器材料包括以下或由以下组成:乙酸纤维素、聚醚砜或再生纤维素。

凝聚介质

如上文解释的,可以通过任何适当的处理步骤将多核苷酸从非球状形式转化为球状形式。优选地,在本文提供的方法中,可以使呈非球状形式的多核苷酸与凝聚介质接触以采用球状形式。因此,在方法中,步骤(i)优选地包括处理所述样品,使得所述样品中的所述多核苷酸采用球状形式,其中所述处理包括使所述样品与凝聚介质接触。

根据本文提供的方法选择多核苷酸涉及选择呈球状状态的多核苷酸。本领域技术人员应当理解,球状状态不包括多核苷酸的沉淀形式。由于多核苷酸的带电的磷酸盐主链与溶液中带正电荷的阳离子之间发生离子相互作用,因此会发生多核苷酸诸如dna的沉淀。降低这样的电荷的被筛选能力,例如通过向溶液中的多核苷酸添加溶剂,其中添加的溶剂的极性小于溶液中包括的溶剂的极性,因此可以防止引起多核苷酸从溶液中沉淀出来的足够的电荷筛选。因此,当方法包括通过使样品与凝聚介质接触来处理样品,使得样品中的多核苷酸采用球状形式时,使用不促进沉淀的凝聚介质是优选的。

凝聚介质是促进由非球状状态的多核苷酸形成球状状态的介质。在本文提供的方法中可以使用任何合适的凝聚介质。优选地,凝聚介质是包括亲水性聚合物的盐溶液。凝聚介质不会引起样品中的多核苷酸沉淀。

在用于本文提供的方法的优选的凝聚介质中,亲水性聚合物是聚醚或多糖。优选地,亲水性聚合物是聚醚。根据方法使用的用于凝聚介质中的优选的聚醚是聚乙二醇(peg)和改性的聚乙二醇。根据方法使用的用于凝聚介质中的优选的多糖包括葡聚糖和改性的葡聚糖(例如硫酸葡聚糖)。改性的和未改性的聚乙二醇和葡聚糖是可商购获得的,例如从sigmaaldrich。当聚醚是聚乙二醇时,可以使用任何合适的聚乙二醇。优选地,聚乙二醇具有的分子量为约2000da至约12000da;更优选地,约4000da至约10000da,例如,约6000da到约8000da。具有的分子量为约6000da的peg也称为peg6k;具有的分子量为约8000da的peg也称为peg8k,等。

在用于本文提供的方法的优选的凝聚介质中,盐溶液优选地包括(i)族或(ii)族金属盐。优选的金属盐是钠盐、钾盐、镁盐和钙盐。钠盐和钾盐是优选的,优选地为钠盐。可以使用任何合适的反离子(阴离子)。优选的阴离子包括卤根、硝酸根、磷酸根、碳酸根和有机阴离子,诸如乙酸根等。优选地金属盐为(i)族或(ii)族金属卤化物,优选地为氯化物。最优选地,金属盐是氯化钠或氯化钾,优选为氯化钠。

因此,在用于本文提供的方法的优选的凝聚介质中:

i)亲水性聚合物是聚酯或多糖,任选地,其中该亲水性聚合物是具有的分子量为2000至12000的聚乙二醇;和/或

ii)盐溶液包括(i)族或(ii)族金属盐,任选地其中金属盐是金属卤化物。

在用于本文提供的方法的优选的凝聚介质中,存在的亲水性聚合物浓度为从约10至约200mg/ml;更优选地从约20至约150mg/ml,例如从约30至约100mg/ml,例如从约40至约80mg/ml,优选地从约50至约70mg/ml,例如约60mg/ml。

在用于本文提供的方法的优选的凝聚介质中,存在的凝聚介质中的盐浓度为从约0.1m至约1m;更优选从约0.3至约0.8m,例如从约0.5至约0.7m,例如0.6m的浓度。

因此,在用于本文提供的方法的优选的凝聚介质中

i)在凝聚介质中的聚合物浓度为约10至约200mg/ml;和/或

ii)在凝聚介质中的盐浓度为约0.1至约1m。

因此,用于方法的特别优选的凝聚介质包括:

i)从约40mg/ml至约80mg/ml,优选地从约50mg/ml至约70mg/ml的具有的分子量为从约4000da至约10000da,优选地约从6000da至约8000da的聚乙二醇;

以及

ii)从约0.3m至约0.8m,优选地从约0.5m至约0.7m的(i)族或(ii)族金属卤化物,优选地氯化钠。

最优选地,凝聚介质是或包括约60mg/mlpeg6k和约0.6m氯化钠。

延伸介质

如上文解释的,可以通过任何适当的处理步骤将多核苷酸从球状形式转化为非球状形式。优选地,在本文提供的方法中,可以使球状形式的多核苷酸与延伸介质接触以采用非球状形式。因此,方法可以进一步包括:

iii)处理选择的多核苷酸,使得选择的多核苷酸采用非球状形式。

在这样的方法中,步骤(iii)优选地包括处理选择的多核苷酸,使得选择的多核苷酸采用非球状形式,其中处理包括使多核苷酸与延伸介质接触。

延伸介质是促进由球状状态的多核苷酸形成非球状状态的介质。在本文提供的方法中可以使用任何合适的延伸介质。优选地,延伸介质是不包括高浓度的亲水性聚合物的水溶液。优选地,延伸介质是不包括高浓度的盐的水溶液。在包括同时使用本文定义的凝聚介质和本文定义的延伸介质的实施方式中,优选地,延伸介质中的盐的浓度低于凝聚介质中的盐的浓度。在包括同时使用本文定义的凝聚介质和本文定义的延伸介质的实施方式中,优选地,延伸介质中的亲水性聚合物的浓度低于凝聚介质中的亲水性聚合物的浓度。优选地,延伸介质是或包括缓冲溶液。

因此,用于本文提供的方法的优选的延伸介质包括不含或基本上不含亲水性聚合物的水溶液。优选地,水溶液不含可以降解多核苷酸的酶,诸如dnase和rnase。水溶液可以任选地是水。优选地,水溶液是缓冲水溶液。可以使用任何合适的缓冲液。优选地,缓冲液是有机缓冲液,诸如tris(三(羟甲基)氨基甲烷)。优选地,缓冲液包括用于螯合金属的剂。合适的剂包括edta、柠檬酸和硼酸盐。edta是优选的。优选地,缓冲液包括tris和edta。优选地,存在的tris的浓度为从约1mm至约50mm,例如从约10mm至约20mm和/或优选地,存在的edta的量为从约0.1mm至约5mm,例如从约1mm至约2mm。优选地,缓冲液具有的ph为从约6至约9,例如从约7到约8。

因此,用于本文提供的方法的优选的延伸介质:

i)包括从约1mm至约50mm,优选地从约10mm至约20mm的有机缓冲液,优选地为tris;

ii)包括从约0.1mm至约5mm,优选地从约1mm至约2mm的螯合剂,优选地edta;以及

iii)具有的ph从约6至约9。

最优选地,延伸介质是以下或包括以下:te缓冲液(约10mmtris;约1mmedta;具有约8的ph)。

当方法包括使用滤器选择多核苷酸时,一旦选择,选择的多核苷酸可以不含滤器。替代地,选择的多核苷酸可以部分或全部结合至滤器。因此,在以下方法:包括通过用滤器过滤样品来选择多核苷酸并且还包括处理选择的多核苷酸,使得选择的多核苷酸通过使选择的多核苷酸与延伸介质接触而采用非球状形式中,优选地,使用延伸介质从滤器中洗脱选择的多核苷酸。通过用延伸介质洗涤滤器可以实现从滤器洗脱选择的多核苷酸。当滤器是针筒式滤器时,使用针头通过针头滤器泵送或抽取洗脱介质。这样的方法可以是有益处的,因为处理选择的多核苷酸,使得选择的多核苷酸采用非球状形式,并且可以同时实现从滤器洗脱选择的多核苷酸,这可以提供简化处理、提高速度和减小选择的核苷酸的污染范围的优点。

样品

样品包括多核苷酸的混合物。样品可以是包括多核苷酸的任何合适的样品。多核苷酸可以例如包括pcr反应的产物、基因组dna、内切核酸酶消化的产物和/或dna文库。

样品可以是生物样品。可以在从任何生物或微生物获得或提取的样品上体外进行该方法。该生物或微生物通常是古细菌、原核或真核生物,并且通常属于五个王国之一:植物界、动物界、真菌、原核生物和原生生物。可以在从任何病毒获得或提取的样品上体外进行该方法。

样品优选地是流体样品。样品通常包括体液。体液可从人或动物获得。人或动物可能患有、疑似患有疾病或有患病风险。样品可以是尿液、淋巴液、唾液、粘液、精液或羊水,但优选地是全血、血浆或血清。通常,样品是人来源的,但替代地,它可以来自其他哺乳动物,诸如来自商业养殖的动物,诸如马、牛、绵羊或猪,或者替代地可以是宠物,诸如猫或狗。

替代地,通常从以下商业作物获得植物来源的样品:诸如谷类作物、豆科作物、水果或蔬菜,例如小麦、大麦、燕麦、油菜、玉米、大豆、大米、香蕉、苹果、西红柿、土豆、葡萄、烟草、豆类、扁豆、甘蔗、可可、棉花、茶或咖啡。

样品可以是非生物样品。非生物样品优选地是流体样品。非生物样品的实例包括手术液、水诸如饮用水、海水或河水,以及用于实验室测试的试剂。

可以在执行方法之前对样品进行处理,例如通过离心或穿过过滤掉不需要的分子或细胞诸如红细胞的膜。可以在取样后立即对样品进行该方法。样品通常还可以在该方法之前被存储,优选地低于-70℃。

样品可以包括基因组dna。可以使基因组dna片段化。可以通过任何合适的方法使dna片段化。例如,片段化dna的方法是本领域已知的,这样的方法可以使用转座酶,诸如mua转座酶。优选地,不对基因组dna进行片段化。

通过该方法分离的多核苷酸可以是例如dna、rna和/或dna/rna杂合体。dna可以是双链或单链的。样品可以包括dna,并且选择的和未选择的多核苷酸可以各自包括dna。替代地,样品可以包括rna,并且选择的和未选择的多核苷酸可以各自包括rna。在进一步替代方案中,样品可以包括dna和rna,并且选择的多核苷酸可以包括dna,而未选择的多核苷酸可以包含rna;或选择的多核苷酸可以包括rna,未选择的多核苷酸可以包括dna。优选地,样品中的多核苷酸是双链dna。

因此,方法可以用于从包括目标多核苷酸的亚群和长度大于和/或小于期望的亚群的多核苷酸的群体中分离出目标多核苷酸的期望的亚群。例如,方法可以用于从包括较短的多核苷酸的亚群和较长的多核苷酸(例如,较长的dna,诸如双链dna)亚群的群体中分离较短的多核苷酸(例如,dna,诸如双链dna)的亚群。方法可以用于从包括较长的多核苷酸的亚群和较短的多核苷酸(例如,较长的dna,诸如双链dna)亚群的群体中分离较长的多核苷酸(例如,dna,诸如双链dna)的亚群。方法通常不包括多核苷酸的沉淀。方法通常包括通过滤器过滤样品。

换句话说,方法可以用于从包括具有的长度大于阈值的多核苷酸的样品中选择具有的长度小于阈值的多核苷酸(例如dna,诸如双链dna)。方法可以用于从包括具有的长度小于阈值的多核苷酸的样品中选择具有的长度大于阈值的多核苷酸(例如dna,诸如双链dna)。在这样的方法中的阈值可以是例如大约1kb、2kb、5kb、10kb、15kb、20kb、25kb、50kb、100kb等。这样,该方法可以用于选择来自更广泛的多核苷酸群体的具有的长度小于1kb、2kb、5kb、10kb、15kb、20kb、25kb、50kb或100kb等的多核苷酸(例如dna,诸如双链dna)等。方法可以用于选择来自更广泛的多核苷酸群体的具有的长度大于1kb、2kb、5kb、10kb、15kb、20kb、25kb、50kb或100kb等的多核苷酸(例如dna,例如双链dna)。方法通常不包括多核苷酸的沉淀。方法通常包括通过滤器过滤样品。

选择的多核苷酸的修饰

样品中的选择的多核苷酸可以是修饰的或未修饰的。样品中的选择的多核苷酸可以在选择之前进行修饰并随后进行选择,或者它们可以最初是未修饰的然后在选择后进行修饰。可以进行任何适当的修饰。例如,可以将一种或多种测序衔接子添加至样品中的多核苷酸的一端或两端。例如,衔接子可以被设计为单端或双端附连。合适的衔接子定义如下。

测序衔接子

衔接子可以附连至选择的多核苷酸的一端或两端。如以下更详细描述的,核酸操作酶可以任选地与衔接子预结合。在酶不沿着多核苷酸移动的条件下,核酸操作酶可以与每个选择的多核苷酸的一端或两端预结合。酶可以在衔接子上失速。由于没有燃料和/或必需的辅因子,酶可能会失速。在燃料存在下酶可能失速,使用可以去除/克服的失速来引发酶的运动(例如,通过立足点位移)。

可以将相同的衔接子添加到选择的多核苷酸的两端。备选地,可以将不同的衔接子添加至每个选择的多核苷酸的两端。可以将衔接子添加到每个选择的多核苷酸的仅一端。向多核苷酸添加衔接子的方法是本领域已知的。衔接子可以例如通过连接,通过点击化学,通过标记,通过拓扑异构化或通过任何其他合适的方法附连至多核苷酸。

衔接子优选地能够附连至核酸操作酶可以结合的多核苷酸的端。衔接子优选地是合成的或人工的。衔接子优选地包括聚合物。聚合物优选地是多核苷酸。多核苷酸衔接子可以包括dna、rna、修饰的dna(诸如碱性dna)、rna、pna、lna、bna和/或peg。衔接子更优选地包括单链和/或双链dna或rna。

衔接子可以包括可以与核酸操作酶结合的单链多核苷酸。

在一种实施方式中,衔接子是y形衔接子。y衔接子通常是多核苷酸衔接子。y衔接子通常是双链的,并且包括(a)在一端,两条链杂交在一起的区域,和(b)在另一端,两条链不互补的区域。链的非互补部分形成突出端。由于两条链通常不像双链部分那样彼此不杂交,所以在y衔接子中非互补区域的存在使衔接子具有y形状。核酸操作酶可以结合至突出端和/或双链区。在一种实施方式中,第一核酸操作酶可以结合至双链区,以及第二核酸操作酶可以结合至突出端。突出端上的第二酶优选地被间隔子失速。在一种实施方式中,y衔接子包括如本文更详细描述的膜锚或孔锚。锚可以附连至与核酸操作酶结合的突出端互补并因此与其杂交的多核苷酸。

y衔接子的非互补链之一可以包括前导序列,当其与跨膜孔接触时,其能够穿入孔中。前导序列通常包括聚合物。聚合物优选带负电荷。聚合物优选是多核苷酸,诸如dna或rna、修饰的多核苷酸(例如脱碱基dna)、pna、lna、聚乙二醇(peg)或多肽。前导序列优选地包括多核苷酸,更优选地包括单链多核苷酸。单链前导序列最优选地包括dna的单链,诸如聚dt段。前导序列优选地包括一个或多个间隔子。前导序列可以是任何长度,但是通常长度为10至150个核苷酸,诸如长度为20至120、30至100、40至80或50至70个核苷酸。

衔接子可以是发夹环衔接子。发夹环衔接子是包括单个多核苷酸链的衔接子,其中多核苷酸链的端能够彼此杂交或被杂交至彼此,并且其中多核苷酸的中间段形成环。可以使用本领域已知的方法设计合适的发夹环衔接子。环可以是任何长度。环的长度优选地从约2至400、从5至300、从10至200、从20至100个核苷酸或从30至50个。由多核苷酸链的两个杂交的段形成的衔接子的双链部分称为茎。发夹环的茎的长度优选地从4至200,诸如5至150、10至100、20至90、30至80、40至70或50至60个核苷酸对。如果核酸操作酶被绑定至发夹衔接子或结合至发夹衔接子,则其通常结合至发夹的环,而不是茎。

如果选择的多核苷酸是双链的,则可以将y衔接子添加至一端,并将发夹环衔接子添加至另一端。在该实施方式中,可以将核酸操作酶绑定至y衔接子和/或发夹衔接子。

衔接子可以以任何方式附连至选择的多核苷酸。衔接子优选地共价附连至选择的多核苷酸。衔接子可以连接至选择的多核苷酸。衔接子可以连接至多核苷酸的任一端,即5’或3’端,或连接至多核苷酸的两端,即至5’端和至3’端。可以使用本领域已知的任何方法将衔接子连接至多核苷酸。可以在不存在atp或使用γ-s-atp(atpγs)代替atp的情况下将衔接子连接至多核苷酸。优选的是在不存在atp其中将核酸操作酶连接至衔接子的情况下,将衔接子连接至多核苷酸。可以使用连接酶,诸如t4dna连接酶、大肠杆菌(e.coli)dna连接酶、taqdna连接酶、tmadna连接酶和9ondna连接酶来连接衔接子。在方法的步骤(i)之前,可以从样品中去除连接酶。可以使用拓扑异构酶附连衔接子。拓扑异构酶可以是例如moietyclassification(部分分类)(ec)组5.99.1.2和5.99.1.3的成员。

可以根据本文提供的方法使用的衔接子可以结合有核酸操作酶,所述核酸操作酶被绑定,使得其沿衔接子的移动被阻碍或阻止,直到使其在施加的电势下与跨膜孔接触为止。在这种实施方式中,衔接子优选地包括多核苷酸和/或核酸操作酶优选地是转位酶或解旋酶。可以通过在间隔子处失速而阻碍或阻止核酸操作酶的移动,例如,如wo2014/135838所公开的。wo2014/135838中公开的酶和间隔子的任何配置均可用在分离多核苷酸的方法中。

间隔子优选地是衔接子的一部分,例如间隔子可以中断衔接子中的多核苷酸序列。衔接子中可以有任意数目的间隔子,例如1、2、3、4、5、6、7、8、9、10或更多个间隔子。在目标多核苷酸中优选地存在一、二、四或六个间隔子。核酸操作酶优选地在朝向衔接子的端的间隔子的一侧,该衔接子附连至多核苷酸或用于附连至多核苷酸。替代地,核酸操作酶可以在间隔子的远离衔接子端的一侧,该衔接子附连至多核苷酸或用于附连至多核苷酸。替代地,第二酶可以位于间隔子上。

间隔子提供了即使在存在燃料和必需的辅酶和/或辅因子的情况下,酶也无法克服的能量屏障。间隔子可以通过降低酶的吸引力(例如,间隔子中核苷酸的碱基可能缺失)或通过物理上阻断一种或多种解旋酶的移动(例如,间隔子可以包括庞大的化学基团)来使酶失速。

间隔子可以包括阻碍或阻止酶沿着目标多核苷酸移动的任何分子或分子组合。在没有跨膜孔和施加的电势的情况下,确定酶是否在间隔子上失速是简单的。例如,可以通过聚丙烯酰胺凝胶电泳(page)来测量酶移动通过间隔子并移位dna的互补链的能力。

间隔子通常包括线性分子,诸如聚合物。间隔子通常具有与目标多核苷酸不同的结构。例如,如果目标多核苷酸是dna,则一个或多个间隔子通常不是dna。特别地,如果目标多核苷酸是脱氧核糖核酸(dna)或核糖核酸(rna),则间隔子优选地包括肽核酸(pna)、甘油核酸(gna)、苏糖核酸(tna)、锁核酸(lna)或带有核苷酸侧链的合成聚合物。间隔子可以包括与衔接子中其他核苷酸反向的一个或多个核苷酸。例如,当多核苷酸在5'至3'方向上时,间隔子可以包括在3'或5'方向上的一个或多个核苷酸。

间隔子优选地包括一个或多个硝基吲哚,诸如5-硝基吲哚、肌苷、吖啶、2-氨基嘌呤、2-6-二氨基嘌呤、5-溴-脱氧尿苷、反向的胸苷(反向的dt)、反向的双脱氧胸苷(ddt)、双脱氧胞苷(ddc)、5-甲基胞苷、5-羟甲基胞苷、2'-o-甲基rna碱基、异脱氧胞苷(iso-dc)、异脱氧鸟苷(iso-dg)、ispc3基团(即缺少糖和碱基的核苷酸)、光可裂解(pc)基团、己二醇基团、间隔子9(isp9)基团、间隔子18(isp18)基团、聚合物或硫醇连接基。间隔子可以包括这些基团的任何组合。这些基团中的许多可以从(integrateddna)商购获得。

间隔子可以包含例如2、3、4、5、6、7、8、9、10、11、12或更多个2-氨基嘌呤、2-6-二氨基嘌呤、5-溴-脱氧尿苷、反向的dt、ddt、ddc、5-甲基胞苷、5-羟甲基胞嘧啶核苷、2'-o-甲基rna碱基、iso-dc、iso-dg、ispc3基团、pc基团、己二醇基团和硫醇连接基、2、3、4、5、6、7、8、9、10、11、12或更多。间隔子优选地包括2、3、4、5、6、7、8或更多个isp9基团和/或2、3、4、5或6或更多个isp18基团。最优选的间隔子是四个isp18基团。

在间隔子包括聚合物的情况下,聚合物优选地为多肽或聚乙二醇(peg)。多肽优选地包括2、3、4、5、6、7、8、9、10、11、12或更多个氨基酸。peg优选地包括2、3、4、5、6、7、8、9、10、11、12或更多个单体单元。

间隔子可以包括一个或多个脱碱基核苷酸(即,缺少核碱基的核苷酸),诸如2、3、4、5、6、7、8、9、10、11、12或更多个脱碱基核苷酸。在脱碱基核苷酸中,核碱基可以被-h(idsp)或-oh替代。通过从一个或多个相邻核苷酸中去除碱基,可以将脱碱基间隔子插入到目标多核苷酸中。例如,可以将多核苷酸修饰为包括3-甲基腺嘌呤、7-甲基鸟嘌呤、1,n6-亚乙烯基腺嘌呤肌苷或次黄嘌呤,并且可以使用人烷基腺嘌呤dna糖苷酶(haag)从这些核苷酸中去除核碱基。替代地,可以将多核苷酸修饰成包括尿嘧啶,并且用尿嘧啶-dna糖苷酶(udg)去除核碱基。在一实施方式中,一个或多个间隔子不包括任何脱碱基核苷酸。

核酸操作酶可以在线性分子间隔子之前或之上失速。如果使用线性分子间隔子,则衔接子优选地包括邻近最接近衔接子的端的间隔子的端的多核苷酸的双链区,所述衔接子的端附连至多核苷酸或用于附连至多核苷酸。杂交的双链区优选地在间隔子上终止,并且不包括优选地邻近该间隔子形成突出端的间隔子。可以将另外的多核苷酸链与突出端杂交以形成另外的双链区。另外的双链区通常有助于使第二酶在间隔子上失速。另外的多核苷酸通常由与目标多核苷酸相同的核苷酸形成,但是可以由不同的核苷酸形成。例如,其他多核苷酸可以由锁核酸(lna)或桥连核酸(bna)形成。

如果使用线性分子间隔子,则衔接子优选地在间隔子的端包括阻断分子。阻断分子可以有助于确保第二酶在间隔子上保持失速。阻断分子可以是物理上导致一种或多种解旋酶失速的任何化学基团。阻断分子可以是多核苷酸的双链区。

合适的化学基团包括侧化学基团(pendantchemicalgroups)。化学基团可以附连至目标多核苷酸中的一个或多个核碱基和/或附连至多核苷酸主链。可以存在任何数目的化学基团,诸如1、2、3、4、5、6、7、8、9、10、11、12或更多。合适的基团的实例包括但不限于荧光团、链霉亲和素和/或生物素、胆固醇、亚甲蓝、二硝基苯酚(dnp)、地高辛和/或抗地高辛和二苄基环辛炔基团。

如果衔接子中存在多个间隔子,则间隔子可以相同或不同。例如,一个间隔子可以包括上文讨论的线性分子之一,而另一个间隔物可以包括物理上使第二酶失速的一个或多个化学基团。间隔子可以包括上文讨论的任何线性分子和一个或多个化学基团,诸如一个或多个脱碱基基团和荧光团。

大多数核酸操作酶诸如解旋酶会结合dna并沿dna移动,因此可能会使用不是dna的任何物来使其失速。

在不存在跨膜孔和施加的电势的情况下,间隔子优选地能够在游离核苷酸存在和/或辅因子存在的情况下使核酸操作酶失速。间隔子使酶失速的能力可能受盐浓度的影响。使用的盐浓度越高,一个或多个间隔子需要的越短。在不存在跨膜孔和施加的电势的情况下,间隔子优选地能够以小于约100mm的盐浓度使核酸操作酶失速。

在游离核苷酸和辅因子存在下,可以用于使处理dna的酶失速的间隔子的实例包括:在1m盐下,4个ispc3基团或2个isp18基团;在100-1000mm盐下,4个isp18基团或6个isp9基团;在<100-1000mm盐下,6个isp18基团、12个ispc3基团或20个ispc3基团。可以通过使酶后面的dna链退火,例如通过支点位移将酶“推入”失速化学反应。替代地,可以使用无法转位的条件来该酶“失速”。例如,可以将衔接子保持在酶不能转位和/或结合燃料的ph下。小分子抑制剂可以替代地用于使酶失速。

可以附连至选择的多核苷酸的衔接子可以包括标签。标签可以与衔接子杂交或可以与酶附连。合适的标签是本领域已知的。合适的标签的实例包括但不限于生物素、可选择的多核苷酸序列、抗体、抗体片段诸如fab和scsv、抗原、多核苷酸结合蛋白、聚组氨酸尾和gst标签。生物素与用抗生物素蛋白诸如链霉抗生物素蛋白包覆的表面特异性结合。可选择的多核苷酸序列与用互补序列包覆的表面特异性结合(即杂交)。

衔接子和/或标签可以包括可被切割、切刻、裂解或水解的区域。合适的位点是本领域已知的。合适的位点包括但不限于rna区域、包括脱硫生物素和链霉抗生物素蛋白的区域、二硫键、可光裂解区域和限制酶位点,或被酶选择性裂解的其他位点。

除了标签之外或代替标签,衔接子可以包括用于附连另外的多核苷酸和/或其他分子诸如例如蛋白质的隐藏位点。除了标签之外或代替标签,衔接子可以包括用于附连另外的多核苷酸和/或其他分子诸如例如蛋白质的暴露位点。用于附连另外的多核苷酸的位点可以例如是能够与互补的多核苷酸链或与包括或由通用碱基诸如肌苷组成的链杂交的单链区域。互补多核苷酸链可以是dna、rna、dna/rna杂合体、pna、lna、bna和/或包括修饰的碱基或由修饰的碱基组成的链。修饰的碱基可以例如是脱碱基核苷酸,诸如其中核碱基被-h(idsp)或-oh替代的核苷酸。修饰的碱基可以例如包括3-甲基腺嘌呤、7-甲基鸟嘌呤、1,n6-亚乙烯基腺嘌呤肌苷或次黄嘌呤中的一种或多种,并且可以使用人烷基腺嘌呤dna糖苷酶(haag)从这些核苷酸中去除核碱基。可以将多核苷酸修饰成包括尿嘧啶,并且用尿嘧啶-dna糖苷酶(udg)去除核碱基。修饰的碱基可以例如是2'-o-甲基(2'ome)和/或2'-氟碱基。互补链或通用链可以存在于衔接子诸如y衔接子中以用于使用跨膜孔表征选择的多核苷酸,例如,另外的多核苷酸可以是衔接子,诸如y衔接子。

用于附连分子的位点可以例如是在其在暴露时可以结合至单链dna结合蛋白(ssb),诸如大肠杆菌单链结合蛋白的单链dna段。

另外的多核苷酸或其他分子可以例如被标记,允许连接至与该链杂交的多核苷酸,或者相反地,以防止连接至该链杂交的多核苷酸,允许消化,或者相反地,防止消化。连接可以是例如使用连接酶的直接连接或诸如使用点击化学的间接连接。

除标签之外或代替标签,衔接子可以包括隐藏位点,当该位点变为暴露时,该位点可以与另一条链连接。除标签之外或代替标签,衔接子可以包括用于附连可连接至另一条链的另外的多核苷酸的暴露位点。

除标签之外或代替标签,衔接子可以包括隐藏位点,当其变为暴露时,其允许消化。除标签之外或代替标签,衔接子可以包括暴露位点,当其变为暴露时,其允许消化。除标签之外或代替标签,衔接子可以包括适合于隐藏或暴露的点击化学附连的化学基团。

衔接子可以是单链和/或双链的。衔接子可以例如包括单链段和双链段。衔接子可以附连至双链多核苷酸的一条链,或优选地附连至两条链。衔接子可以附连至多个多核苷酸的每一个的一端或两端。

优选地,当用测序衔接子修饰选择的核苷酸时,(i)核酸操作酶和/或(ii)膜锚或跨膜孔锚可以附连至测序衔接子。

核酸操作酶

可以将核酸操作酶附连至测序衔接子,例如以根据本文公开的方法促进选择的多核苷酸的表征。例如,在包括使选择的多核苷酸与跨膜孔接触的方法中,核酸操作酶可以便于选择的多核苷酸与孔的相互作用。

核酸操作酶可以是能够结合至多核苷酸并且能够处理多核苷酸的任何蛋白质。在处理多核苷酸时,核酸操作酶沿着多核苷酸移动。酶的运动方向是一致的。一致的移动意指酶从多核苷酸的5'端移动到3'端,或反之亦然。酶可以在处理多核苷酸时对其进行修饰。发生多核苷酸的修饰不是必需的。因此,核酸操作酶可以是保留其沿着多核苷酸移动的能力的修饰的酶。

核酸操作酶可以是例如移位酶、解旋酶、聚合酶或外切核酸酶。

核酸操作酶可以沿着单链多核苷酸诸如单链dna或单链rna移动,或者可以沿着双链多核苷酸诸如双链dna或dna/rna杂交体移动。例如,可以使用作用于单链或双链dna的解旋酶或移位酶。

解旋酶可以是例如超家族1或超家族2的成员。所述解旋酶是优选地以下家族之一的成员:pif1样、upf1样、uvrd/rep、ski样、rad3/xpd、ns3/nph-ii、dead、deah/rha、recg样、recq样、t1r样、swi/snf样和rig-i样。这些家族中的前三个家族在超家庭1中以及后十个家族在超家庭2中。解旋酶更优选地是以下亚家族之一的成员:recd、upf1(rna)、pcra、rep、uvrd、hel308、mtr4(rna)、xpd、ns3(rna)、mss116(rna)、prp43(rna)、recg、recq、t1r、rapa和hef(rna)。那些亚家族中的前五个亚家族在超家族1中,以及后十一个亚家族在超家族2中。upf1、mtr4、ns3、mss116、prp43和hef亚家族的成员是rna解旋酶。其他亚家族的成员是dna解旋酶。

解旋酶可以是多聚或寡聚解旋酶。换句话说,解旋酶可能需要形成多聚体或寡聚体诸如二聚体以起作用。在这样的实施方式中,两个或更多个部分不能在不同的单体上。解旋酶优选地是单聚的。换句话说,解旋酶优选地不需要形成多聚体或寡聚体诸如二聚体即可起作用。例如,hel308、recd、trai和xpd解旋酶都是单聚解旋酶。这些将在下文更详细地讨论。确定解旋酶是寡聚/多聚还是单聚的方法是本领域已知的。例如,可以检查使用解旋酶解缠的放射性标记的或荧光标记的多核苷酸的动力学。替代地,可以使用尺寸排阻色谱法分析解旋酶。

单聚解旋酶可以包括附连在一起的若干结构域。例如,trai解旋酶和trai亚组解旋酶可以包括两个recd解旋酶结构域、释放酶结构域和c末端结构域。这些结构域通常形成能够起作用而不会形成寡聚体的单聚解旋酶。

合适的解旋酶的具体实例包括hel308、ns3、dda、uvrd、rep、pcra、pif1和trai。这些解旋酶通常作用于单链dna。可以沿着双链dna的两条链移动的解旋酶的实例包括ftfk和六聚酶复合物,或多亚基复合物,诸如recbcd。

解旋酶可以是,例如,在wo2013/057495、wo2013/098562、wo2013098561、wo2014/013260、wo2014/013259、wo2014/013262和wo/2015/055981中公开的解旋酶、修饰的解旋酶或解旋酶构建体中的任何一个。hel308解旋酶优选地包括在wo2014/013260中公开的任何一种或多种修饰。dda解旋酶优选地包括在wo2015/055981和/或wo2016/055777中公开的任何一种或多种修饰。

核酸操作酶可以是聚合酶。当聚合酶沿着多核苷酸移动时,聚合酶通常将合成互补的多核苷酸链。在其他方面,可以以类似于移位酶的方式使用聚合酶。聚合酶可以是保留其沿着多核苷酸移动的能力,但是不合成互补链的修饰的聚合酶。聚合酶可以是,例如,3173dna聚合酶(可从corporation商购获得)、sd聚合酶(可从商购获得)或其变体。酶优选地是phi29dna聚合酶或其变体。

互补链的合成可能是有利的,因为它增加了多核苷酸的量。增加多核苷酸的量可以提高使用通过该方法选择的多核苷酸的任何后续测定的灵敏度。当多核苷酸包含修饰的碱基时,聚合酶可以用于合成包含正常碱基的互补链,这可能对于使用多核苷酸的后续测定也是有利的。

使用聚合酶可以具有的优点是其可以用于区分受损的多核苷酸与未受损的多核苷酸。例如,聚合酶可能无法穿过dna中的脱碱基核苷酸或胸腺嘧啶二聚体。因此,可以使用使用聚合酶的方法将受损的多核苷酸从未受损的多核苷酸分离。

核酸操作酶可以是外切核酸酶。外切核酸酶通常在其沿多核苷酸移动时消化该多核苷酸。外切核酸酶通常裂解双链多核苷酸的一条链以形成单独的核苷酸或核苷酸的较短链,诸如二核苷酸或三核苷酸。当使用外切核酸酶时,最终选择的多核苷酸是未消化链的双链多核苷酸,或其中一条链被部分消化而另一条链完整的多核苷酸。在方法中可以使用任何外切核酸酶。用于方法的优选的酶包括来自大肠杆菌的外切核酸酶iii酶、来自大肠杆菌的外切核酸酶i、噬菌体λ外切核酸酶和衍生自来自大肠杆菌的外切核酸酶iii的酶、来自大肠杆菌的外切核酸酶i、噬菌体λ外切核酸酶。衍生自这些外切核酸酶之一的酶优选地包括负责结合至核酸并且用于消化核酸的结构域(催化结构域)。

核酸操作酶优选地是一种能够处理长的多核苷酸链而不与多核苷酸解结合的酶。通常,核酸操作酶能够沿着从500个核苷酸碱基对至最多达2.5亿个核苷酸碱基对的多核苷酸链移动,诸如从1,000、2,000、5,000、10,000、50,000或100,000个核苷酸碱基对至最多达2亿、1亿、1千万或1百万个核苷酸碱基对。

酶可以是修饰的或未修饰的。可以修饰酶以形成封闭的复合物。封闭的复合物是其中多核苷酸结合位点被修饰使得该酶以这样的方式封闭在多核苷酸周围,以使酶到达多核苷酸的端时不会从多核苷酸上脱落的酶。用于修饰酶以产生封闭的复合物的合适的封闭复合酶的实例和方法在例如wo2014/013260和wo2015/055981中公开。

当核酸操作酶是未修饰的聚合酶时,该酶通常能够沿着最高达30kb的多核苷酸移动。可以通过修饰聚合酶以封闭一个开口来增加移动距离,当该酶沿着多核苷酸的一部分进入时,多核苷酸能够从中解开。对于这样的修饰的聚合酶,可以通过聚合酶处理上文指定的更长的多核苷酸长度。

可以将膜锚和跨膜孔锚附连至测序衔接子,例如以根据本文公开的方法促进选择的多核苷酸的表征。例如,在包括使选择的多核苷酸与跨膜孔接触的方法中,膜锚或跨膜孔锚可以促进选择的多核苷酸在跨膜孔周围的定位。

锚可以是可插入到膜中的多肽锚和/或疏水锚。疏水锚优选地是脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸酯或生育酚。锚可以包括硫醇、生物素或表面活性剂。

一方面,锚可以是生物素(用于结合至链霉抗生物素蛋白)、直链淀粉(用于结合至麦芽糖结合蛋白或融合蛋白)、ni-nta(用于结合至聚组氨酸或聚组氨酸标记的蛋白)或肽(诸如抗原)。

锚可以包括一个接头,或2、3、4或更多个接头。优选的接头包括但不限于聚合物,诸如多核苷酸、聚乙二醇(peg)、多糖和多肽。这些接头可以是线性的、支化的或环状的。例如,接头可以是环状多核苷酸。衔接子可以与环状多核苷酸接头上的互补序列杂交。一个或多个锚或一个或多个接头可以包括可被切割或分解的组分,诸如限制性位点或光不稳定基团。接头可以用马来酰亚胺基团官能化以附连至蛋白质中的半胱氨酸残基上。合适的接头在wo2010/086602中描述。

锚优选地是胆固醇或脂肪酰基链。例如,可以使用具有的长度为6至30个碳原子的任何脂肪酰基链,诸如十六烷酸。

在wo2012/164270和wo2015/150786中公开了合适的锚的实例以及将锚附连到衔接子的方法。

跨膜孔

本文提供的方法优选地进一步包括使选择的多核苷酸与跨膜孔接触。更优选地,该方法包括使选择的多核苷酸与跨膜孔接触,以及从而表征选择的多核苷酸。如本文描述的,可以实现选择的多核苷酸的表征。

跨膜孔是某种程度上跨膜的结构。它允许由施加的电势驱动的水合离子在膜上或膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流向膜的另一侧。然而,跨膜孔不必要穿过膜。它可能在一端封闭。例如,孔可以是膜中的孔、间隙、通道、沟槽或狭缝,水合离子可以沿着膜流入或流入到膜中。

在本文提供的方法中可以使用任何跨膜孔。孔可以是生物的或人工的。合适的孔包括但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是dna折纸孔(origamipore)(langecker等人,科学(science),2012年;338:932-936)。合适的dna折纸孔在wo2013/083983中公开。

跨膜孔优选地是跨膜蛋白质孔。跨膜蛋白孔是允许水合离子(例如多核苷酸)从膜的一侧流向膜的另一侧的多肽或多肽集合。在本文提供的方法中,跨膜蛋白孔能够形成允许由施加的电势驱动的水合离子从膜的一侧流向另一侧的孔。跨膜蛋白孔优选地允许多核苷酸从膜诸如三嵌段共聚物膜的一侧流到另一侧。跨膜蛋白孔允许多核苷酸移动通过孔。

跨膜蛋白孔可以是单聚体或寡聚体。孔优选地由若干重复的亚基,诸如至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个或至少16个亚基组成。孔优选地是六聚体、七聚体、八聚体或非聚体的孔。孔可以是同质寡聚物或异质寡聚物。

跨膜蛋白孔通常包括离子可通过其流动的桶或通道。孔的亚基通常围绕中心轴,并向跨膜桶或通道或跨膜α-螺旋束或通道提供链。

跨膜蛋白孔的桶或通道通常包括便于与分析物,诸如核苷酸、多核苷酸或核酸的相互作用的氨基酸。这些氨基酸优选地位于桶或通道的缢痕附近。跨膜蛋白孔通常包括一个或多个带正电荷的氨基酸,诸如精氨酸、赖氨酸或组氨酸或芳香族氨基酸,诸如酪氨酸或色氨酸。这些氨基酸通常便于孔与核苷酸、多核苷酸或核酸之间的相互作用。

根据本文提供的方法使用的跨膜蛋白孔可以衍生自β-桶孔或α-螺旋束孔。β-桶孔包括由β-链形成的桶或通道。合适的β-桶孔包括但不限于β-毒素,诸如α-溶血素、炭疽毒素和杀白细胞素,以及细菌的外膜蛋白/孔蛋白,诸如耻垢分枝杆菌孔蛋白(msp),例如mspa、mspb、mspc或mspd、csgg、外膜孔蛋白f(ompf)、外膜孔蛋白g(ompg)、外膜磷脂酶a和奈瑟菌(neisseria)自转运体脂蛋白(nalp)和其他孔,诸如lysenin。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,诸如wza和clya毒素。

跨膜孔可以衍生自或基于msp、α-溶血素(α-hl)、lysenin、csgg、clya、sp1和溶血性蛋白质呋喃糖毒素c(frac)。

跨膜蛋白孔优选地衍生自csgg,更优选地衍生自来自大肠杆菌str.k-12亚菌株mc4100的csgg。这样的孔将是寡聚的,并且通常包括衍生自csgg的7、8、9或10个单体。孔可以是衍生自包括相同单体的csgg的同质寡聚孔。替代地,孔可以是衍生自包括至少一种不同于其他单体的单体的csgg的异质寡聚孔。在wo2016/034591中公开了衍生自csgg的合适的孔。

跨膜孔优选地衍生自lysenin。在wo2013/153359中公开了衍生自lysenin的合适的孔。

跨膜孔优选地衍生自或基于α-溶血素(α-hl)。野生型α-溶血素孔由7个相同的单体或亚基形成(即,它是七聚的)。α-溶血素孔可以是α-溶血素-nn或其变体。变体优选地包括在位置e111和k147处的n个残基。

跨膜蛋白孔优选地衍生自msp,更优选地衍生自mspa。在wo2012/107778中公开了衍生自mspa的合适的孔。

跨膜孔优选地是msp,α-溶血素(α-hl)、lysenin、csgg、clya、sp1或溶血性蛋白呋喃糖毒素c(frac)的变体。

给定(“参考”)多肽的变体是具有不同于参考多肽的氨基酸序列并且保留其形成孔的能力的氨基酸序列的多肽。可以使用本领域已知的任何方法来测定变体形成孔的能力。例如,变体可以与其他适当的亚基一起插入到两亲性层中,并且可以确定其寡聚形成孔的能力。用于将亚基插入膜诸如两亲性层的方法是本领域已知的。例如,亚基可以以纯化的形式悬浮在含有三嵌段共聚物膜的溶液中,使得其扩散至膜并通过结合至膜及组装成功能状态而被插入。替代地,可以使用在m.a.holden,h.bayley美国化学学会期刊(j.am.chem.soc.)2005,127,6502-6503和wo2006/100484中描述的方法将亚基直接插入到膜中。

在给定参考序列的整个长度上,基于氨基酸的相似性或同一性,变体优选地与该序列至少50%同源。更优选地,基于整个长度上给定参考序列的氨基酸的相似性或同一性,变体可以为至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选地至少95%、97%或99%同源。在100个或更多个例如125、150、175或200或更多个连续氨基酸的一段中,可以至少有80%,例如至少85%、90%或95%的氨基酸相似性或同一性(“硬同源性”)。

本领域的标准方法可以用于确定同源性。例如,uwgcg软件包提供了可用于计算同源性的bestfit程序,例如在其默认设置(devereux等人(1984)核酸研究(nucleicacidsresearch)12,387-395页)上使用。pileup和blast算法可以用于计算同源性或列队序列(诸如鉴定当量残基或相应序列(通常在其默认设置上)),例如在altschuls.f.(1993)进化生物学(jmolevol)36:290-300;altschul,s.f等人(1990)进化生物学(jmolevol)215:403-10中描述的。可以通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得进行blast分析的软件。可以使用成对同一性或通过应用评分矩阵诸如blosum62并转换为当量同一性来测量类似性。由于它们代表功能性变化而不是进化变化,因此在确定同源性时会有意地掩盖突变位置。可以通过使用位置特异性评分矩阵,例如在蛋白质序列综合数据库中使用psiblast更敏感地确定类似性。可以使用反映氨基酸的化学物理特性(例如电荷)而不是反映进化时间尺度上的替换频率的不同的评分矩阵。

可以对ppt的序列,例如msp、α-溶血素(α-hl)、lysenin、csgg、clya、sp1和溶血性蛋白呋喃糖毒素c(frac)进行氨基酸替换。例如,可以进行多达1、2、3、4、5、10、20或30个替换。保守替换用具有相似化学结构、相似化学特性或相似侧链体积的其他氨基酸替换氨基酸。引入的氨基酸可以具有与其替代的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。替代地,保守替换可以引入另一种芳族或脂族氨基酸替代现有的芳族或脂族氨基酸。

可以修饰本文描述的任何蛋白质,诸如跨膜蛋白质孔,以帮助其鉴定或纯化,例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签),链霉抗生物素蛋白标签、sumo标签、gst标签或mbp标签或通过添加信号序列以促进其从其中多肽天然不包括这样的序列的细胞中分泌。引入遗传标签的另一种方法是使标签在孔或构建体的天然或工程化位置上发生化学反应。这样的一个实例是使凝胶移位试剂与在孔的外部工程化的半胱氨酸反应。这已被证明是用于分离溶血素的异质寡聚物的方法(braha等人(1997)生化与分子生物学(chembiol).4(7):497-505)。

孔可以用显露的标记来标记。显露的标记可以是允许检测孔的任何合适的标记。合适的标记包括但不限于荧光分子、放射性同位素、例如125i、35s、酶、抗体、抗原、多核苷酸和配体诸如生物素。

本文描述的任何蛋白质,诸如跨膜蛋白质孔,可以合成地或通过重组手段制备。例如,可以通过体外翻译和转录(ivtt)来合成孔。可以修饰孔的氨基酸序列以包括非天然存在的氨基酸或以增加蛋白质的稳定性。当通过合成手段生产蛋白质时,可以在生产期间引入这样的氨基酸。孔也可以在合成或重组生产后改变。

可以使用本领域已知的标准方法来产生本文描述的任何蛋白质,诸如跨膜蛋白质孔。可以使用本领域的标准方法衍生并复制编码孔或构建体的多核苷酸序列。可以使用本领域中的标准技术在细菌宿主细胞中表达编码孔或构建体的多核苷酸序列。可以通过由重组表达载体原位表达多肽在细胞中产生孔。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法在sambrook,j.和russell,d.(2001).分子克隆(molecularcloning):实验室手册(alaboratorymanual),第3版,冷泉港实验室出版社,纽约冷泉港中描述。

在从产生蛋白质的生物体中通过任何蛋白质液相色谱系统纯化之后或重组表达后,可以大规模产生孔。典型的蛋白质液相色谱系统包括fplc、akta系统、bio-cad系统、bio-radbiologic系统和gilsonhplc系统。

表征

提供一种用于表征多核苷酸的方法。表征方法包括:

i)进行如本文描述的方法;

ii)使跨膜孔与所述选择的多核苷酸接触;

iii)施加跨所述跨膜孔的电势差;以及

iv)进行一种或多种测量,这些测量指示相对于跨膜孔移动的多核苷酸的一种或多种特征,以及从而表征所述多核苷酸。

一个或多个特征可以选自(i)多核苷酸的长度、(ii)多核苷酸的同一性、(iii)多核苷酸的序列、(iv)多核苷酸的二级结构以及(v)多核苷酸是否被修饰。优选地,多核苷酸的一个或多个特征包括多核苷酸的序列。

表征方法通常包括在多核苷酸相对于跨膜孔移动时测量通过跨膜孔的电流。

可以使用在stoddart,d.s.,等人,(2009),美利坚合众国国家科学院院刊(proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica)106,第7702-7707页、liebermankr等人,美国化学学会期刊(jamchemsoc.)2010;132(50):17961-72以及国际申请wo-2000/28312中描述的标准的单通道记录设备进行电测量。替代地,可以使用多通道系统,例如,在wo2009/077734和wo2011/067559中描述的来进行电测量。

表征方法可以使用适合于研究其中将孔插入到膜中的膜/孔系统的任何设备来进行。可以使用适合于跨膜孔感测的任何设备来进行表征方法。例如,该设备可以包括包括水溶液的室和将室分成两段的屏障。屏障可以具有孔径,在孔径中形成包含跨膜孔的膜。本文描述了跨膜孔。

可以使用在wo2008/102120、wo2010/122293或wo00/28312中描述的设备进行表征方法。

表征方法可以包括通常通过测量电流来测量流经孔的离子电流。替代地,可以通过光学方法测量通过孔的离子流,诸如由heron等人:美国化学学会期刊(j.am.chem.soc.)第9卷131,第5号,2009所公开的。因此,该设备还可以包括能够施加电势并测量跨膜和孔的电信号的电路。可以使用膜片钳或电压钳来进行表征方法。表征方法优选地涉及电压钳的使用。

表征方法可以在基于硅的孔阵列上进行,其中每个阵列包括128、256、512、1024、2000、3000、4000、6000、10000、12000、15000或更多个孔。

表征方法可以包括测量流经孔的电流。该方法通常在跨膜和孔施加电压的情况下进行。使用的电压通常从+2v至-2v,通常为-400mv至+400mv。使用的电压优选地在具有选自以下的下限:-400mv、-300mv、-200mv、-150mv、-100mv、-50mv、-20mv和0mv和独立地选自以下的上限:+10mv、+20mv、+50mv、+100mv、+150mv、+200mv、+300mv和+400mv的范围内。使用的电压更优选地在100mv至240mv的范围内,并且最优选地在120mv至220mv的范围内。通过使用增加的施加电势,可以增加通过孔的不同核苷酸之间的分辨是可能的。

表征方法通常在任何载流子,诸如金属盐,例如碱金属盐、卤化物盐,例如氯化物盐,诸如碱金属氯化物盐的存在下进行。载流子可以包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或氯化1-乙基-3-甲基咪唑鎓。在上文讨论的示例性设备中,盐存在于室内的水溶液中。通常使用氯化钾(kcl)、氯化钠(nacl)或氯化铯(cscl)。kcl是优选的。该盐可以是碱土金属盐,诸如氯化钙(cacl2)。盐浓度可以处于饱和状态。盐浓度可以为3m或更低,通常为从0.1至2.5m、从0.3至1.9m、从0.5至1.8m、从0.7至1.7m、从0.9至1.6m或从1m至1.4m。盐浓度优选地为从150mm至1m。该表征方法优选地使用至少0.3m,诸如至少0.4m、至少0.5m、至少0.6m、至少0.8m、至少1.0m、至少1.5m、至少2.0m、至少2.5m或至少3.0m的盐浓度进行。高盐浓度提供高信噪比,并且允许在正常电流波动的背景下鉴别出指示结合/不结合的电流。

表征方法通常在缓冲液存在下进行。在上文讨论的示例性设备中,缓冲液存在于室内的水溶液中。可以使用任何合适的缓冲液。通常,缓冲液是hepes。另一种合适的缓冲液是tris-hcl缓冲液。方法通常在从4.0至12.0、从4.5至10.0、从5.0至9.0、从5.5至8.8、从6.0至8.7或从7.0至8.8或从7.5至8.5的ph下进行。使用的ph优选地是约7.5。

表征方法可以在从0℃至100℃、从15℃至95℃、从16℃至90℃、从17℃至85℃、从18℃至80℃、19℃至70℃或从20℃至60℃下进行。表征方法通常在室温下进行。表征方法任选地在支持酶功能的温度,诸如约37℃下进行。

发明人发现,当将选择方法应用于从包括多核苷酸的混合物的样品中选择多核苷酸时,相对于多核苷酸样品的信号品质,改善了表征选择的多核苷酸时记录的信号品质。随着读取长度的增加,通常观察到改善的信号。多核苷酸的读取长度由多种因素决定,并且包括样品的同质性。样品的读取长度可以由参数,例如n50值或n75值表示。对于给定的一组测量,50%的测量值比n50值长,而50%的测量值比n50值短。类似地,75%的测量值大于n75值,而25%的测量值小于n75值。该方法有利地允许增加针对多核苷酸样品观察到的n50和n75值。因此,优选地,在选择方法中,选择的多核苷酸的平均读取长度比初始样品的平均读取长度长。

试剂盒

进一步提供了用于分离多核苷酸的试剂盒,该试剂盒包括:

-滤器;以及

-凝聚介质;

-以及任选地进一步包括延伸介质。

优选地,滤器是如本文描述的滤器。优选地,凝聚介质是如本文描述的凝聚介质。若存在,优选地,延伸介质是如本文描述的延伸介质。

优选地,试剂盒包括以下中的一种或多种:

-如本文描述的测序衔接子;和/或

-如本文描述的膜锚或跨膜孔锚;和/或

-如本文描述的核酸操作酶;和/或

-用于核酸操作酶的燃料和/或辅因子;和/或

-洗涤溶液,该洗涤溶液不包括用于核酸操作酶的燃料和/或辅因子。

可以通过添加或去除燃料和/或辅酶/辅因子来控制多核苷酸操作酶的活性。燃料通常是游离核苷酸或游离核苷酸类似物。游离核苷酸可以是但不限于腺苷一磷酸(amp)、腺苷二磷酸(adp)、腺苷三磷酸(atp)、鸟苷一磷酸(gmp)、鸟苷二磷酸(gdp)、鸟苷三磷酸(gtp)、胸苷一磷酸(tmp)、胸苷二磷酸(tdp)、胸苷三磷酸(ttp)、尿苷一磷酸(ump)、尿苷二磷酸(udp)、尿苷三磷酸(utp)、胞苷一磷酸(cmp)、胞苷二磷酸(cdp)、胞苷三磷酸(ctp)、环腺苷一磷酸(camp)、环鸟苷一磷酸(cgmp)、脱氧腺苷一磷酸(damp)、脱氧腺苷二磷酸(dadp)、脱氧腺苷三磷酸(datp)、脱氧鸟苷一磷酸(dgmp)、脱氧鸟苷二磷酸(dgdp)、脱氧鸟苷三磷酸(dgtp)、脱氧胸苷一磷酸(dtmp)、脱氧胸苷二磷酸(dtdp)、脱氧胸苷三磷酸(dttp)、脱氧尿苷一磷酸(dump)、脱氧尿苷二磷酸(dudp)、脱氧尿苷三磷酸(dutp)、脱氧胞苷一磷酸(dcmp)、脱氧胞苷二磷酸(dcdp)和脱氧胞苷三磷酸(dctp)。游离核苷酸优选地选自amp、tmp、gmp、cmp、ump、damp、dtmp、dgmp或dcmp。游离核苷酸优选地是腺苷三磷酸(atp)。酶辅因子是允许多核苷酸结合蛋白起作用的因子。酶辅因子优选地是二价金属阳离子。二价金属阳离子优选地为mg2+、mn2+、ca2+或co2+。酶辅因子最优选为mg2+

洗涤溶液不含用于核酸操作酶的燃料和/或辅因子,并且通常是无菌的和/或不含可以降解多核苷酸的酶,诸如dnase和/或dnase。洗涤溶液优选地是水溶液,诸如缓冲溶液或不含dnase和rnase的水。

以下实施例说明本发明。然而,实施例不以任何方式限制本发明。

实施例

实施例1

该实施例证实了本文提供的方法可以用于从包含大小不等的dsdna的片段的混合文库中进行期望大小的dna的大小选择。

制备了一个包含dsdna片段大小在100bp至48kbp之间不等的混合文库,并被施加到具有增加孔径且在两种不同的缓冲液中的一系列滤器中。通过控制所使用的孔径和缓冲溶液,可以根据本文提供的方法从混合文库中选择期望的多核苷酸。

结果在图2中示出。该图示出了0.75%的醋酸锂琼脂糖凝胶,在250v下运行15分钟,并根据标准规约使用sybr金进行可视化。凝胶上负载有根据本文提供的方法选择的混合文库中的各种dna馏分。凝胶上的馏分如以下:

泳道1-混合有1μg噬菌体λdna(neb)的对照1μg1kbdna梯(neb)。

泳道2-混合有1μg噬菌体λdna的1μg1kbdna梯在dna凝聚缓冲液(60mg/mlpeg6000、600mmnacl)中温育,然后被施加到0.1μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道3-混合有1μg噬菌体λdna的1μg1kbdna梯在te(10mmtris-hcl(ph8.0))中温育,然后被施加到0.1μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道4-混合有1μg噬菌体λdna的1μg1kbdna梯在dna凝聚缓冲液(60mg/mlpeg6000、600mmnacl)中温育,然后被施加到0.2μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道5-混合有1μg噬菌体λdna的1μg1kbdna梯在te(10mmtris-hcl(ph8.0))中温育,然后被施加到0.2μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道6-混合有1μg噬菌体λdna的1μg1kbdna梯在dna凝聚缓冲液(60mg/mlpeg6000、600mmnacl)中温育,然后被施加到0.45μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道7-混合有1μg噬菌体λdna的1μg1kbdna梯在te(10mmtris-hcl(ph8.0))中温育,然后被施加到0.45μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道8-混合有1μg噬菌体λdna的1μg1kbdna梯在dna凝聚缓冲液(60mg/mlpeg6000、600mmnacl)中温育,然后被施加到5μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

泳道9-混合有1μg噬菌体λdna的1μg1kbdna梯在te(10mmtris-hcl(ph8.0))中温育,然后被施加到5μm尼龙滤器(acrodisc)上,并且用50μlte(10mmtris-hcl(ph8.0))缓冲液洗脱。

因此,负载在凝胶上的馏分概括如下:

dna凝聚缓冲液=(60mg/mlpeg6000,600mmnacl)

te=10mmtris-hcl(ph8.0)

对于每个样品,将2μgdna在500μl的指定的温育缓冲液中温育/混合(持续大约1分钟),以及随后使用1ml针头将其施加到具有指定的孔径的滤器上,然后用1000μl的新鲜缓冲液洗涤,之后用1ml的空气干燥滤器。通过将50μlte缓冲液用滤器抽取来洗脱dna以使样品重悬。可以看出,所有的滤器都能有效地选择10kbp以上的dna片段,其中0.2μm的滤器回收最多量的dna,而5μm大小的滤器回收的dna很少甚至没有。

dna凝聚缓冲液的优点可以从例如0.2μm孔径的缓冲液比较中看出(图2,泳道4和5)。呈球状形式的dna耐剪切力,以及因此施加到滤器时不会断裂。因此,在泳道4中观察到了选择的dna的离散带(约10kbp)。相比之下,当不使用凝聚缓冲液时,dna不会呈球状形式,并且在将其施加到滤器时会产生碎片,如图2的泳道5的主带下方的涂片所证明的。

实施例2

该实施例示出,当通过纳米孔测序表征时,根据本文提供的方法进行大小选择的dna产生增加的读取长度。

使用oxfordnanoporetechnologiesltd.minion测序仪对进行过或未进行过大小选择的人dna(人男性基因组,promega)样品进行测序。根据标准文库规约(sqk-lsk108,oxfordnanoporetechnologiesltd;https://store.nanoporetech.com/ligation-sequencing-kit-1d.html制备样品。简而言之,该规约涉及使用nebnext端修复/da尾模块对dna端进行修复和da加尾,然后将测序衔接子连接到已制备的端上。根据本文提供的方法,在测序衔接子连接之前,通过将样品与dna凝聚介质(60mg/mlpeg6000,600mmnacl)温育/混合持续大约1分钟,对样品进行大小选择。(滤器大小0.2μm)。在测序衔接子连接之前,不对其他样品进行大小选择。

两种样品均在单独的流动池上测序,并比较了文库的读取长度。结果在图3中示出。

测序文库的n50值是50%的读段大于该值且50%的读段小于该值的大小。类似地,测序文库的n75值是75%的读段大于该值且25%的读段小于该值的大小。从图3可以看出,相对于未进行大小选择的对照,进行大小选择后的样品的n50从18504bp增加到37846bp。类似地,进行大小选择后,样品的n75值分别从7261bp增加到23956bp。这些结果证明,当通过纳米孔测序表征时,根据本文提供的方法进行大小选择的dna产生增加的读取长度。

实施例3

该实施例进一步示出,当通过纳米孔测序表征时,根据本文提供的方法进行大小选择的dna产生增加的读取长度。

使用oxfordnanoporetechnologiesltd.minion测序仪对进行过或未进行过大小选择的人dna(人男性基因组,promega)样品进行测序。如实施例2所描述的制备样品。相应地,根据本文提供的方法,在测序衔接子连接之前,通过将样品与dna凝聚介质温育来对样品进行大小选择。在测序衔接子连接之前,不对其他样品进行大小选择。两种样品均在单独的流动池上测序,并比较了文库的读取长度。结果在图4中示出。

从图4所示的结果可以看出,通过进行大小选择,去除了更多的较短片段,进行大小选择的样品产生了稍更多的25kbp以上的期望读段和许多更多的50kbp以上的读段。

实施例4

该实施例进一步示出,当通过纳米孔测序表征时,根据本文提供的方法进行大小选择的dna产生增加的读取长度。

使用oxfordnanoporetechnologiesltd.minion测序仪对进行过或未进行过大小选择的人dna(细胞系gm12878)样品进行测序。如实施例2所描述的制备样品、对其进行大小选择并确定读取长度。

比较了进行大小选择的和未进行大小选择的样品的读取长度。结果示出在图5中(深灰色=未进行选择;浅灰色=根据本文公开的方法进行大小选择)。可以看出,在进行大小选择的情况下,更多的较短片段被去除。进行大小选择的dna的n50值明显高于未进行大小选择的dna的相应n50值。类似地,进行大小选择之后,样品的n75值增加。大小选择导致显著增加的约25kb以上的期望读段,以及约50kb的期望读段几乎多到两倍。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1