用于制备用于单分子表征的核酸构建体的方法和系统与流程

文档序号:30012452发布日期:2022-05-13 10:01阅读:1923来源:国知局

本发明涉及用于制备用于单分子表征的核酸构建体的方法和系统。

背景技术

当前在广泛的应用范围内需要快速且便宜的多核苷酸(例如,DNA或RNA)测序和鉴定技术。现有技术缓慢且昂贵,主要是因为它们依赖于扩增技术来产生大量多核苷酸并且需要大量用于信号检测的专用荧光化学品。

跨膜孔(纳米孔)作为聚合物和各种小分子的直接电子生物传感器具有巨大的潜力。具体地,最近关注作为潜在的DNA测序技术的纳米孔。

当跨纳米孔施加电势时,当如核苷酸等分析物在桶中暂时停留一段时间时,电流会发生变化。纳米孔检测核苷酸给出已知特征和持续时间的电流变化。在链测序方法中,使单个多核苷酸链通过孔并且衍生出核苷酸的同一性。链测序可以涉及使用分子制动器来控制移动所述多核苷酸通过孔。

有许多商业情况,包含多核苷酸测序和鉴定技术,都需要制备核酸文库。这可以使用转座酶来实现。



技术实现要素:

本发明人已经鉴定了用于制备用于单分子表征的核酸构建体的新型方法,例如通过纳米孔测序。在所述方法中,使用多核苷酸引导的效应蛋白(PGEP)将转座酶引导到靶多核苷酸内的所关注区域。在此类方向上,转座酶与包括多核苷酸(如经修饰的多核苷酸)的可转座元件相互作用,以介导将底物插入到所关注区域。以此方式,可以将有利于单分子表征的经修饰的多核苷酸引入到靶多核苷酸以促进其表征。

本发明人已经证明PGEP和转座酶可以以多种方式相互作用,并且此外,可以操纵这种相互作用以调节转座酶的活性。以此方式,可以提高插入的准确性,并且使脱靶转座酶活性最小化。

因此,提供了一种制备用于单分子表征的核酸构建体的方法,所述方法包括使靶多核苷酸与以下接触:

多核苷酸引导的效应蛋白;

引导多核苷酸;

转座酶;以及

包括经修饰的多核苷酸的可转座元件,

其中所述多核苷酸引导的效应蛋白将所述转座酶引导到所述靶多核苷酸内的所关注区域,并且所述转座酶将所述可转座元件插入到所述多核苷酸中,由此产生用于单分子表征的核酸构建体。

还提供了一种制备核酸构建体的方法,所述方法包括使靶多核苷酸与以下接触:

多核苷酸引导的效应蛋白;

引导多核苷酸;

转座酶;以及

可转座元件,

其中所述多核苷酸引导的效应蛋白和所述转座酶通过连接子部分在基因上融合或连接,使得所述转座酶被引导到所述靶多核苷酸内的所关注区域,并且将所述可转座元件插入到所述靶多核苷酸中,由此制备核酸构建体。

还提供了一种用于制备用于单分子表征的核酸构建体的系统,所述系统包括:

多核苷酸引导的效应蛋白;

引导多核苷酸;

转座酶;以及

包括经修饰的多核苷酸的可转座元件,

其中所述多核苷酸引导的效应蛋白将所述转座酶引导到所述靶多核苷酸内的所关注区域,并且进一步其中所述转座酶将所述可转座元件插入到所述多核苷酸中,由此产生用于单分子表征的核酸构建体。

还提供了一种用于制备核酸构建体的系统,所述系统包括:

多核苷酸引导的效应蛋白;

引导多核苷酸;

转座酶;以及

可转座元件,

其中所述多核苷酸引导的效应蛋白和所述转座酶通过连接子部分在基因上融合或连接,使得所述转座酶被引导到所述靶多核苷酸内的所关注区域,并且将所述可转座元件插入到所述靶多核苷酸中,由此制备核酸构建体。

还提供了一种检测和/或表征样品中的靶多核苷酸的方法,所述方法包括:

(i)根据权利要求1到27中任一项所述的方法制备用于单分子表征的核酸构建体;

(ii)使所述核酸构建体与包括跨膜孔的膜接触;

(iii)跨所述膜施加电位差;以及

(iv)进行由所述核酸构建体与所述孔接触产生的一种或多种测量,由此检测和/或表征所述靶多核苷酸以确定所述靶多核苷酸的存在或不存在和/或所述靶多核苷酸的一个或多个特性。

附图说明

应理解的是,附图仅用于说明本发明的具体实施例而并不旨在是限制性的。

图1示意性地示出了Cas9酶A,与结合的tracrRNA B和crRNA C,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子D,并且与Cas9结合或连接的转座子蛋白复合物可以将dsDNA标签插入在dsDNA分子中。Cas9可以连接到一个或多个转座子蛋白,如MuA或Tn5 F。在此实例中,Cas9与转座子蛋白之间的连接G发生在Cas9 tracrRNA B与转座子标签链H之一之间。此类连接也是可能的在Cas9 crRNA C与转座子标签链H之间。转座子标签链J和H可以含有用于点击测序衔接子的5'DBCO基团。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将顶部和底部转座子链插入到分子中,从而使用两个带有转座子标签链的标记dsDNA片段K和L有效地切割分子。

图2示意性地示出了Cas9酶A,与结合的tracrRNA B和crRNA C,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子D,并且与Cas9连接的转座子蛋白复合物可以将dsDNA货物插入在dsDNA分子中。在此实例中,Cas9通过蛋白质连接子H与多种转座子蛋白F之一融合。转座子与由插入序列J和两个衔接子序列K组成的dsDNA货物结合。Cas9与转座子蛋白之间的连接也可能在Cas9 crRNA C或tracrRNA与转座子标签链K之间。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到dsDNA分子中,形成可以用于下游应用(如图18中所描述的那些)的分子M。

图3示意性地示出了Cas12k酶A,与结合的tracrRNA B和crRNA C,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子D。Cas12k结合转座子蛋白TniQ F,后者进而与转座子蛋白H和G结合。转座子与由插入序列J和插入序列上游(LE位点)K和下游(RE位点)L的两个衔接子序列组成的dsDNA货物结合。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到的分子中,因此形成可以用于下游应用(如图18中所描述的那些)的分子M。

图4示意性地示出了Cas12k酶A,与结合的tracrRNA B和crRNA C,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子D。Cas12k结合转座子蛋白TniQ F后者进而与转座子蛋白H和G结合。转座子与由具有单链区段的插入序列J和插入序列上游(LE位点)K和下游(RE位点)L的两个衔接子序列组成的dsDNA货物结合。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到的分子中,因此形成可以用于下游应用(如图18中所描述的那些)的分子M。

图5示意性地示出了Cas12k酶A,与结合的tracrRNA B和crRNA C,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子D。Cas12k结合转座子蛋白TniQ F,后者进而与转座子蛋白H和G结合。转座子与由含有双链断裂的插入序列J和插入序列上游(LE位点)K和下游(RE位点)L的两个衔接子序列组成的dsDNA货物结合。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到的分子中,因此形成可以用于下游应用(如图23、26、34、35和36中所描述的那些)的分子M。

图6示意性地示出了由Cas8 A、Cas7 B和Cas6 C形成的级联复合物,与结合的crRNA D,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子E。级联复合物结合转座子蛋白TniQ G后者进而与由蛋白质H、J和K形成的转座子复合物结合。转座子与由插入序列L和插入序列上游M和下游N的两个衔接子序列组成的dsDNA货物结合。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到的分子中,因此形成可以用于下游应用(如图18中所描述的那些)的分子O。

图7示意性地示出了由Cas8 A、Cas7 B和Cas6 C形成的级联复合物,与结合的crRNA D,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子E。级联复合物结合转座子蛋白TniQ G后者进而与由蛋白质H、J和K形成的转座子复合物结合。转座子与由含有单链区段的插入序列L和插入序列上游M和下游N的两个衔接子序列组成的dsDNA货物结合。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到的分子中,因此形成可以用于下游应用(如图18中所描述的那些)的分子O。

图8示意性地示出了由Cas8 A、Cas7 B和Cas6 C形成的级联复合物,与结合的crRNA D,可以如何用于结合含有原间隔子相邻基序(PAM)E的靶dsDNA分子E。级联复合物结合转座子蛋白TniQ G后者进而与由蛋白质H、J和K形成的转座子复合物结合。转座子与由含有双链断裂的插入序列L和插入序列上游M和下游N的两个衔接子序列组成的dsDNA货物结合。tracrRNA和crRNA可以通过用发夹将两者连接成单引导RNA(sgRNA)分子。转座子蛋白将dsDNA货物插入到的分子中,因此形成可以用于下游应用(如图23、26、34、35和36中所描述的那些)的分子O。

图9示出了一种可能的工作流程,通过所述工作流程,可以通过与CRISPR/Cas结合或连接的转座子蛋白插入可点击标签,点击标签的测序衔接子,并将其引入到测序装置,从而对靶DNA分子进行测序。靶(A)和非靶(B)高分子量DNA的混合物与CRISPR-转座子RNP C混合。在RNP与靶DNA结合时,引入双链断裂,所述双链断裂将靶分子切割成两个片段D和E,并且将带有5'DBCO基团的标签序列连接到两个片段上。在去除结合的RNP时,含有3'叠氮基的测序衔接子连接到片段上。这产生了两个衔接子连接的靶片段F和G,当所述靶片段被引入到包括膜H和孔J的纳米孔测序流动池中时,它们都可以被测序。靶分子和非靶分子都被引入到流通池中,但只有靶分子拴系在膜上并被测序。

图10示出了一种可能的工作流程,通过所述工作流程,可以通过CRISPR/Cas-转座子蛋白插入可点击标签,点击货物的测序衔接子,并将其引入到测序装置,从而对靶DNA分子进行测序。靶(A)和非靶(B)高分子量DNA的混合物与CRISPR-转座子RNP C混合。在RNP与靶DNA结合时,与转座子蛋白结合的货物DNA被引入到靶分子D中。货物DNA序列含有暴露的5'DBCO标签。去除结合的RNP时,含有3'叠氮基的测序衔接子连接到靶分子E中的片段标签上。这会产生一个衔接子连接的靶片段F所述衔接子连接的靶片段当被引入到包括膜G和孔H的纳米孔测序流动池中时,可以被测序。靶分子和非靶分子都被引入到流通池中,但只有靶分子拴系在膜上并被测序。

图11示出了一种可能的工作流程,通过所述工作流程,可以通过CRISPR/Cas-转座子蛋白插入引物结合位点,点击经扩增产物的测序衔接子,并将其引入到测序装置,从而对靶DNA分子进行扩增和测序。靶(A)和非靶(B)高分子量DNA的混合物与CRISPR-转座子RNP C混合。在RNP与靶DNA结合时,与转座子蛋白结合的货物DNA被引入到靶分子D中。货物DNA序列含有可以与特异性引物结合的暴露序列。去除结合的RNP时,使用含有5'DBCO基团的特异性引物来扩增靶分子E,从而形成分子F。含有3'叠氮基的测序衔接子连接到靶分子F中的片段标签上。这产生了一个衔接子连接的靶片段G,当所述靶片段被引入到包括膜H和孔J的纳米孔测序流动池中时,它们可以被测序。靶分子和非靶分子都被引入到流通池中,但只有靶分子拴系在膜上并被测序。

图12示出了一种可能的工作流程,通过所述工作流程,可以通过与CRISPR/Cas RNP结合的转座子连接标签,点击测序衔接子,并将其引入到测序装置中,从而对靶DNA分子进行测序。在管B中,crRNA退火到tracrRNA,并通过在室温下将此混合物与Cas9温育持续10分钟而形成RNP。随后,将管B的内容物添加到含有高分子量DNA的管A中,并且允许CRISPR/Cas RNP在37℃下与DNA结合持续15到30分钟。将转座子RNP添加到混合物中,并且在37℃下温育持续15到30分钟,以允许切割和标记靶DNA。在对混合物进行任选的SPRI纯化之后,使用点击化学将所关注片段点击到测序衔接子上,从而形成测序文库。将样品引入到测序装置。

图13示出了一种可能的工作流程,通过所述工作流程,可以通过与CRISPR/Cas RNP结合的转座子连接标签,点击测序衔接子,并将其引入到测序装置中,从而对靶DNA分子进行测序。在管B中,crRNA退火到tracrRNA,并且转座子标签链被组装,并且通过在室温下将此混合物与Cas9和转座子蛋白温育持续30分钟而形成RNP。随后,将管B的内容物添加到含有高分子量DNA的管A中,并且允许CRISPR转座子RNP在37℃下与DNA结合持续15到30分钟以允许切割和标记靶DNA。在对混合物进行任选的SPRI纯化之后,使用点击化学将所关注片段点击到测序衔接子上,从而形成测序文库。将样品引入到测序装置。

图14示出了一种可能的工作流程,通过所述工作流程,可以通过经由CRISPR转座子RNP插入含有标签的货物,点击测序衔接子,并将其引入到测序装置中,从而对靶DNA分子进行测序。在管B中,crRNA退火到tracrRNA,并且通过在室温下将此混合物与Cas12k和转座子蛋白(在此实例中为TniQ、TnsB和TnsC)在存在货物DNA的情况下温育持续30分钟来形成RNP。随后,将管B的内容物添加到含有高分子量DNA的管A中,并且允许CRISPR转座子RNP在37℃下与DNA结合持续15到30分钟以允许切割和插入靶DNA中的货物。在对混合物进行任选的SPRI纯化之后,使用点击化学将所关注片段点击到测序衔接子上,从而形成测序文库。将样品引入到测序装置。

图15探索由CRISPR转座子RNP(A)诱导的所关注区域(ROI)中的单个dsDNA断裂的测序模式。产生的两个片段(B和C)各自含有转座子标签D和E,所述转座子标签可用于测序衔接子连接。片段B在反义方向(-)上读取,并且片段C在有义方向(+)上读取,从而使从切割定位在两个方向上的覆盖深度(D)减小。

图16探索由CRISPR转座子RNP(A和B)诱导的所关注区域(ROI)的侧翼区中的双dsDNA断裂的测序模式。产生的三个片段(C和D和E)之一(C)在每个末端含有转座子标签F,所述转座子标签可用于测序衔接子连接。片段C在反义方向(-)上和在有义方向(+)上读取,从而使在两个方向上的覆盖深度(G)均匀。

图17比较了用于Cas9-MuA富集的不同方法。图1示出了一项实验,其中使用与dCas9结合的MuA将可点击标签引入到3.6kb分析物以进行测序分析,在不存在MuA(子图A)或不存在Cas9(子图B)的情况下,在反应中具有0或150mM的另外的NaCl的情况下(子图C和C(2))。图示出了正向(蓝色)或反向(洋红色)方向上的测序读段的开始。图2示出了同一实验中3.6kb分析物的读段堆积。每个dCas9蛋白的结合位点通过竖直虚线标记。

图18示出了如何使用Cas-转座酶系统在限定的基因座处插入带有经修饰的碱基或序列识别基序的货物。A和B示出了图3所示转座酶系统的可能货物设计,分别插入了一段经修饰的碱基或序列识别基序。C和D分别表示转座酶有效负载的左端(LE)和右端(RE)基序。E表示经修饰的碱基,其可以是生物素化碱基、非规范碱基、脱碱基位点、间隔子等。F表示有效负载骨架,其可以是任意序列、长度或结构(双链或单链特性)。G表示结合蛋白的序列识别元件;例如,lac或tet操纵子序列、限制酶结合位点或工程化锌指蛋白的结合位点。H、I、J、K表示积分积;H和I是货物A的产物,并且J和K是货物B的产物。L表示原间隔子相邻基序(PAM)。M表示识别例如连接到经修饰的碱基的化学部分的蛋白质。N表示识别特定序列基序的蛋白质。

图19示出了通过纳米孔检测插入转座酶的货物的末端衍生化实例。A,平端双链末端(F);B,5'或3'突出端(G)(或两者,即分叉或张开双链体);C,测序衔接子(H)与携带单链解旋酶或转位酶的所关注分子连接;D,测序衔接子(I)与携带双链解旋酶或转位酶的所关注分子连接。所有实例都包含图18中的货物(此处标记为E)(在图18中标记为A)。根据图18,货物可以携带也可以不携带结合蛋白(参见图JG1、H和I)。

图20示出了用于Cas-转座酶介导的货物插入例如带有或不带有结合蛋白的经修饰的碱基的货物的纳米孔检测方法。A,通过纳米孔(D)的双链易位,其可以容纳双链体,但不能容纳经修饰的碱基和/或结合蛋白。B,通过纳米孔(E)的双链易位,其可以容纳双链体,以及经修饰的碱基和/或结合蛋白。C,通过纳米孔(F)的单链易位,其可以容纳单链DNA,但不能容纳经修饰的碱基和/或结合蛋白。所有上述实例(A、B或C)都可以由核酸解旋酶/转位酶(G、H或I)介导,或者转位可以是无酶的(由电压介导)。在C中,孔和/或酶解开双链DNA。箭头指示核酸通过纳米孔的易位方向。

图21示出了转座酶货物的实例,所述转座酶货物将拴系部分插入到靶DNA,这可能会增加表面分析物的局部浓度或使其能够从复杂的背景中纯化。A,带有内部经修饰的碱基B的货物,使蛋白质能够直接(通过疏水性部分,例如胆固醇)或间接(通过结合蛋白)拴系到珠粒或膜表面。K,带有内部ssDNA侧翼(L)的货物,其允许拴系寡核苷酸与货物杂交。C,一种系统,在所述系统中,带有来自(A)的Cas-转座酶整合的货物的示例靶分子F通过结合蛋白E间接拴系到表面D上。E的实例是链霉亲和素,其可以直接与表面D偶联或通过第二生物素部分间接偶联,从而形成夹心结构。偶联相互作用的替代性实例是其中E是疏水性部分,例如胆固醇和E也是疏水的,例如膜表面。拴系相互作用可以增加表面E上靶分子F的局部浓度,从而能够从背景分子G中选择(例如通过纯化或接近)靶标。H,与C类似的系统,其中拴系寡核苷酸I与集成货物提供的侧翼杂交,从而能够拴系到表面J。I和J的实例是其中I是生物素化的寡核苷酸并且J是链霉亲和素包被的珠表面,或者其中I是经胆固醇修饰的寡核苷酸并且J是膜表面。

图22示出了Cas转座酶货物的实例,所述货物可以用于在限定的位点内部衍生DNA,以便通过纳米孔进行无酶捕获。A,带有两个ssDNA延伸的货物(B)。带有PAM D的DNA链C的整合产生整合体E。E的ssDNA侧翼然后被纳米孔F捕获,并且E的双链DNA解开,并且两条链之一易位。箭头示出了易位方向。

图23示出了Cas转座酶货物的实例,所述货物可以用于在限定的位点内部衍生DNA,以便通过纳米孔进行无酶捕获。A,由两个独立的双链体(B)组成的货物。带有PAM D的DNA链C的整合产生带有双链断裂的整合体E和F。然后,E或F的双链末端被纳米孔G捕获,并且双链DNA通过纳米孔易位。箭头示出了易位方向。

图24示出了用于使用Cas-转座酶系统插入测序衔接子的示例货物,每个货物涉及一个或两个测序马达。A示出了携带测序马达的测序衔接子B如何可以通过携带例如点击化学基团E的ssDNA侧翼D连接到Cas-转座酶货物C,从而产生在所指示的方向上读取的产物F。测序衔接子可以在整合到靶分子中之前或之后连接到货物上。G、H、I、J示出了一些可能的替代性构型:G:允许在整合位点上重叠读取的两个侧翼;H:两个不产生重叠读段的侧翼;I:由两个双链体和两个ssDNA侧翼组成的货物,其允许连接两个测序衔接子,但在整合之后会产生双链断裂;J:每个I,但仅有一个ssDNA侧翼,在双链断裂的一侧连接一个测序衔接子。对于G和H,测序马达连接到最终产物中的同一分子上,并通过中间的双链体连接。

图25示出了将两个Cas-转座酶对整合到靶分子中以对特定所关注区域(ROI)进行测序的示例构型。仅示出了最终的集成产物。A示出了两个Cas-转座酶货物E的整合产物,其中两个原间隔子相邻基序(PAM)在相反的链上,但货物是相同的(在相同的方向上)。B示出了一个类似的方案,其中PAM在同一条链中,但货物(E和F)的方向相反。方案A和B都允许对两条链上的特定所关注区域(ROI)进行测序;具体地,A将允许此方案使用单一类型的货物(E)但有两种不同的引导RNA。方案C和D示出了另外两种可能的构型:C示出了“由内而外”的方案,其中读取远离ROI。方案D示出了一种可能的方案,其中可以将两个测序衔接子连接到每个货物上,以允许从ROI上方和向外的多个重叠读段。另外的方案是可能的,并且上述方案并非旨在穷举。块箭头示出了预期的测序读段方向。

图26示出了来自货物的整合产物的实例,如图24所示,I,在整合位点产生双链断裂。

图27示出了组合方案的实例,所述方案涉及在两个不同的基因座(C,D)处整合两个不同的Cas-转座酶货物(A,B)。在基因座C处的整合允许连接测序衔接子,而在基因座D处的整合允许将系链连接到珠粒或膜E,例如通过寡核苷酸F,如在图14,F中所示的方案中。

图28示出了允许特定扩增所关注区域的方案的实例。两个Cas转座酶货物(A,B),每个都带有一个3'末端的寡核苷酸侧翼(C),插入在所示构型中的两个基因座处。然后使用与这些侧翼互补的引物(D,E)通过PCR或等温扩增扩增所关注区域,从而产生最终产物F。货物和引物可以相同或不同。引物可以在扩增步骤期间任选地引入条形码。

图29示出了方案的实例,所述方案允许特定扩展所关注区域并通过插入Cas-转座酶的货物结合唯一分子标识符(UMI)。扩增方案与图28相同,除了其中在货物序列(A,B)中添加了UMI。UMI可以通过扩增引物另外地添加到PCR产物中。

图30示出了方案的实例,所述方案通过Cas-转座酶介导的插入生成链接的模板-补体测序读段,其中目的是提高单分子准确性。在此实例中,货物带有寡核苷酸侧翼,其3'端呈发夹构型E。A示出了可能的整合产物。当通过链置换聚合酶(步骤B)(例如Klenow外切酶)延伸时,聚合酶会将分子(掺入的核苷酸显示为虚线)复制到其末端,生成模板-补体连接的dA加尾物种C,其可以连接到测序衔接子D。然后可以使用纳米孔对此分子进行测序。块箭头示出了读段方向。

图31示出了方案的实例,所述方案通过Cas-转座酶介导的插入生成链接的模板-补体测序读段,其中目的是提高单分子准确性。实例如图30所示,除了在两个位点处插入货物的两个Cas-转座酶对,使得可以在特定的所关注区域A上产生模板-补体链接读段。块箭头示出了读段方向。

图32示出了如何使用Cas-转座酶系统通过夹板产生闭合环状单链DNA的实例。使用产生物种C的Cas-转座酶系统插入两个带有5'和3'寡核苷酸侧翼G、H的货物A和B。当物种C在存在夹板D的情况下在热和碱的存在下变性时,双链分离,并且在复性条件下,每个侧翼部分退火到夹板D以产生有切口的部分双链物种E。E然后可以通过连接酶,例如Taq DNA连接酶密封以产生单链环状DNA F。然后可以使用夹板D或任何其它互补寡核苷酸作为引物通过滚环扩增来扩增F,以产生产物E中含有的序列的多联体。

图33示出了如何使用两个Cas-转座酶对(A,B)插入牛津纳米孔技术公司的1D2衔接子以对所关注区域C进行测序。

图34示出了如何使用Cas-转座酶系统在断裂位点处引入两个发夹。A,可能的货物设计涉及两个发夹。B示出了即使在引入双链断裂之后,寡核苷酸如何可以与两个发夹杂交以将发夹物理连接在一起。C示出了货物A的整合产物。C可以制备以通过dA-加尾(D)和连接测序衔接子(E)进行测序,从而产生两个分子,所述两个分子各自在断裂位点处带有发夹F。块箭头示出了读段方向。

图35示出了如何使用各自带有发夹货物的一对Cas-转座酶复合物来产生两端带有发夹的所关注区域的环状闭合双链分子。A示出了具有单一发夹物种的可能货物分子。将货物A整合到靶标B(在相反链上具有两个整合位点)产生具有两个发夹端的环状闭合产物C。然后可以使用适当的核酸外切酶(H),例如核酸外切酶III和VII,任选地消化背景DNA(带有一个或没有发夹)。然后可以使用与任一或两个发夹退火的引物D(带有连接位点E)扩增产物C,从而产生含有产物C序列的多联体的分子F。测序衔接子G的连接允许对分子F进行测序。块箭头示出了读段方向。

图36示出了图34的替代性方法,即使用发夹将测序衔接子连接到靶标分析物。在此情况下,发夹含有可切割的连接子,例如可以被USER酶切割的脱氧尿嘧啶,或可以使用光切割的可光切割连接子。发夹的切割产生可以用于连接测序衔接子的分叉结构,例如通过连接带有与叉臂互补的突出端的测序衔接子。

图37示出了如何使用抗核酸酶货物的插入来富集特定所关注区域。各自在双链体的一条或两条链上携带一系列寡核苷酸间隔子、无碱基位点或硫代磷酸键(A)的两个Cas-转座酶对可以用于将核酸酶抗性区域插入靶DNA,从而产生B。核酸外切酶消化降解非靶DNA,留下分子C,其可以通过dA加尾(步骤D)和连接测序衔接子(步骤E)制备以用于纳米孔测序。

具体实施方式

应理解的是,所公开的产品和方法的不同应用可以根据本领域的特定需要而定制。还应理解,本文所使用的术语仅出于对本发明的特定实施例进行描述的目的而并不旨在是限制性的。

另外,如在本说明书和所附权利要求中所使用的,除非内容另外明确指明,否则单数形式的“一种(a)”、“一个(an)”以及“所述(the)”均包含复数对象。因此,例如,提及“多核苷酸”包含两个或更多个多核苷酸,提及“分子”是指两个或更多个等。

本文引用的所有出版物、专利和专利申请,无论是上文还是下文,均通过引用整体并入本文。

制备核酸构建体的方法

本发明提供了一种制备用于单分子表征的核酸构建体的方法,所述方法包括使靶多核苷酸与以下接触:多核苷酸引导的效应蛋白(PGEP)、引导多核苷酸、转座酶和包括经修饰的多核苷酸的可转座元件,其中所述多核苷酸引导的效应蛋白将所述转座酶引导到所述靶多核苷酸内的所关注区域,并且所述转座酶将所述可转座元件插入到所述多核苷酸中,由此产生用于单分子表征的核酸构建体。

在所述方法中,PGEP用于将转座酶引导到要表征的靶多核苷酸内的所关注区域。转座酶将可转座元件插入到所关注区域。所述可转座元件包括经修饰的多核苷酸。因此,将经修饰的多核苷酸插入到所关注区域。经修饰的多核苷酸在下文中详细描述,但通常,经修饰的多核苷酸可以是促进或改善单分子表征的元件,如标志物、系链或衔接子。因此,所述方法通过在所关注区域中插入有利的经修饰的多核苷酸来修饰靶多核苷酸,从而制备用于单分子表征的核酸构建体。

本发明还提供了一种制备核酸构建体的方法,所述方法包括使靶多核苷酸与以下接触:多核苷酸引导的效应蛋白、引导多核苷酸、转座酶和可转座元件,其中所述多核苷酸引导的效应蛋白和所述转座酶通过连接子部分在基因上融合或连接,使得所述转座酶被引导到所述靶多核苷酸内的所关注区域,并且将所述可转座元件插入到所述靶多核苷酸中,由此制备核酸构建体。可转座元件通常包括多核苷酸,并且可以包括经修饰的多核苷酸。

在本文所描述的方法中的任何方法中,可以操纵PGEP与转座酶之间的相互作用以调节转座酶的活性。以此方式,可以提高插入的准确性,并且使脱靶转座酶活性最小化。

靶多核苷酸和核酸构建体

如上所述,所述方法提供了靶多核苷酸的定向修饰。例如,所述方法可以用于制备用于单分子表征的核酸构建体。PGEP和转座酶可以用于将包括经修饰的多核苷酸的可转座元件插入到靶多核苷酸中,由此产生用于单分子表征的核酸构建体。因此,核酸构建体由靶多核苷酸和可转座元件形成。

靶多核苷酸和/或核酸构建体可以包括核酸。核酸可以包括一种或多种天然存在的核酸,如脱氧核糖核酸(DNA)和/或核糖核酸(RNA)。靶多核苷酸和/或核酸构建体可以包括单链DNA或单链RNA。靶多核苷酸和/或核酸构建体可以包括双链DNA或双链RNA。靶多核苷酸和/或核酸构建体可以包括DNA/RNA双链体,例如与一条DNA链杂交的一条RNA链。

核酸可以包括一种或多种合成核酸。合成核酸是本领域已知的。例如,核酸可以包括肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)和/或其它具有核苷酸侧链的合成聚合物。如果多核苷酸是PNA,则PNA主链可以由通过肽键连接的重复N-(2-氨基乙基)-甘氨酸单元构成。如果多核苷酸是GNA,则GNA主链可以由通过磷酸二酯键连接的重复乙二醇单元构成。如果多核苷酸是TNA,则TNA主链可以由通过磷酸二酯键连接在一起的重复苏糖构成。如果多核苷酸是LNA,则LNA主链可以是由如上文所讨论的具有将核糖部分中的2'氧和4'碳连接的额外桥的核糖核苷酸形成。

靶多核苷酸和/或核酸构建体可以具有任何长度。例如,靶多核苷酸和/或核酸构建体的长度可以为至少约10个、至少约50个、至少约70个、至少约100个、至少约150个、至少约200个、至少约250个、至少约300个、至少约400个或至少约500个核苷酸。靶多核苷酸和/或核酸构建体的长度可以为至少约1,000、至少约5,000、至少约10,000、至少约100,000、至少约500,000、至少约1,000,000、或至少约10,000,000或更多个核苷酸。靶多核苷酸和/或核酸构建体的长度优选地为约30到约10,000,如约50到约5,000,约100到约2,000个核苷酸,或约500到约1,000个核苷酸。靶多核苷酸自身可以是较长多核苷酸的片段。

靶多核苷酸和/或核酸构建体可以是线性的。靶多核苷酸和/或核酸构建体可以是环状的。靶多核苷酸和/或核酸构建体可以是端到端的RNA或DNA分子。

靶多核苷酸可以包含在样品内。样品通常是已知含有或怀疑含有一种或多种多核苷酸分子的样品。样品优选地包括DNA和/或RNA。样品可以是流体样品。

样品可以是生物样品,例如来自动物、植物或病毒的样品。样品可以包括从任何生物体或微生物中获得的一种或多种细胞。生物体或微生物通常是古细菌、原核生物或真核生物。所述生物体或微生物通常属于五个王国之一:植物界、动物界、真菌、原核生物界和原生生物界。

样品可以从人或非人动物中获得。人或动物可能患有、疑似患有疾病或有患病风险。非人哺乳动物可以是商业养殖的动物,如马、牛、羊或猪。非人哺乳动物可以是宠物,如猫或狗。样品可以包括体液。样品可以是尿液、淋巴液、唾液、粘液、精液、羊水、全血、血浆或血清。

样品可以从植物中获得。例如,样品可以从经济作物如谷物、豆类、水果或蔬菜中获得。例如,样品可以从小麦、大麦、燕麦、油菜、玉米、大豆、稻米、香蕉、苹果、番茄、马铃薯、葡萄、烟草、豆类、小扁豆、甘蔗、可可、棉花、茶或咖啡植物中获得。

样品可以是非生物样品。非生物样品的实例可以包含手水(如饮用水、海水或河水);以及实验室测试用试剂。

样品可以在用于本文所描述的方法之前进行处理。例如,样品可以通过离心或通过过滤掉不需要的分子或细胞如红细胞的膜来处理。样品可以在用于本文所描述的方法之前储存。例如,样品可以储存在-70℃以下。

引导多核苷酸

多核苷酸引导的效应蛋白(PGEP)是能够与靶多核苷酸和引导多核苷酸结合的蛋白质。在制备核酸构建体的方法中,PGEP与引导多核苷酸结合。引导多核苷酸和PGEP通常形成复合物,所述复合物然后在由引导多核苷酸的序列确定的位点处与靶多核苷酸结合。引导多核苷酸能够与靶多核苷酸中的所关注区域中的互补核苷酸序列杂交。引导多核苷酸与所关注区域中的互补核苷酸序列的杂交引导PGEP结合期望的所关注区域。进而,PGEP能够将转座酶引导到所关注区域。

引导多核苷酸可以包括RNA和/或DNA。引导多核苷酸优选地包括RNA。引导多核苷酸优选地是引导RNA。因此,PGEP优选地是RNA引导的效应蛋白。当引导多核苷酸包括RNA时,RNA可以包括crRNA(CRISPR RNA)和/或tracrRNA(反式激活CRISPR RNA)。CRISPR RNA和tracrRNA是本领域已知的。引导多核苷酸可以包括DNA。引导多核苷酸可以是引导DNA。因此,PGEP可以是DNA引导的效应蛋白。

引导多核苷酸包括能够与靶多核苷酸内的多关注区域杂交的序列。引导多核苷酸还包括能够与PGEP结合的序列。能够与靶多核苷酸内的所关注区域杂交的序列可以是与能够与PGEP结合的序列相同的序列,即一个序列既可以结合靶多核苷酸中的所关注区域又可以结合PGEP。能够与靶多核苷酸内的所关注区域杂交的序列可以是与能够与PGEP结合的序列不同的序列。由于引导多核苷酸既能够与靶核苷酸内的所关注区域杂交又能够与PGEP结合,所以引导多核苷酸能够将PGEP引导到所关注区域。引导多核苷酸可以具有能够实现这些结合特性的任何结构和序列。

能够与靶多核苷酸内的所关注区域杂交的序列可以能够与长度为约10到约40个核苷酸的序列杂交。例如,所述序列可以能够与长度为约11到约39、约12到约38、约13到约37、约14到约36、约15到约35、约16到约34、约17到约33、约18到约32、约19到约32、约20到约30、约21到约29、约22到约28、约23到约27、约24到约26或约25个核苷酸的序列杂交。所述序列可以能够与长度为约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的序列杂家。引导多核苷酸通常与靶多核苷酸的双链区的一条链互补。互补程度优选地是精确的。

引导多核苷酸可以包括crRNA和tracrRNA。crRNA可以是单链RNA。crRNA可以能够与靶多核苷酸内的所关注区域中的序列杂交。crRNA可以被设计为靶向任何所关注区域。用于这样做的方法是本领域已知的。tracrRNA可以包括能够与PGEP结合的茎环结构。tracrRNA也可以与crRNA的5'或3'端杂交。因此,crRNA通常与靶多核苷酸结合,并且tracrRNA通常与PGEP结合。crRNA和tracrRNA可以在体外转录为单个多核苷酸,即单引导RNA(sgRNA)。因此,sgRNA是可以包括能够与靶多核苷酸中的所关注区域杂交的部分和能够与PGEP结合的另一部分的多核苷酸。

多核苷酸引导的效应蛋白(PEGP)

如上文所解释的,多核苷酸引导的效应蛋白(PGEP)是能够与靶多核苷酸和引导多核苷酸结合的蛋白质。在制备核酸构建体的方法中,PGEP与引导多核苷酸结合。引导多核苷酸和PGEP通常形成复合物,所述复合物然后在由引导多核苷酸的序列确定的位点处与靶多核苷酸结合。引导多核苷酸能够与靶多核苷酸中的所关注区域中的互补核苷酸序列杂交。引导多核苷酸与所关注区域中的互补核苷酸序列的杂交引导PGEP结合期望的所关注区域。进而,PGEP能够将转座酶引导到所关注区域。

PGEP能够与引导多核苷酸结合。因此,PGEP包括引导多核苷酸结合结构域。引导多核苷酸结合结构域是能够与引导多核苷酸结合的结构域。PGEP(以及因此,其引导多核苷酸结合结构域)通常与引导多核苷酸的不能与靶多核苷酸杂交的区域结合。引导多核苷酸在上文详细描述。引导多核苷酸可以包括DNA,在这种情况下PGEP是DNA引导的效应蛋白。示例性DNA引导的效应蛋白包含来自RecA的蛋白质,如RecA、RadA和Rad51。

引导多核苷酸可以包括RNA,在这种情况下,PGEP是RNA引导的效应蛋白。RNA引导的效应蛋白优选地是RNA引导的核酸内切酶,或核酸酶活性失效的RNA引导的核酸内切酶。

PGEP能够与靶多核苷酸结合。PGEP可以与靶多核苷酸的单链或双链区域结合。PGEP可以与引导多核苷酸杂交的序列上游或下游的靶多核苷酸结合。PGEP结合的靶多核苷酸区域通常距引导多核苷酸与靶多核苷酸杂交的位点沿多核苷酸骨架少于100个核苷酸。PGEP可以与靶多核苷酸中的原间隔子相邻基序(PAM)结合。PAM优选地定位于距引导多核苷酸与靶多核苷酸杂交的位点沿多核苷酸骨架少于100个碱基处。PAM是少于10个核苷酸的短序列。通常,PAM的长度为2到6个核苷酸。合适的PAM在本领域中是已知的。示例性PAMS包含5'-NGG-3'(其中N是任何碱基)、5-NGTN-3、5-GG-3、5'-NGA-3'、5'-YG-3'(其中Y是嘧啶)、5'TTN-3'和5'-YTN-3'。不同的PGEP与不同的PAM结合。如果靶多核苷酸不包括PAM,则PGEP可以结合靶多核苷酸中的其它地方,如引导多核苷酸所引导的。Cas结合需要PAM。

PGEP可以包括靶多核苷酸识别结构域。靶多核苷酸识别结构域是能够与靶多核苷酸结合的结构域。靶多核苷酸识别结构域也可以能够与引导多核苷酸结合。

PGEP可以包括一个或多个核酸酶结构域。例如,PGEP可以包括2个或更多个、3个或更多个、4个或更多个或5个或更多个核酸酶结构域。核酸酶结构域是能够切割(cutting)或切割(cleaving)靶多核苷酸的结构域。当靶多核苷酸是单链时,核酸酶结构域能够在沿着单链的一个或多个点处切割或切割靶多核苷酸。当靶多核苷酸是双链时,核酸酶结构域可以能够在沿着靶多核苷酸的一条或两条链的一个或多个点处切割或切割。为了实现双链靶多核苷酸的两条链的切割或切割,PGEP可以含有能够切割或切割两条链的一个核酸酶结构域,或能够切割或切割靶多核苷酸的一条链的第一核酸酶结构域和能够切割或切割靶多核苷酸的另一条链(即互补链)的第二核酸酶结构域。

PGEP中包含的一个或多个核酸酶结构域可以是有活性的或无活性的。例如,核酸酶结构域或多个结构域可能因突变而失活。PGEP通过其靶多核苷酸识别结构域与靶多核苷酸结合的能力可以不受核酸酶结构域失活的影响。

PGEP的核酸酶活性因此可以失效。失效可以是,例如,通过催化失活。例如,PCT中包含的一个或多个核酸酶结构域可以被催化失活。如上文所描述的,多核苷酸引导的核酸内切酶可以包括两个核酸酶结构域,所述两个核酸酶结构域各自能够切割或切割双链靶多核苷酸的一条链。在此情况下,可以在用于所述方法之前使一个或两个核酸酶结构域失活,使得PGEP能够切割或切割靶多核苷酸的双链区的两条链、一条链或任何链。

可以通过使PGEP中包含的催化位点突变来使核酸酶活性失效或失活。突变可以是取代、插入或缺失突变。例如,一个或多个(如2、3、4、5或6个或更多个)氨基酸可以被取代或插入到催化位点中,或从催化位点缺失。突变优选地为氨基酸取代,并且更优选为单一氨基酸取代。技术人员将能够容易地鉴定PGEP的催化位点和能够使其失活的突变。例如,在PGEP是Cas9的情况下,第一催化位点可以通过D10的突变失活,并且第二催化位点可以通过H840的突变失活。

PGEP可以包括单一蛋白质组分。PGEP可以包括多种蛋白质组分的组装。

PGEP可以包括核酸酶,如多核苷酸引导的核酸内切酶。PGEP可以包括Cas(CRISPR(成簇的规则间隔的短回文重复序列)相关)蛋白。本领域已知的任何Cas蛋白均可以用于所述方法。多核苷酸引导的效应蛋白可以包括Cas、Csn2(CRISPR相关蛋白Csn2)、Cpf1(来自Prevotella和Francisella 1的CRISPR相关蛋白)、Csf1(CRISPR相关蛋白Csf1)、Cmr5(CRISPR相关蛋白Cmr5)、Csm2(CRISPR相关蛋白Csm2)、Csy1(CRISPR相关蛋白Csy1)、Cse1(CRISPR大肠杆菌相关蛋白)或C2c2。Cas蛋白可以是Cas3、Cas 4、Cas5、Cas6、Cas7、Cas8 Cas8a、Cas8b、Cas8c、Cas9、Cas10或Cas10d。当靶多核苷酸包括双链DNA区域时,优选地使用Cas、Csn2、Cpf1、Csf1、Cmr5、Csm2、Csy1或Cse1。当靶多核苷酸包括双链RNA区域时,优选地使用C2c2。PGEP可以是Cas12k。

优选地,PGEP包括Cas9。Cas9具有二瓣叶(bi-lobed)多结构域蛋白质结构,其包括靶识别和核酸酶瓣叶。识别瓣叶结合引导RNA和DNA。核酸酶瓣叶含有HNH和RuvC核酸酶结构域,其定位成用于裂解靶DNA的互补链和非互补链。Cas9的结构在以下中详细介绍:Nishimasu,H.等人,(2014)与引导RNA和靶DNA复合的Cas9的晶体结构(Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA.)《细胞(Cell)》156,935-949中。Cas9的相关PDB参考是5F9R(催化活性化脓性链球菌CRISPR-Cas9的晶体结构,与单引导RNA和双链DNA复合,用于靶DNA切割)。

与野生型Cas9相比,所述Cas9可以是‘特异性增强型’Cas9,其显示降低的脱靶结合。此类“增强特异性”Cas9的实例是化脓性链球菌Cas9D10A/H840A/K848A/K1003A/R1060A。ONLP12296是化脓性链球菌Cas9D10A/H840A/K848A/K1003A/R1060A的氨基酸序列,具有带有TEV可切割连接子的C端双链标签。

PGEP可以包括Cas6、Cas7和Cas8。因此,PGEP可以包括Cas6-Cas7-Cas8蛋白的组装。PGEP可以包括Cas、Cpf1和/或C2c2。因此,PGEP可以包括Cas。PGEP可以包括Cpf1。PGEP可以包括C2c2。PGEP可以包括Cas和Cpf1的组装。PGEP可以包括Cas和C2c2的组装。PGEP可以包括Cpf1和C2c2的组装。PGEP可以包括Cas、Cpf1和C2c2的组装。任何PGEP可以另外地包括Cas12k。

转座酶

如上文所描述的,PGEP用于将转座酶引导到靶多核苷酸内的所关注区域。一旦被引导到所关注区域,转座酶用于将可转座元件,如包括经修饰的多核苷酸的可转座元件,插入到靶多核苷酸中。

转座酶在本领域中是已知的,并且技术人员将能够容易地鉴定用于所述方法的转座酶。示例性转座酶家族包含DDE转座酶、酪氨酸(Y)转座酶、丝氨酸(S)转座酶、滚环(RC)转座酶、Y2转座酶和逆转录酶/核酸内切酶(RT/En)。具体地,示例性DDE转座酶包含玉米Ac转座子、果蝇P元件、Tn5、Tn7、Tn10、Mariner、IS10、IS50或MuA。转座酶可以包括单一蛋白质或蛋白质单体。转座酶可以是包括多个转座酶蛋白或转座酶蛋白单体的多聚体蛋白。多聚体转座酶可以是同源多聚体。例如,转座酶可以包括超过一种MuA、超过一种Tn5或超过一种Tn7蛋白。多聚体转座酶可以是异源多聚体。例如,转座酶可以包括选自MuA、Tn5和Tn7单体的以任何组合形式的超过一种不同的蛋白质。

为了实现其功能,转座酶应当能够与可转座元件如包括经修饰的多核苷酸的可转座元件相互作用。例如,转座酶可以能够与可转座元件结合。转座酶可以能够与超过一个可转座元件结合,其中所述可转座元件中的一个或多个可转座元件可以包括经修饰的多核苷酸。在此情况下,每个可转座元件可以与转座酶能够结合的其它可转座元件相同或不同。转座酶可以能够同时与超过一个可转座元件结合。转座酶可以通过与可转座元件内的左端(LE)和/或右端(RE)基序结合而与可转座元件,如包括经修饰的多核苷酸的可转座元件结合。LE和RE基序是本领域已知的并且可以例如是反向重复序列。

可转座元件

转座酶在与可转座元件如包括经修饰的多核苷酸的可转座元件结合时,可以介导可转座元件插入到靶多核苷酸中。下文详细描述可转座元件。

可转座元件是本领域已知的(参见例如,Saariaho和Savilahti,《核酸研究(Nucleic Acids Research)》,2006;34(10):3139-3149和Lee和Harshey,《分子生物学期刊(J.Mol.Biol.)》,2001;314:433-444),其中它们可替代地被称为转座酶“货物”或“有效负载”。可以使用本领域已知的方法设计包括特定经修饰的多核苷酸的可转座元件。本领域技术人员可以容易地设计和产生包括任何所关注多核苷酸,如经修饰的多核苷酸的可转座元件。

可转座元件可以包括DNA和/或RNA。可转座元件可以包括单链和/或双链多核苷酸,或者可以是部分单链和部分双链的。可转座元件的核苷酸长度可以根据包含在可转座元件内的经修饰的多核苷酸的性质和/或根据本发明方法中制备核酸构建体的特定目的而变化。可转座元件的长度可以超过5、10、20、30、40、50、100、500、1000、5000、10000、50000或100000个核苷酸。可转座元件的优选长度也可以根据所使用的转座酶的类型而变化。例如,MuA的优选底物长度为长度介于5与5000个核苷酸之间,更优选地长度介于10与1000个核苷酸之间,甚至更优选地长度介于20与200个核苷酸之间。

可转座元件通常能够连接到单链或双链靶多核苷酸链中的转座酶介导的切口内的暴露的5'和/或3'端,或连接到在转座酶介导的双链靶多核苷酸的双链断裂内暴露的5'端和/或暴露的3'端。

也就是说,可转座元件可以能够以单链、转座酶介导的切口连接到暴露的5'端。可转座元件可以能够以单链、转座酶介导的切口连接到暴露的3'端。可转座元件可以能够以单链、转座酶介导的切口连接到暴露的5'端和暴露的3'端。因此,可转座元件可以将单链转座酶介导的切口中的暴露的5'端连接到单链转座酶介导切口中的暴露3'端。以此方式,可以通过在切口中插入可转座元件来修复断裂的或破碎的链。

可转座元件可以能够在转座酶介导的双链断裂中连接到一个或两个暴露的5'端。可转座元件可以能够在转座酶介导的双链断裂中连接到一个或两个暴露的3'端。在转座酶介导的双链断裂中,可转座元件可以能够连接到一个或两个暴露的5'端和一个或两个暴露的3'端。因此,可转座元件可以在转座酶介导的双链断裂中连接到暴露的5'端和暴露的3'端。在与转座酶接触之前,暴露的5'端和暴露的3'端可能已经连接,即同一链的一部分。以此方式,可以通过插入可转座元件来修复经受双链断裂的断裂或破碎的链。接合可以通过连接进行。

当可转座元件连接到双链靶多核苷酸的单链内转座酶介导的切口的暴露5'或3'端时,可能会产生“突出端”或“侧翼”。在突出端或侧翼中,与切口链的暴露端连接的一些或全部可转座元件与切口上游或下游的靶多核苷酸的切口或完整链的序列不互补。

可转座元件通常包括左端(LE)和/或右端(RE)基序。LE和RE基序是本领域已知的并且可以例如是反向重复序列。所关注多核苷酸,如经修饰的多核苷酸,例如可以插入在可转座元件中的LE基序与RE基序之间。

经修饰的多核苷酸

可转座元件可以包括一种或多种多核苷酸,如一种或多种经修饰的多核苷酸。经修饰的多核苷酸可以是有助于靶多核苷酸的单分子表征的任何元件。例如,经修饰的多核苷酸可以是在插入到靶多核苷酸之后可以被操纵、修饰和/或检测的元件。例如,经修饰的多核苷酸可以包括一种或多种点击反应性基团、一种或多种荧光团、一种或多种缀合剂、一种或多种下拉基团、一种或多种拴系部分、一种或多种标志物、一种或多种经修饰的碱基,一种或多种无碱基残基和/或一种或多种间隔子。例如,2、3、4、5、6、7、8、9或10种此类修饰可以包含在经修饰的多核苷酸中。

经修饰的多核苷酸可以是标志物。标志物可以是使技术人员能够鉴定一种或多种可转座元件已在何处或是否已插入到靶多核苷酸的所关注区域中的任何合适的标志物。示例性标志物包含一种或多种生物素分子;一种或多种经修饰的碱基;一种或多种无碱基残基;一种或多种碱基-碱基缀合物;或一种或多种蛋白质-碱基缀合物。

优选地,标志物可通过本领域已知的一种或多种测序技术检测,如通过基于纳米孔的测序。所述标志物可以是光学可检测的。例如,标志物可以在适当波长的光的激发下发出荧光。例如,标志物可以包括一种或多种荧光碱基,例如Cy3或Cy5。可以使用技术人员认为合适的任何光学和/或荧光标志物。其它可检测的标志物包含非规范碱基、无碱基和间隔子。可以使用本领域技术人员认为合适的任何无碱基和/或间隔子。具体地,示例性间隔子可以包含C3、PC间隔子、己二醇、间隔子9、间隔子18或1',2’-二脱氧核糖(dSpacer)。

经修饰的多核苷酸可以包括一种或多种经修饰的碱基。经修饰的碱基可以是任何合适的经修饰的碱基。经修饰的碱基可以是例如用生物素标记的核苷酸(即生物素化核苷酸),或用地高辛标记的核苷酸(即地高辛标记的核苷酸)。经修饰的碱基如生物素标记的碱基或地高辛标记的碱基可以使核酸构建体偶联到固体表面,例如分别用链霉抗生物素蛋白或抗地高辛素包被的表面。

经修饰的多核苷酸可以包括下拉基团。下拉基团可以是使技术人员能够纯化或分离核酸构建体或通过将构建体连接到另一种物质来固定核酸构建体的任何合适的下拉基团。例如,其它物质可以是核酸构建体、核酸分子、多肽、蛋白质、膜或固相表面。示例性下拉基团包含一种或多种多肽,以及一种或多种疏水性锚。

例如,下拉基团可以包括一个或多个经修饰的核苷酸碱基。经修饰的碱基可以是用生物素标记的核苷酸(即生物素化核苷酸),或用地高辛标记的核苷酸(即地高辛标记的核苷酸)。下拉基团内的经修饰的碱基如生物素标记的碱基或地高辛标记的碱基可以使核酸构建体连接到固体表面,例如用链霉抗生物素蛋白或抗地高辛素包被的表面。可以使用能够偶联到固体表面的任何合适的系绳。可以与通过本文所描述的本发明的方法制备的核酸构建体偶联的固体表面可以例如包含纳米金、聚苯乙烯珠和Qdot。

例如,下拉基团可以包括拴系部分,其中所述拴系部分包括疏水性锚,任选地其中所述疏水性锚包括疏水性核苷酸碱基。拴系部分可以是脂质、脂肪酸、甾醇、碳纳米管、蛋白质或氨基酸、胆固醇、棕榈酸酯或辛基生育酚。

经修饰的多核苷酸可以是衔接子。衔接子可以允许核酸构建体的进一步操纵或者可以允许核酸构建体的直接测序。衔接子可以是技术人员认为合适的任何衔接子。

衔接子是本领域已知的。例如,衔接子可以包括能够实现蛋白质结合的核苷酸序列、测序衔接子、PCR衔接子、发夹衔接子、能够使靶多核苷酸环化和/或滚环扩增的衔接子、独特的分子标识符(UMI)、寡核苷酸夹板、点击化学部分、核酸外切酶抗性碱基和/或硫代磷酸酯键。衔接子可以同时与期望的蛋白质例如运动酶结合。

衔接子可以包括可以被DNA和/或RNA结合蛋白识别和结合的RNA和/或DNA序列。衔接子可以在将所述衔接子插入到靶多核苷酸中之前或之后与DNA和/或RNA结合蛋白结合。与衔接子结合的RNA和/或DNA结合蛋白可以能够结合双链和/或单链多核苷酸。例如,在本文所描述的方法中,衔接子可以被运动酶如解旋酶或转位酶结合。

衔接子可以是可以被特定DNA和/或RNA结合蛋白特异性识别的序列基序。衔接子可以是可以被DNA和/或RNA结合蛋白特异性识别和结合的RNA/DNA杂合序列。例如,序列基序可以被以其结构性结构域(例如螺旋-转角-螺旋、锌指、亮氨酸拉链、翼状螺旋、翼状螺旋-转角-螺旋、螺旋-环-螺旋、HMG-盒、Wor3和OB-折叠)为特征的DNA结合蛋白识别。衔接子可以是能够被lac或tet阻遏蛋白结合的lacO或tetO阵列。衔接子可以是能够被抗体结合的RNA-DNA杂合序列。RNA-DNA杂交标志物可以被S9.6抗体结合。

衔接子可以包括适合寡核苷酸杂交的核苷酸序列。具体地,寡核苷酸可以包括用于与衔接子杂交的互补碱基,因此能够引发互补多核苷酸序列的延伸(线性扩增)或聚合酶链式反应。例如,在本文所描述的任何方法中,两个PGEP-转座酶对可以靶向靶双链多核苷酸的相反链上的不同所关注区域。然后每个PGEP-转座酶可以插入包括寡核苷酸突出端的衔接子,所述寡核苷酸突出端进一步包括为引物提供杂交位点的序列,从而能够反平行扩增每个PGEP-转座酶靶向的两个区域之间的区域。

衔接子可以包括可以充当唯一分子标识符(UMI)的核苷酸序列。UMI可以通过技术人员认为合适的任何测序方法检测。具体地,UMI可以用于检测和定量核酸构建体。核酸构建体测序读段可以通过UMI的存在进行聚类,从而能够提高单分子测序的准确性。

衔接子可以包括发夹部分。发夹衔接子在本领域中是已知的。具体地,衔接子可以包括已经通过发夹的5'端插入到靶多核苷酸中的发夹。发夹可以具有游离的3'端,其中所述发夹的模板化延伸可以由聚合酶介导以产生互补的2D链。在本文所描述的本发明的上下文中包括发夹部分的衔接子的其它示例性应用涉及在靶多核苷酸中的PGEP-转座酶介导的双链断裂的两个暴露端插入发夹衔接子。发夹可以任选地通过可切割的连接子部分连接。然后可以将DNA马达和连接子部分连接到靶多核苷酸的非发夹端,以直接应用于基于纳米孔的测序方案进行2D测序。在另一个应用中,两个PGEP-转座酶对可以靶向靶双链多核苷酸内的不同所关注区域。每个PGEP转座酶可以介导双链断裂并插入发夹衔接子,以产生跨越两个所关注区域的环状闭合分子,从而形成适合滚环扩增的核酸构建体。另外的实例可以涉及使用抗核酸外切酶的发夹,从而能够保存通过本发明的方法制备的核酸构建体,而其它背景多核苷酸可以被核酸外切酶消化。另外的实例可以涉及使用包括尿嘧啶或其它基团例如允许切割发夹的可光切割间隔子的发夹,任选地在核酸外切酶消化背景多核苷酸之后,以及随后连接测序衔接子和任选地DNA马达。

衔接子可以是任何适于与其它分子形成共价键的衔接子,例如通过点击化学。经修饰的多核苷酸中包含的衔接子可以包括允许无铜点击化学的基团。适用于本发明方法的衔接子的示例性基团是5'DBCO基团。例如,在本文所描述的任何方法中,两个PGEP-转座酶对可以靶向靶双链多核苷酸的相反链上的不同所关注区域。然后每个PGEP-转座酶可以插入包括寡核苷酸突出端的衔接头,所述寡核苷酸突出端进一步包括结合的DNA马达和/或提供点击化学部分的序列,用于共价结合基于纳米孔的测序衔接子,由此允许直接应用于基于纳米孔的测序方案。

插入到双链寡核苷酸的同一链中的一对衔接子可以在本文所描述的方法中充当“夹板”。本公开上下文中的夹板涉及PGEP-转座酶接触沿双链靶多核苷酸的相同链的任何距离的两个不同区域,并在两个所关注区域的每一个中的相同链中引入切口。然后将衔接子连接到每个所关注区域的切口链上。连接到所关注5'区域中的切口的衔接子通过衔接子的3'端连接到切口链上,从而产生5'突出端,其中所述衔接子的5'端是暴露的磷酸基团。连接到所关注3'区域中的切口的衔接子通过衔接子的5'端连接到切口链上,从而产生3'突出端,其中所述衔接子的3'端是暴露的羟基。在靶多核苷酸变性时,包括连接底物的部分可以连接到另外的多核苷酸分子以形成环状多核苷酸分子。环状多核苷酸可以通过滚动环状扩增来扩增。

任何经修饰的多核苷酸可以能够进一步修饰。

PGEP与转座酶之间的关系

所述方法涉及使靶多核苷酸与PGEP、转座酶和可转座元件接触。此类接触允许PGEP将转座酶引导到靶多核苷酸内的所关注区域,以实现将任选地包括经修饰的多核苷酸的可转座元件插入到所关注区域中。

PGEP可以与转座酶结合,以将其引导到所关注区域。换言之,PGEP与转座酶之间的结合可以确定转座酶接触靶多核苷酸的位点。此类结合的性质可以确定PGEP接触靶多核苷酸的点与转座酶接触靶多核苷酸的点之间的距离。

PGEP与转座酶之间的结合可以是直接的或间接的。例如,PGEP与转座酶之间的结合可以由一种或多种蛋白质-蛋白质相互作用介导。PGEP和转座酶可以是在基因上融合的。PGEP与转座酶之间的结合可以由一个或多个连接子部分介导。

当PGEP与转座酶之间的结合由一个或多个连接子部分介导时,连接子部分可以是与PGEP和转座酶结合的连接子多核苷酸。连接子多核苷酸不是靶多核苷酸。连接子多核苷酸可以包括任何种类的多核苷酸,如DNA和/或RNA。连接子多核苷酸可以具有任何长度。连接子多核苷酸可以包括tracrRNA、CRISPR RNA或单引导RNA。单独的连接子多核苷酸可以结合PGEP和转座酶。可替代地,一种或多种连接子多核苷酸可以结合PGEP并与和转座酶结合的一个或多个另外的连接子部分杂交。

连接子部分序列长度可以确定紧邻(i)所述多核苷酸引导的效应蛋白接触的所述靶多核苷酸内的序列上游的原间隔子相邻基序(PAM)与(ii)所述转座酶将所述可转座元件插入到所述所关注区域的位点之间的序列长度。换言之,特定连接子长度可以使技术人员能够控制紧邻PGEP接触的靶多核苷酸内的序列上游的PAM序列与转座酶将可转座元件插入到所关注区域的位点之间的距离。增加连接子部分的长度会增加这种PAM序列与插入位点之间的距离。因此,靶多核苷酸内的所关注区域不受能够被引导多核苷酸有效杂交的位点(例如PAM)的接近度的限制。理想地,由引导多核苷酸靶向的所关注区域中的序列将与靶多核苷酸的其它部分具有最小的序列同一性,以最小化脱靶引导序列杂交和PGEP结合。然而,在一些情况下,可能需要PAM紧邻所关注区域的上游或下游,以实现可转座元件的有效插入。通过改变将PGEP与转座酶结合的连接子的长度,可以抵消对附近PAM的需求,从而在引导多核苷酸的设计中提供更大的自由度。

PGEP和转座酶可以呈复合物。因此,靶多核苷酸可以与包括PGEP和转座酶的复合物接触。复合的PGEP和转座酶可以是在基因上融合的。复合的PGEP和转座酶可以彼此结合。结合如上文所描述。所述复合物可以通过将PGEP与转座酶结合并去除任何不与PGEP结合的转座酶蛋白来形成。未结合的转座酶可以通过亲和纯化技术分离PGEP或转座酶来去除。

如上文所描述的,PGEP和/或转座酶可以包括多种蛋白质组分的组装。例如,PGEP可以包括一个或多个PGEP,如2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个,或10个或更多个PGEP的组装。每个PGEP可以相同或不同。转座酶可以包括一种或多种转座酶蛋白,如2种或更多种、3种或更多种、4种或更多种、5种或更多种、6种或更多种、7种或更多种、8种或更多种、9种或更多种、或10种或更多种转座酶蛋白的组装。每种转座酶蛋白可以相同或不同。通过改变PGEP和/或转座酶中的蛋白质组分的数量,可以改变PGEP和转座酶的化学计量。每个转座酶结合的可转座元件分子的数量也可以变化。例如,转座酶可以结合一个或多个可转座元件,如2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、或10个或更多个可转座元件。每个可转座元件可以相同或不同。

PGEP-转座酶-可转座元件的示例性化学计量组合包含:

-一个PGEP和一对转座酶,其中所述转座酶对一起携带单个底物,例如具有结合DNA马达的多核苷酸;

-一个PGEP和一对转座酶,其中所述转座酶对中的每个转座酶都携带一对底物,例如一对多核苷酸,所述一对多核苷酸各自具有结合的DNA马达;

-两个PGEP和两对转座酶,其中每对携带单个多核苷酸底物,例如每对转座酶有一个多核苷酸,每个多核苷酸具有结合的DNA马达;

-两个PGEP和两对转座酶,其中所述转座酶对中的每个转座酶都携带一对底物,例如每对转座酶一对多核苷酸,所述每对多核苷酸各自具有结合的DNA马达。

接触靶多核苷酸

靶多核苷酸与PGEP、转座酶和可转座元件接触,使得PGEP将转座酶引导到靶多核苷酸内的所关注区域以实现将可转座元件中包含的经修饰的多核苷酸插入到所关注区域。

可以控制接触步骤的条件以控制转座酶的活性。控制转座酶的活性可能是有利的:

i)防止转座酶接触任何所关注区域之外的靶多核苷酸;和/或

ii)防止转座酶介导的一个或多个可转座元件通过转座酶在任何给定的所关注区域之外插入到靶多核苷酸中。

可以以任何方式控制转座酶活性。控制转座酶活性的示例性和非限制性方法包括:

i.使靶多核苷酸与PGEP和转座酶顺序接触;

ii.光活化的控制;

iii.抑制转座酶活性;和/或

iv.动力学控制。

i.靶多核苷酸与PGEP和转座酶的顺序接触

靶多核苷酸可以同时与PGEP、转座酶和可转座元件接触。靶多核苷酸可以在不同时间与PGEP、转座酶和/或可转座元件接触。例如,靶多核苷酸可以首先与多核苷酸引导的效应蛋白接触,并且然后再与转座酶接触。换言之,靶多核苷酸可以顺序地与PGEP和转座酶接触。例如,可以将PGEP添加到包括靶多核苷酸的反应混合物中。然后可以将转座酶和可转座元件添加到反应混合物中。转座酶和可转座元件可以一起或单独添加。在靶多核苷酸与PGEP和转座酶顺序接触期间,任何未与PGEP结合的转座酶都被去除。靶多核苷酸与PGEP和转座酶的顺序接触是有利的,因为转座酶能够与已经与靶多核苷酸中的所关注区域结合的PGEP结合。这最小化了转座酶将结合和/或将可转座元件插入所关注区域之外的区域的可能性。

在靶多核苷酸与PGEP和转座酶顺序接触期间,可以使用不同的反应条件来与PGEP接触和与转座酶接触。靶多核苷酸可以在第一组条件下与PGEP接触,并且在第二组条件下与转座酶接触。第一组条件可能不利于转座酶活性。第二组条件可能有利于转座酶活性。此外,任何未与PGEP结合的转座酶都可以在改变条件使得所述条件有利于转座酶活性之前被去除。

ii.光活化的控制

本发明上下文中的转座酶活性可以由光控制。具体地,其中PGEP通过一个或多个连接子部分结合转座酶,所述一个或多个连接子部分可以经历光活化的控制,从而通过限制其接触靶多核苷酸的能力来控制转座酶活性。光活化的控制可以涉及光开关,因此意味着适合光活化的控制的部分可以被光可逆地活化和去活化。

除了光可切换染料如偶氮苯之外,对光活化的控制敏感的部分的实例包含可逆荧光蛋白如Dronpa。其它对光活化的控制敏感的部分是本领域已知的。

与PGEP和转座酶结合的连接子部分在暴露于特定光源和/或波长的光时可以经历有序到无序的转变。无序连接子部分可能导致转座酶不太接近靶多核苷酸,而转座酶保持与连接子部分结合,或者无序连接子部分可以完全防止转座酶与连接子部分的结合。因此,可能存在有利于诱发有序连接子部分的光照条件,而可能存在不利于诱发有序连接子部分的条件。可以调节这些条件以施加对转座酶的活性的控制。无序的连接子部分可以防止转座酶接触任何所关注区域之外的靶多核苷酸;和/或防止转座酶介导的一个或多个可转座元件通过转座酶在任何给定的所关注区域之外插入到靶多核苷酸中。

转座酶可以被光活化的聚合物网络笼罩。聚合物网络是本领域已知的。形成聚合物网络的一部分的单体可以是光活化的。特别地,单体可以单独地对光活化的控制敏感。因此,聚合物网络的刺激可以诱导网络中的构象变化,从而导致笼状转座酶的释放和随后的活化。转座酶的封闭可以防止转座酶与PGEP结合,从而防止转座酶接触任何所关注区域之外的靶多核苷酸;和/或防止转座酶介导的一个或多个可转座元件通过转座酶在任何给定的所关注区域之外插入到靶多核苷酸中。

iii.转座酶活性的抑制

转座酶活性可以通过使用对转座酶活性不利或有利的反应条件来控制。条件可以被调节活化或改善,或去活化或降低转座酶的酶活性。

因此,靶多核苷酸可以在不利于转座酶活性的条件下与多核苷酸引导的效应蛋白、转座酶和可转座元件接触。

不利于转座酶活性的条件可能会降低转座酶与PGEP和/或靶多核苷酸结合或影响可转座元件插入的能力。不利于转座酶活性的条件是本领域已知的,并且包含低盐浓度和高盐浓度,以及金属离子螯合剂的存在。

具体地,其中盐浓度不超过50mM或至少250mM的条件不利于转座酶活性。因此,不利于转座酶活性的条件可以包括不超过50mM或至少250mM的盐浓度。例如,不利于转座酶活性的条件可以包括约1mM到约50mM,如5mM到45mM、10mM到40mM或20mM到35mM的盐浓度。例如,盐浓度可以是约1mM、2mM、3mM、4mM、5mM、10mM、20mM、25mM、30mM、35mM、40mM或50mM。对转座酶活性不利的条件可以包括250mM或更高、300mM或更高、500mM或更高、或1M或更高的盐浓度。最优选地,盐浓度为约100mM。

不利于转座酶活性的条件包括金属离子螯合剂的存在。金属螯合剂是本领域已知的。示例性金属离子螯合剂是EDTA(乙二胺四乙酸)。

当靶多核苷酸在不利于转座酶活性的条件下与多核苷酸引导的效应蛋白、转座酶和可转座元件接触时,可以在改变条件使得所述条件有利于转座酶活性之前,去除任何未与多核苷酸引导的效应蛋白结合的转座酶。这最小化了由未结合的转座酶介导的脱靶效应的发生。未结合的转座酶可以通过靶向靶多核苷酸或PGEP的亲和纯化技术分离与结合的PGEP复合的靶多核苷酸靶多核苷酸来去除。可替代地,亲和纯化技术可以分离未与PGEP结合的转座酶。

有利于转座酶活性的条件是本领域已知的。有利于转座酶活性的示例性条件包含包括盐浓度为至少50mM但小于250mM的那些条件。有利于转座酶活性的条件可以例如包括50到250mM、60到240mM、70到230mM、80到220mM、90到210mM、100到200mM、110到190mM、120到180mM、130到170mM、140到160mM或150mM的盐浓度。优选地,盐浓度为至少75mM且小于150mM。在100mM的盐浓度下可以实现有利的转座酶活性。有利于转座酶活性的另外的示例性条件包含那些包括不存在金属离子螯合剂和/或存在游离Mg2+离子的条件。有利于转座酶活性的条件也可以降低转座酶结合PGEP的能力和/或结合DNA的能力。

iv.动力学抑制

在本发明的上下文中,PGEP和转座酶在反应期间它们与靶多核苷酸接触的速率方面可以具有不同的动力学。例如,PGEP在给定的所关注区域接触靶多核苷酸可能相对较慢——由其引导多核苷酸的多核苷酸序列确定——而相反,转座酶可以与靶多核苷酸接触并反应相对较快。

因此,本领域技术人员可以在本发明的方法中调节PGEP和/或转座酶的动力学,以防止转座酶接触任何所关注区域之外的靶多核苷酸;和/或防止转座酶介导的一个或多个可转座元件通过转座酶在任何给定的所关注区域之外插入到靶多核苷酸中。具体地,转座酶的动力学活性可以被抑制。

动力学抑制的实例可以涉及靶多核苷酸与PGEP和转座酶的顺序接触,使得PGEP与靶多核苷酸有足够的反应时间,以确保在靶多核苷酸与转座酶接触之前,所有PGEP靶位点都被PGEP结合。此实例可以进一步涉及使靶多核苷酸与转座酶接触,使得转座酶相对于PGEP和/或所关注靶区的浓度处于化学计量平衡。

动力学抑制的实例还可以涉及将转座酶应用于本发明方法,所述转座酶具有与所使用的PGEP类似的动力学活性。这可以通过使用具有与所使用的PGEP类似的动力学活性的天然存在的转座酶来实现,或者这可以通过将突变引入到特定的转座酶,例如在其DNA结合结构域中实现,以人为地降低其动力学活性。

系统

本发明提供了一种用于制备适用于单分子表征的核酸构建体的系统。

本发明提供了一种系统,其包括:

多核苷酸引导的效应蛋白;

引导多核苷酸结合结构域;

转座酶;以及

包括经修饰的多核苷酸的可转座元件,

其中所述多核苷酸引导的效应蛋白将所述转座酶引导到所述靶多核苷酸内的所关注区域,并且进一步其中所述转座酶将所述可转座元件插入到所述多核苷酸中,由此产生用于单分子表征的核酸构建体。

还提供了一种用于制备核酸构建体的系统,所述系统包括:

多核苷酸引导的效应蛋白;

引导多核苷酸;

转座酶;以及

可转座元件,

其中所述多核苷酸引导的效应蛋白和所述转座酶通过连接子部分在基因上融合或连接,使得所述转座酶被引导到所述靶多核苷酸内的所关注区域,并且将所述可转座元件插入到所述靶多核苷酸中,由此制备核酸构建体。

PGEP、引导多核苷酸、转座酶、可转座元件和经修饰的多核苷酸在上文详细描述。关于本文所描述的用于制备用于单分子表征的核酸构建体的方法所描述的任何方面也可以适用于用于制备适合于单分子表征的核酸构建体的系统。

检测和/或表征方法

本发明提供了一种检测和/或表征样品中的靶多核苷酸的方法,所述方法包括:

根据本文所描述的制备核酸构建体的方法制备用于单分子表征的核酸构建体;

使所述核酸构建体与包括跨膜孔的膜接触;

跨所述膜施加电位差;以及

进行由所述核酸构建体与所述孔接触产生的一种或多种测量,由此检测和/或表征所述靶多核苷酸以确定所述靶多核苷酸的存在或不存在和/或所述靶多核苷酸的一个或多个特性。

在由所述靶多核苷酸制备所述核酸构建体之后,通过本文所描述的本发明的方法制备的核酸构建体随后可以应用于检测和/或表征靶多核苷酸的基于纳米孔的方法。先前已经描述了检测样品中的靶多核苷酸的基于纳米孔的方法(WO 2018/060740)。先前已经描述了用于表征样品中的靶多核苷酸的基于纳米孔的方法(WO 2015/124935)。

在本文所描述的检测靶多核苷酸的方法中,在步骤b之前,所述方法可以包括使样品与和靶多核苷酸中的序列结合的引导多核苷酸和多核苷酸引导的效应蛋白接触,其中所述引导多核苷酸和所述多核苷酸引导的效应蛋白与样品中的任何靶标形成复合物。

在本文所描述的检测靶多核苷酸的方法中,步骤(d)可以进一步包括监测由于复合物与跨膜孔的相互作用而对跨膜施加的电位差的影响的存在或不存在,从而确定靶多核苷酸的存在或不存在。所述效应指示由引导多核苷酸、多核苷酸引导的效应蛋白和核酸构建体与跨膜孔相互作用形成的复合物。所述效应可能是由与复合物的一种组分——靶多核苷酸或引导多核苷酸连接的衔接子易位通过孔引起的。所述效应指示通过连接到复合物的组分之一、核酸构建体或引导多核苷酸的衔接子的孔的易位。可以使用电气测量和/或光学测量来监测效应。在这种情况下,效应是所测量到的电量或光学量的改变。电气测量可以是电流测量、阻抗测量、隧穿测量或场效应晶体管(field effect transistor,FET)测量。所述效应可以是通过跨膜孔的离子流的变化,导致电流、电阻的变化或光学特性的变化。效应可以是穿过跨膜孔的电子隧穿。效应可以是由于复合物与跨膜孔的相互作用引起的电位改变,其中在FET测量中使用局部电位传感器监测效应。

在本文所描述的表征靶多核苷酸的方法中,核酸构建体与孔的接触使得核酸构建体的至少一条核酸链移动通过孔。

在本文所描述的表征靶多核苷酸的方法中,进行一种或多种测量指示靶多核苷酸的一个或多个特性,所述一个或多个特性选自:(i)所述多核苷酸的长度;(ii)所述多核苷酸的同一性;(iii)所述多核苷酸的序列;(iv)所述多核苷酸的二级结构;以及(v)多核苷酸是否被修饰。

步骤b.包括使经修饰的多核苷酸与跨膜孔接触,使得经修饰的多核苷酸移动通过所述孔。经修饰的多核苷酸和模板多核苷酸可以与跨膜孔接触,使得它们都穿过孔。

所述方法的步骤b.和c.优选地在施加跨孔的电势的情况下进行。施加的电位可以是电压电位。可替代地,所施加的电势可为化学电势。其实例是跨两亲层使用盐梯度。Holden等人,《美国化学学会杂志(J Am Chem Soc.)》2007年7月11日;129(27):8650-5中公开了盐梯度。在一些情况下,当多核苷酸相对于孔移动时通过孔的电流用于确定核酸构建体的序列。这是链测序。如果核酸构建体被测序,则可以重构靶多核苷酸的序列。

可以使用这种表征靶多核苷酸的方法来表征例如测序核酸构建体和/或模板多核苷酸的全部或仅部分。

跨膜孔是某种程度上跨膜的结构。它允许由施加的电势驱动的水合离子在膜上或膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流向膜的另一侧。然而,跨膜孔不必要穿过膜。它可能在一端封闭。例如,孔可以是膜中的阱、间隙、通道、沟槽或狭缝,水合离子可以沿着它流动或流入其中。

本发明中可以使用任何跨膜孔。孔可以是生物的或人造的。合适的孔包含但不限于蛋白质孔、多核苷酸孔和固态孔。在本文所描述的任何方法中,所述孔可以允许双链多核苷酸和结合的多核苷酸通过所述孔易位。在本文所描述的任何方法中,所述孔可以允许双链多核苷酸和结合的多核苷酸通过所述孔易位。在本文所描述的任何方法中,所述孔可以允许双链多核苷酸的易位。在本文所描述的任何方法中,所述孔可以允许单链多核苷酸的易位。

根据本发明可以使用任何膜。合适膜在所属领域中是众所周知的。膜优选地是两亲层。两亲性层是由如磷脂等具有至少一个亲水部分和至少一个亲脂或疏水部分的两亲性分子形成的层。两亲性层可以是单层或双层。两亲性分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,并且包含例如嵌段共聚物(Gonzalez-Perez等人,《朗缪尔(Langmuir)》,2009,25,10447-10450)。嵌段共聚物是两个或更多个单体亚基聚合在一起以产生单个聚合物链的聚合材料。嵌段共聚物通常具有通过每个单体亚基贡献的性质。然而,嵌段共聚物可具有由个别子单元形成的聚合物不拥有的独特特性。嵌段共聚物可进行工程改造,使得单体子单元中的一个在水性介质中是疏水性的(即亲脂性),而其它子单元是亲水性的。在这种情况下,嵌段共聚物可拥有两亲特性,且可形成模拟生物膜的结构。嵌段共聚物可以是二嵌段的(其由两个单体子单元组成),但也可以由超过两个的单体子单元来构建,形成表现为两亲物的更复杂的排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。

两亲性层通常是平面脂质双层或支撑双层。

两亲性层通常是脂质双层。脂质双层是细胞膜的模型,且用作一系列实验研究的极佳平台。例如,脂质双层可以用于通过单通道记录对膜蛋白进行体外研究。可替代地,脂质双层可以用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。合适的脂质双层包含但不限于平面脂质双层、支持双层或脂质体。脂质双层优选地是平面脂质双层。合适的脂质双分子层在国际申请号PCT/GB08/000563(公布为WO 2008/102121)、国际申请号PCT/GB08/004127(公布为WO 2009/077734)和国际申请号PCT/GB2006/001057(公布为WO 2006/100484)中公开。

用于形成脂质双层的方法在所属领域中是已知的。在实例中公开了适当的方法。脂质双层通常通过Montal和Mueller的方法(《美国国家科学院院报(Proc.Natl.Acad.Sci.USA.)》,1972;69:3561-3566)来形成,其中脂质单层携载于通过开孔两侧的水溶液/空气界面上,所述开孔垂直于所述界面。

Montal和Mueller的方法很受欢迎,因为它是一种经济有效且相对简单的形成适合于蛋白孔插入的优质脂质双层的方法。双层形成的其它常见方法包含脂质体双层的尖端浸没、双层涂刷和贴片夹持。

脂质双层可以如国际申请第PCT/GB08/004127号(公布为WO 2009/077734)中所描述形成。

膜可以是固态层。固态层不是生物来源的。换言之,固态层不是从生物环境(如生物体或细胞)或合成制造形式的生物学可用结构中产生的,也不是从其中分离出来的。固态层可以由有机材料和无机材料两者形成,所述材料包含但不限于:微电子材料、如Si3N4、A12O3和SiO等绝缘材料、如聚酰胺等有机聚合物和无机聚合物、如等塑料或如二组分加成固化的硅橡胶等弹性体以及玻璃。固态层可以由如石墨烯等单原子层或仅几个原子厚的层形成。合适的石墨烯层在国际申请第PCT/US2008/010637号(公布为WO 2009/035647)中公开。

通常使用以下来实行方法:(i)包括孔的人工两亲层,(ii)包括孔的分离的天然存在的脂质双层,或(iii)其中插入孔的细胞。通常使用如人工脂质双层等人工两亲性层执行所述方法。所述层可以包括其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。以下论述了合适的设备和条件。通常在体外进行本发明的方法。

核酸构建体可以与膜偶联。可以使用任何已知的方法完成这一点。具体地,核酸构建体可以通过与片段化的靶多核苷酸连接的合适的经修饰的多核苷酸与膜偶联。可替代地,可以修饰与片段化的靶多核苷酸连接的经修饰的多核苷酸,以引入用于将核酸构建体偶联到膜的偶联或锚定元件。如果膜是两亲层,例如脂质双层(如上文详细讨论的),则核酸构建体优选地通过膜中存在的多肽或膜中存在的疏水锚与膜偶联。疏水性锚优选地是脂质、脂肪酸、固醇、碳纳米管或氨基酸。

核酸构建体可以直接与膜偶联。多核苷酸优选地通过连接子与膜偶联。优选的接头包含但不限于聚合物,如多核苷酸、聚乙二醇(PEG)以及多肽。如果多核苷酸直接与膜偶联,则由于膜与孔之间的距离,表征运行无法持续到核酸构建体的末端,因此一些数据将丢失。如果使用接头,则多核苷酸可以得到完全处理。如果使用接头,则接头可以在任何位置附接到多核苷酸。连接子优选地在尾部聚合物处连接到核酸构建体。

偶联可以是稳定的或暂时性的。对于某些应用来说,偶联的暂时性质是优选的。如果稳定的偶联分子直接连接到多核苷酸的5'或3'端,那么由于双层与孔之间的距离,表征运行无法继续到多核苷酸的末端,一些数据将会丢失。如果偶联是暂时性的,则当偶联的末端随机变为不含双层时,那么多核苷酸可以得到完全处理。下面更详细地讨论了与膜形成稳定或瞬时连接的化学基团。多核苷酸可以瞬时偶联到两亲层,例如使用胆固醇或脂肪酰基链的脂质双层。可以使用长度为6个到30个碳原子的任何脂肪酰基链,如十六烷酸。

合适的偶联方法在国际申请第PCT/GB12/05119 1号(公布为WO 2012/164270)和英国申请第1406155.0号中公开。

用于扩增基因组DNA区段的常见技术是使用聚合酶链式反应(PCR)。此处,使用两个合成寡核苷酸引物,可产生大量相同DNA片段的拷贝,其中对于每个拷贝,双螺旋中的每个链的5'将是合成多核苷酸。通过使用具有反应性基团的反义引物,如胆固醇、硫醇、生物素或脂质,扩增的靶DNA的每个拷贝都将含有用于偶联的反应性基团。

跨膜孔优选地为跨膜蛋白质孔。跨膜蛋白孔是多肽或多肽的集合,其允许如分析物的水合离子从膜的一侧流到膜的另一侧。在本发明中,跨膜蛋白质孔能够形成孔,所述孔允许由施加的电位驱动的水合离子从膜的一侧流到另一侧。跨膜蛋白孔优选地允许分析物如多核苷酸从膜,如脂质双层的一侧流到另一侧。跨膜蛋白孔允许如DNA或RNA的多核苷酸移动通过孔。

跨膜蛋白孔可以是单体或寡聚体。孔优选地由若干个重复亚基构成,如6个、7个、8个或9个亚基。孔优选地是六聚体、七聚体、八聚体或非聚体的孔。

跨膜蛋白孔通常包括离子可以流过的桶或通道。孔的亚基通常围绕中心轴线,并向跨膜β桶或通道或跨膜α-螺旋束或通道贡献链。

跨膜蛋白孔的桶或通道通常包括促进与分析相互作用的氨基酸,如核苷酸、多核苷酸或核酸。这些氨基酸优选地位于桶或通道的缢痕附近。跨膜蛋白孔通常包括一个或多个带正电荷的氨基酸,如精氨酸、赖氨酸或组氨酸或如酪氨酸或色氨酸等芳香族氨基酸。这些氨基酸典型地促进孔与核苷酸、多核苷酸或核酸之间的相互作用。

下面的非限制性实施例说明了本发明,并且不是限制性的。

实例1:

此实例展示了如何使用两个合成crRNA探针来富集噬菌体基因组的区域以进行纳米孔测序。富集不是通过靶与非靶DNA的物理分离,而是通过将转座子衔接子特异性插入到所关注区域,从而允许在此区域内开始特异性测序。这里描述了一种简单的一锅法,其中酶促步骤(dCas9结合、通过MuA的衔接子插入、测序)按顺序执行。

根据制造商的说明,使用 UltraTMII End Repair/dA-Tailing Module(新英格兰生物实验室公司(New England Biolabs,Inc.),目录#E7546L)对3.6kbλDNA(来自SQK-LSK109)进行末端修复和dA加尾。然后根据制造商的说明使混合物经历SPRI纯化以去除污染物并浓缩DNA(AMPure XP珠粒,贝克曼库尔特公司(Beckman Coulter,Inc.))。使用无核酸酶水将最终文库(“DCS”)稀释到100ng/μL。

化脓性链球菌Cas9切口酶(D10A)核糖核蛋白复合物(RNP)如下进行制备。寡核苷酸AR369(带有3DNA延伸的合成tracrRNA;TACATTTAAGACCCTAATAT/iSp18/[tracrRNA])和预混合AR147(CTTCGCGGCAGATATAATGG)和AR148(CCGACCACGCCAGCATATCG)(“crRNA”-以1:1等摩尔比混合的合成crRNA)首先通过在95℃下温育1μL的AR369(在100μM下)、1μL crRNA(100μM下)和8μL无核酸酶双链缓冲液(集成DNA技术公司(Integrated DNA Technologies,Inc.),目录#11-01-03-01)持续5分钟进行退火,然后冷却至室温以形成10μM tracrRNA-crRNA复合物。然后通过在室温下将2.5μL的tracrRNA-crRNA复合物(800nM终浓度)与400nM化脓性链球菌Cas9(新英格兰生物实验室公司,目录#M0650T)在总共30μL NEB CutSmart缓冲液中温育持续30分钟来形成RNP。此步骤产生了30μL的“Cas9 RNP”。

如下制备MuA转座酶核糖核蛋白复合物(RNP)。寡核苷酸EN47(带有3DNA延伸退火到tracrRNA的MuA底链)和EN45(/DBCO-TEG/GCTTGGGTGTTTAACCGTTTTCGCATTTATCGTGAAACGCTTTCGCGTTTTTCGTGCGCCGCTTCA)首先通过在95℃下温育10μL的EN47(5-GATCTGAAGCGGCGCACGAAAAACGCGAAAGCGTTTCACGATAAATGCGAAAACTTTTTTTTTTATATTAGGGTCTTAAATGTA;在100μM下)、10μL EN45(在100μM下)和5μL无核酸酶双链缓冲液(集成DNA技术公司,目录#11-01-03-01)持续5分钟进行退火,然后冷却至室温以形成10μM MuA Y-衔接子。然后通过在总共25μL MuA反应缓冲液中于30℃下使5μL的MuA Y衔接子复合物(8μM最终浓度)与3.3μM MuA转座酶(由牛津纳米孔科技有限公司(Oxford Nanopore Technologies)进行内部纯化)一起温育持续60分钟来形成RNP。此步骤产生了25μL的“MuA RNP”。

三个不同的反应在四个单管中进行如下:

(1)快速测序衔接子被点击到MuA Y衔接子转置DNA的反应,其中将Cas9 RNP添加到反应混合物中,

通过温育1μL文库、5μL Cas9 RNP(上图)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS与Cas9 RNP结合。此混合物在37℃下温育持续10分钟以将Cas9与靶标区域结合,然后添加20mM EDTA、50μM的TCEP和150mM NaCl。将混合物在37℃下再温育另外的10分钟。此步骤产生了100ng的“靶DNA,由Cas9 RNP结合”。

(2)快速测序衔接子被点击到MuA Y衔接子转置DNA的反应,其中将MuA RNP添加到反应混合物中,

将100ng的DCS或1μL的文库添加到2.5μL NEB CutSmart缓冲液、27.5μL无核酸酶水中,总共25μL。此混合物在37℃下温育持续10分钟,然后添加100nM的MuA RNP、20mM的EDTA、50μM的TCEP和150mM NaCl。将混合物在37℃下再温育另外的10分钟。此步骤产生了100ng的“靶DNA,由MuA RNP结合”。

(3)快速测序衔接子被点击到MuA Y衔接子转置DNA的反应,其中将Cas9 RNP和MuA RNP顺序添加到反应混合物中,

通过温育1μL文库、5μL Cas9 RNP(上图)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS与Cas9 RNP结合。此混合物在37℃下温育持续10分钟以将Cas9与靶标区域结合,然后添加100nM的MuA RNP、20mM的EDTA、50μM的TCEP。将混合物在37℃下再温育另外的10分钟。此步骤产生了100ng的“靶DNA,由MuA和Cas9 RNP结合”。

(4)快速测序衔接子被点击到MuA Y衔接子转置DNA的反应,其中将Cas9 RNP和MuA RNP顺序添加到反应混合物中,并且盐浓度增加为150mM NaCl,

通过温育1μL文库、5μL Cas9 RNP(上图)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS与Cas9 RNP结合。此混合物在37℃下温育持续10分钟以将Cas9与靶标区域结合,然后添加100nM的MuA RNP、20mM EDTA、50μM的TCEP和150mM NaCl。将混合物在37℃下再温育另外的10分钟。此步骤产生了100ng的“靶DNA,由更高盐中的MuA和Cas9 RNP结合摩尔”。

然后对混合物进行SPRI纯化以去除未连接的衔接子和其它污染物。将2体积(约50μL)SPRI珠粒(AMPure XP珠粒,贝克曼库尔特公司)添加到衔接子连接的DNA中,通过倒置轻轻混合,并且在室温下温育10分钟以将衔接子连接的DNA与珠粒结合。使用磁力分离器将珠粒沉淀,去除上清液,并用250μL SFB(来自津纳米孔LSK-109)洗涤两次,其中每次洗涤时珠粒完全重新悬浮,并且洗涤后珠粒再次沉淀。第二次洗涤之后,珠粒再次沉淀,去除多余的洗涤缓冲液,并且通过将珠粒沉淀物重悬于13.5μL Tris洗脱缓冲液(10mM Tris-Cl,20mM NaCl,pH 7.5,在室温下)中在室温下持续10分钟来从珠粒中洗脱DNA。将珠粒再一次沉淀,并保留包含在靶位点适应的纯化gDNA的洗脱液(上清液)。通过添加1.5μL的Cutsmart缓冲液(新英格兰生物实验室公司,目录#B7204S)并且将混合物在30℃下温育2分钟和在80℃下温育2分钟,启动DNA切割和转座子衔接子插入。

测序衔接子(来自SQK-RAD004的“RAP”)通过点击化学连接到DNA链。将1μL的RAP添加到混合物中并在室温下温育10分钟。

将37.5μL SQB和25.5μL LB(均来自牛津纳米孔技术公司的LSK-108)添加到15μL洗脱液中,以产生最终体积为75μL的“MinION测序混合物”。

为了对靶DNA进行测序,通过入口端口引入800μL流通池制备混合物(使用:来自牛津纳米孔LSK-109的1170μL FLB和30μL的FLT)制备牛津纳米孔技术公司FLO-MIN106流通池。随后打开SpotON端口,并通过入口端口灌注另外200μL流通池制备混合物。通过SpotON端口将75μL的MinION测序混合物添加到流通池中,并且然后关闭端口。使用牛津纳米孔技术公司的MinKNOW(版本19.06.8)收集6小时的测序数据,并且随后进行碱基调用(使用Guppy)并离线与3.6kbλ参考基因组对齐。

结果

图17和图1示出了相对于3.6kbλ参考的读段的开始,这是由于测序读段与相对于3.6kbλ参考的比对而产生的。正如预期的那样,在条件(3)和(4)中观察到靶标读段开始的富集,表明MuA主要在dCas9结合位点周围150nt窗口内的正确位置进行切割,并且适应的切割位点被有效地点击到测序衔接子。

图17和图2示出了测序读段与3.6kbλ参考比对导致的堆积。正如预期的那样,在条件(3)和(4)中观察到靶标区域的富集,表明MuA主要在正确的位置切割。大约80%的所有映射读段开始于预测的dCas9结合位点周围的150bp窗口。

实例2-λ-Cas12k-转座子序列

此实例展示了如何使用单个合成crRNA探针来富集噬菌体基因组的区域以进行纳米孔测序。富集不是通过靶与非靶DNA的物理分离,而是通过将转座子货物特异性插入到所关注区域,从而允许在所插入的货物内开始特异性测序。这里描述了一种简单的一锅法,其中酶促步骤(dCas9结合、通过MuA的衔接子插入、测序)按顺序执行。

材料与方法

根据制造商的说明,使用 UltraTMII End Repair/dA-Tailing Module(新英格兰生物实验室公司,目录#E7546L)对3.6kbλDNA(来自SQK-LSK109)进行末端修复和dA加尾。然后根据制造商的说明使混合物经历SPRI纯化以去除污染物并浓缩DNA(AMPure XP珠粒,贝克曼库尔特公司)。使用无核酸酶水将最终文库(“DCS”)稀释到100ng/μL。

如下制备转座子核糖核蛋白复合物(RNP)。寡核苷酸ARXX(合成tracrRNA)和ARXX(“crRNA”-合成crRNA)首先通过在95℃下温育1μL的ARXX(在100μM下)、1μL crRNA(100μM下)和8μL无核酸酶双链缓冲液(集成DNA技术公司,目录#11-01-03-01)持续5分钟进行退火,然后冷却至室温以形成10μM tracrRNA-crRNA复合物。然后通过将2.5μL的tracrRNA-crRNA复合物(800nM最终浓度)与800nM的ARXX(“货物”——带有转座子识别位点和衔接子插入物的dsDNA)、400nM的转座子蛋白(Cas12k、TniQ、TnsB和TnsC)中的每一个在总共30μL NEB CutSmart缓冲液中在室温下温育持续60分钟来形成RNP。此步骤产生了30μL的“转座子RNP”。

三个不同的反应在四个单管中进行如下:

(1)一种反应,其中快速测序衔接子被点击到衔接子转置的DNA,其中从添加到反应混合物中的转座子RNP中省略了Cas12k,

通过温育1μL文库、5μL转座子RNP(高于但省略Cas12k)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS被转座子RNP转座。此混合物在37℃下温育持续20分钟,以将Cas12k与靶标区域结合。此步骤产生100ng“靶DNA,由转座子RNP(-Cas12k)结合”。

(2)一种反应,其中快速测序衔接子被点击到衔接子转置的DNA,其中从添加到反应混合物中的转座子RNP中省略了TniQ,

通过温育1μL文库、5μL转座子RNP(高于但省略TniQ)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS被转座子RNP转座。此混合物在37℃下温育持续20分钟,以将Cas12k与靶标区域结合。此步骤产生100ng“靶DNA,由转座子RNP(-TniQ)结合”。

(3)一种反应,其中快速测序衔接子被点击到衔接子转置的DNA,其中从添加到反应混合物中的转座子RNP中省略了货物,

通过温育1μL文库、5μL转座子RNP(高于但省略货物DNA)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS被转座子RNP转座。此混合物在37℃下温育持续20分钟,以将Cas12k与靶标区域结合。此步骤产生100ng“靶DNA,由转座子RNP(-货物)结合”。

(4)快速测序衔接子被点击到衔接子转置DNA的反应,其中将转座子RNP添加到反应混合物中,

通过温育1μL文库、5μL转座子RNP(超过)、2.5μL NEB CutSmart缓冲液、22.5μL无核酸酶水,总共25μL,100ng的DCS被转座子RNP转座。此混合物在37℃下温育持续20分钟,以将Cas12k与靶标区域结合。此步骤产生100ng“靶DNA,由转座子RNP结合”。

测序衔接子(来自SQK-RAD004的“RAP”)通过点击化学连接到DNA链。将1μL的RAP添加到混合物中并在室温下温育10分钟。

将37.5μL SQB和12.5μL LB(均来自牛津纳米孔技术公司的LSK-108)添加到25μL的混合物中,以产生最终体积为75μL的“MinION测序混合物”。

为了对靶DNA进行测序,通过入口端口引入800μL流通池制备混合物(使用:来自牛津纳米孔LSK-109的1170μL FLB和30μL的FLT)制备牛津纳米孔技术公司FLO-MIN106流通池。随后打开SpotON端口,并通过入口端口灌注另外200μL流通池制备混合物。通过SpotON端口将75μL的MinION测序混合物添加到流通池中,并且然后关闭端口。使用牛津纳米孔技术公司的MinKNOW(版本19.06.8)收集6小时的测序数据,并且随后进行碱基调用(使用Guppy)并离线与3.6kbλ参考基因组对齐。

结果

图17示出了测序读段与3.6kbλ参考比对导致的堆积。

序列表

<110> 牛津纳米孔技术有限公司(OXFORD NANOPORE TECHNOLOGIES LIMITED)

<120> 用于制备用于单分子表征的核酸构建体的方法和系统

<130> N417334GB

<150> GB 1913997.1

<151> 2019-09-27

<160> 5

<170> PatentIn 3.5版

<210> 1

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 寡核苷酸AR369-带有3' DNA延伸的合成tracrRNA

<220>

<221> misc_feature

<222> (20)..(20)

<223> 3' iSp18/[tracrRNA]

<400> 1

tacatttaag accctaatat 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成crRNA

<400> 2

cttcgcggca gatataatgg 20

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成crRNA

<400> 3

ccgaccacgc cagcatatcg 20

<210> 4

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 寡核苷酸EN45

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5' DBCO-TEG

<400> 4

gcttgggtgt ttaaccgttt tcgcatttat cgtgaaacgc tttcgcgttt ttcgtgcgcc 60

gcttca 66

<210> 5

<211> 84

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 寡核苷酸EN47-带有退火到tracrRNA的3' DNA延伸的MuA底链

<400> 5

gatctgaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaactttttt 60

ttttatatta gggtcttaaa tgta 84

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1