一种构建测序文库的方法

文档序号:3324712阅读:459来源:国知局
一种构建测序文库的方法
【专利摘要】本发明涉及基因工程及分子生物学领域,提供了一种构建测序文库的方法。包括以下步骤:A.片段化处理源核酸,得片段化产物;B.步骤A的产物与第一接头连接,得第一连接产物;所述第一接头为互补的双链核酸分子;所述双链核酸分子中只有一条链上含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷;所述P-S键为硫代磷酸酯键;C.特异性切割试剂切割第一连接产物,除去被切下的小核酸片段;所述特异性切割试剂用于特异性的切割尿嘧啶核苷酸、P-S键或脱氧肌苷;D.聚合酶延伸步骤C的产物,得聚合酶延伸产物。本发明的方法能够避免构建的测序文库中掺入接头自连的产物。
【专利说明】一种构建测序文库的方法
[0001] 本案为2012年10月25日申请的,申请号为201210411938. 3,发明名称为《一种 接头和构建测序文库的方法》的分案申请。

【技术领域】
[0002] 本发明涉及基因工程及分子生物学领域,更具体地说,涉及一种构建测序文库的 方法。

【背景技术】
[0003] 在现阶段,用于高通量基因测序的DNA片段都会首先制备成测序文库。测序文库 的制备包括以下几个步骤,首先随机切割样品基因组,获得大量DNA片段,然后在DNA片段 两端接上不同的接头,最后对连接产物进行扩增反应得测序文库。在构建文库过程当中,最 大问题在于连接接头时很容易出现相同接头自连以及不同接头自身相互连接的现象,从而 导致构建的测序文库中混有接头自连的产物,进而干扰后续的测序反应,这在构建短标签 的测序文库时尤其严重。此外,接头自连现象的发生也会降低接头和DNA片段的有效利用 率。例如,CN200810044118. 9中公开了一种有利于高通量基因序列标签测序的DNA粘端接 头,是一种末端突出的DNA接头,带有可识别序列Xn、Yn,其序列式为序列(I )和序列(II ), 见图1,其中,X表示A、T、C、G四种碱基中的任意一种,η为4至10之间的任意整数,任意 两个相邻的X不能是相同的碱基,Y是与X -一对应的互补碱基,dm是末端突出标志,d表 示A、T、C、G四种碱基中的任意一种,m为1至4之间的任意整数。上述DNA接头含有两个 突出末端,分别是CCAT和dm,因为d表示A、T、C、G四种碱基中的任意一种,m为1至4之 间的任意整数,所以上述DNA接头的两个突出末端可能完全互补或部分互补,然后在接头 连接过程中发生接头自连的现象,从而导致构建的测序文库中可能混有接头自连的产物, 进而干扰后续的测序反应。
[0004] 因此需要一种新的接头及构建测序文库的方法,能够避免构建的测序文库中掺入 接头自连的产物。


【发明内容】

[0005] 本发明的目的在于提供一种接头和构建测序文库的方法,旨在解决现有技术在构 建测序文库的过程中掺入接头自连的产物的问题。
[0006] 为了实现发明目的,本发明提供了一种接头,所述接头为互补的双链核酸分子;所 述双链核酸分子中只有一条链上含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷;所述P-S 键为硫代憐Ife醋键。
[0007] 其中,所述尿嘧啶核苷酸、P-S键或脱氧肌苷将其所在核酸链分隔成至少两个核酸 片段,且所述核酸片段均小于15bp。
[0008] 其中,所述双链核酸分子为单突出末端双链核酸分子或双突出末端双链核酸分子 或平末端双链核酸分子。
[0009] 其中,所述单突出末端双链核酸分子的突出末端为(dN) a ;所述双突出末端双链核 酸分子的突出末端分别为(dN) b和(dN)。,所述(dN) b和(dN)。中至少有一个位于其所在链 的3'端,所述dN为A或G或C或T,所述a、b和c均为正整数。
[0010] 进一步的,所述(dN)a为T,位于含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷的 链的互补链的3'端;当所述(dN) b和(dN)。均位于其所在链的3'端时,(dN) b为T,(dN) c 的3'末端为G或C或T,(dN)。自身之间不能互补配对;当(dN)b和((1幻。分别位于同一链 的3'端和5'端时,(dN) b为T,(dN)。自身之间不能互补配对。
[0011] 上述任一方案中,所述双链核酸分子的两条核酸链的5'末端的核苷酸均不含磷酸 分子。
[0012] 上述任一方案中,所述双链核酸分子含有至少一个II S型限制性内切酶酶切识别 位点。
[0013] 进一步的,所述II S型限制性内切酶的酶切位点不在接头上。
[0014] 上述任一方案中,所述双链核酸分子含有生物素标记。
[0015] 进一步的,所述生物素标记位于双链核酸分子中含有至少一个尿嘧啶核苷酸、P-S 键或脱氧肌苷的链的互补链的5'端。
[0016] 为了更好的实现本发明的目的,本发明还提出了一种构建测序文库的方法,包括 以下步骤: A. 片段化处理源核酸,得片段化产物; B. 步骤A的产物与第一接头连接,得第一连接产物; C. 特异性切割试剂切割第一连接产物,除去被切下的小核酸片段;所述特异性切割试 剂用于特异性的切割尿嘧啶核苷酸、P-S键或脱氧肌苷; D. 聚合酶延伸步骤C的产物,得聚合酶延伸产物。
[0017] 所述第一接头为本发明的接头中的任一种。
[0018] 其中,在片段化处理之后,所述步骤A还包括对片段化产物的分离纯化及末端修 饰步骤。所述末端修饰包括但不限于:磷酸化、3'末端加 A。
[0019] 其中,步骤B中所述的第一接头为单突出末端双链核酸分子或双突出末端双链核 酸分子或平末端双链核酸分子。
[0020] 进一步的,所述单突出末端双链核酸分子的突出末端为(dN)a;所述双突出末端双 链核酸分子的突出末端分别为(dN) b和(dN)。,所述(dN) b和(dN)。中至少有一个位于其所 在链的3'端,所述dN为A或G或C或T,所述a、b和c均为正整数。
[0021] 更进一步的,所述(dN)aST,位于含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷 的链的互补链的3'端;当所述(dN) b和((1幻。均位于其所在链的3'端时,(dN)b为T,(dN) c的3'末端为6或(:或1',((^)。自身之间不能互补配对;当((^)13和((^)。分别位于同一 链的3'端和5'端时,(dN) b为T,(dN)。自身之间不能互补配对。
[0022] 上述任一方案中,所述第一接头的两条核酸链的5'末端的核苷酸均不含磷酸分 子。
[0023] 上述任一方案中,所述第一接头含有生物素标记。
[0024] 进一步的,步骤B中所述的第一接头在与步骤A的产物连接之前被固定在含有链 酶亲和素标记的磁珠上。
[0025] 进一步的,所述生物素标记位于双链核酸分子中含有至少一个尿嘧啶核苷酸、P-S 键或脱氧肌苷的链的互补链的5'端。
[0026] 其中,所述第一接头含有至少一个II s型限制性内切酶酶切识别位点,且该II s型 限制性内切酶的酶切位点不在第一接头上。
[0027] 进一步的,所述方法还包括以下步骤: E. II s型限制性内切酶酶切聚合酶延伸产物,回收含第一接头的酶切产物; F. 步骤E的产物与第二接头连接,得两端分别是第一接头和第二接头的双链核酸分 子;所述第二接头为互补的双链核酸分子,该双链核酸分子的一端与步骤E的产物中的酶 切末端互补配对。
[0028] 由上可知,本发明的接头为互补的双链核酸分子,所述双链核酸分子中只有一条 链上含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷;在构建测序文库的过程中,可将含有 接头的连接产物上的尿嘧啶核苷酸、P-S键或脱氧肌苷切开,此时接头自连产物被切成多个 小核酸片段,正确连接的产物同样能够被切下小核酸片段,但是正确连接的产物的其余部 分较上述的小核酸片段大很多;即,通过切割步骤,可放大接头自连产物与正确连接的产物 之间的大小差异,从而实现正确连接的产物与接头自连产物的分离,进而实现对接头自连 产物的彻底清除。此外,正确连接的产物上被切下的小核酸片段能够通过后续的聚合酶延 伸步骤补上,进而实现无接头自连产物的测序文库的构建。

【专利附图】

【附图说明】
[0029] 图1是【背景技术】中的有利于高通量基因序列标签测序的DNA粘端接头的结构示意 图; 图2是本发明的第一典型实施例中硫代磷酸酯键的结构示意图; 图3是本发明的第二和第四典型实施例的接头在具体使用过程中的方法示意图; 图4是本发明的第一具体实施例和第一对比实验构建的测序文库的PCR验证结果图。

【具体实施方式】
[0030] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。
[0031] 本发明提出第一典型实施例,一种接头,所述接头为互补的双链核酸分子;所述双 链核酸分子中只有一条链上含有至少一个用于切割的特异性切割位点;所述特异性切割位 点为尿嘧啶核苷酸、P-S键或脱氧肌苷;所述P-S键为硫代磷酸酯键。
[0032] 本方案的接头适于与任意长度的核酸片段连接,尤其适用于与接头长度相差不大 的核酸片段,例如:核酸片段与接头的大小比值在6 :1至1 :4之间,更优选在4 :1至3 :8之 间,更优选在2 :1至1 :2之间。因为在构建测序文库时,接头往往是与片段化的产物连接, 而片段化的产物的往往是一定长度范围内的核酸片段的集合,所以,当用于与接头连接的 核酸片段与接头的大小相差不大时,易导致接头与核酸片段的连接产物的大小和接头自连 产物的大小相近,而不易分离,从而导致测序文库中掺入接头自连的产物,进而干扰后续的 测序反应。而本方案的接头为互补的双链核酸分子,且只有一条链上含有至少一个特异性 切割位点;因此,在构建测序文库的过程中,可将含有接头的连接产物上的特异性切割位点 切开,此时接头自连产物被切出多个小核酸片段,正确连接的产物同样能够被切下小核酸 片段,但是正确连接的产物的其余部分(目标切割产物)较接头自连产物的切割产物和正确 连接的产物上切下的小核酸片段大很多;即,通过切割步骤,可加大接头自连产物与正确连 接的产物之间的大小差异,从而有利于正确连接的产物与接头自连产物的分离,进而实现 对接头自连产物的彻底清除。
[0033] 需要说明的是:所述尿嘧啶核苷酸能够被USER酶或UDG酶特异性切割;所述脱氧 肌苷能够被大肠杆菌核酸内切酶V或大肠杆菌核酸内切酶V同源物或DNA糖基化酶特异 性切割;所述硫代磷酸酯键能够被含有Ag、Hg、Cu、Mn、Zn或Cd原子的切割剂特异性切割。 [0034] 所述硫代磷酸酯键是指磷酸二酯键的桥接氧原子之一被硫原子取代。硫代磷酸脂 键可以是图2中A所示的5' -S-硫代磷酸酯连接(3' -0-P-S-5'),也可以是图2中B所示 的3' -S-硫代磷酸酯连接(3' -S-P-0-5')。
[0035] 可用各种含金属的物质切割硫代磷酸酯键。所述金属可以是Ag、Hg、Cu、Mn、Zn或 Cd。优选的,该物质是提供Ag+、Hg++、Cu2+、Mn2+、Zn +或Cd+离子的可溶于水的盐(也可采用提 供其它氧化状态的离子的盐)。特别优选含银盐如硝酸银(AgNO 3)或其它提供Ag+离子的盐。 切割的条件包括例如50 mM AgNO3,约22?37°C,10分钟或更长时间如30分钟。优选的, pH为4.0?10.0,更优选5.0?9.0,如约6.0?8.0,如约7.0。参见Mag, M.等,Nucleic AcidsRes.,19(7): 1437-1441,1991。
[0036] 如上所述,特异性切割位点为P-S键的接头与特异性切割位点为尿嘧啶核苷酸或 脱氧肌苷的接头相比,所需的特异性切割试剂的成本更低,完成切割的速度更快,操作也更 为简便,构建测序文库的成本更低;但其对环境造成的污染较大。相应的,特异性切割位点 为尿嘧啶核苷酸或脱氧肌苷的接头能够避免环境污染的问题。
[0037] 优选的,所述特异性切割位点均为尿嘧啶核苷酸。因为尿嘧啶核苷酸被特异性切 割的速度较脱氧肌苷被特异性切割的速度更快,即本方案的接头能够提高构建测序文库的 效率。
[0038] 本方案中,所述小核酸片段是指从接头与核酸片段的连接反应的产物(可包括正 确连接产物和接头自连产物)上被特异性切割试剂切割下的核酸片段。
[0039] 基于第一典型实施例,本发明提出第二典型实施例,本实施例中对特异性切割位 点,即尿嘧啶核苷酸、P-S键或脱氧肌苷在核酸链上的分布做了进一步的限定。所述特异性 切割位点将其所在核酸链分隔成至少两个核酸片段,且所述核酸片段均小于15bp。
[0040] 如图3所示,本方案的接头在构建测序文库的过程中,在经特异性切割试剂切割 之后,所得的小核酸片段均小于15bp,这降低了这些小核酸片段与其互补链之间的结合能 力,更容易形成单链分子,保证目标切割产物与接头自连产物的切割产物和正确连接的产 物上切下的小核酸片段之间的大小差异处于易于分离的范围,即,通过切割步骤更有利于 正确连接的产物与接头自连产物的分离,进而实现对接头自连产物的彻底清除。S卩,第二典 型实施例的接头能够更好的避免构建的测序文库中掺入接头自连的产物。
[0041] 优选的,所述特异性切割位点将其所在核酸链分隔成至少两个核酸片段,且所述 核酸片段均小于l〇bp。
[0042] 更优选的,所述特异性切割位点将其所在核酸链分隔成至少两个核酸片段,且所 述核酸片段均小于8bp或7bp或6bp或5bp。本方案中的接头,通过对特异性切割位点之间 的位置的进一步限定,在构建测序文库的过程中,在经特异性切割试剂切割之后,断裂形成 的核酸片段在常温下即可与特异性切割位点所在链的互补链分离,即形成单链分子,从而 在常温下即可实现对接头自连产物的彻底清除,这降低了分离实验对实验条件的要求,可 更快的实现正确连接产物的分离纯化。
[0043] 基于第二典型实施例,本发明提出第三典型实施例,本实施例在上述对特异性切 割位点在核酸链上的分布的各种限定的基础上,还可有以下进一步限定:所述接头的用于 与核酸片段连接的一端与距该端最近的特异性切割位点之间的距离小于等于l〇bp。
[0044] 本方案能够进一步保证本发明的接头在构建测序文库的过程中,经特异性切割之 后,接头自连产物被切割后的不含特异性切割位点的两条链相互之间能够互补配对的碱基 数小于等于20bp,该两条链能够较容易的被解链,保证接头自连产物的切割产物与目标切 割产物之间的大小差异处于能被更容易的分离的范围,即,更有利于正确连接的产物与接 头自连产物的分离,进而实现对接头自连产物的彻底清除。所以,本方案的接头能够更好的 避免构建的测序文库中掺入接头自连的产物。
[0045] 更进一步的,所述接头的用于与核酸片段连接的一端与距该端最近的特异性切割 位点之间的距离小于等于8bp、7bp、6bp、5bp或4bp。本方案中的接头,通过对接头的用于与 核酸片段连接的一端与距该端最近的特异性切割位点之间距离的进一步限定,在利用本方 案的接头构建文库时,可保证接头自连产物经特异性切割后形成的所有核酸片段在常温下 均为单链形式,即,可在常温下实现对接头自连产物的彻底清除,即降低了分离实验对实验 条件的要求,可更快的实现正确连接产物的分离纯化。
[0046] 上述任一技术方案中的接头可以是单关出末纟而接头、双关出末纟而接头或平末纟而接 头。即,所述接头为互补的双链核酸分子;所述双链核酸分子中只有一条链上含有至少一个 尿嘧啶核苷酸、P-S键或脱氧肌苷;所述P-S键为硫代磷酸酯键。所述双链核酸分子为单突 出末端双链核酸分子、双突出末端双链核酸分子或平末端双链核酸分子。
[0047] 其中,所述单突出末端双链核酸分子的突出末端为(dN)a,所述dN为A或G或C或 T,所述a为正整数。
[0048] 进一步的,所述(dN)a自身之间不能互补配对。本方案的接头避免了接头之间的 互补配对连接,使得基于本方案的接头构建测序文库时,进一步避免了构建的测序文库中 掺入接头自连的产物的现象的出现,提高了接头的利用率。
[0049] 更进一步的,所述(dN)aST,即dN为T,a等于1 ;所述(dN)a位于含有至少一个 尿嘧啶核苷酸、P-S键或脱氧肌苷的链的互补链的3'端。本方案的接头能利用其单突出的 T末端与3'端为单突出A尾的核酸片段高效连接,进而提高用于构建测序文库的核酸片段 和接头的利用率,并提1?测序文库的构建效率。
[0050] 其中,所述双突出末端双链核酸分子的突出末端分别为(dN) b和(dN)。,所述(dN) b和(dN)。中至少有一个位于其所在链的3'端,所述dN为A或G或C或T,所述b和c均为 正整数。
[0051] 进一步的,所述(dN)b自身之间不能互补配对,所述(dN)。自身之间不能互补配对, 所述之间不能互补配对。本方案的接头避免了接头之间的互补配对连接, 使得基于本方案的接头构建测序文库时,进一步避免了构建的测序文库中掺入接头自连的 产物的现象的出现,提高了接头的利用率。
[0052] 应当说明的是,本发明所述的(dN)a自身之间不能互补配对,是指每一个确定序列 的(dN) a与其本身之间不能互补配对;同样的,(dN) b之间不能互补配对,是指每一个确定 序列的(dN)b与其本身之间不能互补配对;(dN)。之间不能互补配对,是指每一个确定序列 的(dN)。与其本身之间不能互补配对。
[0053] 更进一步的,当所述(dN) b和(dN)。均位于其所在链的3'端时,(dN) b为T,即dN 为T,b等于1。本方案的接头能利用其T末端与3'端为单突出A尾的核酸片段高效连接, 进而提高用于构建测序文库的核酸片段和接头的利用率,并提高测序文库的构建效率。
[0054] 更进一步的,所述(dN)。的3'末端为G或C或T。本方案的接头彻底避免了(dN) b和(dN)。之间的互补配对连接。
[0055] 上述任一方案中,所述双链核酸分子的两条核酸链的5'末端的核苷酸均不含磷酸 分子。本方案的接头彻底避免了接头之间的自连现象的出现。
[0056] 上述任一方案中,所述双链核酸分子含有至少一个II s型限制性内切酶酶切识别 位点。
[0057] 需要说明的是,所述的II s型限制性内切酶为切割位点在识别序列之外的限制性 内切酶,包括但不限于:Acu I、Alw I、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、 Bmr I、Bpm I、BpuE I、Bsa I、BseM II、BseR I、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、 BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、 Mbo II、Mly I、Mme I、Mnl I、NmeAIII、Ple I、Sap I、SfaN I 和 TspDT I ,优选为 Acu I、 Bsg I、EcoP15 I 或 Mme I。
[0058] 进一步的,所述II s型限制性内切酶酶切识别位点与接头上用于和核酸片段连接 的一端之间的距离为d,所述II S型限制性内切酶酶切识别位点与II S型限制性内切酶切割 位点之间的距离为e,d和e均为自然数,d小于e,8卩,II s型限制性内切酶的酶切位点不在 接头上。
[0059] 本方案的接头可用于构建含有相同序列长度的待测序片段的测序文库,进而使得 测序文库在后续的扩增和测序过程中均一性更佳。
[0060] 上述任一方案中,所述双链核酸分子含有标记物。所述标记物为生物素、抗原、抗 体、受体、配体、多聚组氨酸中的至少一种。利用含有与所述标记物特异性结合的配合物的 固相载体,可对本方案的接头的连接产物进行快速的分离纯化,提高测序文库的构建效率。
[0061] 进一步的,所述标记物为生物素标记。所述生物素标记能够与含有链酶亲和素或 亲和素标记的固相载体特异性结合,从而实现对连接产物的快速分离纯化。
[0062] 更进一步的,所述生物素标记位于双链核酸分子中含有至少一个尿嘧啶核苷酸、 P-S键或脱氧肌苷的链的互补链的5'端。含有本方案的接头的连接产物(正确连接的产物 和可能存在的接头自连产物的混合物)在被特异性切割试剂切割后,含有链酶亲和素或亲 和素标记的固相载体可快速的将目标切割产物与小核酸片段分离,进而实现正确连接的产 物与接头自连产物的分离。本方案的接头能够进一步提高测序文库的构建效率。
[0063] 上述任一方案中,所述接头的大小无特殊限制。优选的,所述接头的大小在20至 80bp之间。更优选的,所述接头的大小在25至60bp之间。
[0064] 本发明提出第四典型实施例,一种构建测序文库的方法,包括以下步骤: A.片段化处理源核酸,得片段化产物; B. 步骤A的产物与第一接头连接,得第一连接产物; C. 特异性切割试剂切割第一连接产物,除去被切下的小核酸片段;所述特异性切割试 剂用于特异性的切割尿嘧啶核苷酸、P-S键或脱氧肌苷; D. 聚合酶延伸步骤C的产物,得聚合酶延伸产物。
[0065] 所述第一接头为本发明的接头中的任一种。
[0066] 图3示出了本典型实施例中的部分流程。本方案利用第一接头上的一条链含有的 尿嘧啶核苷酸、P-S键或脱氧肌苷,利用特异性切割试剂进行切割,此时第一接头自连产物 被切出多个小核酸片段,正确连接的产物同样能够被切下小核酸片段,但是正确连接的产 物的其余部分(目标切割产物)较接头自连产物的切割产物和正确连接的产物上切下的小 核酸片段大很多;即,通过切割步骤,可加大第一接头自连产物与正确连接的产物之间的大 小差异,从而有利于正确连接的产物与第一接头自连产物的分离,进而实现对第一接头自 连产物的彻底清除;然后再通过步骤D,聚合酶延伸步骤C的产物(目标切割产物),将正确 连接的产物补上,最终实现无接头自连产物的测序文库的构建。
[0067] 需要说明的是,步骤A中所述源核酸是双链核酸分子,可以是基因组中的任意片 段,包括但不限于基因、基因的一部分、调控序列、内含子或内含子的一部分;也可以是基因 组DNA、cDNA或DNA与RNA的杂合分子;还可以是基因组DNA、cDNA、RNA (包括但不限于 mRNA和rRNA)上特定区域的扩增片段。源核酸的大小无特殊限制,优选的,源核酸大于等于 150bp,更优选的,源核酸大于等于200bp。
[0068] 所述片段化源核酸的方法有多种,包括但不限于:超声法、喷雾法、化学剪切法和 酶切法。可根据实际情况,采用相适应的方法进行实验。上述方法均为本领域的常规技术, 在此不再赘述。
[0069] 根据后续建库步骤对核酸长度的需要,还可对片段化得到的核酸片段进行分离纯 化,分离方法可以采用常用方法,如凝胶电泳、蔗糖梯度或氯化铯梯度沉降、柱层析分离等。 本方案尤其适用于分离纯化得到的片段化产物与第一接头的大小比值在6 :1至1 :4之间 的情况,更适用于上述比值在4 :1至3 :8之间的情况,更适用于上述比值在2 :1至1 :2之 间的情况。
[0070] 优选的,分离纯化得到的片段化产物在20bp至200bp之间;更优选的,分离纯化得 到的片段化产物在25bp至IOObp之间。
[0071] 另外,根据所使用的片段化方法以及后续第一接头连接的需要,还可对所得的多 核苷酸片段进行进一步的末端修饰,包括但不限于:磷酸化或去磷酸化、末端补平和末端加 A,等等;以便于后续的步骤中与连接组件的连接。
[0072] 所述步骤B中,第一接头与步骤A产物的连接反应可只发生在步骤A产物的一端, 也可发生在步骤A产物的两端。
[0073] 所述第一连接产物为第一接头与步骤A产物完成连接反应后得到的产物。
[0074] 若第一接头与步骤A产物之间的连接反应被设计成只发生在步骤A产物的一端, 则步骤B所得的第一连接产物可包括仅在一端含有已知序列(第一接头)的双链核酸分子和 第一接头自连的产物,步骤D所得的聚合酶延伸产物只在一端含有已知序列(第一接头),为 了成功构建测序文库,可在聚合酶延伸产物的另一端接上接头。
[0075] 若第一接头与步骤A产物之间的连接反应被设计成可发生在步骤A产物的两端, 则步骤B所得的第一连接产物可包括在两端均含有已知序列(第一接头)的双链核酸分子和 第一接头自连的产物,步骤D所得的聚合酶延伸产物就是在两端均含有已知序列(第一接 头),可直接作为测序文库,也可通过进一步的处理,从而得到符合特殊要求的测序文库。
[0076] 步骤C中所述特异性切割试剂为USER酶、UDG酶、大肠杆菌核酸内切酶V、大肠杆 菌核酸内切酶V同源物、DNA糖基化酶或含有Ag、Hg、Cu、Mn、Zn或Cd原子的切割剂,它们 能够分别特异性的切割尿嘧啶核苷酸、P-S键或脱氧肌苷。
[0077] 步骤C中所述被切下的小核酸片段的除去方式有多种,包括但不限于:在较高温 度条件下对切割产物进行柱分离纯化,此时的温度需既低于目标连接产物的退火温度,又 高于步骤C中被切下的小核酸片段与其互补片段的退火温度。上述温度的选择,为本领域 技术人员的常规技术手段,在此不再详述。步骤C中所述的被切下的小核酸片段的除去方 法还可以采用凝胶电泳、蔗糖梯度或氯化铯梯度沉降等。优选采用柱分离纯化,通过柱分离 纯化的步骤更少,效率更高,成本更低。
[0078] 所述小核酸片段是指在步骤C中,被特异性切割试剂从第一连接产物上切下的核 酸片段。
[0079] 所述目标切割产物是指被切去小核酸片段后的第一连接产物。
[0080] 基于第四典型实施例,本发明提出第五典型实施例,在本实施例中,步骤B中所述 的第一接头含有生物素标记;所述生物素标记位于双链核酸分子中含有至少一个尿嘧啶核 苷酸、P-S键或脱氧肌苷的链的互补链的5'端。
[0081] 本方案中,为了便于步骤B的连接产物的分离纯化,至少可以有以下两种实施方 案。
[0082] 第一种实施方案如下:步骤B中所述的第一接头在与步骤A的产物连接之前被固 定在含有链酶亲和素标记的磁珠上。本方案中,步骤B的连接反应是发生在磁珠上的,连接 反应完成后,通过磁铁的吸附作用,连接产物和未连接的第一接头能够简便的与未连接的 步骤A的产物分离。
[0083] 第二种实施方案如下:步骤B中所述的第一接头先与步骤A的产物进行连接反应, 连接反应完成之后用含有链酶亲和素标记的磁珠捕获连接产物。本方案同样能够通过磁铁 的吸附作用,使连接产物和未连接的第一接头与未连接的步骤A的产物分离。与上一实施 方案相比,本方案能够避免在连接反应过程中,因为磁珠的沉降而导致的第一接头集中在 连接反应体系的底部而导致的连接反应效率的降低。当然,上一实施方案也可以通过在连 接反应的过程中使连接反应体系周期性振荡来避免这一问题的发生。
[0084] 此外,利用含有链酶亲和素标记的磁珠进行捕获的步骤还可以发生在步骤C的特 异性切割之后,也可以发生在步骤D的聚合酶延伸之后。优选发生在步骤D的聚合酶延伸 之后,这样步骤B的连接反应、步骤C酶切反应、步骤D的聚合酶延伸反应过程中,相应的第 一接头、连接产物、特异性切割产物均不会因磁珠的沉降作用而集中在反应体系的底部,从 而避免了连接反应效率的降低、切割效率的降低和聚合酶延伸效率的降低。
[0085] 更进一步的,步骤C的切割反应和步骤D的聚合酶延伸反应均能够发生在磁珠上。 在步骤C中的切割反应完成之后,利用磁铁的吸附作用,可快速的将步骤C中切割下的小核 酸片段除去;而在步骤D中的聚合酶延伸反应之后,利用磁铁的吸附作用,可快速的将步骤 D所得聚合酶延伸产物分离纯化出来。
[0086] 上述任一方案中,步骤B中所述的第一接头上的特异性切割位点将其所在核酸链 分隔成至少两个核酸片段,且所述核酸片段均小于15bp。
[0087] 更优选的,所述特异性切割位点将其所在核酸链分隔成至少两个核酸片段,且所 述核酸片段均小于8bp或7bp或6bp或5bp。
[0088] 更进一步的,所述第一接头的用于与片段化产物连接的一端与距该端最近的特异 性切割位点之间的距离小于等于l〇bp。
[0089] 本方案能够进一步保证第一接头在构建测序文库的过程中,经特异性切割之后, 第一接头自连产物被切割后的不含特异性切割位点的两条链相互之间能够互补配对的碱 基数小于等于20bp,该两条链能够较容易的被解链,保证接头自连产物的切割产物与目标 切割产物之间的大小差异处于能被更容易的分离的范围,即,更有利于正确连接的产物与 第一接头自连产物的分离,进而实现对第一接头自连产物的彻底清除。即,本方案能够更好 的避免构建的测序文库中掺入接头自连的产物。
[0090] 更进一步的,所述第一接头用于与片段化产物连接的一端与距该端最近的特异性 切割位点之间的距离小于等于8bp、7bp、6bp、5bp或4bp。本方案中的第一接头,通过对第一 接头的用于与片段化产物连接的一端与距该端最近的特异性切割位点之间距离的进一步 限定,在利用本方案的第一接头构建文库时,可保证第一接头自连产物经特异性切割后形 成的所有核酸片段在常温下均为单链形式,即,可在常温下实现对第一接头自连产物的彻 底清除,这降低了分离实验对实验条件的要求,可更快的实现正确连接产物的分离纯化。
[0091] 上述任一方案中,步骤B中所述的弟一接头可以是单关出末纟而接头、双关出末立而 接头或平末端接头。即,所述第一接头为互补的双链核酸分子;所述双链核酸分子中只有一 条链上含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷;所述P-S键为硫代磷酸酯键;所述 双链核酸分子为单突出末端双链核酸分子、双突出末端双链核酸分子或平末端双链核酸分 子。
[0092] 其中,所述单突出末端双链核酸分子的突出末端为(dN)a,所述dN为A或G或C或 T,所述a为正整数。
[0093] 进一步的,所述(dN)a自身之间不能互补配对。本方案中的第一接头能够避免第 一接头之间的互补配对连接,从而进一步避免了构建的测序文库中掺入第一接头自连的产 物的现象的出现,提高了第一接头的利用率。
[0094] 更进一步的,所述(dN)aST,即dN为T,a等于1 ;所述(dN)a位于含有至少一个 尿嘧啶核苷酸、P-S键或脱氧肌苷的链的互补链的3'端。本方案的第一接头能利用其单突 出的T末端与3'端为单突出A尾的核酸片段高效连接,进而提高用于构建测序文库的核酸 片段和第一接头的利用率,并提高测序文库的构建效率。
[0095] 其中,所述双突出末端双链核酸分子的突出末端分别为(dN) b和(dN)。,所述(dN) b和(dN)。中至少有一个位于其所在链的3'端,所述dN为A或G或C或T,所述b和c均为 正整数。
[0096] 进一步的,所述(dN)b自身之间不能互补配对,所述(dN)。自身之间不能互补配对, 所述(dN) b和(dN)。之间不能互补配对。本方案的第一接头避免了第一接头之间的互补配 对连接,使得本方案进一步避免了构建的测序文库中掺入第一接头自连的产物的现象的出 现,提高了第一接头的利用率。
[0097] 更进一步的,当所述(dN) b和(dN)。均位于其所在链的3'端时,(dN) b为T,即dN 为T,b等于1。本方案的第一接头能利用其T末端与3'端为单突出A尾的核酸片段高效 连接,进而提高用于构建测序文库的核酸片段和第一接头的利用率,并提高测序文库的构 建效率。
[0098] 更进一步的,所述(dN)。的3'末端为G或C或T。本方案的第一接头彻底避免了 (dN) b和(dN)。之间的互补配对连接。
[0099] 上述任一方案中,所述第一接头的两条核酸链的5'末端的核苷酸均不含磷酸分 子。本方案彻底避免了第一接头自连现象的出现。
[0100] 基于上述任一方案,本发明提出第六典型实施例,所述第一接头含有至少一个π S 型限制性内切酶酶切识别位点;所述方法还包括以下步骤: E. II s型限制性内切酶酶切聚合酶延伸产物,回收含第一接头的酶切产物; F. 步骤E的产物与第二接头连接,得两端分别是第一接头和第二接头的双链核酸分 子;所述第二接头为互补的双链核酸分子,该双链核酸分子的一端与步骤E的产物中的酶 切末端互补配对。
[0101] 需要说明的是,所述的II s型限制性内切酶为切割位点在识别序列之外的限制性 内切酶,包括但不限于:Acu I、Alw I、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、 Bmr I、Bpm I、BpuE I、Bsa I、BseM II、BseR I、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、 BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、 Mbo II、Mly I、Mme I、Mnl I、NmeAIII、Ple I、Sap I、SfaN I 和 TspDT I ,优选为 Acu I、 Bsg I、EcoP15 I 或 Mme I。
[0102] 进一步的,所述II S型限制性内切酶酶切识别位点与第一接头上用于和核酸片段 连接的一端之间的距离为d,所述II S型限制性内切酶酶切识别位点与II S型限制性内切酶 切割位点之间的距离为e,d和e均为自然数,d小于e,S卩,该II s型限制性内切酶的酶切位 点不在第一接头上。
[0103] 本方案构建的测序文库中的文库分子含有相同序列长度的待测序片段,这使得测 序文库在后续的扩增和测序过程中均一性更佳。
[0104] 以下将通过两个具体实施例对本发明进行进一步的详细说明。
[0105] 第一具体实施例以一正常人的全血基因组DNA为源核酸,第一接头由SEQ ID NO: 1 和SEQ ID N0:2退火而成,其中,SEQ ID N0:1的5'端含双生物素标记,第一接头上含有 Acu I酶切识别位点。
[0106] 一、片段化全血基因组DNA。
[0107] UDnase I酶切片段化。
[0108] 按以下配比在冰上配置片段化反应体系:基因组DNA,6y g ;500mM Tris-HCl, 8 μ L ; IOOmM MnCl2,8 μ L ;lmg/mL BSA,8 μ L ;Dnase I (Fermentas, #ΕΝ0521, lu/ μ L),6 μ L ; CldH2O,补至 80 μ L。
[0109] 反应条件如下:37°C酶切 20min,然后加入 1 μ L 0· 5mol/L 的 EDTA (Fermentas, #R1021,pH 8· 0)终止反应。
[0110] 2、柱回收。
[0111] 利用 QIAquick Nucleotide Removal Kit (Qiagen,Cat. nos. 28304)回收片段化 产物,具体操作如下:往酶切产物中加入500 μ L Buffer PNI ;将QIAquick离心柱置入对应 的2ml收集管,将上述需要纯化的DNA产物移入Quick离心柱,6000rpm离心1分钟;弃离 心过柱的液体,加入750 μ L Buffer PE,6000rpm离心1分钟,弃离心过柱的液体,重复此步 骤一次;将QIAquick离心柱再次放回收集管,13000rpm离心1分钟,然后将QIAquick离心 柱转至一个新的1.5mL EP管内;向QIAquick离心柱内底部中心加入50 μ L Buffer EB,静 置2分钟,13000rpm离心1分钟,离心所得液体即为过柱纯化得到的DNA。
[0112] 二、DNA片段末端修复。
[0113] 按以下配比在冰上配置DNA片段末端修复反应体系:5XReaction Buffer, 40 μ L ;dNTP (各 2mM,Fermentas,#R0241 ),4 μ L ;步骤一产物,4 μ g ;T4 DNA Polymerase (Fermentas,#ΕΡ0061,5u/ μ L),0· 8 μ L ;ddH20,补至 200 μ L。
[0114] 反应条件:11°C孵育20min ;然后加热至75°C,处理lOmin,以终止反应。
[0115] 参考步骤一中2、柱回收步骤,对上述反应的产物进行柱纯化。
[0116] 三、末端加 A反应。
[0117] 1、按以下配比在冰上配置末端加 A反应体系:10XNEBuffer2,12yL;10mM dATP, 2· 4μ L ;Klenow Fragment (3, 一 5' exo -,NEB,#M0212L,5u/y L),2. 4μ L ;步骤二产物, 3μ g ;ddH20,补至 120μ L。
[0118] 反应条件:37°C孵育30min ;然后加热至75°C,处理20min,以终止反应。
[0119] 2、对步骤1的产物进行切胶纯化,使用12%PAGE胶,180V电泳20min ;然后在紫外 线照射的条件下切取30bp至SObp间的DNA片段;将切下的凝胶转移至2mL的EP管中,捣 碎凝胶,然后加入PAGE凝胶回收液(0. 5M醋酸氨,IOmM醋酸镁,ImM EDTA,0. 1%SDS),PAGE 凝胶回收液至少需要没过凝胶,37°C孵育2h ;将凝胶及凝胶液转移至3S柱中,12000rpm离 心2min,将离心下的液体转移至新的1.5mL EP管中。然后参考步骤一中2、柱回收步骤对 离心下的液体进行柱纯化。
[0120] 四、与第一接头连接。
[0121] 按以下配比在冰上配置连接反应体系:步骤三产物,200ng ;第一接头,600ng ; 10XT4 DNA Ligase Buffer, 8 μ L ;50%PEG 4000,8 μ L ;T4 DNA Ligase (Fermentas, #EL0011,5u/y L),4y L ;ddH20,补至 80μ L。
[0122] 反应条件:16 °C连接过夜。
[0123] 然后参考步骤一中2、柱回收步骤,对连接反应的产物进行柱纯化。
[0124] 五、USER酶酶切。
[0125] 按以下配比在冰上配置USER酶酶切体系:步骤四产物,200ng ;10XUSER Buffer, 10 μ L ;USER (NEB, #M5505, lu/ μ L),10 μ L ;ddH20,补至 100 μ L。
[0126] 反应条件:37 °C孵育Ih。
[0127] 利用 QIAquick Nucleotide Removal Kit (Qiagen,Cat. nos. 28304)回收 USER 酶 酶切产物,具体操作如下:往酶切产物中加入500 μ L Buffer PNI,55°C孵育5min,使得被 USER酶切下的小核酸片段、第一接头自连产物被切割后的不含尿嘧啶核苷酸的两条链均被 变性成单链;将QIAquick离心柱置入对应的2ml收集管,将55°C孵育后的溶液移入Quick 离心柱,6000rpm离心1分钟;弃离心过柱的液体,加入750μ L Buffer PE,6000rpm离心1 分钟,弃离心过柱的液体,重复此步骤一次;将QIAquick离心柱再次放回收集管,13000rpm 离心1分钟,然后将QIAquick离心柱转至一个新的I. 5mL EP管内;向QIAquick离心柱内 底部中心加入50 μ L Buffer EB,静置2分钟,13000rpm离心1分钟,离心所得液体即为过 柱纯化后得到的USER酶酶切后的目标产物。
[0128] 六、聚合酶修复。
[0129] 按以下配比在冰上配置聚合酶延伸体系:步骤五产物,120ng ;10XPyrobest Buffer II,15uL;dNTPs (各 2.5mM),4uL;Pyrobest DNA Polymerase (Takara,DR005A, 5u/ μ L),0· 75 μ L ;ddH20,补至 150 μ L。
[0130] 反应条件:60°C孵育40min。
[0131] 参考步骤一中2、柱回收步骤,对聚合酶延伸的产物进行柱纯化。
[0132] 七、Acu I 酶切。
[0133] 按以下配比在冰上配置Acu I酶切反应体系:步骤六产物,2μ g ;10XNEBuffer4, 4 μ L ;Acu I (NEB, #R0641L,5u/ μ L),1 μ L ;400 μ M SAM, 4 μ L ;ddH20,补至 40 μ L。
[0134] 反应条件:37°C孵育 1.5h,然后加入 IyL 0.5mol/L 的EDTA(Fermentas,#R1021, pH 8.0)终止反应。
[0135] 八、磁珠捕获。
[0136] 利用链霉亲和素标记的磁珠 M280 (invitrogen,Dynabeads * MyOneTM Streptavidin Cl)捕获步骤七的产物。
[0137] 具体操作如下: 1) 取8 μ L M280,用磁铁吸附磁珠,然后用移液器吸去上清; 2) 加入16yL TE (IOmM Tris-HCl,lmM EDTA,pH7.5)洗涤,用磁铁吸附磁珠,然后用 移液器吸去上清;重复三次; 3) 加入40μLBindingBuf?er(20mMTris-HCl,l·0MLiCl,2mMEDTA,pH7·5)悬浮 磁珠,然后加入40 μ L步骤七的产物,混匀后至旋转转盘上低速转动,室温结合2h,每10至 15min轻弹管壁或短暂涡旋混匀磁珠,使步骤七产物中含生物素标记的分子充分结合到磁 珠上; 4) 用磁铁吸附磁珠,小心除去上清,然后用20 μ L TE清洗磁珠2次; 5) 用磁铁吸附磁珠,小心除去上清,然后加入20 μ L TE重悬磁珠。
[0138] 九、与弟-接头连接。
[0139] 第二接头由 SEQ ID N0:3 和 SEQ ID N0:4 退火而成,其中,SEQ ID N0:3 和 SEQ ID N0:4的5'末端的均不含磷酸分子,SEQ ID N0:4上的N为通用碱基,可以是A、G、C或T。
[0140] 按以下配比配置连接反应体系:步骤八产物,20yL;第二接头,600ng;10XT4 DNA Ligase Buffer,8 μ L ;50%PEG 4000,8 μ L ;T4 DNA Ligase (Fermentas,#EL0011,5u/μ L), 4μ L ;ddH20,补至 80μ L。
[0141] 反应条件:22°C连接2h,每10至15min轻弹管壁或短暂涡旋混匀磁珠,以避免磁 珠沉降进而导致的连接效率较低。
[0142] 用磁铁吸附磁珠,然后用移液器吸去上清,再用20 μ L TE清洗磁珠3次,最后重悬 于20 μ L TE中,此时固定在磁珠上的核酸片段即为测序文库。
[0143] 十、PCR验证测序文库。
[0144] 分别以步骤九所得产物(实验组1)、步骤九所得产物的10倍稀释液(实验组2)和 100被稀释液(实验组3)为模板,F-primer(SEQIDN0:5)和R-primer(SEQIDN0:6)为 上下游引物进行PCR扩增,以验证测序文库构建是否成功,并确定扩增所得测序文库的最 佳模版稀释度。同时设一空白对照和阳性对照,空白对照的模板为CldH 2O ;阳性对照的模板 由SEQ ID NO: 7和SEQ ID NO: 8退火形成的20ng/μ L的水溶液。
[0145] 按以下配比在冰上配置PCR反应体系:模板,lyL;10XTaq Buffer,2.5yL; dNTPs (各 2·5ηιΜ),0·5μ?;10μΜ F-primer,lyL;10yM R-primer,lyL;Taq 酶 (Fermentas,#EP0401,5u/ μ L),0· 25 μ L ;ddH20,补至 25 μ L。
[0146] 反应条件: 94°C 变性,2min ; 94°C变性,30s ;57°C退火,30s ;72°C延伸,30s ;重复15个循环; 72°C 延伸,5min。
[0147] 本发明的发明人还设计了一个第一对比实验,该对比实验与第一具体实施例相 t匕,采用第三接头替代第一接头,该第三接头与第一接头相比,只是将第一接头上的U碱基 用T碱基替换;另外,在第一对比试验中无步骤五的USER酶酶切步骤、步骤六的聚合酶修复 步骤,最后同样以F-primer (SEQ ID N0:5)和R-primer (SEQ ID N0:6)为上下游引物进 行PCR扩增验证。
[0148] 第一对比实验的PCR扩增产物与第一具体实施例的扩增产物同时进行PAGE电泳 检测,PAGE凝胶浓度为12%,电压180V,点用时间50min。
[0149] 结果如图4所示,其中M为20bp Marker (TaKaRa,D521A);实验组1 (1)、实验组 2 (2)、实验组3 (3)和阳性对照组(阳)均能得到预计大小的单一目标条带(IlObp左右), 而空白对照组(空)则无条带出现,说明测序文库构建成功;实验组3的目标条带与实验组 2的目标条带大小相差不大,所以从节约模板的角度来说,扩增所得测序文库的最佳模版稀 释度为100倍稀释。而对1 (第一对比试验,PCR扩增模板为与第二接头连接后的原液)在 目标条带下方明显出现杂带,且该杂带的大小与第二接头和第三接头之和(IOObp左右)大 致相同,后经进一步的测序证实,且确实是第二接头和第三接头自连的产物;对2 (对比试 验,PCR扩增模板为与第二接头连接后的10被稀释液)在目标条带下方的同一位置隐约出 现杂带。
[0150] 应当说明的是,第一具体实施例中的片段化的方法可用超声法、喷雾法或化学剪 切法代替,相关方法的具体实现方法为本领域的常规技术,在此不再赘述。第一具体实施例 中柱回收方法可采用其他类似的柱纯化试剂盒替代也可采用凝胶电泳纯化方法替代。
[0151] 另外,如果不需要构建含有相同长度的待测片段的话,步骤六的产物即可作为测 序文库,而无需进行后续的步骤,且如果需要对测序文库进行扩增,可采用F-primer引物 作为上游引物和下游引物进行扩增。
[0152] 当然,第一具体实施例中的第一接头仅是本具体实施例所采用的一种具体的双链 核酸分子,符合本发明的精神的第一接头均可应用到本具体实施例中;第一具体实施例中 的第二接头也仅是本具体实施例所采用的一种具体的双链核酸分子,符合本发明的精神的 第二接头均可应用到本具体实施例中;例如可采用具有更短的序列长度的单突出末端双链 核酸分子,该单突出末端位于其所在核酸链的3'端,突出碱基数为2,突出的碱基为两个通 用碱基N,N为A、G、C或T。
[0153] 还有,第一具体实施例中,可将步骤八的磁珠捕获步骤提前至步骤四中,替代步骤 四的柱回收步骤,并使得后续的步骤中均可采用磁铁吸附磁珠的方式替代柱回收步骤,这 样可以大大提到文库构建的效率,降低文库构建的成本。同样的,步骤八的磁珠捕获步骤也 可置于步骤五、步骤六、步骤七或步骤九中。
[0154] 第二具体实施例以Lambda噬菌体DNA ( λ DNA)的扩增产物作为源核酸。
[0155] -、源核酸的制备。
[0156] ADNA的PCR扩增反应体系如下:上游引物(10yM,SEQ ID N0:9),2yL;下游引物 (ΙΟμΜ,SEQ ID N0:10),2yL;ADNA,50ng;10XEx Taq Buffer,5yL;Ex Taq (5U/yL), 0· 5 μ L ;dNTP (各 2· 5mM),4 μ L ;ddH20,力口至 50 μ L。
[0157] PCR反应条件如下: 95 °C 3min ; 94°C 30s,58°C 30s,72°C 30s;重复 25 个循环; 72 °C 7min〇
[0158] 对反应产物进行PCR产物清洁回收,得源核酸。
[0159] 二、超声片段化。
[0160] 在冰浴条件下,利用超声破碎方式对步骤一所得源核酸进行片段化处理。具体操 作为:将扩增产物(10 Ug左右)放入100 μ L TE buffer溶液中,430W功率条件下超声4s, 间隔5s,重复12次。超声破碎后的产物利用PAGE胶电泳分离,回收25bp~100bp的DNA片 段。
[0161] 三、DNA片段末端修复。
[0162] 按以下配比在冰上配置DNA片段末端修复反应体系:5XReaction Buffer, 40 μ L ;dNTP (各 2mM,Fermentas,#R0241 ),4 μ L ;步骤一产物,4 μ g ;T4 DNA Polymerase (Fermentas,#ΕΡ0061,5u/ μ L),0· 8 μ L ;ddH20,补至 200 μ L。
[0163] 反应条件:11°C孵育20min ;然后加热至75°C,处理lOmin,以终止反应。
[0164] 参考第一具体实施例中的步骤一中2、柱回收步骤,对上述反应的产物进行柱纯 化。
[0165] 四、连接第四接头。
[0166] 第四接头由SEQ ID NO: 11和SEQ ID NO: 12退火而成,其中SEQ ID NO: 11的5' 端不含磷酸基团。
[0167] 按以下配比在冰上配置连接反应体系:步骤三产物,200ng ;第四接头,600ng ; 10XT4 DNA Ligase Buffer, 8 μ L ;50%PEG 4000,8 μ L ;T4 DNA Ligase (Fermentas, #EL0011,5u/y L),4y L ;ddH20,补至 80μ L。
[0168] 反应条件:16 °C连接过夜。
[0169] 然后参考第一具体实施例中的步骤一中2、柱回收步骤,对连接反应的产物进行柱 纯化。
[0170] 五、USER酶酶切。
[0171] 按以下配比在冰上配置USER酶酶切体系:步骤四产物,200ng ;10XUSER Buffer, 10 μ L ;USER (NEB, #M5505, lu/ μ L),10 μ L ;ddH20,补至 100 μ L。
[0172] 反应条件:37 °C孵育Ih。
[0173] 利用 QIAquick Nucleotide Removal Kit (Qiagen,Cat. nos. 28304)回收 USER 酶 酶切产物,具体操作如下:往酶切产物中加入500 μ L Buffer PNI,55°C孵育5min,使得被 USER酶切下的小核酸片段、第四接头自连产物被切割后的不含尿嘧啶核苷酸的两条链均被 变性成单链;将QIAquick离心柱置入对应的2ml收集管,将55°C孵育后的溶液移入Quick 离心柱,6000rpm离心1分钟;弃离心过柱的液体,加入750μ L Buffer PE,6000rpm离心1 分钟,弃离心过柱的液体,重复此步骤一次;将QIAquick离心柱再次放回收集管,13000rpm 离心1分钟,然后将QIAquick离心柱转至一个新的I. 5mL EP管内;向QIAquick离心柱内 底部中心加入50 μ L Buffer EB,静置2分钟,13000rpm离心1分钟,离心所得液体即为过 柱纯化后得到的USER酶酶切后的目标产物。
[0174] 六、聚合酶修复。
[0175] 按以下配比在冰上配置聚合酶延伸体系:步骤五产物,120ng ;10XPyrobest Buffer II,15uL;dNTPs (各 2.5mM),4uL;Pyrobest DNA Polymerase (Takara,DR005A, 5u/ μ L),0· 75 μ L ;ddH20,补至 150 μ L。
[0176] 反应条件:60°C孵育40min。
[0177] 参考第一具体实施例中的步骤一中2、柱回收步骤,对聚合酶延伸的产物进行柱纯 化。
[0178] 七、高通量测序验证。
[0179] 以步骤六所得产物为测序文库进行高通量测序,对测序结果中得到的所有reads (即)进行分析,未发现有第四接头自连片段的序列,将这些reads进行处理、拼接得基因序 列SEQ ID NO: 13,经比对证实该基因序列为Lambda噬菌体DNA的一部分,可由SEQ ID NO: 9 和SEQ ID NO: 10扩增而得。
[0180] 本发明的发明人还设计了一个第二对比实验,该对比实验与第二具体实施例相 t匕,采用第五接头替代第四接头,该第五接头与第四接头相比,只是将第一接头上的U碱基 用T碱基替换;另外,在第二对比试验中无步骤五的USER酶酶切步骤、步骤六的聚合酶修复 步骤,并将步骤四的产物同样进行高通量测序。对其测序结果中得到的所有reads (S卩)进 行分析,发现有第四接头自连片段的序列(SEQ ID N0:14),将这些reads进行处理、拼接得 同样能够得到基因序列SEQ ID NO: 13。
[0181] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【权利要求】
1. 一种构建测序文库的方法,其特征在于,包括以下步骤: A. 片段化处理源核酸,得片段化产物; B. 步骤A的产物与第一接头连接,得第一连接产物;所述第一接头为互补的双链核酸 分子;所述双链核酸分子中只有一条链上含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷; 所述P-S键为硫代磷酸酯键; C. 特异性切割试剂切割第一连接产物,除去被切下的小核酸片段;所述特异性切割试 剂用于特异性的切割尿嘧啶核苷酸、P-S键或脱氧肌苷; D. 聚合酶延伸步骤C的产物,得聚合酶延伸产物。
2. 根据权利要求1所述的构建测序文库的方法,其特征在于,所述第一接头上的尿嘧 啶核苷酸、P-S键或脱氧肌苷将其所在核酸链分隔成至少两个核酸片段,且所述核酸片段均 小于15bp〇
3. 根据权利要求1所述的构建测序文库的方法,其特征在于,所述双链核酸分子为单 突出末端双链核酸分子、双突出末端双链核酸分子或平末端双链核酸分子。
4. 根据权利要求3所述的构建测序文库的方法,其特征在于,所述单突出末端双链核 酸分子的突出末端为(dN)a ;所述双突出末端双链核酸分子的突出末端分别为(dN)b和(dN) 。,所述(dN) b和(dN)。中至少有一个位于其所在链的3'端,所述dN为A或G或C或T,所 述a、b和c均为正整数。
5. 根据权利要求4所述的构建测序文库的方法,其特征在于,所述(dN) a为T,位于含 有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷的链的互补链的3'端;当所述(dN)b和((^)。 均位于其所在链的3'端时,(dN)bST,(dN)。的3'末端为G或C或T,(dN)。自身之间不 能互补配对;当(dN)j^[I(dN)。分别位于同一链的3'端和5'端时,(dN)b为T,(dN)。自身 之间不能互补配对。
6. 根据权利要求1至5中任一项所述的构建测序文库的方法,其特征在于,所述第一接 头的两条核酸链的5'末端的核苷酸均不含磷酸分子。
7. 根据权利要求1至5中任一项所述的构建测序文库的方法,其特征在于,所述第一接 头含有生物素标记。
8. 根据权利要求7所述的构建测序文库的方法,其特征在于,所述生物素标记位于双 链核酸分子中含有至少一个尿嘧啶核苷酸、P-S键或脱氧肌苷的链的互补链的5'端。
9. 根据权利要求1至5中任一项所述的构建测序文库的方法,其特征在于,所述第一接 头含有至少一个II s型限制性内切酶酶切识别位点,且该II s型限制性内切酶的酶切位点 不在第一接头上。
10. 根据权利要求9所述的构建测序文库的方法,其特征在于,所述方法还包括以下步 骤: E. II s型限制性内切酶酶切聚合酶延伸产物,回收含第一接头的酶切产物; F. 步骤E的产物与第二接头连接,得两端分别是第一接头和第二接头的双链核酸分 子;所述第二接头为互补的双链核酸分子,该双链核酸分子的一端与步骤E的产物中的酶 切末端互补配对。
【文档编号】C40B50/06GK104372414SQ201410699623
【公开日】2015年2月25日 申请日期:2012年10月25日 优先权日:2012年10月25日
【发明者】盛司潼 申请人:盛司潼
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1