专利名称:一种利用酶切延伸增加读长的测序方法
技术领域:
本发明涉及基因工程领域,更具体地说,涉及一种利用酶切延伸增加读长的测序方法。
背景技术:
新一代测序技术(next-generation sequencing, NGS)主要包括焦磷酸测序法 (sequencing by pyrosequencing),合成法测序(sequencing by synthesis, SBS)禾口连接法测序(sequencing by ligation, SBL)。其中,连接法测序具有准确率高,成本低的优点,适用于转录本及比较基因组学研究,特别是单核苷酸多态性(Single Nucleotide Polymorphisms, SNP)的检测。现有的一种连接测序法是利用内切酶酶切延伸进行测序的,如图1所示,该方法的步骤包括(1)、利用带有酶切识别位点的双链寡核苷酸接头一与核酸片段连接,得到待测核酸片段;O)、以识别酶切识别位点的限制性内切酶对待测核酸片段进行酶切,得到其中一条链带有突出末端的双链产物;(3)、在双链产物上连接一组对应特定位置带有荧光标记的双链接头二,得到连接产物;通过检测连接产物的荧光信号获取该特定位置对应的核苷酸序列信息;其中,双链接头二带有突出末端;每个双链接头二带有酶切识别位点;根据酶切识别位点与酶切位点之间的核苷酸个数,所述突出末端预先计算好一个或数个核苷酸;(4)、分离步骤(3)中的连接产物,得到分离产物;(5)、利用能识别步骤(3)中所带酶切识别位点的酶对分离产物进行酶切,得到带有酶切识别位点的一组片段;(6)、重复步骤C3)至(5)的操作,直至测得待测核酸片段上能测的所有核苷酸序列;其中最后一次重复操作时,可以忽略步骤(5)。在上述连接测序法中,利用带有荧光标记的双链寡核苷酸接头作为检测探针,以接头上所带酶切识别位点位置的变更来实现和控制测序位置的延伸推进。由于双链寡核苷酸接头核苷酸个数以及所使用的限制性内切酶识别位点与酶切位点之间的核苷酸个数限制,所能检测得到的核苷酸序列最多只能等于酶切识别位点与酶切位点之间的核苷酸个数,其读长受限制。因此,迫切需要一种新的利用酶切延伸增加读长的测序方法,使测序的读长不受限制,能读取待测核酸片段上所需的核苷酸序列。
发明内容
本发明的目的在于提供一种利用酶切延伸增加读长的测序方法,旨在解决现有技术中酶切延伸方法的读长受限的问题。
为了实现发明目的,所述利用酶切延伸增加读长的测序方法包括以下步骤A.将第一 anchor结合于原待测核酸片段的接头一上;B.在第一 anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第一 anchor延伸末端后M个核苷酸的序列信息;C.利用内切酶将步骤B中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物;D.酶切产物连接接头二得新待测核酸片段,结合第二 anchor于接头二上;E.在第二 anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第二 anchor延伸末端后N个核苷酸的序列信息;F.重复步骤C至E的操作,直至测得原待测核酸片段中所需的核苷酸序列信息;其中,M、N均为正整数。其中,步骤A中所述第一 anchor带有至少一个酶切识别位点。进一步的,所述步骤C包括以下步骤Cl.将荧光探针与第一 anchor洗脱,重置第一 anchor并进行链延伸,与原待测核酸片段形成双链核酸分子;C2.内切酶通过识别第一 anchor上所带的酶切识别位点进行酶切,将步骤B中已得到序列信息的核苷酸部分或完全切除,得带有待测序片段的酶切产物。其中,步骤C可以包括以下步骤Cl’ .在第一 anchor的另一端连接双链的接头三,该接头三带有至少一个酶切识别位点;C2’.利用内切酶识别接头三所带的酶切识别位点,将步骤B中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物。其中,所述步骤A中第一 anchor的一端是封闭的。进一步的,在步骤C前还包括步骤C0.对第一 anchor的另一端进行活化,使其能够用于连接和延伸。其中,上述步骤中第一 anchor带有至少一个特异性残基。进一步的,所述步骤B包括以下步骤Bi.在带有特异性残基的第一 anchor延伸末端连接荧光探针,检测其荧光信号, 得到对应位置的核苷酸序列信息;B2.以特异性切割剂切割特异性残基,将荧光探针及第一 anchor洗脱,重置第一 anchor ;B3.在第一 anchor延伸末端重复荧光探针的连接和检测操作,得到第一 anchor延伸末端后M个核苷酸的序列信息。其中,步骤D中所述接头二为平末端接头、突出末端接头、分叉型接头或带茎环结构的接头。其中,步骤D包括以下步骤Dl.酶切产物连接接头二,得到带有接头二的双链核酸片段;D2.将带有接头二的双链核酸片段变性解离,得新待测核酸片段;D3.将第二 anchor结合于新待测核酸片段的接头二上。
其中,所述第一 anchor和第二 anchor可以是相同或者不同的。进一步的,所述第二 anchor可以带有至少一个酶切识别位点。进一步的,所述第二 anchor还可以带有至少一个特异性残基。其中,上述步骤中的原待测核酸片段固定于固相载体表面。其中,步骤B中所述M的数值范围优选为1 9,更优选为1 6。其中,步骤E中所述N的数值范围优选为1 9,更优选为1 6。由上可知,本发明所述利用酶切延伸增加读长的测序方法,利用内切酶将原待测核酸片段上已经得到序列信息的核苷酸部分或完全切除,然后再连接新的接头,用于锚定新的anchor并进行后续的测序反应,从而延长了测序反应的读长,且本发明的酶切延伸测序方法的读长不受限制。
图1是现有技术中一种利用内切酶酶切延伸测序的连接测序法示意图;图2是本发明一个实施例中利用酶切延伸增加读长的测序方法的方法流程图;图3是本发明一个实施例中所用第一 anchor的结构示意图;图4是本发明一个实施例中利用图3所示的第一 anchor得到其延伸末端后M位核苷酸序列信息的方法流程图;图5是本发明一个具体实施方式
中第一 anchor的结构示意图;图6是本发明一个具体实施方式
中利用图5所示的第一 anchor得到其延伸末端后M位核苷酸序列信息的方法流程图;图7是本发明另一个具体实施方式
中第一 anchor的结构示意图;图8是本发明一个具体实施方式
中利用图7所示的第一 anchor得到其延伸末端后M位核苷酸序列信息的方法流程图;图9是本发明一个实施例中得到带有待测序片段的酶切产物的方法流程图;图10是本发明另一个实施例中得到带有待测序片段的酶切产物的方法流程图;图11是本发明一个实施例中接头二的结构示意图;图12是本发明另一个实施例中接头二的结构示意图;图13是本发明另一个实施例中所用的接头二的结构示意图;图14是本发明另一个实施例中所用的接头二的结构示意图;图15是本发明另一个实施例中所用的接头二的具体结构示意图;图16是本发明一个实施例中得到第二 anchor延伸末端后N个核苷酸的序列信息的方法流程图;图17是本发明另一个实施例中得到第二 anchor延伸末端后N个核苷酸的序列信息的方法示意图;图18是本发明一个实施例中利用酶切延伸增加读长的测序方法示意图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
本发明提供了一种利用酶切延伸增加读长的测序方法,包括以下步骤首先将锚定引物第一 anchor与原待测核酸片段上的接头一锚定结合,利用标记位置不同的荧光探针,重复连接荧光探针、采集荧光信号、洗脱荧光探针、更换荧光探针后再连接的步骤,并根据所连接的荧光探针种类的不同,读取原待测核酸片段中第一 anchor延伸末端后M个核苷酸的序列信息;然后利用内切酶进行酶切,将之前已经读取过的核苷酸序列部分或完全切除,保留带有待测序核苷酸序列的新待测核酸片段,并使之与新的接头连接,进而锚定新的anchor,然后通过在新的anchor的延伸末端连接不同的荧光探针,读取新的anchor的延伸末端后N个核苷酸的序列信息。之后重复上述内切酶酶切、更换新的接头、锚定新的 anchor、连接新的荧光探针和检测荧光信号读取核苷酸序列信息的步骤,从而获得原待测核酸片段中所需的核苷酸序列信息。利用本发明的酶切延伸测序方法进行测序,读长不受限制。其中,上述步骤中的原待测核酸片段与新待测核酸片段是相对的,原待测核酸片段是指最初始的待测核酸片段,其上带有接头以及待测序的核酸片段;而新待测核酸片段是指经过酶切之后的待测序片段连接新的接头而形成的待测核酸片段。本发明中所述荧光探针分为不同组别类型,同组类型中不同荧光标记对应同一特定位置的不同核苷酸序列,而不同组类型的荧光探针荧光标记对应的特定位置不同。每次连接反应中,加入同一组类型的荧光探针,根据所采集的荧光信号,可以读取该组荧光探针标记特定位置对应的核苷酸序列信息。本发明中所述的各种anchor是用于与待测核酸片段上的各种接头进行锚定结合的单链寡核苷酸;其中所述anchor的一端是延伸末端,另一端可以是封闭的,也可以是不封闭的,封闭的优势在于避免anchor相互之间的自连现象的发生,保证anchor与荧光探针的定向连接。本发明所述延伸末端,是指能够用于继续连接并进行核苷酸链延伸的末端,其可位于anchor的3,端,也可位于anchor的5,端。本发明所述酶切识别位点,是指能够被酶特异性识别并利用其进行酶切反应的核苷酸序列,该序列的核苷酸个数无具体限制,可根据实际需要进行相应的调整。图2示出了本发明一个实施例中利用酶切延伸增加读长的测序方法流程,该方法包括Si.将第一 anchor结合于原待测核酸片段的接头一上;S2.在第一 anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第一 anchor延伸末端后M个核苷酸的序列信息;S3.利用内切酶将步骤S2中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物;S4.酶切产物连接接头二得到新待测核酸片段,将第二 anchor结合于接头二上;S5.在第二 anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第二 anchor延伸末端后N个核苷酸的序列信息;S6.重复步骤S3至S5的操作,直至测得原待测核酸片段中所能获取的核苷酸序列 fn息ο针对本技术方案,需要说明的是
步骤Sl中所述的原待测核酸片段,至少其两端带有接头,为使操作便利,优选将其中一端接头与固相载体连接,所述用于连接的固相载体可以使不同材质和不同形状的刚性物质,其材质包括但不限于玻璃、硅、陶瓷、塑料和金属;其形状包括但不限于板层形、 平板形、圆片形和球形;对于固相载体,本发明优选磁珠以及玻片。本步骤中所述第一 anchor是根据碱基互补配对原则,与原待测核酸片段上的接头一进行锚定结合的锚定引物,用于在步骤S2中连接荧光探针。除此之外,第一 anchor还可以根据具体需要,进行不同的设计。在本发明的一个实施方案中,第一 anchor与原待测核酸片段一端的接头一通过碱基互补配对进行锚定结合。该方案中,第一 anchor可以不进行封闭处理,以降低第一 anchor的合成成本;也可以在第一 anchor的一端进行封闭处理,避免第一 anchor相互之间发生自连,保证第一 anchor与荧光探针的定向连接。将第一 anchor的一端进行封闭,可以是第一 anchor的3,端,也可以是5,端,经过封闭处理既可以控制连接的方向,又可以避免第一 anchor之间相互连接。在本步骤的一个具体实施方式
中,将第一 anchor的3’端进行封闭,封闭的方法包括但不限于双脱氧、氨基化反应、酰胺化,第一 anchor被封闭的3’端无法继续连接,即第一 anchor的连接只能发生在5’端;而在本步骤的另一个具体实施方式
中,将第一 anchor的5’端进行封闭,封闭的方法包括但不限于去磷酸化或酰胺化,即第一 anchor的连接只能发生在3’端。在本发明的另一个实施方案中,第一 anchor带有至少一个特异性残基,所述特异性残基是指其本身或其所带的化学键能被特异性切割的残基,它能使其所在的核苷酸片段由于被切割而更易于洗脱。用于切割特异性残基的物质称为特异性切割剂。所述特异性残基包括但不限于脱氧尿嘧啶核苷酸(de0Xy-UraCil,dU)、脱氧肌苷(deoxy Inosine,dI)、带有硫代磷酸酯键的核苷酸和切口酶的酶切识别位点。其相应的特异性切割剂包括但不限于尿嘧啶-DNA糖基化酶⑴racil-DNA Glycocasylase,UDG酶)、大肠杆菌核酸内切酶V、带有 Ag、Hg、Cu、Mn、Zn或Cd离子的化合物和切口酶。所述切口酶,是指能识别双链核酸分子中一条核苷酸链所携带的酶切识别位点,而在带有该酶切识别位点的核苷酸链上进行酶切形成切口的II型限制酶;本发明所述切口酶,包括但不限于Nt.Alw I内切酶、Nt. BsmA I内切酶、Nt. BspQ I内切酶、Nt. BstNB I内切酶。本实施方案的第一 anchor设计方式可以使得在后续的洗脱更换过程中更加便利。在本发明的另一个实施方案中,第一 anchor带有至少一个酶切识别位点,该酶切识别位点可被直接利用于部分或完全切除步骤S2中所读取过的核苷酸序列,使得整个发明技术方案步骤简化,操作简便。步骤Sl中所述接头一为原待测核酸片段一端上的一段已知序列,用于使第一 anchor锚定结合到原待测核酸片段上。该接头一可以是得到待测序的样品之后进行测序文库构建过程中自行设计合成连接上去的,也可以是得到的待测序样品本身已经带有的。步骤S2中,所述第一 anchor的延伸末端,是指在第一 anchor后能够继续连接并进行核苷酸链延伸的末端。根据步骤Sl中所述第一 anchor的不同设计结构,步骤S2可以采用不同的实现方式。在本发明的一个实施方案中,第一 anchor带有特异性残基,在本实施方案中的一个具体实施例中,第一 anchor的结构如图3所示,图中所示X为A、G、C或T,Y代表特异性残基,η为正整数。另外,图中Y的个数以及Y在X中的位置可变,当存在多个Y时,Y与Y 之间并不一定是以图3中所示的相连的形式存在,可分别散布在第一 anchor的不同位置。 上述的第一 anchor可以使得步骤S2中荧光探针的洗脱以及更换的实现更加简便。利用该结构的第一 anchor实现步骤S2的方法如图4所示,包括以下步骤S21.在带有特异性残基的第一 anchor延伸末端连接荧光探针,检测其荧光信号, 得到对应位置的核苷酸序列信息;S22.以特异性切割剂切割特异性残基,将荧光探针及第一 anchor洗脱,重置第一 anchor ;S23.在第一 anchor延伸末端重复荧光探针的连接和检测操作,得到第一 anchor 延伸末端后M个核苷酸的序列信息。需要说明的是,在该技术方案中,步骤S21中所述第一 anchor带有的特异性残基及其相应的特异性切割剂可以包括多种。在本发明的一个优选实施例中,如图5所示,第一 anchor带有的特异性残基为dU 碱基,其对应的特异性切割剂为UDG酶。利用如图5所示结构的第一 anchor,步骤S2可以通过图6所示的方法实现,该方法包括以下步骤S21’.在带有dU碱基的第一 anchor延伸末端连接荧光探针,检测其荧光信号,得到对应位置的核苷酸序列信息;S22’.以UDG酶识别dU碱基并进行酶切,将荧光探针及第一 anchor洗脱,重置第一 anchor ;S23,.在第一 anchor延伸末端重复荧光探针的连接和检测操作,得到第一 anchor 延伸末端后M个核苷酸的序列信息。以该技术方案实现步骤S2,其优势在于,第一 anchor带有dU碱基,可以直接利用特异性识别酶切dU碱基的UDG酶对第一 anchor进行切割,形成短片段,从而使得步骤S2 中荧光探针的洗脱以及更换的实现更加简便。在本发明的另一个优选实施例中,如图7所示,第一 anchor所带的特异性残基为切口酶Nt. Alw I的酶切识别碱基。利用如图7所示结构的第一 anchor,步骤S2可以通过如图8所示的方法实现,该方法包括以下步骤S21”.在带有切口酶酶切识别位点的第一 anchor延伸末端连接荧光探针,检测其荧光信号,得到对应位置的核苷酸序列信息;S22”.以切口酶识别切口酶酶切识别位点并进行酶切,将荧光探针洗脱;S23”.在第一 anchor延伸末端重复荧光探针的连接和检测操作,得到第一 anchor 延伸末端后M个核苷酸的序列信息。以该技术方案实现步骤S2,其优势在于,在更换荧光标记对应碱基位置不同的荧光探针时,可以利用第一 anchor上所携带的切口酶酶切识别位点,通过相应的切口酶直接将原来连接的荧光探针与第一 anchor之间的连接打断,从而轻松将原来连接的荧光探针洗掉,连接新的荧光探针,避免将第一 anchor洗脱之后又重置,简化操作步骤,同时节省试剂的成本。其中,上述步骤中所述M为正整数,其数值范围由本发明所使用的连接酶决定,优选为1 9,更优选为1 6。在本发明的一个实施方案中,利用T4连接酶实现本发明所述的酶切延伸测序法,M的数值优选为1 6 ;在本发明的另一个实施方案中,利用Tth连接酶实现本发明所述的酶切延伸测序法,M的数值范围可优选为1 9。在上述优选范围内, 本发明的酶切延伸测序法不仅能够增加测序读长,测序读长不受限制,还能进一步提高测序过程中的荧光探针与anchor连接的准确性,进而提高核苷酸序列信息读取的准确性。其中,当利用T4连接酶,将荧光探针连接在anchor的3’端或者5’端时,荧光探针与anchor 发生连接的那一端的6个碱基需与相应的待测序片段完全互补配对,才能实现连接;当利用Tth连接酶,将荧光探针连接在anchor的3’端或5’端时,分别要求荧光探针与anchor 连接的那一端的8个或9个碱基与相应的待测序片段完全互补配对,才能实现连接。上述步骤中所使用的荧光探针分为不同组别类型,同组类型中不同荧光标记对应同一特定位置的不同核苷酸序列信息,而不同组类型的荧光探针荧光标记对应的特定位置不同。每次连接反应中,加入同一组类型的荧光探针,根据所采集的荧光信号,可以得到该组荧光探针标记特定位置对应的核苷酸序列信息;而通过第一 anchor的杂交结合-荧光探针的连接-采集荧光信号-荧光探针的洗脱这些操作的重复,可以准确的得到第一 anchor 延伸末端后M个核苷酸的序列信息。在步骤S2结束之后,原待测核酸片段上保留了结合的第一 anchor和荧光探针。为了便于步骤S3中的内切酶进行酶切,可将第一 anchor延伸末端重新活化,然后加入四种核苷酸,利用DNA聚合酶,沿着第一 anchor延伸末端的方向,将固定于固相载体上的原待测核酸片段形成完整的双链核酸分子。步骤S3中所述内切酶,是指能识别双链核酸分子上所带有的特异性酶切识别碱基序列,然后在距离酶切识别位点一定数量碱基的位置进行双链核酸切割的酶。在本发明中,可以使用酶切之后能得到平末端的内切酶,优选使用酶切之后能得到粘性突出末端的内切酶,其选用原则遵循通过识别酶切识别位点,能将步骤S2中已经获取的核苷酸序列全部或部分切除的内切酶即可。在选用内切酶时,优选最适反应温度在37°C左右的内切酶,最适反应温度过高的内切酶容易导致在酶切过程中双链的变性解离,从而导致后续荧光探针的连接受阻;优选对甲基化不敏感的内切酶,以便能持续的酶切和获取待测核酸片段的核苷酸序列;优选酶切识别位点与酶切位点之间核苷酸个数在4以上的,使得每次酶切之后向前延伸测序的长度更长。本发明所用的内切酶可以是II型内切酶,包括但不限于Acu I.Alw I.Bbs I.Bbv
I、BccI、BceA I、BciV I、BfuA I、Bmr I、Bpm I、Bsa I、BseR I、Bsg I、BsmA I、BsmB I、 BsmF I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、Fau I、Fok I、Hga I、Hph I、HpyA V、Mbo
II、MlyI、Mnl I、Ple I、Sap I、SfaN I、BpuE I、Mme I 和 NmeAIII,其中优选 Acu I、Bbv I,BceA I,Bpm I,BseR I,BspM I,Fok I,Hga I,Mbo II 和 Mnl I ;所用的内切酶也可以是 III型内切酶,包括但不限于Ecop 1和Ecop 15 1。步骤S3中,用于被内切酶进行识别的酶切识别位点,可以通过第一 anchor带入, 也可以通过其他方法带入。根据酶切识别位点来源的不同,步骤S3也可以通过不同的方法实现。在本发明中的一个实施方案中,酶切识别位点直接由第一 anchor带入,即第一 anchor带有至少一个酶切识别位点。
利用第一 anchor上所带有的酶切识别位点,可以有多种不同的方式实现步骤S3。 在本方案的一个具体实施方式
中,步骤S3可以直接利用内切酶识别第一 anchor上所带的酶切识别位点,将步骤S2中已经得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物。利用该实施方式实现步骤S3的优势在于,在步骤S2得到第一 anchor延伸末端后 M个核苷酸的序列信息之后,利用第一 anchor上所带有的酶切识别位点直接进行酶切,可以简化操作步骤。在本方案的另一个具体实施方式
中,利用第一 anchor上所带有的酶切识别位点, 步骤S3还可以通过如图9所示的方法实现,该方法包括如下步骤S31.将荧光探针与第一 anchor洗脱,重置第一 anchor并进行链延伸,与原待测核酸片段形成双链核酸分子;S32.内切酶通过识别第一 anchor上所带的酶切识别位点,将步骤S2中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物。利用该技术方案实现步骤S3的优势在于,首先利用第一 anchor的延伸末端进行链延伸,与原待测核酸片段延伸形成双链核酸分子,能够保证酶切产物保持双链状态,便于后续接头的连接。在本实施方案的一个优选实施例中,原待测核酸片段通过5’端连接固定于微珠上,而结合于接头一的第一 anchor上带有酶切识别位点序列5’ . . . CTGAAG. . . 3’,步骤S3 中利用II型内切酶Acu I识别该酶切识别位点并进行酶切,得到待测序片段3’端带有两个突出核苷酸的酶切产物。在本实施方案的另一个优选实施例中,原待测核酸片段通过5’端连接固定于微珠上,而结合于接头一的第一 anchor上带有酶切识别位点序列5’. . . GCAGC. . . 3’,步骤S3中利用π型内切酶I识别该酶切识别位点并进行酶切,得到待测序片段3’端带有两个突出核苷酸的酶切产物。在本实施方案的另一个优选实施例中,原待测核酸片段通过5’端连接固定于微珠上,而结合于接头一的第一 anchor上带有酶切识别位点序列5’. . . GAGTC. . . 3’,步骤S3中利用II型内切酶Mly I识别该酶切识别位点并进行酶切,得到待测序片段3’端带有平末端的酶切产物。在本实施方案的一个优选实施例中,原待测核酸片段通过3’端连接固定于微珠上,而结合于接头一的第一 anchor上带有酶切识别位点序列5’. . . CATCC. . . 3’,步骤S3中利用i^ok I酶识别该酶切识别位点并进行酶切,得到待测序片段5’端带有4个突出核苷酸的酶切产物。在本实施方案的一个具体实施例中,原待测核酸片段通过5’端连接固定于微珠上,而结合于接头一的第一 anchor上带有酶切识别位点序列5’ . . . CAGCAG. . . 3’,步骤S3 中利用III型内切酶Ecopl5I酶识别该酶切识别位点并进行酶切,得到待测序片段3’端带有两个突出核苷酸的酶切产物。在本发明的另一个实施方案中,酶切识别位点通过在第一 anchor的另一端连接带有至少一个酶切识别位点的接头三带入。利用接头三,步骤S3可以通过如图10所示的方法实现,该方法包括以下步骤
S31’.在第一 anchor的另一端连接双链的接头三,该接头三带有至少一个酶切识别位点;S32’ .利用内切酶识别接头三所带的酶切识别位点,将步骤B中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物。需要说明的是,所述第一 anchor的另一端,是相对步骤S 1中第一 anchor已经用于延伸的末端而言的;若第一 anchor的另一端在步骤S3之前是被封闭的,那么在步骤S3 之前需要先进行活化;活化的方法可以利用现有技术中的任一种,只需将另一端中可用于连接的基团暴露出来即可,如在本发明的一个优选的具体实施方式
中,第一 anchor本身带有特异性残基,可直接利用特异性切割剂切割特异性残基完成活化。所述接头三,是带有至少一个酶切识别位点的核酸分子,用于引入内切酶的酶切识别位点,以便于后续步骤中,通过内切酶将已得到序列信息的核苷酸部分或完全切除。利用该技术方案实现步骤S3的优势为适用性广,对原待测核酸片段无特殊要求,无论原待测核酸片段上结合的第一 anchor 是否带有酶切识别位点,均可通过该技术方案实现。需要进一步说明的是,接头三可以选用相应带有不同末端的接头,包括但不限于平末端接头、突出末端接头、分叉型接头和带茎环结构的接头。本发明中优选使用突出末端接头、分叉型接头和带茎环结构的接头,这些结构的接头在连接过程中可以避免出现多个接头之间自连的现象。针对上述不同的实现方案,接头三上所述用于酶切的内切酶酶切识别位点可以是上述内切酶所对应的任意一种,只需在设计合成时将酶切识别位点与酶切位点之间的核苷酸预先计算好,使得酶切之后恰好将步骤S2中已经读取过序列信息的核苷酸部分或完全切除即可,因此在本发明中可以选用不同的酶切识别位点及其相应的内切酶实现对步骤S2中已得到序列信息的核苷酸的切除。在此需要说明的是本发明中所述平末端接头是指接头双链之间的核苷酸数量相等且完全互补的双链接头。本发明中所述突出末端接头,是指双链核酸分子中的至少一端带有突出核苷酸序列,而其余核苷酸则完全互补的双链核酸接头。突出末端接头可为单突出末端(图11),也可以是含有两个突出末端的双突出末端,这两个突出末端可在一条核苷酸链上(图12a)或在不同的核苷酸链上(图12b)。本发明中所述分叉型接头包括互补区和分叉区,其基本结构如图13所示,互补区双链的核苷酸互补配对,配对的核苷酸对数不限。互补区末端可为平末端或突出末端。该分叉型接头的互补区带有至少一个酶切识别位点。在本实施例的具体实施方式
中,接头三优选互补区的3’末端为突出末端,且突出末端最后一个碱基为T的T末端分叉接头;或者优选互补区的3’末端带有双脱氧核苷酸的双脱氧分叉接头。本发明中所述带茎环结构的接头,如图14所示。该接头为单链核酸分子,该单链核酸分子包括第一互补配对区1、茎环区2和第二互补配对区3 (图14a),第一互补配对区1 能够与第二互补配对区3互补配对,且它们形成的互补配对区包括至少一个限制性内切酶的酶切识别位点,而通过该酶切识别位点,特定的酶能够将茎环区切开或切除,从而将单链核酸分子变成双链核酸分子,以便于后续的操作;同时还至少包括一个用于后续步骤S3进行酶切的酶切识别位点。如图14b所示,带茎环结构的接头还可带有突出末端4,该突出末端可位于单链核酸分子的5’端或3’端。突出末端4的存在能够进一步的防止接头自连现象的发生。该突出末端优选为T。应当说明的是,上述实施方案仅是本发明中关于选用的酶切识别位点及其相应的内切酶的一些具体实施例,并不用以限制本发明的保护范围,换用符合条件的其他酶切识别位点及相应的内切酶,同样可实现本发明的目的。为得到带有待测序片段的酶切产物,可以在步骤S3的酶切反应之后进行纯化回收,而纯化回收的方法可以利用现有技术中的多种方式实现。在本发明的一个实施例中,原待测核酸片段固定于玻片上,酶切之后直接以缓冲液冲洗即可实现有待测序片段的酶切产物与其他物质分离纯化;在本发明的另一个具体实施例中,原待测核酸片段固定于磁珠上, 直接利用磁铁吸附,以缓冲液轻微冲洗,即可实现带有待测序片段的酶切产物与其他物质分离纯化。步骤S4中,在连接接头二之前,根据步骤S3中得到的酶切产物的不同以及后续使用的连接方法,可以选择性的对酶切产物进行修饰处理,如末端补平;也可以直接利用酶切之后得到的突出末端进行接头二的连接。在本发明的一个具体实施例中,根据步骤S3中利用第一 anchor上所带内切酶的酶切识别位点,以i^ok I进行酶切,得到3’端带有4个核苷酸序列突出末端的酶切产物。对酶切产物先进行末端补平处理,然后再连接接头二。此实施方式的优势在于可以避免由于过长的突出末端而使得接头二合成的种类过多,从而降低接头二的合成成本。在本发明的另一个具体实施例中,根据步骤S3中利用第一 anchor上所带酶切识别位点为Acu I的酶切识别位点,以Acu I进行酶切,得到3’带有2个核苷酸序列突出末端的酶切产物。针对该突出末端突出的核苷酸较少,只需合成42种接头二即可实现连接, 因此直接利用酶切之后得到的突出末端进行接头二的连接。此实施方式的优势在于可以简化操作步骤,直接加入接头二进行反应即可。步骤S4中,所述接头二,是用于与带有待测序片段的酶切产物连接形成新待测核酸片段的双链核酸分子。根据酶切产物末端以及选用的连接方式不同,接头二可以选用相应带有不同末端的接头,包括但不限于平末端接头、突出末端接头、分叉型接头和带茎环结构的接头。本发明中优选使用突出末端接头、分叉型接头和带茎环结构的接头,这些结构的接头在连接过程中可以避免出现多个接头之间自连的现象。在本发明的一个具体实施例中,接头二选用平末端接头,用于实现与经过末端补平修饰之后的酶切产物进行连接。在本发明的一个优选实施例中,酶切产物带有突出末端,因此接头二直接选用如图11所示的突出末端接头与酶切产物实现连接,该突出末端接头的突出末端与酶切产物的突出末端相匹配。在本发明的一个具体实施例中,步骤S3中的内切酶为Acu I,此时,接头二可具体采用如图15所示的接头。在本发明的另一个优选实施例中,接头二采用如图13所示的分叉型接头实现与酶切产物的连接。在本实施例的具体实施方式
中,接头二优选互补区的3’末端为突出末端, 且突出末端最后一个碱基为T的T末端分叉接头;或者优选互补区的3’末端带有双脱氧核苷酸的双脱氧分叉接头。在本发明的另一个优选实施例中,接头二采用如图14所示的带茎环结构的接头实现与酶切产物的连接。在本实施例的一个优选实施方式中,接头二采用如图14b所示的带茎环结构的接头实现接头二与酶切产物的连接,进一步防止接头自连现象的发生。应当说明的是,上述实施例仅是本发明对于接头二选用的具体实施方式
,并不用以限制本发明的保护范围。步骤S4中,为了便于后续第二 anchor与接头二的互补配对能够顺利进行,可以对酶切产物与接头二连接之后形成的双链核酸连接产物进行处理,形成单链形式的新待测核酸片段。将双链核酸连接产物上互补结合于待测序片段上的核苷酸以及酶切之后保留下来的核苷酸进行处理形成单链新待测核酸片段的方法,包括但不限于通过NaOH变性解离或升温退火的方式进行清除。所述第二 anchor是能与接头二锚定结合的单链核酸分子,用于在步骤S5中连接荧光探针;所述第二 anchor可以与第一 anchor相同或者不同。若第二 anchor与第一 anchor相同,则后续继续酶切时可使用相同的内切酶进行操作,简化反应试剂的种类,同时还能避免因新待测核酸片段中存在相同的内切酶序列,导致后续的酶切步骤得到非目标产物;若第二 anchor与第一 anchor不同,则可以在第二 anchor的合成中弓|入新的设计,满足更多的实际需要。第二 anchor与第一 anchor的不同,可以是酶切识别位点的位置和种类不同,也可以是核苷酸数量的不同。第二 anchor根据需要可以进行其他处理。在本发明的一个具体实施例中,根据需要将第二 anchor的3’端或5’端进行封闭,用以控制连接方向,并避免第二 anchor相互之间的自连。在本实施例的一个具体实施方式
中,对3’端进行封闭的方法包括但不限于双脱氧、氨基化反应、酰胺化,其无法继续连接,控制第二 anchor的连接只发生在5’端;在本实施例的另一个具体实施方式
中,将第二 anchor的5’端进行封闭,通过5’端进行去磷酸化或酰胺化处理将其封闭,从而只保留3’端作为连接的末端。在本发明的另一个具体实施例中,第二 anchor带有特异性残基,可以使得后续荧光探针的更换以及洗脱更加简便。在本发明的一个优选实施方式中,第二 anchor所带的特异性残基为dU碱基,其核苷酸序列中引入数个dU碱基,该结构的第二 anchor可以在后续测序的洗脱过程中直接切除dU碱基形成不同的短片段,便于洗脱的实现。在本发明的另一个优选实施方式中,第二 anchor所带的特异性残基为带有硫代磷酸酯键的碱基,在其核苷酸序列中,以一个或多个硫代磷酸酯键(p-幻代替原有的P-O 键,可以直接利用带有Ag、Hg、Cu、Mn、Zn和Cd离子的化合物切割P-S键实现第二 anchor 的洗脱。在本发明的另一个优选实施方式中,第二 anchor带有两个酶切识别位点,其中一个为用于切割双链的限制性内切酶酶切识别位点,另一个为用于切割双链中的一条单链形成切口的切口酶酶切识别位点。应当说明的是,上述实施例仅是本发明中第二 anchor的一些具体实施方式
,并不用以限制本发明的保护范围。步骤S5中,得到第二 anchor延伸末端后N个核苷酸的序列信息通过如图15所示的方法实现,该方法包括以下步骤S51.在第二 anchor延伸末端后连接荧光探针,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;
S52.将荧光探针去除,连接标记位置不同的荧光探针,检测该荧光探针的荧光信号,得到该标记位置的核苷酸序列信息;S53.重复步骤S52的操作,直至得到第二 anchor延伸末端后N个核苷酸的序列信肩、ο上述技术方案利用标记位置不同的荧光探针之间的连接和更换,实现对第二 anchor延伸末端后N个核苷酸的序列信息的获取。其中,步骤S52中所述荧光探针的去除可以有多种方式实现。在本步骤的一个具体实施方式
中,利用NaOH变性将荧光探针以及第二 anchor从新待测核酸片段上解离下来,然后将第二 anchor重新结合于接头二上,进行后续标记位置不同的荧光探针的连接以及信号检测操作。此实施方式简单易行,不需要添加另外的试剂。在本步骤的另一个优选实施方式中,第二 anchor带有数个dU碱基,因此利用UDG 酶直接进行dU碱基的切除,形成短片段,升温变性解离,重新得到新待测核酸片段,然后将第二 anchor重新结合于接头二上,进行后续标记位置不同的荧光探针的连接以及信号检测操作。在本步骤的另一个优选实施方式中,第二 anchor的核苷酸序列中,几个硫代磷酸键(P-S)代替原有的P-O键,因此直接利用带有Ag、Hg、Cu、Mn、ai和Cd离子的化合物切割 P-S键实现第二 anchor以及荧光探针的去除。在本步骤的另一个优选实施方式中,第二 anchor延伸末端处带有一个切口酶的酶切识别位点,因此直接利用切口酶将荧光探针与第二 anchor之间的连接去除,就可以在第二 anchor的延伸末端继续连接标记位置不同的荧光探针,实现后续测序步骤的实施。此实施方式直接将荧光探针去除,而不需要对第二 anchor进行处理,既简化操作,又降低试剂成本。上述优选实施方式利用特异性的物质将第二 anchor中的连接切除,形成短小片段,然后利用温和条件即可去除荧光探针。其中,上述步骤中所述N为正整数,其数值范围同样由本发明所使用的连接酶决定,优选为1 9,更优选为1 6。在本发明的一个实施方案中,利用T4连接酶实现本发明所述的酶切延伸测序法,N的数值优选为1 6 ;在本发明的另一个实施方案中,利用Tth 连接酶实现本发明所述的酶切延伸测序法,N的数值范围可优选为1 9。在上述优选范围内,本发明的酶切延伸测序法不仅能够增加测序读长,测序读长不受限制,还能进一步提高测序过程中的荧光探针与anchor连接的准确性,进而提高核苷酸序列信息读取的准确性。 其中,当利用T4连接酶,将荧光探针连接在anchor的3,端或者5’端时,荧光探针与anchor 发生连接的那一端的6个碱基需与相应的待测序片段完全互补配对,才能实现连接;当利用Tth连接酶,将荧光探针连接在anchor的3’端或5’端时,分别要求荧光探针与anchor 连接的那一端的8个或9个碱基与相应的待测序片段完全互补配对,才能实现连接。图16为步骤S5中一个具体实施例中得到第二 anchor延伸末端后N个核苷酸的序列信息的方法示意图,该图直观的展现了得到第二 anchor延伸末端后N个核苷酸的序列信息的过程步骤51.读取第二 anchor延伸末端后第1位核苷酸序列信息在T4连接酶的作用下,第二 anchor延伸末端后连接标记位置为第1位的荧光探针,然后采图,收集荧光信号,根据得到的荧光信号确定第二 anchor延伸末端后第1位的核苷酸序列信息;步骤52.读取第二 anchor延伸末端后第2位核苷酸序列信息利用第二 anchor 延伸末端处所带的切口酶酶切识别位点,将荧光探针与第二 anchor之间的连接切掉,通过升温变性解离将标记位置为第1位的荧光探针洗脱,然后换用标记位置为第2位的荧光探针连接到第二 anchor的延伸末端,采图成像,收集荧光信号,根据得到的荧光信号确定第二 anchor延伸末端后第2位的核苷酸序列信息;步骤53.读取后续核苷酸重复步骤52的操作,换用标记位置不同的荧光探针获取相应位置的核苷酸序列信息,直至得到第二 anchor延伸末端后第6位核苷酸的序列信肩、ο上述实施方案中,利用第anchor延伸末端处带有的切口酶酶切识别位点,直接实现标记位置不同的荧光探针的连接更换,从而实现获聚第二 anchor延伸末端后6个核苷酸的序列信息。应当说明的是,上述实施例仅是实现步骤S5中得到第二 anchor延伸末端后N个核苷酸的序列信息的一些具体实施方案,并不用以限制本发明的保护范围。例如改变其中N 的数值,如在本发明的另一个具体实施例中,取N = 4,同样可以实现酶切延伸测序的目的。图17为本发明一个实施例中利用酶切延伸增加读长的测序方法示意图,该图直观的展现了酶切延伸增加读长的测序过程步骤1.第一 anchor杂交结合将第一 anchor通过碱基互补配对杂交结合于原待测核酸片段的接头一上,其中原待测核酸片段的5’端通过连接固定于磁珠表面;其中,第一 anchor带有序列为序列5’. . . CTGAAG. . . 3’的酶切识别位点,且第一 anchor的核苷酸序列中带有dU 。步骤2.获取第一 anchor延伸末端后6个核苷酸的序列信息T4连接酶作用下, 在第一 anchor的延伸末端连接用于检测的荧光探针,检测荧光信号得到相应位置的核苷酸序列信息,并利用UDG酶切除dU碱基以实现第一 anchor的重置和标记位置不同的荧光探针的更换检测,采集相应探针的荧光信号图,获得第1至6位的核苷酸序列信息。步骤3.酶切为便于后续酶切的进行,当第一 anchor延伸末端后6个核苷酸的序列信息全部被读取之后,首先在DNA聚合酶的作用下,将原待测核酸片段延伸形成完整的双链核酸分子;然后利用Acu I酶特异性识别并酶切第一 anchor中所携带的酶切识别位点,将之前已经读取过的第一 anchor延伸末端的6个核苷酸序列切除,得到3’端带有两个核苷酸突出末端的未测序片段;酶切反应之后,利用磁铁吸附磁珠,将带有未测序片段的酶切产物纯化回收。步骤4.酶切产物连接接头二并结合第二 anchor 利用其中一端带有两个核苷酸突出末端,一共为42 = 16种的接头二,在T4连接酶的作用下,与酶切产物进行连接得到双链连接产物;连接反应结束之后,将双链连接产物变性解离形成单链,得到固定于磁珠上的新待测核酸片段;将第二 anchor通过碱基互补配对结合于新待测核酸片段的接头二上。其中,第二 anchor上同样带有序列为序列5’ . . . CTGAAG. . . 3’的酶切识别位点,且距离第二 anchor延伸末端处4个核苷酸位置处还带有序列为5’ . . . GGATC. . . 3’的酶切识别位点。步骤5.获取第二 anchor延伸末端后6个核苷酸的序列信息按照如图15所示实施例的方法,利用切口酶Nt. Alw I切割荧光探针与第二 anchor之间的连接,实现不同标记位置荧光探针的更换,从而可以读取不同位置的核苷酸序列信息,获取第二 anchor延伸末端后6个核苷酸的序列信息。步骤6.重复步骤3、步骤4、步骤5中的操作,获取一定数量(其数值范围优选为 1 6)的核苷酸序列信息之后,通过酶切手段切除已经读取过的核苷酸序列,并构建新的待测核酸片段,以此实现延伸测序的目的,直至得到原待测核酸片段上所需的全部核苷酸序列信息。针对上述各技术方案,为进一步说明本发明所记载技术方案的技术效果及优越性,本发明给出具体的操作实施例本实施例以MTHFR基因的一段核酸片段两端接上接头作为原待测核酸片段(SEQ ID NO :5),其中原待测核酸片段5’端的固定接头通过链霉亲和生物素的作用与磁珠结合, 原待测核酸片段3’端带有接头一序列。测序过程采用深圳华因康基因科技有限公司生产的Pstar II-Plus测序平台进行,测序过程采集的荧光信号图像数据采用与该测序平台配套的Image Process by Base(IPB)数据处理软件进行分析。一、第一 anchor锚定结合于原待测核酸片段的接头一上第一 anchor (SEQ ID NO 1)与原待测核酸片段的接头一之间通过碱基互补配对杂交结合,其中原待测核酸片段通过链霉亲和生物素的作用被固定于磁珠上,而磁珠本身被固定于玻片表面,第一 anchor延伸末端上带有Acu I酶的酶切识别位点,该反应过程及体系为28°C,400y L 2XSSPE(saline sodium phosphate EDTA)缓冲液对固定于玻片表面的原待测核酸片段进行润洗;加入第一anchor (15 μ Μ),2 X SSPE 环境下升温至 65°C,维持 30s ;降温至42 °C,Imin 杂交;以磁铁吸附磁珠,30°C,900 μ L清洗缓冲液进行清洗,将未反应的第一 anchor分
离清除。二、获取第一 anchor延伸末端后6个核苷酸的序列信息1、连接荧光探针在T4连接酶的作用下,将荧光探针(3μΜ)连接到第一 anchor延伸末端之后,连接反应过程及体系为30°C,连接缓冲液对杂交分离的产物进行润洗;加入0. 2U/yL T4连接酶,荧光探针(3 μ M),连接缓冲液中,30°C,20min反应;连接反应结束之后,以磁铁吸附磁珠,30°C,900 μ L清洗缓冲液进行清洗,将未反应的荧光探针与连接产物进行分离。2、采集荧光信号,读取相应位置的核苷酸序列信息将连接有荧光探针的连接产物放入测序仪,在荧光显微镜下进行激发,采集荧光信号,根据荧光信号判断读取该位置的核苷酸序列。3、洗脱第一 anchor及荧光探针在读取上一步骤中相应位置的核苷酸序列信息后,可以利用不同的方法进行洗脱。在本实施例中,利用NaOH直接变性解离,反应过程及体系为
测序反应体系中加入NaOH(0. 05M),变性Imin ;以磁铁吸附磁珠,30°C,900 μ L洗脱缓冲液进行清洗,将变性解离的第一 anchor 及荧光探针以及NaOH进行清洗分离。在本发明的另一个实施例中,利用UDG酶对第一 anchor中的dU碱基进行切割形成小片段,然后将小片段直接洗脱,反应过程及体系为酶切缓冲液,20 μ L ;UDG酶,10 μ L ;洗脱缓冲液加至200 μ L ;37°C,5min 进行酶切;酶切结束后,以磁铁吸附磁珠,加入900 μ L洗脱缓冲液进行洗脱分离,得到未接第一 anchor的原待测核酸片段。4、重复上述步骤,通过更换不同标记位置的荧光探针进行连接,从而读取得到第一 anchor延伸末端后第1至6位的核苷酸序列信息。三、Acu I酶切,得到带有未测序片段的酶切产物1、延伸形成双链核酸分子为便于后续酶切的进行,当第一 anchor延伸末端后5位核苷酸序列信息全部被读取之后,利用之前所述的NaOH变性解离方法除去荧光探针及第一 anchor,并重新结合第一 anchor于接头一上,然后在DNA聚合酶的作用下,将原待测核酸片段延伸形成完整双链核酸分子,延伸反应体系及过程为30°C条件下,以Klenow酶反应缓冲液润洗第一 anchor与原待测核酸片段的结合物;加入0. 1 U/μ L 的 Klenow 酶,IXKlenow 酶反应缓冲液中,37°C,孵育 IOmin ;延伸反应结束后,以磁铁吸附磁珠,300C,900 μ L清洗缓冲液进行清洗,将原待测核酸片段延伸形成的完整双链核酸分子进行分离。2、AcuI 酶切得到双链核酸分子后,以Acu I进行酶切,得到带有待测序片段的酶切产物,酶切的反应体系及过程为300C,双链核酸分子中加入 400 μ L IXNEBuffer 2,40 μ M SAM ;加入0. 05U/yL 的 Acu I 酶,37°C 孵育 2h;酶切反应结束后,以磁铁吸附磁珠,30°C,900 μ L清洗缓冲液进行清洗,分离得到带有待测序片段的酶切产物,其中带有待测序片段的核苷酸链3’端带有两个核苷酸的突出末端。四、酶切产物连接接头二,并结合第二 anchor1、酶切产物连接接头二利用酶切产物所带的突出末端,以如图18所示结构的接头二(SEQ ID NO :2和SEQ ID NO 3)进行连接,其中突出末端的-X碱基为A或G或C或T,接头二是以种类一共为42 =16种接头混合的形式加入连接反应中,连接反应的体系和过程为30°C条件下,在回收的酶切产物中加入IX连接缓冲液;加入浓度为10μΜ的16种接头混合的接头二,以及0. 2U/yL的Τ4连接酶,16°C 条件下孵育Ih ;连接反应结束后,以磁铁吸附磁珠,30°C,900 μ L清洗缓冲液进行清洗,分离得到双链核酸分子形式的新待测核酸片段。2、第二 anchor 的结合以NaOH变性解离的方法,将双链核酸分子形式的新待测核酸片段转变成带有未测序片段的单链新待测核酸片段。第二 anchor (SEQ ID NO 4)与接头二的杂交结合体系及过程为^°C,在单链新待测核酸片段中加入400 μ L 2 X SSPE,加入第二 anchor (10 μ Μ), 60°C维持30s ;然后降温至42°C,杂交孵育anin ;杂交结束之后,以磁铁吸附磁珠,30°C,900 μ L清洗缓冲液进行清洗,将未反应的第二 anchor分离清除。五、获取第二 anchor延伸末端后6个核苷酸的序列信息1、连接荧光探针在T4连接酶的作用下,将荧光探针(2. 5 μ Μ)连接到第二 anchor延伸末端之后, 连接反应过程及体系为30°C,新待测核酸片段中加入连接缓冲液;加入0. 2U/yL T4连接酶,荧光探针(2. 5 μ M),连接缓冲液中,30°C,20min反应;连接反应结束之后,以磁铁吸附磁珠,30°C,900 μ L清洗缓冲液进行清洗,将未反应的荧光探针与连接产物进行分离。2、采集荧光信号,读取相应位置的核苷酸序列信息将连接有荧光探针的连接产物放入测序仪,在荧光显微镜下进行激发,采集荧光信号,根据荧光信号判断读取该位置的核苷酸序列。3、洗脱第二 anchor及荧光探针在读取上一步骤中相应位置的核苷酸序列信息后,利用UDG酶对第二 anchor中的 dU碱基进行切割形成小片段,然后将小片段直接洗脱,反应过程及体系为UDG酶酶切缓冲液,20 μ L ;UDG酶,10 μ L ;洗脱缓冲液加至200 μ L ;37°C,5min 进行酶切;酶切结束后,以磁铁吸附磁珠,加入900 μ L洗脱缓冲液进行洗脱分离,得到未接第二 anchor的新待测核酸片段。4、重复上述步骤,通过更换不同标记位置的荧光探针进行连接,从而读取得到第二 anchor延伸末端后第1至6位的核苷酸序列信息。六、获取后续核苷酸序列信息重复步骤三至步骤五的操作,通过酶切手段切除已经读取过的核苷酸序列,并构建新的待测核酸片段,以此实现延伸测序的目的,直至得到原待测核酸片段上所能读取的全部核苷酸序列信息。对于测序所得的荧光信号图像数据,利用IPB处理软件以生物信息学方法进行分析,得到的分析结果显示前100个base读取准确率为99. 99% (Q30),100 200个kise 的读取准确率为99. 85% (Q20),200 300个kise的读取准确率为99% (Q20),该300个 base的读取准确率平均值为99. 82% (Q20) 0因此,根据上述数据,在该实施例中本发明所记载的技术方案进行连接测序达到的高质量读长为300bp。以本发明所记载的技术方案进行连接测序,理论上应当可以将待测核酸片段所有的核苷酸序列信息读取出来。但通过所述实施例中得到的数据,其高质量的读长仅为 300bp,其原因可能是由于在不断循环的酶切与连接操作中,内切酶的酶切能力以及连接酶的连接能力有所下降而导致。因此,若对于内切酶的酶切能力以及连接酶的连接能力进行加强,利用本发明所记载的技术方案进行连接测序的话,可以达到更长的读长。应当说明的是,本发明利用酶切延伸增加读长的测序方法典型的应用但不限于核苷酸测序中,任何其他类似的应用均应包含在本发明的保护范围之内。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种利用酶切延伸增加读长的测序方法,其特征在于,所述方法包括以下步骤A.将第一anchor结合于原待测核酸片段的接头一上;B.在第一anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第一 anchor延伸末端后M个核苷酸的序列信息;C.利用内切酶将步骤B中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物;D.酶切产物连接接头二得新待测核酸片段,结合第二anchor于接头二上;E.在第二anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第二 anchr延伸末端后N个核苷酸的序列信息;F.重复步骤C至E的操作,得到原待测核酸片段中所需的核苷酸序列信息;其中,M、N均为正整数。
2.根据权利要求1所述的利用酶切延伸增加读长的测序方法,其特征在于,步骤A中所述第一 anchor带有至少一个酶切识别位点。
3.根据权利要求2所述的利用酶切延伸增加读长的测序方法,其特征在于,所述步骤C 包括以下步骤Cl.将荧光探针与第一 anchor洗脱,重置第一 anchor并进行链延伸,与原待测核酸片段形成双链核酸分子;C2.内切酶通过识别第一 anchor上所带的酶切识别位点进行酶切,将步骤B中已得到序列信息的核苷酸部分或完全切除,得带有待测序片段的酶切产物。
4.根据权利要求1所述的利用酶切延伸增加读长的测序方法,其特征在于,步骤C包括以下步骤Cl’ .在第一 anchor的另一端连接双链的接头三,该接头三带有至少一个酶切识别位占.C2’.利用内切酶识别接头三所带的酶切识别位点,将步骤B中已得到序列信息的核苷酸部分或完全切除,得到带有待测序片段的酶切产物。
5.根据权利要求4所述的利用酶切延伸增加读长的测序方法,其特征在于,步骤Cl,中所述接头三为平末端接头、突出末端接头、分叉型接头或带茎环结构的接头。
6.根据权利要求1所述的利用酶切延伸增加读长的测序方法,所述步骤A中第一 anchor的一端是封闭的。
7.根据权利要求6所述的利用酶切延伸增加读长的测序方法,其特征在于,在步骤C前还包括步骤CO.对第一 anchor的另一端进行活化,使其能够用于连接和延伸。
8.根据权利要求1至7中任一项所述的利用酶切延伸增加读长的测序方法,其特征在于,所述第一 anchor带有至少一个特异性残基。
9.根据权利要求8所述的利用酶切延伸增加读长的测序方法,其特征在于,所述步骤B 包括以下步骤Bi.在带有特异性残基的第一 anchor延伸末端连接荧光探针,检测其荧光信号,得到对应位置的核苷酸序列信息;B2.以特异性切割剂切割特异性残基,将荧光探针及第一 anchor洗脱,重置第一anchor ;B3.在第一 anchor延伸末端重复荧光探针的连接和检测操作,得到第一 anchor延伸末端后M个核苷酸的序列信息。
10.根据权利要求1所述的利用酶切延伸增加读长的测序方法,其特征在于,步骤D中所述接头二为平末端接头、突出末端接头、分叉型接头或带茎环结构的接头。
11.根据权利要求1所述的利用酶切延伸增加读长的测序方法,其特征在于,所述第一 anchor禾口第二 anchor相同或不同。
12.根据权利要求11所述的利用酶切延伸增加读长的测序方法,其特征在于,所述第二 anchor带有至少一个酶切识别位点。
13.根据权利要求11所述的利用酶切延伸增加读长的测序方法,其特征在于,所述第二 anchor带有至少一个特异性残基。
14.根据权利要求1至7、10至13中任一项权利要求所述的利用酶切延伸增加读长的测序方法,其特征在于,步骤A中所述原待测核酸片段固定于固相载体表面。
全文摘要
本发明涉及基因工程领域,提供了一种利用酶切延伸增加读长的测序方法。本发明所述利用酶切延伸增加读长的测序方法,首先将第一anchor结合于原待测核酸片段的接头一上,使用连接测序法读取第一anchor延伸末端后的M个核苷酸的序列信息;然后利用内切酶识别相应的酶切识别位点将已读取序列信息的核苷酸部分或完全切除,在酶切回收的待测序片段上连接新的接头二,然后在接头二上锚定结合第二anchor,并在第二anchor延伸末端连接荧光探针,向前延伸读取核苷酸序列信息;通过重复上述操作,得到原待测核酸片段所需的核苷酸序列信息,从而利用酶切延伸进行测序的方法实现延长测序的读长且使读长不受限制的目的。
文档编号C12Q1/68GK102559918SQ201210047900
公开日2012年7月11日 申请日期2012年2月28日 优先权日2012年2月28日
发明者盛司潼 申请人:盛司潼