专利名称:一种增加读长的测序方法
技术领域:
本发明涉及基因工程领域,更具体地说,涉及一种增加读长的测序方法。
背景技术:
新一代测序技术(next-generation sequencing, NGS)主要包括焦磷酸测序法 (sequencing by pyrosequencing),合成法测序(sequencing by synthesis, SBS)禾口连接法测序(sequencing by ligation, SBL)。其中,连接法测序具有准确率高,成本低的优点,适用于转录本及比较基因组学研究,特别是单核苷酸多态性(Single Nucleotide Polymorphisms, SNP)的检测。现有的一种连接测序法是基于在特定位置带有荧光标记的寡核苷酸探针进行的, 该寡核苷酸探针带有η个碱基,分为h(h ^ η)组,同一组寡核苷酸探针的不同荧光标记对应同一特定位置的不同碱基序列,不同组之间的区别在于不同荧光标记对应的特定位置不同,因为该寡核苷酸探针的3’端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接。每次连接反应,用于锚定的引物anchor通过互补配对结合于待测核酸片段的接头序列上,然后在T4连接酶的作用下,每个anchor后连接一个寡核苷酸探针,测得相应位置的碱基序列;一次连接之后将之前的anchor及寡核苷酸探针洗脱,重连anchor及更换另一组寡核苷酸探针进行连接,检测该组寡核苷酸探针对应位置的碱基;重复连接-检测-洗脱-连
接的步骤,即可测得待测核酸片段接头序列的3’末端后第1、2.......h位的碱基序列信
肩、ο此外,在上述连接测序法中,若将寡核苷酸探针的3’端活化并在其后继续连接片段时经常无法得到连接产物或得到的连接产物很少。通过实验研究,我们发现这是由于连接酶的保真度会随着与连接点的距离增大而降低导致,因此在上述连接测序法中读长h是受限的。不同的连接酶的保真度是不同的。以T4连接酶为例,经过验证,我们发现T4连接酶最大限度能保证6个碱基正确互补配对,也即高质量的读长h < 6,读长过短。从第7位碱基开始,T4连接酶无法保证寡核苷酸探针与待测核酸片段之间碱基的正确匹配,因此寡核苷酸探针连接到anchor上时,第6位之后的碱基会产生错配。若经过处理,直接将寡核苷酸探针的荧光信号淬灭且活化其3’端,而在其后继续连接新的寡核苷酸探针,用以读取新的核苷酸序列信息,则只有碱基正确配对的寡核苷酸探针后面才能连接,而有错配存在的寡核苷酸探针后面无法连接。相比第一次连接上的寡核苷酸探针,此时连接上的新的寡核苷酸探针数量急剧下降,检测得到的荧光信号极其微弱,导致核苷酸的读取准确率降低。因此,迫切需要一种新的连接测序法,能够增加读长,同时还能保证增加的核苷酸序列信息的读取准确率。
发明内容
本发明的目的在于提供一种增加读长的测序方法,旨在解决现有技术中连接测序法读长过短的问题,并能进一步避免增加读长时出现核苷酸序列信息读取准确率低的问题。为了实现发明目的,所述增加读长的测序方法包括以下步骤A.将第一 anchor结合于待测核酸片段的接头上,该第一 anchor带有酶切识别位
点;B.在第一 anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到延伸末端后M个核苷酸序列信息;C.利用酶切识别位点,以切刻内切酶进行酶切,得到在第一 anchor延伸末端后保留N个核苷酸的酶切产物;D.将酶切产物与荧光探针连接,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第M+1至N+K位的核苷酸序列信息。其中,所述第一 anchor上带有至少一个dU碱基。其中,所述第一 anchor的一端是封闭的。其中,所述步骤C包括以下步骤Cl.将荧光探针与第一 anchor洗脱,锚定第二 anchor并在其延伸末端连接自由探针,得到自由探针复合物;C2.利用自由探针复合物所带酶切识别位点,以切刻内切酶酶切,得到在第一 anchor延伸末端后保留N个核苷酸的酶切产物。步骤C也可以通过以下方式实现直接利用切刻内切酶识别第一 anchor所带的酶切识别位点,并在第一 anchor延伸末端方向进行酶切,将荧光探针中带有荧光标记的片段部分切掉,保留N个核苷酸,从而得到在第一 anchor延伸末端后保留N个核苷酸的酶切产物。一 anchor 禾口 二 anchor t匿同同,当H一 anchor 禾口 二 anchor 不同时,第二 anchor在延伸末端较第一 anchor少L个核苷酸。其中,步骤Cl中所述第一 anchor上带有至少一个dU碱基。进一步的,步骤Cl中所述荧光探针与第一 anchor的洗脱采用UDG酶识别并切除 dU碱基形成短片段,然后利用洗脱缓冲液进行洗脱。其中,所述第二 anchor上带有至少一个dU碱基。其中,上述切刻内切酶的酶切位点位于酶切识别位点所在anchor的延伸末端方向,酶切位点与酶切识别位点之间的核苷酸个数随切刻内切酶的不同而不同。其中,所述步骤D可以通过现有技术中重复类似杂交-连接-采集荧光信号-洗脱-杂交的步骤实现,也可以通过以下步骤实现Dl.将酶切产物与荧光探针连接,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;D2.将荧光探针去除,连接标记位置不同的荧光探针,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;D3.重复步骤D2的操作,直至得到第M+1至N+K位的核苷酸序列信息。进一步,步骤D2包括以下步骤D21.利用酶切产物所带酶切识别位点,以切刻内切酶切掉荧光探针与酶切产物之间的连接,并将荧光探针洗脱;
D22.将标记位置不同的荧光探针与酶切产物连接,检测该荧光探针的荧光信号, 得到相应位置的核苷酸序列信息。进一步的,步骤D2包括以下步骤D21’ .将酶切产物中的anchor与保留的核苷酸以及连接的荧光探针通过解离进行洗脱;D22’.利用杂交anchor-连接探针-切刻内切酶酶切的步骤,重新制备酶切产物;D23’.将标记位置不同的荧光探针与酶切产物连接,检测该荧光探针的荧光信号, 得到相应位置的核苷酸序列信息。由上述可知,本发明所述增加读长的测序方法,首先使用连接测序法读取anchor 延伸末端后的M个核苷酸序列信息,然后利用切刻内切酶识别anchor所带的酶切识别位点并进行酶切,在anchor延伸末端后保留N个核苷酸,将之前已经读取过的相应数量的核苷酸位置封闭,然后在保留的核苷酸之后再连接检测用的荧光探针,读取第M+1位及之后的核苷酸序列信息,从而实现增加读长的目的。同时,利用切刻内切酶控制酶切之后所保留的核苷酸个数,能够保证连接酶的高保真度,进而保证后续核苷酸序列信息的读取准确率。
图1是本发明一个实施例中增加读长的测序方法的方法流程图;图2是本发明所用anchor的结构示意图;图3是本发明一个实施例中得到在anchor延伸末端后保留N个核苷酸的酶切产物的方法流程图;图4是本发明一个实施例中第二 anchor与第一 anchor不同时的结构示意图;图5是本发明一个实施例中通过更换荧光探针并检测相应荧光信号,得到第M+1 至N+K位核苷酸序列信息的方法流程图;图6是本发明一个实施例中通过更换荧光探针获得相应位置的核苷酸序列信息的方法流程图;图7是本发明另一个实施例中通过更换荧光探针获得相应位置的核苷酸序列信息的方法流程图;图8是本发明另一个实施例中通过更换荧光探针并检测相应荧光信号,得到第 M+1至N+K位核苷酸序列信息的方法示意图;图9是本发明一个实施例中增加读长的测序方法示意图;图10是本发明一个实施例中验证连接酶在前一片段出现错配时无法继续连接的电泳结果图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。本发明提供了一种增加读长的测序方法,包括以下步骤首先按照常规连接测序法的步骤,利用锚定引物anchor以及检测所用的不同种类荧光探针,重复杂交锚定 anchor、连接荧光探针、采集荧光信号、洗脱anchor及荧光探针的步骤,根据所连接的荧光探针种类的不同,读取待测核酸片段中anchor延伸末端后M位的核苷酸序列信息。其中, 所述anchor上带有切刻内切酶识别位点;所述anchor延伸末端,是指在anchor上能够继续连接并进行核苷酸链延伸的末端,可以是anchor的5’端,也可以是anchor的3’端;与此相对应的是非延伸末端,是指在anchor上不能继续连接并进行核苷酸链延伸的末端,可通过对anchor的3’或5’末端进行封闭处理来实现。然后利用anchor延伸末端的酶切识别位点,以切刻内切酶进行酶切形成切刻,将切刻之后出现的未与anchor连接的短片段部分洗脱,在anchor延伸末端保留数个核苷酸,然后在保留的核苷酸后面再连接荧光探针, 通过更换荧光探针的种类,读取后续的核苷酸序列信息,从而实现增加连接测序法中读长的目的。同时,通过切刻内切酶,控制在anchor延伸末端后保留的核苷酸个数,可以实现不同个数的核苷酸读长增加,而且可以保证连接酶的高保真性,避免增加读长时核苷酸序列信息读取准确率降低的问题。图1示出了本发明一个实施例中增加读长的测序方法流程,该方法包括Si.将第一 anchor结合于待测核酸片段的接头上,该第一 anchor带有酶切识别位占.
^ \\\ S2.在第一 anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到延伸末端后M个核苷酸序列信息;S3.利用酶切识别位点,以切刻内切酶进行酶切,得到在第一 anchor延伸末端后保留N个核苷酸的酶切产物;S4.将酶切产物与荧光探针连接,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第M+1至N+K位的核苷酸序列信息。本技术方案的优势在于,能够在利用普通连接测序法读取M个核苷酸序列信息的基础上,通过切刻内切酶的酶切保留第一 anchor延伸末端后正确配对的N个核苷酸,然后在连接酶的作用下,在所保留的N个核苷酸之后再连接荧光探针,继续向下读取核苷酸序列,从而实现读长增加的目的;而通过切刻内切酶控制住保留的核苷酸个数,可以实现不同个数的核苷酸读长增加,而且可以保证连接酶的高保真性,避免增加读长时核苷酸序列信息读取准确率降低的问题。需要说明的是本发明中所述第一 anchor为锚定引物,用于与待测核酸片段的接头进行锚定结
I=I O其中,步骤Sl中所述的待测核酸片段,其上至少带有一个接头,包括但不限于两端中至少有一端带有接头、或两端都带有接头、或除两端之外的其余位置带有接头。当待测核酸片段只有两端位置带有接头时,后续的anchor可不做封闭处理;若待测核酸片段除两端之外的其余位置带有接头,为了控制后续连接的方向,优选将anchor的一端将进行封闭处理,以避免连接的无序。步骤Sl中,第一 anchor通过碱基互补配对与待测核酸片段的接头结合,其基本结构如图2所示,第一 anchor上带有酶切识别位点1。在本发明的一个具体实施例中,所用到的第一 anchor的序列为SEQ NO :1。在实际应用过程中,为实现不同的目的,还可以在基本结构的基础上加入更多的特殊设计。在本发明的另一个具体实施例中,除了第一 anchor的延伸末端带有酶切识别位点外,在第一 anchor的其余核苷酸序列中,引入了 dU碱基,其序列为SEQ N0:2,该第一 anchor可以在后续的洗脱过程中直接切除dU碱基形成不同的短片段,便于洗脱的实现。在本发明的另一个具体实施例中,将第一 anchor的一端进行封闭,可以是第一 anchor的3’端,也可以是5’端,经过封闭处理既可以控制连接的方向,又可以避免第一 anchor之间相互连接。在本实施例的一个具体实施方式
中,将第一 anchor的3’端进行封闭,采用的方法包括但不限于双脱氧、氨基化反应、酰胺化,其无法继续连接,控制第一 anchor的连接只发生在5’端;而在本实施例的另一个具体实施方式
中,将第一 anchor的 5’端进行封闭,通过5’端进行去磷酸化或酰胺化处理将其封闭,从而只保留3’端作为连接的末端。此外,由于碱基的互补配对关系,因此在构建待测核酸片段或以待测核酸片段形成测序文库时,所用的接头中与第一 anchor酶切识别位点对应的核苷酸也是特定的。步骤S2中,经过一轮测序操作后,可以得到第一 anchor延伸末端后的M个核苷酸的序列信息。其中,M为正整数。根据在连接测序过程中所使用的连接酶及连接酶的保真度,M的数值范围优选为1 9。 步骤S2中,所述第一 anchor延伸末端是指第一 anchor能够用于连接并进行核苷酸链延伸的末端,与此相对应的是非延伸末端,也即经过一定封闭处理后无法再进行连接的末端。本发明中所用的荧光探针分为不同组别类型,同组类型中不同荧光标记对应同一特定位置的不同核苷酸序列,而不同组类型的荧光探针荧光标记对应的特定位置不同。每次连接反应中,加入同一组类型的荧光探针,根据所采集的荧光信号,可以读取该组荧光探针标记特定位置对应的核苷酸序列信息;而通过杂交-连接-采集荧光信号-洗脱这些操作的重复,可以准确的读取第一 anchor延伸末端后M个核苷酸序列信息。步骤S3中所述N为正整数,其数值范围优选为1 9,而且为了保证测序的连续性与准确性,在数值上应保证N < M。步骤S3中所述切刻内切酶,能够识别双链中的一条单链所带的酶切识别位点,并对该单链进行酶切,其酶切位点位于酶切识别位点所在第一 anchor延伸末端的下游方向, 酶切位点与酶切识别位点之间的核苷酸个数随所用的切刻内切酶不同而不同。为了保证连接酶的连接保真度,避免出现错配,切刻内切酶进行酶切之后,在第一 anchor延伸末端保留的核苷酸个数N的范围为1 9,为尽可能增加读长,N的数值优选为 3 9,更优选为5 9。上述切刻内切酶,包括但不限于Nt. Alw I内切酶、Nt.BsmA I内切酶、Nt. BspQ I内切酶、Nt. BstNB I内切酶。步骤S3可以有多种实现方式,在本发明的一个实施例中,直接利用能够识别第一 anchor上所带的酶切识别位点的切刻内切酶进行酶切,使得连接在第一 anchor延伸末端后的荧光探针形成切刻,从而使带有荧光标记的部分形成短片段,然后以洗脱液将短片段洗脱,得到在第一 anchor延伸末端后保留N个核苷酸的酶切产物。该实施方案的优点在于可以简化操作,节省时间。而在本发明的另一个实施例中,如图3所示,步骤S3可通过以下步骤实现S31.将荧光探针与第一 anehor洗脱,锚定第二 anehor并在其延伸末端连接自由探针,得到自由探针复合物;
S32.利用自由探针复合物所带酶切识别位点,以切刻内切酶酶切,得到在第一 anchor延伸末端后保留N个核苷酸的酶切产物。该实施方案的优点在于,将原有的第一 anchor与荧光探针洗脱之后,锚定第二 anchor,在其延伸末端后连接简便易得且成本低的自由探针,通过提高自由探针的浓度而使待测核酸片段都能与之连接,弥补了之前荧光探针因为成本高、浓度低以及空间位阻效应不能保证与所有待测核酸片段连接的缺陷,从而可以保证后续进行步骤S4的操作时,读取到的荧光信号足够多,能够准确的判断所读取的核苷酸序列。对于本实施方案需要说明的是本方案中,第一 anchor与第二 anchor皆为锚定引物,用于与待测核酸片段的接头进行锚定结合。步骤S31中所述第一 anchor与第二 anchor可以是相同的,此时相当于将第一 anchor洗脱之后重置,其优点在于使用同一种anchor,可以简化反应试剂。第二 anchor也可以与第一 anchor不相同。在本步骤的一个具体实施例中,第二 anchor与第一 anchor的酶切识别位点不同。在本步骤的另一个具体实施例中,第二 anchor带有数个dU碱基,而第一 anchor 并无dU碱基。在本步骤的另一个具体实施例中,第二 anchor与第一 anchor相比,在延伸末端少了 L个核苷酸序列,其中L为正整数,其数值范围优选为1 8 ;如图4所示,在此实施例中,第二 anchor本身并无酶切识别位点,通过与后续连接上的自由探针组合形成酶切识别位点。步骤S31中荧光探针与第一 anchor的洗脱,可利用现有技术中多种方式实现。在本步骤的一个具体实施例中,待测核酸片段是与微珠固定结合的,采集荧光信号结束之后,直接利用NaOH对测序反应体系进行处理,使得连接在待测核酸片段上的第一 anchor与荧光探针解离,然后以洗脱缓冲液直接将解离的第一 anchor与荧光探针清洗掉。在本步骤的另一个具体实施例中,第一 anchor在设计合成时加入dU碱基,因此直接利用特异性识别酶切dU碱基的尿嘧啶-DNA糖基化酶⑴racil-DNA Glycocasylase,UDG 酶)对第一 anchor进行酶切,形成短片段,升温即可将这些由第一 anchor和荧光探针形成的短片段洗脱。在本步骤的另一个具体实施例中,在第一 anchor设计合成时,利用几个硫代磷酸键(P-幻代替原有的P-O键,因此可以直接利用带有Ag、Hg、CU、Mn、ai或Cd离子的化合物切刻P-S键将第一 anchor和荧光探针洗脱。应当进一步说明的是,上述实施例只是步骤S31中用于洗脱第一 anchor和荧光探针的一些具体实施方式
,并不用以限制本发明的保护范围。此外,步骤S31中所述自由探针为单链寡核苷酸,其核苷酸个数优选为5 15,更优选为5 10,其核苷酸组成数目自由可变,合成时采用随机合成方式即可,简便易得,成本低。步骤S4中,N、K均为正整数。根据所选用的连接酶,K的取值范围优选为1 9。得到第M+1至N+K位的核苷酸序列信息通过如图5所示的方法实现,该方法包括以下步骤
S41.将酶切产物与荧光探针连接,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;S42.将荧光探针去除,连接标记位置不同的荧光探针,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;S43.重复步骤S42的操作,直至得到第M+1至N+K位的核苷酸序列信息。上述技术方案利用标记位置不同的荧光探针之间的更换连接,实现对M+1至N+K 位核苷酸序列信息的读取。其中,步骤S42可以有多种实现方式。在本步骤的一个具体实施例中,步骤S42通过如图6所示的方法实现,该方法包括以下步骤S421.利用酶切产物所带酶切识别位点,以切刻内切酶切掉荧光探针与酶切产物之间的连接,并将荧光探针洗脱;S422.将标记位置不同的荧光探针与酶切产物连接,检测该荧光探针的荧光信号, 得到相应位置的核苷酸序列信息。该方案的优势在于,利用酶切产物本身所带的酶切识别位点,利用切刻内切酶直接将连接在保留核苷酸之后的荧光探针切除,然后换用检测其他位置核苷酸的荧光探针进行连接,而不需要将酶切产物上的anchor以及保留的核苷酸洗脱之后再次重连,既简化了操作,又节省了试剂,降低了成本。在本发明的另一个实施例中,步骤S42通过如图7所示的方法实现,该方法包括以下步骤S421’.将酶切产物中的anchor与保留的核苷酸以及连接的荧光探针通过解离进行洗脱;S422’ .利用杂交anchor-连接探针-切刻内切酶酶切的步骤,重新制备酶切产物;S423’ .将标记位置不同的荧光探针与酶切产物连接,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息。其中,步骤S422’中所述的杂交anchor-连接探针-切刻内切酶酶切,是指在步骤 S421’的基础上,重新在待测核酸片段上杂交带有酶切识别位点的anchor,然后在anchor 延伸末端连接自由探针,并以切刻内切酶识别和酶切,得到在anchor延伸末端保留有N个核苷酸的酶切产物的操作。其中,此处所述anchor,泛指能够满足本发明要求的锚定引物, 可以是前面所述的第一 anchor,也可以是前面所述的第二 anchor,其上带有酶切识别位点ο该实施方案通过将anchor、保留的核苷酸及荧光探针洗脱,之后重复杂交 anchor-连接自由探针-切刻内切酶酶切_连接荧光探针_采集荧光信号_洗脱_杂交的操作,即可得到第M+1位直至第N+K位的核苷酸序列信息。图8为本发明一个实施例中利用T4连接酶得到第M+1至N+K位核苷酸序列信息的方法示意图,该图直观的展现了得到第M+1至N+K位核苷酸序列信息的过程步骤51.读取第6位核苷酸序列信息在之前的步骤中,首先利用常用的连接测序法,在T4连接酶的作用下,更换连接的荧光探针,读取1 5位的核苷酸序列信息,即M = 5 ; 然后利用Nt. BstNB I酶对连接在微珠上并固定于固相载体表面的自由探针复合物进行酶切,所述Nt. BstNB I酶的酶切位点在其识别位点后四位核苷酸之后进行酶切,得到anchor 延伸末端保留4位核苷酸的酶切产物,即此时N = 4 ;在该4位核苷酸后连接用于检测的一组共4种6号位荧光探针,在荧光显微镜下采集荧光信号,根据荧光信号的种类判断读取第 6位的核苷酸序列信息;步骤52.读取第7位核苷酸序列信息利用Nt. BstNB I再次进行酶切,将6号位荧光探针与保留的核苷酸之间的连接切除,利用洗脱缓冲液将其洗掉,然后在T4连接酶的作用下,连接用于检测的一组共四种7号位荧光探针,并通过荧光显微镜采集荧光信号,读取第7位核苷酸序列信息;步骤53.读取后续核苷酸序列信息重复步骤52的操作,在T4连接酶的作用下, 换用标记位置不同的荧光探针读取相应位置核苷酸序列信息,直至得到第9位核苷酸序列 fn息ο上述实施方案中,在T4连接酶的作用下,利用酶切位点在酶切识别位点之后四位进行酶切的切刻内切酶Nt. BstNB I对自由探针进行酶切,实现在原有读长的基础上增加4 位的目的。应当进一步说明的是,上述实施例仅是实现步骤S4中读取第M+1至N+K位核苷酸序列信息的一些具体实施方案,并不用以限制本发明的保护范围。例如改变M、N的数值,同样可以实现读长的增加。在本发明的另一个实施例中,在T4连接酶的作用下,利用常用的连接测序法读取anchor延伸末端之后共4位(即M = 4)核苷酸序列信息,然后换用 Nt. BsmA I内切酶进行酶切可以得到在anchor后保留1位(即N = 1)核苷酸的酶切产物, 利用图8所示方法可以在原读长为4位核苷酸的基础上,增加1位读长。图9为本发明一个具体实施例中增加读长的测序方法示意图,该图直观的展现了在测序中实现读长增加的过程步骤1.读取第1至5位核苷酸序列信息将第一 anchor通过碱基互补配对杂交结合于待测核酸片段的接头上,其中待测核酸片段的一端通过连接固定于磁珠表面,第一 anchor的延伸末端带有切刻内切酶Nt. Alw I的酶切识别位点,且第一 anchor的核苷酸序列中带有dU碱基;在T4连接酶作用下,在第一 anchor的延伸末端连接用于检测的荧光探针,通过重连第一 anchor以及标记位置从1至5号位的不同组别荧光探针的更换连接,采集相应探针的荧光信号图,读取第1至5位的核苷酸序列信息;步骤2.洗脱当第5号位核苷酸序列信息被读取之后,利用UDG酶特异性识别并酶切第一 anchor中所携带的dU碱基,将第一 anchor与荧光探针连接的核苷酸链切割成小片段,通过洗脱缓冲液以及温度的控制,将第一 anchor和荧光探针清洗掉;步骤3.连接自由探针在待测核酸片段通过碱基互补配对重新连接第一 anchor, 然后在连接酶的作用下,在第一 anchor延伸末端连接一个九聚寡核苷酸自由探针,得到待测核酸片段、第一 anchor与自由探针三者组成的自由探针复合物;步骤4.切刻内切酶酶切利用Nt. Alw I酶识别第一 anchor所携带的酶切识别位点并进行酶切,然后对切出来的小片段寡核苷酸链进行洗脱,得到在第一 anchor延伸末端保留4位核苷酸的酶切产物;步骤5.读取第5位后的核苷酸序列信息在T4连接酶的作用下,在步骤4中得到的酶切产物上保留的4位核苷酸之后连接特定位置标记的荧光探针,采用如图8所示的方法,利用第一 anchor上携带的酶切识别位点,通过酶切的方式更换标记位置不同的荧光探针进行连接检测,采集相应位置的荧光信号,然后读取5号位后的第6至9位的核苷酸序列 fn息ο通过上述对本发明所记载技术方案的进一步阐述和举例说明,可以知道,利用本发明所记载的技术方案进行连接测序时,其读长由所选用的连接酶的保真度与切刻内切酶的酶切能力决定,其读长最长可达到连接酶的保真度所能保证正确连接的核苷酸个数,再加上切刻内切酶酶切之后能保留的核苷酸个数之和,即前述M与N的取值范围之和。根据之前所述M与N的优选取值范围,本发明所记载的技术方案在待测核酸片段的一端能达到的读长范围优选为1 18,也即在待测核酸片段单端的读长可达到18个核苷酸的长度,因此通过两端分别进行测序的读长可以达到36个核苷酸的长度。本发明在实现读长增加的基础上,通过控制切刻内切酶酶切保留的核苷酸个数, 能够在增加读长同时保证连接酶的保真度,避免出现因为前面核苷酸的错配而影响后续荧光探针的连接,进而影响读长增加时的核苷酸序列信息读取准确率。为了验证所述优势,本发明给出了一个具体实施例,用以证明当连接核苷酸个数超过连接酶的保真度范围时,容易出现因为前面核苷酸的错配影响后续荧光探针连接的数量,进而影响核苷酸序列信息读取准确率。该实施例以T4连接酶为例,所包括的步骤及具体操作如下所示步骤一、锚定anchor杂交结合于待测模板序列片段的接头上设计序列已知的待测模板(SEQ ID NO :3),利用接头(SEQ ID NO 4)将待测模板制备成测序片段文库,其中测序片段连接于磁珠上,磁珠被固定于玻片表面;然后通过碱基互补配对将锚定anchor (SEQ ID NO 5)杂交结合到测序片段的接头上,杂交的反应过程及体系为28°C,400y L 2XSSPE(saline sodium phosphate EDTA)缓冲液对固定于玻片表面的测序片段进行润洗;加入anchor (15 μ Μ),2 X SSPE 环境下升温至 65°C,维持 30s ;降温至42 °C,Imin 杂交;30°C,900y L 清洗缓冲液[50mM KCl,IOmM Tris-HCl (pH7. 4),0. ImM EDTA,0. 01% Triton X-100]进行清洗,将未反应的锚定anchor分离清除。步骤二、连接自由探针设计4种由7个核苷酸组成的寡核苷酸片段作为非荧光标记自由探针,分别是 Pl (SEQ ID N0:6)、P2(SEQ ID N0:7)、P3(SEQ ID NO :8)禾口 P4(SEQ ID NO :9),其中 Pl 的核苷酸能完全与测序片段互补,而其余三种则是最后一位核苷酸与测序片段不能互补;在T4 连接酶的作用下,将自由探针连接到测序片段上锚定anchor的延伸末端,形成自由探针复合物,设置五个连接体系,其中连接体系中相对应的试剂是等量的,分别是连接体系1 :P1与测序片段连接,得到自由探针复合物1 ;连接体系2 :P2与测序片段连接,得到自由探针复合物2 ;连接体系3 :P3与测序片段连接,得到自由探针复合物3 ;连接体系4 :P4与测序片段连接,得到自由探针复合物4 ;连接体系5 :P1、P2、P3和P4等量混合后与测序片段连接,得到自由探针复合物5 ;
上述连接体系进行连接反应的体系为30°C,连接缓冲液[50mM Tris-HCl (pH7. 5), IOmM MgCl2, IOmM dithiothreitol, ImM ATP]对杂交分离的产物进行润洗;加入T4连接酶,自由探针(3口11),连接缓冲液中,301,201^11反应;连接反应结束之后,30°C,900 μ L清洗缓冲液进行清洗,将未反应的自由探针与连接产物进行分离,得到自由探针复合物。步骤三、连接荧光探针设计带荧光标记的九聚核苷酸作为荧光探针,其连接端第一位核苷酸是特定的C, 与测序片段中锚定anchor延伸末端后第6位的核苷酸正好互补。在T4连接酶的作用下, 荧光探针分别与上一步骤中的自由探针复合物进行连接,得到相应的连接产物1、连接产物 2、连接产物3、连接产物4和连接产物5,连接反应的体系为加入T4连接酶,荧光探针(311|1),连接缓冲液中,301,201^11反应;连接反应结束之后,30°C,900 μ L清洗缓冲液进行清洗,将未反应的荧光探针与连接产物进行分离。步骤四、变性解离利用NaOH直接对上述连接产物分别进行变性解离,采用同样量洗脱液进行洗脱, 收集上清液得到五种上清单链DNA液,变性反应体系为连接产物中加入NaOH(0. 05Μ),变性^iiin ;30°C,少量洗脱缓冲液[50mM KCl, IOmM Tris-HCl (pH7. 4),0. ImM EDTA]进行清洗,收集上清液,得到上清单链DNA液。步骤五、琼脂糖凝胶电泳检测上清单链DNA液以核苷酸数目为25的寡核苷酸片段作为参照物,20%琼脂糖凝胶对收集得到上清单链DNA液进行检测,点样时,不同泳道之间点样的量保持一致,电泳结束之后得到如图 9所示的电泳结果图。图中泳道1为连接产物1中得到的上清液样品,泳道2为连接产物2 中得到的上清液样品,后续泳道以此类推,最右边泳道为参照物电泳结果。从图9的结果可以看出只有泳道1的电泳结果恰好是锚定anchor (Ilnt)+自由探针(7nt) +荧光探针(9nt)的长度值;泳道2、3、4的电泳结果长度值只有18nt,说明泳道 2、3、4的样品只是锚定anchor与自由探针连接得到的自由探针复合物,后续荧光探针没有连接成功;而泳道5中,只有少量27nt的电泳条带,从条带推断其产物量约为泳道1中条带的1/4,正好与四种自由探针混合中Pl自由探针的量相当。除此之外,本发明还分别设计了 6号位核苷酸与测序片段相应位置互补但7号位不互补的自由探针实施例进行验证,得到的实验结果同样证明,当锚定anchor后连接的自由探针没有完全与测序片段之间互补时,后续的荧光探针无法连接上去。综合上述实施例的结果,若所连接的自由探针核苷酸数量超过T4连接酶的保真度限值6时,完全可以预见自由探针在锚定anchor延伸末端连接时会出现错配,导致后面的荧光探针无法连接,只有少部分正确配对的自由探针后面才能继续连接荧光探针,因此导致荧光信号在采集时会较弱,从而导致后续核苷酸序列信息的读取准确率降低。而本发明通过控制切刻内切酶酶切保留的核苷酸个数,使其数值控制在连接酶的保真度范围以内,能够在增加读长同时保证连接酶的保真度,不会出现因为错配而导致荧光探针无法连接的情况,从而保证了核苷酸序列信息读取的准确率。针对上述各技术方案,为进一步说明,本发明以T4连接酶为例,给出具体的操作实施例一、读取第1至5位核苷酸序列信息1、anchor与待测核酸片段的杂交结合anchor (SEQ ID NO :10)与待测核酸片段的接头之间通过碱基互补配对杂交结合, 其中待测核酸片段通过链霉亲和生物素的作用被固定于磁珠上,而磁珠本身被固定于玻片表面,anchor延伸末端上带有Nt. Alw I酶的酶切识别位点,该反应过程及体系为28°C,400y L 2XSSPE(saline sodium phosphate EDTA)缓冲液对固定于玻片表面的待测核酸片段进行润洗;加入anchor (15 μ Μ),2 X SSPE 环境下升温至 65°C,维持 30s ;降温至42 °C,Imin 杂交;300C,900 μ L清洗缓冲液进行清洗,将未反应的anchor分离清除。2、连接荧光探针在T4连接酶的作用下,将荧光探针(3μΜ)连接到anchor延伸末端之后,连接反应过程及体系为30°C,连接缓冲液对杂交分离的产物进行润洗;加入T4连接酶,荧光探针(311|1),连接缓冲液中,301,201^11反应;连接反应结束之后,30°C,900 μ L清洗缓冲液进行清洗,将未反应的荧光探针与连接产物进行分离。3、采集荧光信号,读取核苷酸序列信息将连接有荧光探针的连接产物放入测序仪,在荧光显微镜下进行激发,采集荧光信号,根据荧光信号判断读取该位置的核苷酸序列信息。4、洗脱anchor及荧光探针在读取一个位置的核苷酸序列信息之后,可以利用不同的方法进行洗脱。在一个实施例中,利用NaOH直接变性解离,反应过程及体系为测序反应体系中加入NaOH(0. 05M),变性Imin ;300C,900 μ L洗脱缓冲液进行清洗,将变性解离的anchor及荧光探针以及NaOH进行清洗分离。在另一个实施例中,利用UDG酶对anchor中的dU碱基进行切割形成小片段,然后将小片段直接洗脱,反应过程及体系为酶切缓冲液,20 μ L ;UDG酶,10 μ L ;洗脱缓冲液加至200 μ L ;37°C,5min 进行酶切;酶切结束后,加入900 μ L洗脱缓冲液进行洗脱分离,得到未接anchor的待测核酸片段。5、重复上述步骤,通过更换不同标记位置的荧光探针进行连接,从而读取第1至5 位的核苷酸序列信息。二、洗脱anchor及荧光探针读取完第5位核苷酸序列信息时,将结合于待测核酸片段上的anchor和荧光探针洗脱分离,洗脱方式参照之前所述的洗脱方式及步骤。三、连接自由探针1、重新杂交 anchor加入anchor (15 μ Μ),2 X SSPE 环境下升温至 65°C,维持 30s ;降温至42 °C,Imin 杂交;300C,900 μ L清洗缓冲液进行清洗,将未反应的anchor分离清除。2、自由探针的连接T4连接酶的作用下,在杂交结合于待测核酸片段上的anchor延伸末端连接一个由九聚寡核苷酸形成的非荧光标记自由探针,连接反应过程及体系为30°C,连接反应缓冲液对杂交分离的产物进行润洗;加入T4连接酶,自由探针(311|1),连接缓冲液中,301,201^11反应;连接反应结束之后,30°C,900 μ L清洗缓冲液进行清洗,将未反应的自由探针与连接产物进行分离,得到自由探针复合物。四、切刻内切酶酶切利用自由探针复合物中,anchor延伸末端携带的酶切识别位点,以Nt. AlwI酶进行识别并酶切,然后得到在anchor延伸末端带有4位核苷酸的酶切产物,酶切反应过程及体系为400 μ L NEB buffer 2,30°C 清洗;加入Nt. Alw I 酶(0. IU/μ L,NEB),NEB buffer2 中,37°C 酶切 Ih ;酶切反应结束后,30°C,900 μ L清洗缓冲液进行清洗,清除未反应的酶以及由酶切形成的小片段,得到在anchor延伸末端带有4位核苷酸的酶切产物。五、连接荧光探针,读取后续第6至9位的核苷酸序列信息1、连接第6号位荧光探针并读取第6位核苷酸序列信息T4连接酶作用下,在酶切产物上保留的4位核苷酸之后连接用于检测第6号位核苷酸的荧光探针,连接反应过程及体系为30°C,连接缓冲液对杂交分离的产物进行润洗;加入T4连接酶,第6号位荧光探针(3 4 11),连接缓冲液环境下,301,201^11反应;连接反应结束之后,30°C,900 μ L清洗缓冲液进行清洗,将未反应的荧光探针与连接产物进行分离。将经过清洗分离之后的连接产物放入测序仪中,采集荧光信号,根据荧光信号读取第6位的核苷酸序列信息。2、洗脱对已经读取第6位核苷酸序列信息的连接产物进行洗脱,以便于连接用于检测下一位核苷酸的荧光探针,此步骤可采用多种方式进行。在一个实施例中,利用NaOH直接变性解离,反应过程及体系为测序反应体系中加入NaOH(0. 05Μ),变性Imin ;300C,900 μ L洗脱缓冲液进行清洗,将变性解离的anchor及荧光探针以及NaOH进行清洗分离。在另一个实施例中,利用UDG酶对anchor中的dU碱基进行切割形成小片段,然后将小片段直接洗脱,反应过程及体系为酶切缓冲液,20 μ L ;UDG酶,10 μ L ;洗脱缓冲液加至200 μ L ;37°C,5min 进行酶切;酶切结束后,加入900 μ L洗脱缓冲液进行洗脱分离,得到未接anchor的待测核酸片段。以上两个实施例都是将连接在待测核酸片段上的anchor和保留的核苷酸以及荧光探针完全洗脱,因此读取后续其他位置的核苷酸序列信息,需要重新杂交anchor到待测核酸片段,在anchor延伸末端重新连接自由探针并进行酶切得到酶切产物,然后再连接荧光探针进行检测,过程太过于复杂,耗费的试剂量也大,成本高,不利于推广。在本发明的一个优选实施例中,直接利用切刻内切酶对荧光探针进行切除,而 anchor以及原来酶切保留的4位核苷酸则不需要再进行重新连接的操作,本实施例的实现过程及体系为400 μ LNEB buffer 2,30°C 清洗;加入Nt. Alw I 酶(0. IU/ μ L, NEB),NEB buffer 2 中,37°C 酶切 Ih ;酶切反应结束后,30°C,900 μ L清洗缓冲液进行清洗,清除未反应的酶以及由酶切形成的荧光探针小片段。3、更换荧光探针,读取后续位置的核苷酸序列信息利用优选实施例中的洗脱方式,以Nt. Alw I酶对测序后的反应体系进行酶切,洗脱之后换用标记位置不同的荧光探针进行连接,采集相应的荧光信号,根据荧光信号进行不同位置核苷酸序列信息的读取,直到读取第9位核苷酸序列信息。 该实施例以Τ4连接酶进行连接测序,通过常规连接测序方法读取第1至5位的核苷酸序列信息,然后在anchor延伸末端连接九聚物自由探针,利用Nt. Alw I酶识别anchor 延伸末端所带的识别位点并进行酶切,得到anchor延伸末端后保留4位核苷酸的酶切产物,然后再进行荧光探针的连接,采集荧光信号,从而可以在待测核酸片段的单端实现在原有5位核苷酸读长的基础上增加4位核苷酸的目的。若换用保真度为9的Tth连接酶以类似该实施例的操作进行连接测序,切刻内切酶同样选用Nt. Alw I酶,则可以在待测核酸片段的单端实现读长为9加上4 一共13位核苷酸的长度,通过在待测核苷酸的双端进行测序,则读长可为26位核苷酸。应当说明的是,本发明对增加读长的测序方法典型的应用但不限于核苷酸测序中,任何其他类似的应用均应包含在本发明的保护范围之内。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种增加读长的测序方法,其特征在于,所述方法包括以下步骤A.将第一anchor结合于待测核酸片段的接头上,该第一 anchor带有酶切识别位点;B.在第一anchor延伸末端连接荧光探针,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到延伸末端后M个核苷酸序列信息;C.利用酶切识别位点,以切刻内切酶进行酶切,得到在第一anchor延伸末端后保留N 个核苷酸的酶切产物;D.将酶切产物与荧光探针连接,检测其荧光信号,更换荧光探针并重复连接和检测操作,得到第M+1至N+K位的核苷酸序列信息;其中,M、N、K均为正整数。
2.根据权利要求1中所述的增加读长的测序方法,其特征在于,所述第一anchor上带有至少一个dU碱基。
3.根据权利要求1所述的增加读长的测序方法,其特征在于,所述第一anchor的一端是封闭的。
4.根据权利要求1所述的增加读长的测序方法,其特征在于,所述步骤C包括以下步骤Cl.将荧光探针与第一 anchor洗脱,锚定第二 anchor并在其延伸末端连接自由探针, 得到自由探针复合物;C2.利用自由探针复合物所带酶切识别位点,以切刻内切酶酶切,得到在第一 anchor 延伸末端后保留N个核苷酸的酶切产物。
5.根据权利要求4所述的增加读长的测序方法,其特征在于,所述第一anchor和第二 anchor t匿同$$同,当H一 anchor 禾口 二 anchor $同0^, 二 anchor ¢$¢#7^ ^ !!一 anchor少L个核苷酸。
6.根据权利要求4所述的增加读长的测序方法,其特征在于,步骤Cl中所述第一 anchor上带有至少一个dU碱基。
7.根据权利要求4所述的增加读长的测序方法,其特征在于,所述第二anchor上带有至少一个dU碱基。
8.根据权利要求1至7中任一项所述的增加读长的测序方法,其特征在于,所述步骤D 通过以下步骤实现Dl.将酶切产物与荧光探针连接,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;D2.将荧光探针去除,连接标记位置不同的荧光探针,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息;D3.重复步骤D2的操作,直至得到第M+1至N+K位的核苷酸序列信息。
9.根据权利要求8所述的增加读长的测序方法,其特征在于,步骤D2包括以下步骤 D21.利用酶切产物所带酶切识别位点,以切刻内切酶切掉荧光探针与酶切产物之间的连接,并将荧光探针洗脱;D22.将标记位置不同的荧光探针与酶切产物连接,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息。
10.根据权利要求8所述的增加读长的测序方法,其特征在于,步骤D2包括以下步骤D21’ .将酶切产物中的anchor与保留的核苷酸以及连接的荧光探针通过解离进行洗脱;D22’ .利用杂交anchor-连接探针-切刻内切酶酶切的步骤,重新制备酶切产物; D23’.将标记位置不同的荧光探针与酶切产物连接,检测该荧光探针的荧光信号,得到相应位置的核苷酸序列信息。
全文摘要
本发明涉及基因工程领域,提供了一种增加读长的测序方法。本发明所述增加读长的测序方法,首先使用连接测序法读取带有酶切识别位点的anchor延伸末端后M个以内的核苷酸序列信息,巧妙利用切刻内切酶识别anchor所带的酶切识别位点并进行酶切,在anchor延伸末端后保留N个以内的核苷酸,将之前已经读取过的相应数量的核苷酸位置封闭,然后在保留的核苷酸之后再连接检测用的荧光探针,读取后续位置的核苷酸序列信息,从而实现增加读长的目的。同时,利用切刻内切酶控制酶切之后所保留的核苷酸个数,能够保证连接酶的高保真度,进而保证后续核苷酸序列信息的读取准确率。
文档编号C12Q1/68GK102534040SQ201210047879
公开日2012年7月4日 申请日期2012年2月28日 优先权日2012年2月28日
发明者盛司潼 申请人:盛司潼