Dna碱基序列的测序方法及用于该方法的样品调制方法

文档序号:449777阅读:1048来源:国知局
专利名称:Dna碱基序列的测序方法及用于该方法的样品调制方法
技术领域
本发明涉及利用由酶进行的DNA互补链合成的DNA分析方法、用于高效率的DNA碱基序列测序方法的样品的调制方法以及用于该方法的试剂盒。
随着对人基团组解析技术的进步,对高效率的DNA碱基序列的测序技术的要求提高了。使用放射性同位素标记DNA片段、通过凝胶电脉法测定DNA长度、再利用人工确定碱基序列的方法目前已被替代。将DNA用萤光物质标记,然后一边进行凝胶电泳一边进行光照,从而能够自动地光学检测DNA片段的测序仪(DNA Sequencers)已经得到普及。该装置使被称为引物(primer)的寡核苷酸与目的DNA进行杂交,制成用于使用酶的互补链合成来确定碱基序列的各种长度的DNA片段,利用凝胶电泳测定DNA片段的长度,然后再确定碱基序列的方法称为桑格(Sanger)(DNA测序)法或双脱氧(dideoxy)测序法。此处,能够一次确定碱基序列的长度,取决于利用凝胶的长度分离能力,为400-700碱基。比这更长的从数K个碱基至数十K个碱基的DNA碱基序列的测序要花费大量的时间和人力。
先前,在确定较长的DNA(数K-数十K碱基)的碱基序列时常用鸟枪(Shotgun)法。在鸟枪法中,利用超声波等将DNA样品随机地切断,将DNA片段克隆植入大肠菌等中培养,培养出菌落后,培养各菌落中的大肠菌,增加DNA的复制品。然后提取样品DAN进行解析。在该方法中,在取出的每个菌落中含有的DNA中含有片段化的样品DNA,但DNA片段究竟是样品DNA的哪个部分,这在确定碱基序列之前是不可能知道的,所以必须取相当于10-20倍的要确定DAN链长的DNA片段进行解析。因此要耗费大量的时间和人力,这成为很大的障碍。
确定DNA的碱基序列,是从制作DNA文库开始的,该文库收集有将含有基因的DNA形成的从10K碱基至100K碱基长度的克隆后全部的DNA。实际上在确定碱基序列时,将各克隆进一步切断,利用DNA测序仪制成可以用来分析的长度的亚克隆,然后进行碱基序列的测序。最后将已确定序列的DNA片段重组,得到原先的完全的DNA碱基序列。上述方法因为操作简单,所以得到广泛应用。
但是从目前的人基团组测序计划来看,作为大规模的碱基序列测序方法,从生产效率及自动化方面考虑未必是最佳方法(数理科学No.359、May、(1993)PP74-81)。特别是利用DNA测序仪测定时事先要制成亚克隆,这是非常麻烦的。先前,亚克隆是将巨大的DNA利用超声波随机切断而进行调制的(“Molecular Cloning”secondedition.Cold Spring Harbor Laboratory Press(1989)PP13.21-13.23)。将亚克隆插入大肠肝菌进行培养得到菌落,再将得到的菌落分离,分别得到片段化的目的DNA。然后用含有分离得到的DNA片段的质粒对每个菌落进行DNA碱基序列的测序。通常,1次碱基序列操作所能决定的DNA碱基长度为300个碱基到500个碱基,所以必须要解析大量的亚克隆。
另外,即使获得了菌落,因为含有相同DNA片段部分的菌落有很多,所以不得不重复地对同一DNA碱基序列部分进行测序,必须分析实际要确定的碱基序列部分的10倍至20倍的碱基长度。实际中,确定10K碱基长的DNA碱基序列时,必须要解析400以上的质粒(亚克隆),但为了不使碱基序列信息重复,不能选择亚克隆。另外,制备亚克隆要利用大肠菌的宿种、载体系统,所以操作复杂难以实现自动化。
在不必重复地确定同一碱基序列的碱基序列测序方法中,有引物行进(Primer walking)法(Science 258(1992)PP1787-1791、Proc.Natl.Acad.Sci.U.S.A.866917-6921(1989))。在引物行进法中,将巨大的DNA直接作为样品DNA使用。首先确定样品DNA的部分碱基序列。然后,以确定了的DNA碱基序列为基础,在确定了碱基序列的部分上合成进行特异地杂交的引物,确定余下部分的DNA碱基序列。即,从一端开始将要确定碱基序列的DNA片段的碱基序列按顺序确定的方法。在引物行进法中,可以将重复确定的碱基序列部分减少到最少,但在每次确定碱基序列时都必须要合成引物,非常麻烦。另外,碱基序列测定操作因为已经变成顺序的(Sequential),所以不只限于适合大规模测序。
为解决克隆法及引物行进法的生活繁杂性而试验了各种方法。特别有希望的是将样品DNA利用限制性内切酶形成DNA片段,然后从混合物的状态直接测定碱基序列的方法(DNA Research1(1994)PP231-237),以下说明该方法。为识别利用DNA限制性内切酶切断的各DNA片段,将具有已知碱基序列的寡核苷酸利用连接反应导入由DNA限制性内切酶形成的DNA片段的末端。然后使用可以辩别由限制性内切酶形成的切断部分及、与该切断部分连接的从1个碱基至4个碱基的未知碱基序列的引物组(Primer set),进行序列反应。引物组例如当未知碱基序列部分是2个碱基的情况下,由16种全部的碱基的碱基序列组合形成。2条链DNA片段为3种(作为DNA末端有6种)左右的情况下,可以直接使用上述引物组从混合物确定各DNA片段的碱基序列。确定各DNA片段的碱基序列之后,将各DNA片段的碱基序列重建,得到全体碱基序列。为得到全体碱基序列,合成与各DNA片段的3’末端附近的碱基序列相同的碱基序列的引物,将切断前的DNA作为模板进行碱基序列测序反应,确定DNA片段与DNA片段间的碱基序列,由此可以确定DNA片段间的结合。另外,确定由其他的限制性内切酶切断的DNA片段的碱基序列,以碱基序列的重列为线索,进而确定DNA片段的相互连接关系。
如上所述,长的DNA的碱基序列测序在以往是由需要花费大量的人力和时间的过程来进行。使用亚克隆的方法,因为可以同时进行多个DNA片段(亚克隆)的碱基序列测序,所以正被广泛应用,但必须重复读出同一碱基序列部分,如果碱基序列测序的规模变大,则存在要花费庞大的人力及时间的问题。另外,如果为提高效率而减少重复,则已确定碱基序列的各DNA片段的重建变得很困难,存在不能再组成原来的长的DNA碱基序列的问题。
在引物行进法中,因为常常是从确定了碱基序列的部分开始合成下一个引物而使用,所以具有确定了碱基序列部分的连接关系清楚的优点。但是碱基序列的测序基本上是必须从1条DNA链的一端开始,依次每次进行数百个碱基,因此其处理能力有限,而且已合成的引物并不能对已确定碱基序列的部分发挥良好的机能,全部碱基序列的测序变得很困难,这是目前存在的问题。在确定由限制性内切酶得到的DNA片段的碱基序列的方法中,因为要知道DNA片段间的连接,所以存在需要耗费巨大的人力的问题。
为解决上述问题,本发明的第1个目的在于提供一种碱基序列的测序方法,该方法,在确定样品DNA的碱基序列时,与确定作为目标的DNA片段的碱基序列的同时,可以确定与目标DNA邻接的样品DNA的碱基序列的至少一部分。
为完成第1个目的,本发明具有如下的构成。
本发明的第1构成(A)的碱基序列测序方法的特征在于包括以下各工序(A1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及(A2)在DNA片段的3’末端上导入具有特定的碱基序列的寡核苷酸(例如由单一的碱基种类组成的寡核苷酸)的工序及(A3)将导入了寡核苷酸的DNA的片段的1条链作为模板,使用由与寡核苷酸的碱基序列的至少一部分至补的第1碱基序列部分及与利用限制性内切酶识别的碱基序列互补的第2碱基序列部分及、从1个碱基至4个碱基的范围的碱基组合而形成的第3碱基序列部分组成的,并被标记(例如萤光标记)的标记引物,进行互补链合成延伸反应,得到具有与DNA片段的1条链互补的碱基序列的标记延伸引物的工序及(A4)使(a)将导入了寡核苷酸的DNA片段的1条链作为模板,使用标记引物进行序列反应的工序及、(B)将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板,使用标记的延伸引物进行序列反应的工序,分别或同时进行的工序及、(A5)将序列反应的生成物进行电泳,确定DNA片段的碱基序列及、与DNA片段的碱基序列邻接的样品DNA的至少一部分的碱基序列,确定比DNA片段更长的部分的样品DNA的碱基序列的工序,另外在工序(A3)、(A4)中使用耐热性聚合酶,改变条件将工序(A3)、(A4)分别重复数次,得到足够数量的标记的延伸引物及序列反应生成物。
本发明的第2构成(B)的碱基序列测序方法的特征在于具有以下各工序(B1)将样品DNA利用第1限制性内切酶切断得到DNA片段的工序及(B2)使用引物将DNA片段的1条链作为模板进行延伸反应之后,将3’末端与萤光标记的核苷酸置换的工序及、(B3)将(B2)生成的互补链利用与第1限制性内切酶不同的第2限制性内切酶切断,得到在3’末端上被萤光标记的萤光标记引物的工序及、(B4)使用萤光标记引物,将具有DNA片段的1条链的碱基序列和与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板,进行序列反应的工序及、(B5)将序列反应的生成物进行电泳,确定与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列,确定比DNA片段的长度更长的部分的样品DNA的碱基序列的工序。
本发明的第3构成(C)的碱基序列确定方法的特征在于包括以下各工序(C1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(C2)使用引物,将DNA片段的1条链作为模板进行互补链合成,得到具有与DNA片段的1条链互补的碱基序列的工序及、(C3)使用引物,将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板,进行在延伸链的末端上导入萤光标记的序列反应的工序及(C4)利用限制性内切酶切断序列反应的生成物的工序及、(C5)将利用限制性内切酶切断的序列反应的生成物进行电泳,确定与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列,再确定比DNA片段的长度更长的部分的样品DNA的碱基序列的工序。
本发明的第4构成(D)的碱基序列测序方法,共特征在于包括以下工序(D1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(D2)使用萤光标记引物,将DNA片段的1条链作为模板进行互补链合成,得到具有与DNA片段的1条链互补的碱基序列的引物的工序及、(D3)将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板;使用引物进行序列反应的工序及、(D4)将序列反应的生成物进行电泳,确定与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列,再确定DNA片段的长度更长的部分的样DNA的碱基序列的工序。
本发明的第5构成(E)的碱基序列测序方法的特征在于包括以下各工序(E1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(E2)使用在DNA片段上进行选择互补链结合被萤光标记的第1引物及、具有与DNA片段的1条链互补的碱基序列的被萤光标记的第2引物,将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分及样品DNA的1条链及DNA片段混合作为模板,进行序列反应的工序及、(E3)将序列反应的生成物进行电泳,确定DNA片段的碱基序列及、与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列,再确定比DNA片段的长度更长的部分的样品DNA的碱基序列的工序。
本发明的第6构成(F)的碱基序列确定方法的特征在于包括以下各工序(F1)将样DNA利用限制性内切酶切断得到DNA片段的工序及、
(F2)将DNA片段的1条链作为模板,使引物发生延伸反应,得到1条链DNA的工序及、(F3)使用1条链DNA,将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板,进行序列反应的工序及、(F4)将序列反应的生成物进行电泳,确定与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列,再确定比DNA片段的长度更长的部分的样品DNA的碱基序列的工序。
本发明的第6构成(G)的碱基序列确定方法的特征在于包括以下工序(G1)将具有与从样品DNA得到的DNA片段的1条链的碱基序列的一部分互补的碱基序列用在3’末端上具有的引物进行互补链合成延伸反应,得到具有与DNA片段的1条链的一部分互补的碱基序列的延伸引物的工序及、(G2)使(a)以DNA片段的1条链作为模板,使用引物进行序列反应的工序及、(b)将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板,使用延伸引物进行序列反应的工序,进行的工序及(G3)将序列反应的生成物进行电泳,确定DNA片段的碱基序列及与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列,再确定比DNA片段的长度更长的部分的样品DNA的碱基序列的工序。
另外,在以上的碱基序列测序方法中,可以利用限制性内切酶将样品DNA切断得到DNA片段,但并不限于这种方法,也可以利用超声波等将样品DNA随机切断得到DNA片段。另外也可以利用其他方法从样品DNA调制DNA片段。
本发明的碱基序列测序方法(将DNA片段的碱基序列利用延伸反应可以一个接一个地连接下去。以下将本发明的方法称为片段行进法(fragment walking method)),在以下进行更详细的说明,该方法是由以下各工序组成
(1)将样DNA利用限制性内切酶形成片段的工序、(2)利用限制性内切酶调查与被识别的切断部分相连接的末端部的从1个碱基到4个碱基的碱基种类及DNA片段的长度,确定用于序列反应的引物的工序、(3)将由限制性内切酶得到的DNA片段进行电泳,根据长度进行分级的工序、(4)在DNA片段的3’末端上导入已知的寡核苷酸的工序、(5)使用在3’末端上具有为辨别DNA片段的由从1个碱基至4个碱基形成的碱基序列的萤光标记引物,将被辨别的DNA片段作为模板进行互补链合成的工序、(6)将使用标记引物辨别的DNA片段作为模板进行序列反应的工序及、使用由工序(5)生成的互补链,将具有与被辨别的DNA片段相同的碱基序列及与其邻接的碱基序列的样DNA的一部分或样品DNA作为模板进行序列反应的工序,分别或同时进行的工序、(7)解析由工序(6)得到的序列反应的生成物,从得到的碱基序列获得被辨别的DNA片段的碱基序列及、与被辨别的DNA片段相邻接的碱基序列从而确定样DNA中各DNA片段的排列,再确定比被辨别的DNA片段的长度更长的样品DNA的碱基序列的工序。
在片段行进法中,可以将长的DNA碱基序列在短时间内高效率地测序。一般地,利用限制性由切酶切断DNA,生成很多的DNA片段,但可以从由限制性内切酶切断反应得到的DNA片段直接确定碱基序列,通过探索被确定的碱基序列的重复序列,可以不必经过克隆或亚克隆,就可以非常小的丰余序列(low redundancy)确定很长的DNA的全部的碱基序列。
在片段行进法中,使用预先调制的16种少数的引物文库,利用样品DNA的限制性内切酶切断反应进行DNA片段的选择性的序列反应。多个DNA片段并列地被确定碱基序列,被萤光标记的引物为导入序列反应的生成物而被延伸,与此同时生成与各DNA片段互补的被萤光标记的延伸引物。该被萤光标记的长的引伸引物,作为以未经受限制性内切酶切断反应的样品DNA作为模板的引物使用。在利用样品DNA的限制性内切酶切断反应的各DNA片段的选择性序列反应液中,添加未经受限制性内切酶切断反应的样品DNA作为模板,与各DNA片段的碱基序列一起,与该DNA片段相邻接的样品DNA的碱基序列,通过以样品DNA作为模板的被萤光标记的长的延伸引物的序列反应的生成物被确定。
由于可以与各DNA片段的碱基序列一起,确定超过限制性内切酶的切断部位的这种与该DNA片段相邻接的样品DNA的碱基序列,所以以被确定的这些碱基序列为基础,通过寻找重复的碱基序列,从1个DNA片段开始向与该DNA片段相邻接的DNA片段过渡,就可以确定样品DNA的全部的碱基序列。该方法中,可读取的DNA的长度不是DNA片段的长度,将未经受限制性内切酶切断反应的样品DNA作为模板,利用序列反应确定。因此,全体碱基序列可以以非常小的丰余序列的状态被确定。
另外,附加说明片段行进法,在片段行进法中,将要确定碱基序列的样品DNA利用4碱基识别酶等限制性内切酶完全切断,制成无重复的片段组。在生成的DNA片段中,如果除去经限制性内切酶识别而切断的这部分的碱基序列,则碱基序列未知。这些DNA片段尤其不具有带有已知碱基序列的引物进行杂交并成为互补链合成的起点的引发点(Priming Site)。因此在生成的DNA片段的3’末端侧上结合具有已知碱基序列的寡核苷酸而作为引发点。使引物与DNA片段杂交利用互补链合成制备DNA延伸链时,引物的3’末端的2个碱基(称为辨别序列)与DNA片段完全互补,进行紧密地杂交的时刻进行反应,但如果不是这样的时刻,则反应很慢或完全不进行,这是公知的。因此在萤光标记引物3’末端(互补链延伸侧)上连接任意的2个碱基(有16种碱基序列),从DNA片段中选择具有与萤光标记引物完全互补序列的特定的片段,进行互补链合成,可以确定碱基序列(DNA Research1/231-237(1994))。
在DNA片段组中含有的DNA片段的种类少,与1种引物完全互补的DNA片段为1个时,可以用上述引物分别确定各片段的碱基序列。1种引物与2个以上的DNA片段杂交时,预先进行长度分离等之后进行上述操作。这样在引物行进法中,可以将处于混合状态的DNA片段的碱基诹列,不必使用16种引物进行克隆等,就可以不重复地简单并列确定。确定DNA片段相互间的连接,并确定样品DNA全部的碱基序列时按如下方法进行。上述16种萤光标记引物,只与末端具有引发点的片段DNA进行杂交,与原来的未切断的样品DNA不杂交。但如果将与DNA片段杂交的上述引物进行互补链延伸,则延伸的部分与原来的样品DNA互补,与原来的样品DNA进行杂交。因此,在使用上述引物进行各DNA片段的碱基序列测序用的互补链合成反应时,在升降反应温度的循环序列条件下进行,一旦在反应液中加入未切断的样品DNA,除了DNA片段的碱基序列外,还可以确定与切断部连接的原来的样品DNA的碱基序列。在该方法中使用16种不同的引物,可以将各DNA片段及连接在其上的碱基序列并列确定,效率非常高。该方法因为好象是从一个DNA片段向下一个DNA片段通过连接碱基序到一步步地前进,所以称为片段行进法。
片段行进法是一种效率非常高的方法,作为引物必须准备3’末端的2个碱基全部组合的16种引物。萤光式DNA测序仪中现在有单色方式(以1种萤光体识别DNA片段的末端碱基种类,以不同的泳动路线使末端碱基种类不同的DNA片段泳动)及4色方式(对应于DNA片段的末端碱基种类以4种萤光体识别,用同一泳动路线使DNA片段泳动),但为了达到高生产效率,优选采用4色方式。但如果将上述片段行进法适用于4色方式,则最少必须准备16×4=64个萤光标记引物,这在片段行进法的实用方面是一个问题。
本发明的第2个目的在于,解决上述问题,提供一种为了能用市售的通用引物或手头有的少数引物就能很容易地实施片段行进法的DNA分析方法、DNA碱基序列测序方法中所用的样品调制方法及用于该方法的试剂盒。
为完成第2个目的,本发明具有如下构成。
本发明中,使用带有锚的辨别引物,该辨别引物是在3’末端上具有由2个碱基组成的辨别序列的引物上带有锚的带锚辨别引物(以下为了简便称为锚定引物),以PCR(Polymerase chain reaction)增加作为模板的DNA片段的拷贝数。锚部分的互补链在DNA片段的末端被导入,但使萤光标记引物与锚部分杂交进行碱基序列测序反应。锚定引物(共用16种)没有被萤光标记的必要,在碱基序列测序中使用的萤光标记引物上,使用通常的测序中所用的4种萤光体分别标记的通用引物。
16种锚定引物,与混合DNA片段中的特定DNA片段杂交,进行互补链延伸,用于增加特定的DNA片段的拷贝数。其结果,从DNA片段的混合物中,只增加了锚定引物完全杂交的DNA片段,可以实质上选出特定的DNA片段。在被选出的DNA片段上,导入萤光标记引物杂交的部分,可以进行序列反应。即,使用具有可以成为通常的聚合酶反应的引物的碱基序列的普通萤光标记引物,不用增加萤光标记引物的种类即可以很容易地进行片段行进法。
作为这样的萤光标记引物的例子有,在M13系列载体上使用的具有碱基序列(序列序号1)5’-TGTAAAACGAC GGCCAGT-3’的引物,用于T7系列载体的具有碱基序列(序列序号2)。
5’-GTAATACGACTCACTATAGGGC-3’的引物等,除了一般被称为普通引物的引物之外,还可以利用具有任意序列的萤光标记引物。当然还可以利用公知的萤光体作为萤光标记。
本发明的构成特征如下详细说明,本发明的构成(a)中涉及的样品调制方法的特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有寡核苷酸、及与利用限制性内切酶识别的序列实质上互补的序列和、在3’末端侧具有由1-4个碱基组成的选择序列、在5’末端侧具有至少8核苷酸(octamer)以上的锚序列的锚定引物,进行互补链合成得到DNA链的工序及、(4)使用具有至少与锚序列实质上相同的序列、不直接与样品DNA进行杂交的引物,由工序(3)得到的DNA链作为模板进行互补链合成的工序。
本发明的构成(b)中涉及的样品调制方法的特征在于包括以下的工序(1)将样品DNA切断生成多个长度的DNA片段的工序及(2)在DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有与寡核苷酸实质是互补的碱基序列和、在3’末端侧具有为辨别由1-4个碱基组成的DNA片段的序列、在5’末端侧具有至少8核苷酸以上的锚序列的锚定引物和、具有与锚序列实际上相同的碱基序列,在单独使用时与DNA片段不能稳定地进行杂交的引物,将DNA片段对每个末端的碱基序列进行区分,进行PCR放大的工序。
本发明的构成(c)中涉及的确定DNA链的碱基序列及与DNA链的碱基序列相邻接部分的样品DNA的碱基序列的碱基序列测序方法的特征在于包括以下工序(1)将样品DNA利用限制性切酶切断,生成多个长度的DNA片段的工序及、(2)在DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸工序及、(3)使用具有寡核苷酸、及与利用限制性内切酶识别的识别部序列实际上互补的序列和、在3’末端侧具有由1-4个碱基组成的辨别序列、在5’末端侧具有至少8核苷酸以上的锚序列、识别部序列的一部分碱基被取代、不能利用限制性内切酶切断的碱基序列部分的锚定引物和、被限制性内切酶切断的碱基序列的引物,利用PCR将特定的DNA片段放大的工序及、(4)切断被放大的特定的DNA片段的一个末端,得到DNA链的工序及、(5)使用具有至少与锚序列实际上相同的序列、不直接发与样品DNA杂交的萤光标记引物,将由工序(4)得到的DNA链作为模板进行互补链合成得到DNA片段的工序及、(6)使用萤光标记引物及互补链合成DNA片段,将由工序(4)得到的DNA链、样品DNA作为模板进行序列反应的工序,其特征还在于萤光标记引物具有至少与锚序列实质上相同的序列。
本发明的构成(d)中涉及的确定第1、第2个DNA链的碱基序列及与第1、第2DNA链的碱基序列相邻接的部分的样品DNA的碱基序列的碱基测序方法,其特征在于该方法包括以下各工序(1)将样品DNA利用第1限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在DNA片段的至少3’末端侧导入碱基序列是已知的、具有由第2限制性内切酶得到的识别部序列的寡核苷酸的工序及、(3)使用具有寡核苷酸、及与利用第1限制性内切酶识别的识别部序列实质上是互补的序列和、在3’末端侧具有由1-4个碱基组成的第1选择序列的、在5’末端侧具有至少8核苷酸以上的第1锚序列的、识别部序列的一部分碱基被置换、具有不能被第1限制性内切酶切断的碱基序列部分的第1描定引物及,具有寡核苷酸,及与利用第1限制性内切酶识别的识别部序列实质上互补的序列和、在3’末端具有由1-4个碱基形成的第2选择序列、在5’末端侧具有至少8核苷酸以上的第2锚序列、寡核苷酸的一部分碱基被置换的、具有不能被第2限制性内切酶切断的碱基序列部分的第2锚定引物,利用PCR将特定的DNA片段放大的工序及、(4)将被放大的特定的DNA片段的第1末端用第2限制性内切酶切断,得到第1DNA链,将被放大的特定的DNA片段的第2末端利用第1限制性内切酶切断,得到第1DNA链的工序及、(5)使用具有至少与第1锚序列实质上相同的序列的、不与样品DNA直接杂交的第1萤光标记引物及、具有至少与第2锚序列实质上相同的序列的、不与样品DNA上直接杂交的第2萤光标记引物,将由工序(4)得到的第1、第2DNA链作为模板进行互补链合成,得到第1、第2互补链合成DNA片段的工序及、(6)使用第1、第2萤光标记引物与第1、第2互补链合成DNA片段,将由工序4得到的第1、第2DNA链、样品DNA作为模板进行序列反应的工序;其特征还在于第1萤光标记引物具有与至少第1个锚序列实质相同的序列,第2个萤光标记引物具有与至少第2个锚序列实质相同的序列。
本发明的构成e涉及一种试剂盒,其特征在于由具有与连接反应用寡枋苷酸互补的碱基序列及、限制性内切酶识别的识别部序列及、与普通引物相同的序列、在3’末端侧具有由1-4个碱基组成的选择序列、可以选择DNA片段的末端的碱基序列的多个锚定引物组成,锚定引物的特征在于,选择DNA片段末端的2个碱基的序列的选择序列,含有由2个碱基形成的全部组合的碱基序列。
本发明的构成(f)涉及一种试剂盒,其特征在于,在至少由连接反应用寡核苷酸、互补链合成用引物组成的试剂盒中,互补链合成用引物包括由与寡核苷酸实质上互补的序列、限制性内切酶识别的识别部序列及、在该识别部序列的3’末端侧具有由2个碱基组成的选择序列的16种引物组成的第1引物组(primer set)和、在该第1引物组的各引物的5’末端侧导入锚序列,各引物的识别部序列的一部分的碱基被置换的16种引物组成的第2引物组。
本发明的构成(g)涉及一种试剂盒,其特征在于,在至少由连接反应用寡核苷酸、互补链合成引物组成的试剂盒中,互补链合成用引物包括具有寡核苷酸、及与利用第1限制性内切酶识别的识别部序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第1选择序列、在5’末端侧具有至少8核苷酸以上的第1锚序列;识别部序列的一部分碱基被取代、具有不能被第1限制性内切酶切断的碱基序列部分的第1锚定引物组和、由寡核苷酸、及与利用第1限制性内切酶识别的识别部序列实质上互补的序列和、在3’末端侧具有由1-4个碱基组成的第2选择序列、在5’末端侧具有至少8核苷酸以上的第2锚序列、寡核苷酸的一部分碱基被取代、具有不能被第2限制性内切酶切断的碱基序列部分的第2锚定引物组,其特征还在于第1、第2选择序列的碱基由2个碱基组成,包括由2个碱基组成的全部组合的碱基序列。
本发明的构成(h)涉及一种分析方法,其特征在于分析由构成(a)、(b)的样品调制方法调制的样品。
参照

图1简要说明本发明,为完成第1个目的,将DNA片段3作为模板,使用萤光标记引物31合成互补链,得到延伸DNA链32。将延伸DNA链作为引物,将样品DNA1作为模板,进行序列反应,得到DNA延伸链33。电泳分离延伸DNA链33,可以同时确定DNA片段的碱基序列及、与DNA片段邻接的样品DNA1的至少一部分的碱基序列。
根据本发明,在利用限制性内切酶切断样品DNA而获得的、DNA片段的混合物中添加含有作为确定切断前的样品DNA或碱基序列使用的目标DNA片段的3’末端侧的碱基序列的很长的DNA片段,在此状态下进行碱基序列测序反应,可以同时确定目标DNA片段与目标DNA片段的3’末端侧上邻接的DNA片段部分的碱基序列。根据本发明的方法,在确定利用限制性内切酶得到的各DNA片段的碱基序列的同时,可以同时确定与各DNA片段相邻接的DNA片段部分的碱基序列,可以确定各DNA片段间的碱基序列的连接。
因此,不必使用多个限制性内切酶确定各DNA片段的碱基序列的重叠序列,可以高效率地确定碱基序列。另外,不必使用亚克隆,全部只在试管内反应,就可以确定很长的样品DNA的碱基序列。另外,象引物行进一样,不必每次都在确定碱基序列时合成引物,即可确定各DNA片段的碱基序列,可以确定各DNA片段间的碱基序列的连接。即,不必重复解析由样品DNA得到的多个DNA片段的碱基序列,即可确定样品DNA的碱基序列。
参照图12简要说明本发明,为完成第2个目的,将样品DNA1利用N1aIII切断,在含有DNA片段组303的液体320中加入DNA寡核苷酸304,在限制性内切酶切断部位的3’末端上结合已知碱基序列的DNA寡核苷酸304,将含有寡核苷酸结合物的液体分别注入16只试管中,分别加入不同的引物(在3’末端、5’末端侧的锚序列上具有带有DNA片段的辨别功能的辨别序列),进行互补链合成,将生成物进行凝胶电泳。使用产物的凝胶电泳谱,确定将DNA片段PCR放大时所必需的PCR用辨别引物。将分别取至试管323中的液体分别置于PCR的组合数量(K)的容器中,在各容器中加入PCR用辨别引物,使用锚定引物、及引物组的引物的组合进行PCR放大,将得到的DNA片段利用透析等方法精制,作为利用片段行进法进行碱基序列测序用的模板。
使用引物组确定碱基序列的方法,因为由使用多色计测的系统准备的引物数量很多,非常麻烦,但本发明的锚定引物具有DNA片段辨别功能,因此使用少量的已经存在的引物即可简单地确定很长的样品DNA的碱基序列。另外,利用在DNA链的两端具有可利用限制性内切酶切断的不同的切断部分的引物进行PCR,可以高效率地从2条链的2端同时开始确定碱基序列。
附图简单说明图1为表示本发明实施例1的处理顺序的流程图。
图2为在本发明实施例1中,使用萤光标记引物,将利用pUC19的HhaI切断的DNA片段作为模板的延伸反应生成物的电泳图、图3为在本发明的实施例1中,利用pUC19的PCR生成物的限制性内切酶HhaI的切断生成物的琼酯凝胶电泳分离的级分的电泳图、图4为在本发明的实施例1中,使用萤光标记引物,将级分4的DNA片段作为模板的延伸反应生成物的电泳图、图5A、5B、5C、5D、5E为本发明的实施例1中,由级分1得到的碱基序列测序反应生成物的电泳图、图6A、6B、6C、6D、6E为本发明的实施例1中,由级分4得到的碱基序列测序反应生成物的电泳图、图7为本发明的实施例1中pUC19的碱基序列测序说明图、图8为本发明的实施例2中,使用萤光标记引物,将利用λ-DNA的HhaI切断得到的DNA片段作为模板的延伸反应生成物的电泳图、图9为表示本发明的实施例4的处理顺序的流程图、图10为表示本发明的实施例5的处理顺序的流程图、图11为本发明的实施例5中进行分离与碱基序列测序的一系列操作的系统构成例示图、图12为说明使用本发明的样品调制方法的DNA解析流程图、图13表示将DNA寡核苷酸连接结合的DNA片段;图14A为与结合DNA寡核苷酸后的DNA链(1条链)的末端进行杂交的锚定引物组的概念图、图14B为与结合DNA寡核苷酸后的DNA链(1条链)的末端进行杂交的引物组的概念图、图15为使用16种选择引物得到的DNA片段的互补链合成的产物的凝胶电泳谱的例示图、图16表示被检测出来的DNA片段的结构例、图17为利用使用锚定引物的互补链合成(PCR放大)得到的产物的一例的表示图、图18为具有选择序列的锚定引物、标记引物与DNA片段的关系图、图19为使用具有选择序列的锚定引物,辨别DNA片段,进行PCR之前预先用少量的DNA片段确定引物对的方法的说明图。
以下参照附图详细说明实施例。
实施例1图1是表示本发明实施例1的处理顺序的流程图。实施例1是连续地进行上述工序(5)和工序(6),同时确定被选择的DNA片段的碱基序列和,与该被选择的DNA片段的碱基序列接续在一起的样品DNA的碱基序列。也可以同时进行工序(5)和工序(6)。采用pUC19作为样品。
(样品DNA的放大)样品DNA少时,按以下顺序采用PCR将样品DNA1放大。首先,为了将环状的pUC19做成直链状,将10pmol的pUC19以100单元的Pst1于37℃用1小时切断。按普通方法进行乙醇沉淀,获得直链状的pUC19。然后,使用1mM的ATP和12个单元的末端脱氧核苷酸转移酶,在切断的pUC19两头的3′末端上导入PolyA序列后,作为PCR用的引物进行杂交。
作为引物,使用具有碱基序列为TTTTTTTTTTT TTTGCAGGC(序列号3),以及,TTTTTTTTT TTTTTGCAGGT(序列号4)的二种引物。使用96pmol的二种各引物和,5fmol的导入PolyA的pUC19的Pst1切断物和,各30nmol的dATP、dCTP、dGTP、dTTP和,15个单元的TaqDNA聚合酶,进行PCR。各反应液量规定为4800μl。各反应液分成96等分后进行热循环反应。热循环反应,经过94℃时30秒,47℃时30秒,72℃时5分钟的循环,进行2次后,再将94℃时30秒,55℃时30秒,72℃时5分钟的循环进行35次。
为了除去未反应的引物和dATP、dCTP、dGTP、dTTP,用0.7%的琼脂糖凝胶电泳进行分离分取,作为电泳时由2.7K碱基长之一的条带所组成的高纯度PCR产物,得到约15pmol的链状pUC19。以下,将该链状pUC19称为PCR产物,作为样品DNA1。
(样品DNA的片段化)采用限制性内切酶制作将pUC19PCR产物切断的DNA片段。在本实施例中,使用Hhal作为限制性内切酶,但切断样品DNA1(pUC19PCR产物)的限制性内切酶并不仅限于酶Hhal。图1中,12,13,14表示由样品DNA的限制性内切酶产生的片段部分。在Tris-HCl(10mM,pH7.5)、MgCl2(10mM)、NaCl(50mM)、二硫苏糖醇(1mM)的溶液中,使84单元的Hhal与5.5pmol的pUC19PCR产物反应。该反应于37℃进行1小时。反应后,使用反应液的一部分,按照后述的在DNA片段的3′末端上导入寡核苷酸的方法,在DNA片段的3′末端上引入已知的碱基序列。
然后,用16种引物(序列号5)进行延伸反应。用16种引物的每一种通过电泳对延伸反应产物进行分析。图2示出分析结果。在图2,图4中,39表示碱基长度,38表示引物的泳动峰值,37表示由于引物延伸而产生的DNA片段的电泳图形,40表示引物具有的2个碱基序列。基于图2的结果,通过电泳分离,分取各引物的延伸产物,尽量成为1类。
关于分取,将Hhal切断反应液立即通过2%琼脂糖凝胶电泳进行分离,获得第1至第4的四个级分。如图3所示,从第1至第4的四个级分分别得到具有第1至第4的四种分离条带的电泳图形91,92、93、94。DNA尺寸标识器90的各条带,从下至上排列为100个碱基长,200个碱基长、300个碱基长、…、和100个碱基长。
(在DNA片段的3′末端上导入寡核苷酸)在DNA片段的3′末端上导入具有已知碱基序列的寡核苷酸的方法有2种。第1种方法是通过连接反应在DNA片段上导入具有已知碱基序列的寡核苷酸的方法,仅在DNA片段的3′末端上导入寡核苷酸。连接反应用的2条链寡核苷酸中,将与DNA片段的5′末端相接侧的连接反应用的2条链寡核苷酸的3′末端做成二脱氧核苷酸的形态。或者,预先除去DNA片段的5′磷酸。这是因为,如果在DNA片段的5′末端侧导入多余寡核苷酸,则会在工序(5)中生成的DNA互补链中进入原来DNA链中所没有的碱基序列,工序(6)未启动的缘固。第2种方法是使用末端脱氧核苷酸转移酶(以下称为末端转移酶),在DNA片段的3′末端上顺次导入dATP(2′-脱氧腺苷5′-三磷酸盐)或dTTP(2′-脱氧胸苷5′-三磷酸盐)的方法。第2种方法比第1种方法更简单,效率也高,因此在本实施例中采用第2种方法。
为了确保荧光标记引物可以杂交的部位,在各DNA片段的3′末端上导入PolyA序列。导入PolyA序列时,采用末端脱氧核苷酸转移酶。反应条件如下所示。在约4pmol的各级分中,添加dATP(1mM),CoCl2(5mM),MgCl2(5mM)、巯基乙醇(0.5mM)、二甲胂酸钠(50mM、PH7.2),使12.5单元的末端脱氧核苷酸转移酶于37℃反应1小时。
(选择性互补链合成)如图1所示,制得的DNA片段2、3,具有在3’末端侧导入的PolyA部分21,限制性内切酶识别部分23,以及被选择的碱基序列部分22。被选择的碱基序列部分22是通过荧光标记引物31选择的2个碱基部分。
由样品通过限制性内切酶获得的DNA片段,是许多种类DNA片段的混合物。为了只选择性地确定作为目的DNA片段3的碱基序列,使用荧光标记引物31。荧光标记引物31的任意碱基序列部分201,是由任意2种碱基组合而成,全部为16种。荧光标记引物31的PolyT部分203和DNA片段3的PolyA部分21,以及荧光标记引物31的限制性内切酶识别部分202和DNA片段3的限制性内切酶识别部分23,各自可以完全杂交。
像完全杂交体51那样,荧光标记引物31的任意碱基序列部分201,可以仅仅与具有与任意碱基序列部分201互补的碱基序列22的DNA片段3杂交。然而,不完全杂交体52中,任意的碱基序列部分201和DNA片段2,其末端部分不杂交,因此使16种荧光标记引物与DNA片段反应,就可以挑选出目的DNA片段。
实际上按以下方法,预先仅选择出可以在碱基序列确定时利用的荧光标记引物,然后再进行碱基序列确定反应。首先,在含有约200fmol的DNA片段的DNA混合物的各级分中,添加含有dATP(0.1mM)、dCTP(16mM)、dGTP(0.1mM)、dTTP(0.1mM)的混合溶液(16μl)、MgCl2(75mM)的Tris-HCl(250mM、PH9.5)缓冲液(8μl)、,总量为48μl,按每个容器3μl分装在16个容器中。各容器中添加各荧光标记引物(0.001mM,0.5μl)和2单元/μl的耐热性DNA聚合酶(0.5μl)。使用的耐热性DNA聚合酶,是比通常广泛使用的Taq聚合酶,在延伸特性和基质特异性方面更为改善的ΔTaqTM或ThermoSequenaseTM(任何一种都是Amersham International公司的制品)更为有效。其理由是,作为普通的Taq聚合酶,特定的碱基序列部分中延伸反应停止的情况经常产生。将94℃时保持30秒→66℃时保持30秒→72℃时保持60秒的热循环反复进行5次,用电泳分析反应产物。
图2中示出分取前的分析结果,图4中示出分取后的级分4(给出图3电泳图94的级分)的分析(电泳)结果。示出具有使用的引物的任意碱基序列部分201的2个碱基序列40的各电泳图。
在具有图4示出的、由具有2个碱基序列XY(XY表示任意2个碱基的组合)的引物选择出的DNA片段的电泳图中,除引物的电泳峰值38以外,在全部不出现峰值的情况下,表示不存在与引物反应的DNA片段。图4中,由具有2个碱基序列AA的引物选择的DNA片段的电泳图中,仅检出1条泳动峰值,表示引物仅与1种的DNA片段进行杂交,如下说明的碱基序列确定成为可能。
图2及图4中,出现2个以上泳动峰值的电泳图(例如,具有由图4示出的2个碱基序列GG的引物选择的DAN片段的电泳图)示出,使用的荧光标记引物与多个DNA片段进行杂交。具有由图4示出的2个碱基序列GG的引物选择的DNA片段的电泳图示出,具有GG作为任意碱基序列部分201的萤光标记引物,相对于2种DNA片段起着荧光标记引物的作用,仅仅对1种具有特定碱基序列的NDA片段进行碱基序列确定时,不能使用具有GG作为任意碱基序列部分201的荧光标记引物。
然而,在图4中,由具有2个碱基序列GG的引物选择的DNA片段电泳图中2个接近的泳动峰值中的左侧的泳动峰值和,由具有2个碱基序列CA的引物选择的DNA片段的电泳图的泳动峰值,在相等长度的碱基上具有峰值,由具有2个碱基序列GG的引物选择的DNA片段电泳图中2个接近的泳动峰值中的右侧的泳动峰值和,由具有2个碱基序列AA的引物选择的DNA片段电泳图的泳动峰值,在相等长度的碱基上具有泳动峰值,给予相同长度碱基(泳动时间)的DNA片段具有2条链的里外(+链,-链)的关系,因此,使用与DNA片段的限制性内切酶识别部分相邻接的、具有2个碱基序列CA和GG、或2个碱基序列AA和GG的引物,通过PCR,可以分离出由具有2个碱基序列GG的引物选择的2种DNA片段。
以上说明中,是以使用具有由2个碱基XY(XY表示任意2个碱基的组合)组成的任意碱基序列的引物分离DNA片段的情况作为例子进行说明,但也可以是使用具有由3个碱基XYZ(XYZ表示任意3个碱基的组合),或4个碱基WXYZ(WXYZ表示任意4个碱基的组合)组成的任意碱基序列的引物分离DNA片段。如上所述,可以很容易地预先挑选出确定碱基序列时所用的荧光标记引物。
(互补链合成,以及碱基序列确定)然后,使用选择过的荧光标记引物进行碱基序列确定。此处,示出将表示图3中示出的电泳图91(级分1)和94(级分4)的级分用作DNA片段的例子。由分取后的级分的分析(电泳)结果,可以判明级分1,以及级分4中,任意碱基序列部分201是AA的荧光标记引物与1种DNA片段进行杂交,因此以下任意的碱基序列部分201使用AA的荧光标记引物31,进行荧光引物31杂交的DNA片段的碱基序列确定。
为了同时读取与DNA片段3相邻接的部分14的碱基序列,添加不能用Hhal切断的PCR产物(样品DNA1)后,进行碱基序列确定反应(序列反应)。荧光标记引物31,与导入了PolyA的DNA片段3完全杂交,但不与样品DNA1进行杂交。将DNA片段3作为模板而互补链合成的延伸DNA链32,与样品DNA1进行杂交,通过序列反应形成DNA延伸链33。在DNA碱基序列确定中,如果碱基长度变长,则DNA片段数减少,因此信号强度减弱。
为了能使来自由延伸DNA链32延伸而得到的DNA延伸链33的信号强度达到足够的强度,预先仅用dNTP(dATP、dCTP、dGTP、和dTTP的混合物),延伸荧光引物31至DNA片段3的5′末端,大量制成延伸DNA链32之后,使用延伸DNA链32将样品DNA1作为模板进行序列反应,可以有效地获得DNA延伸链33。也就是,大量制作对未切断的样品DNA起着引物作用的延伸DNA链32后,添加二脱氧核苷酸进行碱基序列确定反应。以下示出反应的详细情况。在包含约100fmol的各DNA片段的级分1,或级分4中,分别添加荧光标记引物31(1pmol/μl)为2μl、dNTP为4μl,含75mM MgCL2的Tris-HCl(250mM、pH9.5)缓冲液为2μl,总量为14μl,然后按每个容器为3.5μl,分别注入到4个容器中,在分注的4个容器中按每个容器2单元/μl添加Taq DNA聚合酶(ΔTaq聚合酶(アマッャム公司)0.5μl)。将94℃时保持30秒→64℃时保持30秒→72℃时保持60秒的热循环反复5次,大量制成荧光引物31延伸至DNA片段3的5′末端的延伸DNA链32。
然后,在含有大量这种延伸DNA片段32的反应液中,分别添加12.5fmol的PCR产物(样品DNA1)、二脱氧核苷酸(ddNTP),以及脱氧核苷酸的混合液(4.5μl)。二脱氧核苷酸和脱氧核苷酸的组成如下作为A反应用,dNTP为0.020mM,ddATP为1.0mM;作为C反应用,dNTP为0.020mM,ddCTP为0.50mM;作为G反应用,dNTP为0.020mM,ddGTP为0.10mM;作为T反应用,dNTP为0.020mM,ddTTP为1.0mM;对混合液反复进行30次94℃时保持30秒→64℃时保持30秒→72℃时保持60秒的热循环。进行乙醇沉淀以回收反应产物,用荧光式DNA测序仪电泳分离反应产物后进行碱基序列确定。
获得清楚的电泳图,图5A~图5E,图6A~图6E中分别示出来自级分1、级分4的混合DNA样品的电泳结果。图5A、图6A分别示出荧光引物31延伸后3′末端碱基以A作为末端的A片段组,
图5B、图6B分别示出以C为末端的C片段组,图5C、图6C分别示出以G为末端的G片段组,图5D、图6D分别示出T为末端的T片段组,图5E、图6E是分别重复A、C、G、T各DNA片段组电泳图的图。电泳图41、42、43各自根据通过将DNA片段3作为模板的测序反应生成的DNA片段(图1中示出的DNA延伸链34),荧光引物31延伸至DNA片段3的5′末端后反应停止而生成的DNA片段(图中示出的延伸DNA链32),延伸DNA链32(图1)结合在DNA上后进一步延伸的DNA延伸链33。
按照以前的碱基序列测序方法,只可能得到电泳图41,42,但按本实施例,则可以在确定DNA片段3的碱基序列的同时,确定与DNA片段3相接续的样品DNA的碱基序列。本实施例中,假定长的样品DNA被4碱基识别限制性酶完全切断,但即使是不能安全被4碱基识别限制性酶切断的情况下,如果长的样品DNA分子的总数中,例如20%~30%可以被4碱基识别限制性酶完全切断,就可以没有任何问题地确定碱基序列,进而,超过了通过限制性内切酶理想切断的部分,也可以确定由限制性内切酶切断的相邻的DNA片段的至少一部分碱基序列。
本实施例中,从通过限制性内切酶将样品DNA1切断的DNA片段中,荧光标记引物31的3′末端侧的任意碱基序列部分201和,与限制性内切酶识别部分23相邻接并被选择的碱基序列部分22处于互补关系的DNA片段,可以通过荧光标记引物31进行选择,并可以选择性地进行测序反应。互补链形成时的引物的退火温度(anealing temperature)设定在60℃以上,优选在62℃~68℃的范围内,可以进一步提高选择性。
互补链合成,是从荧光标记引物31进行杂交的DNA片段3的3′末端向5′末端方向进行。通常的DNA碱基序列测序反应时,由于作为A、C、G或T中任何一种特定的碱基种类而添加二脱氧核苷酸,在导入二脱氧核苷酸的部位停止延伸反应。延伸DNA链32,是到达DNA片段3的5′末端的DNA链。不添加二脱氧核苷酸的情况下,延伸DNA链32到达DNA片段3的5′末端。以样品DNA1作为模板,以DNA片段延伸DNA链32作为引物的测序反应,也达到超过限制性内切酶识别部位的DNA链部分14,因此也可以确定DNA链部分14的碱基序列。一旦,要使由互补链合成而生成的延伸DNA链32,起着样品DNA1的引物的作用,则必须通过热变性从模板DNA片段3脱离并成为1条链,而这种脱离是通过热循环测序进行。相对于模板DNA(DNA片段3,及样品DNA1)的引物(荧光引物31,及延伸DNA链32)的杂交(例如,64℃时30秒),互补链延伸反应(例如,72℃时60秒),通过热变性使延伸的引物脱离模板DNA的各工序组成的循环测序,例如反复进行30次。通过这种循环测序,可同时获得以DNA片段3作为模板延伸至DNA片段3途中的DNA片段34和,以样品DNA1作为模板而延伸DNA链32延伸的DNA延伸链33。其结果是,可以确定DNA片段3的碱基序列和与DNA片段3的3′末端相邻接的部位的样品DNA的碱基序列的至少一部分。至于其它的DNA片段,也同样可以确定各DNA片段的碱基序列和与DNA片段的3′末端相邻部位的样品DNA的碱基序列的至少一部分。
利用限制性内切酶得到的各DNA片段的碱基序列和,与各DNA片段的3′末端邻接的样品DNA的碱基序列部位,与其它的DNA片段的5′末端附近的碱基序列重叠,因此可以很容易地将各DNA片段的碱基序列连接起来。而且,由于很明显地观测到由直至DNA片段3末端的互补链合成反应而产生的引物延伸体32的电泳峰值,因此能很容易地判别限制性内切酶在样品DNA中的切割部位。实际上,利用本实施例方法确定碱基序列来决定由pUC19的Hhal切断的DNA片段有几个,调查各DNA片段的碱基序列的联系,pUC19的整个长度的碱基序列不经过克隆化就可确定。
图7说明了实施例1中,pUC19(碱基全长2.7Kbp)的碱基序列的确定。图7中,↓表示由限制性内切酶Hhal切断的部位,←→附近表示的数值(例如,270,393等)表示由限制性内切酶切断的部位之间的长度(碱基数),模轴表示碱基长度,-→及←-分别表示本实施例中的碱基序列确定部位,与→及←平行所表示的-,表示与由作为碱基序列确定对象的Hhal切断的DNA片段相邻接的碱基序列部位(提供各DNA片段的碱基序列联系信息的碱基序列部分)。进而,图7中,碱基序列确定部位770,是由图6中示出的电泳图决定的部位,是由DNA片段770-1的碱基序列部分和,与DNA片段770-1相邻接的DNA片段的一部分的碱基序列部分770-2组成。如图7所示,通过有效利用提供各DNA片段的碱基序列的联系信息的碱基序列部分-的信息,就可以确定碱基全长为2.7Kbp的pUC19的全碱基序列。
实施例2本实施例中,经过克隆化获得长的样品DNA的情况下,通过使用克隆时所用的限制性内切酶切断样品DNA而得到的长DNA片段,作为样品DNA1。就λDNA中应用的例子说明本发明的方法。为了确定碱基序列,预先使用16种(为了选择DNA片段的任意碱基序列部位为2个碱基的情况下)引物,进行互补链合成,正确判断多长的DNA片段以什么种类存在,进行哪种DNA片段的分取为好是成功的关键。
图8中示出,将λDNA(47.7K碱基长),用HhaI切断的DNA片段作为模板,用荧光标记引物进行延伸反应而得到的反应物的电泳图。如图所示,按反应物的原有状态,DNA片段数过多,DNA片段的分取困难。像λDNA这样巨大的样品DNA,预先,例如经过6碱基识别限制性酶切断后,通过电泳分离出由限制性内切酶切断的DNA片段后,进行分取,将分取过的各DNA片段进一步用4碱基识别限制性酶切断,与实施例1中的pUC19情况相同,可以决定碱基序列。例如,使用PstI作为6碱基识别限制性酶,使用HhaI作为4碱基识别限制性酶。
实施例3通常,在许多研究室中,经过克隆化得到的长DNA以DNA文库的形式保存着。而且,进行碱基序列确定的DNA领域的克隆常常是已经结束。按照本发明,即使是在克隆已经结束的情况下,不经亚克隆就能高效地确定碱基序列。例如,作为模板,将pUC19用限制性内切酶Pst1切断的直链状DNA规定为样品DNA1。本实施例,从使用由Pst1切断的直链状pUC19作为样品DNA1这一点来看,与实施例1不同。以下,采用与图1中所用符号相同的符号进行说明。用100单元的Pst1,于37℃花费1小时,切断10pmol的pUC19。按照通常方法,进行乙醇沉淀。Pst1在1个地方切断pUC19,因此可获得呈直线状的pUC19。
以下,按与实施例1同样的方法确定碱基序列。将呈直线状的pUC19,用限制性内切酶Hhal切断后制备DNA片段,通过琼脂糖凝胶电泳,分成3种级分,从16种荧光标记引物中,挑选出测序反应中使用的荧光引物31。使用荧光引物31,通过延伸反应获得延伸DNA链32。然后,将pUC19作为模板,将延伸DNA链32延伸后获得DNA延伸链,按与实施例1同样方法确定碱基序列。其结果,可以确定特定的DNA片段3的碱基序列和,与DNA片段3的3′末端相邻接而连结起来的样品DNA1(pUC19)的碱基序列。
实施例4DNA片段的长度如果从400个碱基到500个碱基以上,就很难得到足够数量的DNA片段,在凝胶电泳中,除了来自DNA片段的信号强度变弱外,还有DNA链长的分离能降低的问题。以下用图9说明解决该问题的方法。
由第1限制性内切酶切断样品DNA 500后获得的DNA片段501的3′末端上,按与实施例1同样的方法导入PolyA。将DNA片段501作为模板,采用在限制性内切酶识别部分、以及在与限制性内切酶识别部分相连的未知碱基序列部分上进行杂交的荧光标记引物502(称为第1引物),进行序列反应,通过荧光式DNA测序仪,将合成的各种长度的DNA片段550进行电泳分离,从而确定DNA片段501的碱基序列。然后准备用生物素标记第1引物的生物素化引物504。
以导入了PolyA的片段501作为模板进行互补链合成,获得互补链合成DNA片段530。在保持有抗生物素蛋白的玻珠(beads)510中进行捕集反应后,从反应液中取出互补链合成DNA片段530。然后,通过具有荧光标记dNTP511及3′核酸外切酶活性的酶DNA聚合酶,分解互补链合成DNA片段530的3′末端(3′→5′核酸外切酶反应),并添加新的荧光标记dNTP511,获得在3′末端上具有荧光标记的荧光标记DNA512(3′末端识别反应)。
此处,以在先确定碱基序列的DNA片段501的碱基序列为基础,决定切断DNA片段501的3′末端附近的2条链DNA的第2限制性内切酶。通过第2限制性内切酶切断荧光标记DNA链512,获得成为短荧光标记引物的第2引物513。以样品DNA500为模板,通过序列反应503,延伸第2引物513后,按实施例1同样的方法,确定碱基序列。不用说,也可以将样品DNA500作为模板通过序列反应,延伸在3′末端具有荧光标记的荧光标记DNA链512后,再通过第2限制性内切酶切割第2引物513的延伸体。第2引物513,是与样品DNA500的一部分互补的。由序列反应生成的第2引物513的延伸体,只有通过第2限制性内切酶识别的部分变短,序列反应的产物直到更长的DNA片段长度,可以用荧光式DNA测序仪以高的灵敏度检测出来,可以更正确地确定碱基序列。
实施例5使用第2限制性内切酶,与在实施例4中为了生成DNA片段所用的第1限制性内切酶不同,用这种第2限制性内切酶,切断荧光标记DNA链512,但在本实施例中,将使用荧光标记终止剂延伸的DNA链,通过用于制作DNA片段的限制性内切酶切断后,确定与DNA片段相邻接的碱基序列。图10示出本实施例的处理程序。
例如,用限制性内切酶Hhal切断样品DNA700,得到DNA片段701,702,703,704。然后,使用在3′末端上具有辨别碱基序列的第1引物710,制作目的DNA片段702的互补链。第1引物710的5′侧预先用生物素711标记。使用表面上固定有抗生物素蛋白的抗生物素蛋白固定玻珠712,引出互补链延伸的第1引物750,除去作为模板的DNA片段702后,将第1引物710延伸的1条链,用作序列反应的引物(称为第2引物750)。
也可以不用抗生物素蛋白固定玻珠712,改用磁性玻珠来引出第2引物。将第2引物和样品DNA700混合,添加序列反应液进行序列反应,获得在3′末端上具有荧光标记的DNA片段720。然后,用限制性内切酶Hhal切断,除去第2引物750,得到DNA片段721后,通过荧光式DNA测序仪对DNA片段721进行电泳,从而确定碱基序列。按照本实施例,可以确定第1引物710杂交的DNA片段702的3′末端上邻接的样品DNA700的碱基序列(即,可确定DNA片段703碱基序列)。
实施例6
如实施例2所示,由数十K碱基组成的长的样品DNA的碱基序列的确定,首先是用6碱基识别限制性酶切断样品DNA,然后通过电泳分离,分取后,将分取过的各DNA片段再用4碱基识别限制性酶切断,采用上述各实施例中说明的方法,就可以确定全部的碱基序列。上述的分离和碱基序列确定,可在计算机的控制下自动进行,进行上述分离和碱基序列确定的整个系统,由分离装置,进行序列反应的装置(自动装置),像毛细管组电泳装置之类的高效率的DNA测序仪构成,不需要特别熟练就可操作。
图11中示出进行分离和碱基序列确定的一系列操作的系统构成例。图11示出的系统,由酶反应装置900,片段分析装置901,分取用电泳装置902、DNA测序仪903,在这些装置之间,具有为了运送反应产物的多个吸移管904,为了使吸移管904移动的XYZ级装置905,以及在预先设定的程序下控制各装置运行的计算机906构成。
酶反应装置900,由保持16种引物组的具有至少16个级分的引物组保持部910,保持酶、缓冲液等反应试剂的反应试剂保持部911,用限制性内切酶进行样品DNA切断反应的酶切断反应部912,回收酶切断反应部中反应产物的DNA回收部913,具有进行延伸反应的至少16个级分的延伸反应部914,进行序列反应的序列反应部918,吸移管洗涤部915,保持样品DNA的样品保持部917构成。构成酶反应装置900的各部,在计算机906控制之下独立地通过温度控制装置(图中未示出)进行控制,在各部之间,包括样品液,反应试剂,反应产物的各种料液的运送,通过吸移管904进行,吸移管904位置的移动控制是通过XYZ级装置905进行,将料液吸到吸移管,或排出吸移管的控制,与移动控制一起,通过来自计算机906的控制信号进行。
由样品保持部917通过吸移管将样品DNA取到酶切断反应部912中,由反应试剂保持部911将限制性内切酶等分液后加到酶切断反应部912中,于37℃保持1小时进行反应。反应结束后,由吸移管将反应液移至DNA回收部913,回收由限制性内切酶切断的DNA。DNA回收部913,由硅珠膜和泵组成;DNA的回收,首先在硅珠膜上补充DNA,进行洗涤后用水进行洗提。将回收的被切断的DNA的一部分分成16份,在延伸反应部914通过16种引物组进行延伸反应。反应产物通过吸移管添加到片段分析装置901中,反应过的引物和其片段长经过测定,其测定结果由计算机906分析,各引物按照可用于1种片段延伸那样来决定DNA片段混合物的分取范围。将残存在DNA回收部913中的DNA片段混合物,添加到分取用电泳装置902中后,将DNA片段混合物分注成2-5个级分。
将各级分运送至序列反应部918进行序列反应。序列反应中所需要的试剂由反应试剂保持部911通过吸移管供入序列反应部。由序列反应部918获得的序列反应产物,运送至DNA测序仪903后进行电泳,得到碱基序列确定所需要的电泳分析结果。根据有关各级分的电泳分析结果,确定样品DNA的碱基序列。样品DNA的碱基序列确定,通过计算机906,或单独具有DNA测序仪903的计算机进行。计算机906具有表示装置916,表示各种控制的进行状况、碱基序列的信息资料。
实施例7图12示出采用本发明样品制备方法的DNA分析流程。将含有待分析样品DNA301(具有数Kb~10Kb的长度)的溶液分成2份,各自分取到第1个管子302-1和第2个管子302-2中。将第1个管子302-1中包含的样品DNA用限制性内切酶N1aIII切断,得到DNA片段组。NIaIII识别碱基序列-CATG-,生成在3′末端上具有-CATG(3′)的碱基序列的DNA片段。使用的限制性内切酶,除Sau3Al、HhaI、MaeI外其它任何限制性内切酶都行,但以切断部位高频率出现的4碱基识别限制性酶为佳。在含有DNA片段组303的溶液320中添加寡核苷酸304,至少在限制性内切酶切断部的3′末端上结合具有已知碱基序列的寡核苷酸304。结合寡核苷酸的方法中,有采用通过末端脱氧核苷酸转移酶的PolyA链附加和连接的方法,但此处以采用连接的例子进行说明。含有连接反应产物的溶液321,2等分后预先分取到管子322和323中。
图13示出连接结合了寡核苷酸304的DNA片段。在图13中,N及n是构成待决定碱基序列的DNA片段的核苷酸(是A、T、G、C的任何一种),由N1aIII识别的识别序列305是-CATG-3′。结合了DNA寡核苷酸304后的DNA链的3′末端侧,按照不进行互补链合成那样用二脱氧核苷酸取代后使得互补链不会延伸超过它。当然,在寡核苷酸阶段,用氨基或生物素等的残基修饰3′-OH,预先阻碍3′延伸的形式是优选的。结合了DNA寡核苷酸304之后的DNA链的3′末端侧,不使其进行互补链合成,这是因为,通过使用锚定引物进行互补链合成,锚定引物的3′末端(具有为进行DNA片段辨别的碱基序列的部分)与DNA片段完全不互补的情况下,不能产生与锚定部分互补的链。锚定引物的3′末端与DNA片段完全匹配的链中,锚定引物的一部分与反对侧的末端(合成链的3′末端)进行杂交,进而延伸,合成出将与锚定部分互补的碱基序列保持在3′末端上的DNA片段。
图14A示出与结合了DNA寡核苷酸304后的DNA链(1条链)的末端进行杂交的锚定引物组(锚定引物组①)的概念图;图14B示出与结合了DNA寡核苷酸304后的DNA链(1条链)的末端进行杂交的引物组②的概念图。准备在DNA片段上具有与导入的DNA寡核苷酸304互补的部分315及、在其5′末端侧的锚定序列311,并具有3′末端侧的用XX表示的2个碱基(以1~4个碱基为好)组成的辨别序列312的16种(相应于1~4个碱基为4~256种)锚定引物组306。辨别序列312是用于从DNA片段的混合物中选择出特定DNA片段的碱基序列。该锚定引物组306的锚定部分311或含有锚定部分311部分的碱基序列实质上预先做成通用序列。此时准备如图14A的313所示的将距离锚定引物组306的3′末端为第6个碱基的碱基(限制性内切酶的切割序列内的一个,此处为C)转变成别的碱基例如T的锚定引物(锚定引物组①)16种和,不变化的原样C的引物组307(引物组②)。在该例中,如图14B所示,在引物组②中没有必要在引物组②上附加锚,但为了有利于以后的查对,可预先用Texas Red或FITC附上荧光标记314。
使用以1种荧光体荧光标记过的引物组②和DNA片段混合物进行引物的延伸反应。也就是,如图12所示,从装有含连接反应产物溶液的管子322,将料液分注到16只管322-1,322-2、……,322-16中,各自加入不同的引物进行互补链合成。也就是,在各个管子中分别添加互不相同的选择序列312。互补链合成的产物经过凝胶电泳。图15是互补链合成产物的凝胶电泳谱的例子。电泳图中,具有选择序列312的引物和,分别由DNA链(2条链)中的+链及-链互补链合成的产物,从泳动开始点以等距离L成对地出现。当引物的3′末端的2个碱基完全与DNA片段匹配时就产生互补链合成,生成与其DNA片段同等长度的荧光标记DNA片段。因此,由获得的图15的图谱可得知,在DNA片段组中有怎样长度的片段,其末端的碱基序列是什么。图16是表示被检测出的DNA片段结构例的图,例如,由具有选择序列(引物选择性序列)AG的引物,以及具有选择序列(引物选择性序列)TC的引物获得的电泳图中,出现DNA链长约400个碱基的DNA片段。
由此可得知,把原有的样品DNA用限制性内切酶切断的2条链DNA片段中,长度约为400bp,各自链的3′末端侧的碱基序列分别包含作为3′□GTACTC…5′,及3′□GTA CAG…5′的DNA片段。此处,「□」是通过连接反应导入DNA片段中的寡核苷酸的碱基序列,「…」是在DNA片段上固有的碱基序列。接续在限制性内切酶识别部的碱基序列3′GTAC5′上的5′末端侧的碱基序列,各自成为与AG,及TC互补的碱基序列。即可得知,图16中示出的DNA片段处于DNA片段混合物之中。仅取出这种DNA片段时,使用末端碱基序列分别具有AG及TC的锚定引物,进行PCR(polymerase Chain Reaction),只要是其DNA片段的拷贝数比其它大几个数量级就行。
使用由4种荧光体分别标记的引物,确定如此制得的DNA的碱基序列,以及与它们相连的原来的样品DNA的碱基序列。为了用已有的4种荧光标记引物进行测序,使用在5′末端侧引入锚的锚定引物306①作为PCR用引物。即,这种锚定引物,如图14A所示,与已有的引物共用的锚定序列311,实质上与通过连接反应而在DNA片段的3′末端侧导入的DNA寡核苷酸304互补,是具有与锚定引物组306共用的共用引物序列315、与限制性内切酶识别的碱基序列的1部分或全部共用的碱基序列、以及3′末端侧上2个碱基组成的辨别序列312的引物。与锚定序列311共用的引物序列315,也可以是一部分共用,但共用部分的长度为8核苷酸以下。用4种荧光体分别标记的已知的引物单独使用时,不能稳定地与已导入DNA片段的DNA寡核苷酸304的碱基序列杂交并进行互补链合成是必要的。共用引物序列315具有实质与DNA寡核苷酸304互补的碱基序列。而且,锚定部分311的碱基序列为10核苷酸以上,优选在15核苷酸以上是为获得稳定的杂交所必需的。
此外,对引物序列进行一些研究。也就是,这些锚定引物①,具有与导入DNA片段的DNA寡核苷酸304互补的碱基序列和,在3′末端上有2个碱基的选择序列(XX)312,但预先使限制性内切酶识别的碱基序列-CATG-的5′末端侧的1个碱基的种类产生变化。图14A的例子中,使碱基序列-CATG-中的C变化成T(代替T,也或以是A、G),这种锚定引物,距离3′末端为第6个碱基的碱基T313发生失配,但稳定地与导入DNA片段末端中的DNA寡核苷酸304进行杂交,形成互补链。其结果,形成的DNA链变成为不能用本实施例中所用的限制性内切酶切断的类型。而且,即使将碱基序列-CATG中的A,变化成T、G、C中任何一种,这种锚定引物,距离3′末端为第5个碱基的碱基发生失配,但稳定地与导入DNA片段末端中的DNA寡核苷酸304进行杂交,形成互补链。其结果同样,形成的DNA链变成为不能用本实施例中所用的限制性内切酶切断的类型。此外,还准备16种引物(引物组②)。这些引物如图14B所示,不具有锚定序列,但却是具有选择序列(XX)312的引物,距离3′末端为第2个碱基至第6个碱基的碱基序列,与碱基序列-CATG-互补,可以附加也可以不附加5′末端的荧光标记314。
利用图15的结果,确定为使比130个碱基更长的DNA片段进行PCR放大所必要的PCR用选择性引物。如图12所示,分取到管子323中的溶液,被分装到PCR组合的数(K)个(在电泳图中,互补链合成的产物,是从迁移点开始等距离出现的对的数量以下,等于被确定的PCR用选择性引物的种类数)容器323-1、323-2、……323-K中,在容器中各自添加不相同的PCR用选择性引物,进行使用选择性引物的PCR放大。在这种PCR放大中,使用锚定引物组①,以及引物组②的组合引物。此外,130个碱基(通常150个碱基)以下的DNA片段即使不进行分析,也可以如下所述通过各DNA片段的接续操作确定整个碱基序列,因此不进行PCR放大。
对由PCR放大获得的DNA片段经过透析等进行精制,并作为碱基序列确定用模板。图17示出通过使用锚定引物①的互补链合成(PCR放大)所获得的产物一例。在图17中,304′的一部分是寡核苷酸304的延伸部分。此处获得的DNA片段,是分别在末端上具有锚定引物组306(锚定引物组①)的锚定引物,以及引物组307(引物组②)的引物的DNA片段。引物组307的引物结合的部分305的-CATG-,如果使用先前所用的限制性内切酶,则可在切断部位400切断,但锚定引物组306的锚定引物的结合侧部分351的-CATA-,由于与-CATG不同,因此不能被先前使用的限制性内切酶切断。
其结果,如果将PCR放大产物作为由先前的限制性内切酶切断后的1条链,使用具有与锚定序列311相同碱基序列的荧光标记引物330(*表示荧光标记)进行互补合成,就会在3′末端侧上具有与原来的样品DNA301互补的碱基序列,与原来的样品DNA链进行杂交后生成可进一步延伸互补链的DNA片段(互补链延伸的荧光标记引物402)。然后添加先分取到第2个管子302-2中的片段化之前的原有样品DNA301和,碱基序列确定用的试剂(ddNTP含有二脱氧核苷酸三磷酸盐的试剂)后,进行序列反应。由使用荧光标记引物330的序列反应可得知PCR放大的DNA片段的碱基序列,由使用预先准备的经上述互补链延伸过的荧光标记引物402的序列反应可得知这种DNA片段应该连系的碱基序列(连结的碱基序列)。也就是,与实施例5同样,由实施例1可以确定DNA片段的碱基序列和,与该碱基序列相邻接的碱基序列。
图17中示出的DNA片段,是在末端上各自具有锚定引物组306的锚定引物和引物组307(引物组②)的引物的DNA片段。由使用不同的PCR选择性引物(在图14A,图14B中,具有不同识别序列的引物组307、306的引物)的反应,可以读出样品DNA301的碱基序列。上述序列反应中,使用由具有不同发光波长的4种荧光体分别标记的引物;进行所谓A终止反应、C终止反应、G终止反应及T终止反应,因此可以使用普通的4色引物作为荧光标记引物330,操作极为简便。即,其优点是没有必要制作在3′末端具有识别序列的16种荧光标记引物(由于是4色所以总计是64种引物)。
实施例8
本实施例是由3′末端、5′末端两侧同时确定2条链DNA的碱基序列的例子。图18示出具有识别序列的锚定引物,标记引物和DNA片段的关系。被荧光标记过的正向引物(forward primer)(将+链进行互补链延伸合成所使用的引物)171,以及引物(将-链进行互补链延伸合成所使用的引物)371,而标记荧光体分别采用Texas Red(314,发光波长615nm),以及Cy-5(141,发光波长654nm)。然后,将这些引物称为引物-a(171,正引物),引物-b(371)。图18示出引物-a(171)、-b(371)、锚定引物(361、362)和在末端上附加了DNA寡核苷酸304的DNA片段的关系。引物-a(171)和锚定引物-a(361)的锚定序列具有实质上通用的碱基序列,引物-b(371)和锚定引物-b(362)的锚定序列具有实质上通用的碱基序列。引物-a、-b,即使是部分地与DNA片段杂交也不会稳定,没有锚定引物存在时成为不发生互补链合成的碱基序列。也就是,仅与锚定引物延伸后而得到的DNA链316的一部分进行稳定的杂交,制成序列产物。
与DNA片段相结合的DNA寡核苷酸的碱基序列中,预先加入Class2A限制性内切酶FokI的限制性内切酶识别部(-GGATG)318。该限制性内切酶FokI是由限制性内切酶识别部318将3′末端侧的9个碱基部位317切断的限制性内切酶,如以后所述,可以用于除去结合在DNA片段上的寡核苷酸。锚定引物-a(361),使限制性内切酶识别部(是碱基被取代过的限制性内切酶识别部)351(此处是N1aIII的限制性内切酶识别部)的碱基序列-CATG-的一部分发生变化,按照313那样C→T,变化成-TATG-,成为不能用限制性内切酶N1aIII切断的产物,但由于具有Class2A的限制性内切酶切断的识别序列(-GGATG)318,因此可被FokI切断。另一方面,锚定引物-b(362),保存了限制性内切酶识别序列部-CATG-305,但使Class2A限制性内切酶的识别序列(-GGATG-)的一部分319变化成-GTATG-,使其转变为不能用FokI切断。也就是,使用锚定引物-a和-b,PCR放大过的产物用限制性内切酶N1aIII切断一侧,用Class2A的限制性内切酶切断相反的另一侧,在能除去分别在DNA片段末端导入的DNA寡核苷酸方面下工夫。不言而喻,锚定引物-a、及-b,在3′末端上具有由2个碱基组成的辨别序列312(图18的例中为AG、TC),是分别由16种引物组成的锚定引物组。
以下,按顺序说明。与实施例7相同,含有待分析样品DNA(数Kb~10Kb)的料液被分成2份。分离出的一份料液,用限制性内切酶N1aIII(也可以是其它的4碱基识别酶)切断样品DNA。由限制性内切酶切断的切断部,通过连接反应与具有已知碱基序列的DNA寡核苷酸结合。此处用的DNA寡核苷酸是碱基序列(序列号6),5′-GTAAAACGACGGCCAGTGGATGCATG-3’的辅助寡核苷酸101和,碱基序列(序列号7),具有在3′-CATTTTGCTGCCGGTCACCTAC-5′的3′端上导入生物素(Bio)、并在5′端上具有磷酸基(P)的3′Bio-CATTTTGCTGCCGGTCACCTAC P-5′结构的连接寡核苷酸。辅助寡核苷酸101,除去由N1aIII生成的作为突出端的CATG-3′的碱基序列,与连接寡核苷酸102的碱基序列处于互补的关系,生物素(Bio)是为了封阻延伸反应而导入的物质,也可以用生物素(Bio)以外的物质修饰3′端的OH基。在导入了DNA寡核苷酸的DNA链中,在一方末端附近存在由N1aIII识别的切断部,在另一末端附近存在由FokI识别的切断部。被导入的连接寡核苷酸102的3′末端,用生物素封闭使其不进行超过它的链延伸。连接反应的收率差的情况下,使用不带有5′-P的连接,仅对辅助寡核苷酸进行连接反应后,通过聚合酶合成互补链。此种情况下,3′末端,在用末端脱氧核苷酸转移酶将二脱氧核苷酸导入3′末端之后封阻。如果采用这种方法,可防止引物之间通过连接反应成为二聚物,因此可以高效率地将辅助寡核苷酸101和连接核苷酸102的碱基序列导入DNA链中。DNA片段的自身连接可以防止使用大量过剩(100倍)的寡核苷酸。锚定引物-a(锚定引物组a),及锚定引物-b(锚定引物组b),通过被导入的DNA寡核苷酸以及N1aIII的识别部进行杂交,但锚定引物-a,NIaIII的识别部的碱基序列由-CATGNN 3′变成-TATGNN3′。另一方面锚定引物-b,FokI的识别部的碱基序列由-GGATGCATGNN变成-GTATGCATGNN。这些变化中任何一种都是不会对互补链合成产生妨碍的点取代。
图19说明在使用具有选择性序列的锚定引物来识别DNA片段从而进行PCR之前,用少量的DNA片段确定引物对的方法。为了确定用于将DNA片段混合物进行PCR放大的引物对,制作与实施例7同样的电泳谱。也就是,将在先分成2等份的另一份料液(包括由限制性内切酶切断的DNA片段组),如图19所示,进一步分成16份装入各自的容器中,分别按每容器1种添加属于锚定引物组b的16种引物110,再进一步添加荧光标记(*)过的正向引物111,在循环测序的条件下互补链延伸,形成由正向引物111延伸的互补链106。此处使用了锚定引物-b,但也可同样使用锚定引物-a,或完全不具有点取代的引物组。反应中,首先是锚定引物-b(110)与DNA片段100杂交,3′末端完全匹配的,即产生互补链延伸103。此处不匹配侧的链不延伸。互补链一直进行到导入寡核苷酸(辅助寡核苷酸101)部分,结果可以在延伸链的3′末端上得到与辅助寡核苷酸101杂交的碱基序列104。通过热循环反应,该互补链延伸103,进一步地形成在3′末端上具有引物110的锚定序列和互补碱基序列105的DNA片段。也就是,形成正向引物111的杂交碱基序列105部分。在该碱基序列105部分上杂交正向引物111,形成延伸的互补链106。然后,与普通的PCR同样进行反应,锚定引物-a的末端碱基序列完全杂交,获得长度基本上与DNA片段相同的(限于两端锚定引物长度的长度)荧光标记DNA片段。
此外,DNA片段混合物的长度,在每次求DNA片段末端的每个2个碱基种类时使用,但将DNA片段混合物在其末端的每2个碱基序列进行PCR放大的方法也是有效的。如果将辨别序列从2个碱基增至3或4个碱基,即使1个碱基失配也具有作为引物的功能。为了防止这一点,例如在具有3碱基的选择性序列时,在距离锚定引物的3′末端的第4个碱基(靠近选择性序列这边的碱基)上加入肌苷,减弱末端的结合力。此种情况下,如果进一步在选择序列上有失配,则互补链合成极为困难,有利于提高识别特性。
将16种锚定引物-b每次获得的荧光标记DNA链通过凝胶电泳分离后,即可得知包含在混合中的DNA链的末端碱基序列和长度。用如此获得的末端碱基序列和长度,确定PCR用引物,但2个引物分别从锚定引物-a、及-b中选择1种。使用这2个引物(例如,锚定引物-a(361)及-b(362))进行PCR放大,如图18所示,由此获得具有在一个末端附近由N1aIII切断,在另一个末端附近由FokI切断的切断部的DNA片段。将获得的各种DNA片段经乙醇精制后,溶于缓冲液后各自分成2份,得到有关各DNA片段的(a)及(b)溶液。在(a)溶液中加入N1aIII,在(b)溶液中加入FokI,将DNA片段切断。一旦将由NIaIII切断的DNA片段1条链化,用荧光标记引物171(正向引物)在循环反应下进行互补合成,就会在3′末端侧上具有与原来样品DNA301互补的碱基序列,与原来的样品DNA链杂交后生成互补链可进一步延伸的DNA片段(互补链延伸的荧光标记引物404)。同样,一旦将由FokI切断的DNA片段1条链化,用荧光标记引物371在循环反应下进行互补合成,就会在3′末端侧上具有与原来样品DNA301互补的碱基序列,与原来的样品DNA链杂交后生成互补链可进一步延伸的DNA片断(互补链延伸的荧光标记引物406)。于是,与原来的样品DNA链301杂交从而预先准备互补链可进一步延伸的DNA片段404、406。
然后,将两者混合(也可以是直到最后也是分开的),添加具有限制性内切酶切断前全长的样品DNA301,进而添加碱基序列确定用的试剂(ddNTP含有二脱氧核苷酸三磷酸盐的试剂,进行循环序列反应。通过这种反应,可以获得DNA链前后的碱基序列确定所必须的信息资料。也就是,从使用荧光标记引物171、371的序列反应可得知PCR放大过的DNA片段的碱基序列;从使用上述互补链延伸的荧光标记引物404、406的序列反应可得知该DNA片段应该连系的碱基序列(连接的碱基序列)。也就是,与实施例1~实施例5相同,可以确定DNA片段的碱基序列和,与该碱基序列相邻接的碱基序列。
与实施例1~实施例5,实施例7相同,可以确定DNA片段的碱基序列和,与该碱基序列相邻接的碱基序列。
此处,引物与DNA2条链(+,-链)相对应是2色(2种荧光标记的引物),A、C、G、T的识别,是以不同的电泳路线进行,即每种末端碱基在不同的电泳路中泳动(Bio/Technology.9,648-651(1991))。
另一方面,使用4色荧光体引物(分别被4种萤光体标记的引物)时,不必使(a)溶液和(b)溶液混合,就可与实施例7同样进行。于是,使用在DNA链两端具有不同切断部的引物进行PCR,由于可从2条链的两侧同时确定碱基序列,因此效率良好。而且,可以同时知道两末端接续的碱基序列,因此具有可以使确定碱基序列的DNA片段数为最少的优点。
以上各实施例中的样品DNA的长度只要为数Kb~10Kb就行,当然也可以是从检查对象中提取的DNA中被片段化的DNA片段样品。
(序列表)序列号1序列的长度18序列类型核酸链数1条链布局直链状序列种类其它核酸,合成DNA序列TGTAAAACGACGGCAGT序列号2序列的长度22序列类型核酸链数1条链布局直链状序列种类其它核酸、合成DNA序列GTAATGCGACTCACTATAGGGC序列号3序列的长度20序列类型核酸链数1条链布局直链状序列种类其它核酸,合成DNA序列TTTTTTTTTTTTTTGCAGGC序列号4序列的长度20序列类型核酸链数1条链布局直链状序列种类其它核酸,合成DNA序列TTTTTTTTTTTTTTGCAGGT序列号5序列的长度20序列类型核酸链数1条链布局直链状序列种类其它核酸,合成DNA序列的特征其它的信息资料X、Y;任意的A、C、G或T序列TTTTTTTTTTTTTTTCGCXY序列号6序列的长度26序列类型核酸链数1条链布局直链状序列种类其它核酸,合成DNA序列GTAAAACGACGGCCAGTGGATGCATG序列号7
序列的长度22序列类型核酸链数1条链布局直链状序列种类其它核酸,合成DNA序列CATCCACTGGCCGTCGTTTTAC
权利要求
1.碱基序列测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及(2)在DNA片段的3’末端上导入具有特定碱基序列的寡核苷酸的工序及(3)将导入了上述寡核苷酸的上述DNA的片段的1条链作为模板,使用由与寡核苷酸的碱基序列的至少一部分至补的第1碱基序列部分及与利用上述限制性内切酶识别的碱基序列互补的第2碱基序列部分及、从1个碱基至4个碱基的范围的碱基组合而形成的第3碱基序列部分组成的,并被标记的标记引物,进行互补链合成延伸反应,得到具有与DNA片段的1条链互补的碱基序列的标记延伸引物的工序及(4)使(a)将上述导入了寡核苷酸的上述DNA片段的1条链作为模板,使用上述标记引物进行序列反应的工序及、(b)将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的样品DNA的1条链的一部分或样品DNA的1条链作为模板,使用上述标记延伸引物进行序列反应的工序,分别或同时进行的工序及、(5)将上述序列反应的生成物进行电泳,确定上述DNA片段的碱基序列及、与DNA片段的碱基序列邻接的样品DNA的至少一部分的碱基序列工序。
2.权利要求1中记载的碱基序列测序方法,其中的标记是指萤光标记。
3.权利要求1中记载的碱基序列测序方法,变换温度条件将其中的工序(3)重复进行数次。
4.权利要求1中记载的碱基序列测序方法,变换温度条件,将其中工序(4)即上述互补链合成延伸反应及上述标记延伸引物从上述DNA片段中游离出来的操作重复进行数次。
5.权利要求1中记载的碱基序列测序方法,在其中的工序(3)、(4)中使用耐热性聚合酶。
6.权利要求1中记载的碱基序列测序方法,其中的寡核苷酸是由单一的碱基种类组成的。
7.碱基序列测序方法,其特征在于包括以下工序(1)将样品DNA利用第1限制性内切酶切断得到DNA片段的工序及(2)使用引物将上述DNA片段的1条链作为模板进行延伸反应之后,将3’末端与萤光标记的核苷酸置换的工序及、(3)将(2)生成的互补链利用与上述第1限制性内切酶不同的第2限制性内切酶切断,得到在3’末端上被萤光标记的萤光标记引物的工序及、(4)使用上述萤光标记引物,将具有DNA片段的1条链的碱基序列和与其邻接的碱基序列的上述样品DNA的1条链的一部分或上述样品DNA的1条链作为模板,进行序列反应的工序及、(5)将上述序列反应的生成物进行电泳,确定与上述DNA片段的碱基序列相邻接的上述样品DNA的至少一部分的碱基序列。
8.碱基序列测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)使用引物,将上述DNA片段的1条链作为模板进行互补链合成,得到具有与DNA片段的1条链互补的碱基序列的工序及、(3)使用上述引物,将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或上述样品DNA的1条链作为模板,进行在延伸链的末端上导入萤光标记的序列反应的工序及(4)利用上述限制性内切酶切断上述序列反应的生成物的工序及、(5)将上述利用限制性内切酶切断的序列反应的生成物进行电泳,确定与DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列的工序。
9.碱基序列测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及(2)在上述DNA片段的3’末端上导入具有特定的碱基序列的寡核苷酸的工序及(3)将上述导入了寡核苷酸的DNA片段的1条链作为模板,使用由与上述寡核苷酸的碱基序列的至少一部分至补的第1碱基序列部分及与利用上述限制性内切酶识别的碱基序列互补的第2碱基序列部分及、从1个碱基至4个碱基的范围内的碱基组合而形成的第3碱基序列部分组成的,并被标记的标记引物,进行互补链合成延伸反应,得到具有与上述DNA片段的1条链互补的碱基序列的标记延伸引物的工序及(4)使(a)将上述导入了寡核苷酸的DNA片段的1条链作为模板,使用上述标记引物进行序列反应的工序及、(b)将具有DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或样品DNA的1条链作为模板,使用上述萤光标记的延伸引物进行序列反应的工序,进行的工序及、(5)将序列反应的生成物进行电泳,确定与上述DNA片段的碱基序列邻接的上述样品DNA的至少一部分的碱基序列的工序。
10.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)使用萤光标记引物,将上述DNA片段的1条链作为模板进行互补链合成,得到具有与上述DNA片段的1条链互补的碱基序列的引物的工序及、(3)将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或样品DNA的1条链作为模板,使用上述引物进行序列反应的工序及、(4)将上述序列反应的生成物进行电泳,确定与上述DNA片段的碱基序列相邻接的上述样品DNA的至少一部分的碱基序列的工序。
11.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)使用与上述DNA片段进行选择互补链结合并被萤光标记的第1引物及、具有与上述DNA片段的1条链互补的碱基序列的被萤光标记的第2引物,将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或将样品DNA的1条链及上述DNA片段混合作为模板,进行序列反应的工序及、(3)将上述序列反应的生成物进行电泳,确定上述DNA片段的碱基序列及、与上述DNA片段的碱基序列相邻接的上述样品DNA的至少一部分的碱基序列的工序。
12.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)在上述DNA片段的3’末端导入具有已知碱基序列的寡核苷酸的工序(3)通过利用上述限制性内切酶识别上述DNA片段并识别与切断部分相连接的末端部的1-4个碱基的碱基种类,进行延伸反应,从而在测定上述DNA片段的长度的同时,确定用于序列反应的引物的工序及、(4)将利用上述限制性内切酶得到的上述DNA片段利用电泳法根据长度进行分离而分取的工序及、(5)使用在3’末端具有为辨别上述DNA片段的由1-4个碱基组成的碱基序列的萤光标记引物,辨别上述DNA片段,将被辨别的上述DNA片段作为模板合成互补链的工序及、(6)进行(a)使用上述标记引物,将被辨别的上述DNA片段作为模板的序列反应,及(b)使用由上述工序(5)生成的上述互补链,将具有被辨别的上述DNA片段的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分,或上述样品DNA的1条链作为模板的序列反应的工序及(7)将上述序列反应的生成物进行电泳,确定被辨别的上述DNA片段的碱基序列及与被辨别的上述DNA片段的碱基序列邻接的上述样品DNA的至少一部分的碱基序列的工序。
13.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)将上述DNA片段的1条链作为模板,使引物发生延伸反应,得到1条链DNA的工序及、(3)使用上述的1条链DNA,将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或上述样品DNA的1条链作为模板,进行序列反应的工序及、(4)将上述序列反应的生成物进行电泳,确定在上述DNA片段的碱基序列相邻接的上述样品DNA的至少一部分的碱基序列的工序。
14.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)分别将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或上述样品DNA的1条链,及上述DNA片段作为模板,使用与上述样品DNA的1条链或上述样品DNA的1条链的一部分进行选择性地互补链结合的引物及、与上述DNA片段进行选择性地互补链结合的引物,进行序列反应的工序及、(3)将上述序列反应的生成物进行电泳,确定比上述DNA片段的碱基序列的长度更长部分的上述样品DNA的碱基序列的工序。
15.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用第1限制性内切酶切断得到DNA片段的工序及、(2)使用引物,将上述DNA片段的1条链作为模板进行延伸反应后,将3’末端用萤光标记核苷酸置换的工序及、(3)将上述互补链用与上述第1限制性内切酶不同的第2限制性内切酶切断,得到3’末端被萤光标记的萤光标记引物的工序及、(4)使用上述萤光标记引物,将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或上述样品DNA的1条链作为模板,进行序列反应的工序及、(5)将上述序列反应的生成物进行电泳,确定比上述DNA片段的碱基序列的长度更长部分的上述样品DNA的碱基序列的工序。
16.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断得到DNA片段的工序及、(2)将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分、或上述样品DNA的1条链及、上述DNA片段的1条链分别作为模板,使用与上述样品DNA的1条链或上述样品DNA的1条链的一部分进行选择性地互补链结合的引物及、与上述DNA片段进行选择性地互补链结合的引物,同时进行序列反应的工序及、(3)将上述序列反应的生成物进行电泳,同时确定上述DNA片段的碱基序列及,与上述DNA片段的碱基序列相邻接的上述样品DNA的至少一部分的碱基序列的工序。
17.碱基序列的测序方法,其特征在于包括以下工序(1)使用3’末端上具有与由样品DNA得到的DNA片段的1条链的碱基序列的一部分互补的碱基序列的引物进行互补链合成延伸反应,得到具有与上述DNA片段的1条链的一部分互补的碱基序列的延伸引物的工序及、(2)进行(a)以上述DNA片段的1条链作为模板,使用上述引物进行序列反应的工序及、(b)将具有上述DNA片段的1条链的碱基序列及与其邻接的碱基序列的上述样品DNA的1条链的一部分或上述样品DNA的1条链作为模板,使用上述延伸引物进行序列反应的工序及、(3)将序列反应的生成物进行电泳,确定上述DNA片段的碱基序列及与上述DNA片段的碱基序列相邻接的样品DNA的至少一部分的碱基序列的工序。
18.DNA样品调制方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有寡核苷酸、及与利用限制性内切酶识别的序列实质上互补的序列和、在3’末端侧具有由1-4个碱基组成的选择序列、在5’末端侧具有至少8核苷酸(octamer)以上的锚序列的锚定引物,进行互补链合成得到DNA链的工序及、(4)使用具有至少与锚序列实质上相同的序列、并不与上述样品DNA进行杂交的引物,将由工序(3)得到的上述DNA链作为模板进行互补链合成的工序。
19.样品调制方法,其特征在于包括以下工序(1)将样品DNA切断生成多个长度的DNA片段的工序及(2)在上述DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有与上述寡核苷酸实质上互补的碱基序列和、在3’末端侧具有为辨别由1-4个碱基组成的上述DNA片段的序列、在5’末端侧具有至少8核苷酸以上的锚序列的锚定引物和、具有与上述锚序列实质上相同的碱基序列,在单独使用时与DNA片段不能稳定地进行杂交的引物,将上述DNA片段对每个末端的碱基序列进行区分,进行PCR放大的工序。20.DNA样品调制方法,其特征在于,包括使用在3’末端具有为辨别与限制性内切酶识别的识别部序列相连接的由1-4个碱基组成的DNA片段的选择序列的引物及、上述识别部序列的一部分的碱基被置换并不能利用上述限制性内切酶切断的引物,至少进行1次互补链合成的工序及、将两端附近具有不同的限制性内切酶识别的识别部序列的DNA链进行合成的工序。
21.权利要求20记载的样品调制方法,其特征在于包括将上述DNA链的单个末端利用限制性内切酶切断,制备为确定样品DNA的碱基序列的模板DNA的工序。
22.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有上述寡核苷酸、及与利用上述限制性内切酶识别的识别部序列实质上互补的序列和、在3’末端侧具有由1-4个碱基组成的辨别序列、在5’末端侧具有至少8核苷酸以上的锚序列、上述识别部序列的一部分碱基被取代、并不能利用上述限制性内切酶切断的碱基序列部分的锚定引物和、具有经过用上述限制性内切酶切断的碱基序列的引物,利用PCR将特定的DNA片段放大的工序及、(4)切断被放大的上述特定的DNA片段的一个末端,得到DNA链的工序及、(5)使用至少具有与上述锚序列实质上相同的序列、不直接与上述样品DNA进行杂交的萤光标记引物,将由工序(4)得到的DNA链作为模板进行互补链合成得到互补链合成DNA片段的工序及、(6)使用上述萤光标记引物及上述互补链合成DNA片段,将由工序(4)得到的上述DNA链、上述样品DNA作为模板进行序列反应的工序,确定上述DNA链的碱基序列及与上述DNA链的碱基序列相邻接的部分的上述样品DNA的碱基序列。
23.碱基序列的测序方法,其特征在于包括下列各工序(1)将样品DNA利用限制性切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有上述寡核苷酸、及与利用上述限制性内切酶识别的识别部序列实质上互补的序列和、在3’末端侧具有由1-4个碱基组成的选择序列、在5’末端侧具有至少8核苷酸以上的选择序列、上述识别部序列的一部分碱基被取代、并不能利用上述限制性内切酶切断的碱基序列部分的锚定引物和、具有经过用上述限制性内切酶切断的碱基序列的引物,利用PCR将特定的DNA片段放大的工序及、(4)切断被放大的上述特定的DNA片段的一个末端,得到DNA链的工序及、(5)使用至少具有与上述锚序列实质上相同的序列、不直接与上述样品DNA进行杂交的萤光标记引物,将由工序(4)得到的上述DNA链、上述样品DNA作为模板进行序列反应的工序,确定上述DNA链的碱基序列及与上述DNA链的碱基序列相邻接的部分的上述样品DNA的碱基序列。
24.权利要求22或23中记载的碱基序列测序方法,其中萤光标记引物至少具有与上述锚序列实质上相同的序列。
25.碱基序列测序方法,其特征在于包括以下工序(1)将样品DNA利用限制性切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列是已知的寡核苷酸的工序及、(3)使用具有上述寡核苷酸、及与利用上述限制性内切酶识别的识别部序列实质上互补的序列和、在3’末端侧具有由1-4个碱基组成的选择序列、在5’末端侧具有至少8核苷酸以上的锚序列、上述识别部序列的一部分大碱基被取代、不能利用上述限制性内切酶切断的碱基序列部分的锚定引物和、具有经过用上述限制性内切酶切断的碱基序列的引物,利用PCR将特定的DNA片段放大的工序;确定被放大的上述特定的DNA片段的碱基序列。
26.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用第1限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列已知的、具有由第2限制性内切酶得到的识别部序列的寡核苷酸的工序及、(3)使用具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别部序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第1选择序列的、在5’末端侧具有至少8核苷酸以上的第1锚序列的、上述识别部序列的一部分碱基被置换、并具有不能被上述第1限制性内切酶切断的碱基序列部分的第1锚定引物及,具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第2选择序列、在5’末端侧具有至少8核苷酸以上的第2锚序列、上述寡核苷酸的一部分碱基被置换、具有不能被上述第2限制性内切酶切断的碱基序列部分的第2锚定引物,利用PCR将特定的DNA片段放大的工序及、(4)分别将放大的上述特定的DNA片段的第1末端用上述第2限制性内切酶切断,得到第1DNA链,将被放大的上述特定的DNA片段的第2末端利用上述第1限制性内切酶切断,得到第1DNA链的工序及、(5)使用至少具有与上述第1锚序列实质上相同的序列的、与上述样品DNA不直接杂交的第1萤光标记引物及、至少具有与上述第2锚序列实质上相同的序列的、与上述样品DNA不直接杂交的第2萤光标记引物,将由工序(4)得到的上述第1、第2DNA链作为模板进行互补链合成,得到第1、第2互补链合成DNA片段的工序及、(6)使用上述第1、第2萤光标记引物及第1、第2互补链合成DNA片段,将由工序4得到的第1、第2DNA链、上述样品DNA作为模板进行序列反应的工序;确定上述第1、第2DNA链的碱基序列及与上述第1、第2DNA链的碱基序列相邻接部分的上述样品DNA的碱基序列。
27.碱基序列的测序方法,其特征在于包括以下工序(1)将样品DNA利用第1限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列已知的、具有由第2限制性内切酶得到的识别部序列的寡核苷酸的工序及、(3)使用具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别部序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第1选择序列的、在5’末端侧具有至少8核苷酸以上的第1锚序列的、上述识别部序列的一部分碱基被置换、并具有不能被上述第1限制性内切酶切断的碱基序列部分的第1锚定引物及,具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别序列实质上互补的序列及、在3’末端侧具有1-4个碱基组成的第2选择序列、在5’末端侧具有至少8核苷酸以上的第2锚序列、上述寡核苷酸的一部分碱基被置换、具有不能被上述第2限制性内切酶切断的碱基序列部分的第2锚定引物,利用PCR将特定的DNA片段放大的工序及、(4)分别将放大的上述特定的DNA片段的第1末端用上述第2限制性内切酶切断,得到第1DNA链,将被放大的上述特定的DNA片段的第2末端利用上述第1限制性内切酶切断,得到第1DNA链的工序及、(5)使用上述第1、第2萤光标记引物,将由工序(4)得到的上述第1、第2DNA链、上述样品DNA作为模板进行序列反应的工序;确定上述第1、第2DNA链的碱基序列及、与上述第1、第2DNA链的碱基序列相邻接部分的上述样品DNA的碱基序列。
28.权利要求26或27中记载的碱基序列测序方法,其中第1萤光标记引物至少具有与上述第1锚序列实质相同的序列,其中第2萤光标记引物至少具有与上述第2锚序列实质相的序列。
29.碱基序列测序方法,其特征在于包括以下工序(1)将样品DNA利用第1限制性内切酶切断,生成多个长度的DNA片段的工序及、(2)在上述DNA片段的至少3’末端侧导入碱基序列已知的、具有由第2限制性内切酶得到的识别部序列的寡核苷酸的工序及、(3)使用具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别部序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第1选择序列的、在5’末端侧具有至少8核苷酸以上的第1锚序列的、上述识别部序列的一部分碱基被置换、并具有不能被上述第1限制性内切酶切断的碱基序列部分的第1锚定引物及,具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别部序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第2选择序列、在5’末端侧具有至少8核苷酸以上的第2锚序列、上述寡核苷酸的一部分碱基被置换、具有不能被上述第2限制性内切酶切断的碱基序列部分的第2锚定引物,利用PCR将特定的DNA片段放大的工序;确定被放大的上述特定的DNA片段的碱基序列。
30.一种试剂盒,是由具有与连接反应用寡核苷酸互补的碱基序列及、限制性内切酶识别的识别部序列及、可以成为聚合酶反应的引物的碱基序列的、在3’末端侧具有1-4个碱基组成的选择序列的、可以选择DNA片段的末端的碱基序列的多个锚定引物形成。
31.权利要求30中记载的试剂盒,其中,所述锚定引物,选择上述DNA片段末端的2个碱基的序列的选择序列含有由2个碱基组成的全部组合碱基序列。
32.一种试剂盒,其特征在于在至少由连接反应用寡核苷酸、互补链合成用引物组成的试剂盒中,上述互补链合成用引物包括与上述寡核苷酸实质上互补的序列、限制性内切酶识别的识别部序列及、在该识别部序列3’末端侧具有由2个碱基组成的选择序列的16种引物组成的第1引物组(Primer set)及、在该第1引物组的各引物的5’末端侧导入锚序列,上述各引物的上述识别部分序列的一部分的碱基被置换过的16种引物组成的第2引物组。
33.一种试剂盒,其特征在于在至少由连接反应用寡核苷酸、互补链合成用引物组成的试剂盒中,上述互补链合成用引物包括上述寡核苷酸、及与利用第1限制性内切酶识别的识别部分序列实质上互补的序列及、在3’末端侧具有由1-4个碱基组成的第1选择序列、在5’末端侧具有至少8核苷酸以上的第1锚序列;上述识别部序列的一部分碱基被置换、具有不能被上述第1限制性内切酶切断的碱基序列部分的第1锚定引物组及、具有上述寡核苷酸、及与利用上述第1限制性内切酶识别的识别部序列实质上互补的序列及、在3’末端侧具有由1-4个碱基形成的第2选择序列、在5’末端侧具有至少8核苷酸以上的第2锚序列、上述寡核苷酸的一部分碱基被置换、具有不能被上述第2限制性内切酶切断的碱基序列部分的第2锚定引物组。
34.权利要求33中记载的试剂盒,其中第1、第2选择序列的碱基由2个碱基形成,包括由2个碱基组成的全部组合的碱基序列。
35.分析由权利要求18中记载的样品调制方法调制的样品的分析方法。
36.分析由权利要求19中记载的样品调制方法调制的样品的分析方法。
37.分析由权利要求20中记载的样品调制方法调制的样品的分析方法。
38.分析由权利要求21中记载的样品调制方法调制的样品的分析方法。
39.分析由权利要求21中记载的样品调制方法调制的样品的分析方法,包括将上述DNA链的一个末端用限制性内切酶切断、制备为确定DNA片段的长度的模板DNA的工序。
全文摘要
本发明涉及利用由酶进行的DNA互补链合成的DNA分析方法,用于高效率的DNA碱基序列测序方法的样品的调制方法以及用于该方法的试剂盒。
文档编号C12Q1/68GK1153825SQ9611256
公开日1997年7月9日 申请日期1996年9月18日 优先权日1996年9月18日
发明者神原秀记, 冈野和宣 申请人:株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1