Dna制备方法

文档序号:448897阅读:386来源:国知局
专利名称:Dna制备方法
技术领域
本发明涉及DNA分析,尤其是有效的长DNA分析方法。
根据以前的方法,克隆被用于长DNA分析长DNA被降解成片段,这些不同片段被引入质粒一类的载体。然后它们被转化到培养于琼脂培养基的大肠杆菌中。在这种情况中,如果它们培养在只允许含包括靶DNA质粒的大肠杆菌才能生长的培养基上,在琼脂上将产生菌落。最终的大肠杆菌是组成菌落的单一种,此菌落中含同样DNA片段质粒的大肠杆菌被增殖。从单菌落中挑出大肠杆菌,它们被培养和纯化,并且DNA片段拷贝数增加。现有技术一直利用按照所述的克隆和培养过程得到的DNA,以测定碱基序列。
但上述的现有技术需要一个DNA克隆和大肠杆菌培养的过程以获得大量模板DNA。这个过程复杂并且需要大量人力,不适于自动化;如果用来分析人类基因组之类的大容量DNA则还有许多问题要解决。
荧光检测类DNA序列仪已被用于DNA碱基序列测定(Nature321,674—679(1986))。这基于对凝胶电泳分离的DNA片段的荧光检测方法。以Sanger方法(双脱氧法)通过酶促链延伸反应产生DNA片段。基于凝胶分离的方法能读出400至700个碱基的序列。对测定几个kb到几十个kb的DNA序列,这种方法是费时和麻烦的,因为需要额外的步骤来制备短的模板DNA。为此一种普通的方法就是鸟枪法(Anal.Biochem.,192,216(1983))。根据这种方法,DNA被超声波随机消化以克隆DNA片段并把它们插入到大肠杆菌中。培养出菌落后,每个菌落的大肠杆菌被培养,由此增加DNA拷贝的数目。提取和分析样品DNA。这种方法在测定序列之前不能确定样品DNA的哪部分相当于被提取菌落所含的DNA。另外,这种方法在碱基序列测定中需要较多的丰余序列。通常要提取和分析相当于要测定序列的靶DNA链长度10至20倍的DNA片段。因此,这种方法所需的较多时间和人力是这种方法的一大不利之处。
另外也建议一种从末端一个一个测定DNA序列的方法(PrimorWalking;Proc.Natl.Acad.Sci.U.S.A.86,6917(1989))。根据这种方法,测定了DNA序列的一部分后,从结果中选出下一个引物区,然后又用双脱氧法测定相邻接的序列。这种方法提供了较高的测序效率,但它有一缺点,就是从时间系列看要测定整个序列它需要很多的时间,并且每一次分析都必须制备引物,要花费很多时间和功夫。
进一步也提出了一种利用限制性内切酶产生长DNA的短片段并测定单个DNA片段序列,从而把最后结果联系在一起的方法。根据这种方法限制酶消化的片段大小不均一,并且常常不能一步分析。并且它有一个缺点,就是需要很多时间来确定片段之间的联接。因此如上述方法,这种方法不适于自动化或大规模DNA分析。
本发明的目的是提出一适于自动化的单一DNA样品的制备方法。DNA样品被切成片段,这些片段通过使用3’—末端有1至4个碱基的选择性序列来识别和选择DNA片段的引物而被选择性地扩增和分析,无需DNA克隆或大肠杆菌的培养。目前本发明的目的已成功地实现。本发明提供了一种适于自动化,无需DNA克隆和大肠杆菌培养过程的DNA样品制备方法。
本发明是基于在含有许多DNA片段的混合物中任一DNA片段都可以被凝胶电泳分离这样一种想法上的,如果能被聚丙烯酰胺凝胶电泳成功分离的DNA小于几个kb,可配以DNA片段末端碱基序列的分类。即使混合物中含太多种的DNA片段而不能以凝胶电泳分离,它们可以在按照末端碱基序列分类后通过凝胶电泳加以分离。反过来,DNA片段在被凝胶电泳粗略分开后通过它们的末端碱基序列被鉴定或各自分开。
本发明中的DNA制备方法至少包含三步;一步是通过消化产生很多DNA片段;一步是在片段的末端引入寡核苷酸,一步是用在3’末端有1至4个碱基的选择性序列的引物通过互补链延伸反应产生DNA片段拷贝。
如所述的双链DNA消化(片段化)过程,此方法可以使用限制酶处理,外切核酸酶/S1核酸酶处理和用激光或超声波的物理消化。另外,已述的双链DNA消化过程也包括含消化使用S1核酸酶去除消化(片段化)过程中形成的环形DNA单链、使用DNA聚合酶和连接酶修复双链DNA缺陷等步骤的处理方法。
另外,根据本发明的DNA制备方法包括(1)通过消化从双链DNA产生多个DNA片段的步骤;(2)通过连接把具有已知碱基序列的寡核苷酸(第一寡核苷酸)引入一个DNA片段末端,把具有已知序列且不同于第一寡核苷酸的寡核苷酸(第二寡核酸)引入到另一DNA片段末端的步骤;(3)利用含同所述第一寡核苷酸碱基序列互补碱基序列的引物和在5’末端引入荧光标记并在3’末端有用来鉴定和选择一个DNA片段末端碱基序列的1至4个碱基的选择性序列、含同所述第二寡核苷酸有互补碱基序列的引物,进行所述DNA片段的互补链延伸反应并增加DNA片段拷贝的数目。
另外,本发明的DNA制备方法包括(1)把已如碱基序列的寡核苷酸引入通过消化双链DNA产生的DNA片段末端的步骤;(2)利用至少一种引物对所述DNA片段进行PCR(聚合酶链反应)扩增的步骤,该引物含同引入到片段上的寡核苷酸互补的碱基序列,并在3’末端有少于5个碱基(1至4个碱基)的选择序列,通过这种序列来从片段混合物中鉴定和选择一种DNA片段;和(3)通过凝胶电泳对DNA片段分离和分级的步骤。
此外,根据本发明的DNA制备方法有(1)把已知序列的寡核苷酸引入到包括双链DNA的DNA片段群中的步骤;(2)利用引物进行至少一次的互补链延伸反应,从而增加DNA片段拷贝数目的步骤,该引物含同引入的寡核苷酸互补的碱基序列并在3’末端有少于5个(一至四个碱基)碱基的选择性序列,以通过DNA片段末端的碱基序列来识别和选择这个DNA片段。
根据本发明,双链DNA通过限制酶处理,外切核酸酶/S1核酸酶处理和激光或超声波物理消化降解成片段,将已知序列的寡核苷酸引入到这一未知DNA片段的末端使之成为可被PCR(聚合酶链反应)扩增的形式。就是说,通过凝胶电泳把每组具有不同长度的DNA片段粗略地分离和分级。DNA片段也可以另外一种方式通过外切核酸酶从它们的末端消化成短的片段;长度可通过调节反应时间来控制,由此获得具有不同长度的片段组。产生的DNA片段通过连接反应把具有已知碱基序列的寡核苷酸引入其末端而被修饰。在这种情况下每一片段组中DNA片段的长度几乎一致,但从严格角度讲包括多种长度。
所述限制酶包括HhaI,NIa3,San3A,Taq1,PstI,MaeI,HindIII,EcoR1。外切核酸酶,S1核酸酶和连接酶产品均有商品供应。
然后对末端有特定碱基序列的未知DNA片段,利用含同引入的寡核苷酸有互补碱基序列并且在3’末端有少于5个碱基选择性序列以籍此通过互补链延伸反应来识别和选择此DNA片段的引物,重复进行互补链延伸反应从而增加DNA片段拷贝的数目。如果选择性序列的碱基数目是一个的话,这就使得从全部四个DNA片段组中选择和扩增一个DNA组成为可能。如果选择性序列的碱基数是2则整个DNA片段组是16;如果碱基数为3,则DNA片段组数为64。这使得纯化和制备末端有特定碱基序列的DNA成为可能。这可以根据DNA片段末端的碱基序列来将它们分类。
引入到未知DNA片段末端、具有已知碱基序列的寡核苷酸为10至50个碱基长度,或优选18至30个碱基长度。当寡核苷酸长度小于10个核苷酸,则难以实现引物和模板DNA的稳定杂交,导致PCR产率较低。相反,虽然长寡苷酸能提供和模板DNA的稳定杂交,但其合成既贵且麻烦。
当具有各种长度的DNA片段根据长度由上述的凝胶电泳粗略地进行分离和分级时,一组中片段的数目减少了。这可以使末端有特定碱基序列而被选择性引物选择的仅一种或两种片段通过互补链延伸反应来增加拷贝数;这就使得通过识别和选择末端碱基序列来纯化DNA片段成为可能。而且重复互补链延伸反应能增加DNA片段拷贝的数目。它们提供了极佳的DNA测序样品。
在另一个例子中,将被测序的DNA被至少两种识别4个碱基的内切酶消化成可以在一次测序操作中完成测序的大小。不同的寡核苷酸被引入到每个这些片段的末端。同第一条引物互补的第一条寡核苷酸被引入到由第一种限制酶产生的DNA片段的3’末端,而第二条寡核苷酸被引入到由第二种限制酶产生的DNA片段的5’末端。第一条引物在3’末端有2个碱基的选择性序列,允许末端两个碱基同其互补的第一片段组中的片段互补链延伸。利用热循环反应使延伸的链同具有互补序列的第二片段组的片段杂交,进而产生更长的链。这样就产生了一个以第一条引物为5’末端,以同第二条寡核苷酸互补的序列为3’末端的延伸片段组。这些片段相互之间稍微重叠以致可得到一个便于确定整个序列的片段组。并且,可以通过利用有选择性序列的第一条引物和同第二条寡核苷酸有相同序列并且也有选择性序列的第二条引物来分别制备每一种DNA片段,从而进行有效的序列测定。
常规的长DNA序列测定依赖于鸟枪法,使得相同序列要平均重复读10至20次,并且它还需要克隆和大肠杆菌培养的麻烦步骤,并且不适于自动化。
本发明相比之下允许通过末端序列选择性PCR扩增由凝胶电泳分离的、包含具有几乎相等长度DNA片段的片段组中的一种DNA片段,由此获得以几乎相同速率改变长度的有序排列的DNA片段组。在这些片段中,DNA组一边的末端起始于相同的位点,而另一末端的终止位置以特定长度的间隔而变化。从最长的DNA链相继测定末端的序列。通过一直阅读序列信息直至在和较短的DNA片段末端接近的序列处发生重叠,此方法确保有效地测定所有的序列。
安排DNA片段的长度使片段间重叠序列部分少于50个碱基;这相当于总序列的百分之十至百分之二十。即使测定两条DNA链的序列,整个丰余序列至多为2.5,相当于常规方法的四分之一至八分之一。本发明不存在遗漏小片段的问题;没有片段结合在一起由此不能确定整个序列的问题,虽然这些问题在利用克隆步骤的常规方法中经常遇到。并且它还有由于没有克隆步骤而利于自动化操作的优点。
使用两种限制酶的方法可进行更有效地DNA序列测定。第一和第二片段组是分别通过对DNA的第一和第二次酶消化产生的。因为使用了不同的限制酶所以DNA在不同位点被切割。第一组片段的3’末端总是出现于属于第二组的一个片段中。此3’末端能杂交于第二组的片段上而延伸产生一更长片段。利用同第一片段组DNA片段3’末端杂交的第一条引物进行的互补链延伸反应将产生长至这条DNA片段5’末端的互补链。此互补链3’末端边的序列也和第二片段组的DNA片段互补。提高含上述延伸DNA的反应混合物的温度使杂交体热解离。然后降低温度产生杂交体,延伸的互补链和第二片段组中的DNA形成杂交体。所述延伸链通过互补链延伸进一步延伸,结果合成了长至第二片段组中DNA5’末端的互补链。换句话说,这样产生了含第一和第二组片段的结合片段。利用同此3’末端杂交的引物通过链延伸反应产生具有附着到第一组片段5’末端的第二组DNA片段5’末端的模板。利用第一条引物进行的测序反应将识别出属于第一片段组的DNA组和其相邻部分DNA片段的序列,使得利用重叠序列识别每一DNA片段连接区成为可能。
如上所述,根据本发明,寡核苷酸被引入到DNA片段的末端。利用3’末端有1至4个碱基选择性序列的引物来识别和选择一个DNA末端的碱基序列,此引物和上述寡核苷酸部分杂交,进行PCR扩增,由此仅选择特定片段。此程序免除了克隆步骤,确保全自动化的样品处理。
根据本发明,利用两个碱基做为选择性序列,并且DNA由第一种限制酶消化产生小片段组,这些小片段组通过使用分别制备的16种(4×4=16)引物平行测序。此外,测序前,在加入由第二种限制酶消化获得的DNA片段后通过PCR制备测序模板,由此通过延伸第一DNA片段组的DNA至属于第二DNA片段组的末端而获得模板,并产生一种虽相互重叠但包括DNA整个长度的片段组。从这种模板DNA获得的序列信息包含了与相邻DNA片段重叠的信息。这就提供了一种确定整个碱基序列的容易方法。


图1是描述根据本发明的一个长DNA序列测定例子的概念性图解;图2是描述根据本发明的一个利用酶获得DNA片段例子的概念性图解;图3是表示本发明中使用的引物和引入到DNA片段中的寡核苷酸间关系的图解;图4是描述根据本发明通过选择性DNA聚合酶反应从凝胶电泳分离的DNA片段中获得具有特定长度且具有几乎相同长度DNA片段方法的图解;图5是描述根据本发明的纯化方法的概念性图解;图中DNA片段组含有具有相同序列和细小长度差别的DNA片段;
图6是一描述根据本发明应用物理方法切割DNA产生DNA片段,进行选择性PCR之方法的概念性图解;图7是描述根据本发明利用两种限制酶产生DNA片段和产生延伸片段进行重叠分析获得整个序列之方法的概念性图解;图8是以16条选择性引物进行聚合酶反应及PVCDNA消化产物得到的DNA片段图谱;图9是描述以两类十六条引物利用PCR扩增把DNA片段分成256组之方法的概念性图解;及图10是描述制备包括整个DNA的重叠DNA片段方法的概念性图解。
下面给出了参照实施例时本发明的具体描述,而本发明并不限于下述的实施例实施例1如图1所示,长DNA的分析需要在样品DNA1的位置2进行化学或物理切割。接下来的一步是从这些切割片段中制备一个DNA末端3含一个特定末端碱基而另一个末端4位于样品DNA1不同切割位置的单链DNA片段。从3’末端(末端4)相继阅读得到被测序的部分6。
实施例1涉及利用通过末端消化得到DNA片段的情况。
产生图1所示DNA片段的方法之一是通过外切核酸酶(Amer-sham Co.)和S1核酸酶(Amercham Co.)链续消化末端碱基。下面给出了测定插入到载体中的长DNA(大约10kb长)序列的情况。M13噬菌体双链质粒DNA如M13mp18(Amercham Co.)被用做载体。图2描述了测定根据本发明利用双链M13mp18制备的样品序列的过程。被测序的DNA 20克隆到限制性内切酶BamH1位点21。此载体在Bam位点21和引物位点24间有Xbal 22和PST 123位点。当被限制酶切割,就可得到如图2所示的一长DNA片段25。
然后此外切核酸酶III(Amercham Co.)作用于长DNA片段25几分钟。外切核酸酶III相继从具有5’粘端和平端DNA的3’末端切割双链DNA。通过改变反应时间,有可能获得DNA片段组26产物,其中图2中的双链部份30有不同的长度26。接下来的一步用绿豆核酸酶(S1核酸酶)、核酸酶(Amersham Co.)和Klenow片段(DNA聚合酶)(Amershem Co.)作用于DNA片段组26,由此去除单链部分而得到具有平端的DNA片段组27。把已知碱基序列、具有一个粘端和一个平端的寡核苷酸32连接到DNA片段组27而得到DNA片段组28。为防止寡核苷酸32以相反应向连接到DNA片段27上,寡核苷酸32的非杂交末端为一粘性末端(而非平端)。荧光团31被结合到寡核苷酸32的非杂交末端的5’端来检测DNA片段的分级分离。连接反应进行6至12小时。
然后DNA片段组28被限制酶BamHI消化,并把已知碱基序列的寡核苷酸41(一个末端为粘性末端)连接到切割点上,由此获得DNA片段组29。连接到BamHI位点的寡核苷酸41的碱基序列不同于连接到平端的寡核苷酸32的碱基序列。此DNA片段29的BamHI位点是在特定位点被切割(寡核苷酸41被连接到此位点上)并和寡核苷酸连接。但由于另一端是通过缺失而消化的,连接到另一边的寡核苷酸(32)从严格意义上讲不是结合到在特定位点被消化的片段上。片段组29是一包括有许多不同长度DNA片段的混合物。就是说,DNA片段29(平末端)的寡核苷酸32一边的位置从严格意义上说是非特定的。
DNA测序反应是从寡核苷酸32一边进行的。当对包含有许多不同长度DNA片段混合物的29组进行DNA序列测定的时候,就获得含各种序列混合信号而不能实现成功测序。这就使有必要从混合物中选择仅有特定长度的DNA片段,由此确定碱基序列。根据以前的方法,这些片段被再次克隆(亚克隆),培养菌落后获得特定性菌落。再培养后,纯化DNA片段并且拷贝数增加。根据本发明只有特定的DNA被选择性PCR扩增从而取代了常规的亚克隆。接在DNA片段29的寡核苷酸32后的部分对每一种DNA片段都有不同的碱基序列。如果引物3’末端边的2个碱基在DNA互补链延伸中完全杂交,互补链延伸反应就能发生;但如果不能杂交,互补链延伸反应就不能发生或在很小程度上发生。因此发明者利用接在杂交的寡核苷酸32后的两个碱基对每一种片段不同,这一事实就可仅选择和扩增特定的DNA链(如果有多种片段,那有可能有不同种片段都具有相同的两个碱基序列)。
图3描述了用于扩增的引物和两末端引入寡核苷酸的片段之间的关系。N代表A,T,G或C的一种。用于扩增的引物包括(1)和寡核苷酸41杂交的引物51,(2)和5’末端有荧光团标记的寡核苷酸32杂交的引物61,和(3)后接TG 62的引物52。应该注意的是TG是一用来选择符合5’末端碱基序列类型之DNA片段种类的选择性序列。相应地,当选择性序列含两个碱基时,除了序列TG还有15种选择性序列,可以为5’末端有这15种碱基序列的DNA片段种类提供选择性扩增。就是说,在这种情况中全部16种引物的每一种均由含两个碱基的选择性序列部分和寡核苷酸61部分组成,61寡核苷酸部分形成一个共有序列。引物51一般与所有片段杂交。另一方面,以完全杂交的引物52进行的互补链延伸反应对在末端共有序列后有AC序列的DNA片段能有效地实现。在有不同长度的众多片段种类中仅有特定的种类才能被PCR用选择性引物扩增。这将在图4中得以描述。PCR之前DNA片段组的一部分含有具有不同长度的DNA片段。图4中的上图显示了它们拷贝数目的分布(电泳模式)71。举例说,如果一包含有不同长度DNA片段的混合DNA片段组被有末端TG序列的引物扩增,那么仅从上述混合DNA片段组的样品DNA中获得的末端序列为AC的DNA片段被选择性扩增。PCR后的DNA片段的电泳模式可由图4中的下图所表示为72。这样就能从混合DNA片段组中扩增和分离一种特定种类DNA片段。
上面已显示了通过仅扩增酶(外切核酸酶)末端消化产物(缺失产物)中特定种类片段获得片段的方法。通过改变末端消化反应时间,有可能得到与末端消化反应时间一致、具有不同但几乎相同长度的DNA片段。通过按上述方式处理这些DNA片段,有可能在每一组中仅扩增与末端消化反应时间相一致的特定的片段种类,并为每一组提供相同的长度。按这种方式进行的序列分析可以进行长DNA序列测定。
实施例2如果根据扩增所述特定种类的DNA片段所得到的DNA片段组中仍含有各种长度的DNA片段,可根据下列方法进行纯化图5给出了方法的略图。(a)组包括通过降解所产生的具有不同长度的DNA片段组100。已知的寡核苷酸41和32被连接到所述DNA片段的两个末端,如(b)组所示。接着这些片段进行PCR扩增。(至于PCR中的引物,参见图3的说明)。这样,与寡核苷酸32杂交的引物52在通用序列61的3’末端具有用以碱基选择的两个碱基62(此处为OCR);因此,各种片段中只有TG部分完全一致的片段才能通过PCR来扩增。这导致产生三种片段,如(c0组所示。去除引物后,片段进行混合并热变性和退火;接着除了相同长度DNA之间形成配对外,具有不同长度DNA间也形成配对,如(d)组所示。
因为这些DNA两个末端的碱基序列是一致的,就形成了环101。如果通过S1核酸酶降解这一单链部分,它就变成在双链部分上具有切口102的类型,如(e)组所示。如果口部分存在一个或更多碱基的缺失,随后进行的连接修复反应将不能顺利进行。为了避免这一情况,DNA聚合酶作用于切口部分,如103,通过互补链延伸得到(f)组。接着进行DNA连接酶修复双链步骤得到(g)组。通过DNA聚合酶和连接酶修复双链将产生较高比例的具有相同长度(双链)的短DNA链104。接着DNA链(双链)104进行热变性以得到单链,并且从所述(c)组得到(g)组的反应重复多次;这可能使得具有不同长度的各种DNA链变为具有长度更加一致的片段如DNA链104(双链)。因此,这也可能使得通过降解得到的一个片段组的长度一致。应用S1核酸酶的方法可在连接寡核苷酸前用于(a)组。
实施例3在所述实施例2中,通过降解减少DNA的大小。这也可通过超声波或激光或化学降解剂剪切片段。例如,图6所示为应用超声波剪切的情况。当应用超声波时,前切发生是随机地,并且剪切位点120是随机位点。产生的片段随机地来自DNA的各部分,为了提高分析的效率,得到具有不同长度、从特定位点起始的片段是较为方便的。
连接有荧光标记111和生物素112的寡核苷酸110在样品DNA降解前连接到样品DNA的两个末端。接着降解DNA并连接寡核苷酸121到片段上。保护片段的荧光标记侧以免进行连接反应。
例如,将片段荧光标记末端转变成粘性末端以免寡核苷酸连接到该末端上。含有标记的样品DNA被制成片段,并且降解部分被制成平端;接着具有与寡核苷酸110不同碱基序列的寡核苷酸121通过连接反应与其结合。形成的片段根据大小通过电泳进行分离。带有链亲和素131的磁珠130用于仅把连有生物素的长度更加相似的DNA片段135分离出来;接着使用与寡核苷酸110和121互补的引物进行PCR扩增。这样,与寡核苷酸121杂交的引物必须是带有碱基分离序列的引物,例如,那些除了互补序列并在3’末端侧带有TG,如图5所示。这保证了从长度相似的DNA片段组中只选择出特定长度的片段并被扩增。这使得根据大小从每一组中可分离到1到3种DNA片段。根据实施例2的方法可将含有不同长度的多种DNA片段的组制成单一长度。
根据前面讨论的样品制备方法,可从样品DNA末端得到具有特定长度间隔的DNA片段组。因此,这些DNA片段组的连续碱基测序可确保有效的DNA测序。属于每个DNA片段组的DNA片段应优选调整至约300碱基长。而且,DNA片段组中具有相似长度的两个组应制备成具有长度约3000碱基的差别。这是因为DNA测序仪易读序列的长度约为400碱基。当应用可确定更长的DNA片段序列的长胶(能确定800至1000碱基序列)时,DNA片段可制成长度上相差600至800碱基。
实施例4第4个实施例是关于通过限制酶消化待分析的DNA以确定每个片段和相邻DNA片段的序列,并应用序列重叠连接片段而确定全部DNA序列的方法。酶法降解产物应包括非重叠的全部序列。如果我们选择这些产物中的长片段,并确定这些片段的序列及相互重叠的邻接序列,可实现最有效地测序,因为在测序中产生较少的冗余序列并且待测序的片段可同时被测序。下面描述了一个应用pUCDNA(约2.7kb)的例子图7说明了本发明的流程。
Hhal(GCG↓C)用作第一个限制酶,同时Sau3Al(↓GATC)用作为第二个限制酶。不必说,其它限制酶如NIa3,PssI,MaeII,HinPl,Taql,MseI,Sau96及其它末端的核酸酶也可以使用。样品DNA溶解于缓冲液中并分到两个容器中。将Hhal和Sau3Al加入到每个容器中以消化DNA。从含有由Hhal消化的第一片段组的溶液中去除酶,并将序列已知的第一个寡核苷酸连接到3’—末端。(可使用末端转移酶,可加上poly—A尾等)这一寡核苷酸用作引物部分,所以要求10碱基或更多。5’—末端不连接任何东西。
序列已知的第二个寡核苷酸(10碱基或更多)被连接到由Sau3Al消化的第二片段组的5’—末端。没有寡核苷酸连接到3’—末端,其通过DNA聚合酶或其它方法引入双脱氧核苷酸(终止子)被封闭;换句话说,应采取措施保证已知序列的引物即使在多次聚合酶反应后也不会与该3’—末端杂交。这是因为,如果与引入到5’—末端的寡核苷酸互补的寡核苷酸被引入到3’—末端,属于第二片段组的片段由于循环式互补链延伸反应可利用第二个寡核苷酸进行PCR扩增;这种情况必须避免,因为该目的是制备如下所述的延伸片段。含有第一片段组的样品溶液的一部分可用于通过对利用与DNA片段3’—末端未知序列部分相杂交的16条引物(第一引物)产生的互补链延伸产物进行凝胶电泳来检测样品中片段大小,从而得到凝胶电泳图谱(图8中图谱1),这16种荧光标记引物(具有选择碱基的第一引物)含有包括两个碱基的选择序列。该图谱显示了对于第一片段组每一末端的二碱基序列的DNA片段长度。因为聚合酶反应后几种引物产生了不只一种的产物,所以在测序前这一DNA样品(片段混合物)按大小进行分离。
第一片段组进行凝胶电泳分离,并且通过参考图谱,根据大小进行DNA片段分离,以保证根据末端的二碱基进行分离的每一组中大概含一种DNA链。小片段可被排除。在PUC的例子中,分离成两种大小的组;约150至270碱基和300到500碱基(第一和第二组)。另一方面,第二片段组也进行凝胶电泳分离,以分离长度大于约100碱基的片段。第二片段组所含有的DNA片段加到包括第一片段组的第一和第二组中。
热稳定DNA聚合酶,聚合酶反应底物,生物素标记的第一引物和基本上与第二寡核苷酸序列相同的引物加到第一和第二组中,进行PCR扩增。这使得第一片段组的DNA只扩增出那些延伸至属于具有部分相同序列的第二片段组的DNA的5’—末端的DNA片段。扩增后,利用生物素和亲合素的结合仅分离出延伸的片段,并用作DNA测序反应的模板。扩增后,双链进行热解链以产生具有第一引物杂交位点的模板DNA链。根据第一组中含有的DNA片段数目将含有模板DNA链的溶液分部,并将具有选择序列的第一引物加入每一部分,进行测序反应。
使用延伸的第一片段组作为模板可保证得到第一DNA片段序列及其邻接序列。通过连接DNA片段,邻接序列能用于得到全序列。
如果应用与两种限制酶消化的每一片段组相杂交的引物通过PCR产生延伸片段,则该方法可更加有效(如图9和10所示)。
取一半DNA并用第一个四碱基识别酶Hhal进行剪切以制备第一片段组。接着将第一寡核苷酸连接到3’—末端已知序列上。另一半DNA分到另一容器中,并用第二种酶Sau3A1进行剪切以制备第二片段组。然后将第二寡核苷酸连接到5’一末端已知序列上(图9)。封闭3’—末端以免在互补链延伸时被延伸。对第一片段组进行凝胶电泳以收集超过150碱基长的DNA片段。分离第二片段组以收集超过100碱基长的片段。收集的第二组片段同所述第一片段组混合,混合液分成16份(1至16组),并进行PCR扩增。这一步使用与第一寡核苷酸基本互补的第一引物,和16种第二引物,第二引物具有与第二寡核苷酸相同的序列及一部分限制酶识别序列和3’—末端侧二碱基选择序列。反应中,一种选择引物和第一引物被引入到每一组中,这样使得第一引物进行互补链延伸,直到与第二寡核苷酸互补的链。通过互补链与属于第二片段组的片段重新杂交进行循环反应。这些延伸链中,只有能与具有选择性序列的第二引物相杂交的链才能进行PCR扩增,因而产生大量拷贝。换句话说,根据第二寡核苷酸后面的二碱基序列和5’—末端的前切位点序列将DNA分类,并将分类的DNA扩增。将PCR反应中的引物从所述方法中得到的16组反应产物中去除,并将每组的产物分成16份,总共256份。每一份中加入带有荧光标记和3’—末端含有二碱基选择序列(16种)的每一种第一引物,并进行互补链延伸。根据第一寡核苷酸的已知序列后的两碱基序列和片段3’—末端侧的部分识别序列(从经过PCR扩增后引物延伸链的角度看在5—末端侧)将每份中(共256份)含有的DNA片段分类。进行凝胶电泳检测共256(16×16)份中延伸的DNA链。当每一份中只有一种片段时,则该份只含有一种与选择引物杂交而通过互补链延伸而延伸的DNA片段;这样向其中加入双脱氧核苷酸(ddNTP)以进行测序反应,并通过荧光DNA测序仪确定序列。当每一份中含有两种或更多种的DNA片段时,通过凝胶电泳进行大小分离后测序或通过具有3至4碱基的选择序列的引物进行确定。
实施例5本例指明了一种运用PCR得到含有不同DNA片段的DNA片段组的方法(图10)。
取DNA并用四碱基识别酶NI13(CATG↓)进行消化。凝胶电泳分离大于150碱基长的DNA片段,并将序列已知的第一寡核苷酸连接到消化片段的3’—末端侧。去除未反应的寡核苷酸和连接酶。纯化后得到第一片段组。取DNA并用第二种四碱基识别酶Sau3Al进行消化。凝胶电泳分离大于100碱基长的DNA片段,并将序列已知的第二寡核苷酸连接到片段的5’—末端侧,去除接酶和相似的底物,纯化后得到第二片段组。
两片段组等摩尔混合,如图10所示。混合样品分到256支管中,作为PCR模板。制备16种含有与第一寡核苷酸基本互补的序列和3’—末端侧具有二碱基选择序列的第一引物,同时制备16种含有与第二寡核苷酸基本相同序列并在3’—末端侧带有二碱基选择序列的第二种引物作为第二引物。这样,生物素可相似底物加到靠近第二引物的5’—末端。制备第一和第二引物间所有可能组合的共256个引物对,并将每一对加入到一个混合样品中。加入热稳定DNA聚合酶和DNA互补链延伸底物到样品中,进行PCR扩增。
在混合样品中存在各种类型的DNA。与第一DNA片段组中互补链完全匹配的带有选择序列的引物1首先被延伸。然后延伸的引物1与第二DNA片段组中具有与该延伸链互补序列的DNA片段杂交,使链延伸。直到延伸至位于第二片段组的5’—末端与第二寡核苷酸互补的序列,则引物1的延伸停止。该DNA片段被称为杂合片段(涉及第一和第二片段组的DNA片段的一种结合形式)。第二引物可与由引物1延伸而来的这条链的3’—末端杂交;但是,只有当位于第二引物3’—末端的选择序列匹配时,第二引物才能延伸,换句话说,只有当以第一和第二引物的选择序列做为模板的属于第一和第二片段组的DNA片段配对时,互补链延伸反应才能进行;然后进行PCR扩增。也就是说仅有同第一和第二引物选择性序列配对的杂交片段才能被选择性扩增。扩增后,DNA被纯化或第二引物中的生物素被固定在珠子之类固体物表面的亲和素(生物素/亲和素结合)捕获,由此仅提取靶DNA。
下一步的通过DNA测序反应测序和前面一样,如给出的所述实例。在本实施例中,DNA分成256管。也有可能在固体表面辨别每一种DNA的第一或第二引物并将引物固定其上,再分别加入每一种剩余的引物种类,然后反应就可以进行。
下面列出了图中的参照号码及文字描述。
1,20样品DNA
2切口位点3.一个DNA片段末端4另一个DNA片段末端5DNA片段组6被测序的部分21BamHI位点22XbaI位点23Pstl位点24引物位点25长DNA片段26外切核酸酶III降解的DNA片段27平端DNA片段28两末端带有已知碱基序列的寡核苷酸的DNA片段29每个末端带有不同已知碱基序列寡核苷酸的DNA片段30双链部分31,63,111荧光基因32已知碱基序列的寡核苷酸41已知碱基序列的另一寡核苷酸51与BamHI位点上寡核苷酸杂交的引物52与寡核苷酸32杂交的引物61通用碱基序列部分62与通用碱基序列部分邻接的二碱基71PCR前DNA片段的电泳图谱72PCR后DNA片段的电泳图谱
100降解产生的不同长度DNA片段101在DNA片段的变性和退火过程中形成的未杂交部分102S1核酸酶降解产生的缺口部分103在缺口部分延伸的互补链部分104相同长度的双链部分110通过连接引入到DNA上的寡核苷酸112生物素120超声波降解形成的剪切位点121其它寡核苷酸130磁珠131链亲合素135分离的长度几乎相同的DNA片段204,141酶1降解产生的DNA片段205,142酶2降解产生的DNA片段143第一寡核苷酸144第二寡核苷酸145封闭的3’—末端146片段混合物147具有选择序列的第一引物148生物素149第二引物150带有亲合素的颗粒(磁珠)151待测序的模板DNA片段152荧光标记具有选择序列的第一引物
153酶2剪切位点154酶1剪切位点108,155产生的延伸片段13荧光基团
权利要求
1.一种DNA制备方法,包括(1)第一步通过消化双链DNA产生多个具有不同长度的DNA片段;(2)第二步把有已知碱基序列的寡核苷酸通过在第一步的消化处连接,引入到所述DNA片段中;和(3)第三步利用含同所述寡核苷酸互补的碱基序列并在3’末端有1至4个碱基的选择性序列以在一个DNA片段末端识别和选择碱基序列的引物,对在上述第二步中获得的DNA片段进行互补链延伸反应并增加DNA片段拷贝的数目。
2.根据权利要求1的DNA制备方法,其中所述第一步包括限制酶处理的步骤。
3.根据权利要求1的DNA制备方法,其中所述第一步包括外切核酸酶和S1核酸酶处理的步骤。
4.根据权利要求1的DNA制备方法,其中所述第一步包括利用S1核酸酶消化DNA单链部分及用DNA聚合酶和连接酶修复双链DNA的步骤。
5.根据权利要求1的DNA制备方法,其中所述第一步包括激光物理切割的步骤。
6.根据权利要求1的DNA制备方法,其中所述第一步包括由超声波进行物理切割的步骤。
7.一种DNA制备方法,包括(1)第一步通过消化双链DNA产生多个具有不同长度的DNA片段;(2)第二步把已知碱基序列的第一条核苷酸通过连接在所述步骤1消化处引入到所述DNA片段的一个末端,并把已知序列但与第一条寡核苷酸不同的第二条寡核苷酸引入到所述DNA片段的另一末端;(3)第三步利用含同上述第一条寡核苷酸互补的碱基序列的引物及含同所述第二条寡核苷酸互补的碱基序列,5’末端引入荧光基团标记并在3’末端有用以在所述DNA片段一个末端识别和选择碱基序列的1至4碱基选择性序列的引物,对在第二步中获得的DNA片段进行互补链延伸反应并增加DNA片段拷贝的数目。
8.一种DNA制备方法,包括(1)第一步获得已知碱基序列的寡核苷酸引入到由消化双链DNA产生的消化部分的DNA片段;(2)第二步利用至少一种含同所述寡核苷酸互补的碱基序列并在3’末端有用来识别和选择所述DNA片段一个末端之碱基序列的1—4个碱基选择性序列的引物,对所述DNA片段进行PCR(聚合酶链反应);(3)第三步通过凝胶电泳分离和分级DNA片段。
9.一种DNA制备方法,包括(1)第一步获得已知碱基序列的寡核苷酸已引入到包括多个双链DNA的DNA片段组中的DNA片段;(2)第二步利用含同所述寡核苷酸互补的碱基序列并在3’末端有用来识别和选择DNA片段一个末端之碱基序列的1至4个碱基选择性序列的引物,进行至少一次互补链延伸反应来增加DNA片段拷贝数目。
10.一种DNA制备方法,包括(1)第一步获得已知碱基序列寡核苷酸引入到包括多个双链DNA的DNA片段组中的DNA片段;(2)利用含同所述寡核苷酸互补的碱基序列及限制性序列识别序列的一部分及在3’末端有用来识别和选择DNA片段一个末端之碱基序列的1至4个碱基选择性序列的引物,进行至少一次互补链延伸来增加DNA片段的拷贝数目。
11.一种测序方法,包括对根据权利要求1至10中任何一条DNA制备方法获得的模板DNA片段所产生的测序反应产物进行电泳,从而确定碱基序列的步骤。
12.获得做为DNA碱基测序模板的DNA片段的DNA制备方法,所述方法包括覆盖按以下步骤由所述不同种类限制性内切酶消化产生的片段的DNA互补链延伸反应过程(1)由至少两种不同限制性内切酶(第一和第二限制性内切酶)消化样品DNA分别产生第一和第二片段组;(2)对消化的DNA片段的末端分别用第一和第二条寡核苷酸修饰后把第一和第二片段组混合;(3)利用同至少一个修饰末端杂交的引物进行互补链延伸反应。
13.根据权利要求12的DNA制备方法,其中已知碱基序列的第一条寡核苷酸引入到由至少一种酶(第一种酶)消化得到的DNA片段的3’末端而变成与所述引物杂交的部分区域。
14.根据权利要求11的DNA制备方法,进一步包括(1)把有不同于所述第一条寡核苷酸序列的第二条寡核苷酸加到属于第二DNA片段组DNA片段5’末端的步骤;(2)利用同所述第一条寡核苷酸有10个或更多互补核苷酸序列的第一条DNA引物,及同所述第二条寡核苷酸有10个或更多基本相同核苷酸序列的第二条DNA探针(引物),进行互补链延伸反应的步骤。
15.根据权利要求12的DNA制备方法,进一步包括(1)把有不同于所述第一条寡核苷酸序列的第二条寡核苷酸加到属于第二片段组DNA片段的5’末端的步骤;(2)利用同所述第一条寡核苷酸有10个或更多互补核苷酸序列的第一条DNA引物,及同所述第二条寡核苷酸有10个或更多基本相同序列的第二条DNA引物,进行互补链延伸反应。
16.根据权利要求14和15任何一条的DNA制备方法,进一步包括(1)阻断属于所述第二DNA片段组的DNA片段之3’末端链延伸能力的步骤;和(2)允许所述第二条DNA探针仅同所述第一条DNA探针的互补链延伸产物杂交的步骤。
17.利用互补链延伸反应产生包含第一和第二DNA片段组DNA片段的DNA制备方法,所述方法包括(1)用第一种限制酶消化样品DNA产生第一DNA片段组及以第二种限制酶消化样品DNA产生第二DNA片段组的步骤;(2)混合所述第一DNA片段组和所述第二DNA片段组的步骤;和(3)利用同所述第一DNA片段组杂交的第一条探针及同所述第二DNA片段组杂交的第二条探针进行至少一次的互补链延伸反应的步骤。
18.用于DNA制备以获得用于测定DNA碱基序列的DNA片段的试剂盒,所述试剂盒包括至少16种包含5’末端10个或更多已知核苷酸序列、全部或部分限制酶识别序列及3’末端两个碱基的选择性序列或基本相同组合的DNA探针。
19.根据权利要求18的试剂盒,其中的限制酶为识别4碱基的内切酶。
20.一种碱基序列测定方法,其中利用根据权利要求12至17的任何一条的DNA制备方法获得的DNA片段为模板,通过对测序反应产物电泳确定碱基序列。
21.一种碱基序列测定方法,其中利用权利要求18至19任何一条的试剂盒的DNA制备方法获得的DNA片段为模板,通过对测序反应产物电泳进行碱基序列确定。
全文摘要
描述了一种DNA制备方法,所述方法包括通过消化双键DNA产生多个有不同长度DNA片段的第一步;在第一步的消化处通过连接把已知碱基序列的寡核苷酸引入到所述DNA片段上的第二步;以3′末端有选择性序列的引物对所述第二步中获得的DNA片段进行互补链延伸反应并增加DNA片段拷贝数目的第三步。
文档编号C12Q1/68GK1131157SQ9512113
公开日1996年9月18日 申请日期1995年12月21日 优先权日1994年12月22日
发明者神原秀记, 冈野和宣, 藤森清 申请人:株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1