利用高保真dna聚合酶介导的替换性引物延伸反应进行序列分析的方法

文档序号:564231阅读:839来源:国知局

专利名称::利用高保真dna聚合酶介导的替换性引物延伸反应进行序列分析的方法
技术领域
:本发明涉及一种DNA序列分析方法,特别是涉及一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法。
背景技术
:基因组测序是当今生命科学领域中的一项非常重要的工作。自1990年人类基因组计划(HGP)启动至2001年基本完成,基因组研究有了飞速地发展。为揭示基因功能,开发个性化药物和明确生物物种间的进化关系以及不同生物体生命活动的异同,需要对更多的基因组进行测序。从这个意义上说,基因组测序仅仅是后基因组时代的开始。基因组研究的发展需要新一代测序技术的出现。最近,美国国家卫生研究院(NIH)提供"革命性基因组测序技术"(RevolutionaryGenomeSequencingTechnologies)项目的基金,向生物科技发起了新的挑战计划到2009年,达到每测定一个人的全基因组序列只花费10万美元的目标,而到2014年,费用将降为1000美元。"1000美元基因组"所含的意思是,承诺DNA测序将便宜到个人足以负担得起,并使人们认为这种能把自己的基因组序列存盘供医生参考的一生一次的支出是值得的。此外,廉价测序技术能扩大基因组的研究者队伍,供给研究人员更多的基因组以便于对照了解病人和健康者之间的个体差异,从而使基因序列信息更有价值。目前,所有这些应用的障碍在于基因图高昂的制作成本及有效的准确度。有关技术进展Sanger测序方法的衍生这类方法通过荧光标记双脱氧核苷酸,延用双脱氧的链末端中止法原理,联合毛细管电泳分离技术获得基因组信息。该方法自发明以来,一直具有准确可靠的优点。尽管这种方法对完善人类基因组测序做出了贡献,但由于其所用材料昂贵、检测费时,限制了将其运用在1000美元测序的计划中(1,2)。杂交测序(Sequencingbyhybridization):以杂交原理为基础的代表技术即为基因芯片技术,基因芯片同样具有潜在的突变检测能力。该项技术依赖于大量的特定探针与标记样品进行杂交,通过检测配对与否的杂交信号强弱进而判断样品中耙分子的数量。正是由于这种单点阵的识别,阻碍了其在高通量基因测序中的运用。归结原因,其一,对于完成人类长达30亿对碱基的基因组测序来说,基因芯片需要大量天文数量的探针;其二,基因芯片对于具有高度重复序列的样品是难以测定的(3,4)。DNA合成法测序(Sequencingbysynthesis):通过模仿DNA分子复制过程,用带标记的dNTP代替ddNTP加入到新互补链中,来完成信号的检测。近来有报道,一种基于合成法,运用显微镜分离检测不同标记的dNTPs的技术平台被应用于芯片中(5)。而聚合酶克隆已成功运用在细菌基因组的再测序中(6)。另外有新的尝试将聚合酶克隆交联于浸没在乳液状中的株状微粒上,在扩增反应结束后,每一个微粒都会携带目的DNA分子的许多拷贝进而同时进行测序(7,8)。若能有机的结合这些技术,将能使基因测序费用大幅度降低成为可能。物理化学化方法目前,一种新的被称作纳米测序的方法正在兴起,以4种碱基间的物理性质差别为基础,将这种差别转变成为可以检测的信号,从而进行测序。理论上是可以根据每一种碱基的化学质量、大小、化学键和所带电荷来识别单碱基的类型。但该方法可能存在的弊端是,相对于全基因组来说,其目的单链DNA的制备会比较困难(9,10)。从医学角度看,我们也许不需要测定出全部基因组中的30亿对碱基的序列,而只需集中在占人类基因组中10%的编码区域,即可获得足够的生物医学相关信息。基于这种考虑,在不久的将来,人们即能在出生时即获得个人的基因组编码信息而受益一生。就技术可行性而言,我们认为生物芯片的推广将会使1000美金测序计划变成现实。根据制造集成芯片中的墨菲定律,芯片的密度必将增加到一定水平。当一块基片可以制备为包含了10万到30万阵列,而每个位点能识别IOOO个核苷酸,届时,IOOO美元测出全基因序列的计划将不会是梦想。当然,目前有关IOOO美金测序计划的研究并没有触及到核心问题或者说还没有找到合适的相关方法。即便在芯片这个平台中,单碱基延伸法可以完成木部分基因组序列的测定,但离1000美金测序的目标还很远,且无法测定简单重复序列。据认为测序技术上的瓶颈在于使用了"基因扩增"的方式来进行"读取DNA"序列,若能绕开"基因扩增"的方式读取"DNA序列"的方法,即可使缩短时间和减少成本成为可能(ll)。为了加速1000美金测序计划的研究进展,2006年10月4日美国X奖励基因会设立了总额为1000万美金的奖项,以奖励最终完成此目标的研究团队(12)。1000美金测序计划的研究将推动相关领域技术的快速发展和个体化医学的全面推行。1000美金测序计划的关键技术,包括高通量与每一被测序列的长度达到上百个甚至上千个碱基,基于目前芯片制造技术已达到每芯片含100万个短序列的密度。因此,如何使单一被测定序列得到更多的信息,是1000美金测序计划中有待解决的最为现实的难题。目前,我们正在尝试on/off分子开关与芯片失活/激活技术相结合,以期达到每位点识别100个碱基的目标。如果目标可以实现,那么1000美金测全基因组序列计划将在未来十年内完成,毫无疑问,这将不仅为个体化治疗提供强有力的保证,而且为提高人类生存质量提供依据。而我们提出的基于纳米级分子开关的测序方案,除了能对突变位点进行基因分型外,每一延伸引物尚可一次性识别几个至十个核苷酸(13,14)。这种碱基步行法用于测序,与探针杂交法和连接酶介导的测序方法在效果上相似,均只能得到较短的序列集合,在应用于基因组测序时将会无可避免地存在多个未知序列。因此,若以on/off分子开关为基础,偶联两种不同的引物延伸反应即部分性链终止和替换延伸反应于一个反应体系,将使芯片上的一个延伸弓I物解码数百甚至更长的碱基序列。
发明内容本发明的目的是克服现有技术中的不足,'提供一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法。本发明的技术方案概述如下一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,包括如下步骤(1)准备耐3'-5'核酸外切酶消化的引物并对这些引物可实际参与反应的三末端自由羟基进行定量测定;(2)以单一种类的荧光标记的ddNTP与非荧光标记的同一种类dNTP为混合底物,在不具有3'-5'核酸外切酶活性DNA聚合酶催化下,进行部分性链终止引物延伸反应;(3)人工合成的耐3'-5'核酸外切酶消化的dNTP在具有3'-5'核酸外切酶活性的高保真DNA聚合酶催化下进行的替换性引物延伸反应;(4)偶联部分性链终止引物延伸反应和替换性引物延伸反应并重复使用这一偶联过程。所述引物为三末端修饰的引物或三末端未修饰的引物。所述三末端修饰的引物为耐3,-5,核酸外切酶消化的修饰。所述具有3'-5'核酸外切酶活性的高保真DNA聚合酶为Vent高保真DNA聚合酶、DeepVent高保真DNA聚合酶、Pfu高保真DNA聚合酶、Sso7d-PfU高保真DNA聚合酶或Kapa高保真DNA聚合酶。所述不具有3'-5'核酸外切酶活性DNA聚合酶为TaqDNA聚,酶、T7测序酶、Vent—DNA聚合酶、DeepVenfDNA聚合酶。所述人工合成的耐3'-5'核酸外切酶消化的dNTP为硫化修饰的PS-dNTP、环化修饰的acy-NTP或锁核酸。所述荧光标记的ddNTP与非荧光标记的dNTP的浓度比例在待测序列中单一碱基的最大连续重复程度小于10个时为1/3至1/30。所述荧光标记的ddNTP与非荧光标记的dNTP浓度比例在待测序列中单一碱基的最大连续重复程度小于100个时为1/31至1/300。所述荧光标记的ddNTP与非荧光标记的dNTP浓度比例在待测序列中单一碱基的最大连续重复程度小于1000个时为1/301至1/3000。本发明的优点是1.本发明为世界上第一个偶联部分性链终止延伸反应与替换性引物延伸反应用于测序的,这一设计是本发明可行性和具有高通量的基础。2.荧光标记的ddNTP只被用于中间反应过程,当信号(碱基识别)获取后,利用高保真DNA聚合酶的3'-5'校正功能清除了新合成链中不能延伸的碱基,使其3'端得以活化,可继续另一反应过程。3.此外,耐3'-5'核酸外切酶消化的dNTP与具有3'-5'核酸外切酶活性的高保真DNA聚合酶结合所进行的替换性引物延伸反应,能清除荧光ddNTP,减少背景噪音,并使反应同步化。4.该方法采用荧光ddNTP成熟技术替换目前合成法测序中使用的荧光dNTP非成熟技术,结合替换性引物延伸反应使经典的链终止测序法与合成测序法两种看似不相容的技术偶联到一个反应体系中。5.该方法与多种技术平台相容,特别适宜于基于芯片的序列分析。5图1为本发明的方法工作原理示意图。图2为本发明与芯片技术相容示意图。具体实施例方式本发明方法的关键为对需要延伸的耐3'-5'核酸外切酶消化的引物进行部分失活与重新激活的循环反应。如图1所示。准备耐3'-5'核酸外切酶消化的引物并对这些引物可实际参与反应的三末端自由羟基进行定量测定;(对三末端自由羟基进行定量测定是指运用不具有3'-5'核酸外切酶活性DNA聚合酶介导以荧光标记的ddNTP为底物进行单碱基延伸反应和随后利用3'-5'核酸外切酶切除引物三末端新加上的带荧光的碱基。)通过对待延伸引物(耐3'-5'核酸外切酶消化的引物)以单一种类的荧光标记的ddNTP与非荧光标记的同一种类dNTP为混合底物,在不具有3'-5'核酸外切酶活性DNA聚合酶催化下,进行部分性链终止引物延伸反应,通过ddNTP与dNTP混合底物中的ddNTP连接到新生DNA链的3'末端使延伸反应终止。(ddNTP为双脱氧核糖核苷酸)(荧光标记的ddNTP与非荧光标记的dNTP混合物为ddATP/dATP或ddTTP/dTTP或ddCTP/dCTP或ddGTP/dGTP)该反应由测序酶如T7测序酶所介导(也可以采用无校正作用的TaqDNA聚合酶或Vent—DNA聚合酶或DeepVenfDNA聚合酶所介导)。由于ddNTP与dNTP混合底物中的dNTP并不导致延伸反应的终止,因此,根据待测序列中单一碱基的连续重复程度可调整ddNTP/dNTP的比例,通常为1/10至1/1000之间当待测序列中单一碱基的最大连续重复程度小于10个时,这一比例为1/3至1/30;当待测序列中单一碱基的最大连续重复程度小于IOO个时,这一比例为1/31至1/300;当待测序列中单一碱基的最大连续重复程度小于1000个时,这一比例为1/301至1/3000。但是,当待测序列中特定区域的单一碱基的连续重复程度大于1000个时,本发明的测序结果会出现误差。在部分性链终止引物延伸反应之后,通过多次洗涤去除残留在反应体系中的ddNTP荧光信号,当使用芯片测序时,可向芯片加入不含ddNTP和dNTP的一倍浓度PCR反应缓冲液,孵育30秒至一分钟。重复清洗2-5次。然后通过荧光扫描装置检测待延伸引物上的荧光信号强度。当一种碱基的反应完成,清洗完成和检测完成之后,新生DNA分子的3'末端处于两种状态,其中一部分三末端含有ddNTP残基而无可延伸的3'末端自由羟基;另一部分则含有dNTP残基而拥有可延伸的3'末端羟基。因此,为使新生链在使用另一种ddNTP/dNTP混合底物时具有足够的数量且数量基本恒定的待延伸羟基,并清除和减少另一新碱基检测时的背景荧光信号,本方法通过引入替换性引物延伸反应达到上述目的。替换性引物延伸反应由具有3'-5'核酸外切酶活性的高保真DNA聚合酶催化下进行。具有3'-5'核酸外切酶活性的高保真DNA聚合酶可以选用Vent高保真DNA聚合酶(也可以选用DeepVent高保真DNA聚合酶、Pfo高保真DNA聚合酶、Sso7d-Pfii高保真DNA聚合酶或Kapa高保真DNA聚合酶)。在替换性引物延伸反应中,不耐3'-5'核酸外切酶消化的ddNTP和dNTP残基被清除,而耐3'-5'核酸外切酶消化的dNTP则被整合进新合成的DNA分子中,这一反应的结果是耐3,-5,核酸外切酶消化的dNTP替换了新生DNA分子三末端不耐3,-5,核酸外切酶消化的ddNTP和dNTP残基,从而使反应体系同步化,激活了那些因ddNTP掺入而失活的三末端。随着荧光标记的ddNTP被消化,反应体系中的原有荧光信号便可用物理的漂洗方式予以清除,漂洗仍使用不含荧光ddNTP的一倍浓度PCR反应缓冲液,一般漂洗2-5次,每次30秒至一分钟。然后,依次进行另一种碱基的反应。四种碱基的反应顺序是固定的,可选用其16种排列中的特定一种排列作为程序。上述部分性链终止引物延伸反应和替换性引物延伸反应的不断循环,和依次分别对构成DNA的四种组分A、T、C、G进行反应,通过引物的失活过程获得待测定碱基的性质和数量;通过替换性引物延伸反应使失活的部分引物得以重新激活,从而使该反应能得以循环进行。从信号获取的角度,部分性链终止为直接解码或测序的反应过程。这一步与Sanger's测序原理一致,均可能出现延伸产物所带荧光颜色的区别和同一种引物中延伸产物长度不一。在Sanger's酶法测序中,不同长度产物通过电泳进行辨认,但在芯片测序反应时,由于延伸反应在固相面进行,反应产物不可能电泳。在这里,延伸产物的长度由所检测到的荧光信号的强度所反映。例如,当ddNTP/dNTP的比例为1/1000时,单一种碱基的不同长度重复序列的延伸产物的荧光信号强度在重复数小于32时基本上以1/1000为量子化单位变化(表二)。对芯片测序反应而言,信号的标准化可通过两方面所达到。首先,如图2所示,通过对芯片进行以100%荧光标记的ddNTP为底物的单碱基延伸反应,以获取饱和或最大荧光强度,作为100%参考值。另外,可通过选取信号强度相近且频率出现最高的低信号作为一个碱基延伸反应的基本量子化信号的平均值,当使用ddNTP/dNTP为1/1000时,这一基本量子化信号的平均值接近于饱和式最大荧光强度即100%参考值的1/1000。Sanger's酶法测序由于要求电泳,无法直接应用于芯片测序。另外,Sanger's酶法测序可读长度一般仅为400-800碱基,后一点是由于末端终止法测序反应过程中可用于延伸反应的含3'末端羟基不断消耗的原因。与Sanger's酶法测序相比,虽然目前的循环合成法测序在理论上具有一定的优点,但因引入多种新的化合物,新生链的延长长度受到极大限制,仅为10-100碱基之间,其实际应用受到限制。有鉴于此,本发明结合Sanger's聚合酶介导的末端终止法,使用了ddNTP/dNTP混合底物,应用于部分性链终止引物延伸反应中。同时,本发明结合了链合成测序法对待测序列每一种碱基分步进行反应的原理,通过发明由耐3'-5'核酸外切酶消化的dNTP与具有3'-5'核酸外切酶活性的高保真DNA聚合酶所介导的替换性引物延伸反应,使Sanger's酶法末端终止测序和链合成循环反应测序这两种偶联为一个反应体系。部分性链终止引物延伸反应与替换性引物延伸反应的不断循环,和依次分别对构成DNA的四种组分A、T、C、G进行反应及循环,可使新生链的长度达到及超过Sanger's酶法末端终止测序。如图2所显示,荧光信号强度的标准化之一为通过单碱基延伸反应所得到测序微芯片在含四种混合的荧光标记ddNTP和待测模板反应液中孵育,使得芯片上每一个与相应模板结合的引物都延伸一个碱基,检测其信号强度作为参考当量100%。然后,芯片移入含有3'-5'核酸外切酶的反应液中孵育,让芯片回归初始状态,并检测信号强度是否接近于零。这一步用于实验仪器的校准,并检测了高保真DNA聚合酶的工作效率。单碱基延伸芯片技术已得到广泛应用。与普通测序所用引物不同的是,本发明应用于芯片技术平台时,其芯片上的引物3'末端须经过修饰而具有耐3'-5'核酸外切酶消化的特性。如图2所举例,在选定的特定引物点,向芯片加入含ddATP/dATP的混合反应液进行孵育时,其中ddATP为绿色荧光标记而dATP为非荧光标记,若待测模板在此处序列含两个T碱基,新合成的DNA序列则可相应延伸两个A碱基。部分性链终止引物延伸反应完成后,向芯片上加入不含ddNTP和dNTP的一倍浓度PCR反应缓冲液,重复清洗2-5次,通过多次洗涤去除残留在反应体系中的背景荧光信号及多余模板。然后检测其信号强度,以判断序列当前位置腺嘌呤的个数。假定芯片该点含有约10000个引物,需要延伸2个腺嘌呤,而ddATP/dATP的浓度比为1/100,当引物延伸第一个A碱基时,大约有9900个dATP进入新合成的DNA分子(10000x99/100),同时约有100个引物3'末端被引入绿色荧光标记的ddATP(10000x1/100)。由于ddATP的3'末端不含自由羟基而反应终止,因此当延伸第二个A碱基时只有剩余的9卯0个引物可以继续延伸,其中又有99个引物被引入绿色荧光标记的ddATP(9900x1/100),此时模板序列的T碱基己完成复制过程但反应液中缺乏其它三种碱基导致该点的反应无法继续进行,其绿色荧光强度与该步反应过程中整合进新生DNA链中的荧光ddATP直接相关,根据检测所得到的绿色荧光的强度,即可判断A碱基延伸数目为2。然后,向芯片加入含3'-5'核酸外切酶活性高保真DNA聚合酶与耐3'-5'核酸外切酶消化修饰的特异腺嘌呤的缓冲液及待测模板进行孵育,绿色荧光标记的ddATP与非荧光标记的dATP被消化,引物3'端末端位置被引入耐3'-5'核酸外切酶消化的修饰腺嘌呤,完成修饰的特异腺嘌呤替换延伸反应。至此,绿色荧光标记ddATP以及普通dATP被消化,并与多余模板一同被物理漂洗除去,而引物3'末端位置只存在被引入的耐3'-5'核酸外切酶消化的修饰腺嘌呤。漂洗后荧光检测信号强度降至背景噪音水平,至此A碱基延伸反应结束,该点成功引物延伸了2个A碱基,同时该点所有引物重新回复到具有3'末端自由羟基和进入可延伸状态。A碱基的延伸反应结束后,向芯片加入含ddTTP/dTTP的混合反应液及待测模板进行孵育,其中ddTTP为红色荧光标记而dTTP为非荧光标记,图2例中待测模板在此处序列仅含一个A碱基,新合成的DNA序列则可相应延伸一个T碱基,并因反应液中缺乏引物继续延伸所需的其它三种碱基导致反应终止。向芯片上加入漂洗液,去除背景荧光信号后,检测其信号强度,判断序列当前位置dTTP的个数。同样当芯片该点含有10000个引物,需要延伸一个T碱基,而ddTTP/dTTP的浓度比为1/100,在当引物延伸时,则大约有9900个dTTP进入新合成的DNA分子(10000x99/100),和同时约有100个引物3'末端被引入红色荧光标记的ddTTP(10000x1/100)。此时由于引物3,末端无法从反应液中获取延伸所需其它三种碱基导致该点的反应结束。其红色荧光强度约为单碱基延伸反应过程中所得到的饱和荧光强度的1%,通过检测红色荧光的强度,可判断T碱基延伸数目为1。然后,向芯片加入含3'-5'核酸外切酶活性高保真DNA聚合酶与耐3'-5'核酸外切酶消化修饰的特异dTTP缓冲液及待测模板进行孵育,红色荧光标记的ddTTP与非荧光标记的dTTP被消化,耐3'-5'核酸外切酶消化修饰的特异dTTP替换延伸,引物3'端末端位置被引入耐3'-5'外切酶消化的修饰dTTP,这时引物3'末端位置只存在被引入的耐3'-5'核酸外切酶消化的修饰dTTP,漂洗后使红色荧光检测信号强度降至背景噪音水平。至此T碱基反应结束。T碱基延伸反应结束后,向芯片加入含ddCTP/dCTP的混合反应液和待测模板进行孵育,其中ddCTP为蓝荧光标记而dCTP为非荧光标记,图2例中待测模板在此处序列不含碱基G,新合成的DNA序列则无C碱基延伸。通过相应漂洗之后检测荧光信号强度,其荧光强度表现为背景噪音而无特定峰值,可判断此引物点在此次反应中无C碱基延伸。虽然芯片中该引物点在上一步含ddCTP/dCTP混合反应液中不存在引物延伸,但仍需向芯片加入含3'-5'核酸外切酶活性高保真DNA聚合酶与耐3'-5'核酸外切酶消化修饰的特异dCTP的缓冲液进行孵育以使芯片上其它有延伸反应的引物点进行替换延伸,并完成相应漂洗过程。C碱基延伸反应结束后,向芯片加入含ddGTP/dGTP的混合反应液和待测模板进行孵育,其中ddGTP为荧光标记而dGTP为非荧光标记,当待测模板在此处序列含1个C碱基,新合成的DNA序列则可相应延伸1个G碱基,并因反应液中缺乏引物继续延伸所需的其它三种碱基导致反应终止。部分性链终止反应完成后,通过漂洗去除背景荧光信号,检测其信号强度,判断序列当前位置dGTP的个数。然后,向芯片加入含3'-5'核酸外切酶活性高保真DNA聚合酶与耐3'-5'核酸外切酶消化修饰的特异dGTP的缓冲液进行孵育,荧光标记的ddGTP与非荧光标记的dGTP被消化,耐3'-5'核酸外切酶消化修饰的特异dGTP替换延伸,引物3,端末端位置被引入耐3'-5'核酸外切酶消化的修饰dGTP,,并完成相应漂洗过程。至此G碱基延伸反应结束。综上所述,通过分析荧光信号的种类和强度,可得到引物3'末端引入碱基的种类和数目在反应中参与延伸的部分ddNTP,其荧光种类解码新加入碱基种类,荧光强度解码新加入碱基的数量。就例图2中的代表性引物点而言,经过连续四步反应即一个测序循环,引物3,末端被引入AATG,巧妙的完成一段序列的测序任务。该方法通过不断针对每一种碱基分别进行反应且连续循环,使引物不断延伸,待测模板上的序列随之不断被解码,因此,本发明可以为长序列模板测序。下面通过具体实施例对本发明作进一步的说明。实施例1遗传性乳腺癌相关基因(Brca-1)部分测序引物设计与信号分析Brca-l为一种与遗传性乳腺癌发生相关的基因,其fe基因库中的编号为(NM—065379.3),含有8个外显子。本应用例以Brca-l的外显子1,2和3为例,说明本发明在实际序列测定中的应用步骤。(1)准备相应的耐3'-5'核酸外切酶消化的引物并对这些引物可实际参与反应的三末端自由羟基进行定量测定。目标基因的测序可分为基因组序列测定和编码序列测定。本例以芯片平台对目标序列Brca-l的前三个外显子编码序列进行测序设计。从Genbank中的表格输出选项可直接得到相应的外显子和外显子两端的内含子序列,先合成三末端硫化修饰与五末端氨基修饰的测序引物(见表l)。测序引物(浓度在80nM到50pM之间)通过其五末端的氨基基团与环氧化处理的芯片玻璃涂层形成共价结合,以含有150mM磷酸钠的缓冲液(pH=8.0)点样。室温下空气干燥过夜,65。C烘干30分钟,在含有0.1%SDS,5%乙醇和双蒸水的热混合液中冲洗约1分钟即可应用。利用可进行原位PCR的PCR仪对芯片进行单碱基延伸与延伸碱基的切除反应应用100^1含四种荧光标记的ddNTP与待测序模板对待延伸引物进行单碱基延伸,以所得到的荧光强度定量待延伸引物三末端可实际参与反应的9三末端自由羟基数,之后通过将芯片与含3'-5'核酸外切活性的核酸酶共孵育而达到切除带荧光的单碱基。(2)以不具有3'-5,核酸外切酶活性DNA聚合酶介导,以单一种类的荧光标记的ddNTP与非荧光标记的同一种类dNTP为混合底物及待测模板的反应混合液中进行部分性链终止引物延伸反应。在本例的反应中,所用ddNTP/dNTP混合底物为ddATP/dATP混合底物,其比例采用1/100,引物延伸由T7测序酶介导,反应温度和时间分别控制52摄氏度至64摄氏度之间和在30秒钟至90秒钟之间。这一歩在原理上与Sanger's末端终止法测序相似,区别在于本实验不采用含有四种ddNTP和四种dNTP的公共混合底物,而是分别采用ddATP/dATP;ddTTP/dTTP;ddCTP/dCTP和ddGTP/dGTP四类不同的混合底物。Sanger's末端终止法测序目前已广泛应用于分子生物学、遗传学和基因组测序等众多领域。部分性链终止引物延伸反应完成后,向芯片上加入不含ddNTP和dNTP的一倍浓度PCR反应缓冲液,重复清洗2-5次,通过多次洗涤去除残留在反应体系中的背景荧光信号及多余模板。然后检测其信号强度,以判断序列当前位置腺嘌呤的个数。(3)人工合成的耐3'-5'核酸外切酶消化的dNTP在具有3'-5'核酸外切酶活性的高保真DNA聚合酶催化下进行的替换性引物延伸反应。在本例中的替换性引物延伸反应中,采用硫化修饰的PS-dATP底物,其使用浓度为20(HiMdATP,反应由具有3'-5'核酸外切酶活性Pfu高保真DNA聚合酶所介导,引物延伸反应温度和时间分别控制52摄氏度至64摄氏度之间和在30秒钟至90秒钟之间。(4)偶联部分性链终止引物延伸反应和替换性引物延伸反应并重复使用这一偶联过程。如表1所示,本例显示了每一循环都分别针对每一特定种类的碱基A,T,C,G进行部分性链终止引物延伸反应和替换性引物延伸反应。通过不断重复这种循环过程,以解码更长序列。此循环过程为本发明用于序列分析的基础,由部分性链终止引物延伸反应和替换性引物延伸反应两个偶联反应不断循环来完成测序任务。在部分性链终止引物延伸反应完成后,替换性引物延伸则相对应的分别使用浓度为200pMdATP,200pMdTTP,200pMdCTP,200nMdGTP以完成替换性引物延伸反应。通过上述四个步骤,本例在表1的最后一行中给出了野生型序列。表l、朋CA/外显子模板制备引物测序引物12ATGGCAGATGTTGCACTGAGGAAAATAAATTACCAAATTTTCAGCTGTTCAACATACAAAAGCATACCACTGGCCAGCGCCGAAAGCGACCGAGGACCAACCTCGGAGGGTAPl:ATGGCAGATGTTGCACT^P2:CAAATTCCACATTTCAGIP3:CTGTTCAACATACAAAG4P4:TCTGGAGCGCATCGTIP5:CGCCGAAAGCGACCGAGT£P6:CTCGGAGGGTATTTATGI10测序反应<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>说明测序引物中的黑体加下划线标记的碱基为硫化修饰者。此表中所列荧光强度来源于部分性链终止反应使用ddNTP/dNTP比例为1:100。不同ddNTP/dNTP的比例浓度其意义不同,例如1:IO所得信号强度较强,对单一碱基的成串长序列衰减较快,而l:100或l:1000所得信号强度相应变弱,但对单一碱基的成串长序列衰减较慢。事实上,当这一比例为l:0(即仅使用四种混合的ddNTP)时,只能延伸一个碱基;而当这一比例为0:1(即仅使用四种混合的dNTP)时,则延伸反应可连续进行。表2、ddNTP/dNTP不同比例测定成串碱基时针对单一碱基的每一步中掺入新生DNA链中的荧光ddNTP的总荧光强度(以纯ddNTP为底物的单碱基延伸荧光强度为1)成串长度(碱基个纯ddNTP1/101/1001/1000纯dNTP数)1l細0.1000.0100.001O扁20.1900.0200.002O細30.2710.0300.003O扁40.3440.0390.0040.00050.4100.0490.0050.00060.4690.0590.006o扁70.5220.0680.0070.00080.5700.0770.0080.00090.6130.0860.009o扁100.6510.0960.0100.000110.6860.1050.0110.000120.7180.1140.012o扁130.7460.1220.013o扁140.7710.1310.0140.000150.7940.1400.015o細160.8150.1490.016o扁170.8330.1570.017o扁180.8500.1650.0180.000190.8650.1740.019o扁200.8780.1820.0200.000210.8910.1900.021o細220.9020.1980.0220.000230.9110.2060.023o扁240.9200.2140.024o扁250.9280.2220.0250.000260.9350.2300.0260.000270.9420.2380.0270.00028O駕0.2450.028o扁290.9530.2530.029o細300.9580.2600.030o細310.9620.2680.031o扁320.9660.2750.0320.000330.9690.2820.0320.000340.9720.2890.0330.000350.9750,2970.0340.00014表1中测序引物中的黑体加下划线标记的碱基为硫化修饰碱基。此表中所列荧光强度来源于部分性链终止引物延伸反应使用ddNTf/dNTP比例为1:100。不同ddNTP/dNTP的比例浓度其意爻不同,例如l:IO所得信号强'度较强,对单一碱基的成串长序列衰减较快,而1:100或h1000所得信号强度相应变弱,但对单一碱基的成串长序列衰减较慢。事实上,当这一比例为h0(即仅使用四种混合的ddNTP)时,只能延伸一个碱基;而当这一比例为0:1(即仅使用四种混合的dNTP)时,则延伸反应可连续进行。这一根据ddNTP/dNTP的比例浓度获取不同强度荧光信号和荧光信号强度在测序过程中随单一碱基的成串长序列衰减的情况在表2中有详细反映。参考文献(1)LanderES,LintonLM,BirrenB,etal.人类基因组的测序与序列分析(Initialsequencingandanalysisofthehumangenome).自然,Nature,2001,409(6822):860.(2)VenterJC,AdamsMD,MyersEW,etal.人类基因组序列(Thesequenceofthehumangenome).科学,Science,2001,291:1304-1351.(3)PreparataFP,OliverJS.利用半简并碱基的杂交法DNA测序(DNASequencingbyHybridizationUsingSemi-DegenerateBases).计算机生物学,ComputBiol,2004,11(4):753-765.(4)PrinceJA,FeukL,HowellWM,etal.利用基因位点特异性杂交原理的子弹和精确的单碱基多态性分析设计标准与方法领(J试(Robustandaccuratesinglenucleotidepolymorphismgenotypingbydynamicallele-specifichybridization(DASH):designcriteriaandassayvalidation).基因组研究,GenomeRes,2001,11:152(5)KimDH.,H.K.Oh,J丄Eou,H丄Seo,S.K.Kim,etal.鱼类弹状病毒的全序列一种海洋鱼类的致病原(Completenucleotidesequenceofthehir咖erhabdovirus,apathogenofmarinefish).病毒研究,VirusRes,2005,107:1-9.(6)ShendureJ,MitraRD,VarmaC,etal.高级测序技术方法与目标(Advancedsequencingtechnologies:methodsandgoals).自然-基因学综述,NatureReviewsGenetics,2004,5,335-344.(7)MaiguliesM,EgholmM,AltmanWE,etal.微制造高密度皮升反应器进行基因组测序(Genomesequencinginmicrofabricatedhigh-densitypicolitrereactors).自然,Nature,2005:437376380.(8)PoinarHN,SchwarzC,QiJ,etal.环境微生物基因组学与古基因组学猛玛DNA的大规模须!l序(Metagenomicstopaleogenomics:Large-scalesequencingofmammothDNA).禾斗学,Science,2006,311(5759):392-394.(9)DeamerDW,AkesonM.纳米孔与核酸超高速测序展望(Nanoporesandnucleicacids:prospectsforultrarapidsequencing).生物技术进展,TrendsBiotechnol,2000,18(4):147-151.(10)LiX,QianQ,FuZ,WangY,XiongQZengD,WangX,LiuX,TengS,HiroshiF,YuanM,LuoD,HanB,LiJ.谷类的分蘖期控制(Controloftilleringinrice).自然,Nature2003,422:618-621.(11)www.ebiotrade.com/newsf/2006-2/20062993051.htm15(12)genomics,xprize.org(13)ZhangJ,LiK.老成员新表现高保真DNA聚合酶介导的SNP分析方法和从头测序法(Newperformancefromanoldmember:SNPassayanddenovosequencingmediatedbyexo+DNApolymerases).生物化学与分子生物学杂志,JBiochemMolBiol.2004,37(3):269-274.(14)ZhangJ,LiK,PardinasJR,SommerSS,YaoKT.高保真酶介导的校正基因分型法(Proofreadinggenotypingassaysmediatedbyhighfidelityexo+DNApolymerases).生物技术进展,TrendsBiotechnol.2005,23(2):92-96.权利要求1.一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是包括如下步骤(1)准备耐3’-5’核酸外切酶消化的引物并对这些引物可实际参与反应的三末端自由羟基进行定量测定;(2)以单一种类的荧光标记的ddNTP与非荧光标记的同一种类dNTP为混合底物,在不具有3’-5’核酸外切酶活性DNA聚合酶催化下,进行部分性链终止引物延伸反应;(3)人工合成的耐3’-5’核酸外切酶消化的dNTP在具有3’-5’核酸外切酶活性的高保真DNA聚合酶催化下进行的替换性引物延伸反应;(4)偶联部分性链终止引物延伸反应和替换性引物延伸反应并重复使用这一偶联过程。2.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述引物为三末端修饰的引物或三末端未修饰的引物。3.根据权利要求2所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述三末端修饰的引物为耐3'-5'核酸外切酶消化的修饰。4.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述具有3'-5'核酸外切酶活性的高保真DNA聚合酶为Vent高保真DNA聚合酶、DeepVent高保真DNA聚合酶、Pfii高保真DNA聚合酶、Sso7d-Pfii高保真DNA聚合酶或Kapa高保真DNA聚合酶。5.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述不具有3'-5'核酸外切酶活性DNA聚合酶为TaqDNA聚合酶、T7测序酶、VenfDNA聚合酶、DeepVent—DNA聚合酶。6.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述人工合成的耐3'-5'核酸外切酶消化的dNTP为硫化修饰的PS-dNTP、环化修饰的acy-NTP或锁核酸。7.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述荧光标记的ddNTP与非荧光标记的dNTP的浓度比例在待测序列中单一碱基的最大连续重复程度小于IO个时为1/3至1/30。8.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述荧光标记的ddNTP与非荧光标记的dNTP浓度比例在待测序列中单一碱基的最大连续重复程度小于100个时为1/31至1/300。9.根据权利要求1所述的一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,其特征是所述荧光标记的ddNTP与非荧光标记的dNTP浓度比例在待测序列中单一碱基的最大连续重复程度小于1000个时为1/301至1/3000。全文摘要本发明公开了一种利用高保真DNA聚合酶介导的替换性引物延伸反应进行序列分析的方法,步骤为(1)准备耐3’-5’核酸外切酶消化的引物;(2)以单一种类的荧光标记ddNTP与非荧光标记同种类dNTP为底物,在不具有3’-5’核酸外切酶活性DNA聚合酶催化下,进行部分性链终止引物延伸反应;(3)耐3’-5’核酸外切酶消化的dNTP在具有3’-5’核酸外切酶活性的高保真DNA聚合酶催化下进行的替换性引物延伸反应;(4)偶联部分性链终止引物延伸反应和替换性引物延伸反应并重复。本发明因需要延伸的引物不随测序的进行而明显减少,故每一测序引物可测定较长的序列,与多种技术平台相容,适宜于基于芯片的序列分析。文档编号C12Q1/68GK101519687SQ20081005235公开日2009年9月2日申请日期2008年2月29日优先权日2008年2月29日发明者佳张,凯李申请人:凯李
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1