技术简介:
该专利针对传统基因测序方法依赖已知序列、速度慢且效率低的问题,提出了一种利用具有3'至5'外切酶活性的多聚酶进行引物延伸反应的新技术。此方法能够通过高度特异性地识别完全配对与不完全配对的DNA片段,直接快速准确地测定未知基因序列,无需预先扩增或已知序列作为基础。
关键词:基因测序,3'至5'外切酶活性,引物延伸反应
专利名称:利用具有3'至5'外切酶活性的多聚酶进行基因序列分析的制作方法
技术领域:
本发明涉及一种用于基因测序的方法,具体即指利用具有3至5外切酶活性的多聚酶进行基因碱基序列的快速测序。
末端中止法是当代基因测序的主要方法,该方法虽然十分可靠,但因其每一信号最多只能提供有关一个碱基的信息,测序速度受到限制。更为重要的是,这一方法要求一段已知的基因序列作为测序的基础。这种对已知序列的依赖性,极大地减慢了这一方法在未知序列测定时的速度。此外,这一方法放大效率有限,常常需要对待测基因先进行放大。这一方法既费时,实际上还是一种间接的测序方法。
对寡核甘酸杂交测序芯片而言,由于杂交技术固有的热力学不均一性,其准确性不高,目前仍处在实验室研究和改进阶段,实用性尚有待观察。
另外,目前所有与测序有关的酶法包括经典的末端终止法和最近发展的单碱基延伸法,其标记途径均通过双脱氧三磷酸核甘酸。由于双脱氧三磷酸核甘酸不能脱水而具有终止延伸的作用,其反应为单向引物延伸过程。由于双脱氧三磷酸核甘酸在单向引物延伸反应中的应用,而使引物延伸的放大效率仅与反应循环次数成正比。在没有双脱氧三磷酸核甘酸的双向引物延伸反应中,效率是与反应循环次数的二次方成正比的。
目前基因序列分析中最大的问题是缺乏用于全基因范围的单碱基多态性检测的技术。
就第一个碱基加上之后的延伸过程而言,没有3’至5’外切酶活性的多聚酶所进行的引物延伸反应产物中,突变发生的机率约为2/1000,而利用具有3’至5’外切酶活性的多聚酶进行引物延伸反应,则能使突变发生的机率减少80-90%,从而大大提高正确产物的数量和减少错误产物的数量。这一巨大差别,已为世人所知。伸的第一步,决定该反应是否改变引物的序列。没有3’至5’外切酶活性的多聚酶所进行的引物延伸反应以100%不改变引物的序列的方式进行,无论引物与模板是否完全配对。这样就可能造成引物与模板相互配对的失真,即无法从引物序列来准确无误地反映出模板的序列。与此相反,具有3’至5’外切酶活性的多聚酶所进行的引物延伸反应则视配对情况而定,若配对则100%不改变引物的序列;若不配对则改变引物的序列,使之与模板完全配对。由此可见,若能合理利用具有3’至5’外切酶活性的多聚酶在引物延伸反应时对配对情况的区别能力,则可从引物序列准确无误地阅读出模板的序列。(见
图1)应用含有多个不同反应的单一反应体系的关键之一,是这些不同的反应必须能在相似或相同的反应条件下进行。我们通过对具有3’至5’外切酶活性的多聚酶进行引物延伸反应的研究,找到了从46℃至66℃的广泛范围内,使该酶能够很容易地分辨完全配对与不完全配对的引物序列的反应条件。由于具有校正功能的DNA多聚酶的校正能力与反应体系中的三磷酸核甘酸浓度呈现出反相关关系,在1X至2X浓度的三磷酸核甘酸中,完全配对与不完全配对的引物序列的分辨依赖于产物多与少的比较;当三磷酸核甘酸的浓度降为0.8X至0.2X时,这种分辨则越来越容易,表现为信号的有或无的变化。
合理利用具有3’至5’外切酶活性的多聚酶在引物延伸反应中对配对情况的区别能力的另一关键,是如何将具有3’至5’外切酶活性的多聚酶对引物序列的准确无误辨认转化为可为高通量分析方法所能检测到的信号。本发明通过对引物的修饰,包括(1)标记引物的3’末端核甘酸,达到完全配对的引物的产物保留该标记核甘酸,而不完全配对的引物的产物则该标记核甘酸被3’至5’外切酶的校正功能所切除而不带标记信号;(2)利用修饰的3’末端核甘酸以造成对3’至5’外切酶的不敏感性,达到完全配对的引物具有延伸产物而3’或近3’末端不完全配对的引物没有延伸产物的效果。二、信号标记与读取本发明的信号来源视其标记方法不同而不同。可采用的标记方法主要有三种,即引物集合中引物的3’末端碱基,标记的三磷酸核甘酸底物,和标记配对引物。
当采用引物3’末端标记时,与模板完全配对的引物将产生含有标记信号的产物。这种标记可以是放射性的标记也可以是非放射性的标记如荧光标记。而与模板不完全配对的引物将视引物的修饰情况而具有两种可能,即由于碱基不配对不产生产物,或由于3’至5’外切酶活性的多聚酶的校正功能而产生不含标记的产物。(见图1和图2)当采用标记的三磷酸核甘酸作为标记来源时,标记的三磷酸核甘酸底物与未标记的三磷酸核甘酸底物的比例视标记物的种类的不同而不同,变化在1∶10至1∶100之间。
当对非碱基特异性的配对引物进行标记时,标记可在其5’末端,也可在非3’末端的其他任何碱基。
在显像与获取信号之前,需对DNA分子上的标记信号与非DNA分子上的标记信号进行分离。具体分离方法视具体应用方法而决定。当本发明用于电泳时,分离过程可省略;当本发明用于生物芯片时,严格条件的洗涤将去除非延伸的DNA分子上的标记信号。若标记信号来源于标记的引物且背景噪音太大时,则可在25℃至37℃时使用低浓度的核酸外切酶孵化15分钟至1小时。DNA分子上的标记信号,可采用相应的常规方法进行显像与检测,具体方法由标记方法决定。对采用酶标记或其他化学反应物标记如地高辛原和生物素,在检测信号之前则需进行专一的化学显像反应。
在进行到显像与检测阶段时,若标记方式为放射性或直接荧光法,则不需显像的过程,即可直接扫描测定放射性强度或荧光强度或采用自显影方式而随后进行图像的扫描分析。如标记方式为化学发光法或间接荧光,则需要进行显影预阻断,显像反应,显像后的洗涤过程,然后再进行标记信号的检测。三、序列分析所检测到的标记信号直接代表相应部位的引物的3’末端的特异性碱基序列。序列分析可采用人工分析,或计算机辅助。当待测基因序列的数量不超过100碱基对时人工分析既快速又方便,对于较长序列的情形则需利用计算机辅助分析。
本发明提供了一种未知基因序列测定新方法,该方法的特点是直接、敏感、简单、快速。使用本发明测定基因序列既不要求一段已知的序列作为测序的基础,也不要求对待测模板预先进行放大。因而本发明创造的直接碱基测序技术,使要求高可靠性和高敏感性的生物样本的快速基因序列测定成为可能。本发明的有益效果是本方法使用具有校正功能的多聚酶进行引物延伸反应,其准确性要高于常规测序使用无校正功能的多聚酶进行的引物延伸反应。当用于基因序列分析时,由于本方法测序时不依赖一段已知序列,故本方法可用于未知序列的直接测序;这是本方法与现有测序方法相比的第一大优点;另外,在序列分析时,本方法所得每一信号都含有多于一个碱基序列的信息,通常每一信号代表四至八个碱基的信息。每一信号都含有多于一个碱基序列的信息能产生两种功效第一,使测序速度加快;第二,序列间的相互重叠能提高测序的准确性。
目前基因分析中尚急需开发可用于多个单碱基多态性位点测定的技术,本发明对基因序列的快速准确测定,尤其是该方法在大范围的退火温度下能有效工作,使其在全基因层次的单碱基多态性分析上,具有所有其他现有基因分析方法无可比拟的功效。目前的芯片制造技术,可以在一张玻片上载有40万个不同的DNA寡核甘酸,采用本方法与微芯片结合,则一张微芯片可达到测定近20万个不同的单碱基多态性位点的高效率。因此,本方法为单碱基多态性分析和基因序列分析提供了高通量分析手段。
试验用放大元的有义引物为碱基特异性引物,且含有一限制性内切酶EcoR I的位点的野生序列或3’单碱基不配对碱基。反义引物与有义引物的产物长度为220碱基对。完全配对的有义引物序列为AGT CCT CTC CTA TCC CAA GAT ATC TGA GAA TTC引物延伸反应为第一次解链95度5分钟,然后解链95度10秒,退火30秒,72度延伸1秒,循环30次。反应的退火温度为49度至69度。
结果与模板完全配对的引物有大小正确的产物,能被EcoR I消化。而与模板不完全配对的引物,使用具有3至5外切酶活性的多聚酶进行引物延伸反应时,其产物能被EcoR I消化;相反,使用不具有3至5外切酶活性的多聚酶进行引物延伸反应时,其产物则不能被EcoR I消化。见图3和图4。实用例2利用具有3’至5’外切酶活性的多聚酶Deep Vent及与模板序列完全配对和不完全配对的放射标记引物进行单碱基多态性测定(见图5)。实用例3利用具有3’至5’外切酶活性的多聚酶Deep Vent及与模板序列完全配对和不完全配对的3’末端硫取代核甘酸引物进行单碱基多态性测定(见图6)实用例4利用具有3’至5’外切酶活性的多聚酶Deep Vent及与模板序列完全配对和不完全配对的3’末端硫取代核甘酸引物进行基因序列测定(见图7)
参考文献
1The International SNP Map Working Group.A map of human genomesequence variation containing 1.42 million single nucleotidepolymorphisms. Nature 409928 933. 200
2About the relationsip between SNPs and disease diagnosis,a statementas“It will only be a matter of time before physicians can screen patientsfor susceptibility to a disease by analyzing their DNA for specific SNPprofiles”is posted on the site of http//.
3Project announcement about the development of SNP assays wasavailable on NIH websitehttp//grants. nih. gov/grants/guide/pa-files/PAR-99-102. html.
4Halushka MK,Fan J,Bentley K et alPatterns of single-nucleotidepolymorphisms in candidate genes for blood-pressure homeostasis. NatureGenetics,22239-47,1999.
5Lindblad-Toh K,Winchester E,Daly MJ et alLarge-scale discoveryand genotyping of single-nucleotide polymorphisms in the mouse. NatureGenetics,24381-86,2000.
6Park SJ,Taton A,Mirkin CAArray-based electrical detection of DNAwith nanoparticle probes.Science,2951503-06,200
7Huang MM等(1992). Extension of base mispairs by TAQ DNA polymeraseimplications for single nucleotide discrimination in PCR.Nucleic AcidsRes 204567073.
8Kwok DE,等(1990).Effects of primer-template mismatches on thepolymerase chain reactionhuman immunedeficiency virus type 1 modelstudies,Nucleic Acids Res 18995-1005.
9Oum H,Wengel J(2001).Locked nucleic acidsa promising molecularfamily for gene-function analysis and antisense drug development.CurrOpin Mol Ther 3239-243.
10Warrington JA,Shah NA,Chen X,Janis M,Liu C,Kondapalli S,ReyesV,Savage MP,Zhang Z,Watts R,DeGuzman M,Berno A,Snyder J,Baid J.New developments in high-throughput resequencing and variation detectionusing high density microarrays. Hum Mutat;19402-9.2002.
11Chicurel MFaster,better,cheaper genotyping.Naturc 412580-582,200
12Weber JL,May PEAbundant class of human DNA polymorphisms whichcan be typed using the polymerase chain reaction. Am J Hum Genet 44388396.1989
13Pastinen T,Raitio M,Lindroos K,Tainola P,Peltonen L,SyvanenAC.A system for specific,high-throughput genotyping by allelee-specificprimer extension on microarrays.Genome Res.101031-42. 2000.
14Zhang J,Li K (2001).The 3’terminal labeled primer extensionA new method of high throughput screening for SNP analysis.Current DrugDiscovery 921-24.
15Pritchard JK,Przeworski M 2001.Linkage disequilibrium in humansmodels and data. Am J Hum Genet 69114.
16Breen,Gerome ab. Collier,David b.The Tower of Babel?An assessmentof the development and state of genetic and SNP technologies.PsychiatricGenetics.1259-61,2002.
17张佳,李凯Thc 3’termina llabeled primer extensionA new mcthodof high 16).张佳等生物芯片的现状与研究进展。Am J Chin Med,3312-315.2001.
权利要求1.一种利用具有3至5外切酶活性的多聚酶进行引物延伸反应对未知序列进行测定的方法其特征在于该方法包括以下步骤a.制备含有多种不同序列的特定寡核甘酸引物集合;b.用具有3至5外切酶活性的多聚酶进行引物延伸反应;c.引物延伸反应产物的显像与序列分析;
2.权利要求1中的寡核甘酸引物集合其特征是由3’末端序列各异的引物亚集合组成;
3.权利要求1中的每一寡核甘酸引物亚集合其特征是3’末端具有相同的序列而其末端则含有4的n次方种长度为n的不同的序列;
4.权利要求1中的寡核甘酸引物集合其特征是由未被修饰的寡核甘酸和被修饰的寡核甘酸组成;
5.权利要求4中的修饰其特征是指对寡核甘酸进行化学修饰以改变其对核酸酶的反应特性;
6.权利要求4中的修饰其特征是指对寡核甘酸进行化学修饰以使其具有标记信号;
7.权利要求1中的引物延伸反应产物其特征是标记的产物;
8.权利要求1中引物延伸反应产物的标记信号其特征是来自于标记的引物;
9.权利要求1中引物延伸反应产物的标记信号其特征是来自于标记的三磷酸核甘酸底物。
全文摘要本发明利用具有3至5外切酶活性的多聚酶进行碱基序列快速分析。该方法利用具有3至5外切酶活性的多聚酶在引物延伸时的高度特异性而直接利用已被延伸的引物3’末端和近3’末端的已知序列信息,通过碱基严格配对的原则而准确获取引物延伸反应中相应模板的未知序列,达到基因序列的快速测定。
文档编号C12N15/09GK1414110SQ0212916
公开日2003年4月30日 申请日期2002年8月19日 优先权日2002年8月19日
发明者李铠 申请人:张旭