技术简介:
本发明提出了一种方法来测定第一种多核苷酸与第二种多核苷酸之间核苷酸序列内的变异存在及其具体类型。该方法首先对选定区域进行扩增反应生成模板群,接着通过使用一对引物同时由两条链产生经标记的线性多核苷酸片段家族,并通过这些片段中的标记来测定碱基定位和具体类型,最后与第二种多核苷酸进行比较鉴定变异情况。这种方法能够准确、高效地定位并确定不同多核苷酸之间的序列变异。
关键词:多核苷酸变异,片段产生反应,碱基定位
专利名称:测定多核苷酸序列变异的方法
背景已知人类基因组中的个别DNA序列变异直接导致特殊疾病或状况,或者使某些个体易患特殊疾病或状况。这样的变异还调控许多疾病的严重程度或发展。此外,DNA序列随种群变异。因此,测定人类基因组中的DNA序列变异,有益于做出正确的诊断、找到合适的疗法、和理解在疾病的发病机理和状况的流行中基因组变异和环境因子之间的相互关系。
人类基因组中有几种类型的DNA序列变异。这些变异包括插入、删除和重复序列的拷贝数差异。然而,人类基因组中最常见的DNA序列变异是单个碱基对的取代。当该变异等位基因的种群频率为至少1%时,这些变异被称作单核苷酸多态性(single nucleotidepolymorphism,SNP)。
因为SNP是稳定的、频繁发生、且具有比其它基因组变异(诸如重复序列)更低的突变率,所以SNP特别有益于研究DNA序列变异与人类疾病和状况之间的相互关系。此外,与检测其它较少见的DNA序列变异的方法相比,检测SNP的方法更易于自动化,并适用于大范围研究。
已经发展了许多能够定位或鉴定SNP的方法。这些方法包括双脱氧指纹法(dideoxy fingerprinting,ddF)、荧光标记的ddF、变性指纹法(denaturation fingerprinting,DnF1R和DnF2R)、单链构象多态性分析、变性梯度凝胶电泳、异源双链分析、RNase切割、化学切割、使用列阵(array)的杂交测序和直接DNA测序。
用于定位或鉴定SNP的已知方法具有某些缺点。例如,一些已知方法不能鉴定特殊碱基变化或这些碱基变化在序列内的精确定位。其它已知方法不能同时分析多个样品或分析合并样品。还有其它已知方法检测不同的变异时要求不同的分析条件。此外,一些已知方法不能在基因分型(genotyping)实验中用于量化已知SNP。此外,许多已知方法对通量具有过多限制。
因此,需要新方法来测定第一种多核苷酸与第二种多核苷酸之间核苷酸序列变异的存在和具体类型,包括人个体基因组中SNP的存在。优选的,该方法可以测定合并样品中第一种多核苷酸与第二种多核苷酸之间核苷酸序列变异的存在和具体类型。额外优选的,该方法可以测定两种或多种变异是否位于各个体的相同或不同等位基因上,而且可以用于测定变异在种群中的发生频率。更优选的,该方法可以以高精确度同时筛选大量样品。
概述在一个实施方案中,提供了测定第一种多核苷酸与第二种多核苷酸之间核苷酸序列变异的存在和具体类型的方法。该方法包括,首先,提供第一种多核苷酸的样品,并选择第一种多核苷酸可能含有变异的区域;然后,将选定区域用于产生模板的扩增反应,以产生包括选定区域的双链多核苷酸模板群;其次,通过产生片段的反应,使用一套引物,同时由模板的两条链产生经标记线性多核苷酸片段家族。该片段家族的每一个片段由终止物于片段的3’末端终止。片段家族包括在以引物为侧翼的两条模板链的部分中由终止物表示的每个可能的碱基处终止的至少一个片段。然后,使用片段中存在的标记,测定第一种多核苷酸选定区域内的至少若干碱基的定位和具体类型。其次,将经测定的碱基的定位和具体类型,与第二种多核苷酸的碱基的定位和具体类型进行比较,从而鉴定第一种多核苷酸选定区域与第二种多核苷酸相应区域之间核苷酸序列变异的存在和具体类型。
描述本发明包括用于测定至少两种多核苷酸之间一个或几个多核苷酸序列差异的存在、定位或具体类型或其组合的方法。除其它用途外,本方法可以定位和鉴定人类基因组中存在的单核苷酸多态性。此外,本方法可以发现个体之间、个体与种群之间、和种群之间先前未鉴定的基因组变异。同样,本方法可以测定基因组变异在种群中的频率或分布。而且,本方法可以将在种群中发现的特殊基因组变异与该种群中的特殊表型联系起来。还有,本方法可以测定基因组变异在个体和种群中的等位基因分布。
更具体的说,本发明的方法可以提供两种多核苷酸之间的下列类型的多核苷酸序列信息。第一,本方法可以鉴定第一种多核苷酸选定区域中与另一种或多种多核苷酸不同的所有核苷酸的位置。第二,本方法可以鉴定哪个核苷酸取代了多核苷酸中的其它核苷酸。第三,本方法可以测定在序列的给定位置发生核苷酸变化的每一种多核苷酸分子所占的比例。第四,当两种不同的多核苷酸具有多个核苷酸差异时,本方法可以提供关于哪些差异同时发生的信息。
本方法比已知方法具有多个组合优势。一般而言,本方法提供了更多类型的信息、能更广泛的应用、且操作更简单。特别有利的是,本方法是能够同时鉴定和量化已知和未知变异,并测定两群多核苷酸之间的所有变异的定位、具体类型和频率的简单技术。而且,本方法可以测定两个或多个遗传性变异是否位于个体的相同或不同等位基因上,且可以用于测定变异在种群中的发生频率。
此外,本方法可以用于来自任何来源的任何类型的多核苷酸。除了测定SNP的定位和具体类型,本方法还可以用于测定下列多核苷酸变异的存在和类型,包括涉及多个核苷酸的取代、删除、插入、扩展和收缩和截短或嵌合分子。此外,本方法可以鉴定二倍体生物体中序列相对拷贝数的变更,如涉及一个多核苷酸拷贝的缺失诸如杂合性的丧失,或涉及额外多核苷酸拷贝的获得诸如存在额外染色体拷贝的状况。
此外,在种群研究中,通过分析由取自多个个体样品组成的单个合并样品,本方法可以用于测定每种多核苷酸变异的频率。最后,本方法可以用于评估对某些因素敏感或有抵抗力的种群所占的比例,所述因素依赖于特殊多核苷酸变异的存在或缺乏,或者用于检测种群中随时间发生的多核苷酸变异,诸如合并细菌的培养物。同样,本方法可以自动化。
本方法优选包括提供第一种多核苷酸的样品。然后,选择第一种多核苷酸的一个或多个特殊区域,该区域待测定至少一种序列差异的存在、定位或具体类型。其次,将选定区域用于产生模板的扩增反应。在优选的实施方案中,对产生的模板进行纯化,以除去其它扩增反应成分。
然后,通过产生片段的反应,使用一组引物,同时由模板的两条链产生经标记的线性多核苷酸片段家族。由此反应产生的片段家族包括由双脱氧终止物于以引物为侧翼的两模板链每个可能的碱基处的3’末端终止的片段,用双脱氧终止物表示。
最后,使用片段中存在的标记,鉴定第一种多核苷酸模板选定区域的每个碱基的定位和具体类型。将上述定位和具体类型与已知参考序列进行比较,或与使用本方法由第二种多核苷酸产生的经标记线性多核苷酸片段家族测定的相应信息进行比较。比较产生关于第一种多核苷酸与参考序列之间、或第一种多核苷酸与第二种多核苷酸之间一种或多种序列差异的存在、定位或具体类型的信息。现在将更为详细的讨论本方法。1)提供多核苷酸样品在扩增模板之前,必须得到合适数量和质量的感兴趣的多核苷酸,用于将要使用的选定扩增方法。一些合适的样品可以由供应商购买,诸如American Type Culture Collection(Rockville,MD,US)或Coriell Institute for Medical Research(Camden,NJ,US)。此外,用于由多种来源得到合适多核苷酸样品的商业性试剂盒可以由Qiagen Inc.(Chatsworth,CA,US)、Invitrogen Corporation(Carlsbad,CA,US)、和5’-3’Prime Inc.(Boulder,CO,US)和其他供应商处获得。而且,由多种来源得到用于扩增方法的多核苷酸的常规方法,包括PCR和RT-PCR,是本领域技术人员众所周知的。
有利的是,本方法允许同时分析由样品群得到的多核苷酸。如果在分析之前合并两个或多个多核苷酸样品,那么优选以相等比例混合多核苷酸样品。2)选择用于分析的一个或多个多核苷酸区域接着,选择第一种多核苷酸中待测定至少一种序列变异的存在、定位或具体类型的一个或多个特殊区域。如此公开书中使用的,“区域”应当理解为包括相同多核苷酸上的多个不连续序列。可以根据相同或相关多核苷酸的已知序列信息,或者可以根据参考多核苷酸的感兴趣区域(使用本领域技术人员众所周知的方法进行测序),进行区域的选择。3)扩增选定区域一旦选定了区域,根据本领域技术人员知道的技术,对区域进行扩增反应以产生模板。如此公开书中使用的,“模板”应当理解为包括由相同多核苷酸上的不连续序列产生的模板群。在优选的实施方案中,通过此扩增反应产生的模板包括每条链大约50-50,000个核苷酸的双链核酸。在特别优选的实施方案中,扩增方法是PCR(分析的多核苷酸是DNA),或RT-PCR(分析的多核苷酸是RNA),但是可以通过适于待分析多核苷酸的任何合适的扩增方法产生模板,这可由本领域技术人员借助此公开书的参考而理解。用于进行PCR和RT-PCR的合适试剂盒可以由许多商业性供应商获得,诸如Amersham PharmaciaBiotech,Inc.(Piscataway,NJ,US)、Life Technologies,Inc.(Gaithersburg,MD,US)、和Perkin-Elmer,Corp.(Norwalk,CT,US)及其他来源。4)纯化模板在优选的实施方案中,根据本领域技术人员知道的技术,将由扩增反应产生的模板进行纯化,以除去其它扩增反应成分。例如,可以将扩增反应混合物进行聚丙烯酰胺凝胶电泳或琼脂糖凝胶电泳,并通过乙醇或异丙醇沉淀、滤膜纯化或层析柱纯化,纯化具有期望大小的模板,以除去其它扩增反应成分。纯化后,将模板以溶液保存,优选保存于无菌的、不含核酸酶的、18MΩ水或0.1xTE中。5)产生经标记的线性多核苷酸片段家族然后使用通过扩增产生的模板,通过片段产生反应,使用一对引物,同时由每种模板的两条链产生经标记的线性多核苷酸片段家族。片段产生反应与扩增反应相似,只是扩增的多核苷酸片段包含来自以引物为侧翼的两条模板链的片段家族,而且片段家族由双脱氧终止物于3’末端终止,并在相应于双脱氧终止物的每个可能的碱基处终止,而非跨越以引物为侧翼的全长模板链的单一多核苷酸序列。
在优选的实施方案中,片段产生反应如下进行,但是其它相当步骤也是合适的,本领域技术人员借助此公开书的参考可理解这一点。首先,选择位于模板内的多核苷酸序列区域进行分析。其次,人工合成位于选定区域侧翼的一对引物。在优选的实施方案中,正向和反向引物对的3’末端之间的多核苷酸长度是大约50-2000个核苷酸。在特别优选的实施方案中,正向和反向引物对的3’末端之间的多核苷酸长度是大约100-1000个核苷酸。
然后,构建反应混合物,其中包括模板、引物对、溶剂、一组四种2’脱氧核苷三磷酸(dNTP)、一对2’,3’-双脱氧核苷三磷酸(ddNTP)、缓冲液、二价阳离子、依赖DNA的DNA聚合酶、和至少一种可检测的标记试剂。将此反应混合物加到合适的反应容器中,诸如0.2ml或0.5ml管或96孔热循环反应板的孔中。使用这种方法,通过合并最初模板产生扩增反应中的样品,或通过合并模板产生扩增反应产生的模板,可以在同一个物理位置同时分析多种多核苷酸。当以任一种方式同时分析多种多核苷酸时,反应混合物包括对每种多核苷酸特异的模板。然而,为了节约时间,显然也可以在分开的物理位置同时分析两种多核苷酸。然后将每个反应管用蒸发屏障覆盖,诸如矿物油或石蜡珠,并将反应混合物在合适温度范围进行合适时间的循环。
反应混合物更具体的包括大约1pg-200ng,更优选100-150ng模板,该模板溶于一定体积的溶剂,该溶剂包含大约1-3μl无菌的、不含核酸酶的、18MΩ水或0.1xTE缓冲液。向此反应混合物中加入人工合成的引物对,至终浓度大约1-50pmol/反应,反应总体积大约20μl。
反应混合物中还包含浓度大约相等的四种dNTP:dATP、dCTP、dGTP和dTTP。然而,可以有利的使用dUTP代替dTTP以改进结果,诸如要分析的模板中有超过五个连续胸苷残基时即可如此。每种dNTP的优选浓度是大约1μmol-1mmol。在优选的实施方案中,四种dNTP每一种的浓度是大约20-200μmol。
反应混合物中还包含2’,3’-双脱氧核苷三磷酸(ddNTP,由ddATP、ddCTP、ddGTP和ddTTP组成,或ddUTP代替ddTTP)的非Watson-Crick配对的两种碱基。合适的配对包括ddATP:ddCTP、ddATP:ddGTP、ddCTP:ddTTP、ddGTP:ddTTP。优选的,两种ddNTP之一必须是嘧啶核苷酸,而另一种必须是嘌呤核苷酸。在特别优选的实施方案中,ddNTP对是ddATP:ddCTP或ddGTP:ddTTP,任一对将产生关于位于引物3’末端之间的完整模板序列的完整序列信息。
每种ddNTP最初以大约0.01μM-10mM浓度存在。在优选的实施方案中,每种ddNTP的浓度是大约100-500μM。在片段产生反应中使用的ddNTP对的浓度取决于作为聚合酶底物使用的ddNTP的效率,这一点本领域技术人员可借助此公开书的参考而理解。
反应混合物还包含具有足够缓冲能力的缓冲液,以维持反应混合物在pH范围约6.0-10.0、温度范围大约20-98℃的pH。在优选的实施方案中,缓冲液是浓度为大约10-500mM的Tris,优选大约50-300mM。
反应混合物中还包含至少一种二价阳离子。在优选的实施方案中,该二价阳离子是终浓度为大约0.5-10mM的MgCl2,更优选终浓度为大约1.5-3.0mM。还可以使用浓度为大约0.1-20mM的MgCl2,这也是合适的。
反应混合物中还包含聚合酶,诸如依赖DNA的DNA聚合酶。选择的聚合酶应当优选热稳定的,具有最小的外切核酸酶、内切核酸酶或其它DNA降解活性,而且应当高效率和高保真的将ddNTP掺入合成的DNA链。聚合酶合适的浓度是大约0.1-100U/反应,更优选大约1-10U/反应。合适的聚合酶可以由Amersham Pharmacia Biotech,Inc.、Promega Corporation(Madison,WI,US)和Perkin-Elmer Corporation及其它供应商处商业性获得。
在优选的实施方案中,反应混合物包含其它物质,以改进产量或效率、增强聚合酶稳定性、和减轻假象。例如,可以使用其它dNTP或追加dNTP,诸如可以使用浓度为大约0.1-20mM的脱氧肌苷三磷酸(dlTP)或7-脱氮GTP代替dGTP,以减轻片段产生反应中可能发生的压缩(compression)、打滑(stutter)或终止(stop)。同样,可以加入例如去污剂和还原剂以稳定聚合酶。此外,可以向反应混合物中加入有机溶剂,诸如甘油、二甲基甲酰胺、甲酰胺、乙腈和异丙醇,以改进引物的退火严谨度。当存在有机溶剂时,优选浓度大约0.1-20%(体积百分比)。
除了上面讨论的反应混合物成分,重要的是,取决于所分析样品的数目和类型,和样品是否来自合并的来源,通过掺入经标记的引物、经标记的双脱氧终止物或经标记的非终止的脱氧核苷酸,或者上述的组合,由片段产生反应产生的反应产物含有至少一种可检测的标记物,这可借助此公开书的参考而理解。适合于进行本方法的标记物类型是荧光标记、荧光能量转移标记、发光标记、化学发光标记、磷光标记和光致发光标记等,只要标记物与此方法兼容,多种标记物的检测能够辨别不同的标记物,且反应产物可以通过标记物测量,则其它类型的标记物也是合适的。在优选的实施方案中,标记物是荧光标记或荧光能量转移标记。
有多种荧光标记适用于此方法,诸如荧光染料。合适的荧光标记应当是化学稳定的,以掺入到标记试剂中,而且应当对此方法进行过程中的降解有抵抗力。而且,当分析反应产物时,荧光标记对反应产物的移动应当只具有微小的影响。此外,荧光标记应当具有高量子效率的激发和发射,且激发波长和发射波长之间的光谱间隔应当至少是10nm,使它们能够在光谱上于发射波长相互分开,相应发射波长之间最小5nm。激发波长优选为260-2000nm,而发射波长优选为约280-2500nm。而且,荧光标记应当优选能够附着到引物、dNTP和ddNTP上。
合适的荧光标记的实例是由荧光素家族及其衍生物、若丹明及其衍生物、Bodipy(4,4-difluoro-4-bora-3a,4a-diaza-s-indacene)及其衍生物、花菁及其衍生物、和铕螯合物衍生的荧光化合物。合适的荧光染料标记可以由Molecular Probes,Inc.(Eugene,OR,US)和Research Organics,Inc.(Cleveland,OH,US)及其它来源处商业性获得。类似的,合适的能量转移对也是可以商业性获得的,诸如来自Perkin-Elmer Corporation的Big DyesTM。而且,可以由AmershamPharmacia Biotech,Inc.及其它供应商处得到附有能量转移对的定制引物。
在反应混合物中使用的引物可以在它们的5’末端或内部用一种或多种标记物进行标记,只要引物的3’OH基团保持暴露以允许聚合酶与引物行使功能即可。正向和反向引物都可以用同一标记物进行标记,但优选正向和反向引物用可以相互区别的不同标记物进行标记。
合适的经标记引物可以通过任何多种方法进行制备,或可以商业性购买,这可由本领域技术人员借助此公开书的参考而理解。例如,发荧光的亚磷酰胺可以用于标记引物的5’末端或内部标记引物。伯胺可以使用常规N-羟基琥珀酰亚胺酯进行标记,或者可以在合成引物时将可与伯胺发生反应的其它种类的荧光染料引入引物。而且,可以将其它活性种类诸如巯基引入引物,并与具有适当活性的荧光染料结合。用于此方法的染料标记引物的常用浓度是大约1-50pmol/20μl反应体系。
对反应混合物中使用的双脱氧终止物三磷酸进行标记。经标记的ddNTP在片段产生反应中终止多核苷酸链的合成,并能够鉴定反应产物中发生链终止处的碱基。
ddNTP对的每种成员应当是不同标记的,诸如具有不同的荧光团,以至于可以检测、辨别并分别测量ddNTP对的每种成员。而且,经标记的ddNTP对的每种成员,诸如ddATP和ddCTP,可以对进行的每个片段产生反应具有经不同标记的子集,诸如分别用x1ddA、x2ddA….xnddA和y1ddC、y2ddC….ynddC表示,其中x1、x2、…xn和y1、y2、…yn表示与相应ddNTP偶联的不同标记,以允许进一步鉴定反应产物。合适的标记物包括荧光素、若丹明110、若丹明6G、羧基若丹明、及其它标记物。合适的经标记的ddNTP可以由AmershamPharmacia Biotech,Inc.、Perkin-Elmer Corporation及其它供应商处商业性获得。
在优选的实施方案中,用于此方法的经荧光标记的ddNTP的浓度将是大约10μM-1mM,更优选大约10-300μM。然而,ddNTP对中每种经标记的ddNTP的浓度不必相等。然而,将优选根据本领域技术人员知道的技术,根据产物长度、信号强度和作为所用聚合酶的底物的各种ddNTP的效率,对浓度进行优化。
而且,可以对反应混合物中使用的脱氧核苷三磷酸进行类似的标记,以鉴定产生反应产物的反应混合物。这通过下面的方法来实现,用相同标记物对在单个片段产生反应中使用的所有经标记dNTP进行标记,而用不同的、可辨别的标记物对不同片段产生反应中使用的所有经标记dNTP进行标记。当使用经标记的dNTP时,其只占dNTP总量的一部分。当使用经标记dNTP时,优选其以比率为未标记dNTP浓度的大约1-10%存在。在优选的实施方案中,dNTP是荧光标记的。
一旦将反应混合物置于适当容器中,根据本领域技术人员知道的技术,诸如使用温度循环的常规PCR技术,进行片段产生反应。此片段产生反应产生一组经标记的反应产物,其中包括在引物之外以双脱氧终止物于3’末端终止于每个位置的经标记的互补DNA链家族,其中所述位置处模板链中的核苷酸之一含有相应于终止物对之一的碱基。
举例来说,循环要求的常用时间和温度条件是温度范围90-98℃10sec-2min熔解模板双链;温度范围40-60℃1-60sec使引物与各自目的链退火;和温度范围50-75℃30sec-10min以通过DNA聚合酶的作用进行引物延伸。这些循环重复足够次数,通常为大约10-60次,以得到足够数量的、可检测的经标记反应产物。在优选的实施方案中,片段产生反应进行25个循环95℃30sec,50℃5sec,和60℃4min。然而,本领域技术人员借助此公开书的参考可理解,最佳时间和温度将取决于引物长度、引物序列、分析的多核苷酸序列、和使用的DNA聚合酶。6)分析反应产物在由模板双链产生经标记的线性多核苷酸片段家族之后,使用标记物鉴定来自第一种多核苷酸的这些经标记的反应产物,并将其具体类型与已知参考序列进行比较,或与来自第二种多核苷酸的经标记反应产物进行比较,以测定第一种多核苷酸和参考序列之间、或第一种多核苷酸和第二种多核苷酸之间的序列变异。如下进行。
首先,优选的,通过本领域众所周知的方法,诸如通过乙醇沉淀,纯化经标记的反应产物,除去其它反应混合物成分。然后通过适当方法使用适当仪器,对经纯化的标记反应产物进行分析。用于这样的分析的方法和仪器,必须能够检测和辨别片段产生反应方法中使用的标记物,且必须能够辨别或分辨不同长度单链DNA的链之间的单碱基差异。
例如,可以将经纯化的标记反应产物与合适的上样试剂混合,然后在类似于常规多核苷酸测序的条件下,使用变性电泳进行分析。概括的说,将反应产物溶于水或其它合适缓冲液,并与甲酰胺进行混合。然后,将它们于95℃加热1-5min进行变性,并于4℃迅速冷却。接着,将经变性的反应产物加到适当的仪器上,并通过变性聚丙烯酰胺电泳、变性毛细管电泳、或其它合适方法进行分析,其中使用的仪器能够检测和辨别反应产物上的标记物。用于电泳的分离基质必须对单链或变性DNA具有单碱基分辨率。合适的仪器可以由AmershamPharmacia Biotech,Inc.、LiCor,Inc.(Lincoln,NE,US)、Perkin-Elmer Corporation及其它来源处商业性获得。此外,还可以获得合适的定制仪器,诸如来自Marshfield Institute(Marshfield,WI,US)的SCAFUD。两种仪器类型都有软件可以用于分析由检测荧光反应产物产生的模式,和用于比较检测和分析的每种样品产生的数据。
一旦完成了对标记反应产物的分析,即将它们与参考序列或与来自分析的第二种多核苷酸的类似反应产物进行比较,测定第一种多核苷酸和参考序列之间、或第一种多核苷酸和第二种分析的多核苷酸之间的变异。此外,可以将多重分析的结果、和样品的来源和表型编入数据库,用于其它分析和相关性研究。而且,使用此方法,在单个反应混合物中,可以同时分析多于两种多核苷酸序列,本领域技术人员借助此公开书的参考可理解这一点。7)解读掺入反应产物中的标记以用于检测本方法产生的标记反应产物的优选方式,检测和辨别该方法中使用的标记物。标记物具有两种不同的功能。
第一,使用来源鉴定标记物来鉴定序列的来源,表现为将不同的、可辨别的标记引物或标记的非终止dNTP或二者兼之掺入反应产物,其中将相同标记物掺入由单一来源或合并物得到的反应产物。然后对来自这些标记的信号的鉴定能够测定衍生得到反应产物序列的来源或集合。
第二,使用碱基鉴定标记物(与来源鉴定标记物不同的标记物)通过将不同的、可辨别的标记双脱氧终止物掺入反应产物而鉴定反应产物上的终止碱基。
这两种类型标记物的使用,借助下列实施例作为参考将能更好理解。在第一个实施例中,片段产生反应中使用的正向引物具有红色标记(R),而片段产生反应中使用的反向引物具有蓝色标记(B)。而且,双脱氧终止物对的ddGTP成员具有绿色标记(G),而双脱氧终止物对的ddTTP成员具有黄色标记(Y)。此外,用于含第一种样品的模板的片段产生反应的一部分非终止dCTP具有橙色标记(O),而用于含第二种样品的模板的片段产生反应的一部分非终止dCTP具有紫色标记(P)。表Ⅰ给出两种片段产生反应的期望结果,并显示此实施例期望的标记反应产物分布。
表Ⅰ
因而,正如由上述实施例可理解的那样,可以鉴定每种反应产物的样品来源、模板链和终止碱基,同时可以由反应产物长度的分析与模板链长度的知识结合,鉴定终止碱基位置。在上述实施例中,具有颜色为橙色、红色和绿色的峰,来自由第一种样品得到的反应产物,因为它们含有橙色;来自含正向引物的模板链,因为它们含有红色;且由碱基G终止,因为它们含有绿色。
通过考虑产生每个峰的反应产物的标记物和它们的相对位置,可以测定模板正向和反向链的序列。可以通过它们的标记物鉴定衍生反应产物的样品,并可以测定第一种样品的多核苷酸和第二种样品的多核苷酸之间的序列变异。而且,通过分析两种样品的标记反应产物产生的峰的相对强度,可以测定变异发生的相对频率的估计值。
在第二个实施例中,测定在单个等位基因上或在两个等位基因上的多核苷酸变异的定位。为此目的,用完全未标记的dNTP进行片段产生反应,但是片段产生反应中使用的正向引物具有红色标记(R),而片段产生反应中使用的反向引物具有蓝色标记(B)。而且,双脱氧终止物对的ddGTP成员具有绿色标记(G),而双脱氧终止物对的ddTTP成员具有黄色标记(Y)。表Ⅱ给出了预计的结果,并显示此实施例预计的标记反应产物分布。
表Ⅱ
通过参考已知序列,可以测定各种反应产物的峰来自正向或反向链。然后,比较由正向和反向链得到的产物和它们的相对强度和颜色,能够判断变异是存在于一个等位基因还是两个等位基因上。
实施例1使用本方法定位并鉴定来自个体的单个DNA样品的SNP本方法用于测定含有人类生长激素转录激活子(growth hormonetranscriptional activator,GHDTA)和人类生长激素(growthhormone,GH1)基因的DNA区域中两种不同的单核苷酸多态性的定位和具体类型。本方法在来自两个不同个体的DNA上分别进行。一个个体的基因座1和2都是纯合A。另一个个体的基因座1是纯合G,而基因座2是纯合T。本方法如下进行。
首先,使用PCR标准方法,从每个个体分别制备跨越含GHDTA和GH1基因区域的2.7kb模板。然后,进行片段产生反应。反应混合物含有荧光标记的2’,3’双脱氧核苷三磷酸终止物对。在每种样品上进行两个反应。一个反应使用ddATP:ddCTP对(“A/C反应”)进行,另一个反应使用ddGTP:ddTTP对(“G/T”反应)进行。
根据制造商的说明书,每个反应混合物含有来自AmershamThermoSequenaseTMDye Terminator Cycle Sequencing Core Kit的成分,包括1/10量的下列成分20μl 5X反应缓冲液,10μl dNTP混合物,20μl去离子水,10μl ThermoSequenaseTM,120-150ng模板,和20pmol正向和反向引物。引物的5’末端之间跨越272bp的模板序列。A/C反应还含有1μl若丹明6G标记的ddATP和1μl ROX标记的ddCTP。G/T反应还含有1μl若丹明110标记的ddGTP和1μlTAMRA标记的ddTTP。
使用蜡珠覆盖层防止热循环过程中的蒸发。片段产生反应中使用的循环组成如下起始变性96℃3.5min,退火50℃15sec,延伸60℃4min;然后,进行另外的30个循环96℃30sec,50℃15sec,60℃4min;最终延伸60℃10min。
循环之后,将反应混合物冷却至4℃。除去蜡覆盖层,并将反应产物转移到1.5ml离心管中。然后,加入2μl 3M NaAc(pH5.2)和68μl100%乙醇(-20℃),沉淀DNA。将离心管于-20℃静置10min,然后以13,500xg离心5min。
接着,吸去乙醇,将沉淀用300μl80%乙醇(-20℃)清洗,并以13,500xg离心5min。吸去乙醇,并将沉淀短暂干燥,然后重悬于4μl去离子水。对于A/C和G/T组合,分别加入2μl用TAMRA或ROX标记的内部标准(internal standard)MapMarkerTM 400(BioVentures,Inc.,Murfreesboro,TN)。将样品振荡混匀,然后于37℃加热10min,以完全溶解沉淀。将样品短暂离心,使反应产物集中于离心管底部。
含反应产物的每种样品取2μl,加到装有10μl去离子甲酰胺的0.5ml分析管中,并盖好。将管振荡混匀并短暂离心。然后,将样品于95℃变性5min,并迅速冷却至4℃。
接着,在来自Perkin-Elmer Corporation的ABI PRISMTM310Genetic Analyzer上,使用41cm无涂层层析柱和POP4凝胶,对反应产物进行分析。分析指令包括进胶5kV 30sec,电泳15kV24min,60℃;使用适合于染料组合的光谱CCD指令。根据制造商的说明书,使用来自Perkin-Elmer Corporation的GeneScan7分析软件处理数据。对于A/C反应,使用对应于绿色(ddA若丹明6G)和红色(ddC ROX)的频道获取样品数据,使用黄色(TAMRA)频道获取内部标准数据。对于G/T反应,使用蓝色(ddG若丹明110)和黄色(ddT TAMRA)频道获取样品数据,使用红色(ROX)频道获取内部标准数据。
将每个个体每个反应得到的结果与以引物为侧翼的区域内的已知DNA序列进行比较,比较的结果证明了SNP的正确定位和具体类型。这证明了本方法可以用来定位和鉴定来自个体的DNA样品的多种SNP。
实施例2使用本方法定位并鉴定来自合并的模板混合物和来自合并的基因组DNA样品的SNP进一步使用本方法定位和鉴定合并的模板混合物中和合并的基因组DNA混合物中的SNP。首先,将如实施例1中公开的方法制备的两种2.7kb合并模板,以下列比例混合(150ng/μl总DNA):1∶0;40∶1;20∶1;10∶1;1∶1;1∶10;1∶20;1∶40;0∶1。如实施例1中进一步公开的,将这些合并模板混合物用于本方法。使用ddATP:ddCTP终止物对进行一个反应,使用ddGTP:ddTTP终止物对进行另一个反应。如实施例1中,对反应产物进行分析。
结果证明,即使反应混合物含有合并模板,即使将模板用含有其它等位基因的模板稀释40倍,本方法也能够测定SNP的定位和具体类型。而且,对应于每个等位基因的峰的相对强度,精确表示了反应混合物中每个等位基因所占的比例。这说明使用本方法可以测定SNP在合并模板混合物中的频率。
第二,以下列比例将来自实施例1中的、具有不同SNP基因型的相同两个个体的基因组DNA混合物进行合并1∶0;40∶1;20∶1;10∶1;1∶1;1∶10;1∶20;1∶40;0∶1。然后使用此合并的基因组DNA,得到2.7kb模板。根据本方法如实施例1中公开的,但是使用引物和ddGTP:ddTTP终止物对(它们都用不同的、可独特鉴定的荧光团进行了荧光标记),纯化并处理了总量为120ng的模板。
结果两种模板各产生了可独特鉴定的模式。出现了两种颜色标记的片段,而且它们的信号强度随合并混合物中发现的SNP的比例而变化。即,随着SNP1(G)和SNP2(T)等位基因的比例或SNP1(A)和SNP2(A)的比例升高或者降低,与相应片段上的终止物相关的信号强度也相应升高或者降低。
与放射性标记产生的无颜色ddF模式相反,此实施例证明本方法产生的模式可以容易的定位和鉴定不同的SNP,因为终止物是用不同的荧光团进行标记的,可以通过它们的颜色差异进行选择性鉴定。而且,即使模板是合并的或将基因组DNA群用于产生含SNP的合并模板,或将含SNP的模板用不含SNP的模板稀释40倍,仍可容易鉴定SNP产生的反应产物。
虽然借助某些优选的实施方案,已经相当详细的讨论了本发明,但是其它的实施方案仍然是可能的。因此,所附权利要求的精神和范围不受此处的优选实施方案的描述的限制。
权利要求1.测定第一种多核苷酸和第二种多核苷酸之间核苷酸序列变异的存在和具体类型的方法,包括a)提供第一种多核苷酸的样品;b)选择第一种多核苷酸可能含有变异的区域;c)对选定区域进行模板产生扩增反应,以产生包含所选定区域的双链多核苷酸模板群;d)通过片段产生反应,使用一组引物,同时由模板的两条链产生经标记的线性多核苷酸片段家族其中片段家族的每个片段由终止物于片段的3’末端终止,且其中片段家族包括在以引物为侧翼的模板链部分的每个可能碱基处终止的至少一个片段,用终止物表示;e)使用片段中存在的标记,测定第一种多核苷酸选定区域中至少一些碱基的定位和具体类型;并f)将测定的碱基的定位和具体类型与第二种多核苷酸的碱基的定位和具体类型进行比较,由此鉴定第一种多核苷酸选定区域和第二种多核苷酸相应区域之间核苷酸序列变异的存在和具体类型。
2.权利要求1的方法,其中还包括在对选定区域进行模板产生扩增反应之后,对模板进行纯化以除去其它扩增反应成分。
3.权利要求1的方法,其中终止经标记的线性多核苷酸片段家族的终止物是2’,3’-双脱氧终止物。
4.权利要求1的方法,其中第二种多核苷酸相应区域的序列如下测定a)对相应区域进行模板产生扩增反应,以产生包含相应区域的第二群双链多核苷酸模板;b)通过片段产生反应,使用第二组引物,同时由第二模板的两条链产生经标记的线性多核苷酸片段家族2,其中片段家族2的每个片段由终止物于片段的3’末端终止,且其中片段家族2包括在以第二引物为侧翼的两条模板链部分的每个可能碱基处终止的至少一个片段,用终止物表示;并c)使用片段家族2中存在的标记,测定第二种多核苷酸选定区域中至少一些这样的碱基的定位和具体类型。
全文摘要测定第一种多核苷酸与第二种多核苷酸之间核苷酸序列内的变异的存在与具体类型的方法,包括:首先,提供第一种多核苷酸的样品,并选择第一种多核苷酸中可能含有变异的区域;然后,对选定区域进行模板产生扩增反应,以产生包含该选定区域的双链多核苷酸模板群;接着,通过片段产生反应,使用一对引物,同时由模板的两条链产生经标记的线性多核苷酸片段家族;然后,使用片段中存在的标记,测定第一种多核苷酸选定区域内至少若干碱基的定位和具体类型;再将经测定的碱基的定位和具体类型,与第二种多核苷酸的碱基的定位和具体类型进行比较,从而鉴定第一种多核苷酸选定区域与第二种多核苷酸相应区域之间的核苷酸序列变异的存在和具体类型。
文档编号C12Q1/68GK1312859SQ99809692
公开日2001年9月12日 申请日期1999年8月19日 优先权日1998年8月19日
发明者E·P·道森, J·A·飞利浦三世 申请人:生物风险公司, 范德比尔特大学