核酸间差异的检测方法

文档序号:5834938阅读:904来源:国知局
专利名称:核酸间差异的检测方法
1.发明领域本发明涉及分子生物学领域,更具体而言是核酸杂交、霍利迪连结体形成和支链迁移。一方面,本发明提供了检测两相关核酸序列间的差异存在的方法和试剂。在本发明的一个优选实施方案中,此差异是突变,例如点突变、缺失或插入。本发明的实际应用包括,但并不局限于基因型分析、单核苷酸多态性的发现和检测、多核苷酸定性和定量、突变率检测、基因表达分析。此外,本发明能够区别纯合基因变异和杂合基因变异。
2.发明背景在开发多种核酸杂交技术时,利用了核酸与互补核酸进行选择性和特异性结合的倾向。这些技术不仅在检测核酸序列间的互补性和/或同一性(例如差别基因表达水平定量如RNA印记、DNA印记、以及基因表达芯片/微阵列),并且在一些情况下,可利用它们来检测相关核酸序列间的差异。
目前,低特异性使得基于等位基因特异性杂交之上的基因型测定技术的准确性较差。尤其是,目前基于多核苷酸杂交的基因型测定技术在区别或鉴定单核苷酸多态性方面经常表现出特异性不足。例如,含有特定SNP的一种形式的特定DNA链/寡核苷酸链不仅能与完全匹配的互补DNA进行杂交,也能与非完全匹配的特异性DNA链/寡核苷酸链,如含有特定SNP的另一种形式的特定DNA链或寡核苷酸链进行杂交。虽然两条完全互补的DNA链的杂交较非完全互补DNA链(包括那些含有两互补链间一或多碱基对错配的DNA链)间的杂交要强,但一般来讲,单碱基对差异太小而不能为SNP评分提供足够的特异性。相反,基因表达芯片和/或微阵列常常具有较SNP芯片/微阵列更好的特异性/准确性,这是由于特定cDNA及它们固定化在芯片/微阵列上的相应的寡核苷酸/DNA片段之间的杂交是非常特异的。这样的杂交不一定依赖于两核酸间的单碱基对差异。此处公开的方法将高度特异的等位基因特异性霍利迪结构形成与核酸杂交技术(如基因芯片/微阵列)进行结合,从而解决了这个问题。因此,SNP芯片/微阵列能获得与基因表达芯片/微阵列相同的高水平特异性/准确性。
在Panyutin IG等1993年发表的论文(Panyutin IG,Hsieh P,单碱基错配的形成阻止了自发的DNA支链迁移(1993)J.MoI.BioL,230413-24.)中,将一个与单链M13mp18病毒DNA的特定部分完全(或部分)互补的单链寡核苷酸退火结合到此病毒DNA上,形成在每个末端具有1个(或2个)尾的部分双链体。寡核苷酸与M13mp18病毒DNA形成的部分双链体形成具有1个(或2个)互补尾的侵入的部分双链体的十字型类霍利迪结构。随后,十字型样霍利迪结构以远离尾的方向进行支链迁移(由于能量屏障的存在,也即破坏了现有的氢键而不能形成新的氢键情况的存在,使得支链迁移不能向尾方向进行)。对在含有单尾的部分双链体间形成的霍利迪结构来讲,不管存在还是不存在Mg++,寡核苷酸/M13mp18部分双链体的双链体部分与侵入的部分双链体之间的单(或多)碱基对差异提供了足够的能屏障(2氢键→0氢键),以阻止支链迁移的进行并防止退火寡核苷酸的释放。对于含有双尾的部分双链体间形成的霍利迪结构来讲,只有在Mg++存在的情况下,寡核苷酸/M13mp18部分双链体的双链体部分与侵入的部分双链体之间的单碱基对差异(取代,缺失或插入)才能提供足够的能屏障来推动支链迁移来阻止退火寡核苷酸的释放。
已经提出的一个检测相关核酸序列间差异的方法包括在这些相关核酸序列间形成一个包含有霍利迪连结体的复合体。此方法在美国专利NO.6,013,439中有描述,在这个复合体中,至少对一对非互补核酸链的每个成员进行了标记。这两个标记碱基对会产生信号,这要依赖于这两个标记的碱基对间紧密接近。如果在此相关核酸间存在差异,霍利迪连结体就是稳定的,从而对彼此紧密接近的标记进行定位,并产生信号。另一方面,如果两序列间不存在差异,霍利迪连结体是不稳定的,复合体就解离为双链体,消除了两个标记间的紧密接近,并削弱了信号。对稳定的复合体是否形成进行确定,此稳定复合体的存在表明两相关序列间存在差异。
利用上述方法来检测相关核酸序列间是否存在差异时存在一个问题,也就是这通常需要利用标记过的PCR引物来产生检测霍利迪连结体复合体所需的标记核酸链。尤其是,当用于分析的靶核酸是基因组DNA时,利用标记引物就存在问题,这取决于必需采用的引物浓度以及由高水平标记引物的存在随后产生的干扰。因为此方法的一个重要的应用就是对基因组DNA进行分析,所以这是一个重大的缺陷。此外,标记核酸的制备和利用成本高且不方便,因此,不需要利用标记的多核苷酸或引物就能确定核酸序列间差异的有效方法是理想的方法。
本发明通过提供用于快速高效检测相关核酸序列间存在的差异的新颖方法和试剂解决了使用标记的多核苷酸和引物所引起的问题。同样的,本发明包含了对包括分子生物学和医学在内的相关领域的高度理想和实际的补充。
在Panyutin IG和Hsieh P的发现基础之上,我们设计了一个基因型分析方法,利用它可进行基因型的多元分析(在一个分析反应中可同时分析上万SNP/突变)并消除了对单个PCR反应的需求。因此,我们的方法具有显著减低成本并提高基因图谱分析结果的潜力。
3.发明概述一方面,本发明提供了检测两相关核酸间存在或不存在差异的方法。这些方法具有足够高的敏感性,可检测到核酸间存在的任何差异,甚至可对单核苷酸多态性进行检测。在这些方法中,靶核酸和参照核酸在特定条件下进行接触,从而使它们形成具有能够迁移的支链结构的十字型核酸复合体。在这样的接触条件下,如果靶核酸和参照核酸是完全相同的,那么支链迁移就能够完成,从而完成完整的链交换。如果靶核酸和参照核酸是不同的,就不能完成支链迁移,从而形成稳定的十字型复合体。检测到稳定的十字型复合体就能确定核酸间差异的存在。可以利用与这些复合体进行特异性结合的分子、利用凝胶电泳或通过对稳定的十字型复合体进行特异性分离对此稳定的十字型复合体进行检测。
在一个示范性实施方案中,本发明提供了检测两相关核酸间差异存在的方法。此方法包括形成包含有以双链体形式存在的两核酸序列的十字型复合体,其中,此十字型复合体中的核酸或者是都没有进行标记,或者是对形成十字型复合体的四核酸链中的一个进行了标记;将此十字型复合体置于能进行支链迁移的条件下,其中,如果两相关核酸序列间存在差异,那么该十字型复合体中的支链迁移就停止,此十字型复合体继续以稳定的十字型复合体形式存在;如果两相关核酸序列间不存在差异,十字型复合体中的支链迁移继续进行,直至完成完整的链交换,并且此十字型复合体解离为两双链体核酸;支链迁移后,将十字型复合体或其解离后的双链体产物置于特定条件下,使得该十字型复合体与试剂进行特异性结合,该十字型复合体与试剂进行的结合产生了可检测到的信号,检测到该十字型复合体与试剂特异性结合产生的信号就说明该十字型复合体的存在,也就说明两相关核酸序列间存在差异,没有检测到此信号说明两相关核酸序列间缺乏差异的存在。
在另一个示范性实施方案中,本发明提供了检测两相关核酸间差异存在的方法。此方法包括形成包含有以双链体形式存在的两核酸序列的十字型复合体,其中,此十字型复合体中的核酸或者是都没有进行标记,或者是形成十字型复合体的四条核酸链中的一个或多个进行了标记;将此十字型复合体置于能进行支链迁移的条件下,其中,如果两相关核酸序列间存在差异,那么该十字型复合体中的支链迁移就停止,此十字型复合体继续以稳定的十字型复合体形式存在;如果两相关核酸序列间不存在差异,十字型复合体中的支链迁移继续进行,直至完成完整的链交换,并且此十字型复合体解离为两双链体核酸;支链迁移后,将十字型复合体或其解离后的双链体产物置于能从双链体DNA中分离十字型DNA复合体(霍利迪结构)的条件下,并对该十字型复合体进行分离。通过与固定化在芯片/微阵列上的寡核苷酸/DNA片段进行杂交,包含有十字型复合体的DNA片段就可用做SNP评分的探针。
4.附图简述

图1提供了一个按照本发明的实施方案示意图,此实施方案利用PCR来检测两相关核酸序列间的差异,其中,两相关序列间不存在任何差异可导致完整的支链迁移,并导致霍利迪连结体复合体解离;图2提供了本发明的一个实施方案示意图,此实施方案利用PCR来检测两相关核酸序列间的差异,其中,两相关序列间存在的差异妨碍了支链的迁移,并导致稳定的霍利迪连结体复合体形成;图3提供了一个示意图,此图表示了一种利用与霍利迪连结体特异结合的蛋白来检测两相关核酸间差异的方法,其中两相关序列中的一个序列上存在变异,支链迁移停止,形成了稳定的霍利迪连结体复合体,而此复合体可利用标记的霍利迪连结体特异性结合蛋白来进行检测;图4提供了一个示意图,此图表示了另一种利用与霍利迪连结体特异结合的蛋白来检测两相关核酸间差异的方法,其中两相关序列中的一个序列上存在变异,支链迁移停止,形成了稳定的霍利迪连结体复合体,而此复合体是可利用标记的霍利迪连结体特异性结合蛋白来进行检测的;图5提供了靶DNA基因型分析方法的示意图;图6A提供了一个方法示意图,此方法可利用解离固定化在固体基质上的十字型复合体来对两核酸进行比较;图6B提供了一个方法示意图,此方法可通过对固定化在固体基质上的稳定的霍利迪结构进行检测来检测两核酸间差异的存在;图7提供了本发明的一个实施方案示意图,此实施方案利用PCR来确定在特定的SNP位置的二倍体基因组DNA样品的基因型;图8A提供了典型的凝胶电泳实验结果,其中检测到了稳定的霍利迪结构;图8B提供了典型的凝胶电泳实验结果,其中检测到了核苷酸的几个碱基对差异;图9A图解了稳定的霍利迪结构在蛋白结合条件下的迁移率变动;图9B图解了稳定的霍利迪结构的特异性结合,这是通过RuvA来进行的;图9C图解了稳定的霍利迪结构的特异性结合,它们分别是利用RuvA、突变RuvC、以及RuvA和突变RuvC混合物来进行的;以及图10图解了稳定的霍利迪结构与RuvA和RuvC的特异性反应。
5.附表简述表1图解了一个示范性方法,此方法可利用PCR来确定二倍体基因组DNA样品的基因型。
6.优选实施方案的详述正如在发明背景部分所述,以前用于检测核酸序列间差异的方法具有不准确、低产量和高成本的缺陷。
正如下面的详述,本发明通过提供新颖的核酸差异检测方法克服了这些困难及其他的限制。与以前的两核酸间差异的检测方法相比,本发明中的方法具有提高的准确性和效率。
6.1缩写在本专利说明书中,所提及的含有特定碱基序列的核酸的简写是传统的单字母简写。因此,包含于核酸时,天然的编码核酸碱基简写如下腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)。此外,除非有特别说明,以系列单字母简写表示的核酸序列是按5′→3′方向排列的。
6.2定义此处所用的名词“核酸”和“多核苷酸”是可以互换的,都指代任何核酸,不管此核酸是由脱氧核糖核苷还是由核糖核苷组成,也不管其连接方式是磷酸二酯键还是其他的修饰过的键,如磷酸三酯、氨基磷酸酯、硅氧烷、碳酸酯、羧甲酯、乙酰胺、氨基甲酸酯、硫醚、桥联氨基磷酸酯、桥联亚甲基磷酸酯、硫代磷酸酯、甲基磷酸酯、二硫代磷酸酯、桥联硫代磷酸酯或砜键以及这些键的结合。
术语核酸、多核苷酸以及核苷酸也特别包含除由五种生物学上的碱基(腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶以及尿嘧啶)组成的核酸以外的核酸。例如,本发明中的多核苷酸可至少含有一种修饰的碱基,这些修饰的碱基是选自包括但并不局限于5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟基甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-galactosylqueosine、肌苷、N6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-mannosylqueosine、5′-甲氧基羧基甲基尿嘧啶、5-甲氧基鸟嘧啶、2-甲硫基-N6-异戊烯腺嘌呤、尿嘧啶-5-氧乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w以及2,6-二氨基嘌呤。
此外,本发明中的多核苷酸可含有至少一种修饰过的糖,它选自包括但不局限于由阿拉伯糖、2-氟阿拉伯糖、木酮糖以及己糖组成的组中。
本发明并没有受到到多核苷酸来源的限制。此处的多核苷酸可取自人或非人哺乳动物,或其他生物体,或源自任何重组来源、通过体外合成或化学合成的多核苷酸。这些核苷酸可以是DNA、RNA、cDNA、DNA-RNA、杂交体或他们的混合物等,并且他们可以双链、单链或部分双链的形式存在。本发明中的核酸包括以纯化或非纯化形式存在的核酸和其片段,包括基因、染色体、质粒、生物物质如微生物,例如细菌、酵母、病毒、类病毒、霉菌、真菌、植物、动物、人等的基因组。
此处的核酸可以仅仅是复合体混合物如生物样品的微小部分。可利用本领域中熟知的方法从生物样品中获得这些核酸。
可对本发明中的核酸进行衍生和修饰,例如,为了便于检测,可进行生物素化、胺修饰、烷基化、或其他类似的修饰。
在许多情况下,例如需要提高的核酸酶稳定性时,本发明可应用具有修饰过的核苷间键的核酸。例如,用于合成含有硫代磷酸酯、二硫代氨基磷酸酯、磷阿米酮、甲氧乙基氨基磷酸酯、formacetal、thioformacetal、二异丙基甲硅烷基、乙酰胺、氨基甲酸酯、二亚甲基硫化物、二亚甲基亚砜、二亚甲基砜、2′-O-烷基以及2′-脱氧-2′-氟代硫代磷酸酯的核苷酸间键的方法在本领域中是众所周知的(见Uhlman等.,1990,Chem.Rev 90543-584;Schneider等.1990,Tetrahedron Lett.31335,以及其中引用的参照文献)。
术语“寡核苷酸”指相对较短的单链多核苷酸,一般来讲是通过合成方式得到的。一般来讲,寡核苷酸包含有8-100个核苷酸的序列,优选的是20-80个核苷酸,更优选的是30-60个核苷酸。可应用多种方法来制备本发明中使用的寡核苷酸。这些寡核苷酸可通过生物合成或化学合成的方法来获得。对短序列(最多大约100个核苷酸)来讲,一般化学合成相对于生物合成来讲较为经济一些。在经济之外,在合成步骤中,化学合成提供了引入低分子量化合物和/或修饰过的碱基的适当方法。此外,化学合成在靶多核苷酸结合序列长度和区域选择方面比较灵活。可通过标准方法,如商业用自动化核酸合成仪中使用的方法来合成寡核苷酸。在适当修饰的玻璃或树脂上进行的化学合成可以使DNA共价连接到表面上。这在冲洗和样品处理上有优势。可选用分子生物学中的标准复制方法,得到更长的序列。如J.Messing(1983)Methods Enzymol,101,20-78中所描述的,选用M13来进行单链DNA合成。其他的寡核苷酸合成方法包括磷酸三酯和磷酸二酯法(Narang,等.(1979)Meth.Enzymol.6890),以及在支持物上合成(Beaucage,等.(1.981)Tetrahedron I,etters 22;18591862),以及氨基磷酸酯技术,Caruthers,M.H.,等.,"Methods in Enzymology,"VoL154,pp.287-314(1988),以及在"DNA和RNA的合成与应用,"S.A.Narang,editor,Academic Press,New York,1987及其参照文献中描述的其他方法。
寡核苷酸“引物”可用于在多核苷酸模板上进行的链延伸,如用于核酸扩增。寡核苷酸引物一般是合成的单链寡核苷酸,在3′末端含有可杂交序列,它能与靶多核苷酸或参照多核苷酸的指定序列进行杂交。一般来说,寡核苷酸引物的可杂交序列与指定的序列或引物结合位点含有至少90%,优选95%,最优选100%的互补性。寡核苷酸引物的可杂交序列中的核苷酸数目应该是严格的,这样严格的寡核苷酸引物杂交条件可防止过度的随机非特异性杂交。一般来讲,寡核苷酸引物的杂交序列的核苷酸至少有10个,优选的是至少15个,优选20-50个核苷酸。此外,在引物的5′末端含有一个不与靶或参照多核苷酸杂交的序列,它含有1-60个核苷酸,5-30个核苷酸或,优选的8-30个核苷酸。
术语“样品”指预测含有目的核酸的物质。这样的样品包括生物流体,如血液、血清、血浆、痰、淋巴液、精液、阴道粘液、粪便、尿、脑脊液等;生物组织如毛发和皮肤;等等。其他样品包括细胞培养物等、植物、食物、法医学样品如纸、织物和刮削下的碎屑、水、污物、药品等。必要的时候,可利用试剂对样品进行预处理以使样品液化和/或从结合物质中释放核酸。这些预处理方法在本领域中是熟知的。
术语“扩增”应用于核酸是指任何可形成一或多拷贝核酸的方法,其中优选的扩增是指数扩增。如Saiki,等,(1986)Science,2301350-54描述的,可用于DNA特定序列酶扩增的一种方法是聚合酶链式反应(PCR)。PCR中选用的引物长度可为大约10-50个或更多核苷酸,一般是选用至少约15个核苷酸来保证充分的特异性。制备得到的双链片段称为“扩增子”,其长度可在30-20,000个或更多核苷酸间。
术语“链延伸”指通过增加核酸或碱基来延伸多核苷酸的3′末端。与本发明相关的链延伸一般是依赖于模板的,也就是,添加的核苷酸是由延伸链与之杂交的模板核酸序列决定的。制备的链延伸产物序列与模板序列是互补的。一般来讲,链延伸是酶催化的,在本发明中优选的选用热稳定DNA聚合酶,例如得自水生栖热菌(Taq聚合酶)、Thermococcus lioralis以及激烈火球菌的聚合酶。
“霍利迪连结体”是两相关(经常是相同的)核酸序列和他们的互补序列形成的复合体中的十字型连接体的分支点。此连接体能够进行支链迁移,从而解离为两双链序列,其中序列同一性和互补性一直延伸到链末端。霍利迪连结体、其形成和支链迁移都是本领域中的熟练技术人员熟悉的概念,并且有描述,例如,在Whitby等.,J.Mol.Biol.(1996)264878-90和Davies及West,Crarent Biology(1998)8727-27中的描述。
“支链迁移条件”是指在这些条件下,霍利迪连结体支链能够沿组成多核苷酸链行进。一般来讲,在本发明的实施中,选取的条件是使得仅仅在链交换不造成错配的条件下迁移能够进行的条件,其中形成单碱基错配将会妨碍链迁移,从而形成稳定的霍利迪连结体或霍利迪连结体复合体。在如Panyutin和Hsieh,(1993)J.MoL Biol.,230413-24中就能发现合适的条件。鉴于涉及的特定多核苷酸的性质不同,在特定应用中就不得不对条件进行变动。本领域技术人员不进行大量实验就可轻易区分这些修饰。
“稳定的”霍利迪连结体是指一个连接体,其中的错配已使支链迁移延缓到足以从双链体DNA中检测和区别稳定的霍利迪连结体的程度,而由于支链迁移,这些双链体DNA将会从含有相同序列的霍利迪连结体中释放出来。
含有“复合体”的霍利迪连结体指含有通过霍利迪连结体相连的四个核酸链的复合体,通过序列内和他们的互补成分中的差异可阻止其解离为两个双链序列。
当两核酸序列(1)完全相同,或(2)除了序列中将两核酸序列区分开来的一些差异外他们是完全相同的,那么这两个核酸序列是“相关的”。此差异可以是在序列中取代、缺失、或插入任何单核苷酸或核苷酸系列。此处的这些差异指“两相关核酸序列间的差异”。经常的,相关的核酸序列相互间具有单核苷酸的差异。一般来讲,相关的核酸序列在每个末端至少含有15个相同的核苷酸,但是他们具有不同的链长或含有存在至少一个核苷酸差异的间插序列。
术语“突变”指正常的保守核酸序列的核苷酸序列中的改变,从而形成与正常(未改变的)或野生型序列不同的突变体。一般来讲,可将突变分为两类,也即碱基对取代和读框移位突变。后者伴随着一到多个核苷酸对的插入或缺失。对表型正常性和异常性来讲,单个核酸差异可以是显著的,例如镰状细胞性贫血。
“双链体”是一含有相互退火的两互补序列的双链核酸序列。“部分双链体”是一双链核酸序列,其中一个链的部分与另一链的部分相互补,并可退火形成部分双链体,但链的所有长度并不完全互补,这样就至少在部分双链体的一个末端形成了一个单链多核苷酸尾。
在核酸序列中,此处的术语“杂交”、“结合”、和“退火”是可互换的。两核苷酸序列相互杂交的能力是基于两核苷酸序列的互补程度之上的,而互补程度是基于配对的互补核苷酸对比例之上的。在一给定序列中与另一序列互补的核苷酸越多,则杂交条件可越严格,则这两序列的结合越特异。一般来讲,提高的严格性是通过升高温度、提高助溶剂比率、降低盐浓度,以及本领域中熟知的其他方法来实现的。
当一个序列能与另一序列以相反方向结合时这两个序列就是“互补”的,其中一个序列的3′末端结合到另一个序列的5′末端,并且随后一个序列的每个A、T(U)、G、C与另一序列的T(U)、A、C和G分别配对。
“小有机分子”是分子量约小于1500,优选100-1000,更优选300-600的化合物,例如生物素、洋地黄毒甙、荧光素、罗丹明及其他染料、四环素和其他蛋白结合分子、以及半抗原等。小有机分子能为核酸序列与标记物或支持物提供结合方式。
6.3检测核酸间差异的方法本发明是普遍适用的,能对两相关核酸序列间的任何差异进行检测,不管这些差异是否是已知的。这些差异包括核酸序列内的任何变异,如单或多碱基取代或多态性、缺失或插入。本发明中的方法是快速、方便并能进行自动化操作的,并且能够以同源或异源形式进行。它理想地适用于快速的突变预筛选和基因型分析,尤其是包含有单核苷酸多态性(SNPs)的鉴定。本发明公开的方法是灵敏的且可定量的,并尤其服从于聚合酶链式反应(PCR)的应用。
一般来讲,本发明提供了可有效检测两相关核酸序列间差异的方法和试剂,而此差异是通过确定包含有能够形成稳定的霍利迪连结体的序列的构建体是否存在来确定的。本发明提供了方法和试剂以便为本发明中的实施制备这样的构建体,本发明也提供了可用于有效稳定和检测霍利迪连结体的方法和试剂。例如,在本发明的一个示范性实施方案中,利用一或多种能够与霍利迪连结体特异性结合的结合蛋白来检测稳定的霍利迪连结体。此处公开本发明的特定实施方案来例解本发明,从而使本领域中的熟练技术人员能实践本发明,但并没有限制本发明的范围。
6.3.1核酸通过形成包括多核苷酸构建体在内的稳定的霍利迪结构,本发明提供了用以检测两核苷酸序列间差异的新颖方法,其中的多核苷酸构建体包含有这两个多核苷酸序列,如图1所示。为了描述本发明,比较方便的是将这两个核苷酸序列称做靶序列和参照序列。一般来讲,参照序列是序列基本已知的多核苷酸,靶序列是一相关序列,是我们要进行检测以发现是否含有相对于参照序列的差异的序列。
两序列是相关的是指这两序列是完全相同的,或者是除了二者之间存在的一些差异外,这两序列是相同的。在本发明的优选实施方案中,这些差异是取代、缺失或插入变异或突变,例如但并不局限于单核苷酸多态性(SNP)。一般来说,靶序列和参照序列是以一对序列的形式制备的,按照下文详述的方法,他们可形成部分双链体。
图1图示了一个典型的部分双链体A′。部分双链体A′包含有一个互补双链体区和一或多个尾区。互补双链体区含有一个靶序列或退火到其互补序列上的参照序列。其他的部分双链体示例图解做A″、B′和B″。
在部分双链体A′中,一个尾区含有寡核苷酸尾T1和T2′。同样的,第二个尾区含有寡核苷酸尾T3′和T4。通过多核苷酸连接领域中技术人员熟知的那些已知连接方式就可将尾T1、T2′、T3′和/或T4连接到靶序列上。可通过共价键或连接体来对他们进行直接连接。连接体可以是多核苷酸或本领域中熟练技术人员已知的其他任何连接体。优选的,尾T1和/或T3′是通过磷酸二酯键直接与靶序列连接的。以类似的方式,将尾T1、T2、T3、T4、T1′、T2′、T3′和/或T4′连接到靶序列或参照序列上。
在本发明的一些实施方案中,部分双链体含有一个尾区。例如,当T1和T2′为0bp大小、而T3′>0bp、T4>0bp大小(或者,当T1>0bp、T2′>0bp大小、而T3′和T4为0bp大小)时,部分双链体A′含有一个尾区。在本发明的另外一些实施方案中,部分双链体具有两个尾区。例如,当T1、T2′、T3′和T4都大于0bp大小时,图1所示的部分双链体含有两个尾区。尾T1、T2′、T3′和T4优选为5-500bp,更优选为5-55bp。
所有的四个尾都包含相互间没有关联且都与模板DNA没有关联的序列,或者,部分双链体每个末端的多核苷酸尾对之一(T1/T2′或T3′/T4)是模板DNA序列。优选的,在没有来自靶序列、参照序列或其他尾的干涉的情况下,尾能与另一与尾互补的序列杂交。
为了形成十字型结构,利用相同的靶序列和其相应的参照序列制备了两或多个部分双链体。例如,在适当条件下,图1例示的部分双链体A′和B″能形成十字型结构。在图1中,部分双链体A′包含尾T1、T2′、T3′和T4。另一种部分双链体B″含有尾T1′、T2、T3和T4′。在部分双链体每个末端的每对多核苷酸尾,如T1/T2′,T2/T1′,T3′/T4,T3/T4′是不相互补的,并且在应用条件下他们不会相互退火。然而,部分双链体A′右端的尾T3′与部分双链体B″右端的尾T3相互补,因此能与其进行杂交。部分双链体A′右端的尾T4与部分双链体B″右端的尾T4′相互补,因此能与其进行杂交。部分双链体A′左端的尾T1与部分双链体B″左端的尾T1″相互补,因此能与其进行杂交。部分双链体A′左端的尾T2′与部分双链体B″左端的尾T2相互补,因此能与其进行杂交。
6.3.2核酸的制备可利用本领域中的技术人员熟知的多核苷酸或核酸制备方法来制备上述的部分双链体。例如,可利用标准重组、合成或PCR技术、或他们结合实用来制备部分双链体。此外,可从天然来源中分离部分双链体或其部分,如靶序列或参照序列。在美国专利NO.6,013,439中对能形成部分双链体的序列的示范性制备方法有描述,此专利在此处全文引用作为参照。在本发明的优选实施方案中,利用PCR技术来制备部分双链体。图1例示了通过PCR来制备部分双链体A′、A″、B′、B″。部分双链体,如A′和B″可用于检测靶序列和参照序列间的差异。可将A作为靶序列而B作为参照序列,或者相反。
为了确定两相关DNA序列间是否存在差异,需利用标准PCR,以分别进行或二者结合的方式对双链体A和B进行扩增,此PCR是选用由一或多个正向引物和两反向引物R1&R2组成的普通引物组来进行的。R1和R2可分享同一个与模板DNA上的相同部分杂交的3′末端(r′=r1′=r2′),或者R1和R2的3′末端与模板DNA的不同部分杂交。如图1所示,正向引物F1或正向引物F2可用于PCR反应中。如果选用的是正向引物F1,就可制备得到具有T1/T1′尾的双链体,如A1。如果选用的是正向引物F2,就可制备得到具有T2/T2′尾的双链体,如A2。这两个正向引物也可用来制备位于与正向引物相对应的末端的部分双链体。例如,在同一PCR反应中选用正向引物F1和F2产生可以用来制备用于部分双链体A′和A″的序列。此外,不含尾区的正向引物可用于制备在相应于正向引物的末端不含尾区的双链体。
虽然在一般情况下引物不需要进行标记,但在特定应用中对一或多个引物进行标记是有必要的。在本发明的一个优选实施方案中,正向引物和反向引物间的距离至少是1bp,优选的尾1-600bp或5-600bp,更优选的是5-100bp,这要取决于此应用的理想意图和目的多核苷酸的性质。
按照本发明,PCR扩增包括温度循环到变性双链体、寡核苷酸引物退火,以及通过依赖于热稳定模板的核苷酸聚合酶进行引物延伸。利用PCR进行的扩增方法采用的温度一般为大约50-100℃,更经常的是大约60-95℃。在杂交阶段选用50-80℃的相对低温,而变性阶段是在大约80-100℃下进行的,延伸阶段是在大约70-80℃下进行的,一般为大约72-74℃。一般来讲,本方法中的时间段为大约10秒-10分/循环,循环数目高达60或更多,一般为10-50次,经常为20-45次。在本领域中,合适的PCR规程是已知的,并可从如Sambrook等,Molecular CloningA Laboratory Manuai,2nded.,Cold SpringHarbor Laboratory Press,New York(1989)中查阅到,或由熟练的技术人员通过适当的实验得到。
选用聚合寡核苷酸引物来进行PCR扩增,此聚合寡核苷酸引物是设计来与待扩增的核酸的侧翼区域序列进行互补且退火杂交的。此引物的3′区至少有90%,优选95%,最优选100%与待扩增链序列的一部分互补的。在反应选用的引物的退火条件下,引物的互补部分应该足够长以便与靶序列或参照序列进行选择性杂交。一般来说,引物中可杂交序列的核苷酸数目至少为10个,优选至少15个,更优选20-50个核苷酸的长度。在一些情况下,基本上所有的引物是与靶序列互补的,例如图1中的F引物。在其他的情况下,引物的5′末端不与靶序列互补,在此情况下非互补序列将被掺入所复制子的末端。此非互补末端可含有1-60个或更多核苷酸、5-30个核苷酸、或优选的8-30个核苷酸。正是利用这些引物来产生位于部分双链体末端的寡核苷酸尾。这些引物也可用于制备复制子中间体,而这些复制子中间体能够被用于本发明中产生部分双链体制备的通用引物所识别。
PCR扩增中选用的寡核苷酸引物的浓度至少要与需要的拷贝数相同,一般为1nM-1mM,优选100nM-110uM。对基因组DNA扩增来讲,优选正向引物为大约500-1000nM、两反向引物分别为大约250-500uM,也即与STS(序列标记位点)扩增的条件相似。当对克隆过的DNA片段进行扩增时,低引物浓度就足够了,例如约25-250nM。
正向引物F的整个序列与模板DNA也即A和B进行杂交。正向引物F1和F2的3′末端可以相同(f1=f2),并与模板DNA(参照DNA和靶DNA)上的同一部分进行杂交,或者引物F1和F2具有不同的3′末端,从而与模板DNA上的不同部位进行杂交(f1≠f2)。此外,F1含有与或不与模板DNA杂交的5′末端区域(T1)。同样的,F2含有与或不与模板DNA杂交的5′末端区域(T2)。反向引物R1和R2可分享一共同的3′末端(r′=r1′=r2′),并与模板DNA上的同一部分进行杂交,或者引物R1和R2具有不同的3′末端,它与模板DNA上的不同部位进行杂交。此外,R1含有不与模板DNA杂交的5′末端区域(T3)。同样的,R2含有不与模板DNA互补,从而不与其杂交的5′末端区域(T4)。T3与T4没有关联,也即T3的互补链(T3′)不与T4互补,并且T4的互补链(T4′)不与T3互补。因此,在本方法中选用的条件下T4′不会与T3杂交。多个循环的PCR扩增会形成多个DNA产物,包括具有四个尾的部分双链体A′、A″、B′、B″(图1)的组成链。具有尾的部分双链体是通过调整溶液的温度以使组成链进行杂交来形成所需部分双链体的方式来制备得到的。我们注意到也形成了许多其他的双链体。一般来讲,这些非必需的产物不会造成问题,因为在上述条件下有形成了足够量的部分双链体。
每个含尾的部分双链体A′由双链体A的两互补核苷酸链的双链体,以及在双链体的一端的两个非互补寡核苷酸尾T3′和T4组成。依赖于对正向引物的选择,部分双链体A′可在其部分双链体的另一端含有0、1或2个尾(如果T1=0且T2=0,那么制备的部分双链体的左端可不含尾;如果T1=0或T2=0,那么制备的部分双链体可在其左端含有一个尾;如果T1≠T2≠0,那么在制备的部分双链体左端可含有两个非互补尾)。每个含尾的部分双链体A″由双链体A的两互补核苷酸链的双链体,以及在双链体的一端的两个非互补寡核苷酸尾T4′和T3组成。依赖于对正向引物的选择,部分双链体A″可在其部分双链体的另一端含有0、1或2个尾(见上文)。每个含尾的部分双链体B′由双链体B的两互补核苷酸链的双链体,以及在双链体的一端含有的两个非互补寡核苷酸尾T3′和T4组成。依赖于对正向引物的选择,部分双链体B′可在其部分双链体的另一端含有0、1或2个尾(见上文)。每个含尾的部分双链体B″由双链体B的两互补核苷酸链的双链体,以及在含尾双链体B′的一端的两个非互补寡核苷酸尾T4′和T3组成。依赖于对正向引物的选择,部分双链体B″可在其部分双链体的另一端含有0、1或2个尾(见上文)。
当引物F1、F2、R1和R2用于制备部分双链体A′、B′、A″、B″,而T1≠T2≠T3≠T4、f1=f2、r1=r2′或r1′≠r2′时,通常是利于进行PCR扩增的,选用引物F1/R1和F2/R2,同时进行反应A和B(靶DNA和参照DNA),这样就可以同时制备得到部分双链体A′、A″、B′和B″。然而,必需指出的是,如果需要,这些复制和扩增也可分别进行。例如,如图1所示,选用引物F1/R1和F2/R2,A和B扩增可单独完成。随后,在适当的条件下,将制备得到的含尾的扩增产物进行结合以得到部分双链体A′、A″、B′和B″(图1)。
当引物F1、F2、R1和R2用于制备部分双链体A′、B′、A″、B″,而T1≠T2≠T3≠T4、f1≠f2、r1′≠r2′时,重要的是,在模板的左端和右端,PCR扩增产物A1&B1(选用F1/R1,见图1)较A2&B2(选用F2/R2,见图1)覆盖了更多的模板DNA(换言之,f1较f2更在上游,r1′较r2′更在下游);或者,在模板的左端和右端,PCR扩增产物A1&B1(选用F1/R1,见图1)较A2&B2(选用F2/R2,见图1)覆盖了更少的模板DNA(换言之,f1较f2在更下游,r1′较r2′在更上游)。请注意,虽然PCR扩增产物A1&B1(选用F1/R1,见图I)较A2&B2(选用F2/R2,见图1)覆盖了模板DNA左端和右端更大的部分,但含有尾T1和T3是无用的或这与含有尾T1和T3无关(因此,优选T1=T3=0bp)。相同,虽然PCR扩增产物A1&B1(选用F1/R1,见图1)较A2&B2(选用F2/R2,见图1)覆盖了模板DNA左端和右端更少的部分,但含有尾T2和T4是无用的或这与含有尾T2和T4无关(因此,优选T2=T4=0bp)。如上所述,这通常利于进行PCR扩增,选用引物F1/R1和F2/R2,同时进行反应A和B(靶DNA和参照DNA),这样就可以同时制备得到部分双链体A′、A″、B′和B″。然而,必需指出的是,如果需要,这些复制和扩增也可分别进行。例如,如图1所示,选用引物F1/R1或F2/R2,A和B扩增可单独完成。随后,在适当的条件下,将制备得到的含尾扩增产物进行结合以得到部分双链体A′、A″、B′和B″(图1)。
当引物F、R1和R2用于制备部分双链体A′、B′、A″、B″、而T1=T2(优选T1=T2=0bp)、T3≠T4、f1=f2=f、r1′=r2′或r1′≠r2′时,通常是利于进行PCR扩增的,选用引物F、R1和R2,同时进行反应A和B(靶DNA和参照DNA),这样就可以同时制备得到部分双链体A′、A″、B′和B″。然而,必需指出的是,如果需要,这些复制和扩增也可分别进行。例如,选用引物F、R1和R2,A和B扩增可单独完成。随后,在适当的条件下,将制备得到的含尾扩增产物进行结合以得到部分双链体A′、A″、B′和B″。或者,在A和B起始扩增的时候选用F和仅仅一种R引物(R1或R2),随后将另外的一个R引物加入,并在开始时使用过的R引物存在或不存在的条件下进行额外的扩增循环。
对于本领域技术人员而言,所有的这些以及其他能够制备得到所需的含尾部分双链体A′、A″、B′和B″的其他的方案改变都是显而易见的,也都在本发明的范围之内。
6.3.3十字型结构的形成为了检测序列A和B间的差异,将包含有序列A和B的部分双链体(A′、A″、B′、B″)在适当的条件下进行接触,这样互补尾就能相互退火,从而启动形成四链复合体(霍利迪连结体),如图1所示。将形成的复合体C1、C2、C3、C4置于能进行支链迁移的条件下。限定了支链迁移不能以朝向尾的方向进行,因为在给定部分双链体上的尾相互间是不互补的,例如,T1与T2′不互补。然而,在靶序列和参照序列完全相同的情况下,支链迁移可按其他方向进行。如果两序列相同的,支链迁移就能进行到链的末端,造成复合体解离为两双链体,每个双链体含有源自最开始的部分双链体的一条链。另一方面,如果靶序列和参照序列不同,越过差异点后的支链迁移将会在新形成的双链体上造成错配。在本发明的操作条件下,这样的差异的出现实际上会阻断支链迁移,从而形成一个稳定的霍利迪连结体复合体。因此,稳定的霍利迪连结体的形成就表明两序列间差异的出现,因为在没有差异的条件下,此霍利迪连结体会解离为两双链体。
在含尾的部分双链体A′的右端,也即每条链的末端部分,分别含有序列T4和T3′,他们分别与T4′和T3′互补,而T4′和T3′是位于B″右端的尾,他们之间不具互补性,这些对于熟练的技术人员来讲是显而易见的。当在适当的条件下,将四尾的部分双链体A′、A″、B′、B″置于同一溶液中,就可形成两个含有部分双链体A′和B″的十字型霍利迪连结体(复合体C1和C2)。A′的T1尾与B″的T1′尾杂交和A′的T2′尾与B″的T2尾杂交可形成一个十字型霍利迪连结体。另一个十字型霍利迪连结体是A′的T3′尾与B″的T3尾杂交和A′的T4尾与B″的T4′尾杂交的结果。此外,另外的两个十字型霍利迪连结体复合了来自部分双链体A″和B′的C3和C4。一个是当A″的T1′尾与B′的T1尾杂交及A″的T2尾与B′的T2′尾杂交时形成的。另一个是当A″的T3尾与B′的T3′尾杂交及A″的T4′尾与B′的T4尾杂交时形成的。
此外,四尾的部分双链体A′、A″、B′和B″可形成多联体。例如,三个部分多联体B″、A′与另一个部分双链体B″可形成具有两个霍利迪连结体的多联体。然而,多联体的存在并不妨碍对序列A和序列B间差异的检测。如果序列A和序列B是相同的,这两个霍利迪连结体的支链迁移将按B″-A′-B″方向进行完全,最终整个多联体解离为两个双链体。如果在序列A和B间存在差异,这两个霍利迪连结体将会是稳定的。对稳定的霍利迪连结体的检测将会表明序列A和B间的差异。
本领域技术人员利用此处提供的内容和本领域技术人员所掌握的一般知识就能确定合适的尾杂交条件,从而形成含有特定双链体的霍利迪连结体。例如,可参见上文提及的Sambrook等、上文提及的Panyutin等的论文、以及美国专利No.6,013,439的内容。
将霍利迪连结体复合体C1、C2、C3、C4置于支链迁移条件下,其中,由于尾T1和T2及尾T3和T4是不同的,所以支链迁移只能沿远离尾端的方向进行,但正是这些尾的杂交启动了十字型霍利迪连结体的形成。如果在A和B间没有错配,那么复合体C1、C2、C3、C4的支链迁移就沿远离尾端的方向进行,直至部分双链体的另一端。因此,霍利迪复合体C1、C2、C3、C4都解离为双链体(图1)。或者,如果在A和B间存在错配,复合体C1、C2、C3、C4沿远离尾端进行的支链迁移就由于错配而停止,就形成稳定的霍利迪连结体复合体C1、C2、C3、C4(图2)。在本发明的一个实施方案中,支链迁移是在离子如Mg++存在的情况下进行的,而Mg++可增强错配的趋势,从而阻止自发的DNA迁移,因此就稳定了含有这样的错配的霍利迪连结体。Mg++的优选浓度为1-10mM。应该指出,通过其他离子,尤其是二价阳离子如Mn++或Ca++,或者适当的离子组合也可稳定霍利迪连结体复合体。在一个尤其优选的实施方案中,在65℃下、PH8.3,含有4mM MgCl2、50mM KCl、10mM Tris-HCl的缓冲液中温育20-120分钟可完成支链迁移。单碱基错配可导致稳定的霍利迪连结体的形成,对此种情况下的支链迁移条件的描述可参见如Panyutin and Hsieh,(1993)J.Mol.BioL,230413-24,此处全部引用作为参照。
6.3.4霍利迪结构的检测检测到稳定的十字型霍利迪连结体复合体(C1、C2、C3或C4)可用来指示DNA序列A和B间差异的存在。另一方面,不存在稳定的十字型霍利迪复合体可用于指示DNA序列A和B间差异的缺乏。按照本发明,可利用下述方法来检测指示核酸序列间差异的稳定的霍利迪连结体。例如,可通过能够与霍利迪连结体特异性识别和结合的分子来检测稳定的霍利迪连结体的存在。
6.3.4.1利用对十字型核酸复合体特异的分子来进行检测在一个实施方案中,对霍利迪结构具有特异性的1或多个分子可用于检测稳定的霍利迪结构的存在,从而检测多核苷酸序列A和多核苷酸序列B间的差异。
可利用本领域技术人员熟知的与霍利迪结构特异性结合的一或多个分子来检测霍利迪结构的存在。在一个优选的实施方案中,可利用一或多种蛋白来结合与检测稳定的霍利迪连结体的形成。源自多种生物体的许多蛋白表现出与霍利迪连结体特异性结合的能力。这些蛋白包括但并不局限于大肠杆菌的RuvA、RuvC、RuvB、RusA、RuvG;源自RuvA、RuvC、RuvB、RusA、RuvG的蛋白/突变体。此外,这些蛋白包括源自多种其他生物体的RuvA、RuvC、RuvB、RusA、RuvG的同系物(包括功能性同系物),例如源自哺乳动物的RuvA、RuvC、RuvB、RusA和RuvG的同系物,源自酵母的Ccel和spCcel,源自Pyrococcus furiosusa的Hjc,以及其他多种可与霍利迪连结体特异性结合的解离酶和重组酶。
在本发明中的尤其实用的实施方案中,利用热稳定蛋白来检测霍利迪结构的存在。这些热稳定蛋白包括源自嗜热生物体的RuvA、RuvC、RuvB、RusA和RuvG的热稳定同系物,而这些嗜热生物体是选自水生栖热菌、黄栖热菌、Thermus thermophilus和本领域中的熟练技术人员熟知的其他嗜热生物体。源自激烈火球菌的Hjc是与霍利迪结构具特异性结合的适当的热稳定蛋白的良好示例。
已经对在本发明的示例中有益的多种蛋白的制备和性质进行了描述,例如在下面列出的参照文献中,而所有列出的这些文献在此处全部引用作为参照Davies and West,supra;Whitby et al.,supra;Iwasaki H,.et al.1992.E.coli RuvA and RuvC proteins specificallyinteract with Holliday Junctions and promote branch migration.Genes Dev.62214-20;Parsons CA,et al.1992.Interaction of E.Coli RuvA and RuvB proteins with syntheticHolliday junctions.Proc.Natl.Acad.USA 895452-56;Traneva IR,et al.1992.Purification and properties of the RuvA and RuvB proteins of E.coli.Mol.Gen.Genet.2351-10;Rafferty JB,et al.1996.Crystal structure of the DNA recombination proteinRuvA and a model for its binding to the Holliday junction.Science 274415-21;Hargreaves D.,et al.1999.Crystalizaion of E.coli RuvA complexed with a syntheticHolliday junction.Acta Crystallogr D.Biol Crystallogr 55Pt 1)263-5;Hargreaves D.,etal.1998.Crystal structure of E.coli RuvA with bound DNA Holliday junction at 6Aresolution.Nature Struct Biol.5(6)441-6;Dunderdale HJ,et al.1994.Cloning,overexpression,purification,and characterization of the E.coli RuvC Holliday junctionresolvase.J Biol Chem 267(7)5187-94;Ariyoshi M,et al.1994.Atomic structure of theRuvC resolvasea Holliday junction specific endo nuclease from E.coli.Cell 78(6)1063-72;Sharples GJ,et al.1994.Processing of intermediates in recombination and DNA repairidentification of a new endonuclease that specifically cleaves Holliday junction.EMBO13(24)6133-42;Rice P,et al.1995.Structure of the bacteriophage Mu transposase coreacommon structural motif for DNA transposition and retroviral integration.Cell 82(2)209-20;Bujacz G.,et al.1995.High-resolution structure of the cataltic domain of aviansarcoma virus integrase.J Mol Biol 253(2)333-46;Rice P.et al.1996.Retroviralintegrases and their cousins.Curr Opin Struct Biol 6(1)76-83;Suek D.1997.DNArecognition by structure-selective nucleases.Biopolymer 44(4)405-21;White MF,et al.1997.The resolving enzyme CCE1 of yeast opens the structure of the four-way junction.JMol Biol 266(1)122-34;Whitby MC,et al.1997.A new Holliday junction resolvingenzyme from S.pombe that is homologous to CCE1 from S.cerevisiae.J Mol Biol271(4)509-22;Bidnenko E,et al.1998.Lactococcus lactis phage operon coding for anendonuclease homologous to RuvC.Mol Microbiol 28(4)823-34;Raaijmakers H,et al.1999.X-ray structure of T4 endonuclease VIIa DNA junction resolvase with a novel foldand unusual domain-swapped dimer achitecture.EMBO.18(6)1447-58;Komori K,et al.1999.A Holliday junction resolvase from Pyrococcus furiosusfunctional similarity to E.coli RuvC provides evidence for conserved mechanism of homologous recombination inBacteria,Eukarya,and Archaea.Proc Natl Acad Sci USA.96(16)8873-8;Komori K,etal.2000.Mutational analysis of the Pyrococcus furiosus Holliday junction resolvase Hjcrevealed functionally important residues for dimer formation,junction DNA binding andcleavage activities.J Biol Chem.(September/2000 issue);Sharples GJ,etal.1999.Holliday junction processing in bacteriainsight from the evolutionary conservation ofRuvABC,RecG,and RusA.J bacteriol 181(8);5543-50;Sharples GJ,et al.1993.An E.coli RuvC mutant defective in cleavage of synthetic Holliday junctions.Nucleic AcidResearch,21(15)3359-64.
可利用检测和/或蛋白显现领域中的技术人员熟知的方法来检测特异性结合到霍利迪结构上的蛋白。实际上,本发明的一个优点就是它可在不使用标记核酸的情况下来检测稳定的霍利迪连结体。在一优选的实施方案中,至少用一种标记物标记了至少一种霍利迪连结体特异性结合蛋白,也即能够选择性识别并结合霍利迪连结体的蛋白,并将标记后的蛋白置于可使该蛋白与稳定的霍利迪连结体如复合体C1、C2、C3和/或C4结合的条件下。该蛋白与霍利迪连结体的结合能产生一些能够检测到的信号,优选的的检测方式是定量检测。该信号可用作稳定的霍利迪连结体存在和其定量的指示剂,反过来,它也可作为DNA多态性分子中错配DNA的存在和量/比率的指示剂。
在一优选的实施方案中,本发明选用了至少一种标记过的蛋白来检测霍利迪连结体。对蛋白来讲,这些标记可以是内源的,如由于氨基酸如色氨酸、酪氨酸、或苯丙氨酸、或能够以一种可检测的方式进行反应的蛋白侧链的荧光得到的天然蛋白荧光。在翻译过程中或翻译后,这些标记能结合到蛋白上。适当的标记包括,但并不局限于荧光分子(包括,如荧光素、罗丹明及荧光蛋白和肽,如GFP和GFP变体及类似物)、放射性基团、固体表面、寡核苷酸、酶、染料、化学发光基团、辅酶、酶底物、配体、受体和有机小分子。
在本发明的一个优选实施方案中,两或多种蛋白可用于检测稳定的霍利迪连结体。这两种蛋白可以是相同的,也可是不同的,或是同一个蛋白的域或亚基。在一些实施方案中,可将这两或多种蛋白结合形成二聚体或更高程度的寡聚体,在一些实施方案中寡聚化作用要依赖于与霍利迪连结体的结合。在一优选实施方案中,这两种蛋白是用不同的标记物来标记的,并且这两种蛋白间的霍利迪连结体依赖型复合体形成导致了这两种标记物的缔合。这两种标记物的缔合可用作稳定的霍利迪连结体存在的指示剂(图3)。
例如,在霍利迪连结体不存在的情况下,RuvA和RuvC不能自发形成RuvC-RuvA复合体。然而,RuvA和RuvC能同时结合到霍利迪连结体上并形成RuvA-RuvC-霍利迪连结体复合体。已经对RuvA和RuvC以及多种RuvC突变体进行了克隆、过度表达和纯化。在本发明的一个优选实施方案中,RuvA和RuvC分别与不同的、可用作分子间荧光共振能量转移(FRET)供体/受体对的荧光载体相融合。分子间FRET可用来检测供体/受体对的缔合,也可用来对这些分子间的关系进行定性。在分子生物学领域中,FRET这类应用的原则是众所周知的。对利用FRET来检测两分子缔合进行描述的文献包括,如Heim R.1999.Green FluorescentProtein Forms for Energy Transfer.Methods in Enzymology 302408-23;Foerster T.1948.Ann Phys 255;Mitra RD,et al.1996.Fluorescence resonance energy transfer betweenblue-emitting and red-shifted excitation derivatives of green fluorescente protein.Gene17313-7;and Furey WS,et al.1998.Use offluorescence energy transfer to investigate theconformation of DNA substrates to the Klenow fragment.Biochemistry 37(9)2979-90,所有这些都在此处引用作为参照。只有在霍利迪连结体存在的情况下,RuvA和RuvC融合蛋白才相互缔合并产生特异的FRET信号。对FRET信号进行检测和/或定量可用于对稳定的霍利迪连结体的存在或其量进行检测和/或定量。一般来说,这两种蛋白与稳定的霍利迪连结体的结合导致了供体和受体对的紧密接近,并且受体在最大发射波长时的发射比率(在最大发射波长时,供体与受体的发射比)改变和发射强度改变可用来对霍利迪连结体的存在进行检测/定量。
本发明优选使用RuvC突变体,它缺乏酶的霍利迪连结体特异性核酸内切酶活力的野生型形式,但却保留了与霍利迪连结体特异性结合的能力。这些突变体包括D7N、E66Q、D138N、D141N、D7N、E66D、D138E和ruvC51,并在如SaitoA,等.1995.对组成RuvC霍利迪连结体解离酶催化中心的四个酸性氨基酸进行鉴定.Proc Natl AcadSci USA 927470-4;及Sharples GJ,等1993.在对合成的霍利迪连结体进行的切割中存在缺陷的大肠杆菌RuvC突变体.NucleicAcid Research,21(15)3359-64中有描述。
在本发明的一个优选实施方案中,FRET受体和供体对包含有蛋白质。特别适合的蛋白包括绿色荧光蛋白(GFPVs)和具有适当激发和发射频率的GFP突变体,其中许多在前述的文献中都有描述,如Heim R.,见上文;Foerster T.,见上文;Mitra RD,等.,见上文以及FureyWS,等.,见上文。
在本发明的一个实施方案中是利用了一个单霍利迪连结体结合蛋白来进行检测的,其中,分子内FRET可用于检测霍利迪连结体的存在/量(图4)。可利用两个荧光团,如两个用作分子内供体/受体FRET对的GFP突变体,对单霍利迪连结体蛋白进行双重标记。在一优选实施方案中,选用的单个蛋白为RuvC,更优选的是前述的一种RuvC突变体。当结合到霍利迪连结体上时,双标记蛋白进行了构象改变,这引起了两荧光团间物理关系的改变,因此也引起了FRET信号的改变。FRET的改变可以检测到,并且可用作稳定的霍利迪连结体的存在和其量的指示剂,这在上述的选用两霍利迪连结体结合蛋白的示例中有描述。
当选用了单个结合蛋白时,如果选用的蛋白可形成同源或异源寡聚体,那么分子间FRET也可用于检测霍利迪连结体的存在/量(图3)。例如,大肠杆菌RuvA在溶液中是以四聚体形式存在,而当与霍利迪连结体结合时就能形成八聚体。八聚体RuvA的形成是依赖于与霍利迪连结体的结合。因此,单独的RuvA可用于通过分子间FRET来检测霍利迪连结体。例如,可利用荧光团如GFPs或GFP变体对RuvA四聚体进行标记,第二个RuvA四聚体可利用第二个荧光团进行标记,这样这两个荧光团就可作为分子间供体/受体FRET对。在本发明的一个实施方案中,在霍利迪结构存在下,两个差别标记的RuvA四聚体形成了一个八聚体。
在本发明的一个实施方案中,固体表面可作为标记物,例如光学生物传感器,如Biacore或Iasys的表面。例如,光学生物传感器在Canziani G,等.1999.对利用光学生物传感器进行生物分子识别的研究.Methods 19(2)253-69中有描述。一般来讲,将能够与霍利迪连结体结合的分子,优选包括上文讨论的蛋白的分子,固定化在生物传感器的表面。在此实施方案中,霍利迪连结体与固定化蛋白的结合能够产生可检测到的光学信号。生物传感器可将此信号记录下来并作为稳定的霍利迪连结体存在和其存在量的指示。在此实施方案中,单标记,也即生物传感器表面足以用来检测霍利迪连结体。本发明的这一实施方案的优点是多核苷酸没有形成霍利迪连结体,霍利迪连结体结合分子也无需进行标记。
在本发明的另一实施方案中,LOCI(发光氧通道免疫测定)可用于检测霍利迪连结体结合蛋白与霍利迪连结体的结合。在如Ullman EF,等.1994.发光氧通道免疫测定利用化学发光来测定微粒结合的动力学.Proc Natl Acad Sci USA 915426-30中有对LOCI的描述。
在另外一个实施方案中,可以利用ELISA检验的方式来检测霍利迪连结体结合蛋白与霍利迪连结体的结合。ELISA检验在本领域中是众所周知的,并在如上文提及的美国专利NO.6,013,439和Sambrook等的论文中有描述。
在本发明的另一个实施方案中,可用质谱分析法来检测稳定的霍利迪连结体。本发明的这一实施方案的一个优点是不仅多核苷酸不形成霍利迪连结体,而且霍利迪连结体结合分子也无需进行标记。通过利用两双链体DNA形成十字型霍利迪连结体,或通过霍利迪连结体特异性结合蛋白与霍利迪连结体结合形成的霍利迪连结体/蛋白复合体就可得到高分子量的分子。利用质谱分析法来检测具有不同分子量的分子的存在/比率就可对霍利迪连结体进行检测/定量,反过来,也就能指示两DNA片段间的差异存在与否。应用质谱分析法来对大分子复合体进行定性在如KelleherNL.2000.从初级结构到功能从大分子质朴分析法得来的生物学启发.Chem Biol.7(2)R37-45中有描述。
在本发明的另一个实施方案中,SIGNATUREBIO公司的phenodynamic profiling system可用于检测霍利迪连结体诱导的蛋白-蛋白相互作用。本发明的这一实施方案的一个优点是不仅多核苷酸不形成霍利迪连结体,而且霍利迪连结体结合分子也无需进行标记。
6.3.4.2利用凝胶电泳来检测稳定的霍利迪结构在本发明的一个实施方案中,将十字型复合体置于支链迁移条件下得到的混合物是利用凝胶电泳来分离的。另人惊讶的是,在适当的条件下,可通过凝胶电泳来检测稳定的霍利迪结构。利用凝胶电泳检测到的稳定的霍利迪结构的存在表明靶序列和参照序列间的差异存在。
需要对凝胶电泳条件进行选择,这样,稳定的霍利迪结构就能从混合物中的其他复合体,如双链体、部分双链体和单链多核苷酸中分辨出来。凝胶电泳的实际操作条件要取决于多核苷酸序列和部分双链体的大小和性质。这些条件对本领域中的熟练技术人员来讲是显而易见的。例如,当靶序列和参照序列为大约35-300bp,并且相应的部分双链体为大约50-300bp时,稳定的霍利迪结构可在4-6%TBE-PAGE凝胶中、160V下电泳30分钟时分辨出来。
6.3.4.3通过分离稳定的霍利迪结构来检测在本发明的另一个实施方案中,通过将稳定的霍利迪连结体从混合物中的其他分子如双链体和单链多核苷酸中分离出来,从而完成对稳定的霍利迪连结体的检测。可从双链体DNA中分离稳定的霍利迪连结体,分离方式可为凝胶电泳、毛细管电泳、层析(包括利用包被有上文详述的霍利迪结构特异性结合蛋白的柱进行亲和层析)。
有多种方法可从双链体DNA中分离十字型霍利迪结构。为了确定多个SNP位置的单个的基因型,我们为每个SNP位置设计了一组PCR引物(F1、F2、R1和R2)。可将利用单个的基因组DNA进行PCR得到的DNA片段(部分双链体)作为靶DNA。将利用同一组引物得到的已知基因型的DNA片段(部分双链体)作为参照DNA。因此,每个SNP就有两个参照DNA(部分双链体)。将每个SNP位点的靶DNA(部分双链体)混合,并通过进行霍利迪连结体形成过程/支链迁移过程,逐个的将它们分别与相应的两个参照DNA(部分双链体)进行比较。PCR/支链迁移后,将在多个(1-数百万)SNP位点得到的混合物收集到一起。然后将收集的DNA置于分离/纯化霍利迪结构的条件(如凝胶/毛细管电泳、层析)下。利用多种方式对靶DNA和相应的多SNP参照DNA形成的这些霍利迪结构进行分离/纯化。
可利用凝胶电泳或毛细管电泳从双链体DNA中分离霍利迪连结体。随后对含有霍利迪连结体DNA的条带进行检测和纯化。然后,从含有霍利迪连结体的凝胶条带中洗脱/纯化DNA。
另外,作为另一个例示而不是限制,可通过层析法来分离包含有霍利迪连结体的收集物。在一优选实施方案中,与霍利迪结构特异性结合蛋白包被/缀合的固体表面(如柱、过滤器、塑料等)可用于分离/纯化霍利迪连结体。在包含有霍利迪连结体的纯化收集物中存在具有特异性SNP的DNA片段就表明此SNP的靶DNA与它曾对比过的参照DNA不同。或者,换言之,在此特异性SNP位置上用于产生靶DNA的二倍体基因组DNA至少有一个SNP版本拷贝与所用的参照DNA版本不同。因此,能够检测含有分离的/纯化的霍利迪连结体收集物的DNA片段的性质的方法都可用于SNP评分。源自多种生物体的多种蛋白表现出与霍利迪连结体特异性结合的能力,这在上文有详述。
作为一示例而不是一限制,DNA杂交可用于确定含有分离/纯化的霍利迪连结体收集物的DNA片段的性质。在一优选的实施方案中,可对含有已分离的霍利迪结构的DNA进行标记,并用作探针与固定化在SNP-芯片/微阵列上的DNA片段/寡核苷酸进行杂交,从而进行SNP评分。对芯片/微阵列上的特异性SNP来讲,阳性杂交信号表示用于产生在特异性SNP位置上的靶DNA的二倍体基因组DNA至少含有一个拷贝与选用的参照DNA不同。选取SNP位置上所有可能的版本作为参照DNA,将他们逐个的与相应的靶DNA进行比较(形成霍利迪结构/进行支链迁移),随后利用芯片/微阵列进行杂交来分离/纯化和鉴定霍利迪结构,我们就能同时高特异性/准确性地确定多(1-数百万)SNP位置处的二倍体基因组DNA样品的基因型。
例如,图5图解了多个多态性位点基因型分析方法。在图5中,利用4个正向引物(F/R1,F/R2,F/R3和F/R4)和一个反向引物来对靶DNA进行扩增。这四个正向引物F/R1、F/R2、F/R3和F/R4包含有一个多核苷酸序列F,此序列可与靶DNA和四条尾序列T1、T2、T3和T4中的一个序列互补。反向引物包含有与靶DNA和任选的通用尾UT互补的多核苷酸序列。如上文所述进行PCR来制备靶部分双链体。对正向和反向引物要进行一定的选择,这就可使得生成的部分双链体包含有靶序列中的目的多态性。利用相同的引物,对与靶DNA相对应并含有该多态性的已知序列的参照DNA进行扩增就可得到参照部分双链体。在能够形成十字型结构和进行支链迁移的条件下,将靶双链体和参照双链体混合在一起。按照前述的方法对稳定的霍利迪结构进行分离。霍利迪结构的分离表示着靶序列和参照序列间差异的存在。
值得注意的是可对多个靶DNA同时进行检测。利用一组独特的PCR引物来制备每个独特靶DNA的部分双链体。例如,就两个靶DNA来讲,与第一个靶DNA对应的部分双链体可用与尾T1、T2、T3和T4对应的引物来制备。与第二个靶DNA对应的部分双链体可用与尾T5、T6、T7和T8对应的引物来制备。尾T1、T2、T3和T4不能与尾T5、T6、T7和T8对应。每个参照DNA的参照部分双链体可利用与制备相应的靶DNA时所用的引物相对应的引物来制备。在相同的混合物中,所有的靶部分双链体能与相应的参照部分双链体进行接触,并且稳定的霍利迪结构能够一步回收。利用如任选的通用尾UT就可进行PCR来对回收的多核苷酸进行随意的扩增。然后,利用本领域中的熟练技术人员熟知的技术来鉴定回收的多核苷酸。例如,可通过与对尾T1、T2、T3和T4或尾T5、T6、T7和T8特异的寡核苷酸杂交来鉴定回收的多核苷酸。这些杂交可通过如基因芯片、寡核苷酸阵列或包被有寡核苷酸的标记珠来进行。可检测的杂交信号的存在表明一个特定的靶DNA与其相应的参照DNA不同。例如,回收的多核苷酸与相应于尾T5、T6、T7和T8的寡核苷酸杂交表明第二个DNA与它对应的参照DNA不同。
值得注意的是,相同的检测仪器(如基因芯片、寡核苷酸阵列或包被有寡核苷酸的标记珠)可用于任何多态性的基因型分析。这些检测仪器是特异于与上述方法中应用的PCR引物相应的尾,而不是特异于靶DNA。
6.4通过对固体基质上的稳定的霍利迪结构进行检测来检测两核酸间差异的方法另一方面,本发明提供了方法和试剂来解离固体基质上的十字型复合体。将相应于一个多核苷酸序列的部分双链体的一个多核苷酸固定化在固体支持物上,并在能形成十字型复合体和进行支链迁移的条件下与其他多核苷酸接触。此多核苷酸序列可以是,如一与相应于参照序列的核酸形成十字型复合体的靶序列,或与相应于靶序列的核酸形成十字型复合体的参照序列。如果靶序列和参照序列是完全相同的,那么支链迁移就能完成,并且一个双链体从固体表面上释放出来。如果靶序列和参照序列间存在差异,支链迁移将会停止,霍利迪连结体结构就稳定在固体基质上。对固定化的霍利迪连结体结构的检测就表明在靶序列和参照序列间存在差异。
此处的固体基质可以是本领域中的熟练技术人员熟知的任何固体基质。此处的固体基质包括本领域中的熟练技术人员熟知的那些可在其上固定化多核苷酸的任何物质。合适的物质包括,如金属、聚合物、玻璃、多糖、硝酸纤维素等。这些固体基质也可以任何形式,如珠、盘、板、条或其他能够负载多核苷酸的形式存在。这些多核苷酸可以通过本领域技术人员熟知的方式结合到固体基质上。这些多核苷酸可,如非共价结合到固体基质上,或直接共价结合到固体基质上,或通过连接体来结合到固体基质上。在一个优选实施方案中,多核苷酸通过紫外线交联固定化到硝酸纤维素上。
为了确定两DNA片段A和B间是否存在差异/变异,选用一个正向引物(F)和两个反向引物(R1和R2)中的任一个(A或B),进行PCR扩增(图6A和6B),使得该两DNA片段中的每个DNA片段(A或B)首先与尾/标记#1或与尾/标记#2相连接。形成的四个DNA双链体为A1(A+尾/标记#1);A2(A+尾/标记#2);B1(B+尾/标记#1);及B2(B+尾/标记#2)。
将一个双链体,如A1,固定化在固体基质上。将双链体A2/B1/B2混合物添加到固定化的双链体A1中,在随后的支链迁移条件下,部分双链体A′、A″、B′、B″就形成了瞬时霍利迪结构(图6A和6B)。如果A和B间有错配,那么瞬时霍利迪结构就会成为稳定的霍利迪结构/连接体(图6B)。当A和B间不存在差异时,瞬时霍利迪结构将会解离为双链体(图6A)另外,也可将其中的一个双链体如A1固定化在固体基质上。然后A1变性,并与A2形成固定化在固体基质上的部分双链体A′和A″(图6A和6B)。然后,将B1和B2的混合物,优选1∶1的比例,置于煮沸/变性条件下,随后置于重新退火条件下,在混合物中形成部分双链体B′和B″(图6A和6B)。然后,将含有B′和B″部分双链体的B1/B2混合物添加到已固定化有A′和A″部分双链体的固体基质上。然后将得到的混合物置于支链迁移条件下,这样部分双链体A′、A″、B′、B″就能形成瞬时霍利迪结构(图6A和6B)。当A和B间不存在差异时,瞬时霍利迪结构/连接体就迅速的解离为双链体(图6A)。
利用PCR/支链迁移缓冲液或任何不破坏霍利迪结构的缓冲液任意的冲洗固体基质上未结合的物质。只有当A和B间有错配/差异的时候,才不会将玻璃表面上的稳定的十字型霍利迪结构冲洗下来(图6B)。
随后,将试剂添加到不仅能与霍利迪结构特异性结合,而且能进行直接或间接检测的固体基质上。该试剂包括,但并不局限于GFP(或其他荧光)标记的霍利迪连结体特异性结合蛋白,如RuvC、RuvA、RusA和它们的同系物,及上文详述的其他试剂。随后,冲洗掉任何不能与固体表面特异性结合的试剂。然后,利用对这些试剂来说适当的方法来对这些特异性结合的试剂进行检测和/或定量。这些方法在上文都有详述。试剂的特异性结合表明固体基质上存在稳定的霍利迪结构,从而表明A和B间存在差异。
6.5 SNP鉴定方法任何基因变异,包括SNP在内,对DNA序列内每个可变位置来讲,至少包含有两种可能的版本。为了确定在一个特定的可变位置靶DNA样品(二倍体或单倍体)含有哪种版本,就要将靶DNA序列与代表可变位置处所有可能的变异版本的参照DNA序列进行比较。众所周知,DNA变异是以不同于SNP的多种形式存在。本发明不仅能够检测SNP,而且能检测涉及多碱基的多态性、多碱基对缺失、插入和错义突变。然而,通过SNP进行的基因型分析将用于例示,而并不局限,本发明在确定二倍体个体,如人的多种基因变异的基因型方面的应用。
为了确定特定SNP位置上的基因组DNA样品(X/X)的基因型,对所讨论的DNA进行扩增得到靶DNA。此外,两参照DNA(A或B)是由两参照基因组DNA样品(A/A或B/B)或由含有两参照DNA序列(A或B)的克隆DNA片段扩增而来的。所有三个DNA样品是利用两普通的未标记引物组、在标准PCR条件下进行PCR扩增得到的。基因组DNA的PCR条件与STS(利用基因组DNA进行的PCR中,正向引物的浓度为~500nM-1000nM,两反向引物的浓度为大约~250uM-500uM的PCR条件类似,利用克隆的DNA片段进行的PCR能耐受较低的引物浓度(~250nM)。每组引物含有3个引物一个正向引物(LF或RF)及两个反向引物(LR1,LR2或RR1,RR2)。LF与所讨论的SNP位置的左侧靶序列杂交。只要考虑到PCR扩增的可能性,LF就要与所讨论的SNP位置保持最短的距离,LF就是以这种方式设计的。LF优选与SNP位置保持<10bp的距离。LR1和LR2分享同一个3′-末端部分(LR),此3′-末端部分与所讨论的SNP位置的右侧靶序列进行了杂交。只要考虑到PCR扩增的可行性,LR1/LR2就要与所讨论的SNP位置保持最短的距离,LR1/LR2就是以这种方式设计的。LR1/LR2的3′端优选与所讨论的SNP位置相邻的碱基对相对应。RF与所讨论的SNP位置的左侧靶序列杂交。只要考虑到PCR扩增的可能性,RF就要与所讨论的SNP位置保持最短的距离,RF就是以这种方式设计的。RF的3′端优选与所讨论的SNP位置相邻的碱基对相对应。LR1和LR2分享同一个3′-末端部分(RR),此3′-末端部分与所讨论的SNP位置的右侧靶序列进行了杂交。只要考虑到PCR扩增的可行性,RR1/RR2就要与所讨论的SNP位置保持最短的距离,RR1/RR2就是以这种方式设计的。RR1/RR2的3′末端一般应为5-500bp,优选小于10bp。
利用两组引物(LF/LR1/LR2和RF/RR1/RR2),由靶基因组DNA样品扩增得到了两个靶DNA复制子L(X/X)和R(X/X)。复制子L(X/X)是利用引物组LF/LR1/LR2得到的。复制子R(X/X)是利用引物组RF/RR1/RR2得到的。利用两组引物(LF/LR1/LR2和RF/RR1/RR2),由两参照DNA样品(A/A和BB)扩增得到了四个参照DNA复制子L(A/A)、R(A/A)、L(B/B)、R(B/B)。复制子L(X/X)分别与复制子L(A/A)和L(B/B)以1∶1的比例混合形成了混合物L(X/X)/(A/A)和L(X/X)/(B/B)。复制子R(X/X)分别与复制子R(A/A)和R(B/B)以1∶1的比例混合形成了混合物R(X/X)/(A/A)和R(X/X)/(B/B)。随后,将生成的这四种混合物L(X/X)/(A/A)、L(X/X)/(B/B)、R(X/X)/(A/A)和R(X/X)/(B/B)变性/重退火,并置于支链迁移条件下(在含有Mg++的PCR缓冲液中,先在95℃下持续2min,随后在65℃下持续30min)。随后利用前述的霍利迪连结体特异性结合蛋白来检测稳定的霍利迪连结体的存在和存在的量。记录检测到的四种混合物的信号,并与所有可能的基因型的条形码(图7和表1)进行比较来确定所讨论的SNP位置上的靶基因组DNA样品的基因型。本发明不仅能确定所讨论的SNP位置上的靶基因组DNA样品的基因型,而且能确定所讨论的SNP位置附近的其他突变的存在和位置。
7.实施例1 利用凝胶电泳来检测两序列间的差异本实施例证明了稳定的霍利迪结构可由含有不同序列的多核苷酸来形成。按照本发明中的方法,可利用凝胶电泳来检测稳定的霍利迪结构。利用含尾反向引物,对含有已知的单核苷酸多态性(SNP)的人基因组DNA的5个区进行PCR扩增,以便形成霍利迪连结体。从国家生物技术信息中心(NCBI)的SNP数据库就能查到这些区的序列、在这些序列中各自的SNP的性质和位置、以及引物的序列。所用的SNP的NCBI检测ID如下4215、4217、4213、4141和4212。
源自M08PDR系列(含有8个个体DNA样品的Human PolymorphismDiscovery Resource系列的最小的亚型)的基因组DNA样品购自Coriell Cell Repository(Camden,NJ)。对每个SNP,扩增两个基因组DNA样品,一个为纯合体,一个为杂合体。这些样品的基因型在Lishansld,2000,Clinical Chemistry 46(9),1464-1470中有描述。用于扩增基因组DNA的引物序列如下所示。SNP4215F5’-CTGTGTTATTTGCTGATCCTG-3’(SEQ ID NO1)Rt15’-ACCATGCTCGAGATTACGAGGTAAACTTTCTGAGCCTCTGG-3’(SEQ ID NO2)Rt25’-GATCCTAGGCCTCACGTATTGTAAACTTTCTGAGCCTCTGG-3’(SEQ ID NO3)SNP4217F5’-CATTAGCTTAAAAGCTGTCTTTTGC-3’(SEQ ID NO4)Rt15’-ACCATGCTCGAGATTACGAGGGTTTGCTGGAAGAAAGCAG-3’(SEQ ID NO5)Rt25’-GATCCTAGGCCTCACGTATTGGTTTGCTGGAAGAAAGCAG-3’(sEQ ID NO6)SNP4213F5’-AAAACCCTGTTGATATTGGCC-3’(SEQ ID NO7)Rt15’-ACCATGCTCGAGATTACGAGCTGAATACTCTCCATCCTTGCC-3’(SEQ ID NO8)Rt25’-GATCCTAGGCCTCACGTATTCTGAATACTCTCCATCCTTGCC-3’(SEQ ID NO9)SNP4141F5’-ACCACATCCTCTCATTCGTTG-3’(SEQ ID NO10)Rt15’-ACCATGCTCGAGATTACGAGGGGGTCTCTGCAGTTAACCA-3’(SEQ ID NO11)Rt25’-GATCCTAGGCCTCACGTATTGGGGTCTCTGCAGTTAACCA-3’(SEQ ID NO12)SNP4212F5’-TGATGTCAAAATAGCTCCATGC-3’(SEQ ID NO13)Rt15’-ACCATGCTCGAGATTACGAGAATATGCAAAGTAATTTTCTGGCC-3’(sEQ ID NO14)Rt25’-GATCCTAGGCCTCACGTATTAATATGCAAAGTAATTTTCTGGCC-3’(SEQ ID NO15)其中F是正向PCR引物,R是反向PCR引物,t1和t2是5个复制子共有的“尾”序列(下面划线的)。正向和反向序列在NCBI SNP数据库中有公布。
利用PTC-200 DNA Engine thermocycler (MJ ResearchInc.,Waltham,MA)来进行PCR扩增。94℃下变性10s、62℃下重退火15s、72℃下延伸45s,这样进行35个PCR循环。在进行循环之前要在95℃下温育10分钟来活化AmpliTaq GoldTMDNA聚合酶(Applied Biosystems,Foster City,CA),随后在95℃下变性2min,在65℃下温育30min(重退火和支链迁移)。反应混合物(100ul)中含有100ng基因组DNA、2.5U AmpliTaq GoldTMDNA聚合酶、每种dNTP各200nM及溶解在商业AmpliTaq缓冲液(10mM Tris-HCl,ph8.3,50mM KCl,1.5mM MgCl2,0.01%明胶)中的每种引物各250nM。
将进行支链迁移的5ul PCR产物与1ul 6X TBE加样缓冲液(Invitrogen Corp.,San Diego,CA)混合,并填充到4-12%的梯度TBE预制聚丙烯酰胺凝胶(Invitrogen Corp.,San Diego,CA)。利用Xcell SurelockTMMini-Cell电泳仪(Invitrogen Corp.,SanDiego,CA),在1X TBE缓冲液中、165V下进行30分钟的凝胶电泳。用SYBR Gold荧光染料(Molecular Probes,Eugene,OR)对凝胶进行染色,并在DR-45M Dark ReaderTM透射仪(Clare Chemical Research,Denver,CO)上观察。
图8A展示了一个典型的凝胶图片。在1X TBE缓冲液中、165V下在4-12%梯度预制凝胶中电泳30分钟,并用SYBR Gold进行染色。在凝胶的底部展示了NCBI检测ID、各自的多态性和扩增子长度。条带3、6和13含有一个大小标记物-100bp的DNA序列梯(InvitrogenCorp.,San Diego;CA)。箭头指示未解离的霍利迪连结体带。
对于图8A中的每个SNP来说有两条条带一个是纯合体(左),另一个是杂合体(右)。扩增子的长度为122-245bp。当两等位基因存在单碱基序列差异时,仅仅在每个SNP的杂合体样品中出现相对较弱并缓慢移动的条带(箭头所示)。移动越慢的条带相应于较长的扩增子。系列稀释实验(未给出)证明,这些带中的DNA的量与未解离的霍利迪连结体的预期量大体相同(总量的1/16)。当用霍利迪连结体特异性核酸内切酶即野生型大肠杆菌RuvC进行消化时,缓慢移动的条带消失(未给出)。基于这些事实,缓慢移动的条带显然表示未解离的霍利迪连结体,因此也指示着基因组DNA中的两选择性等位基因的存在。
因此,正如图8B中的实验证明的那样,对未标记的PCR产物进行快速电泳足以进行SNP基因型分析。在此实验中,利用特异于SNP 4215的引物组对源自M08PDR系列的8个基因组DNA样品进行扩增,并进行支链迁移。165V下,在1X TBE缓冲液中,利用6%TBE凝胶电泳30min,并用SYBR Green染色。对6%TBE凝胶进行SYBRGreen(Molecular Probes,Eugene,OR)染色后,只有以前鉴定为杂合体A/G SNP(Lishanski,2000,上文)的五个样品(1,3,5,6和8)展示出由于支链迁移终止而产生的未解离的霍利迪连结体带(箭头所指)。
8.实施例2 RuvA和突变体RnvC蛋白与稳定的霍利迪连结体的特异性结合如本发明中的方法所述,本实施例证明了能够利用蛋白来特异性结合和检测稳定的霍利迪连结体。尤其是,利用RuvA和RuvC来特异性结合和检测稳定的霍利迪连结体。
在大肠杆菌中,RuvA和RuvC蛋白是多亚基RuvABC复合体的组成部分,多亚基RuvABC复合体可通过解离霍利迪连结体来促进同源基因重组。Shinagawa and Iwasaki,1996 Trends In BiologicalSciences21,107-111;Eggleston and West,2000,J.Biol.Chem.275,26467-26476.对它们在体外与合成的霍利迪连结体的结合进行了很好的研究。Davies and West,1998,Current Biology 8,725-727;Whitby et al.,1996,J.Mol.Biol.264,878-890.在溶液中,22kDaRuvA蛋白是以同型四聚体的形式存在的,并以四聚体或八聚体的形式与合成的霍利迪连结体特异性结合,以四聚体还是八聚体形式结合是要依赖于蛋白的浓度。19kDa RuvC蛋白是一个霍利迪连结体特异性内切核酸酶或解离酶,它可以二聚体的形式与霍利迪连结体结合、对其进行切割,并导致其解离。已经对几个保留有特异性结合活性但缺乏内切酶活性的RuvC蛋白突变体进行了分离。Saito et al.,1995,Biochemistry 92,7470-7474.
从大肠杆菌中表达和纯化的重组Ruv A和RuvC(D7N突变体)蛋白是由Dr.Hideo Shinagawa(Osaka University,Japan)提供的。按照实施例1中的描述,对选自M08PDR系列的多个样品进行PCR扩增和支链迁移。除实施例1中的SNP4215、4212、4213和4141外,这些实验中还包括了另两个SNPSNP3989和4216。选用的是下列引物组SNP 3989F5’-TGAGAGTAGCTTGGCTGGGT-3’(SEQ ID NO16)Rt15’-ACCATGCTCGAGATTACGAGTTTGGCTTTCATCTTCCCC-3’(SEQ ID NO17)Rt25’-GATCCTAGGCCTCACGTATTTTTGGCTTTCATCTTCCCC-3’(SEQ ID NO18)SNP 4216F5’-GCCATTGTAAGATCTGAATGAGG-3’(sEQ ID NO19)Rt15’-ACCATGCTCGAGATTACGAGATGTTTTATGTGGAGAGGTATCTGC-3’(SEQ ID NO20)Rt25’-GATCCTAGGCCTCACGTATTATGTTTTATGTGGAGAGGTATCTGC-3’(SEQ ID NO21)利用下文描述的条带移位实验对蛋白结合进行检测。室温下,将5ul进行支链迁移的PCR产物与1ul 0.25uM RuvA蛋白或1ul 0.5uM突变RuvC蛋白(在1X AmpliTaq缓冲液中稀释,见实施例1)混合,温育5-10min。加入1ul 6X样品加样缓冲液,然后将此样品加入到预制的聚丙烯酰胺凝胶中,如实施例1所述进行电泳并染色。
图9A例示了RuvA和RuvC与纯合体(左)或杂合体(右)SNP 4215样品的结合的对比实验。样品(A=RuvA;C=突变体RuvC)是在置于1X TBE缓冲液中的4-12%梯度聚丙烯酰胺凝胶中、在165V电压下电泳30min,并用SYBR Green染色的。白点指示相当灰白的霍利迪连结体条带的位置。在纯合体样品中没有观察到结合(没有移位的条带),而当蛋白结合时,杂合体样品中的霍利迪连结体条带的迁移率就发生了变动。
图9B展示了RuvA与霍利迪连结体的结合,其反应条件是能够保证RuvA对四种PCR产物的霍利迪连结体的特异性,而此四种PCR产物是与四种不同的SNP相对应的。实验条件与上文的图9A的实验条件相同。只是杂合体样品是用于结合实验中。对所有的SNP来讲,当与RuvA结合时,霍利迪连结体条带在电泳迁移率上有改变(-表示没有添加RuvA,+表示添加了RuvA)。
图9C提供了另一个RuvA、突变体RuvC及这两种蛋白的混合物与三种PCR产物的霍利迪连结体结合的例子,而此三种PCR产物是相应于以杂合体形式存在的三种不同的SNP的。除了凝胶电泳时间为75min和用SYBR Gold染色外,实验条件与上文图9A的实验条件相同的。A=RuvA;C=突变RuvC;A+C=RuvA+RuvC(预混合蛋白中添加有PCR产物)。
本实施例中实验表明,在特定的条件(相对较低的蛋白浓度)下,RuvA和突变体RuvC能特异性结合到进行支链迁移的DNA PCR扩增形成的未解离的霍利迪连结体上。因此,这些结合反应可用于对含有给定多态性的两个等位基因的样品和那些含有一个等位基因的样品进行区分,或换言之,就是进行SNP基因型分析。
9.实施例3 利用RuvA和RuvC对稳定的霍利迪连结体进行特异性结合如本发明中的方法所述,本实施例证明了两蛋白的复合体能有稳定的霍利迪连结体特异性结合。以抗Ruv A和突变体RuvC(由Dr.Hideo Shinagawa,Osaka University,Japan提供)的抗血清为探针,与霍利迪结构进行杂交,证明了这两种蛋白与或结构的特异性结合。
按照实施例2中的方法进行蛋白结合。实验选用了SNP 4216的杂合体样品。当RuvA和突变体RuvC都包括在结合反应中时,需要在添加PCR产物前对它们进行预混合。凝胶电泳条件与图9C中的相同。用SYBR Gold染色后,将凝胶暂时在含有0.1%SDS的1X Tris-甘氨酸电泳缓冲液(25mM Tris碱,192mM甘氨酸,pH8.3,InvitrogenCorp.,San Diego,CA)中温育。利用Xcell IITMBlot Module(Invitrogen Corp.,San Diego,CA),将蛋白从凝胶转移到硝酸纤维素膜(0.2um孔径),在20V电压下进行2hr。缓冲液包括12mMTris碱-96mM甘氨酸(pH8.3)和20%甲醇。在含有50mMTris-HCl、pH7.5、150mM NaCl、0.05%Tween 20的1X TBST缓冲液(RocheMolecular Biochemicals,Mannheim,Germany)中对硝酸纤维素膜进行短暂漂洗。然后,将硝酸纤维素膜在含有1%封闭试剂(RocheMolecular Biochemicals,Mannheim,Germany)的1X TBST中温育1hr。此步温育和所有的其他冲洗和温育步骤都是在4℃下持续震荡进行的。在完成封闭步骤后,将膜在含有10ml 1∶1000稀释的兔抗RuvC抗体的1%封闭溶液中温育1hr。将膜在20ml 1X TBST中冲洗四次,每次更换缓冲液,每次冲洗时间为5-10min。然后,将膜在含有10ml1∶1000稀释的1mmunoPureTM山羊抗兔IgG(与碱性磷酸酶缀合)的1%封闭溶液中温育30min。然后,将膜在20ml 1X TBST中冲洗四次,每次更换缓冲液,每次冲洗时间为5-10min。碱性磷酸酶的底物溶液是通过向10ml 0.1MTris-HCl、pH9.5、0.1 MNaCl、50mM MgCl2中添加44ul 75mg/ml氮蓝四唑氯化物(NBT)和33ul 5-溴-4-氯-3-吲哚磷酸p-甲苯胺盐(BCIP)制得的。NBT和BCIP购自LifeTechnologies,Rockville,MD。在5-10min内就可显色。
用铅笔对含有并显示RuvC蛋白的条带(图10的II中的2和3泳道)进行了标记。如上所述,对硝酸纤维素膜进行重阻断,并与进行1∶2000稀释的兔抗RuvA抗体探针杂交。
在1和3泳道中可见含有RuvA蛋白的条带(图10,III)。在第3泳道中,先后分别利用抗RuvC抗体和抗RuvA抗体显示出的条带的位置完全相同。或许是由于RuvAC复合体具有提高的紧密性,其电泳迁移率要略高于RuvA(泳道1)和RuvC(泳道2)的迁移率。
在图10的每个系列中,泳道1表示杂合体PCR产物+RuvA,泳道2表示杂合体PCR产物+RuvC(突变体),泳道3表示杂合体PCR产物+(RuvA+RuvC)。系列I表示用SYBR Gold染色的凝胶,系列II表示与抗RuvC抗体探针杂交的膜,系列III表示与抗RuvC抗体探针重杂交的膜。利用抗RuvC抗体对系列III的第2泳道进行的染色仍然可见。
10.实施例4 利用LOCI检测稳定的霍利迪连结体本实施例描述了检测稳定的霍利迪结构的方法,这个方法是通过对特异于霍利迪结构的两分子的分子间相互作用进行检测来进行的。
本实施例应用了均质化学发光检测法LOCI(Ullman et al.,1994,Proc.Nat.Acad.Sci.USA 91,5426-5430;Packard BioScience,Meriden,CT)。它们利用了一个事实当两个颗粒,一个受体和一个供体,紧密接触时,由于生物学上的相互作用就产生了化学发光。如实施例1-3中描述的,利用一个参照序列和一个靶序列就制备得到了PCR产物。PCR产物在能形成四链复合体和进行支链迁移的条件下进行接触。
支链迁移后,如果存在,稳定的霍利迪结构,就会与生物素化的RuvA(b-RuvA)和未标记的突变体RuvC进行接触。随后,此复合体与特异于RuvC的抗血清(如鼠或兔的抗血清)进行接触。在适当的条件下,形成的复合体与包被有链霉抗生物素的供体珠及包被有抗鼠或抗兔IgG的受体珠进行接触。
利用680nm的激光对此混合物进行照射,供体珠中的光敏剂就产生单电子氧。单电子氧诱导了受体串珠中的化合物的化学发光。如果由于靶多核苷酸和参照多核苷酸间存在差异而形成稳定的霍利迪结构,那么就能观测到信号。在霍利迪连结体不存在(支链迁移没有收到抑制)的情况下不能观测到信号。
11.实施例5利用RuvA来检测稳定的霍利迪结构本实施例证明了含有相同蛋白的两个分子可用不同的标记物进行单独标记,并用于检测靶多核苷酸和参照多核苷酸间的差异。
RuvA蛋白在溶液中时以四聚体的形式存在,并且两个这样的四聚体与霍利迪连结体结合形成八聚体。在体外,对一个RuvA四聚体用生物素标记(b-RuvA),对另一个四聚体用荧光素标记(f RuvA)。标记的RuvA分子可用于检测稳定的霍利迪结构。
如实施例1-4所述来制备PCR产物,并将其置于支链迁移条件下。稳定的霍利迪结构,如果存在,就会与b-RuvA和f-RuvA进行接触。随后,形成的复合体与包被有链霉抗生物素的供体珠及包被有抗荧光素抗体的受体珠进行接触。
如实施例4中所述对供体珠和受体珠的相互作用进行检测。供体-受体信号存在表示靶序列和参照序列间存在差异。
12.实施例6通过FRET来对稳定的霍利迪结构进行检测本实施例描述了一个基于荧光共振能量转移(FRET)之上的、高效且敏感的方法来检测两多核苷酸间的差异。
已公布的含有合成的霍利迪连结体的RuvA复合体的晶体结构(Rafferty et al,1996,Science 274,415-421;Hargreaves et al,1998,Nature Struct.BioL 6,441-446;Ariyoshi et al,2000,Proc.Nat.Acad.Sci.USA 97,8257-8262;Roe et al.,1998,Mol.Cell 2,361-372)表明,两RuvA四聚体间的距离在10-100的FRET区域之内。
在稳定的霍利迪结构存在的情况下,为了产生FRET信号,就要将一个四聚体上的RuvA用FRET对的一个供体,如荧光素来标记,将第二个四聚体用相应的受体,如四甲基罗丹明或QSY7染料(MolecularProbes,Eugene Oregon)来标记。
如实施例1-4所述来制备PCR产物,并将其置于支链迁移条件下。稳定的霍利迪结构,如果存在,就会与两标记的RuvA四聚体进行接触。结合后,利用荧光分光光度计在合适的波长下对供体荧光球进行激发,通过受体荧光出现来检测FRET。
没有霍利迪连结体存在(PCR产物的支链迁移没有受到抑制)的情况下,检测不到FRET。FRET信号出现表明两多核苷酸序列间存在差异,并且有霍利迪连结体形成。
另外,用相同的方法,将与霍利迪结构特异性反应的其他分子对用FRET对进行标记。例如,用两含有FRET对的不同的荧光染料对RuvA和突变体RuvC进行标记,并在霍利迪连结体上检测到了它们的集合。
另外,将RuvA分子与两不同的GFP突变体进行融合,从而将供体和受体荧光球导入RuvA中(Heim,1999,in Methods in.Enzymology302,408-423;Green Fluorescent Protein)。克隆和表达这些融合体时用的载体是得自Aurora Bioscience(San Diego,CA)。这种方法避免了对蛋白进行必需的化学修饰。另外,将RuvA和突变体RuvC与两不同的GFP突变体融合,并在霍利迪连结体上检测到了它们的集合。
13.实施例7通过BRET对稳定的霍利迪结构进行检测本实施例提供了另一个高效且敏感的方法来检测多核苷酸间的差异。本示例中的方法是基于生物发光共振能量转移(BRET;PackatdBioScience,Meriden CT)之上的。在BRBT方法中,可检测到从生物发光供体荧光素酶到受体GFP的能量转移。
如实施例1-6所述来制备PCR产物,并将其置于支链迁移条件下。稳定的霍利迪结构,如果存在,就会与和荧光素酶融合的RuvA及和GFP融合的RuvA进行接触。利用商业可得的克隆和表达载体来制备RuvA与荧光素和GFP的融合体。
结合后,利用荧光分光光度计在合适的波长下对供体荧光载体进行激发,并通过受体的荧光出现来检测BRET。BRET信号的检测不需要任何激发光源。BRET信号出现表明多核苷酸序列间存在差异。
另外,RuvA和突变体RuvC可分别与荧光素酶和GFP(或反过来)进行融合,利用BRET可在霍利迪连结体上检测到它们的集合。
上述讨论包括关于本发明中的一些机理的特定理论。我们没有意图要用这些理论来限制本发明,也不应认为这些理论以任何方式限制本发明。
此处描述的特定实施方案没有限制本发明的范围。实际上,通过前面的描述和附图,对于本领域中的熟练技术人员来讲,除了此处的描述之外,本发明的多种变化是显而易见的。这些变化是在附加的权利要求范围之内的。
此处引用了多种文献,因此,它们公开的部分在本发明中全部引用作为参照。
权利要求
1.检测两个相关多核苷酸序列间是否存在差异的方法,该方法包括(a)形成包含有以双链体形式存在的所述两个多核苷酸序列的十字型复合体;(b)将该十字型复合体置于支链迁移条件下,其中,如果所述两个相关核酸序列间存在差异,该十字型复合体的支链迁移就停止,此十字型复合体就稳定存在;如果所述两个相关核酸序列间不存在任何差异,该十字型复合体的支链迁移就会继续,直至完成完整的链交换,并且该十字型复合体解离为两个双链体核酸,从而形成一稳定的十字型复合体;(c)将所述稳定的复合体或支链迁移后的其解离的双链体产物置于特定的条件下,在此条件下,可选择性识别十字型复合体的第一种试剂与十字型复合体能够进行特异性结合,其中,该试剂与该十字型复合体的结合产生了可检测的信号;及(d)对该第一种试剂与该十字型复合体特异性结合时产生的信号进行检测,以此来指示该十字型复合体的存在,此信号与所述核酸序列间差异的存在相关,该信号不能检测到则与所述核酸序列间缺乏差异相关。
2.权利要求1中的方法,其中的差异为突变。
3.权利要求1中的方法,其中的核酸序列为DNA。
4.权利要求1中的方法,其中的十字型复合体含有霍利迪连结体。
5.权利要求1中的方法,其中的第一种试剂是与霍利迪连结体结合的化学物质,当此化学物质与霍利迪连结体结合时产生了特异的、可检测到的信号。
6.权利要求5中的方法,其中的第一种试剂是染料。
7.权利要求1中的方法,其中的第一种试剂是霍利迪连结体结合蛋白。
8.权利要求7中的方法,其中的霍利迪连结体结合蛋白是重组酶或解离酶。
9.权利要求7中的方法,其中的霍利迪连结体结合蛋白是热稳定的。
10.权利要求7中的方法,其中的霍利迪连结体结合蛋白选自RuvA、RuvC、RuvB、RusA、RuvG、Ccel和spCcel、Hjc。
11.权利要求5中的方法,其中可检测信号的产生涉及霍利迪连结体结合蛋白中的构象改变。
12.权利要求1中的方法,其中可检测信号的产生涉及霍利迪连结体诱导的、发生在霍利迪连结体特异性结合蛋白和形成霍利迪连结体复合体的核酸间的缔合。
13.权利要求1中的方法,其中可检测信号的产生涉及所述第一种试剂的特异性霍利迪连结体结合诱导的荧光。
14.权利要求1中的方法,其中至少一种相关的多核苷酸序列没有进行可检测到的标记。
15.权利要求14中的方法,其中没有一种相关的多核苷酸序列进行了可检测到的标记。
16.权利要求1中的方法,其中a.将稳定的复合体置于特定条件下,在此条件下,可选择性识别十字型复合体的第二种试剂与十字型复合体能够进行特异性结合,其中,第一种试剂和第二种试剂与十字型复合体的同时结合产生了可检测的信号;及b.对第一种试剂和第二种试剂与十字型复合体特异性结合时产生的信号进行检测,以此来指示该十字型复合体的存在,此信号与所述核酸序列间差异的存在相关,该信号不能检测到则与所述核酸序列间缺乏差异相关。
17.权利要求9中的方法,其中第一种和第二种试剂是霍利迪连结体结合蛋白。
18.权利要求9中的方法,其中信号的产生是通过霍利迪连结体诱导的、第一和第二种试剂的紧密缔合来实现的。
全文摘要
本发明提供了用于检测两相关核酸序列间存在或不存在差异的方法。在这些方法中,靶核酸和参照核酸在特定条件下进行接触,从而形成具有能够迁移的支链的十字型核酸复合体。在这样的接触条件下,如果靶核酸和参照核酸是完全相同的,那么支链迁移就能够完成,从而完成完整的链交换。如果靶核酸和参照核酸是不同的,就不能完成支链迁移,从而形成稳定的十字型复合体。检测到稳定的十字型复合体就能确定核酸间差异的存在。可以利用与这些复合体进行特异性结合的分子、利用凝胶电泳或通过对稳定的十字型复合体进行特异性分离对此稳定的十字型复合体进行检测。
文档编号G01N33/566GK1429277SQ01809310
公开日2003年7月9日 申请日期2001年3月12日 优先权日2000年3月11日
发明者Q·杨, W·杨, A·利尚斯基 申请人:弗雷什基因公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1