测定核酸碱基序列的方法

文档序号:628716阅读:1856来源:国知局
专利名称:测定核酸碱基序列的方法
技术领域
本发明涉及一种可用于基因工程领域的测定核酸的核苷酸序列的方法。
背景技术
目前,分析核酸的核苷酸序列的主流方法是链终止法,其中通过采用平板型或毛细管型凝胶电泳来进行分析。在该方法中一次可以分析的核苷酸序列的长度由于所使用的聚合酶和电泳设备的改进而得到增加。然而,可以分析的长度通常仅约500个碱基对,最多1000个碱基对或稍少。因此,为了测定已经克隆到传统载体(质粒、噬菌体、粘粒等)的长于数千个碱基对的DNA片段的核苷酸序列,人们需要使用引物步查法、亚克隆法和缺失克隆构建法之一或其组合。
例如,如果使用引物步查法测定已经克隆到质粒载体中的长度为5000个碱基对的DNA片段的核苷酸序列,则首先使用具有所述载体上的核苷酸序列的引物从已克隆DNA片段的一个末端测定核苷酸序列。然后根据新获得的核苷酸序列信息设计并合成另一种引物,以测定先前测定的核苷酸序列区域之外的一个区域的核苷酸序列。通过重复上述步骤数次,可以测定已克隆片段的完整的核苷酸序列。然而,由于引物步查法要求在核苷酸序列测定的每个步骤设计并合成一种引物,因此需要许多时间和费用。
如果用亚克隆法分析这样一种DNA片段的核苷酸序列,则首先用不同的限制性酶消化质粒DNA,以便根据所述消化所产生的DNA片段的长度制备已克隆DNA片段的限制性图谱。将通过用根据限制性图谱选择的限制性酶消化所获得的DNA片段,亚克隆到噬菌体或质粒载体中。然后,用具有所述载体上的序列的一种引物测定核苷酸序列。由于亚克隆法需要复杂的步骤,包括制备限制性图谱和后续的亚克隆,所以需要很大的工作量和许多时间。另外,适合于亚克隆的限制性酶识别位点需要一致地分布在原始已克隆DNA片段上,以便有效地按照该方法测定所述DNA片段的核苷酸序列。
缺失克隆构建法是Yanisch-Perron等开发的一种核苷酸序列测定法,如Gene,33103-119(1985)中所述,在该方法中,通过从作为基点的已克隆片段一端连续缩短该片段,制备一系列克隆。按照该方法,与引物步查法和亚克隆法相关的问题得到部分解决。具体地说,缺失克隆构建法不需要在核苷酸序列测定的每个步骤设计并合成引物(这是按照引物步查法所需要的)或者制备限制性图谱并且根据限制性图谱进行亚克隆(这是按照亚克隆法所需要的)。然而,缺失克隆构建法需要相当多的基因工程技术,因为为了按照该方法制备具有连续缩短的DNA片段的一系列克隆,需要用两种限制性酶即外切核酸酶III、外切核酸酶VII、Klenow片段DNA聚合酶和DNA连接酶按照这种顺序,在适合于相应酶的条件顺序处理具有已克隆DNA片段的质粒。此外,在最终的顺序处理之前,还必需通过进行初步实验测定已克隆DNA片段对外切核酸酶III的反应性(缺失的倾向),因为反应性随已克隆DNA片段的核苷酸序列而变化。
分析通过PCR随机扩增片段的核苷酸序列的方法包括Telenius等的简并寡核苷酸引物PCR(DOP-PCR)法(Genomics,13718-725(1992))和Wong等的标志随机六聚体扩增(TRHA)法(Nucleic Acids Research,24(19)3778-3783(1996))。在每种方法中,都使用含有随机序列的多种引物的混合物进行PCR,分离多重扩增的序列梯条带并逐个纯化,然后进行测序。因此,这些方法的步骤是复杂的。
如上所述,目前用于分析核酸的核苷酸序列的所有方法都有问题。因此,需要一种快速低成本的分析核酸的核苷酸序列的方法,以分析基因组。
发明目的本发明的主要目的是提供一种测定核酸的核苷酸序列的方法,其中无需复杂的步骤而制备一系列长度从模板核酸上的一个基点连续缩短的扩增DNA片段,并且分析所述DNA片段的核苷酸序列。
发明概要作为深入研究的结果,本发明人已经发现,通过组合用一种模板特异性引物和从具有已确定核苷酸序列的多种引物构成的引物库中选择的一种引物进行PCR,可以制备一系列从模板DNA上的一个基点改变长度的扩增DNA片段。本发明人已经证明,通过测定所述系列的扩增DNA片段中各个DNA片段的核苷酸序列,可以分析原始DNA片段的完整的核苷酸序列,因而本发明得以完成。
本发明的第一方面涉及一种测定核酸的核苷酸序列的方法,所述方法包括(1)在分别具有一个标志序列的至少两种引物的每一种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增模板核酸,其中具有标志序列的引物在5’端一侧具有标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列;并且(2)对在上述步骤(1)中扩增的片段进行直接测序。
按照第一方面,可以使用具有通式所示结构的引物作为具有标志序列的引物通式5’-标志序列-Sa-3’其中“S”代表选自G、A、T和C的一种核苷酸或者两种或两种以上核苷酸的混合物,而“a”代表3或3以上的整数,条件是“Sa”中的至少三个S代表选自G、A、T和C的一种核苷酸。
按照第一方面,可以使用选自表1-5中所列引物的一种引物作为具有标志序列的引物。
按照第一方面,模板核酸的扩增例如使用聚合酶链式反应(PCR)进行。可以优选使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶或者DNA聚合酶的混合物作为PCR中的DNA聚合酶,并且所述DNA聚合酶可以选自Taq DNA聚合酶、Pfu DNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、Tth DNA聚合酶、KOD DNA聚合酶和KOD dash DNA聚合酶。
第一方面的方法还可以包括选择一种产生基本为单一条带的PCR扩增片段的反应。该方法还可以包括选择一个基本为单一条带的PCR扩增片段。
第一方面可以直接在样品上进行,或者在从样品制备模板核酸后进行。可以优选使用质粒、噬菌体、粘粒、BAC或YAC文库、或者基因组DNA或cDNA形式的模板核酸。
本发明的第二方面涉及一种用于第一方面的测定核酸的核苷酸序列的方法的引物库,所述引物库含有至少两种引物,每种引物都在5’端一侧具有一个标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列。
可以优选使用具有通式所示结构的引物作为第二方面的引物库中具有标志序列的引物通式5’-标志序列-Sa-3’其中“S”代表选自G、A、T和C的一种核苷酸或者两种或两种以上核苷酸的混合物,而“a”代表3或3以上的整数,条件是“Sa”中的至少三个S代表选自G、A、T和C的一种核苷酸。
按照第二方面,引物中的标志序列可以含有测序用引物的一种序列。
本发明的第三方面涉及一种用于测定核酸的核苷酸序列的组合物,所述组合物含有第二方面的引物库。
第三方面的组合物还可以含有一种DNA聚合酶。可以使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶、或者DNA聚合酶的混合物作为所述DNA聚合酶。例如可以优选使用TaqDNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、KOD DNA聚合酶或KOD dash DNA聚合酶。
本发明的第四方面涉及一种用于第一方面的测定核酸的核苷酸序列的方法的试剂盒,所述试剂盒含有第二方面的引物库。
第四方面的试剂盒还可以含有DNA聚合酶和供所述DNA聚合酶用的缓冲液。
第四方面的试剂盒可以为包装形式,并且带有指导第二方面的引物库和上述DNA聚合酶使用的说明。引物库中分别具有一个标志序列的各种引物可以分配在预定的位置。
本发明的第五方面涉及一种制品,所述制品由包装材料和装入包装材料中的用于测定核酸的核苷酸序列的试剂构成,其中所述试剂含有一个引物库和/或一种DNA聚合酶,并且其中所述试剂可以用于测定核苷酸序列的说明示于贴在包装材料上的标签或者包装材料所附的说明中。
发明详述以下参考使用聚合酶链式反应(PCR)扩增模板核酸的案例描述本发明。然而,按照本发明使用的扩增法并不限于PCR。可以使用在DNA聚合酶存在下可以用来特异性扩增模板核酸中两种引物所限定区域的任何方法。这类方法的例子包括ICAN法(WO 00/56877)、SDA法(日本专利第2087497号)和RCA法(美国专利第5854035号)。
当在本文中使用时,引物是指含有脱氧核糖核苷酸或者核糖核苷酸例如腺苷酸(A)、鸟苷酸(G)、胞苷酸(C)或胸苷酸(T)的寡核苷酸。脱氧核糖核苷酸可以包含未经修饰或经修饰的脱氧核糖核苷酸,只要它可以用于PCR。
当在本文中使用时,3’端一侧是指从核酸诸如引物中心至3’末端的部分。同样,5’端一侧是指从核酸中心至5’末端的部分。
当在本文中使用时,标志序列是指在引物库中所含有的各种引物中共同的核苷酸序列、或者在引物库中的引物之间不同的核苷酸序列,并且所述标志序列位于所述引物的5’端一侧或者位于从引物的中心至3’末端的部分中。虽然并不打算限制本发明,但所述标志序列可以含有供链终止法用的测序引物退火所至的序列、或者限制性内切核酸酶的识别位点。优选选择使所述标志序列难以退火至模板核酸的核苷酸序列。然而,并不打算限制本发明,因为可能难以根据模板DNA的序列来选择这样一种核苷酸序列。
在下文,将详细描述本发明。
(1)本发明的引物库本发明的引物库是一个引物文库,每种引物在5’末端具有一个标志序列,并且能够退火至任何的核苷酸序列上。选自引物库的引物的3’端一侧的序列对于PCR中从所述引物延伸DNA链非常重要。另外,它对于PCR时特异性扩增从而选择几乎不退火至所述标志序列的模板上的核苷酸序列非常有效。在本发明方法中使用的引物库中所含有的引物具有与模板核酸中的任何核苷酸序列基本互补的核苷酸序列,能够从其3’末端延伸DNA链。即使所述引物3’端一侧的所述核苷酸序列与模板DNA不完全互补,DNA链也可以延伸。通常优选设计引物,使得库中的引物可以退火至几乎均一分布在模板核酸上具有任何核苷酸序列的部分上。当用于本文时,“基本互补的核苷酸序列”是指能够在所用的反应条件下退火至作为模板的DNA上的核苷酸序列。例如,可以依照“Labo Manual PCR”(Takara Shuzo出版,第13-16页,1996)设计这样一种引物。或者,可以使用市售的用于设计引物的软件,诸如OLIGOTMPrimer Analysis软件(Takara Shuzo)。
虽然并不打算限制本发明,但本发明方法中使用的寡核苷酸引物的长度优选为约15个核苷酸至约100个核苷酸,更优选约18个核苷酸至约40个核苷酸。所述引物的核苷酸序列优选与模板核酸基本互补,使得它在所用的反应条件下退火至模板核酸上。
虽然并不打算限制本发明,但是例如可以使用具有以下通式所示结构的寡核苷酸作为依照本发明的引物通式5’-标志序列-Sa-3’其中“S”代表选自G、A、T和C的一种核苷酸或者两种或两种以上核苷酸的混合物,而“a”代表3或3以上的整数,条件是“Sa”中的至少三个S代表选自G、A、T和C的一种核苷酸。
例如,将优选具有10个或10个以上核苷酸、更优选15个或15个以上核苷酸的核苷酸序列置于引物的5’端一侧作为标志序列。虽然关于标志序列的序列并没有具体的限制,但是它最好不形成二级结构或二聚体结构。特别优选与模板核酸的核苷酸序列不互补的序列。如果作为模板的核酸的核苷酸序列信息可得到,则可以参考所述信息设计标志序列。例如,标志序列可以选自一组大约50种的序列,每种序列由在模板核酸中以最低频率存在的6个核苷酸组成。虽然并不打算限制本发明,但是例如当要分析来自大肠杆菌(Escherichia coli)、属于热球菌属(Pyrococcus)的细菌或者属于芽孢杆菌属(Bacillus)的细菌的核苷酸序列时,可以选择一种具体的核苷酸序列GGCACGATTCGATAACG(SEQ ID NO1)作为标志序列。
引物3’端一侧的已确定核苷酸序列(其中每种核苷酸仅由选自四种核苷酸中的一种核苷酸组成的序列)由至少3个核苷酸组成,优选由7个或7个以上的核苷酸组成,因为它需要退火至模板核酸上。一个随机组合的部分N(G、A、T和C的混合物)可以包括在已确定核苷酸序列中,例如位于3’端一侧、位于5’端一侧或者位于内部部分中,虽然对于其位置并没有具体的限制。所述随机核苷酸序列优选具有0-5个核苷酸。引物库中引物的已确定核苷酸序列的核苷酸可以固定为A、G、C或T。例如,就每种由7个核苷酸组成的已确定核苷酸序列而言,从3’末端起的第一个核苷酸和第七个核苷酸可以固定为A、G、C和T中之一。所述核苷酸序列的GC含量优选为50%-70%。例如,在具有7个核苷酸的已确定核苷酸序列中,4个或5个核苷酸可以为G或C。在这种情况下,优选确定所述核苷酸序列,使得所述引物假设其本身没有二级结构或者不形成引物二聚体。
通过制备对于退火至引物中具有3个或3个以上核苷酸、更优选7个或7个以上核苷酸的已确定核苷酸序列的模板上的特异性序列,可以在后续PCR中有效产生单一条带。所述引物可以含有一个随机核苷酸序列的部分。特别是,重要的是在所述引物中包括一个标志序列。
按照本发明,具有以上通式所示结构和已确定核苷酸序列的引物库,可以用来在后续PCR中产生基本为单一条带的扩增片段和获得不同长度的扩增片段。然后,通过分析扩增片段的核苷酸序列,可以确定模板核酸的完整核苷酸序列。
其中对模板特异性的核苷酸序列具有7个核苷酸的引物库例证了本发明引物库的一个实施方案。虽然并不打算限制本发明,但其实例包括实施例1中所述的引物库I-III。实例如下引物库I、IV或VI,其中每种引物在其模板特异性核苷酸序列的5’端一侧含有一个随机核苷酸序列;引物库II,其中每种引物在3’端一侧含有一个随机核苷酸序列;以及在引物中无随机核苷酸序列的部分的引物库III或引物库V。
例如,在模板特异性核苷酸序列具有7个核苷酸的情况下,优选引物中已确定核苷酸序列的7个核苷酸中的6个或6个以上的核苷酸退火至模板核酸上,以供特异性退火用。虽然并不打算限制本发明,但例如如果已确定核苷酸序列位于3’端一侧,则位于所述已确定序列3’末端的具有6个核苷酸的序列的变异特别重要,并且优选6个核苷酸中的2个或2个以上的核苷酸在库中引物中是不同的。
通过用模板特异性引物和本发明引物库中引物的组合进行PCR,可以在总反应物的至少10%中获得不同大小的单一条带的扩增片段。通过对扩增片段直接测序,可以确定目标核酸的完整核苷酸序列。
可以例如用Applied Biosystems Inc.(ABI)的394型DNA合成仪,依照亚磷酰胺法合成本发明的引物库,使得所述引物具有已确定核苷酸序列的部分-标志序列和随机核苷酸序列。或者,可以使用包括磷酸三酯法、H-膦酸酯法和硫代膦酸酯法在内的任何方法来合成引物库。
(2)本发明的测定核苷酸序列的方法通过用得自以上(1)中所述库中的引物和一种模板特异性引物的组合进行PCR,并且测定所得扩增片段的核苷酸序列,实施本发明的方法。
依照本发明的方法,可以使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶、或者DNA聚合酶的混合物作为PCR的DNA聚合酶。虽然并不打算限制本发明,但是例如可以优选使用Taq DNA聚合酶(pol I型)或KOD DNA聚合酶或Pfu DNA聚合酶(α型)。另外,可以使用DNA聚合酶的混合物作为DNA聚合酶。例如,可以优选使用具有3’→5’外切活性的DNA聚合酶和无3’→5’外切活性的DNA聚合酶的组合,所述无3’→5’外切活性的DNA聚合酶例如TaKaRa ExTaq DNA聚合酶、TaKaRa LA-Taq DNA聚合酶、TaKaRaZ-Taq DNA聚合酶或KOD dash DNA聚合酶。此外,在本发明的所述方法中,可以优选使用WO 99/54455中所述的具有3’→5’外切活性的DNA聚合酶或者无3’→5’外切活性的DNA聚合酶的组合。
PCR等所用的dNTP(dATP、dCTP、dGTP和dTTP的混合物)可以优选作为在所述方法中用作延伸反应中底物的三磷酸核苷酸。dNTP可以含有dNTP类似物例如7-脱氮-dGTP等,只要它作为所用DNA聚合酶的底物。
通过组合使用作为模板的核酸、来自以上(1)中所述库的引物和模板特异性引物进行PCR,可以在本发明的所述方法中获得从作为基点的模板特异性引物开始的不同长度的扩增片段。然后,通过对扩增片段进行测序,可以分析模板核酸的完整核苷酸序列。
依照本发明的所述方法,作为模板的核酸可以是一种生物体的基因组。通过物理方法或者通过用限制性酶消化切割基因组所获得的片段、或者插入了这种片段的质粒、噬菌体、噬菌粒、粘粒、BAC或YAC载体,可以优选用作模板核酸。另一方面,它可以是通过逆转录反应获得的cDNA。
在本发明的所述方法中用作模板的核酸(DNA或RNA)可以从可能含有所述核酸的任何样品中制备或者分离。或者,这样一种样品可以直接用于依照本发明的核酸扩增反应中。可能含有所述核酸的样品的实例包括但不限于得自生物体的样品,例如全血、血清、血沉棕黄层、尿、粪便、脑脊液、精液、唾液、组织(例如癌组织或者淋巴结)和细胞培养物(例如哺乳动物细胞培养物或者细菌细胞培养物);含有核酸的样品,例如类病毒、病毒、细菌、真菌、酵母、植物和动物;怀疑污染或感染微生物如病毒或细菌的样品(例如食品或生物制剂);和可能含有生物体的样品,例如土壤和废水。所述样品可以是含有通过如上所述依照已知方法加工样品所获得的核酸的制剂。在本发明中可以使用的制剂的实例包括细胞破坏的产物或者通过所述产物分级分离所获得的样品、所述样品中的核酸、或者其中特定核酸分子例如mRNA被富集的样品。此外,可以优选使用通过已知方法扩增样品中所含有的一种核酸所获得的核酸,例如DNA或RNA。
通过使用例如但不限于用去垢剂、超声处理、振荡/用玻璃珠搅拌或者弗氏压碎器裂解,可以从如上所述的材料制备含核酸的制剂。在某些情况下,最好进一步加工所述制剂,以纯化所述核酸(例如在存在内源核酸酶的情况下)。在这种情况下,通过已知方法例酚抽提、色谱、离子交换、凝胶电泳或者密度梯度离心,纯化所述核酸。
本发明的所述方法可以包括根据作为模板的核酸的来源选择待使用的引物库。
当需要使用具有衍生于RNA的序列的核酸作为模板时,本发明的所述方法可以用通过用所述RNA作为模板的逆转录反应合成的cDNA作为模板来进行。可以制备在逆转录反应中使用的其引物的任何RNA,都可以应用于本发明的所述方法中,包括样品中的总RNA、RNA分子如mRNA、tRNA和rRNA以及特定的RNA分子种类。
在逆转录反应中,可以使用在所用的反应条件下退火至作为模板的RNA上的任何引物。所述引物可以是具有与作为模板的特定RNA互补的核苷酸序列的引物(特异性引物)、寡聚dT(脱氧胸腺嘧啶)引物和具有随机序列的引物(随机引物)。就特异性退火而言,用于逆转录的所述引物的长度优选为6个或6个以上的核苷酸、更优选9个或9个以上的核苷酸。就寡核苷酸合成而言,长度优选为100个或100个以下的核苷酸、更优选30个或30个以下的核苷酸。
具有用RNA作为模板合成cDNA的活性的任何酶都可以用于逆转录反应中。其实例包括来源于各种来源的逆转录酶,例如禽类成髓细胞瘤病毒衍生逆转录酶(AMV RTase)、莫洛尼鼠类白血病病毒衍生逆转录酶(MMLV RTase)和劳斯相关病毒2逆转录酶(RAV-2 RTase)。另外,可以使用也具有逆转录活性的DNA聚合酶。对于本发明,优选在高温下具有逆转录活性的酶如得自栖热菌属(Thermus)细菌的DNA聚合酶(例如Tth(嗜热栖热菌(Thermus thermophilus)DNA聚合酶)和得自芽孢杆菌属嗜热菌的DNA聚合酶。虽然并不打算限制本发明,但例如优选得自芽孢杆菌属嗜热菌的DNA聚合酶如得自B.st(嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))的DNA聚合酶(Bst DNA聚合酶)和得自Bca(热坚芽孢杆菌(Bacillus cardotenax)的DNA聚合酶。例如,Bca DNA聚合酶并不需要锰离子来进行逆转录反应。此外,它可以合成cDNA,同时抑制在高温条件下作为模板的RNA形成二级结构。天然存在的上述酶和具有逆转录酶活性的上述酶的变异体都可以使用,只要它们具有所述活性。
依照本发明的所述方法,可以例如用由三个步骤组成的反应进行PCR。所述三个步骤是解链(变性)即双链DNA成为单链DNA的步骤、引物退火至所述单链DNA上的步骤以及从引物合成(延伸)互补链以便扩增目标DNA区的步骤。或者,它可以用名为“穿梭PCR”(“PCR housaizensen”(PCR法的最新进展),Tanpakushitsu Kakusan Kouso,Bessatsu,(Protein,Nucleic Acid and Enzyme,Supplement),41(5)425-428(1996))的反应进行,其中所述三个步骤的两个步骤即引物退火步骤和延伸步骤在同一温度下进行。另外,依照本发明所述方法的PCR条件可以是用于WO 00/14218中所述高速PCR法的条件。所述反应混合物可以含有一种酸性物质或者阳离子复合物,如WO 99/54455中所述。
如上所述通过PCR获得的扩增DNA片段的核苷酸序列,可以通过使所述DNA片段经过适当的步骤以测定DNA的核苷酸序列如链终止法来测定。通过综合分析各个PCR扩增片段的同样测定的核苷酸序列,可以确定作为模板的核酸中一个广泛区域的核苷酸序列。
依照本发明的方法,PCR产物可以在使其经过适当的纯化方法如用于纯化PCR产物的分子筛(例如Microcon-100)纯化后进行测序。
在使用本发明方法、分析大肠杆菌基因组的一个示例性核苷酸序列分析中,用含有分别具有标志序列的92种引物的本发明引物库,在92个反应的22个反应中,获得单一条带的PCR扩增产物。通过对扩增片段进行直接测序,可以确定约4,000bp或更大的核苷酸序列。在激烈热球菌(Pyrococcus furiosus)的情况下,在92个反应的18个反应中获得单一条带的PCR扩增片段,并且可以在约5,000bp或更大的区域内测定核苷酸序列。在热坚芽孢杆菌基因组的情况下,通过混合以不同方向插入了得自基因组的DNA片段的质粒,在92个反应的20个反应(两个方向的总和)中获得单一条带的PCR扩增产物,并且在约2,000bp或更大的区域中可以以两个方向测定核苷酸序列。
如上所述通过PCR扩增的DNA片段在其末端具有一个衍生于选自引物库的引物的标志序列。因此,扩增DNA片段的核苷酸序列可以通过用与标志序列相同的核苷酸序列的引物来测定。
按照本发明,可以通过直接测序,测定核苷酸序列。当用于本文中时,直接测序是指无需将核酸克隆到载体中,而采用扩增核酸片段作为模板来测定所述核酸的核苷酸序列。直接测序依照用通过扩增法(例如PCR)获得的片段作为模板并使用具有与所述片段互补的序列的引物(例如具有与标志序列相同的核苷酸序列的引物)测定核苷酸序列的常规方法(例如双脱氧法)来进行。
对如上所述在PCR中获得的完整的扩增片段进行测序反应。对于产生基本为单一条带的PCR扩增片段的反应而言,测定所述PCR扩增片段的核苷酸序列,即使在所述反应中观察到由于由引物组成的扩增片段所致的本底。当用于本文中时,基本为单一条带的扩增片段是指为单一条带而使得能够在后续序列分析中分析其核苷酸序列的扩增片段。在本发明的方法中,可以优选使用可以用来获得基本为单一条带的扩增片段的任何核酸扩增法。其实例包括但不限于PCR、ICAN、SDA或RCA。原始模板核酸的完整核苷酸序列可以通过综合分析所述结果来确定。可能测定模板核酸的核苷酸序的一部是不可能的,例如因为各区域的PCR扩增不均一。在这种情况下,对所述区域再次实施本发明的方法或者联合使用一种已知方法如使用根据所获得的核苷酸序列信息等新合成的引物来测定所述区域的核苷酸序列是十分自然的。
可以使用市售的测序仪例如Mega BACE 11000(AmershamPharmacia Biotech)、一种市售的测序试剂盒例如BcaBESTTMDideoxySequencing Kit(Takara Shuzo)等来进行核苷酸序列测定。
在一个优选实施方案中,虽然并不打算限制本发明,但对PCR扩增产物进行琼脂糖凝胶电泳等,以分析扩增产物,选择产生基本为单一条带的扩增片段的反应和产生对于本发明的核苷酸序列测定方法而言适当长度的产物的反应,然后对所述反应产物进行测序。通过包括上述步骤,可以减少待测序的扩增片段数目,以减少核苷酸序列测定所需的费用。此外,如果选择产生基本为单一条带的反应,则目标扩增片段的分子(摩尔)数足够大于其它扩增片段的数目。结果,即使用标志序列进行测序反应,也可以获得具有很低噪音的可靠序列数据。重要的是在将扩增片段量转换为分子数后估计扩增片段的量,以便选择产生基本为单一条带的扩增片段的反应。虽然并不打算限制本发明,但是例如可以有效使用Agilent 2100 Bioanalyzer(Takara Shuzo)的电泳设备。使用这种设备,可以测定扩增片段的量和分子量,并且在根据测定值转换为分子数后可以表述所述片段的量。从序列测定的经济效率的角度来看,重要的是选择产生具有适当长度的产物的反应,以便获得尽可能均一分布而且在待测定的核苷酸序列的整个区域几乎不重叠的核苷酸序列数据。通过用计算机使上述两个选择步骤自动化构建一种系统,可以大大降低核苷酸序列测定所需的工作量和时间。
此外,如果当分析扩增产物时观测到多种扩增片段,则可以按照已知方法分离一种扩增片段(例如丰度最高的扩增片段)进行测序。
在某些情况下,当使用库中所有引物和一种对一个已知序列特异性的引物进行PCR时,可以在所有反应中都产生一种对应于仅用所述特异性引物扩增所得的产物大小的条带。由于这样一种扩增片段不含标志序列,故此即使目标扩增片段污染诸如本底的片段,也可以测定核苷酸序列。然而,由于所述仅用所述特异性引物扩增降低了目标核酸的扩增效率,所以最好设计引物序列,使得不发生这种扩增。虽然并不打算限制本发明,并且它取决于模板序列,所以一般优选引物的3’末端富含AT。
本发明方法中所用的引物库是一种含有上述(1)中所述引物的库。联合使用每种所述引物和一种对模板核酸中的已知序列特异性的引物,独立地进行PCR。虽然并不打算限制本发明,但如果库中引物的已确定核苷酸序列具有7个核苷酸,则这样一种序列以1/47(=16384)的平均频率出现,条件是所述序列中的核苷酸分布完全均一。假若如此,则100种引物中7个核苷酸的已确定核苷酸序列中的一种序列以约160种核苷酸之一的平均频率出现。因而,通过用这100种引物独立地进行PCR,获得相互之间长度平均相差160个核苷酸的扩增片段。其中,用具有与标志序列相同的核苷酸序列或者在标志序列中所含有的核苷酸序列的测序用引物,对基本为单一条带的PCR产物进行测序反应。分析如此获得的核苷酸序列数据。从而一次可以分析数千碱基的序列,而无需等待随后获得的序列数据。
(3)含有本发明引物库的试剂盒本发明提供用于使用上述(1)中所述引物库进行以上(2)中所述的测定核酸的核苷酸序列的方法的试剂盒。在一个实施方案中,所述试剂盒为包装形式,并且带有本发明引物库的具体说明和使用所述库进行PCR的说明。对于本发明的方法,可以优选使用含有本发明引物库、DNA聚合酶和供所述聚合酶用的缓冲液的试剂盒。另一方面,可以依照说明选择并且随后使用本发明的引物库、市售的DNA聚合酶和PCR用的试剂。就使用RNA作为模板的情况而言,所述试剂盒可以含有逆转录反应用的试剂。可以从按照以上(2)中所述的本发明所用的DNA聚合酶中选择DNA聚合酶。可以使用市售的PCR用的试剂作为PCR的试剂,可以使用实施例中所述的缓冲液。此外,所述试剂盒可以含有核苷酸序列测定用的试剂,例如测序用的引物或聚合酶。
说明本发明的核苷酸序列测定方法的说明提供了有关本发明核苷酸序列测定方法的信息、使用所述试剂盒的方法、建议的引物库的具体说明、建议的反应条件等的第三个部分(party)。所述说明包括描述上述内容的印刷物例如小册子或者散页形式的说明手册、贴在试剂盒上的标签以及含所述试剂盒的包装表面上的说明。所述说明也包括通过电子媒介例如因特网公开或提供的信息。
(4)本发明的组合物本发明提供用于上述测定核酸的核苷酸序列的方法的组合物。一种示例性的组合物含有上述(1)中所述的引物库和以上(2)中所述的DNA聚合酶。所述组合物还可以含有缓冲成分、镁盐、dNTP或如进行PCR用的组分的类似物质。此外,所述组合物可以含有以上(2)中所述的酸性或阳离子复合物。
通过使用本发明的引物库,提供一种快速低成本测定核酸的核苷酸序列的方法。由于所述方法组合使用含有大约100种引物的引物库和一种特异性引物来进行,所以对于分析大量和许多种类的基因组是有用的。此外,本发明的方法可用于分析大量和多种基因组,也因为可以用比常规鸟枪测序法所需步骤更少的测序步骤来测定目标核酸的核苷酸序列。
引物库I的结构和由SSSSSSS所示的已确定核苷酸序列示于表1中。
表15’-标志序列-NN-SSSSSSS-3’(I)(NG、A、T和C的混合物;SSSSSSS代表以下所示的一种核苷酸序列)No.Nt seq No. Nt seq No. Nt seq No. Nt seq No. Nt seq1 GAAACGG21 GCAAACG41GCTACGG 61 GGGCAAG 81 GTGAGCG2 GAAAGCG22 GCAACGG42GCTCACG 62 GGGCTTG 82 GTGCCAG3 GAAAGGG23 GCAAGCG43GCTCCAG 63 GGGTACG 83 GTGCTTG4 GAACACG24 GCACACG44GCTTGCG 64 GGTAACG 84 GTGGACG5 GAACGGG25 GCACCAG45GCTTGGG 65 GGTACGG 85 GTGGCAG6 GAAGACG26 GCAGACG46GGACACG 66 GGTAGCG 86 GTGTACG7 GAAGCGG27 GCAGCAG47GGACCAG 67 GTAACGG 87 GTTAGCG8 GACACGG28 GCATGGG48GGAGACG 68 GTAAGCG 88 GTTCACG9 GACAGGG29 GCCAAAG49GGAGCAG 69 GTACACG 89 GTTCCAG10 GACCACG30 GCCACAG50GGCAAAG 70 GTAGACG 90 GTTGACG11 GACCCAG31 GCCATTG51GGCAACG 71 GTAGCGG 91 GTTTGCG12 GACGCAG32 GCCCAAG52GGCACAG 72 GTCAACG 92 GCTTGAG13 GAGAGGG33 GCCCTTG53GGCATTG 73 GTCACGG14 GAGCAAG34 GCCTACG54GGCCAAG 74 GTCAGCG15 GAGCACG35 GCCTCAG55GGCCTTG 75 GTCCAAG16 GAGCCAG36 GCCTTTG56GGCTAAG 76 GTCCACG17 GAGCTTG37 GCGCAAG57GGCTACG 77 GTCCCAG18 GATACGG38 GCGCTTG58GGCTCAG 78 GTCCTTG19 GATTGCG39 GCGGACG59GGCTTTG 79 GTCTGCG20 GATTGGG40 GCGTAAG60GGGACAG 80 GTGACGGNt seq核苷酸序列。
表1显示了通式I所示引物的3’末端的7个核苷酸的已确定核苷酸序列。考虑Tm值、引物的二级结构和引物形成二聚体的概率,从47(=16384)种核苷酸序列中选择出用于所述引物的92种已确定核苷酸序列。
(2)引物库II的构建合成多种分别含有SEQ ID NO2的核苷酸序列GGCACGATTCGATAAC作为标志序列的引物。换句话说,合成通式(II)所示的引物库II5’-标志序列-SSSSSSS-NN-3’ (II)(NG、A、T和C的混合物;S选自G、A、T或C的一种已确定的核苷酸)。
引物库II的结构和由SSSSSSS所示的已确定核苷酸序列示于表2中。
表25’-标志序列-SSSSSSS-NN-3’(II)(NG、A、T和C的混合物;SSSSSSS代表以下所示的一种核苷酸序列)No.Nt seq No. Nt seq No. Nt seq No. Nt seq No. Nt seq1 GAAACGG21 GCAAACG41GCTACGG 61 GGGCAAG 81 GTGAGCG2 GAAAGCG22 GCAACGG42GCTCACG 62 GGGCTTG 82 GTGCCAG3 GAAAGGG23 GCAAGCG43GCTCCAG 63 GGGTACG 83 GTGCTTG4 GAACACG24 GCACACG44GCTTGCG 64 GGTAACG 84 GTGGACG5 GAACGGG25 GCACCAG45GCTTGGG 65 GGTACGG 85 GTGGCAG6 GAAGACG26 GCAGACG46GGACACG 66 GGTAGCG 86 GTGTACG7 GAAGCGG27 GCAGCAG47GGACCAG 67 GTAACGG 87 GTTAGCG8 GACACGG28 GCATGGG48GGAGACG 68 GTAAGCG 88 GTTCACG9 GACAGGG29 GCCAAAG49GGAGCAG 69 GTACACG 89 GTTCCAG10 GACCACG30 GCCACAG50GGCAAAG 70 GTAGACG 90 GTTGACG11 GACCCAG31 GCCATTG51GGCAACG 71 GTAGCGG 91 GTTTGCG12 GACGCAG32 GCCCAAG 52GGCACAG 72 GTCAACG 92 GCTTGAG13 GAGAGGG33 GCCCTTG53GGCATTG 73 GTCACGG14 GAGCAAG34 GCCTACG54GGCCAAG 74 GTCAGCG15 GAGCACG35 GCCTCAG55GGCCTTG 75 GTCCAAG16 GAGCCAG36 GCCTTTG56GGCTAAG 76 GTCCACG17 GAGCTTG37 GCGCAAG57GGCTACG 77 GTCCCAG18 GATACGG38 GCGCTTG58GGCTCAG 78 GTCCTTG19 GATTGCG39 GCGGACG59GGCTTTG 79 GTCTGCG20 GATTGGG40 GCGTAAG60GGGACAG 80 GTGACGGNt seq核苷酸序列。
表2显示了通式II所示引物的3’末端的第三个至第九个核苷酸的已确定核苷酸序列。考虑Tm值、引物的二级结构和引物形成二聚体的概率,从47(=16384)种核苷酸序列中选择出用于所述引物的92种已确定核苷酸序列。
(3)引物库III的构建合成多种分别含有SEQ ID NO2的核苷酸序列GGCACGATTCGATAAC作为标志序列的引物。换句话说,合成通式(III)所示的引物库III5’-标志序列-SSSSSSS-3’(III)(S选自G、A、T或C的一种已确定的核苷酸)。
引物库III的结构和由SSSSSSS所示的已确定核苷酸序列示于表3中。
表35’-标志序列-SSSSSSS-3’(III)(SSSSSSS代表以下所示的一种核苷酸序列)No.Nt seq No. Nt seq No. Nt seq No. Nt seq No. Nt seq1 GAAACGG21 GCAAACG41GCTACGG 61 GGGCAAG 81 GTGAGCG2 GAAAGCG22 GCAACGG42GCTCACG 62 GGGCTTG 82 GTGCCAG3 GAAAGGG23 GCAAGCG43GCTCCAG 63 GGGTACG 83 GTGCTTG4 GAACACG24 GCACACG44GCTTGCG 64 GGTAACG 84 GTGGACG5 GAACGGG25 GCACCAG45GCTTGGG 65 GGTACGG 85 GTGGCAG6 GAAGACG26 GCAGACG46GGACACG 66 GGTAGCG 86 GTGTACG7 GAAGCGG27 GCAGCAG47GGACCAG 67 GTAACGG 87 GTTAGCG8 GACACGG28 GCATGGG48GGAGACG 68 GTAAGCG 88 GTTCACG9 GACAGGG29 GCCAAAG49GGAGCAG 69 GTACACG 89 GTTCCAG10 GACCACG30 GCCACAG50GGCAAAG 70 GTAGACG 90 GTTGACG11 GACCCAG31 GCCATTG51GGCAACG 71 GTAGCGG 91 GTTTGCG12 GACGCAG32 GCCCAAG52GGCACAG 72 GTCAACG 92 GCTTGAG13 GAGAGGG33 GCCCTTG53GGCATTG 73 GTCACGG14 GAGCAAG34 GCCTACG54GGCCAAG 74 GTCAGCG15 GAGCACG35 GCCTCAG55GGCCTTG 75 GTCCAAG16 GAGCCAG36 GCCTTTG56GGCTAAG 76 GTCCACG17 GAGCTTG37 GCGCAAG57GGCTACG 77 GTCCCAG18 GATACGG38 GCGCTTG58GGCTCAG 78 GTCCTTG19 GATTGCG39 GCGGACG59GGCTTTG 79 GTCTGCG20 GATTGGG40 GCGTAAG60GGGACAG 80 GTGACGGNt seq核苷酸序列。
表3显示了通式III所示引物的3’末端的7个核苷酸的已确定核苷酸序列。考虑Tm值、引物的二级结构和引物形成二聚体的概率,从47(=16384)种核苷酸序列中选择出用于所述引物的92种已确定核苷酸序列。
(4)引物库IV的构建合成多种分别含有SEQ ID NO3的核苷酸序列CAGGAAACAGCTATGAC作为标志序列的引物。换句话说,合成通式(IV)所示的引物库IV5’-标志序列-NNN-SSSSSS-3’(IV)(NG、A、T和C的混合物;S选自G、A、T或C的一种已确定的核苷酸)。
引物库IV的结构和由SSSSSS所示的已确定核苷酸序列示于表4中。
表45’-标志序列-NNN-SSSSSS-3’(IV)(NG、A、T和C的混合物;SSSSSS代表以下所示的一种核苷酸序列)No. Nt seqNo. Nt seqNo. Nt seqNo. Nt seq1TGACGG21TCGAAA41GCGATA61AGCGAT2GCGAGC22CGAAAG42CTGCTA62CGCTAC3CGACGG23AGACGG43CGGTGC63CGATTT4CGGTGG24ACGAAC44ATTTGC64GCGAGT5GGACGG25CGTCCT45CGAAAT65GCAAAG6GTACGC26GAACGC46ACAAGC66GCGTTA7TCCGTC27GGCAAT47CCGAGC67CCGTCT8ACACGG28CGCTCA48CACCGA68TGCGTC9CGGATG29CCGTAT49CGACAT69CGCATT10 CGTGGA30CATCGG50TCAAGC70CCGTTT11 ACACCG31TTACGG51TATCCC71CGTGGT12 GACGGA32CGCATA52GCAAAC72GTGCTT13 AAGCCA33TGACGC53GGGAGT73TCACGC14 CACGCA34GAACGG54CCCTTA74GATCGG15 GCACGC35TATGGA55TATCGC75CGCATC16 TAACGC36CGGTTT56TGGTTA76ATGGTT17 CCGATG37TGGCAG57ATGCAA77AACGCA18 CGTCGG38TCATGC58ATCGCT19 CGGTAC39CGACCC59GCACGG20 ATTGCC40GCGAGA60TATGGCNt seq核苷酸序列。
表4显示了通式IV所示引物的3’末端的6个核苷酸的已确定核苷酸序列。考虑Tm值、引物的二级结构和引物形成二聚体的概率,从46(=4096)种核苷酸序列中选择出用于所述引物的77种已确定核苷酸序列。
(5)引物库V的构建合成多种分别含有SEQ ID NO3的核苷酸序列CAGGAAACAGCTATGAC作为标志序列的引物。换句话说,合成通式(V)所示的引物库V5’-标志序列-SSS-3’(V)(S选自G、A、T或C的一种已确定的核苷酸)。
引物库V的结构和由SSS所示的已确定核苷酸序列示于表5中。
表55’-标志序列-SSS-3’(V)(SSS代表以下所示的一种核苷酸序列)No. Nt seq No. Nt seq No. Nt seq No Nt seq1AAA 21CCA41GGA 61TAA2AAC 22CCC42GGC 62TTC3AAG 23CCG43GGG 63TTG4AAT 24CCT44GGT 64TTT5ACA 25CGT45GTA6ACC 26CGC46GTC7ACG 27CGG47GTG8ACT 28CGT48GTT9AGA 29CTA49TAA10 AGC 30CTC50TAC11 AGG 31CTG51TAG12 AGT 32CTT52TAT13 ATA 33GAA53TCA14 ATC 34GAC54TCC15 ATG 35GAG55TCG16 ATT 36GAT56TCT17 CAA 37GCA57TGA18 CAC 38GCC58TGC19 CAG 39GCG59TGG20 CAT 40GCT60TGTNt seq核苷酸序列。
表5显示了通式V所示引物的3’末端的3个核苷酸的核苷酸序列。选择43(=64)种核苷酸序列用于所述引物。实施例2(1)检查一种测定克隆到质粒中的大肠杆菌基因的核苷酸序列的方法。如下制备质粒克隆。简而言之,用得自大肠杆菌JM109(TakaraShuzo)的基因组DNA作为模板并使用分别具有SEQ ID NO4和SEQID NO5的核苷酸序列的引物Eco-1和E6sph进行PCR。用TaKaRTaBlunting Kit(平端化试剂盒)(Takara Shuzo)将所得的约6.1kbp的PCR扩增片段平端化,用限制性酶SphI(Takara Shuzo)消化并且在SmaI和SphI位点之间与质粒pUC119(Takara Shuzo)连接,获得质粒pUCE6。
(2)用质粒pUCE6作为模板,使用具有载体特异性的核苷酸序列的引物M13-引物RV(Takara Shuzo)和在实施例1中制备的分别含有92种引物的引物库I-III中的每种引物进行PCR。制备25μl的PCR反应混合物,所述反应混合物含有20mM tris-乙酸盐(pH 8.5)、50mM乙酸钾、3mM乙酸镁、0.01% BSA、dNTP各300μM、100pg质粒pUCE6、0.625单位TaKaRa ExTaq DNA聚合酶(Takara Shuzo)。用Gene AmpPCR系统9600(Perkin Elmer),将所述反应混合物进行30个循环的PCR,每个循环由98℃0秒、38℃0秒和72℃90秒构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。
使用引物库I,在92个反应的22个反应中,获得大小在300bp至5600bp之间变动的单一条带的PCR扩增片段。用Microcon-100(Takara Shuzo)从扩增片段中除去引物和从反应混合物中除去盐,并依照常规方法,用具有SEQ ID NO2(标志序列)的核苷酸序列的测序引物进行直接测序。结果,可以测定插入到质粒pUCE6的所述DNA片段中的4378个核苷酸的序列。使用引物库II,在92个反应的21个反应中,获得大小在300bp至4700bp之间变动的单一PCR扩增DNA片段。对扩增片段进行直接测序,可以测定4601个核苷酸的序列。使用引物库III,在92个反应的24个反应中,获得大小在1000bp至6000bp之间变动的单一条带的PCR扩增DNA片段。对扩增片段进行直接测序,也可以如上所述用其它引物库测定模板核酸的核苷酸序列。
(3)也检查市售ExTaq缓冲液在PCR中的应用。PCR用的反应混合物的组成与以上(2)中所述的组成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的缓冲液和dNTP各200μM。用Gene AmpPCR系统9600(Perkin Elmer),将所述反应混合物进行30个循环的PCR,每个循环由98℃0秒、38℃0秒和72℃3分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。结果,对于各个引物库获得了与以上(2)中所述结果相似的结果。
(4)检查本发明方法中引物的退火模式。就引物库I而言,在92个反应的22个反应中,获得单一条带的PCR产物,然后可以测定模板核酸的核苷酸序列。在12个反应中,引物中所述7个核苷酸的已确定核苷酸序列与模板核酸完全匹配。在所述22个反应的10个反应中,退火涉及一个核苷酸的错配。在所述10个反应的5个反应中扩增了一个相同的区,在所述10个反应的2个反应中扩增了另一个相同的区。
就引物库II而言,在92个反应的21个反应中,获得单一条带的PCR产物,然后可以测定模板核酸的核苷酸序列。在9个反应中,引物中所述7个核苷酸的已确定核苷酸序列与模板核酸完全匹配。在所述92个反应的10个反应中,退火涉及一个核苷酸的错配。在所述92个反应的2个反应中,退火涉及两个核苷酸的错配。
(2)用质粒pTVPfu8.5作为模板,使用具有载体特异性核苷酸序列的引物MR1(SEQ ID NO8)和在实施例1中制备的引物库I的92种引物中的每一种引物进行PCR。制备100μl的PCR反应混合物,所述反应混合物含有20mM tris-乙酸盐(pH 8.5)、50mM乙酸钾、3mM乙酸镁、0.01% BSA、dNTP各300μM、200pg质粒pTVPfu8.5、2.5单位TaKaRa ExTaq DNA聚合酶。用Gene Amp PCR系统9600,将所述反应混合物进行30个循环的PCR,每个循环由98℃10秒、38℃10秒和72℃2分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。
在92个反应的18个反应中,获得大小在1300bp至8400bp之间变动的单一PCR扩增片段。用Microcon-100(Takara Shuzo)从扩增片段中除去引物和从反应混合物中除去盐,并依照常规方法,用具有SEQID NO2(标志序列)的核苷酸序列的测序引物进行直接测序。结果,可以测定插入到质粒pTVPfu8.5的所述DNA片段中的5622个核苷酸的序列。
(3)也检查市售ExTaq缓冲液在PCR中的应用。PCR用的反应混合物的组成与以上(2)中所述的组成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的缓冲液和dNTP各200μM。用Gene AmpPCR系统9600,将所述反应混合物进行30个循环的PCR,每个循环由98℃10秒、38℃10秒和72℃4分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。结果,对于所述引物库获得了与以上(2)中所述结果相似的结果。
(4)检查本发明方法中引物的退火模式。就引物库I而言,在92个反应的19个反应中,获得单一条带的PCR产物,然后可以测定模板核酸的核苷酸序列。在4个反应中,引物中所述7个核苷酸的已确定核苷酸序列与模板核酸完全匹配。在所述92个反应的9个、1个和1个反应中,退火分别涉及一个核苷酸、两个核苷酸和三个核苷酸的错配。在退火时有一个核苷酸错配的2个反应中,观察到退火至同一序列上。
(2)用质粒pUCBcaF2.7和pUCBcaR2.7的混合物作为模板,使用具有载体特异性核苷酸序列的引物M13-引物RV和在实施例I中制备的引物库I的92种引物中的每一种引物进行PCR。制备100μl的PCR反应混合物,所述反应混合物含有20mM tris-乙酸盐(pH 8.5)、50mM乙酸钾、3mM乙酸镁、0.01% BSA、dNTP各300μM、200pg质粒pUCBcaF2.7和pUCBcaR2.7的混合物、2.5单位TaKaRa ExTaq DNA聚合酶。用Gene Amp PCR系统9600,将所述反应混合物进行30个循环的PCR,每个循环由98℃10秒、38℃10秒和72℃2分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。
在92个反应的19个反应中,获得大小在650bp至2800bp之间变动的单一PCR扩增片段。用Microcon-100从扩增片段中除去引物和从反应混合物中除去盐,并依照常规方法,用具有SEQ ID NO2(标志序列)的核苷酸序列的测序引物进行直接测序。结果,可以测定以两个方向插入到所述质粒的所述DNA片段中的2254个核苷酸的序列。
(3)也检查市售ExTaq缓冲液在PCR中的应用。PCR用的反应混合物的组成与以上(2)中所述的组成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的缓冲液和dNTP各200μM。用Gene AmpPCR系统9600,将所述反应混合物进行30个循环的PCR,每个循环由98℃10秒、38℃10秒和72℃4分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。结果,对于所述引物库获得了与以上(2)中所述结果相似的结果。
(4)检查本发明方法中引物的退火模式。就引物库I而言,在92个反应的19个反应中,获得单一条带的PCR产物,然后可以测定模板核酸的核苷酸序列。在6个反应中,引物中所述7个核苷酸的已确定核苷酸序列与模板核酸完全匹配。在8个和2个反应中,退火分别涉及一个核苷酸和两个核苷酸的错配。
证实了即使所述7个核苷酸的已确定核苷酸序列与模板核酸不完全匹配,也可以依照本发明的方法,进行产生单一条带的PCR扩增和测序。研究所述引物的所述7个核苷酸中与模板不互补的核苷酸的位置。对于可以成功测序的有错配退火的43个反应中,反应数和所述7个核苷酸中错配的位置(在括号中显示)如下5(3’末端);3(从3’末端起的第二个);2(从3’末端起的第三个);6(从3’末端起的第四个);6(从3’末端起的第五个);5(从3’末端起的第六个);和16(从3’末端起的第七个)。在许多情况下,即使从3’末端起的第七个核苷酸错配,也可以进行PCR扩增和测序。因此,表明库中每种引物从3’末端起的第七位的变异可能不是必需的。另一方面,在5个反应中即使错配位于3’末端,也可以获得单一条带的扩增产物和可以进行测序。错配的类型示于表6中。
表6位置 错配位置(从3’末端起)3’末端G-T=4 G-A=1第二个 G-T=1 T-T=1 C-A=1第三个 C-T=1T-T=1第四个 G-T=1C-T=3T-T=1 G-A=1第五个 G-T=1C-T=1 G-G=1G-A=1 A-A=1C-A=1第六个 G-T=1C-T=1 G-G=1G-A=1 A-A=1第七个 G-T=11 G-G=1G-A=4总计 G-T=19 C-T=6T-T=3 G-G=3G-A=8 A-A=2C-A=2如表6中所示,许多错配对都包含T。因此,证实T倾向于以比其它核苷酸更高的频率引起错配。
(2)用粘粒491作为模板,使用具有所述插入片段特异性核苷酸序列的引物Pfu30F1(SEQ ID NO9)以及在实施例1中制备的得自引物库I的92种引物、得自引物库II的92种引物、得自引物库IV的77种引物和得自引物库V的64种引物中的每一种引物进行PCR。制备100μl的PCR反应混合物,所述反应混合物含有20mM tris-乙酸盐(pH8.5)、50mM乙酸钾、3mM乙酸镁、0.01%BSA、dNTP各300μM、500pg粘粒491、2.5单位TaKaRa ExTaq DNA聚合酶。用Gene AmpPCR系统9600,使所述反应混合物经于94℃热变性3分钟,然后进行30个循环的PCR,每个循环由98℃ 10秒、38℃ 10秒和72℃ 40秒构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。
在使用引物库I的92个反应的22个反应中,获得大小在400bp至6000bp之间变动的单一PCR扩增片段。用Microcon-100从扩增片段中除去引物和从反应混合物中除去盐,并依照常规方法,用具有SEQID NO2(标志序列)的核苷酸序列的测序引物进行直接测序。结果,可以测定插入到粘粒491的所述DNA片段中的约1746个核苷酸的序列。在使用引物库II的92个反应的20个反应中,获得大小在500bp至4000bp之间变动的单一PCR扩增片段。如上所述纯化扩增片段,然后进行直接测序。结果,可以测定插入到粘粒491的所述DNA片段中的2045个核苷酸的序列。在使用引物库IV的77个反应的17个反应中,获得大小在1100bp至4000bp之间变动的单一PCR扩增片段。如上所述纯化扩增片段,然后用具有SEQ ID NO3的核苷酸序列的测序引物2进行直接测序。结果,可以测定插入到粘粒491的所述DNA片段中的2614个核苷酸的序列。在使用引物库V的64个反应的23个反应中,获得大小在500bp至2900bp之间变动的单一PCR扩增片段。如上所述纯化扩增片段,然后用具有SEQ ID NO3的核苷酸序列的测序引物2进行直接测序。结果,用引物库V也可以测定插入到粘粒491的所述DNA片段的核苷酸序列。
(3)也检查市售ExTaq缓冲液在PCR中的应用。PCR用的反应混合物的组成与以上(2)中所述的组成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的缓冲液和dNTP各200μM。用Gene AmpPCR系统9600,将所述反应混合物进行30个循环的PCR,每个循环由98℃10秒、38℃10秒和72℃2分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。结果,对于所述相应的引物库获得了与以上(2)中所述结果相似的结果。
(2)用基因组DNA作为模板,使用具有SEQ ID NO9的核苷酸序列的引物Pfu30F1和在实施例1中制备的引物库I的92种引物中的所述24种引物(表1中的No 49-72)中的每一种引物进行PCR。制备100μl的PCR反应混合物,所述反应混合物含有20mM tris-乙酸盐(pH 8.5)、50mM乙酸钾、3mM乙酸镁、0.01% BSA、dNTP各300μM、10ng得自激烈热球菌的基因组DNA、2.5单位TaKaRa ExTaq DNA聚合酶。用Gene Amp PCR系统9600,使所述反应混合物经于94℃热变性3分钟,然后进行40个循环的PCR,每个循环由98℃10秒、50℃10秒和72℃40秒构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。
在使用引物库I的24个反应的8个反应中,获得大小在400bp至4000bp之间变动的单一PCR扩增片段。用Microcon-100从扩增片段中除去引物和从反应混合物中除去盐,并依照常规方法,用具有SEQID NO2(标志序列)的核苷酸序列的测序引物进行直接测序。结果,可以测定所述基因组DNA中约1000个核苷酸的序列,证实了本发明的测定核酸的核苷酸序列的方法的有效性。
(3)也检查市售ExTaq缓冲液在PCR中的应用。PCR用的反应混合物的组成与以上(2)中所述的组成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的缓冲液和dNTP各200μM。用Gene AmpPCR系统9600,使所述反应混合物经于94℃热变性3分钟,然后进行40个循环的PCR,每个循环由98℃10秒、50℃10秒和72℃2分钟构成。然后,用2μl每种反应混合物进行琼脂糖凝胶电泳,用溴化乙锭染色后观察扩增DNA片段。结果,对于所述引物库获得了与以上(2)中所述结果相似的结果。实施例8Thermococcus litoralis RNA酶HII基因和速生热球菌(Thermococcusceler)RNA酶HII基因的克隆(1)基因组DNA的制备从11ml培养物中收集Thermococcus litoralis(购自德意志微生物和细胞保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH;DSM5473)或速生热球菌(购自德意志微生物和细胞保藏中心;DSM2476)的细胞。将细胞独立地悬浮于500μl的25%蔗糖和50mM tris-HCl(pH 8.0)中。向其中加入100μl 0.5M EDTA和50μl10mg/ml氯化溶菌酶(Nacalai Tesque)的水溶液。让混合物于20℃反应1小时。反应后,向反应混合物中加入4ml含有150mM NaCl、1mMEDTA和20mM tris-HCl(pH 8.0)的混合物、50μl 20mg/ml蛋白酶K(Takara Shuzo)和250μl 10%十二烷基硫酸钠水溶液。让混合物于37℃温育1小时。反应后,混合物经过苯酚-氯仿抽提和乙醇沉淀、风干,然后溶于100μl TE中,获得基因组DNA溶液。
(2)RNA酶HII基因中间部分的克隆根据各种热稳定RNA酶HII的氨基酸序列中保守的部分,合成寡核苷酸RN-F1(SEQ ID NO10)和RN-R0(SEQ ID NO11)。
用5μl在实施例8-(1)中制备的得自Thermococcus litoralis或速生热球菌的基因组DNA溶液作为模板,用RN-F1和RN-R0各100pmol作为引物,在100μl的体积中进行PCR。用TaKaRa Taq(Takara Shuzo)作为DNA聚合酶,按照所附的方案进行PCR。如下进行PCR50个循环,每个循环由94℃30秒、45℃30秒和72℃1分钟构成。反应后,用Microcon-100(Takara Shuzo)从反应混合物中除去引物,并且浓缩反应混合物。
(3)RNA酶HII基因上游和下游部分的克隆测定在实施例8-(2)中获得的约0.5kb的得自Thermococcuslitoralis的片段TliF1R0和得自速生热球菌的片段TceF1R0的核苷酸序列。根据所测定的核苷酸序列,合成用于克隆TliF1R0上游的部分的特异性寡核苷酸TliRN-1(SEQ ID NO12)和用于克隆TliF1R0下游的部分的特异性寡核苷酸TliRN-2(SEQ ID NO13)。此外,根据所测定的核苷酸序列,合成用于克隆TceF1R0上游的部分的特异性寡核苷酸TceRN-1(SEQ ID NO14)和用于克隆TceF1R0下游的部分的特异性寡核苷酸TceRN-2(SEQ ID NO15)。另外,合成了表7中所示的48种引物。表7中的标志序列示于SEQ ID NO16中。
表75’-标志序列-NN-SSSSSSS-3’(VI)(NG、A、T和C的混合物;SSSSSSS代表以下所示的核苷酸序列)No 核苷酸序列No核苷酸序列No核苷酸序列1 ggagcag 19gtaacgg 37gcgcaag2 ggcaaag 20gtaagcg 38gcgcttg3 ggcaacg 21gtacacg 39gcggacg4 ggcacag 22gtagacg 40gcgtaag5 ggcattg 23gtagcgg 41gctacgg6 ggccaag 24gtcaacg 42gctcacg7 ggccttg 25gcaccag 43gctccag8 ggctaag 26gcagacg 44gcttgcg9 ggctacg 27gcagcag 45gcttggg10 ggctcag 28gcatggg 46ggacacg11 ggctttg 29gccaaag 47ggaccag12 gggacag 30gccacag 48ggagacg13 gggcaag 31gccattg14 gggcttg 32gcccaag15 gggtacg 33gcccttg16 ggtaacg 34gcctacg17 ggtacgg 35gcctcag18 ggtagcg 36gcctttg在含有在实施例8-(1)中制备的作为模板的1μl基因组DNA溶液、20pmol TliRN-1或20pmol TliRN-2与20pmol表1中所列的48种引物中的每一种引物的组合、或者20pmol TceRN-1或20pmolTceRN-2与20pmol表1中所列的48种引物中的每一种引物的组合、20mM tris-乙酸盐(pH 8.5)、50mM乙酸钾、3mM乙酸镁、0.01%BSA、dNTP各30μM和2.5单位TaKaRa Ex Taq DNA聚合酶(Takara Shuzo)的反应混合物中,进行PCR。如下进行PCR于94℃保温3分钟;然后进行40个循环,每个循环由98℃10秒、50℃10秒和72℃40秒构成。用每种PCR产物各1份进行琼脂糖凝胶电泳。用Microcon-100(Takara Shuzo)从产生单个条带的反应混合物中除去引物,并且浓缩反应混合物。对浓缩物直接测序,以筛选含有所述RNA酶HII上游部分或下游部分的片段。结果,对于Thermococcus litoralis,表明一个约450bp的PCR扩增片段TliN7含有RNA酶HII基因的上游部分,一个约600bp的PCR扩增片段TliC25和一个约400bp的PCR扩增片段TliC26分别含有RNA酶HII基因的下游部分。对于速生热球菌,表明一个约450bp的PCR扩增片段TceN24含有RNA酶HII基因的上游部分,一个约400bp的PCR扩增片段TceC29含有RNA酶HII基因的下游部分。
(4)完整RNA酶HII基因的克隆含有TliF1R0的基因以及上游部分和下游部分的核苷酸序列示于SEQ ID NO17中。从所述核苷酸序列导出的RNA酶HII的氨基酸序列示于SEQ ID NO18中。根据所述核苷酸序列,合成引物TliNde(SEQID NO19)和TliBam(SEQ ID NO20)。
含有TceF1R0的基因以及上游部分和下游部分的核苷酸序列示于SEQ ID NO21中。从所述核苷酸序列导出的RNA酶HII的氨基酸序列示于SEQ ID NO22中。根据所述核苷酸序列,合成引物TceNde(SEQID NO23)和TceBam(SEQ ID NO24)。
用实施例8-(1)中获得的1μl Thermococcus litoralis基因组DNA溶液作为模板,用TliNde和TliBam各20pmol作为引物,在100μl体积中进行PCR。用Ex Taq DNA聚合酶(Takara Shuzo)作为DNA聚合酶,按照所附的方案进行PCR。如下进行PCR94℃30秒、55℃30秒和72℃1分钟,进行40个循环。约0.7kb的扩增DNA片段用NdeI和BamHI(都得自Takara Shuzo)消化。然后通过将所得的DNA片段分别加入到质粒载体pTV119Nd(一种其中pTV119N的NcoI位点被转变为NdeI位点的质粒)或pET3a(Novagen)的NdeI位点和BamHI位点之间,构建质粒pTLI223Nd和pTLI204。
此外,用1μl Thermococcus litoralis基因组DNA溶液作为模板,用TceNde和TceBam各20pmol作为引物,在100μl体积中进行PCR。用Pyrobest DNA聚合酶(Takara Shuzo)作为DNA聚合酶,按照所附的方案进行PCR。如下进行PCR94℃30秒、55℃30秒和72℃1分钟,进行40个循环。约0.7kb的扩增DNA片段用NdeI和BamHI(都得自Takara Shuzo)消化。然后通过将所得的DNA片段分别加入到质粒载体pTV119Nd(一种其中pTV119N的NcoI位点被转变为NdeI位点的质粒)或pET3a(Novagen)的NdeI位点和BamHI位点之间,构建质粒pTCE265Nd和pTCE207。
(5)含RNA酶HII基因的DNA片段的核苷酸序列的测定按照双脱氧法,测定在实施例8-(2)中获得的插入到pTLI223Nd、pTLI204、pTCE265Nd和pTCE207中的所述DNA片段的核苷酸序列。
所测定的核苷酸序列的分析表明,存在推定编码RNA酶HII的可读框。pTLI204中所述可读框的核苷酸序列示于SEQ ID NO25中。从所述核苷酸序列导出的RNA酶HII的氨基酸序列示于SEQ ID NO26中。在pTLI204中所述可读框的核苷酸序列中位置484的“T”在pTLI223Nd中所述可读框的核苷酸序列中被“C”所取代。在所述氨基酸序列中,位置162的苯丙氨酸被亮氨酸所取代。
pTCE207中所述可读框的核苷酸序列示于SEQ ID NO27中。从所述核苷酸序列导出的RNA酶HII的氨基酸序列示于SEQ ID NO28中。在pTCE207中所述可读框的核苷酸序列中位置14的“A”在pTCE265Nd中所述可读框的核苷酸序列中被“G”所取代。另外,在pTCE207中所述可读框的核苷酸序列中位置693-696的核苷酸在pTCE265Nd中缺失。在所述氨基酸序列中,位置5的谷氨酸被甘氨酸所取代,并且位置231的苯丙氨酸缺失。
(6)RNA酶HII基因的表达将用pTLI223Nd或pTCE265Nd转化的大肠杆菌JM109接种到含有100μg/ml氨苄青霉素和1mM IPTG的10ml LB培养基中,于37℃振荡培养过夜。培养后,将经离心收集的细胞悬浮于196μl缓冲液A中,进行超声处理。将通过超声处理悬浮液以12,000rpm离心10分钟而获得的上清液于70℃加热10分钟。然后再次以12,000rpm离心10分钟,以收集上清液,作为热处理上清液。同样,将用pTLI204或pTCE207转化的大肠杆菌HMS174(DE3)接种到含有100μg/ml氨苄青霉素的10ml LB培养基中,于37℃振荡培养过夜。培养后,按照上述方法加工经离心收集的细胞,获得热处理上清液。
测定热处理上清液的酶活性。结果,观察到所有转化体的RNA酶H活性。因此,证实了所述多肽的所述活性,尽管在核苷酸序列或氨基酸序列中有取代。如上所述,证明按照本发明的方法,可以直接从基因组方便而快速地克隆目标基因,而无需构建文库。
工业应用性本发明提供一种快速而低成本的测定核酸的核苷酸序列的方法,其中对通过用一种模板特异性引物和具有已确定核苷酸序列的引物进行PCR获得的PCR产物进行测序。
序列表的独立文本SEQ ID NO1人工设计的寡核苷酸。
SEQ ID NO2人工设计的寡核苷酸。
SEQ ID NO3人工设计的寡核苷酸。
SEQ ID NO4人工设计的寡核苷酸。
SEQ ID NO5人工设计的寡核苷酸。
SEQ ID NO6人工设计的寡核苷酸。
SEQ ID NO7人工设计的寡核苷酸。
SEQ ID NO8人工设计的寡核苷酸。
SEQ ID NO9人工设计的寡核苷酸。
SEQ ID NO10PCR引物RN-F1,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO11PCR引物RN-R0,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO12PCR引物TliRN-1,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO13PCR引物TliRN-2,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO14PCR引物TceRN-1,用于从速生热球菌中克隆编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO15PCR引物TceRN-2,用于从速生热球菌中克隆编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO16设计的作为标志序列的寡核苷酸。
SEQ ID NO19PCR引物TliNde,用于从Thermococcus litoralis中扩增编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO20PCR引物TliBam,用于从Thermococcus litoralis中扩增编码具有RNA酶HIII活性的多肽的基因。
SEQ ID NO23PCR引物TceNde,用于从速生热球菌中扩增编码具有RNA酶HII活性的多肽的基因。
SEQ ID NO24PCR引物TceBam,用于从速生热球菌中扩增编码具有RNA酶HIII活性的多肽的基因。序列表<110>宝酒造株式会社(Takara Shuzo Co.,Ltd.)<120>测定核酸的核苷酸序列的方法<130>662848<150>JP 2000-331513<151>2000-10-30<160>28<210>1<211>17<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>1ggcacgattc gataacg 17<210>2<211>16<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>2ggcacgattc gataac16<210>3<211>17<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>3caggaaacag ctatgac 17<210>4<211>37<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>4ggtggcgcga tgcaaatgca atcttcgttg ccccaac 37<210>5<211>30<212>DNA<213>人工序列<220><223>E6 sph引物<400>5tggccttcga gcgatgcatg ctcactgcca 30<210>6<211>35<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>6tttccaatgg agggttctag atgaacgaag gtgaa35<210>7<211>33<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>7cgacatagtg aggtgtctag acggaaagaa_gga33<210>8<211>30<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>8tttacacttt atgcttccgg ctcgtatgtt30<210>9<211>30<212>DNA<213>人工序列<220><223>人工设计的寡核苷酸<400>9ccttatctat gatctccttc tttccgtctg30<210>10<211>23<212>DNA<213>人工序列<220><223>PCR引物RN-F1,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因<400>10ggcattgatg aggctggnar rgg 23<210>11<211>23<212>DNA<213>人工序列<220><223>PCR引物RN-RO,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因<400>11gtccttggat cgctgggrta ncc 23<210>12<211>24<212>DNA<213>人工序列<220><223>PCR引物TliRN-1,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因<400>12tagctttttt gaatctttga ctcc 24<210>13<211>24<212>DNA<213>人工序列<220><223>PCR引物TliRN-2,用于从Thermococcus litoralis中克隆编码具有RNA酶HII活性的多肽的基因<400>13ctgctgcatc aatactagct aaag 24<210>14<211>24<212>DNA<213>人工序列<220><223>PCR引物TceRN-1,用于从速生热球菌(Thermococcus celer)中克隆编码具有RNA酶HII活性的多肽的基因<400>14tctctgagct tcggaacgtt cttc 24<210>15<211>24<212>DNA<213>人工序列<220><223>PCR引物TceRN-2,用于从速生热球菌(Thermococcus celer)中克隆编码具有RNA酶HII活性的多肽的基因<400>15acccgtgaca gggcgataga aaag 24<210>16<211>17<212>DNA<213>人工序列<220><223>设计的作为标志序列的寡核苷酸<400>16ggcacgattc gataacg 17<210>17<211>675<212>DNA<213>Thermococcus litoralis<400>17atgaagctgg gaggaataga tgaagccggc aggggaccag ttataggccc tcttgtaatt 60gcagcggttg ttgtcgatga atcccgtatg caggagcttg aagctttggg agtcaaagat 120tcaaaaaagc taacaccaaa aagaagagaa gagctatttg aggagattgt gcaaatagtt 180gatgaccacg ttatcattca gctttcccca gaggagatag acggcagaga tggtacaatg 240aacgagcttg aaattgaaaa ctttgccaaa gcgttgaact cccttaaagt taagccggat 300gtgctctaca tagatgcggc cgatgtcaag gaaaagcgct ttggcgacat tataggtgaa 360agactttcct tctctccaaa gataatcgcc gaacataagg cagattcaaa gtacattcca 420gtggctgctg catcaatact agctaaagtt acccgtgaca gggcaataga gaagctcaag 480gagctttatg gggagatagg ctcaggatat ccaagtgatc caaatacaag gaggtttctg 540gaggagtatt acaaggctca tggggaattc cccccaatag tgaggaaaag ctggaagacc 600cttagaaaga tagaagaaaa actaaaagct aaaaagactc agcccactat cttggacttc 660ttaaaaaagc cttaa 675<210>18<211>224<212>PRT<213>Thermococcus litoralis<400>18Met Lys Leu Gly Gly Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Leu Val Ile Ala Ala Val Val Val Asp Glu Ser Arg Met20 25 30Gln Glu Leu Glu Ala Leu Gly Val Lys Asp Ser Lys Lys Leu Thr35 40 45Pro Lys Arg Arg Glu Glu Leu Phe Glu Glu Ile Val Gln Ile Val50 55 60Asp Asp His Val Ile Ile Gln Leu Ser Pro Glu Glu Ile Asp Gly65 70 75Arg Asp Gly Thr Met Asn Glu Leu Glu Ile Glu Asn Phe Ala Lys80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Leu Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Lys Arg Phe Gly Asp Ile Ile Gly Glu110 115 120Arg Leu Ser Phe Ser Pro Lys Ile Ile Ala Glu His Lys Ala Asp125 130 135Ser Lys Tyr Ile Pro Val Ala Ala Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Leu Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Asn Thr Arg Arg Phe Leu170 175 180Glu Glu Tyr Tyr Lys Ala His Gly Glu Phe Pro Pro Ile Val Arg185 190 195Lys Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Lys Ala200 205 210Lys Lys Thr Gln Pro Thr Ile Leu Asp Phe Leu Lys Lys Pro215 220<210>19<211>39<212>DNA<213>人工序列<220><223>PCR引物TliNde,用于从Thermococcus litoralis中扩增编码具有RNA酶HII活性的多肽的基因<400>19gaggaggtag gcatatgaag ctgggaggaa tagatgaag 39<210>20<211>39<212>DNA<213>人工序列<220><223>PCR引物TliBam,用于从Thermococcus litoralis中扩增编码具有RNA酶HIII活性的多肽的基因<400>20aaaggaaacc ttcggatcca ttaaggcttt tttaagaag 39<210>21<211>702<212>DNA<213>速生热球菌(Thermococcus celer)<400>21ttgaagctcg caggaataga cgaggctgga aggggccccg taatcggccc gatggtcatc 60gcggccgtcg tcctcgatga gaagaacgtt ccgaagctca gagatctcgg cgtcagggac 120tcgaaaaagc tgaccccaaa gaggagggag agattattta acgacataat taaacttttg 180gatgattatg taattcttga attatggccg gaggagatag actcccgcgg cgggacgctt 240aacgagctcg aggtggagag gttcgtggag gccctcaact cgcttaaggt gaagcccgac 300gtcgtttaca tagacgcggc ggacgtgaag gagggccgct ttggcgagga gataaaggaa 360aggttgaact tcgaggcgaa gattgtctca gagcacaggg cggacgataa gtttttaccg 420gtgtcctctg cctcgatact ggcgaaggtg acccgtgaca gggcgataga aaagctcaag 480gagaagtacg gcgagatcgg gagcggctac ccgagcgacc caaggacgag ggagttcctc 540gagaactact acagacaaca cggcgagttc ccgcccgtag tccggcgaag ctggaagacg 600ctgagaaaga tagaggaaaa gctgaggaaa gaggccgggt caaaaaaccc ggagaattca 660aaggaaaagg gacagacgag cctggacgta tttttgaggt ag 702<210>22<211>233<212>PRT<213>速生热球菌(Thermococcus celer)<400>22Leu Lys Leu Ala Gly Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Met Val Ile Ala Ala Val Val Leu Asp Glu Lys Asn Val20 25 30Pro Lys Leu Arg Asp Leu Gly Val Arg Asp Ser Lys Lys Leu Thr35 40 45Pro Lys Arg Arg Glu Arg Leu Phe Asn Asp Ile Ile Lys Leu Leu50 55 60Asp Asp Tyr Val Ile Leu Glu Leu Trp Pro Glu Glu Ile Asp Ser65 70 75Arg Gly Gly Thr Leu Asn Glu Leu Glu Val Glu Arg Phe Val Glu80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Val Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Gly Arg Phe Gly Glu GIu Ile Lys Glu110 115 120Arg Leu Asn Phe Glu Ala Lys Ile Val Ser Glu His Arg Ala Asp125 130 135Asp Lys Phe Leu Pro Val Ser Ser Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Lys Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Arg Thr Arg Glu Phe Leu170 175 180Glu Asn Tyr Tyr Arg Gln His Gly Glu Phe Pro Pro Val Val Arg185 190 195Arg Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Arg Lys200 205 210Glu Ala Gly Ser Lys Asn Pro Glu Asn Ser Lys Glu Lys Gly Gln215 220 225Thr Ser Leu Asp Val Phe Leu Arg230<210>23<211>39<212>DNA<213>人工序列<220><223>PCR引物TceNde,用于从速生热球菌(Thermococcus celer)中扩增编码具有RNA酶HII活性的多肽的基因<400>23cagggggtga gcatatgaag ctcgcaggaa tagacgagg 39<210>24<211>39<212>DNA<213>人工序列<220><223>PCR引物TceBam,用于从速生热球菌(Thermococcus celer)中扩增编码具有RNA酶HIII活性的多肽的基因<400>24tgaacccgcg taggatccta cctcaaaaat acgtccagg 39<210>25<211>675<212>DNA<213>Thermococcus litoralis<400>25atgaagctgg gaggaataga tgaagccggc aggggaccag ttataggccc tcttgtaatt 60gcagcggttg ttgtcgatga atcccgtatg caggagcttg aagctttggg agtcaaagat 120tcaaaaaagc taacaccaaa aagaagagaa gagctatttg aggagattgt gcaaatagtt 180gatgaccacg ttatcattca gctttcccca gaggagatag acggcagaga tggtacaatg 240aacgagcttg aaattgaaaa ctttgccaaa gcgttgaact cccttaaagt taagccggat 300gtgctctaca tagatgcggc cgatgtcaag gaaaagcgct ttggcgacat tataggtgaa 360agactttcct tctctccaaa gataatcgcc gaacataagg cagattcaaa gtacattcca 420gtggctgctg catcaatact agctaaagtt acccgtgaca gggcaataga gaagctcaag 480gagttttatg gggagatagg ctcaggatat ccaagtgatc caattacaag gaggtttctg 540gaggagtatt acaaggctca tggggaattc cccccaatag tgaggaaaag ctggaagacc 600cttagaaaga tagaagaaaa actaaaagct aaaaagactc agcccactat cttggacttc 660ttaaaaaagc cttaa 675<210>26<211>224<212>PRT<213>Thermococcus litoralis<400>26Met Lys Leu Gly Gly Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Leu Val Ile Ala Ala Val Val Val Asp Glu Ser Arg Met20 25 30Gln Glu Leu Glu Ala Leu Gly Val Lys Asp Ser Lys Lys Leu Thr35 40 45Pro Lys Arg Arg Glu Glu Leu Phe Glu Glu Ile Val Gln Ile Val50 55 60Asp Asp His Val Ile Ile Gln Leu Ser Pro Glu Glu Ile Asp Gly65 70 75Arg Asp Gly Thr Met Asn Glu Leu Glu Ile Glu Asn Phe Ala Lys80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Leu Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Lys Arg Phe Gly Asp Ile Ile Gly Glu110 115 120Arg Leu Ser Phe Ser Pro Lys Ile Ile Ala Glu His Lys Ala Asp125 130 135Ser Lys Tyr Ile Pro Val Ala Ala Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Phe Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Ile Thr Arg Arg Phe Leu170 175 180Glu Glu Tyr Tyr Lys Ala His Gly Glu Phe Pro Pro Ile Val Arg185 190 195Lys Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Lys Ala200 205 210Lys Lys Thr Gln Pro Thr Ile Leu Asp Phe Leu Lys Lys Pro215 220<210>27<211>702<212>DNA<213>速生热球菌(Thermococcus celer)<400>27atgaagctcg cagaaataga cgaggctgga aggggccccg taatcggccc gatggtcatc 60gcggccgtcg tcctcgatga gaagaacgtt ccgaagctca gagatctcgg cgtcagggac 120tcgaaaaagc tgaccccaaa gaggagggag agattattta acgacataat taaacttttg 180gatgattatg taattcttga attatggccg gaggagatag actcccgcgg cgggacgctt 240aacgagctcg aggtggagag gttcgtggag gccctcaact cgcttaaggt gaagcccgac 300gtcgtttaca tagacgcggc ggacgtgaag gagggccgct ttggcgagga gataaaggaa 360aggttgaact tcgaggcgaa gattgtctca gagcacaggg cggacgataa gtttttaccg 420gtgtcctctg cctcgatact ggcgaaggtg acccgtgaca gggcgataga aaagctcaag 480gagaagtacg gcgagatcgg gagcggctac ccgagcgacc caaggacgag ggagttcctc 540gagaactact acagacaaca cggcgagttc ccgcccgtag tccggcgaag ctggaagacg 600ctgagaaaga tagaggaaaa gctgaggaaa gaggccgggt caaaaaaccc ggagaattca 660aaggaaaagg gacagacgag cctggacgta tttttgaggt ag 702<210>28<211>233<212>PRT<213>速生热球菌(Thermococcus celer)<400>28Met Lys Leu Ala Glu Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Met Val Ile Ala Ala Val Val Leu Asp Glu Lys Asn Val20 25 30Pro Lys Leu Arg Asp Leu Gly Val Arg Asp Ser Lys Lys Leu Thr
35 40 45Pro Lys Arg Arg Glu Arg Leu Phe Asn Asp Ile Ile Lys Leu Leu50 55 60Asp Asp Tyr Val Ile Leu Glu Leu Trp Pro Glu Glu Ile Asp Ser65 70 75Arg Gly Gly Thr Leu Asn Glu Leu Glu Val Glu Arg Phe Val Glu80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Val Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Gly Arg Phe Gly Glu Glu Ile Lys Glu110 115 120Arg Leu Asn Phe Glu Ala Lys Ile Val Ser Glu His Arg Ala Asp125 130 135Asp Lys Phe Leu Pro Val Ser Ser Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Lys Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Arg Thr Arg Glu Phe Leu170 175 180Glu Asn Tyr Tyr Arg Gln His Gly Glu Phe Pro Pro Val Val Arg185 190 195Arg Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Arg Lys200 205 210Glu Ala Gly Ser Lys Asn Pro Glu Asn Ser Lys Glu Lys Gly Gln215 220 225Thr Ser Leu Asp Val Phe Leu Arg230
权利要求
1.一种测定核酸的核苷酸序列的方法,所述方法包括(1)在分别具有一个标志序列的至少两种引物的每一种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增所述模板核酸,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列;并且(2)对在以上步骤(1)中扩增的片段进行直接测序。
2.权利要求1的方法,其中所述具有标志序列的引物具有以下通式所示的结构通式5’-标志序列-Sa-3’其中“S”代表选自G、A、T和C的一种核苷酸或者两种或两种以上核苷酸的混合物,而“a”代表3或3以上的整数,条件是“Sa”中的至少三个S代表选自G、A、T和C的一种核苷酸。
3.权利要求1的方法,其中所述具有标志序列的引物选自表1-5中所列的引物。
4.权利要求1的方法,其中所述模板核酸的扩增使用聚合酶链式反应(PCR)进行。
5.权利要求1的方法,所述方法还包括选择具有标志序列、在所述模板核酸扩增时产生基本为单一条带的扩增片段的引物库。
6.权利要求1的方法,所述方法还包括纯化基本为单一条带的扩增片段。
7.权利要求4的方法,其中在所述PCR中使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶或者DNA聚合酶的混合物。
8.权利要求1的方法,其中所述DNA聚合酶选自Taq DNA聚合酶、Pfu DNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、Tth DNA聚合酶、KOD DNA聚合酶和KOD dashDNA聚合酶。
9.权利要求1的方法,所述方法在从样品制备所述模板核酸后进行。
10.权利要求9的方法,其中所述模板核酸以质粒、噬菌体、噬菌粒、粘粒、BAC或YAC文库、或者基因组DNA或cDNA形式提供。
11.一种供测定核酸的核苷酸序列的方法使用的引物库,所述引物库含有至少两种分别具有一个标志序列的引物,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列,并且其中所述测定核酸的核苷酸序列的方法包括(1)在分别具有一个标志序列的至少两种引物的每一种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增所述模板核酸,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列;并且(2)对在以上步骤(1)中扩增的片段进行直接测序。
12.权利要求11的引物库,其中所述具有标志序列的引物具有以下通式所示的结构通式5’-标志序列-Sa-3’其中“S”代表选自G、A、T和C的一种核苷酸或者两种或两种以上核苷酸的混合物,而“a”代表3或3以上的整数,条件是“Sa”中的至少三个S代表选自G、A、T和C的一种核苷酸。
13.权利要求11的引物库,其中所述具有标志序列的引物中的所述标志序列含有一个测序用引物的序列。
14.一种用于测定核酸的核苷酸序列的组合物,所述组合物含有一个供测定核酸的核苷酸序列的方法使用的引物库,其中所述引物库含有至少两种分别具有一个标志序列的引物,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列,并且其中所述测定核酸的核苷酸序列的方法包括(1)在分别具有一个标志序列的至少两种引物的每一种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增所述模板核酸,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列;并且(2)对在以上步骤(1)中扩增的片段进行直接测序。
15.权利要求14的组合物,所述组合物还含有DNA聚合酶。
16.权利要求15的组合物,其中所述DNA聚合酶为pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶或者DNA聚合酶的混合物。
17.权利要求16的组合物,其中所述DNA聚合酶选自Taq DNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、Tth DNA聚合酶、KOD DNA聚合酶和KOD dash DNA聚合酶。
18.一种供测定核酸的核苷酸序列的方法使用的试剂盒,所述试剂盒含有一个引物库,其中所述引物库含有至少两种分别具有一个标志序列的引物,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列,并且其中所述测定核酸的核苷酸序列的方法包括(1)在分别具有一个标志序列的至少两种引物的每一种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增所述模板核酸,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列;并且(2)对在以上步骤(1)中扩增的片段进行直接测序。
19.权利要求18的试剂盒,所述试剂盒还含有DNA聚合酶和供所述DNA聚合酶用的缓冲液。
20.一种供测定核酸的核苷酸序列的方法使用的试剂盒,所述试剂盒为包装形式并且带有指导引物库和DNA聚合酶使用的说明,其中所述引物库含有至少两种分别具有一个标志序列的引物,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列,并且其中所述测定核酸的核苷酸序列的方法包括(1)在分别具有一个标志序列的至少两种引物的每一种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增所述模板核酸,其中所述具有标志序列的引物在5’端一侧具有所述标志序列,而在3’端一侧具有一个三个或三个以上核苷酸的已确定的核苷酸序列;并且(2)对在以上步骤(1)中扩增的片段进行直接测序。
21.权利要求18或20的试剂盒,其中所述引物库中所述分别具有标志序列的各种所述引物分配在预定的位置上。
22.一种制品,所述制品由包装材料和装入所述包装材料中的用于测定核酸的核苷酸序列的试剂构成,其中所述试剂含有一个引物库和/或一种DNA聚合酶,并且其中关于所述试剂可以用于测定核苷酸序列的说明示于贴在所述包装材料上的标签或者所述包装材料所附的说明中。
全文摘要
本发明涉及一种测定核酸的碱基序列的方法,其特征在于包括下述步骤在分别具有一个标志序列的至少两种引物、一种模板核酸特异性引物和DNA聚合酶存在下,扩增所述模板核酸,其中所述具有标志序列的引物分别在其5’末端一侧具有所述标志序列,而在3’末端一侧具有一个由三个或三个以上核苷酸构成的特定碱基序列;并且对在上述步骤中获得的扩增片段进行直接测序。
文档编号C12Q1/68GK1483082SQ01821389
公开日2004年3月17日 申请日期2001年10月30日 优先权日2000年10月30日
发明者上森隆司, 山下裕兄, 外园成和, 佐藤好美, 向井博之, 浅田起代藏, 加藤郁之进, 之, 之进, 代藏, 兄, 和, 美 申请人:宝生物工程株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1