自回避分子识别系统用于dna扩增的制作方法

文档序号:580909阅读:792来源:国知局
专利名称:自回避分子识别系统用于dna扩增的制作方法
自回避分子识别系统用于DNA扩增相关应用的相关文献这个申请于2008年8月20日向美国临时专利局要求了优先日期12/229159。它关 系到美国的专利申请11/647609,同时是美国专利申请11/271366—部分的延续,有以2004 年11月13日提出的临时专利申请11/271366和60/627459为基础。声明中关于联邦资助的研究或发展。无。联合研究协议中当事人的姓名不适用。以光盘提交公司引用的参考材料。无
背景技术
1.发明的领域本发明涉及到核酸化学领域,更具体到一种物质组分成为复制DNA和RNA的引物, 更具体到用聚合酶链反应扩增DNA的领域。这些物质的组分包括非标核苷酸能够与其互补 的天然核苷酸结合,并且按照一些规则形成稳定的双链结构,这些规则是基于大量的实验 数据,非标核苷酸不与自身强烈的相结,同时实验发现DNA聚合酶可以接受在引物和模板 中的非标核苷酸。2.相关技术的说明在过去15多年来,科学家寻求创新的分子识别系统,该系统的结合性能被用于不 同的方面。一些系统中的模型结构也被用于DNA和RNA中。此外,DNA和RNA的分子识别 系统已被广泛地应用,因为它们之间的分子识别系统和/或天然DNA和RNA遵循简单的规 则,简单到一个普通的人可以利用它得到有用的事情。DNA作为一种模型来说明分子结构和碱基识别的规则。由于它是以四个部分组成, 对于一个长度为η的DNA,不同的DNA序列内的DNA分子识别系统的专利数量将是巨大的。 因此,只有当启发式的识别规则被发现,同时利用这个新的识别规则,使技术熟练的人能够 预测哪些DNA序列与其它的序列结合,从而避免不必要的实验,这样的分子识别系统才被 视为可以被专利保护的。这种启发式规则来源于对天然的DNA,RNA和其修改形式(例如,2'-甲酯改良 RNA)和类似物(例如,PNA)进行大量的熔化温度相的测量实验。一般来说,如果没有这些 大量的实验数据,分子识别无法准确地预测。对于DNA,这些实验已经被做了很多年,已经取 得了很多启发式规则的例子。其中,三个规则尤其的重要Α与T配对,G与C配对,而且两 条DNA链是反平行的。几十年来,这些规则允许一个本领域的技术人员可以设计两个DNA 分子能够在水溶液中结合。当完全遵循该规则,两个完全互补的、长度在15-20个核苷酸的 DNA链,能够在一般的生理缓冲液中(37°C)高选择性地结合,并且不受复杂的混合物中其 它DNA分子的影响。进一步预测DNA之间结合的亲和力大致趋势的规则也已经被发展了很多年。一般 来说,长DNA链相结合比短DNA链相结合有较高的熔融温度。G: C配对比A: T配对有更高的 热稳定性。这些规则对于一个专业从业者要获得DNA系统的实用性并非绝对的必要。利用 更多的高参数化模型来改进熔融温度[A1198a] [A1198b] [Mar85] [Mat98],对于DNA识别系统的实用性并没有本质性的提高。因此,从大约100个熔化温度的实验中总结的规则是必 要的和足够的让一个DNA识别系统模型有核心的实用性;类似的,从数以千计的熔融温度 试验取得的规则未必可以使这个系统具有核心的实用性,尽管它们可以扩大系统的效用。一类非天然的(或,在这里用,“非标准的“)DNA类似物(例如,X和Y),它们可以 彼此配对形成稳定的X: Y同时可以增加非标准DNA双螺旋的稳定性。但是,当X和Y,与标 准的DNA碱基配对,则无助于双螺旋的稳定性。在这个例子中,通过增加X和Y得到的最有 用的遗传密码子具有特殊的生物物理特性,其中A Y,T Y,G Y,C Y,A X,T X,G X和C X这 些不匹配的碱基对,与X:Y碱基对相比较,均显著地降低双螺旋的稳定性。还有更多有用的 是,非标准的不匹配的碱基对与标准的不匹配的碱基对(例如,A:G,C:A, T:G,等),这些不 匹配的碱基对比X:Y配对有显著地不稳定性。在美国专利5432272和后续的专利中,披露了一个人工发明的分子识别系统的模 型(

图1)。在这里,这种人工的分子识别系统的设计基于两种沃森_克里克核酸互补配对 的原则大小互补(大与小的嘌呤嘧啶配对)和氢键互补(一个碱基给于氢,另一个碱基 接受氢)。这两个原则产生出简单的碱基配对规则(“Α与T配对,G与C配对“)并且成 为遗传学,分子生物学和生物技术的基础。美国专利5432272指出,这些原则可以被用于不 同于腺嘌呤核苷酸(A)和胸腺嘧啶(T)和鸟嘌呤(G)和胞嘧啶(C)的非天然核苷酸中。例 如,有十二个非天然碱基组成六个碱基,这些碱基对采用互不相同的氢键模式同时具有沃 森_克里克碱基配对的几何形状。图1显示了一些标准的和非标准的碱基对和他们的命 名。这些碱基类似物提供非标氢键模式是人工扩展遗传信息系统的一部分(Artificially Expanded Genetic Information System, or AEGIS)0美国专利5432272和其继任者告诉我们,人工扩展遗传信息系统(AEGIS)的氢键 模式与该系统中使用的杂环可以相互独立。这意味着不同的杂环化合物通常可以作为分子 识别元件互用。反过来说,人工分子识别系统中的单元的选择,可以有其他考虑,而不只局 限于简单的识别规则。因此,人工扩展遗传信息系统(AEGIS)中pyADA的氢键模式可以是 胸苷,尿苷,尿苷衍生物携带5位荧光基团,携带5位生物素,和其他的衍生物。经过大约100个熔化温度的实验,AEGIS分子识别系统的实用性得到了充足地支 持。AEGIS分子识别系统已经被应用在临床诊断中的分支DNA(bDNA)中,用来检测艾滋病 毒,乙肝和丙型肝炎病毒[Elb04a] [Elb04b]。这个例子说明,尽管由AEGIS单元构建的DNA 双链有不同的序列,也不能够进行精确的预测,这并没有妨碍该人工识别系统被用于每年 40万病人的临床诊断[Ben04]。这也说明了正交性在核酸分析化学中的应用,在由AEGIS 单元建立的寡核苷酸分子中,含有AEGIS单元的寡核苷酸只与其互补的寡核苷酸识别,但 是不与天然的DNA序列结合。人们早已认识到,在文献中有一类DNA类似物,他们有相反的行为并且可能有不 同的用途。在这里,核苷酸类似物具有“自回避”的性质。自回避核苷酸构件被指定为A*, T*,G*,和C*。要成为“自回避”,其中A*:T,T*:A,G*:C和C*:G配对,在双链DNA中应该提供 更高的稳定性(与标准的不匹配配对相比较),A*:T*和G*: C*虽然是正式匹配,但是对双 链的稳定性贡献较少。15年前在DNA结构中使用这样的特性已经被确认,在那里Gamper和 其他人试图将A*和T*的类似物(其中A*是二氨基嘧啶,T*是2-thiothymidine)嵌入单链 DNA或RNA分子中,用于防止形成“二级结构”[Kut96]。他们用了近乎十年时间致力于发展一个相应的G*和C*,后来以肌苷为G*的首选。他们选择包括5-6融合pyrrolopyrimidine 系统(图2) [Woo96],一个胞苷脱氨基的类似物与天然产物zebularine相似的化合物为 O [Gam06] ] [Lahoud等人(2008) Properties of pseudo-complementary DNA substituted with weakly pairing analogs of guanine or cytosine. Nuclecic Acids Res. 36, 6999-7008],和4-N的烷基化胞嘧啶[Lah08a,b,c]衍生物。他们大部分的工作致力于获得 聚合酶,该酶能够将二氨基嘧啶,2-硫代胸苷,和肌苷的三磷酸添加到以模版导向的引物的 3'-端。第一个知识产权源自于这种工作是由美国专利5912340披露(发布于 1999/06/15)。该专利(US5912340)不涉及合成DNA聚合酶或多元PCR的引物。相反, US5912340声称一对寡核苷酸(ODNs),它们的序列具有互补性,但是它们之间不能形成双 链结构,却可以与天然的寡核苷酸结合,如果这对寡核苷酸是由天然核苷酸组成的,那么它 们之间就能够形成稳定的双链DNA。US5912340专利的发明者会满意,如果有“足够“数量的核苷酸(这里讨论*类似 物的衍生物)被嵌入两条寡核苷酸中以防止彼此相互的结合,或(在以后的工作中),如果 有足够数量的类似物在DNA或RNA中,以防止DNA或RNA分子的自身折叠。US5912340没有 提供任何熔融温度,也没有后续工作,也没有提供保证,在本领域普通技术人员几乎不需要 进一步的实验,就可以预测这些寡核苷酸有用的性能。此外,US5912340也没有提供聚合酶 对这些非天然化合物作为模板或引物的数据,因此,不能确定他们将会被聚合酶接受,进而 更不确定他们是否会被聚合酶高效率地接受以达到用于PCR的要求。US5912340或后续工作也不必要这样做,因为该专利的主要目标是获得不能相互 结合的互补碱基。该专利也没有专利PCR引物和提供适合PCR的引物。最近,在一些专利文献(美国专利7371580公布于美国2009年11月15日US 2003/0211474A1,提交于2008年5月13日)中描述了将二氨基嘌呤,2-硫代胸苷,肌苷,和 pyrrolopyrimidine运用到一个核苷酸探针中。在这里,被建议的实用性是防止这些探针之 间形成所谓的“交叉结合”,同时仍允许含有这些核苷酸类似物的探针可以和天然的DNA结 合。然而,这项专利中含有很少熔融温度的实验数据,包含很少的熔融温度,也没有提供足 够的如何使用这些系统的指导,同时也没有这些探针在高度多元化组合中的工作示例。如果这是可行的,一个自回避分子识别系统(SAMRS)将会被及其有价值的应用在 多元聚合酶链反应(PCR)中。在这里,以SAMRS核苷酸构建的寡核苷酸将被作为PCR引物, 而不是作为探针。其中一条引物作为正向引物,与被复制的目标寡核苷酸序列互补;另外 一条引物作为反向引物,其序列与被复制的目标寡核苷酸的5'-端某一部分的序列相同。 这样的PCR引物,如果用SAMRS核苷酸来构建,可提供多个(超过一对),甚至是很多很多 对。由于是自回避,他们应该能够支持在一个反应管中同时扩增许多目标底物,并提供了解 决“多元PCR技术的难题”。解决多元PCR技术难题的方案将会是DNA分析化学中的一个“圣杯”。这方面的证 据包括文献中报道了大量的不同研究小组,多次多方尝试,往往用聪明的结构,包括环删除 解决来自引物之间相互结合所产生的“聚合酶链反应混乱” [Bro97]和[Fre07]。另一个例 子是,在并行基因组测序中,为了避免多元PCR扩增的问题,首先将复杂的DNA混合物稀释 成单个的DNA分子,然后分别扩增单个的DNA分。这不是在解决多元PCR的问题,而是在避免这个问题,从而有引起了单分子化学中操作成本等问题。尽管多元PCR的问题众所周知,美国专利7371580没有提到它的核苷酸类似物可 能被用来解决这个问题。实验结果显示(见下文),在上述专利及其相关工作中所提到的很 多部分不能应用于PCR反应中的引物,另外,一个技术工人在不经过大量的实验后,没有办 法将这些系统用在显而易见的实际应用中。本专利的目的就是提供自我避免的核苷酸类似 物以及足量的实验数据来揭示如何使用这个系统,特别该系统应用在PCR技术中,包括多 元PCR,工具包,以及使用该项技术的过程。发明简介本发明确定SAMRS核苷类似物(T*,A*,G*和C*),当分别与天然的腺嘌呤,胸腺嘧 啶,胞嘧啶和鸟嘌呤配对时能够添加双螺旋的稳定性,当分别与A*,T*,G*和C*配对时降低 双螺旋的稳定性,当将SAMRS碱基嵌入一个寡核苷酸类似物的3'-端,该寡核苷酸可以作 为引物用于PCR扩增技术。此外,这项发明提供了一些特定的核苷酸类似物,用于聚合酶链 反应(PCR)的引物中,并提供了实验证据来证明。此外,这项发明也提供了物质成分构成多 元PCR的多元化引物对,并提供了实验证据表明,这些成分可以在足够高的浓度下实现多 元聚合酶链反应。图示的简要说明图1.人工扩展的基因信息系统(AEGIS)。12个核酸碱基根据沃森-克里克的碱 基配对规则形成碱基对。这样就得到了能够被应用到系统生物学中的工具一人工扩展的 基因信息系统(AEGIS)。嘧啶碱基类似物被指定为“py “,嘌呤为“pu “。大写字母分别代 表氢键模式中的受体(A)和供体(D)。因此,胞嘧啶是pyDAA。请注意字母代号Z和P小沟 的阴影代表孤对电子(这些部位可能是一些聚合酶的识别位点),M代表可附加表示集团的 位置。图2. SNAP2架构,动态地以一个模板组装两个引物片段,每个片段包含8个核 苷酸,其中一个片段的3'-端接CH2CHCK在模板DNA 5'-端的那个片段),在模板DNA 3'-端的那个片段5'-端含有氨基。这些片段在动态的平衡条件下,可以通过亚胺键形成 动态可逆的二聚体。亚胺键的形成和断开在水中是可逆的,这种可逆性有利于,与模板完全 互补的、最稳定的二聚体的形成。如果DNA聚合酶能够利用这种复合的引物复制模板DNA, 这种引物的特异性应该是16个碱基引物所具有的特异性(因此在人类基因组中的结合处 是专一的),因为这两个片段的连接必须在模板的邻接部位发生。但是,这种二聚体引物对 不匹配碱基对的排斥性是非常高的,应该含有8个核苷酸的引物所具有的特性。这种结构 (SNAP2)表面上类似于[Stu89], Szybalski, [Szy90],和科特勒等人[Kot93]提出的结构, 其中多个短片段被连接成为一个复合的序列。在这些提案中,个个片段以共价键连接,这种 连接是不可逆转的,因此不具有动态平衡所有的特性和功能。初步的数据请参阅[Lea06]。图3.详细介绍了在图示2中的化学结构。在这里,两个引物片段临时形成一个亚 胺键的连接。初步数据,请参阅[Lea06]图4. 2004年11月13日提交的,美国序列号60/627459和60/627460中提及的, 自回避分子识别系统(SAMRQ中的杂环化合物。这些杂化碱基通过两个氢键形成碱基对, 可以被嵌入PNA或DNA的骨架中,与天然的G,A,C,和T通过两个氢键结合,但不与自身结 合。这使得这些片段的序列与其他片段的序列有正交性。
图5. 2005年11月12日提交的,美国序列号11/271366中提及的,自回避分子识 别系统(SAMRQ中的杂环化合物。图6.在这项工作中尝试过的,因为各种原因被抛弃的,自回避分子识别系统 (SAMRS)中的杂环化合物。5-methylzebularine作为C*与G形成的氢键太弱,同时化学合 成中也有问题。3-methylpyrimidin-2-one作为T*所提供的氢键也不够强。图7.目前首选的自回避分子识别系统(SAMRS)。一个分子识别系统,能够与其序 列互补的天然DNA相互结合,而不与互补的SAMRS序列结合。SAMRS碱基(以星号*表示) 与标准的碱基通过两个氢键互补,而任何两个大小互补的SAMRS碱基之间(最多)只有一 个氢键。请注意,在G*-C*和A*-T*的摆动结构中不具备两个有效的氢键。在开发SAMRS 概念时,非标准碱基在Bermer实验室的设计规则详见[Gey03]。因此,在本图示杂环化合物 所形成的碱基对中,氨基作为氢键给体均有氢键受体,没有碱基对含有一个负电荷,并且没 有碱基对是非芳香性。图8.标准的引物(图8a)和含有SAMRS的引物(图8b)PCR扩增人类基因组中不 同的癌症基因。SAMRS系统中氢键模式实施如下T*是2-硫代胸腺嘧啶;Α*是2-氨基嘌 呤;G*是次黄嘌呤;C*是Ν4-乙烷基胞嘧啶。模板人类基因组DNAQ5ng/25微升),每一 个引物(200nM)。dNTPs(每一种分别为0. 2mM)。SAMRS引物的反应体系中另外增加5mM的 氯化镁。Taq聚合酶1.0单位/0.025毫升。40个PCR循环94°C变性1分钟,然后SAMRS 引物在55°C退火,标准的引物在60°C退火1分钟;然后引物延伸72°C 90秒。3%琼脂糖凝 胶分离产物同时染色显影(其中一个引物5'-放射性标记)。图9.如示例18中所述,用标准的引物(图9a)和含有SAMRS的引物(图9b)同 时PCR扩增五个和十个人类基因组中不同的癌症基因。SAMRS氢键模式如下T*是2-硫代 胸腺嘧啶;Α*是2-氨基嘌呤;G*是次黄嘌呤;C*是Ν4-乙烷基胞嘧啶。模板人类基因组 DNA(25ng/25微升),每一个引物OOOnM)。dNTPs (每一种分别为ImM)。图10.用以下的引物(浓度为500nM)扩增Taq聚合酶的基因SAMRS-21+4-F 5' -TAT CTG CGT GCC CTG TCT CTG * G * A * G * G-3'序列 编号1SAMRS-21+4-R 5' -CCA ATG CCA ACC TCT ACC TCC 女 A 女 G 女 A 女 G—3'序列 编号2SAMRS-17+8-F 5' -TAT CTG CGT GCC CTG TC 女 T 女 C 女 T 女 G 女 G 女 A 女 G 女 G-3'序列编号3SAMRS-17+8-R 5' -CCA ATG CCA ACC TCT AC 女 C 女 T 女 C 女 C 女 A 女 G 女 A 女 G-3'序列编号4一个星号*后面的字母表示目前首选的杂环化合物。引物的3-端故意设计成重 叠;有标准的核苷酸组成的引物没有得到相应的产品,只有引物二聚体(下箭头,41个碱 基)。2%琼脂糖凝胶分离PCR产物,溴化乙锭染色显影。图11.所测试的不同C*的结构和缩写。图12.示例13中,以含有SAMRS组分的寡核苷酸为模板进行引物延伸的数据。图13.示例14中,以含有SAMRS组分的引物进行引物延伸的凝胶显影图示。图14.示例15中,凝胶显影显示聚合酶能够复制含有连续SAMRS组分的模板底物。图15.示例16中的凝胶显影显示聚合酶能够复制含有2-硫代胸腺嘧啶的模板底 物。图16.示例17中的凝胶显影显示DNA聚合酶能够在不同浓度的氯化钾中复制含 有SAMRS组分的模板底物。发明的详细说明在试图构建自回避分子识别系统以支持PCR反应时,有三个问题需要用实验来证 实。首先,在许多PCR技术,尤其是那些没有用“巢式PCR构架”的PCR中[Bro97],PCR引 物的浓度必须比目标底物高很多倍。在过去十年的文献中(美国专利5912340,[Lah08]和 其中的参考文献)描述了将氨基嘌呤、硫代胸苷、乙基化胞嘧啶、肌苷和其它SAMRS成份嵌 入一个单链寡核苷酸中,以防止自我折叠而形成二级结构,这方面的信息并不详尽,因为含 有SAMRS的寡核苷酸片段与含有标准碱基的寡核苷酸具有相同的数量。PCR扩增需要至少 100倍放大,而且大多数最好超过100倍放大,PCR中引物的终浓度最好是100纳摩尔或更 大。在这样的浓度条件下,自我回避系统的可行性需要一系列的实验来证实,最好是显示在 正常的PCR条件下,完全互补的SAMRS引物不能形成引物二聚体。这表现为在示例4中,这 一点已经得到证实。第二,聚合酶必须能够捕获引物和模板的复合物并且能够延伸引物。如果这点被 证明,然后聚合酶必须能够复制扩增的产品。这两点也必须通过实验来确定,众所周知,因 为聚合酶对底物的接受有很强的特异性[Hor95]。文献(如美国专利7371580)中涉及的 结合特性没有实验支持。此外,文献表明非标准SAMRS核苷三磷酸可能作为聚合酶的底物 (见[Lah08]和其中引用的参考文献),这并不意味着含有非标准核苷酸的引物能够被聚合 酶所接受,当然更不能说明包含非标准核苷酸的模板能够被聚合酶接受。示例4(图10)展 示出单元PCR的配方,示例18 (图9)展示了多元PCR。本规范教导我们引物和模板的熔化温度决定了引物和模板复合物可否被聚合酶 扩增。这就提出了第三个问题。那些对天然DNA及其类似物有一些经历的人相信某些通则 (例如,含有2'-甲酯核苷酸的双螺旋比2'-脱氧核苷酸的双螺旋更稳定,RNA:DNA双链 比DNA:DNA双链更稳定)适用于所有杂环系统,并且支持以这些规则为基础的DNA分子的 分子识别。例3表明,在很多情况下这些规则并不适合用于SAMRS核苷酸。本发明在这里讲述,为什么这些问题需要通过实验来解决,为什么以前的专利文 献没有提到的本发明中的声明,并且通过一系列实验,本专利让大家更好的理解和领悟发 明的核心。在前几代的结构被探索之后,本专利在此声明和确定了一组首选的SAMRS系统 (图 4-6)。最初,SAMRS核苷类似物(T*,A*,G*和C*),被设计为与A,T,C和G分别形成两个 互补的氢键,但只有一个氢键分别在假定的碱基对A*:T*和G*:C*中。依据这个原则(图 5)除去G底部的氢键给于集团(一个氨基),则形成G*(正式名称为次黄嘌呤),同样地,丢 弃C顶部的氢键给于集团(也是一个氨基),则形成C* (正式名称为zebularine)。我们最 初丢弃了 T底部氢键的接受集团(一个C = 0单元)形成了 T* ( 一个吡啶2酮的C-苷)。 由于天然的腺嘌呤(A)底部没有参与氢键的集团,我们将2,6_ 二氨基嘌呤顶部的氢键给于 集团(一个氨基)除去,产生A* (是2-氨基嘌呤)。
我们预期,这些T* A,A* T,C* G和G* C碱基对,将有助于稳定双螺旋与A T碱基 对有大致相同的程度,因为它们都含有两个氢键。此外,这些设计均与设计非标准的核苷酸 的规则相兼容[Gey03],其中大量的实验发现,无补偿的羰基氢键单位与双螺旋的稳定性兼 容,但是无补偿的氨基则与双螺旋的稳定性不兼容。合成第一代T*(2-脱氧核苷吡啶2-酮)的路线已经有报道[LanOO] [Woo03] [Sil99]。但2-吡啶-2-酮和腺嘌呤形成的碱基对非常弱。因此,在2-吡啶-2-酮上加入 甲基,利用著名的甲基对双螺旋的稳定效应。A*采用2'脱氧核苷-2-氨基腺嘌呤,它的带 保护集团的Phosphoramidite可以从Glen Research买到。同时A*是唯一的首选杂环结 构其环外官能集团,在合成其phosphoramidite的过程中需要进行保护。苯氧乙酰基被选 为2-氨基腺嘌呤中环外氨基的保护基团。因为,第一代的O(Zebularine)不能承受通常 寡核苷酸去除保护基时的碱性条件。第一代的C*,2 ‘-脱氧核苷-嘧啶-2-酮(即zebularine中的核苷碱基)已有 报道[Viv04]。它的5-甲基衍生物可以从Glen Research买到[SinOl]。肌苷在商业上可 用多种形式,可从适当的腺苷脱氨衍生物成本低廉的合成。也可以以7-deazainosine的形 式获得。大量的实验表明,第一代的SAMRS核苷类似物需要改进,以提供有用的成分。5_甲 基pyrid-2-one与A的配对和5-methylpyrimidin-2-one与G的配对,对双螺旋的稳定性 贡献太小。因此,我们期望修改核苷糖环的骨架以提高PCR引物的亲和力。例如,它是标准的 做法,使用ribosides或2' -Ο-methylribosides提高一个碱基对的稳定性。我们试图这 样做,但是没有达到所需的稳定性。在Pyrimidines的杂环的5位添加炔集团(ftOpynyl), 也可用于增加嘧啶碱基对的稳定性。经过测试一系列含有上述核苷酸衍生物的寡核苷酸序 列,仍未能实现自回避寡核苷酸系统所要求的性能。考虑到zebularine可能与G配对形成 了一个弱碱基对,因为它们之间是“推-推式“的电子系统,我们准备了嘧啶-2-酮的5位 甲氧基衍生物。这也没有给出需要的稳定性,即使有些含有这种C*的寡核苷酸可以作为引 物,并且能够与模板稳定的结合。zebularine杂环的(图11)各种甲基衍生物也未能满足要求。此外,我们发现 zebularine杂环化合物的两种化学不稳定性,包括酸催化d印yrimidinylation和碱催化 Michael加成。这些结果有些出人意料,就在当时,其它的实验室在试图将其纳入寡核苷酸, 以防止他们折叠时,也发现了同样地现象。当以2-硫代胸苷替代5-methylpyrid-2-0ne作为T*时,我们得到了充足的稳 定性。2-硫代胸苷中的硫原子,是众所周知的一个弱氢键受体[Sis05],因此,它不会与 isoguanine的异构体配对。2_硫代胸苷也可能是一个更好的T*,因为它与A的配对比T与 A的配对有更好的稳定性。以zebularine的衍生物作为C*,我们分别测试了 N4-甲基和N4-乙烷基胞嘧啶。 这些碱基早在1987年
已经被嵌入寡核苷酸,并且可以与G配对[Ngu98]。这些相 关文献,特别是含有这些寡核苷酸合成细节的文献,被收集在本专利的参考文献中。这些提 供了目前SAMRS发明中首选的组分(图7)。通过一系列的实验,获得了一系列的SAMRS碱 基的熔化温度。这些数据为研究者提供了一个重要的,使用这个系统的指导标准。
这些规则,顾名思义,具有启发性。在预测SAMRS系统中的一个序列的结合特性有 一定的不精确性,就像预测标准的DNA,标准的RNA,和AEGIS分子识别系统中某个序列的结 核性一样不精确。因此,作为一般规则,如果一个普通技术人员希望设计一个SAMRS序列 与预先选择的标准的DNA结合,并使其Tm为25°C。那么,他们会从预选序列的5'-端到 3'-端方向写下该标准DNA的序列,然后在其下面按照反平行的方向写出SAMRS的序列, 并且遵循T*与A匹配,C*与G匹配,A*与T匹配,G*与C匹配的原则。然后,我们转向目标(b),寻找条件实现含有SAMRS的寡核苷酸能作为引物。实验 发现由两个氢键组成的碱基对的双螺旋不太稳定,通常需要更长的序列来增加双链的稳定 性。例如,实验发现,长度在25个核苷酸的SAMRS寡核苷酸,才能在标准的PCR反应条件下, 被DNA聚合酶有效地延伸。通过实验进一步发现,复合式的引物效果最好。当然,自回避特性只需要应用在引 物的3'-端,如果引物的3'-端没有SAMRS组件,那么在很多引物存在的情况下,一些引 物3'-端的部分片段可能会重叠,这些重叠,在含有三磷酸核苷酸和聚合酶的PCR反应条 件下,会产生引物二聚体。相反地,引物的5'-端不需要SAMRS来避免引物二聚体的形成。因此,基于聚合酶和SAMRS寡核苷酸之间相互作用的几点发现,本发明包括一些 几点(a)聚合酶能够接受只包含SAMRS碱基的寡核苷酸(包括3'-端的第一个碱基 不是SAMRS碱基)作为引物,但是需要至少15个寡核苷酸的长度,最好超过15个核苷酸。(b)DNA聚合酶能够在PCR中使用含有SAMRS碱基的引物,包括N4-乙烷基胞嘧啶, 我们本来预计该碱基因为侧链的缘故在模板要被拒绝,同样地,我们曾预计耐热聚合酶会 拒绝肌苷,因为它是腺苷的脱氨产品。与此相反,PCR扩增不支持上一代的SAMRS组件。(c)即使在引物浓度大于100纳米的情况下,自回避特性依然成立。此外,自回避, 只要在引物的3'-末端嵌入四个到八个SAMRS组分,就可以有效地避免序列互补的引物 形成引物二聚体。在常规的多元PCR中,利用30个含有SAMRS组分的引物,在一个试管内 同时扩增15个目标底物,含有SAMRS组分的引物不需要任何的优化,就可以避免引物之间 3'-末端序列的二聚。(d) SAMRS元件所产生的不丢失,当引物3'末端的第一个碱基为标准的核苷 酸,即使在大量的引物中,一个引物有与其完全互补的引物存在(例4,图10) JfSAMRS 组件嵌入引物群的3'-末端,依然能产生自回避的效果。这样就可以利用商品化的、 CPG(controlled pore glass)上的标准核苷酸开始引物的合成,有利于降低引物合成的费用。(e)展示关键性的熔化温度数据以支持启发式的规则。(f) 一些启发式规则可以从DNA转移到SAMRS系统,而有些则不能。因此,较长 SAMRS寡核苷酸序列比短序列具有较高的Tm值,如例7中,增加核苷酸的长度从18到25 使Tm值从30. 8上升至42. 0°C。同样地,增加盐的浓度(例7)可以增加Tm值。同样地, 以2,6_ 二氨基嘌呤取代2-氨基嘌呤作为A*也可以增加Tm(例8)。提高氯化钾的浓度可 以降低聚合酶遇到模板中SAMRS时的停顿(例17)。但是,将SAMRS系统中碱基的糖环,由 2'-脱氧核糖替换为2'-甲氧基核糖时,一般的启发式规则不使用,因为这样的替换显著 的降低SAMRS碱基与标准碱基的结合稳定性。
(g)接下来的问题是选择合适的聚合酶在PCR中使用SAMRS引物。例如,肌苷是 G*类似物中的首选。然而,很多来自于高温生物体中的耐热聚合酶遇到肌苷时会停顿,因为 肌苷是腺苷的脱氨化产物,可能是为了允许修复这个共同的缺陷。因此,Taq聚合酶是适合 于SAMRS系统的首选聚合酶。此外,实验证明SAMRS寡核苷酸可以被5 ‘-磷酸标签,并且寡核苷酸的5 ‘-端的 OH基团可以被5'-氨基取代(因此在图2所示的体系结构中非常有用)。另外,在5'-末 端也可以进一步的修饰,以包括连上生物素,捕获标签,或荧光标记。最后,对于PCR引物对,这里讲到,这些引物均含有SAMRS组分,在一对引物中的第 一个引物,其序列与目标底物的特定部位的序列完全互补,因此第一个引物与目标底物的 特定部位相结合。第二个引物的序列与同一目标底物上游某段的序列相同(即在底物的 5'-端方向),其中“相同”指的是,第二个引物中的A或A*对应于靶序列中的A,第二个 引物中的T或T*对应于靶序列中的T,第二个引物中的G或G*对应于靶序列中的G,第二 个引物中的C或C*对应于靶序列中的C。这就意味着,第二个引物的核苷酸序列,与第一个 引物以目标底物为模板进行引物延伸所得产物的序列相互互补,同样也意味着,第二个引 物将以第一个引物延伸的产物为底物,进行引物延伸。这就是PCR系统中,任何一对引物序 列与底物中结合序列之间的关系。扩增产物的长度(不包括引物本身所产生的部分)取决于两个引物之间的间距。 实用的扩增产物的长度为10-1000个核苷酸,最好是10到400核苷酸。因此,在目标底物 与第一个引物3'-端结合的核苷酸序列,与目标底物中与第二个引物3'-端有相同序列 的核苷酸片段之间,应该有10到400核苷酸。范例范例1、制备碱基未受保护的硫代胸苷亚磷酰胺(thiothymidine phosphoramidite)05'-氧,4' -二甲氧基三苯甲基)-2'-脱氧-2-硫代胸苷.在2-硫代胸苷的无水吡啶(50毫升)溶液中(Berry & Associates,1. 95克, 7. 55毫摩尔)加入DMTrCl (2. 94克,8. 68毫摩尔)。该混合溶液在室温下搅拌20小时。 用甲醇(10毫升)猝灭反应,同时蒸发除去溶剂。所得的残渣溶于AcOEt,用蒸馏水和盐 水洗涤,有机相用无水硫酸钠干燥后,蒸发以除去大部分的溶剂。残留物用硅胶柱纯化, 使用正己烷(67%)和Ac0Et(33%)作为洗脱液,最终得到了 3. 90克的白色泡沫状目标 化合物(92 % )。匪R(Varian Mercury 300MHzspectrometer) =1H-Wr(CdcI3JOOMHz) 1.45(s,3H) ;2. 25-2. 34 (m, 1H) ;2. 59-2. 67 (m,1H) ;3. 36-3. 41 (dd,1H) ;3. 53-3. 57 (dd, 1H) ;3. 77(s,6H) ;4. 11 (m, 1H) ;4. 60 (m, 1H) ;6. 86(t, 1H) ;6. 81-7. 40 (m, 13H) ;7. 84(s, 1H). 13C-NMR(CDCl3) :12. 3,41. 3,55. 5,63. 2,71. 9,86. 8,87. 2,90. 1,113. 6,116. 7,127. 5, 128. 3,128. 3,130. 3,135. 5,136. 9,144. 5,159. 0,161. 1,174. 3. ESI-TOF (+) MASS :m/ z[M+Na] +calcd for C31H32N206S+Na :583. 1873 ;found :583. 1897.5 ‘ _{氧-[(4,4' -二甲氧基三苯甲基)_2 ‘-脱氧_2_硫代胸 苷]}_3' -[2-cyanoethyl bis(1-methylethyl)phosphoramidite.将上述实验的产物(300毫克,0. M毫摩尔)溶解在无水二氯甲烷(5毫 升)中,在反应体系中加入N,N-diisopropylethylamine(235微升,1. 35毫摩尔)和2-cyanoethyl-N, N-diisopropyIchlorophosphoramidite (181 微升,0· 81 毫摩尔)。该 混合物在室温下搅拌2小时,向混合物中加入AcOEt,用蒸馏水和盐水洗涤,有机相用无 水硫酸钠干燥后,蒸发以除去大部分的溶剂。残留物用硅胶柱纯化,使用正己烷(33%) 和AcOEt(67% )作为洗脱液,最终得到了 348毫克的白色泡沫状目标化合物(85 % )。 NMR (Varian Mercury 3OOMHz spectrometer) 1H-NMR(CDCl3, 300MHz) 1. 04-1. 18(m, 12H) ;1. 40and 1. 42 (each s,3H) ;2. 26-2. 36 (m, 1H) ;2. 42and 2. 63 (each t,2H); 2.62-2. 79 (m, 1H) ;3. 31—3. 88 (m,6H) ; 3. 80(s,6H) ;4. 18 (m, 1H) ;4. 67 (m, 1H) ;6.92 (m, 1H) ;6. 82-7. 42 (m, 13H) ;7. 88and 7. 92 (each s, 1H) ;9. 36 (br s,1H) · 31P-NMR (CDCl3, 121MHz) (ppm,relto external StandardH3PO4 = 0) = 149. 7 ;150. 4. ESI-TOF (+)MASS :m/ z[M+Na]+calcd forC40H49N407PS+Na :783. 2952 ;found :783. 2909.高效液相饩谱法。高效液相色谱法纯化寡核苷酸的过程如下所述。分析型的 高效液相色谱也可用于纯化寡核苷酸。分析型的高效液相色谱法;Waters 600S控制器, Waters 616泵,Waters 486可调谐吸收检测器。制备型的高效液相色谱;Waters PrepLC 系统控制器,Waters PrepLC 4000系统,Waters 486可调谐吸收检测器。反相柱分析型 的HPLC柱Waters Nova-Pak C18(3. 9x 150mm);制备型的HPLC C18 柱Waters Nova-Pak HR C18(7. 8x 300mm)。离子交换柱分析型的离子交换柱 DIONEX DNAPac PA-100 (4x 250mm), 制备型的离子交换柱DIONEX DNAPac PA-100 (9x 250mm)。反相色谱的缓冲溶液,缓冲溶液 A = 25mM TEAA (或25mM醋酸铵),缓冲溶液B=在缓冲溶液A中加入20%的乙腈。离子交 换色谱的缓冲溶液溶液A = 25mM TEAA+200mM氯化钠,溶液B = 25mM TEAA+1M氯化钠。范例2、制备目前首选的SAMRS寡核苷酸亚磷酰胺(phosphoramidite)化学使得合成含有η个碱基的4η个DNA和RNA序 列变得相当容易。因此,没有必要再专利和拥有这些核苷酸序列。类似地,发明的成分是由 亚磷酰胺合成制备,合成的结果不依赖于核苷亚磷酰胺被加入的顺序。在SAMRS组分中有 几个亚磷酰胺可购得。其他包含目前首选SAMRS成分的寡核苷酸已经有文献报道
[Ngu98],制备程序如下2' -Deoxy-5' -dimethoxytritylinosine-3 ‘ -0-(3-cyanoethy 1-diisopropylaminophosphoramidite ( ^ g Glen Research)ΔΜΦ M-^M 度为 0.12摩尔。2' -Deoxy-5 ' -dimethoxytrityl—2-石智代月匈昔 _3 ‘ -0-(3-cyanoethy 1-diisopropylaminophosphoramidite)制备如上所述,溶解于无水乙腈(终浓度为0. 12 摩尔)。2' -Deoxy-5 ‘ -dimethoxytrityl-N4-ethylcytidine-3 ‘ _0_(3-cyanoethyl-d iisopropylaminoph osphoramidite)是从胸苷合成而来,并在无水乙腈溶解(终浓度为 0. 12 摩尔)。最后,2' -deoxy-5‘ -dimethoxytrityl—2-氛基口票吟 _3‘ -0-(3-cyanoeth yl-diisopropylaminophosphoramidite)上的保护集团为N-苯氧乙酰基衍生物(从2' 脱氧核苷-2-氨基嘌呤准备而来,该化合物购自Berry and Associates)溶解于无水乙腈 (终浓度为0. 12摩尔)。这些试剂在瓶中被安装在应用生物系统公司的394DNA合成仪上 (Applied Biosystems 394DNA synthesizer (Foster City,CA)),DNA 合成开始于用可控孔 径的玻璃为固相,3'-端连接的标准的核苷酸。耦合时间分别为10分钟。3%的二氯乙酸 的二氯甲烷溶液用于脱三苯甲基(5' -detritylation)。合成后,产品在室温下有氨水处 理16小时。然后冷冻和冷冻干燥。寡核苷酸用含7M尿素的20%的PAGE纯化。实验发现, M-ethylcytidine中的氮并不需要保护。此外,还发现,高强的脱保护集团的条件会导致副产物产生,其中包括文献中记载的硫磺从2-thioT中脱离。出于这个原因,苯氧乙酰基被用 来保护2-氨基腺嘌呤。用dimethylformamidine来保护2-氨基嘌呤-5' -dimethoxytrit yl-3 ‘ -deoxynucleoside phosphoramidite 也可以,并且可以从 Glen Research 买至丨J0范例3、含有首选的和非首选的SAMRS组份的寡核苷酸的熔融温度。范例3 (a)为了探索以5-methylzebularine作为C*氢键模式的SAMRS系统的熔化温度,合 成一系列的寡核苷酸对,将其中的X和Y以*碱基的类似物替换。双螺旋寡核苷酸的熔化 温度在260纳米处测量,溶液的体积为1毫升,单链寡核苷酸的浓度为3 μ M。图表3.1.泖丨量熔化温度中用到的序列
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=A,序列编号5
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=2-氨基嘌呤,序列编号6
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=T,序列编号7
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=2-硫代胸腺嘧啶,序列编号8
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=G,序列编号9
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=次黄嘌呤,序列编号10
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=C,序列编号11
SAMRS-Tml5-ACCAAGCXATCAAGT-3X=5-methylpyrimidin-2-one,
序列编号12
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=A,序列编号13
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=2-氨基嘌呤,序列编号14
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=T,序列编号15
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=2-硫代胸腺嘧啶,序列编号16
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=G,序列编号17
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=次黄嘌呤,序列编号18
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=C,序列编号19
SAMRS-Tml-C3-TGGTTCGYTAGTTCA--5/Y=5-methylpyrimidin-2-one,
序列编号20这些取代的杂环化合物作为SAMRS组份:A* = 2_氨基嘌呤;Τ* = 2_硫代胸腺嘧 啶;C* = 5-methylpyrimidin-2-one ;G* =次黄嘌呤·图表3. 2.实验测试熔化温度
X\YTΤ*AA*COGG*A55. 556. 843. 746. 545. 143. 546. 749. 8A*54. 552. 046. 845. 548. 144. 045. 846. 8T46. 348. 054. 052. 544. 645. 048. 446. 权利要求
1.通过酶进行模板导向的引物聚合反应,来扩增寡核苷酸的一种过程,所述过程包括 (a)在水溶液中,一个或多个寡核苷酸引物与上文所说的寡核苷酸、聚合酶、标准的核苷三 磷酸的相互作用,以及(b)在预选的时间长度内培养上述的混合物,其中每个寡核苷酸引 物具有如下的形式(O-oligonucleotide),氨基(-NH2)、和与一个磷酸盐或氨基链接的生物素或荧光标记集 团,B是独立选自腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶、二氨基嘌呤、尿嘧啶、A*、T*、G*、和C*, D是独立选自一个集团包括A*、T*、G*、和C*,E是独立选自一个集团包括A、T、G、和C,K是 独立选自一个集团包括々、1\6、(^*、1^、6*、和C*,其中η是一个从4至25的整数,m是一 个从2到10的整数,一对引物中第一个引物的序列与被扩增的寡核苷酸中某一部分的序列 互补,一对引物中第二个引物的序列,与同样的被扩增的寡核苷酸5'-端,距离第一个引 物结合部位10到1000处之间的某部位的核苷酸的序列相同,其中A*与胸腺嘧啶配对时, 能够增加双螺旋的稳定性,但是,与T*配对不能增加双螺旋的稳定性,T*与腺嘌呤配对能 够增加双螺旋的稳定性,但是,与A*配对则不能增加稳定性,同样地,G*与C*配对不能增 加双螺旋的稳定性,但是当它与胞嘧啶配对时,能够增加双螺旋的稳定性,C*与G*配对不 能增加双螺旋的的稳定性,但是当它与鸟嘌呤配对时,则能够增加双螺旋的稳定性。
2.根据权利要求1所述的过程中A*是选自集团包括2-氨基嘌呤和2,6-二氨基嘌呤。
3.根据权利要求1所述的过程中T*是选自集团包括2-硫代胸腺嘧啶和2-硫代尿嘧啶。
4.根据权利要求1所述的过程中G*是次黄嘌呤。
5.根据权利要求1所述的过程中C*是选自集团包括N4-乙烷基胞嘧啶和N4-甲基胞 嘧啶。
6.根据权利要求1所述的过程中,在引物中m和η的总数至少为15。
7.根据权利要求1所述的过程中,D部分被独立地选自集团包括T*、A*、G*和C*。
8.根据权利要求1所述的过程中,B部分被独立地选自集团包括腺嘌呤、胸腺嘧啶、鸟 嘌呤、胞嘧啶。
9.根据权利要求1所述的过程中,Α*被选自集团包括2-氨基嘌呤和2,6-二氨基嘌呤。
10.根据权利要求1所述的过程中,Τ*被选自集团包括2-硫代胸腺嘧啶和2-硫代尿嘧啶。
11.根据权利要求1所述的过程中G*是次黄嘌呤。
12.根据权利要求1所述的过程中C*是选自集团包括N4-乙烷基胞嘧啶和N4-甲基胞 嘧啶。
13.根据权利要求1所述的过程中,有至少5个引物对被接触。
14.一个化合物具有如下的形式
15. 一个物质的组成,包含一个多数的寡核苷酸对,每个寡核苷酸具有如下的形式
16.根据权利要求15所述构成中至少有一个B或一个D是选自集团包括N4-乙烷基胞 嘧啶和N4-甲基胞嘧啶。
17.根据权利要求15所述构成中的寡核苷酸可以溶解于水中,浓度在100纳摩尔或更尚ο
全文摘要
本发明涉及自回避分子识别系统(SAMRS),一种像DNA的分子,可以与其互补序列的天然DNA依照沃森-克里克规则结合,一但结合,便可以作为聚合酶延伸的引物,同时也可以在聚合酶链反应中作为反向引物延伸的模板,但是,含有SAMRS组份的寡核苷酸类似物不与其序列互补的含有SAMRS组件的寡核苷酸结合。经过大量的实验,我们揭示了SAMRS组件在寡核苷酸中的这些特性,SAMRS组件在引物中最合适的位置,以及一些关键的生物物理数据以支持启发式规则,以设计能够用于引物延伸和PCR反应中,含有SAMRS组件的寡核苷酸序列。我们也披露了含有这些成分的、可以被用于工具箱(kits)的一些寡核苷酸,和在PCR扩增目标寡核苷酸中使用这些成分的流程。
文档编号C12P19/34GK102124020SQ200980132866
公开日2011年7月13日 申请日期2009年8月19日 优先权日2008年8月20日
发明者史蒂文·埃尔伯特·奔纳, 星加周一, 陈非 申请人:史蒂文·埃尔伯特·奔纳, 星加周一, 陈非
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1