分子内核酸重排的组合物和方法

文档序号:392557阅读:272来源:国知局
专利名称:分子内核酸重排的组合物和方法
分子内核酸重排的组合物和方法
背景技术
我们已经描述了标记片段化基因组群体内各成员,然后将它们混合在一起产生能作为混合物进行加工和最终测序的‘群体文库’的方法。群体标签使得分析软件能够将序列读数解析到归为该群体中特定基因组的文件内。总体方法的一个限制源于已有DNA测序技术的局限。具体说,如果基因组的感兴趣区域中的片段比具体技术的可测序长度长,则无法完全分析这类片段(因为测序从片段的一端向内进行)。而且,任何片段化依赖性测序技术的缺点是可能无法将特定基因组区域的一部分中的序列改变与同一基因组(例如同一染色体)的其它部分的序列改变相关联,因为序列改变位于不同片段上。(参见图5和其说明)。本发明消除了现有测序技术造成的限制,并可用于多种其它核酸分析。

发明内容
本发明的诸多方面涉及相对于多核苷酸结构域将该多核苷酸中的感兴趣区域从第一位置移动到第二位置的方法,也称为“反射法”(或反射方法、反射序列法、反射反应等)。在某些实施方式中,所述反射法导致感兴趣区域移动到与该多核苷酸内特定结构域元件(如引物位点和/或MID)功能性相邻。还提供可用于实施本文所述反射法的组合物、试剂盒和系统。附图简要说明结合附图,通过以下详述更好地理解本发明。需要强调,按照惯例,附图的各个特征不成比例。事实上,各种特征的尺寸被任意放大或者缩小以清楚显示。附图包括以下图 1-13

图1 图A的示意图说明用反射序列将第一结构域从核酸分子中的一个位点移动到另一个位点。图B的示意图说明可用于本文所述反射方法的诸多方面的引物对(An^n引物)的相对位置。图2显示采用结合对(生物素/链霉亲和素)分离感兴趣的单链多核苷酸的示范性实施方式。图3的示意图说明将引物位点和MID移动到感兴趣核酸中的具体位置的示范性实施方式。图4显示的示意图说明反射法用于产生富含具有感兴趣区域的片段(例如,从随机片段化和不对称标记的多核苷酸群体富集)的样品的示范性用途。图5显示鉴定样品中同源核酸(例如,衍生自二倍体细胞的染色体对或病毒基因组/转录物的同一区域)的核酸多态性的方法比较。上方示意图显示样品中的两种核酸分子(1和2)在多态性位点A、B和C处有不同多态性分配(A1、B1、C1和C2)。利用片段化进行的标准测序方法(左侧)可鉴定这些核酸中的多态性,但不保留连接信息。利用本文所述的反射方法鉴定多态性(右侧)能保留连接信息。图6 图A示意显示反射法中核酸物质的预计结构和大小;图B是聚丙烯酰胺凝胶,显示实施例1所述反射法产生的核酸物质。图7 图A示意显示反射法所用的核酸和竞争剂的结构;图B是聚丙烯酰胺凝胶, 显示实施例1所述反射法产生的核酸物质。图8显示反射法流程图(左图),其中T7外切核酸酶步骤是任选的。右侧凝胶显示没有T7外切核酸酶步骤(泳道1)或有T7外切核酸酶步骤(泳道2、时反射法所得的产物。图9显示示范性反射法流程,右侧指出何时纯化反应产物(例如,采用Agencourt 珠去除引物寡核苷酸)。图10显示原料(左图)和采用反射法而不使用T7外切核酸酶步骤获得的产物 (右图)(如实施例II所述)。原料中的反射位点是通常存在于所加工的多核苷酸中的序列(也称为“非人工”反射位点)。此图显示,755碱基对原料核酸被加工成预计的461碱基对产物,从而确认“非人工”反射位点能有效地将衔接子结构域以序列特异性方式从感兴趣多核苷酸中的一个位置转移到另一个位置。图11显示实验示意图和结果,该实验在单一较大初始模板(“亲本”片段)上进行反射法以产生各自具有不同感兴趣区域的五种不同产物(“子代”产物)(即产生的各子代产物具有区域1、2、3、4或5)。图12显示实验示意图和结果,该实验用于确定反射法(正如所需)期间的分子内重排相对分子间重排(MID交换)的普遍性。图13显示制备反射法所用材料和进行反射法的示范性流程图。定义除非另外定义,本文中使用的所有技术和科学术语具有本发明所属领域普通技术人员通常所理解的同样含义。但为了清楚和易于理解,仍然定义了某些要素。本文所用的核酸化学、生物化学、遗传学和分子生物学的术语和符号遵循本领域的标准论述和文本中的术语和符合,例如Kornberg和Baker,DNA Replication (《DNA 复制》),第二版(W. H.弗里曼出版社(W. H. Freeman),纽约,1992) ;Lehninger, Biochemistry (《生物化学》),第二版(沃斯出版社(Worth Publishers),纽约,1975); Strachan和Read,Human Molecular Genetics (《人类分子遗传学》),第二版(WL出版社 (Wiley-Liss), M 1999) ;Eckstein 1 , Oligonucleotides andanalogs :A Practical Approach (《寡核苷酸和类似物实践方法》)(牛津大学出版社(Oxford University Press),纽约,1991) ;Gait 编,Oligonucleotide Synthesis :A Practical Approach (《寡核苷酸合成实践方法》)(IRL出版社,牛津,1984);等。“扩增子”指多核苷酸扩增反应产物。即,它是从一个或多个引发序列复制的, 通常是双链的多核苷酸群体。所述一个或多个引发序列可以是相同序列的一个或多个拷贝,或者可以是不同序列的混合物。扩增子可通过各种扩增反应产生,所述反应的产物是一种或多种核酸的多个复制体。通常,产生扩增子的扩增反应是“模板驱动的”,因为反应物(核苷酸或寡核苷酸)的碱基配对要求模板多核苷酸中存在产生反应产物所需的互补物。一方面,模板驱动的反应是用核酸聚合酶进行引物延伸或者用核酸连接酶进行寡核苷酸连接。这类反应包括但不限于聚合酶链反应(PCR)、线型聚合酶反应、基于核酸序列的扩增(NASBA)、滚环扩增等,参见通过引用全文纳入本文的下述文献=Mullis页
等,美国专利 4,683,195 ;4,965,188 ;4,683,202 ;4,800,159 (PCR) ;Gelfand 等,美国专利 5,210, 015(用 “TAQMAN ” 探针进行实时 PCR) ;Wittwer 等,美国专利 6,174,670 ;Kacian 等,美国专利5,399,491( “NASBA,,) ;Lizardi,美国专利5,854,033 ;Aono等,日本专利公开JP 4-262799(滚环扩增);等。一方面,本发明扩增子通过PCR产生。如果有能够随着扩增反应进行测定反应产物的检测化学,那么扩增反应可以是“实时”扩增,例如下述的“实时 PCR”,或如 Leone 等,Nucleic Acids Research,26 :2150-2155 (1998)等文献所述的“实时NASBA”。本文所用术语“扩增”指进行扩增反应。“反应混合物”指含有进行反应所需的所有反应物的溶液,其可包括但不限于,在反应期间将PH维持在所选水平的缓冲剂、盐、辅因子、清除剂等。术语“评估”包括任何测量形式,并包括确定某要素存在与否。术语“测定”、“测量”、“评价”、“评估”、“测试”可互换使用,包括定性和定量测定。评估可以是相对的或绝对的。“评估...的存在”包括确定存在物质的量和/或确定该物质是否存在。本文所用术语 “测定”、“测量”和“评估”和“测试”可互换使用,包括定性和定量测定。“不对称标记的”多核苷酸的左侧和右侧衔接子结构域不同。这一方法总地称为不对称地连接衔接子或不对称地标记多核苷酸,如多核苷酸片段。可通过任何方便的方式产生具有不对称衔接子末端的多核苷酸。示范性不对称衔接子可参见美国专利5,712,126 和 6,372,434 ;美国专利公开 2007/01286 和 2007/0172839 ;和PCT 公开W0/2009/032167 ; 所有文献通过引用全文纳入本文。在某些实施方式中,所用的不对称衔接子可参见2009年 4月四日提交的美国专利申请序列号12/432,080,通过引用全文纳入本文。例如,本发明使用者可使用不对称衔接子来标记多核苷酸。“不对称衔接子”是连接于双链核酸片段的两端时,导致产生侧接感兴趣基因组插入物的序列不同的引物延伸或扩增产物的衔接子。连接通常后接后续加工步骤,以便产生不相同的末端衔接子序列。例如,复制不对称衔接子连接片段产生在末端衔接子序列之间至少有一个核酸序列差异或核苷酸/核苷修饰的多核苷酸产物。将衔接子不对称地连接于多核苷酸(如多核苷酸片段) 产生的多核苷酸在一端具有的一个或多个衔接子序列(例如,一个或多个区域或结构域, 如引物位点)不存在于另一端或与另一端的衔接子序列相比具有不同核酸序列。需要注意,称为“不对称衔接子”的衔接子不一定是自身结构不对称,也不是仅通过将不对称衔接子连接于多核苷酸片段的行动立即使其不对称。而是说,各末端具有相同不对称衔接子的连有不对称衔接子的多核苷酸产生的复制产物(或分离的单链多核苷酸)相对于另一端的衔接子序列是不对称的(例如,至少一轮扩增/引物延伸后)。任何方便的不对称衔接子或不对称连接衔接子的方法均可用于实施本发明。示范性不对称衔接子可参见美国专利5,712,126和6,372,434 ;美国专利公开2007/0128624 和2007/017^39 ;和PCT公开W0/2009/032167 ;所有文献通过引用全文纳入本文。在某些实施方式中,所用的不对称衔接子可参见2009年4月四日提交的美国专利申请序列号 12/432,080,通过引用全文纳入本文。“互补”或“基本上互补”指在核苷酸或核酸之间,例如在双链DNA分子的两条链之间或在寡核苷酸引物和单链核酸上的引物位点之间杂交或碱基配对或形成双链体。互补核苷酸通常是A和T (或A和U),或C和G。参考合适核苷酸插入或缺失进行最优比对和比较时,一条链的核苷酸与另一条链的核苷酸的至少约80 %,通常至少约90 %至95 %,更优选约98至100%配对时,称这两个单链RNA或DNA分子基本上互补。或者,RNA或DNA链在所选杂交条件下与其互补物杂交时,存在基本互补性。通常,在至少14至25个核苷酸的臂上至少约65%互补,优选至少约75%,更优选至少约90%互补时,出现选择性杂交。参见 M. Kanehisa Nucleic Acids Res. 12 :203 (1984),通过引用纳入本文。“双链体”指完全或部分互补的至少两个寡核苷酸和/或多核苷酸在所有或大部分核苷酸上发生沃森克里克型碱基配对,以形成稳定复合物。术语“退火”和“杂交”可互换使用,指形成稳定双链体。提到双链体时,“完美匹配”指构成双链体的多聚核苷酸链或寡核苷酸链相互形成双链结构,以使每条链中的每个核苷酸与另一条链的核苷酸发生沃森克里克碱基配对。稳定的双链体可包括双链体的两条链之间形成沃森克里克碱基配对和/或非沃森克里克碱基配对(其中碱基配对指形成氢键)。在某些实施方式中,非沃森克里克碱基配对包括核苷类似物,如脱氧次黄苷、2,6-二氨基嘌呤、PNA、LNA等。在某些实施方式中, 非沃森克里克碱基配对包括“摆动碱基(wobble base)”,如脱氧次黄苷、8-氧代-dA、8_氧代-dG等,其中“摆动碱基”所指核酸碱基可与互补核酸链中的第一种核苷酸碱基发生碱基配对,但用作核酸合成的模板链时导致将第二种不同核苷酸碱基掺入合成链(下文进一步详述摆动碱基)。两个寡核苷酸或多核苷酸间双链体中的"错配"指双链体中一对核苷酸不能发生沃森克里克结合。提到基因组或靶多核苷酸时,“遗传基因座”、“基因座”或"感兴趣基因座"指基因组或靶多核苷酸的毗连亚区或区段。本文所用的遗传基因座、基因座或感兴趣基因座可指核苷酸、基因或基因的一部分在基因组,包括线粒体DNA或其它非染色体DNA(如细菌质粒)中的位置,或者可以指基因组序列的任何毗连部分,无论它是否在基因内或与基因相关联。遗传基因座、基因座或感兴趣基因座可能是一个核苷酸至长度是几百个或几千个核苷酸或更长的区段。通常,感兴趣基因座具有相关联的参比序列(参见下文中有关“参比序列”的说明)。“试剂盒”指用于提供实施本发明方法所用材料或试剂的任何供给系统。在反应实验的情况下,这种供给系统包括能够储存、运输或从一个位置向另一个位置提供反应试剂(例如,合适容器中的探针、酶等)和/或支持材料(例如,缓冲液、进行实验的书面说明等)的供给系统。例如,试剂盒包括含有相关反应试剂和/或支持材料的一种或多种容器 (如盒)。可将这些内容物一起或单独地提供给预期接受者。例如,第一容器可含有用于实验的酶,而第二容器含有探针。“连接"指在两个或多个核酸,如寡核苷酸和/或多核苷酸的末端之间,以模板驱动反应形成共价键或连接。这种键或连接的性质可能迥然不同,该连接可通过酶促或化学方法进行。本文所用的连接通常用酶促方法实现,在一个寡核苷酸的末端核苷酸的5’碳与另一个寡核苷酸的3’碳之间形成磷酸二酯键。下述文献中描述了各种模板驱动的连接反应,通过引用全文纳入本文=Whiteley等,美国专利4,883,750 ;Letsinger等,美国专利 5, 476, 930 ;Fung 等,美国专利 5,593,826 ;Kool,美国专利 5,426,180 ;Landegren 等,美国专利 5,871,921 ;Xu 和 Kool,Nucleic Acids Research, 27 :875-881(1999) ;Higgins 等, Methods in Enzymology, 68 :50-71(1979) ;Engler 等,The Enzymes,15 :3-29(1982);禾口 Namsaraev,美国专利
发明者A·斯拉特, R·奥斯本, S·布伦那, 吉米卡瓦 申请人:群体遗传学科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1