用于高通量亚硫酸氢盐dna-测序的方法和组合物及其用途的制作方法

文档序号:529937阅读:422来源:国知局

专利名称::用于高通量亚硫酸氢盐dna-测序的方法和组合物及其用途的制作方法用于高通量亚硫酸氢盐DNA-测序的方法和组合物及其用途与相关申请的交叉引用本申请要求基于2007年8月15日申请的美国临时专利申请序列号60/935,472和2007年9月5日申请的60/935,867的优先权。上述临时申请的全部内容通过引用结合到本文中。本公开的
技术领域
和摘要本发明涉及生产适用于化学修饰和高通量DNA测序的DNA模板的新颖方法和组合物。本发明的一种方法涉及DNA接头设计,其中组分胞嘧啶被5-甲基胞嘧啶取代,使所得接头对亚硫酸氢盐介导的脱氨作用具有抗性。当所述接头与双链DNA模板连接时,后续DNA变性和亚硫酸氢盐处理将模板DNA胞嘧啶差异脱氨形成尿嘧啶,而所连接接头的5-甲基胞嘧啶对这一化学转化具有抗性使得接头序列保持不变。因此可使用与未改变接头序列杂交的单一引物组扩增经亚硫酸氢盐处理的DNA两条链。本发明也涉及生产具确定甲基化组成的对照模板以优化适用于亚硫酸氢盐反应条件的方法。在一个优选的实施方案中,本发明可用于生产适于使用传统的SoleXaTM、S0LiDTM或454-型DNA测序平台进行全基因组亚硫酸氢盐-DNA测序以研究DNA甲基化的模板。
背景技术
:外遗调控(印igeneticregulation)的一个主要机制涉及DNA甲基化,藉此S-腺苷-甲硫氨酸的甲基被酶催化转移至胞嘧啶的5-碳位上得到5-甲基胞嘧啶(综述Caiafa和Zampiere,2005;Novik等,2002;Bird,2002;Costello和Plass,2001;Laird和Jaenisch,1996)。在人类中,绝大多数的胞嘧啶甲基化发生在CpG岛的CpG二核苷酸、G+C等容线和CpG热点上,但是位于CpNG、CC(a/t)GGXpA和CpT序列中的胞嘧啶也可被低频率甲基化(Lorincz和Groudine,2001;Woodcock等,1997;Clark等,1995)。调控区的CpG二核苷酸胞嘧啶甲基化促成基因沉默例如在X-染色体活化中并经常在癌症的肿瘤抑制基因沉默中发挥重要作用。已报导了致癌作用各种阶段以及许多其他疾病中不同基因组区域的低甲基化和超甲基化(综述Jones和Baylin,2007;Brena和Costello,2007;Esteller,2007;Rodenhiser和Mann,2006;Laird和Jaenisch,1996)。因此,需要表征被定义为基因组甲基化状态的“甲基化组(methylome)”的方法,以阐明可导致发现药物、药物作用靶或可用的疾病生物标记的调控网络。已研发了各种方法用于以不断增大的分辨率分析胞嘧啶甲基化以阐明调控网络并用于鉴定疾病的生物标记。用于测定胞嘧啶甲基化的最早方法是基于色谱法(Hotchkiss,1948)但是其分辨率低,因为这一技术和其他相关技术只能观察到DNA中的整体甲基化变化。可分析甲基胞嘧啶分布更准确变化的分辨率提高的后续方法利用甲基-敏感性限制性核酸内切酶或亲和色谱法(Zhang等,2006;Cross等,1994)。胞嘧啶化学修饰偶联DNA测序仍然是外遗研究中以单个核苷酸分辨率检测5-甲基胞嘧啶的精选方法,即所谓“黄金标准”。“亚硫酸氢盐-DNA测序”化学的发展使得能够对胞嘧啶甲基化进行直接阳性检测。亚硫酸氢盐-DNA测序法来自20世纪70年代描述的化学,通过该方法亚硫酸氢钠催化胞嘧啶有效脱氨得到尿嘧啶(Shapiro等,1973;Shapiro等,1970;Hayatsu等,1970),其功能上等价于在测序和DNA扩增反应中的胸腺嘧啶。根据反应条件,5-甲基胞嘧啶脱氨形成胸腺嘧啶的速率可比胞嘧啶转化为尿嘧啶的速率慢大约两个数量级(Haystsu和Shiragami,1979;Wang等,1980)。Frommer等(1992)利用甲基胞嘧啶和胞嘧啶之间的选择性化学差异以及聚合酶链式反应(PCR),来提供位于单个DNA链上5-甲基胞嘧啶的阳性展示。从这一最初的报告和其他报告开始,亚硫酸氢盐-DNA测序法迅速成为并且仍然是用于在单核苷酸水平分辨率上研究靶基因座中胞嘧啶甲基化的精选方法(Ehrich等,2007;Grunau等,2001;Eads等,2000;Paulin等,1998;Clark等,1994;Raizis等,1995;Feil等,1994;Frommer等,1992)。近些年来尝试采用大规模全基因组DNA甲基化检测的方法。这些尝试的第一个为“限制性标记基因组扫描”,其中通过连续分级分离用甲基-敏感性限制酶消化的末端标记DNA检测差异DNA甲基化(Hatada等,1991)。这一方法受到可获得性和基因组中限制性酶切位点分布的限制并且分辨率低。Olek等,(1998)(美国专利第6,214,556号)描述了另一种方法,藉此经亚硫酸氢盐处理的DNA与通过使用PCR的选择性完整基因组DNA扩增偶联。通过引物延伸测定检测被扩增的产物以得到可用于评价细胞甲基化状态的复杂DNA甲基化指纹图谱。所进行的引物延伸测定的数量指明这一方法的分辨率和基因组覆盖范围。另一策略是基于使用抗_甲基胞嘧啶抗体或甲基-CpG结合蛋白的甲基化DNA片段亲和层析(Zhang等,2006;Cross等,1994)。甲基化拟南芥DNA的免疫沉淀和亲和色谱法与被捕获标记产物和基因组寡核苷酸嵌合芯片(tilingarray)杂交相偶联已产生了第一个全基因组甲基化图谱(Zhang等,2006)。所得甲基化图谱具有35-碱基分辨率,对应于嵌合芯片上寡核苷酸的长度。使用低分辨率阵列在人类癌细胞系上进行的相似研究已揭示大量的差异甲基化基因(Keshet等,2006;Weber等,2005)。尽管可用于全基因组扫描,但是这一方法受到阵列分辨率和在其可被亲和纯化捕获前DNA片段上甲基-CpG的最低阈值浓度的限制。因此,需要相对大量的原料,因此排除了其在许多临床应用中的用途。在本领域中明显需要只需更少量的原料并且在单个核苷酸水平上具有更高分辨率的更敏感的检测方法。直到最近,技术难题一直阻碍亚硫酸氢盐-DNA测序法在全基因组范围作图绘制甲基化变化的应用。在原理性试验的小规模验证中,Meissner等(2005)证实了使用亚硫酸氢盐-DNA测序法以单核苷酸分辨率作图绘制基因组DNA文库插入物5-甲基胞嘧啶的实际可行性。用亚硫酸氢盐处理大小经过选择的随机片段化基因组DNA片段(装有接头),经PCR扩增并克隆至用于测序的载体中。所得序列数据显示胞嘧啶至尿嘧啶的转化率大于99.9%,表明基因组文库插入物的随机鸟枪法亚硫酸氢盐-DNA测序可应用于全基因组范围。然而,这一方法的用途是有限的,主要受到高成本和传统桑格双脱氧测序法低通量的限制。因此,本领域仍然存在对较低成本和更高通量的经改进的亚硫酸氢盐-DNA测序法的需要。下一代大规模并行DNA测序技术提供了高出若干个数量级的通量并且成本降低,但是这些平台仍然不适用于亚硫酸氢盐-DNA测序,做不到低成本全基因组地研究DNA甲基化。目前有三种市售的用于高通量DNA测序的系统基因组测序仪(TheGenomeSequencerFLX)系统(通常称作454_测序仪)(RocheDiagnostics,Indianapolis,IN);Solexa(Illumina,SanDiego,CA);和SOLiD系统(AppliedBioSystems,FosterCity,CA)。454-技术基于传统的焦磷酸测序化学,其在经克隆扩增的DNA模板上进行,这些模板在单个装载至高密度光学板刻蚀孔的微珠上(Margulies等,2005)。各次碱基延伸生成的信号被精密的光学纤维捕获。Solexa测序模板被固定至专有流动池表面,在那里它们被原位克隆扩增以形成密度高达一千万集簇每平方厘米的分离的序列模板集簇。使用引物介导的DNA合成以分步方式在四种专有的经修饰核苷酸(具有可逆3'双-脱氧核苷酸部分和可裂解的荧光生色团(chromofIuor))存在下进行Solexa测序。在各延伸循环之前化学移除3‘双-脱氧核苷酸部分和荧光生色团用于连续的碱基判定(basecalling)。来自各模板集簇的分步式核苷酸添加循环由激光激发检测,之后进行成像从而完成碱基判定。用于大规模并行DNA测序的AppliedBiosystems'SOLiD方法是基于连续的DNA连接循环,这是由哈佛大学GeorgeChurch创新的策略(Shendure等,2005)。通过这一方法,在微珠上克隆扩增固定化DNA模板(乳滴PCR),这些微珠以高密度置于玻璃流动池的表面。通过短的确定的标记探针连接至与固定化模板杂交的一系列引物的连续循环完成序列测定。这些新仪器每次运行的通量可超过数十亿碱基判定,是目前基于96-道毛细管电泳测序仪器的约一万五千或更多倍。因此,仍然存在对使亚硫酸氢盐-DNA测序化学适应454-,Solexa或SOLiD测序平台以便低成本全基因组地研究DNA甲基化的方法和组合物的需要。在他们的初步研究中,Meissner等(2005)提出新一代454-DNA测序仪可提供经济的解决方案以使亚硫酸氢盐-DNA测序的全基因组应用得以进行,但是他们没有讨论关键问题也没有公开任何付诸实施的方法。更重要的是,研究者没有认识到将他们的方法应用至Solexa或SOLiD平台(典型的序列读取长度仅为35_50个碱基)的巨大困难。本发明提供这些和其他实质性益处。发明详述本发明提供在下一代DNA测序仪中使用的用于亚硫酸氢盐-DNA测序的新颖改进方法和可用组合物,以使大规模高通量全基因组研究胞嘧啶甲基化类型的改变得以实现并用于其它优选的应用。Meissner等(2005)的先导研究描述了亚硫酸氢盐-DNA测序方法,通过该方法首先将短DNA接头与多个大小经选择的随机片段化基因组DNA片段的各个末端相连接。将与接头连接的DNA变性,得到对亚硫酸氢盐处理敏感的单链形式,其中原有(resident)胞嘧啶转化成尿嘧啶但是5-甲基胞嘧啶不发生改变。使用接头区的引物将已转化的DNA扩增重新生成DNA链并产生足够质量的经亚硫酸氢盐转化的DNA产物用于有效克隆至用于通过传统毛细管电泳进行测序分析的载体中。该研究显示该方法提供待测基因组DNA的无偏倚表现并且具有大规模应用的可行性。然而,Meissner等的亚硫酸氢盐处理靶DNA的重要后果是已连接接头中的所有胞嘧啶也被转化成尿嘧啶。因此,为了进行DNA扩增,将PCR引物设计成不与接头序列杂交而是设计成与经亚硫酸氢盐转化的接头序列杂交,这一策略是被称作“甲基化-特异PCR"方法的基础(Cottrell,2004;Li和Dahlya(2002);Herman和8对1^1(1997)(美国专利第6,017,704号);Herman等,1996)。适用于扩增亚硫酸氢盐处理样品的本领域已知的其他适当PCR引物设计包括使用可从亚硫酸氢盐修饰位点扩增DNA的简并引物或使用靶向DNA无胞嘧啶区域的DNA的非常短的引物(Olek等,1998美国专利第6,214,556号)。如本领域所述的甲基化-特异PCR对引物设计的限制与现有ABISOLiD或IlluminaSolexa高通量测序平台的使用不相容。这些平台必须使用紧邻样品DNA插入物之后的经优化并经验证的专有接头序列。这些专有接头的功能为介导DNA测序模板的克隆固相扩增和测序引物的结合。Solexa和SOLiD测序仪的阅读长度仅为35个碱基(在2008年末延伸至50个碱基或以上)。位于专有接头和DNA插入物之间的外来序列例如甲基化-特异PCR所要求的那些将样品DNA本已较短的阅读长度降低至不可接受的水平。结果,如其所述目前的Solexa和SOLiD平台不能测序甲基化-特异PCR法生成的产物(Meissner等,2006;Cottrell,2004;Li和Dahlya,2002;Herman和Baylin,1997,美国专利第6,017,704号;Herman等,1996)。尽管可能形式上生成其中经亚硫酸氢盐转化的接头序列可介导固相载体上克隆扩增的接头设计和结合至Solexa和SOLiD平台的测序引物,但是技术和经济上的难题是难以克服的。在接头上将胞嘧啶亚硫酸氢盐转化成尿嘧啶将有效减少遗传密码至仅三个碱基,因此严重限制了可有效并特异性用于平台所需固相扩增和高通量DNA测序的特异引物的设计。此外,亚硫酸氢盐转化使得接头的两条链不互补,因此需要生产和验证另一组用于其它样品DNA链的固相扩增引物和测序引物。已消耗了大量的公司经费、时间和资源研发并验证SOLiD和Solexa测序平台的现有接头和引物设计;对市场上现有产品的主要设计改变将产生不可接受的财务负担。454-测序仪的读取长度为数百个碱基并且在样品DNA模板中加入甲基化-特异PCR引物将减少读取长度。然而,去除454-模板中的外来序列将增加该平台的效率。本发明提供将现有基于SOLiD、SoIexa或454-的DNA测序平台适用于测序亚硫酸氢盐处理的DNA样品以研究DNA甲基化的新颖、简便、有效并且低成本的方法。本发明的一方面创造了新颖的接头组合物,其中组分胞嘧啶被5-甲基胞嘧啶取代使得所述接头对所结合模板DNA的亚硫酸氢盐处理过程中的脱氨作用具有抗性。当本发明接头与模板DNA连接时,DNA变性并且亚硫酸氢盐处理将模板DNA胞嘧啶转化成尿嘧啶,接头序列保持不变。因此可使用与原来未改变的接头序列互补的单个引物组扩增经亚硫酸氢盐处理的DNA两条链。相反,传统接头的胞嘧啶经亚硫酸氢盐处理转化成尿嘧啶使得必须使用与经亚硫酸氢盐转化的接头序列杂交的PCR引物扩增经亚硫酸氢盐处理的模板。亚硫酸氢盐处理也使得两个DNA模板链不互补。亚硫酸氢盐处理也使传统接头的两条链不互补,致使需要分离的引物组来扩增各DNA链。本发明的接头组合物不存在这一问题,两个接头链保持互补并且单一引物组足以扩增经亚硫酸氢盐处理的两条链用于制备在SoleXa、S0LiD或454-测序平台上测序的模板。这些已建立的平台采用本发明预期引起很少或没有材料消耗,因为这些平台的专有接头的一级序列没有改变,因此,所有的下游操作例如固相DNA扩增和测序引物结合均不受影响。在优选的实施方案中,本发明的一方面可用于生产试剂盒或试剂盒组件,用于制备在S0LiD、SoleXa、454-或其他测序平台上高通量亚硫酸氢盐-DNA测序以进行甲基化研究的DNA模板。试剂盒组件与传统测序供应商提供的那些基本相同,除了简单并低成本地在接头中用5-甲基胞嘧啶替换胞嘧啶。通常,一个接头包括两个短的互补DNA寡核苷酸链,其包含天然的或使用本领域已知的合成路径通过化学或酶辅助合成生产的经修饰的寡核苷酸(综述=Verma和Eckstein,1998;Goodchild,1990)。包含例如甲基与胞嘧啶的5-碳位结合生成5-甲基胞嘧啶的经修饰碱基的寡核苷酸可从许多供应商获得,包括Operon(Cologne,Germany);Sigma-Proligo(Paris,France);和Genosys(St.Louis,MO)。除了化学合成,可能使用甲基转移酶将接头DNA酶促甲基化,只要胞嘧啶在酶的识别位点内。也可能通过使用填充反应(fill-inreaction)中的DNA聚合酶或通过PCR将5-甲基-dCTP掺入接头DNA中。本领域技术人员知道优化的接头设计和合成方法。可操作地,将接头的两条DNA链复性形成双链分子。一般而言,接头序列可在10至100个碱基对(bp)或更长范围内变化,通常为15至30bp。接头的序列组成是可变的,但是通常不含可能干扰潜在引物结合和其他功能的反向重复序列和类似序列。在一些应用中,接头可空间上结合在一起使得已结合的接头可连接至多于一个的靶DNA末端。这一应用的典型为当需要有不同的接头与模板DNA每个末端连接时,如克隆扩增和接着在下一代Solexa、SOLiD或454-DNA测序仪上测序的情况。所结合接头和靶DNA之间的分子内连接之后为分子间连接得到环形分子,藉此靶DNA被两个不同的接头侧接。已描述了一定片段长度范围的DNA区段得到环形分子的分子内连接的条件(Collins和Weissman,1984;Dugaiczyk等,1975;Wang和Davidson,1966)。接头可经工程化具有不同的末端结构以辅助与DNA的连接。经常使用平端,同样可使用用于和具有配偶体互补末端的DNA片段连接的特异粘性互补末端。接头与DNA连接以及使用靶向所连接接头的引物进行全基因组DNA扩增的操作为本领域已知(Hughes等,2005;Klein等,1999;Lucito等,1989;Ludecke等,1989;Kinzler和Vogelstein,1989)。除了之前所述用5-甲基胞嘧啶取代胞嘧啶之外,接头可包括其他经修饰或缀合的核苷酸。可使接头分子对亚硫酸氢盐处理或对可将基因组胞嘧啶与经修饰的接头胞嘧啶区分开来的其他差异化学处理具有抗性的胞嘧啶其他化学修饰均视作属于本发明范围和原理。同样视作属于本发明范围和原理的为其他接头碱基修饰,其中有可将经修饰的接头DNA与基因组DNA区分开来用于研究其他细胞外遗DNA修饰的化学反应。同样视作属于本发明领域和原理的为向接头中掺入表位或纯化标签,例如含生物素的部分或可被形成三螺旋的寡核苷酸靶向的DNA序列(综述=Vasquez和Glazer,2002;Sun等,1996)等,使得可在化学处理各步骤之前、之后或过程中便捷地亲和纯化与接头连接的DNA。根据本发明用于分析的DNA可衍生自任何细胞、组织或器官。在一些实施方案中,DNA衍生自临床治疗不同时间点或阶段的肿瘤或具有疾病表型的其他细胞以评价疾病状态中甲基化类型的整体改变。这样,本发明可用于鉴定疾病或疾病易感性或疾病后果的基因组诊断或预后甲基化生物标记。Ordway等(2006)、Sova等(2006)和Shames等提供了这些生物标记的说明性实例。其他应用包括阐明导致可鉴定用于治疗干预的药物或药物靶标的调控网络。用于全基因组甲基化研究的DNA可通过随机片段化生成以提供基因组的无偏倚分析。适当大小的DNA可在100至500bp或更长范围内变化,通常优选100至250bp。生成随机DNA片段的方法包括(1)牛胰脏脱氧核糖核酸核酶I(DNaseI),其可在锰离子存在下在DNA中形成随机双链裂解(Melgar和Goldthwajt,1968);(2)物理剪切(Shriefer等,1990);和(3)声裂法(Deininger,1983)0在一些实施方案中,可用优先靶向消化CpG岛序列的酶消化基因组DNA,CpG岛序列为与基因组中的基因相关的富含GC的区域(Kato和Sasaki,1998)。大部分的甲基化发生在CpG序列内,因此用例如MspI(CCGG)、HaeIII(GGCC)、TaqI(TCGA)等酶消化基因组DNA将优先将亚硫酸氢盐-DNA测序靶向基因组的这些区域。在宽松条件下使用在GC二核苷酸位置裂解DNA的限制性核酸内切酶CviJI(Fitzgerald等,1992)在部分消化条件下尤其适用于生产可用的DNA片段大小的连续区。计算机模拟分析表明给定的随机50-碱基读取对人类基因组参比集合明确分配(unambiguousassignment)的概率为约93%。对于被MspI(CCGG)或HaeIII(GGCC)位点侧接的50-bp片段和其他具有富含G+C识别位点的其他酶,对基因组集合的明确分配大于99%,因为观察到基因组中绝大多数重复DNA元件具有较低的GC含量并且这些酶的位点在这些基因组区域中低表达(underrepresented)。计算机模型也显示在通过MspI、HaeIII和TaqI消化生成的片段中存在高度重叠。在50_400bp片段大小范围内,绝大多数CpG岛序列可被由这三种酶单独消化构建的基因组文库的重叠50bp读取覆盖。经亚硫酸氢盐处理的DNA通常对参比序列的明确分配率较低,这归因于胞嘧啶转化成尿嘧啶(胸腺嘧啶),其可有效减少对三碱基遗传密码的原始查询(rawquery)。使用Solexa和SOLiD测序仪的成对末端(pair-end)读取能力延伸序列长度以及使用对立DNA链通过一致性比对和建立重叠群可解决这一问题。除了鉴定甲基化状态的改变,当序列数据与参比序列相比时本发明同时也可鉴定SNPs和其他遗传和体细胞改变。本领域具有用于甲基化数据集簇分析的信息工具(Wang等,2007;Segal,2006;Siegmund,2004;Virmani等,2002;Model等,2001;Eads等,2000)。尽管亚硫酸氢盐测序法的可用性和大范围使用,本发明倾向于处理误差和亚硫酸氢盐处理固有的竞争性和不利化学反应引起的问题。这些问题在全基因组应用中更明显。强效的亚硫酸氢盐处理方案(即延长温育时间、高温或高亚硫酸氢盐浓度)确保胞嘧啶完全转化成尿嘧啶,但是存在脱嘌呤作用引起的不可接受的DNA片段化以及最终将5-甲基胞嘧啶转化成胸腺嘧啶的风险(Hayatsu和Shiragami,1979;Wang等,1980)。较低强度处理的风险在于过高估计甲基化水平,归因于胞嘧啶向尿嘧啶的不完全转化。因此,对于主要的实验条件例如温度、PH、反应时间、亚硫酸氢盐浓度、DNA变性效率等仍需大量的工作以继续优化亚硫酸氢盐转化过程(Ehrich等,2007;Hayatsu等,2006;Grunau等,2001;Eads等,2000;Paulin等,1998;Clark等,1994;Raizis等,1995;Feil等,1994;Frommer等,1992)。优化这一过程的主要限制步骤为缺乏便捷和综合性的对照模板以监测亚硫酸氢盐转化固有的复杂和竞争性反应。用于评价亚硫酸氢盐转化效率的现有方法利用高效液相色谱法(HPLC)、凝胶电泳和质谱法检测处理后DNA的质量(Ehrich等,2007)。亚硫酸氢盐反应优化实验中胞嘧啶转化成尿嘧啶的速率通常由甲基化-PCR测定法测定,接着对衍生自一个或多个基因组待测基因座或待测对照模板的克隆产物(Frommer等,1992)测序,从而通过使用甲基转移酶甲基化两条DNA链的确定位点。使用甲基转移酶体外甲基化衍生的对照模板受累于潜在的不完全酶促作用,使得难以辨别特定位点胸腺嘧啶的存在是否由不完全体外甲基化引起或由过度的亚硫酸氢盐转化(其中甲基胞嘧啶被转化成胸腺嘧啶)引起(Hayatsu和Shiragami,1979;Wang等,1980)。此外,仅可评价给定甲基转移酶识别位点内的胞嘧啶。因此,需要便捷、强效和综合性的测定法以监测亚硫酸氢盐-转化过程中的复杂和竞争性反应,尤其当亚硫酸氢盐测序法在全基因组范围内进行时。本发明另一方面提供生产具精确限定的胞嘧啶甲基化组成的合成对照模板的方法以优化亚硫酸氢盐反应的条件。在本发明的一方面,该对照模板包含两个互补的复性DNA链A和B,其中B链的胞嘧啶在5-碳位甲基化并且其中A链的胞嘧啶没有甲基化。通过将衍生自通用DNA模板的两个独立扩增反应的产物复性构建所得半_甲基化DNA分子。第一个反应包含扩增引物A和B,藉此引物A被生物素部分标记,引物B胞嘧啶被5-甲基胞嘧啶取代并且在包含dATP、dTTP、dGTP和5-甲基-dCTP的三磷酸脱氧核糖核苷酸混合物(典型浓度为每核苷酸IOmM)存在下进行扩增。第二个扩增反应包含引物A和B,籍此引物B被生物素部分标记并在包含dATP、dTTP、dGTP和dCTP的三磷酸脱氧核糖核苷酸混合物存在下进行扩增。将等摩尔量的两种扩增产物混合、变性、使其再次复性并接着进行亲和素亲和色谱法移除被生物素标记的DNA分子。因此没有被亲和色谱法捕获的种类包含甲基化胞嘧啶A链和未甲基化胞嘧啶B链的双链半甲基化分子。所得半甲基化对照模板(HM-对照模板)可用于优化亚硫酸氢盐反应条件。因为已知两条DNA链每一条的HM-对照模板绝对精确的甲基化状态,所以与期望序列或亚硫酸氢盐处理后两个对照模板链结果的任何偏差是不完全或过度亚硫酸氢盐处理程度的定量测定。此外,对照模板可经工程化以包含一些特征,例如发夹结构、反向重复序列等,已知这些对亚硫酸氢盐处理、对所得实验条件的抗性更强从而影响它们的转化。在本发明的另一方面,也可通过将两个化学合成的寡核苷酸复性产生HM-对照模板,其中一条链包含胞嘧啶位点的5-甲基胞嘧啶取代并且互补链包含胞嘧啶。在本发明的另一方面,也可通过在包含dATP、dTTP、dGTP和5-甲基-dCTP的三磷酸脱氧核糖核苷酸混合物存在下进行PCR生成对照模板。所得对照模板在两条DNA链上具有5-甲基胞嘧啶完全取代胞嘧啶并是可监测过度亚硫酸氢盐处理的可用对照模板。在优选的实施方案中,具有二级结构或同聚物束严重度不断增强区域的对照模板可用于监测在不同温育时间、温度、PH和亚硫酸氢盐浓度的实验条件下亚硫酸氢盐处理的效率。在另一个优选的实施方案中,将对照模板加入基因组DNA以验证复杂DNA混合物存在下的试验条件。在另一个优选的实施方案中,可将微量的对照模板加入基因组DNA样品以提供在SoleXa、S0LiD或454-平台上高通量亚硫酸氢盐-DNA测序的内部对照。在又另一优选的实施方案中,本发明的对照模板可用于提供基于Solexa、S0LiD、454_或其他测序平台进行高通量亚硫酸氢盐-DNA测序的试剂盒或试剂盒组件。应理解的是根据本文的公开内容在不偏离本发明范围和精神的条件下对本领域技术人员而言其他修改是显而易见的并可轻而易举地实现。参考文献BirdA,2002.DNAmethylationpatternsandepigeneticmemmory(DNA甲基化模式和外遗传记忆).GenesDevl6:6_21·BrenaRM和CostelloJF,2007.Genome-epigenomeinteractionsincancer(癌症中的基因组-外遗基因组相互作用).HumMolGeneticsl6:R96_R105.CaiafaP和ZampieriΜ,2005.DNAmethylationandchromatinstructure:ThepuzzlingCpGislands(DNA甲基化和染色质结构令人迷惑的CpG岛).JCellBiochem94257-265.ClarkSJ等,1995.CpNpGmethylationinmammaliancells(哺乳动物细胞中的CpNpG甲基化)·NatGenet10:20_27·ClarkSJ^,1994.Highsensitivitymappingofmethylatedcytosines(甲基化胞嘧啶的高灵敏度作图绘制).NucAcidsRes22:2990-2997.CollinsFS禾口WeissmanSM,1984.DirectionalcloningofDNAfragmentsatalargedistancefromaninitialprobeAcircularizationmethod(远离起始探针的DNA片段的定向克隆一种环化方法).ProcNatlAcadSci(USA)81:6812_6816·Cottrel1SE,2004.MoleculardiagnosticapplicationofDNAmethylationtechnology(DNA甲基化技术的分子诊断应用).ClinBiochem37:595_604.CostelloJF禾口PlassC,2001.Methylationmatters(甲基化物质).JMedGenet38285-303.CrossSHφ,1994.PurificationofCpGislandsusingamethylatedDNAbindingcolumn(采用甲基化DNA结合柱纯化CpG岛)·NatureGenet6236-244.DeiningerPL,1983.RandomsubcloningofsonicatedDNA:ApplicationtoshotgunDNAsequenceanalysis(随机亚克隆经声处理的DNA应用于鸟枪法DNA序列分析).AnalytBiochem129:216—223.DugaiczykA等,1975.LigationofEcoRIendonuclease-generatedDNAfragmentsintolinearandcircularstructures(EcoRI核酸内切酶生成的DNA片段连接成线性和环状结构).JMolBiol96:171-178.EadsCA2000.MethyLight:Ahigh-throughputassaytomeasureDNAmethylation(MethyLight—种检测DNA甲基化的高通量测定法).NucAcidsRes28:e32.EhrichM等,2007.AnewmethodforaccurateassessmentofDNAqualityafterbisulphitetreatment(—种在亚硫酸氢盐处理后准确评价DNA质量的新方法).NucAcidsRes35:e29.EstellerΜ,2007.Epigeneticgenesilencingincancer:TheDNAhypermethylome(癌症中的外遗传基因沉默DNA超甲基组).HumMolGen16:R50_59.FeilR等,1994.Methylationanalysisonindividualchromosomes:Improvedprotocolforbisulphitegenomicsequencing(单个染色体上的甲基化分析亚硫酸氧盐基因组测序的改进方案).NucAcidsRes22:695-696.FitzgeraldMC等,1992.RapidshotguncloningutilizingthetwobaserecognitionendonucleaseCviJI(应用二碱基识别核酸内切酶CviJI的快速鸟枪法克隆).NucAcidRes20:3753-3762.FrommerM等,1992.Agenomicsequencingprotocolthatyieldsapositivedisplayof5-methylcytosineresiduesinindividualDNAstrands(可得至Ij单个DNA链中5-甲基胞嘧啶残基阳性展示的基因组测序方案).ProcNatlAcadSci(USA)891827-1831.GoodchildJ,1990.Conjugatesofoligonucleotidesandmodifiedoligonucleotides:Areviewoftheirsynthesisandproperties(寡核苷酸和经修饰寡核苷酸的缀合它们的合成和性质的综述).BiOCOnjugateChem1:165_187.GrunauC等,2001.BisulphitegenomicsequencingSystematicinvestigationofcriticalexperimentalparameters(亚硫酸氢盐基因组测序法关键实验参数的系统研究).NucAcidsRes29:e65.HatadaI等,1991.Agenomicscanningmethodforhigherorganismsusingrestrictionsitesaslandmarks(使用限制性酶切位点作为标志用于更高级生物体的基因组扫描法)·ProcNatlAcadAci(USA)88:9523_9527·HayatsuH禾口ShiragamiM,1979.Reactionofbisulphitewiththe5-HydroxymethylgroupsinpyrimidinesandinphageDNAs(亚硫酸M盐与11密禾口噬菌体DNAs中5-羟甲基基团的反应).Biochem18:632_637.HayatsuH等,2006.Doesureapromotethebisulphite-mediateddeaminationofcytosineinDNA?Investigationaimingatspeeding-uptheprocedureforDNAmethylationanalysis(尿素促进亚硫酸氢盐-介导的DNA胞嘧啶的脱氨作用吗?针对加速DNA甲基化分析操作的研究)·NucleicAcidsSymposiumSeriesNo50:69-70.HayatsuH等,1970.Reactionofsodiumbisulphitewithuracil,cytosine,andtheirderivatives(亚硫酸氢钠与尿嘧啶、胞嘧啶及它们的衍生物的反应)·Biochem9:2858_2865·HermanJG禾口BaylinSB,1997.Methodofdetectionofmethylatednucleicacidusingagentswhichmodifyunmethylatedcytosineanddistinguishingmodifiedmethylatedandunmethylatednucleicacids(通过使用修饰未甲基化胞嘧啶的物质并区分经修饰的甲基化核酸和未甲基化核酸检测甲基化核酸的方法).U.S.PatentNo6,017,704(2000年1月25日出版)·HermanJG1996.Methylation-specificPCR:AnovelPCRassayformethylationstatusofCpGislands(甲基化-特异性PCR:CpG岛甲基化状态的新颖PCR测定法).ProcNatlAcadAci(USA)939821-9826.HotchkissRD,1948.Thequantitativeseparationofpurine,pyrimidines,andnucleosidesbypaperchromatography(氏色谱法定量分离口票吟、啼唆禾口核苷).JBiolChem175:315-332.HughesS等,2005.Theuseofwholegenomeamplificationinthestudyofhumandisease(全基因组扩增在研究人类疾病中的用途).ProgBiophysMolBiol88:173-189.JonesP禾口BaylinSB,2007.Theepigenomicsofcancer(癌症的外遗基因组学).Celll28683-692.KatoR禾口HiroyukiS,1998.QuickidentificationandlocalizationofCpGislandsinlargegenomicfragmentsbypartialdigestionofHpaIIandHhaI(iMiiHpaII和HhaI部分消化在大基因组片段中快速鉴别和定位CpG岛).DNARes5=287-295.KeshetI等,2006.Evidenceforaninstructivemechanismofdenovomethylationincancercells(癌细胞中从头甲基化指导性机制的证据).NatGenet38149-153.KinzlerKW禾口VogelsteinB,1989.WholegenomePCR:Applicationintheidentificationofsequencesboundbygeneregulatoryproteins(全基因组PCR在鉴别基因调控蛋白结合序列中的应用).NucAcidsResl7=3645-3653.KleinCA1999.Comparativegenomichybridization,lossofheterozygosity,andDNAsequenceanalysisofasinglecell(单个细胞白勺竞争j"生基因组杂交、杂合性丢失和DNA序列分析).ProcNatlAcadSci(USA)96=4494-4499.LairdPW禾口JaenischR,1996.TheroleofDNAmethylationincancergeneticsand印igenetics(DNA甲基化在癌症基因组学和外遗基因组学中的作用).AnnRevGenet30:441_464·LiL-C禾口DahlyaR,2002.MethPrimer:DesigningprimersformethyIationPCRs(MethPrimer设计甲基化PCRs的引物).Bioinformatics18:1427_1431.LorinczMC禾口GroudineΜ,2001.CmC(a/1)GGmethylation:ΑnewepigeneticmarkinmammalianDNA(CmC(a/t)GG甲基化是哺乳动物DNA中的新外遗传标记吗?)ProcNatlAcadSci(USA)9811034-10036.LudeckeH等,1989.Cloningdefinedregionsofthehumangenomebymicrodissectionofbandedchromosomesandenzymaticamplification(ffl过H微切割显带染色体和酶促扩增克隆人基因组的确定区域).Nature338=248-350.LucitoR等,1998.Geneticanalysisusinggenomicsrepresentations(米用基因组代表进行遗传分析).ProcNatlAcadSci(USA)95:4487_4492.MarguliesM等,2005.Genomesequencinginmicrofabricatedhigh-densitypicrolitrereactors(在微结构高密度皮升反应器中的基因组测序).Nature437376-380.MeissnerA等,2005.Reducedrepresentationbisulphitesequencingforcomparativehigh-resolutionDNAmethylationanalysis(MT"^f"M^SlJ率DNA甲基化分析的reducedr印resentation亚硫酸氢盐测序法)·NucAcidsRes335868-5877.MelgarE禾口GoldthwaitDA,1968.Deoxyribonucleicacidnucleases:ΙΙ·TheeffectofmetalsonthemechanismofactionofdeoxyribonucleaseI(脱氧核糖核酸核酸酶II.金属对脱氧核糖核酸酶I作用机制的作用).JBiolChem243=4409-4416.ModelF2001.FeatureselectionforDNAmethylationbasedclassification(基于DNA甲基化的分类的特征选择).Bioinformatics17S157-S164.Novik,KL等,2002.Epigenomics:Genome_widestudyofmtheylationphenomena(外遗基因组学全基因组研究甲基化现象).CurrIssuesMolBiol4111-128.PaulinR等,1998.Ureaimprovesefficiencyofbisulphite-mediatedsequencingof5'-methylcytosineingenomicDNA(尿素提高基因组DNA中5'-甲基胞嘧啶的亚硫酸氢盐-介导测序的效率).NucAcidsRes26:5009-5010.Olek^,1998.MethodforproducingcomplexDNAmethylationfingerprints(产生复杂DNA甲基化指纹图谱的方法).U.S.PatentN06,214,556(issuedApril10,2001).OlekA等,1996.Amodifiedandimprovedmethodforbisulphitebasedcytosinemethylationanalysis(—种基于亚硫酸氢盐的胞嘧啶甲基化分析的经修改和改进的方法).NucAcidsRes24:5064-5066.OrdwayJM等,2006.ComprehensiveDNAmethylationprofilinginhumancancergenomeidentifiesnovelepigenetictargets(人类癌症基因组的综合DNA甲基化谱式分析鉴别新的外遗传靶点).Carcinogenesis27=2409-2423.RaizisAM等,1995.Abisulphitemethodof5-methylcytosinemappingthatminimizestemplatedegradation(使模板降解最小化的作图绘制5-甲基胞嘧啶的亚硫酸氢盐法).AnalBiochem226161-166.RodenhiserD和MannM,2006.Epigenticsandhumandisease-Translatingbasicbiologyintoclinicalapplications(外遗传学和人类疾病将基础生物学应用至临床应用).CMAJ174341-348.SchrieferLA等,1990.LowpressureDNAshearing:AmethodforrandomDNAsequenceanalysis(低压DNA切变一种用于随机DNA测序分析的方法).NucAcidsRes187455.SegalMR,2006.Validationingenomics:CpGislandmethylationrevisted(基因组学中的验证再谈CpG岛甲基化).StatisticalApplicationsinGeneticsandMolecularBiology5article29.SiegmundKD等,2004.AcomparisonofclusteranalysismethodsusingDNAmethylationdata(采用DNA甲基化数据比较聚类分析法).Boinformatics201896-1904.ShamesDS等,2006.Agenome-widescreenforpromotermethylationinlungcanceridentifiesnovelmethylationmarkersformultiplemalignancies(全基因组扫描肺癌中的启动子甲基化鉴别多种恶性肿瘤的新甲基化标记).PLOSMedicine3:e486.ShapiroR等,1970.Reactionsofuracilandcytosinederivativeswithsodiumbisulphite:Aspecificdeaminationmethod(尿啼唆禾口胞啼与亚iit酸S盐的反应一种特异性脱氨法).JAmChemSoc92=422-424.ShapiroR等,1973.NucleicacidreactivityandconformationII:Reactionofcytosineanduracilwithsodiumbisulphite(核酸反应性和构象II胞嘧啶和尿嘧啶与亚硫酸氢钠的反应).JBiolChem248=4060-4064.ShendureJ等,2005.Accuratemultiplexpolonysequencingofanevolvedbacterialgenome(—个已进化细菌基因组的准确多路克隆阵列测序).Science3091728-1732.SovaP等,2006·Discoveryofnovelmethylationbiomarkersincervicalcarcinomabyglobaldemethylationandmicroarryanalysis(通过全局脱甲基作用禾口微阵列分析发现新的甲基化生物标己).CancerEpidemiolBiomarkersRev11:291-297.VermaS和Eckstein,1998.Modifiedoligonucleotides:Synthesisandstrategyforusers(经修饰的寡核苷酸合成及使用策略)·AnnRevBiochem67:99-134.VirmaniAK等,2002.HierarchicalclusteringoflungcancercelllinesusingDNAmethylationmarkers(使用DNA甲基化标记层次聚类肺癌细胞系).CancerEpidemiolBiomarkersRev11:291-297.WangRY等,1980.Comparisonofbisulphitemodificationof5-methyldeoxycytidineanddeoxycytidineresidues(比较5_甲基脱氧胞苷禾口脱氧胞苷酸残基的亚硫酸氢盐修饰).NucAcidsRes8:4777-4790.WangZ等,2007·Heritableclusterandpathwaydiscoveryinbreastcancerintegratingepigeneticmdphenotypedata(通过整合外遗传和表型数据发现乳腺癌中的遗传聚类和途径).BMCBioinformatics838.WangJC禾口DavidsonN,1966.OntheprobabilityofringclosureoflambdaDNA(对入DNA环合可能性的研究).JMolBiol19:469-482.WeberM等,2005.Chromosome-wideandpromoter-specificanalysesidentiftsitesofdifferentialDNAmethylationinnormalandtransformedhumancells(全染色体和启动子-特异性分析鉴别正常和转化人类细胞中的差异DNA甲基化).NatGenet37853-862.WoodcockDM等,1997.AsymmeticmethylationinthehypermethyIatedCpGpromoterregionofthehumanLlretrotransponson(人Ll逆转座子超甲基化CpG启动子区的不对称甲基化).JBiolChem272:7810-7816.ZhangX等,2006.Genome-widehigh-resolutioinmappingandfunctionalanalysisofDNAmethylationinArabidopsis(拟南芥中DNA甲基化的全基因组高分辨率作图绘制和功能分析).Celll261189-1201.权利要求测定靶DNA群的外遗基因组状态的方法,其包括将靶DNA群片段化至适当大小,将其与包含在一个或多个或所有位点取代其未经修饰的核苷酸类似物的经修饰核苷酸的组合物的一个或多个不同的经修饰-接头连接,与该靶DNA连接得到包含下列的组合物(1)与靶DNA片段的两个末端连接的相同的经修饰-接头;或(2)与靶DNA片段的每个末端连接的不同的经修饰接头;之后,与经修饰接头连接的靶DNA经化学处理,使得靶DNA组合物和经修饰接头组合物在化学和功能上可区分,其中所连接的经修饰的一个或多个接头在实质和功能上均未发生变化;之后,使用与经修饰接头序列互补的引物将化学处理的与经修饰接头连接的DNA扩增至少一个循环;之后,对被扩增的DNA进行DNA测序。2.测定靶DNA群胞嘧啶甲基化状态的方法,其包括将靶DNA群片段化至适当大小,将其与包含在一个或多个或所有胞嘧啶位点取代胞嘧啶的经修饰核苷酸的组合物的一个或多个不同的经修饰_接头连接,与该靶NDA连接得到包含以下的组合物(1)与靶DNA片段的两个末端连接的相同的经修饰-接头;或(2)与靶DNA片段的每个末端连接的不同的经修饰接头;之后,与经修饰接头连接的靶DNA经化学处理,使得靶DNA组合物和经修饰接头组合物在化学和功能上可区分,其中经修饰的一个或多个接头在实质和功能上均未发生变化;之后,使用与经修饰接头序列互补的引物将化学处理的与经修饰接头连接的DNA扩增至少一个循环;之后,对被扩增的DNA进行DNA测序。3.权利要求1的方法,其中所述靶DNA群的外遗基因组状态为5-碳位胞嘧啶的甲基化。4.权利要求1的方法,其中所述经修饰的一个或多个接头由一个或多个经修饰核苷酸组成,所述经修饰核苷酸选自任何经修饰的腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶核苷酸。5.权利要求1和2的方法,其中所述经修饰的一个或多个接头由一个或多个选自任何甲基化核苷酸的经修饰核苷酸组成。6.权利要求1和2的方法,其中所述经修饰的一个或多个接头由一个或多个选自5-甲基胞嘧啶的经修饰核苷酸组成。7.权利要求1和2的方法,其中所述化学处理为亚硫酸氢盐介导的胞嘧啶脱氨作用。8.权利要求1和2的方法,其表征衍生自正常、疾病或其他表型来源的序列数据,其方式为通过作图或与一个或多个参比DNA序列比对以辨别可与任何表型相关的遗传或外遗基因组差异。9.权利要求1和2的方法,其中经修饰的一个或多个接头由一种或多种核苷酸组成,所述核苷酸选自与能够生成仪器或视觉检查可读取检测信号的部分缀合的任何核苷酸。10.权利要求1和2的方法,其中所述经修饰的一个或多个接头能够在固相载体上指导DNA扩增。11.权利要求1和2的方法,其中所述经修饰的一个或多个接头能够在固相载体上指导等温DNA扩增。12.权利要求1和2的方法,其中所述经修饰接头与另一经修饰接头在功能上和空间上相连接。13.权利要求1和2的方法,其中所述经修饰的一个或多个接头由一种或多种核苷酸组成,所述核苷酸选自与亲和纯化标签缀合的任何核苷酸。14.权利要求1和2的方法,其中所述经修饰的一个或多个接头由一种或多种核苷酸组成,所述核苷酸选自与生物素部分缀合的任何核苷酸。15.权利要求1和2的方法,其中所述一个或多个DNA接头包含一个或多个可被能够与DNA形成三螺旋结构的寡核苷酸靶向的序列。16.权利要求15的方法,其中所述形成三螺旋的寡核苷酸与亲和纯化标签缀合。17.权利要求1和2的方法,其中所述靶DNA选自基因组DNA、线粒体DNA、叶绿体DNA、质粒DNA、cDNA、病毒DNA、微生物DNA、化学合成的DNA、核酸扩增的DNA产物以及从RNA转录的DNA。18.权利要求1和2的方法,其中通过应用机械力或通过单独或联合使用一种或多种核酶完全或部分消化将所述靶DNA随机片段化。19.权利要求18的方法,其中所述核酶为选自Bshl236I、BstUI、CviJI、FspBI、HaeIII、HhaI、HpaII、MseI、MspI、Sau3Al、TaqI、Tsp509I、它们的同裂酶和新裂酶的限制性核酸内切酶。20.生产半甲基化DNA对照模板以监测亚硫酸氢盐反应效率的方法,其包括使两条互补的DNA链A和B复性,其中B链的胞嘧啶在5-碳位甲基化,其中的A链胞嘧啶未甲基化;并且A链在包含引物A和B的扩增反应中生成,藉此引物A被生物素基团标记,引物B胞嘧啶被5-甲基胞嘧啶取代,在包含dATP、dTTP、dGTP和5-甲基-dCTP的三磷酸脱氧核糖核苷酸混合物存在下进行DNA扩增;并且B链在包含引物A和B的使用与A链相同的DNA模板的扩增反应中生成,藉此引物B被生物素基团标记并且在包含dATP、dTTP、dGTP和dCTP的三磷酸脱氧核糖核苷酸混合物存在下进行DNA扩增;并且将等摩尔量的两种扩增产物混合、变性、使其再次复性,接着进行亲和素亲和色谱法移除不需要的产物。21.生产甲基化DNA对照模板的方法,其中两条链的胞嘧啶在5-碳位被甲基化以监测亚硫酸氢盐反应效率,该方法包括使用组分胞嘧啶被5-甲基胞嘧啶取代的弓I物将对照DNA模板进行DNA扩增并且DNA扩增在包含dATP、dTTP、dGTP和5-甲基-dCTP的三磷酸脱氧核糖核苷酸混合物存在下进行。全文摘要本文公开了生产适用于化学修饰和高通量DNA测序的DNA模板的新颖方法和组合物。本文也公开了DNA接头设计的方法,其中组分胞嘧啶被5-甲基胞嘧啶取代使得所得接头对亚硫酸氢盐介导的脱氨作用具有抗性。当所述接头连接至双链DNA模板时,后续的DNA变性和亚硫酸氢盐处理将模板DNA胞嘧啶差异脱氨形成尿嘧啶而所连接接头的5-甲基胞嘧啶对这一化学转化具有抗性使得接头序列仍然保持不变。因此可用与未改变接头序列杂交的单一引物组扩增亚硫酸氢盐处理的DNA两条链。也公开了生产具确定甲基化组成的对照模板以优化亚硫酸氢盐反应的条件的方法。在优选的实施方案中,本发明可用于生产适于使用传统的SolexaTM、SOLiDTM或454TM-型DNA测序平台进行全基因组亚硫酸氢盐-DNA测序以研究DNA甲基化的模板。文档编号C12Q1/68GK101802223SQ200880103541公开日2010年8月11日申请日期2008年8月8日优先权日2007年8月15日发明者骆树恩申请人:香港大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1