测定甲基化图谱的方法和组合物的制作方法

文档序号:549638阅读:543来源:国知局
专利名称:测定甲基化图谱的方法和组合物的制作方法
技术领域
本发明涉及甲基化图谱(profile)的测定。
联邦资助的研发发明的权利声明
本发明获得由国家科学基金授予的,准许号为NSF 0077774的政府资助。政府具有本发明中的某些权利。
背景技术
DNA甲基化是一个普遍的生物过程,存在于从细菌到人类的各种生物体中。在该过程中,DNA甲基转移酶催化复制后在腺嘌呤的N6位或胞嘧啶的C5或N4位上加入一个甲基,其中S-腺苷蛋氨酸是甲基的通用供体。在高等真核生物中,DNA甲基化在基因组印记(imprinting)和胚胎发育中起重要作用。另外,DNA甲基化的异常与衰老和包括癌症在内的各种疾病有关。因此,需要一种测定个体细胞或生物体甲基化图谱的方法。本发明针对该需求和其他问题进行解决。
发明概述
本发明提供测定细胞、组织或生物体甲基化图谱的方法。在一些实施方案中,方法包括以下步骤
a.提供大小均一的来源于细胞、组织或生物体的随机切割或剪切的DNA群体,其中所述DNA包含第一部分和第二部分,每个部分包含甲基化和未甲基化核苷酸;
b.将所述第二部分分为甲基化的DNA分部分(sub-portion)和未甲基化的DNA分部分;
c.对至少两个选自第一部分、甲基化的DNA分部分和未甲基化的DNA分部分的DNA样品中至少一个特定序列的相对量进行定量;[10]从而测定细胞或生物体几个这种核酸序列的甲基化图谱。在一些实施方案中,该方法包括以下步骤[12]用不同的标记物标记至少两个DNA样品;和[13]将至少两个DNA样品与核酸杂交;和[14]通过计算两个杂交标记物的比例测定至少两个DNA样品与特定序列的相对杂交。在一些实施方案中,定量步骤包括定量扩增。在一些实施方案中,至少两个DNA样品是甲基化的DNA分部分和未甲基化的DNA分部分。在一些实施方案中,至少两个DNA样品是第一部分和甲基化的DNA分部分。在一些实施方案中,至少两个DNA样品是第一部分和未甲基化的DNA分部分。在一些实施方案中,随机切割或剪切的DNA包括甲基化敏感的限制性酶的甲基化和未甲基化识别序列,其分离步骤包括用甲基化敏感的限制性酶切割第二部分。在一些实施方案中,随机切割或剪切得到的DNA包括甲基化依赖的限制性酶的甲基化和未甲基化识别序列,其分离步骤包括用甲基化依赖的限制性酶切割第二部分。在一些实施方案中,核酸连接在固相支持体上。在一些实施方案中,固相支持体是微阵列。在一些实施方案中,固相支持体是珠子。在一些实施方案中,固相支持体是基质。在一些实施方案中,生物体是植物。在一些实施方案中,生物体是真菌。在一些实施方案中,生物体是原核生物。在一些实施方案中,原核生物是细菌病原体。在一些实施方案中,细菌病原体是从包括革兰氏阳性和革兰氏阴性菌和分枝细菌的组中选择的。在一些实施方案中,生物体是动物。在一些实施方案中,动物是人。在一些实施方案中,细胞是干细胞。在一些实施方案中,细胞是转基因的,核酸对应于转基因的插入位点。在一些实施方案中,组织是血液。在一些实施方案中,组织是活检组织。在一些实施方案中,组织是切除组织。在一些实施方案中,组织是正常组织。在一些实施方案中,组织是肿瘤组织。在一些实施方案中,组织是癌变前组织。在一些实施方案中,该方法进一步包括将核酸的甲基化图谱与核酸的转录进行比较,从而确定核酸的甲基化与转录之间的关系。在一些实施方案中,核酸的转录是用微阵列进行测定的。在一些实施方案中,该方法进一步包括将核酸的甲基化图谱与核酸的拷贝数进行比较,从而测定核酸的甲基化与核酸的拷贝数的组合对表型的贡献。在一些实施方案中,核酸的拷贝数是用微阵列进行测定的。在一些实施方案中,该方法进一步包括将细菌病原体样品的甲基化图谱与病原体参考株进行比较,其中甲基化图谱的相似性表明样品与参考株的共同起源。本发明也提供多核苷酸微阵列。在一些实施方案中,多核苷酸微阵列与第一个和第二个标记的DNA部分进行杂交,其中该部分来自细胞、组织或生物体的大小均一的随机切割或剪切DNA的群体;其中第一个DNA部分包括用第一种标记物标记的未甲基化和甲基化DNA;其中第二个DNA部分缺失未甲基化DNA或甲基化DNA,而且第二个DNA部分用不同于第一种标记物的标记物进行标记。在一些实施方案中,第二个检测DNA部分缺失甲基化的DNA。在一些实施方案中,第二个检测DNA部分缺失未甲基化的DNA。在一些实施方案中,用甲基化敏感或甲基化依赖的限制性酶处理随机切割或剪切的DNA并选择未切割的DNA来缺失第二个DNA部分。在一些实施方案中,DNA群体(population)来源于植物。在一些实施方案中,DNA群体来源于动物。在一些实施方案中,DNA群体来源于真菌。在一些实施方案中,DNA群体来源于原核生物。在一些实施方案中,原核生物是细菌病原体。在一些实施方案中,细菌病原体是从由包括李斯特菌(Listeria)、大肠杆菌(E.coli)、沙门氏菌(Salmonella)、耶尔森菌(Yersinia)和奈瑟淋球菌(Neisseria)在内的革兰氏阴性和革兰氏阳性菌及分枝杆菌组成的组中选择的。在一些实施方案中,DNA群体来源于转基因生物体、细胞或组织。本发明也提供制备来源于一个或多个亲本个体的外遗传相同或不同的后代群体的方法。在一些实施方案中,该方法包括以下步骤[29]a.测定亲本个体的有性或无性繁殖后代的基因组的甲基化图谱;[30]b.选择显示相同或不同甲基化图谱的后代,从而获得来源于一个或多个亲本个体的外遗传相同的群体。在一些实施方案中,该方法进一步包括测定亲本个体的甲基化图谱,选择步骤包括选择显示亲本个体的甲基化图谱的后代。在一些实施方案中,亲本是F1杂合体。在一些实施方案中,后代是有性繁殖的。在一些实施方案中,后代是无性繁殖的。在一些实施方案中,亲本个体是植物。在一些实施方案中,亲本个体是动物。在一些实施方案中,亲本个体是真菌。在一些实施方案中,亲本个体是原核生物。在一些实施方案中,后代是亲本的克隆。在一些实施方案中,基因组的甲基化图谱是在固相支持体上测定的。在一些实施方案中,固相支持体是膜。在一些实施方案中,固相支持体是甲基结合柱。在一些实施方案中,固相支持体是微阵列。在一些实施方案中,固相支持体是珠子。在一些实施方案中,测定步骤包括[34]a.将剪切或随机切割的均一DNA群体分为甲基化和未甲基化部分;[35]b.用第一种标记物标记甲基化或未甲基化部分;[36]c.将甲基化或未甲基化部分与核酸进行杂交。在一些实施方案中,该方法进一步包括提供用第二种标记物标记的总基因组DNA,并将总基因组DNA与核酸进行杂交,从而对来源于第一种标记物的信号进行归一化(normalizing)。在一些实施方案中,通过以下步骤对每个个体或后代基因组的甲基化图谱进行测定[39]a.提供细胞、组织或生物体的大小均一的随机切割或剪切的DNA群体,其中DNA包含第一部分和第二部分,每部分均包括甲基化和未甲基化核苷酸;[40]b.用第一种标记物对第一部分进行标记;[41]c.从第二部分缺失(deplete)甲基化或未甲基化的DNA;[42]d.用不同于第一种标记物的第二种标记物对缺失的第二部分进行标记;[43]e.将第一部分和缺失的第二部分与核酸进行杂交;[44]f.通过计算两种杂交标记物的比例测定DNA中的互补核酸片段的相对甲基化,从而测定细胞、组织或生物体中这些核酸序列的甲基化图谱。在一些实施方案中,该方法包括以下步骤[46]a.提供细胞、组织或生物体大小均一的随机切割或剪切的DNA群体,其中DNA包括第一部分和第二部分,而且DNA包括甲基化敏感或甲基化依赖的限制性酶的甲基化和未甲基化的识别序列;[47]b.用第一种标记物标记DNA群体的第一部分;[48]c.用甲基化敏感或甲基化依赖的限制性酶切割第二部分;[49]d.从第二部分缺失甲基化或未甲基化的DNA;[50]e.用不同于第一种标记物的第二种标记物标记第二部分的未切割DNA;[51]f.将第一和第二部分的标记DNA与核酸进行杂交;及[52]g.通过检测与核酸杂交的第一种和第二种标记物来测定核酸的相对甲基化(relative methylation),从而测定细胞、组织或生物体的甲基化图谱。在一些实施方案中,第二部分用甲基化依赖的限制性酶切割。在一些实施方案中,第二部分用甲基化敏感的限制性酶切割。在一些实施方案中,后代以组进行筛选。本发明也提供将甲基化图谱与杂种优势相关联的方法。在一些实施方案中,该方法包括个体杂交产生后代;测定个体和后代的甲基化图谱;对后代的性状与个体的甲基化图谱进行比较,从而将性状表现与甲基化图谱相关联。在一些实施方案中,个体来源于不同的遗传群体。本发明提供测定细胞、组织或生物体的甲基化图谱的方法。在一些实施方案中,该方法包括以下步骤[56]a.提供细胞、组织或生物体大小均一的随机切割或剪切DNA群体,其中DNA包括第一部分和第二部分,而且每部分包括甲基化和未甲基化的核苷酸;[57]b.用第一种标记物标记第一部分;[58]c.从第二部分中缺失甲基化或未甲基化DNA;[59]d.用不同于第一种标记物的第二种标记物标记缺失的第二部分;[60]e.将第一部分和缺失的第二部分与核酸进行杂交;[61]f.通过计算两种杂交标记物的比例来测定DNA中互补核酸片段的相对甲基化,从而测定细胞、组织或生物体中这种核酸序列的甲基化图谱。在一些实施方案中,第二部分缺失甲基化DNA,在一些实施方案中,第二部分缺失未甲基化DNA。在一些实施方案中,该方法包括以下步骤[64]a.提供细胞、组织或生物体大小均一的随机切割或剪切的DNA群体,其中DNA包括第一部分和第二部分,而且DNA包括甲基化敏感或甲基化依赖的限制性酶的甲基化和未甲基化识别序列;[65]b.用第一种标记物标记DNA的第一部分;[66]c.用甲基化敏感或甲基化依赖的限制性酶切割第二部分;[67]d.从第二部分缺失甲基化或未甲基化DNA;[68]e.用不同于第一种标记物的第二种标记物标记第二部分中标记的未切割DNA;[69]f.将第一和第二部分的标记DNA与核酸进行杂交;和[70]g.通过检测与核酸杂交的第一种和第二种标记物测定核酸的相对甲基化,从而测定细胞、组织或生物体的甲基化图谱。在一些实施方案中,第二部分用甲基化敏感的限制性酶进行切割。在一些实施方案中,第二部分用甲基化依赖的限制性酶进行切割。在一些实施方案中,核酸连接在固相支持体上。在一些实施方案中,固相支持体是微阵列。在一些实施方案中,固相支持体是珠子。在一些实施方案中,生物体是植物。在一些实施方案中,生物体是真菌。在一些实施方案中,生物体是原核生物。在一些实施方案中,原核生物是细菌病原体。在一些实施方案中,细菌病原体是从由包括李斯特菌、大肠杆菌、沙门氏菌、耶尔森菌和奈瑟淋球菌在内的革兰氏阴性和革兰氏阳性菌及分枝杆菌组成的组中选择的。在一些实施方案中,生物体是动物。在一些实施方案中,动物是人。在一些实施方案中,细胞是干细胞。在一些实施方案中,细胞是转基因细胞,其中核酸对应于转基因的插入位点。在一些实施方案中,细胞是干细胞。在一些实施方案中,细胞是转基因细胞,其中核酸对应于转基因的插入位点。在一些实施方案中,组织是血液。在一些实施方案中,组织是活检组织。在一些实施方案中,组织是切除组织。在一些实施方案中,组织是正常组织。在一些实施方案中,组织是肿瘤组织。在一些实施方案中,组织是病变前的组织。在一些实施方案中,该方法进一步包括将核酸的甲基化图谱与核酸的转录进行比较,从而确定核酸的甲基化与转录之间的关系。在一些实施方案中,核酸的转录是通过微阵列进行检测的。在一些实施方案中,进一步包括将细菌病原体样品的甲基化图谱与病原体的参考株进行比较,其中甲基化图谱的相似性表明样品与参考株的共同起源。
定义[75]“均一”是指在一个群体中,某个特定性状表现出很小变异或没有变异。典型地,在均一群体中,个体特定性状的变异不超过500%,在某些情况下,群体中特定个体或平均个体性状的变异小至约300%,200%,100%,75%,50%,25%,10%,5%或1%。类似地,“均一”或“大小均一”在用于DNA群体的DNA片段大小时,是指群体中片段长度不超过约500%的变异(在某些情况下,变异为约300%,200%,100%,75%,50%,25%,10%,5%或1%)。例如,当DNA片段的平均长度为1,000个碱基对时,具有500%变异的均一群体可含有不超过6,000个碱基对的个体。“外遗传均一的”是指其个体成员具有相同外遗传性状的群体。例如,外遗传均一的个体在其基因组之间在甲基化图谱方面将具有很小变异或没有变异。“甲基化”是指在胞嘧啶的C5或N4位置,腺嘌呤的N6位置的胞嘧啶甲基化或其他类型的核酸甲基化。“分离”在核酸纯化中是指将混合物形式的核酸分为两个物理上独立的群体。我们知道,在分离时,一个群体的每个成员并不需要均从第二个群体中分离出来。例如,从DNA的第二部分分离未切割的未甲基化DNA包括将至少一些未甲基化的DNA分离为单独的群体,典型地包括将大多数未甲基化DNA分离出来。当分离时,并不需要将每个未切割的未甲基化DNA从第二部分除去。在另一个实施例中,从DNA的第二部分分离切割的甲基化DNA包括将至少一些甲基化的DNA分离为单独的群体,典型地包括将大多数甲基化DNA分离出来。当分离时,并不需要将每个切割的甲基化DNA从第二部分除去。“分离”并不限定为限制性切割和大小分离,也包括此处所述的亲和纯化和其他本领域的技术人员所知的方法。“杂合体个体”是指个体来源于两个亲本有性杂交得到的直接后代或至少两个个体的遗传复合体。“基因组甲基化图谱”是指一组代表个体基因组DNA甲基化状态的数据。图谱可以表示个体中每个碱基对的甲基化状态或包括与基因组中碱基对子集相关的信息(例如,特定的限制性酶识别序列的甲基化状态)。本领域已知有多种测定DNA甲基化状态的方法,并在此进行描述。术语“微阵列”是指杂交阵列元件的有序排列。阵列元件排列为每平方厘米的基质表面优选地至少有一个或多个不同的阵列元件,更优选地至少100个阵列元件,最优选地至少1000个阵列元件。另外,典型地,阵列元件的每个杂交信号各自可分辨。“甲基化依赖的限制性酶”是指切割甲基化限制性序列,但不切割未甲基化的相同序列的限制性酶(例如McrBC)。“甲基化敏感的限制性酶”是指切割未甲基化限制性序列,但不切割甲基化的相同序列的限制性酶(例如PstI)。样品“缺失甲基化DNA”是指将在目标序列(例如,在甲基化依赖的限制性酶的识别位点)中含有甲基化核苷酸的大多数片段被去除的DNA片段。在一些实施方案中,缺失甲基化DNA的群体中含有不多于40%,30%,20%,10%,5%或1%具有至少一个甲基化的目标序列的片段。缺失的样品中的其余序列在除目标序列以外的位置可含有甲基化的核苷酸。样品“缺失未甲基化DNA”是指在目标序列(例如,在甲基化敏感的限制性酶的识别位点)含有未甲基化核苷酸的大多数片段已被去除的DNA片段。在一些实施方案中,缺失未甲基化DNA的群体中含有不多于40%,30%,20%,10%,5%或1%具有至少一个未甲基化的目标序列的片段。缺失的样品中的其余序列在除目标序列以外的位置可含有未甲基化的核苷酸。“抗体”是指由一个或多个免疫球蛋白基因或其片段编码,可以特异结合和识别被分析物(抗原)的多肽。被鉴定的免疫球蛋白基因包括κ,λ,α,γ,δ,ε和μ的恒定区基因,以及多种免疫球蛋白的可变区基因。轻链分为κ或λ。重链分为γ,μ,α,δ或ε,反之可定义免疫球蛋白的种类分别为IgG,IgM,IgA,IgD和IgE。一个示例的免疫球蛋白(抗体)的结构单元包括一个四聚体。每个四聚体由两对相同的多肽链构成,每对有一个“轻”(约25kD)和一个“重”链(约50-70kD)。每条链的N-末端定义为约100到110或更多个氨基酸的可变区,主要负责抗原的识别。术语可变轻链(VL)和可变重链(VH)分别是指这些轻链和重链。例如,抗体以完整的免疫球蛋白或以由各种蛋白酶消化而产生的多种已充分鉴定的片段存在。例如,木瓜蛋白酶在铰链区的二硫键以下消化抗体,从而产生本身作为轻链通过二硫键与VH-CH1连接的Fab的二聚体-F(ab)′2。F(ab)′2可在破坏铰链区的二硫键的温和条件下还原,从而将F(ab)′2二聚体转变为Fab′单体。Fab′单体本质上是具有部分铰链区的Fab(参见Paul(Ed.)Fundamental Immunology,第三版,Raven Press,NY(1993))。当各种抗体片段作为完整抗体的消化片段来定义时,本领域技术人员将理解将这些片段可以通过化学方法或使用重组DNA方法从头(denovo)合成。因此,此处所用的术语抗体也包括通过修饰整个抗体而产生的抗体片段或那些通过重组DNA技术(例如,单链Fv)重新合成的抗体片段。“杂种优势”或“杂交优势”表示与两个不同的近交相比较,其F1杂合子性状得到提高。杂种优势可在基于两个亲本平均值的基础上,定量地定义为高于亲本平均值的偏差。例如参见,Shull,G.1909.Am BreedAssoc Rep 551-59/Johnson等Genetics 134(2)465-474(1993)。例如,假设来自不同品种、重量为30和40lbs的两个个体进行交配。如果它们的后代重量为50lbs,则表明其水平高于每个单个的亲本。这种被定义为后代性状水平和单个亲本差异的额外重量就是由杂种优势造成的。“杂种优势组”是指具有多个基因型的群体,当同另一个“杂种优势组”或群体中的个体交配时,始终优于种内交配。例如参见,Hallauer,等Quantitative Genetics in Maize Breeding(Iowa State Univ.,Ames,IA 1988);Hallauer,等“Corn Breeding”In(ed.)Corn and Corn Improvement 3rd.(ASA-CSSA-SSSA,Madison,WI,1988),第463-564页;Lee等,Crop.Sci.29,第1067-1071页(1989);Livini C.,等Theor.Appl.Genet.84,第17-25页(1992);Smith等,Maydica 37,第53-60页(1992)。
发明详述1.简介[91]DNA甲基化对基因表达的影响既是区域性的,也是意义深远的。基因组甲基化的改变可造成邻近基因的不适当地表达。因此,调查基因组中多个区域的甲基化状态(或测定“甲基化图谱”)的能力可将特定的甲基化状态与基因表达和或性状相关联。本发明提供用于鉴定和选择具有相近或相同基因组的甲基化状态的个体的方法和组合物,从而选择具有所需表型的个体群体。例如,这些方法和组合物可用于从一个群体(例如有性或无性繁殖后代)中选择保留所需性状的个体。另外,这些方法和组合物可用于鉴定最佳交配对和最佳杂交组,以产生具有杂种优势的后代。另外,这些方法和组合物可用于诊断癌症,鉴定预诊的生物标志物,发现新的药物靶点。而且癌症和甲基化的关系在Jones & Baylin,Nat Rev Genet.3(6)415-28(2002)中进行了讨论。本发明基于重组遗传学领域中的普通技术。本发明中所用普通方法的基本教材包括Sambrook等,分子克隆实验室手册(第三版,2001);Kriegler,基因转移和表达实验室手册(1990);Current Protocols inMolecular Biology(Ausubel等编辑,1994))。
2.测定甲基化图谱[94]本发明提供测定核酸的甲基化图谱,包括整个基因组甲基化图谱的方法。本发明的方法包括产生大小均一的片段化(例如,随机切割或剪切)DNA及产生由甲基化和/或未甲基化DNA组成的DNA样品。然后核酸的甲基化图谱可通过对下述两种核酸的相对量进行定量而测定总DNA,甲基化DNA或未甲基化DNA,例如,分别缺失未甲基化或甲基化DNA的样品。一般来说,这些样品通过将片段化DNA分为等量的两部分(“第一部分”和“第二部分”),然后将第二部分分为甲基化和未甲基化的DNA分部分而产生。然后测定以下各项中包含核酸序列的片段的相对量a.第一部分相对于甲基化DNA的分部分;b.第一部分相对于未甲基化DNA的分部分;或c.未甲基化DNA分部分相对于甲基化DNA的分部分。
d.未甲基化DNA分部分相对于甲基化DNA分部分相对于第一部分。
片段化DNA[96]如上所述,在许多实施方案中,对起始的基因组DNA进行片段化。可通过任何本领域技术人员已知的方法进行片段化(例如,机械剪切,限制性酶或Dnase I切割等)。在一些实施方案中,对大小均一的片段进行了分离(例如,通过琼脂糖凝胶电泳及对特定范围的片段大小进行洗脱)。例如,片段的平均大小可为例如约0.1、0.5、1、2、3、4、5kb或更多。在一些实施方案中,片段的平均大小为例如0.1-1、1-2、1-3、1-5、2-4或1-10kb。
分离甲基化和未甲基化DNA[97]可通过各种方法将DNA分离为甲基化或未甲基化的DNA分部分。例如,在一些实施方案中,可用甲基化敏感(或备选地甲基化依赖的)限制性内切酶切割长度相同的片段化的基因组DNA,从而分离出一个或两个分部分一个分部分为未切割的DNA分子,一个分部分为切割的DNA分子。当使用甲基化依赖的限制性酶时(切割甲基化序列,而不切割未甲基化序列),未切割的DNA部分为未甲基化的限制性序列,切割的DNA片段为甲基化的限制性序列。反之,当使用甲基化敏感的限制性酶时(切割未甲基化序列,而不切割甲基化序列),则未切割的DNA片段为甲基化的限制性序列,而切割的DNA片段为未甲基化的限制性序列。各种甲基化依赖和甲基化敏感的限制性酶对本领域技术人员来说是已知的。例如,限制性酶一般可从New England Biolabs(Beverly,MA)或Roche Applied Sciences(Indianapolis,IN)获得。示例的甲基化依赖的限制性酶包括,例如McrBC、McrA、MrrA和DpnI。示例的甲基化敏感的限制性酶包括,例如PstI、BstNI、FseI、MspI、CfoI和HpaII。例如参见,McClelland,M.等,Nucleic Acids Res.1994 Sep;22(17)3640-59及http://rebase.neb.com。DNA分子的两个分部分(例如切割和未切割的部分)可根据分子量用本领域技术人员已知的各种方法进行分离。例如,凝胶电泳、大小排阻层析、大小差异离心(例如,在蔗糖梯度下)可用于从较重的未切割片段中分离切割的片段。那些本领域的技术人员将了解到也可以使用其他分离甲基化和未甲基化群体,从而缺失样品的甲基化或未甲基化DNA的方法。例如,甲基化核酸或与甲基化核酸的蛋白有关的特异抗体或其他试剂(例如MeCP2)可用于亲和纯化甲基化核酸,从而从未甲基化的DNA中分离出甲基化的DNA。例如参见,Meehan,等,Nucleic Acids Res.20(19)5085-92(1992)。在这种情况下,可以但不必用甲基化敏感的限制性内切酶切割DNA。例如,在一些实施方案中,用含有甲基化DNA特异的蛋白亲和柱分离甲基化和未甲基化部分。一旦分离出来,某个部分或两部分均可以进行标记以用于杂交。在其他实施例中,单独使用化学试剂或与酶一起使用,可以特异切割甲基化的核酸,从而产生甲基化和未甲基化群体。然后将各群体如上所述进行分离。
分部分的预扩增对本领域技术人员来说,当DNA片段被分离为由总DNA和甲基化DNA及未甲基化DNA分部分组成的第一部分时,在对任何特定核酸在分部分中进行定量前,可使用各种方法统一扩增每个分部分的片段。例如,片段的预扩增可提高分部分中任何特定核酸的信号,并在起始DNA痕量时可得到甲基化图谱。这种技术在仅有少量基因组DNA时是非常有用的,例如来源于活检组织或切除肿瘤的样品。在一个实施例中,双链DNA接头与分部分中的DNA片段的末端相连接。然后将DNA接头特异的寡核苷酸加到每个分部分上,然后用例如线性(例如滚环循环)或指数(例如PCR)DNA扩增技术进行扩增。
DNA的定量[104]可通过本领域技术人员已知的任何方法对DNA样品中的核酸(例如第一部分,甲基化DNA分部分和/或未甲基化分部分)进行定量。
杂交[105]例如,简单杂交可用于对DNA样品中的核酸进行定量。在一个实施例中,用不同的标记物(例如荧光或其他可检测的标记物)对两个或多个样品进行标记,标记的样品与核酸杂交后,通过标准方法对不同标记物的相对信号进行检测。给定的DNA探针与特定的甲基化序列的杂交表明该序列是甲基化的。没有探针杂交表明该序列没有甲基化。同样,个体的未甲基化DNA可作为靶标,其中杂交表明该序列在个体中没有被甲基化。在一些实施方案中,样品与微阵列上的探针进行杂交。该实施例特别适于检测大量序列,包括例如整个基因组的一系列位点的甲基化图谱。在一些实施方案中,可对甲基化DNA与给定探针和未甲基化DNA与给定探针的杂交进行检测,并将这些检测结果互相进行比较。例如,这样可测定未甲基化和甲基化靶DNA对给定探针的相对杂交强度。在一些实施方案中,可对给定探针与甲基化或未甲基化分部分的杂交进行检测,并与已测的给定探针与总基因组DNA,例如“第一部分”的杂交结果进行比较。以总基因组DNA为参照,对甲基化或未甲基化DNA分部分的杂交数据进行归一化。例如,这样可测定甲基化靶DNA与总靶DNA对给定探针的相对杂交强度。当总靶DNA与基因组中多于一个的序列进行杂交时,总靶DNA的杂交可测定杂交序列的拷贝数。如果甲基化DNA的杂交导致只有一部分总DNA靶产生信号,那么使用者可计算出杂交序列的哪部分是甲基化的。探针核酸是指可与靶杂交的核酸序列。典型地,探针核酸至少是一段基因组DNA。示差杂交(通过监测两个或多个不同标记物而进行测定)表明在特定基因组序列的相对甲基化。探针核酸可以是任何序列。在一些实施方案中,对各种不同的靶核酸进行检测,从而提供每个靶的甲基化状态的信息。在一些实施方案中,探针核酸序列代表已知甲基化位点或其他目标核酸序列(例如,一个其甲基化与表型例如癌症相关的序列)。选择性地,探针核酸是随机或表达的序列。为了对基因组中大量DNA(例如探针)序列进行处理,比较方便的是将两个标记的群体与微阵列或其他标记探针点阵进行杂交。选择的探针数目至少为,例如约2、5、10、20、50、100、500、1000、10000或更多的片段。在一些实施方案中,探针核酸排列在固相支持体上。示例的固相支持体包括,例如珠子或微阵列。在一些实施方案中,靶序列排列在固相支持体上。为了便于以下描述,将探针定义为微阵列上的核酸元件,而靶核酸定义为甲基化或未甲基化的核酸片段或总基因组核酸。当探针作为微阵列上的杂交阵列元件时,阵列元件以有序的方式进行排列,从而使每个元件存在于基质的特定位置上。因为阵列元件位于基质的特定位置上,因此杂交图谱和信号强度,包括靶序列的示差杂交(它们一起可以提供一个独特的表达谱)可用于解释甲基化图谱,并与表型(例如杂种优势或癌症)相关联。可对总DNA和甲基化DNA、总DNA和未甲基化DNA、未甲基化DNA和甲基化DNA,或总DNA和甲基化DNA及未甲基化DNA的示差杂交进行分析。对于示差杂交,至少制备两种不同的靶DNA样品,并用不同的标记物进行标记。将两种或多种标记的DNA样品的混合物加到微阵列上。然后在两个或多个不同标记物的发射光谱分别可检测的情况下对微阵列进行检测。在一些实施方案中,标记物是具有不同发射光谱的荧光标记物,例如耦联lissamine的核苷类似物和耦联荧光素的核苷类似物。在另一个实施例中使用的Cy3/Cy5荧光物质(Amersham Pharmacia Biotech)。例如,对微阵列的应用而言,使用易检测的荧光标记物(例如Cy3/Cy5)是比较方便的。但是本领域技术人员应知道,可使用任何类型的可检测标记物(例如,放射性、荧光、酶或其它本领域技术人员所知的方法)。杂交后,洗涤微阵列以除去未杂交的核酸,然后对杂交阵列元件与探针之间形成的复合物进行检测。检测复合物形成的方法对本领域技术人员来说是已知的。如上所述,在一些实施方案中,用荧光标记物标记靶多聚核苷酸,并通过荧光显微镜,例如共聚焦荧光显微镜,检测复合物形成的荧光信号的水平和图谱。氩离子激光激发荧光标记物,发射光经过光电倍增管,并对发射光的量进行检测和定量。检测的信号应与微阵列每个位置处的探针/靶多聚核苷酸复合物的量呈比例关系。荧光显微镜与计算机驱动的扫描仪设备相连接,从而产生定量的杂交强度的二维图像。对扫描图像进行检测,从而测定每个杂交靶多聚核苷酸的丰度。在示差杂交实验中,来自两个或多个不同生物样品的靶多聚核苷酸用具有不同发射波长的两个或多个不同的荧光标记物进行标记。用检测特异波长的不同光电倍增管组分别检测荧光信号,从而获得两个或多个样品中的靶多聚核苷酸的相对丰度/表达水平。典型地,当在相同的检测条件下,用一个以上微阵列进行检测时,应对微阵列的荧光强度进行归一化,以考虑杂交信号的差异。在一些实施方案中,用来自每个微阵列上所含的内标对照或来自总基因组DNA杂交强度的信号强度对各个多聚核苷酸探针/靶复合物杂交强度进行归一化。
定量扩增[118]可通过本领域中技术人员所知的多种定量扩增技术(例如定量PCR或定量线性扩增)对DNA样品中的核酸序列(例如分部分的第一部分)进行检测。定量扩增方法如下所述例如美国专利6,180,349;6,033,854和5,972,602,以及例如Gibson等,Genome Research 6995-1001(1996);DeGraves,等,Biotechniques 34(1)106-10,112-5(2003);Deiman B,等,MolBiotechnol.20(2)163-79(2002)。一种检测扩增产物的方法是5′核酸酶PCR检测法(也称为TaqManTM检测法)(Holland等,Proc.Natl.Acad.Sci.USA 887276-7280(1991);Lee等,Nucleic Acids Res.213761-3766(1993))。该方法通过在扩增反应中进行杂交和切割双链标记荧光探针(“TaqManTM”探针)来检测特定PCR产物的积累。产生荧光的探针由标记荧光报告染料和淬灭染料的寡核苷酸组成。在PCR过程中,如果并且只有该探针与扩增的片段杂交时,它才可被DNA聚合酶的5′外切核酸酶切割。探针的切割使报告染料的荧光强度增加。另一种检测扩增产物的方法依赖于能量转移,即由Tyagi和Kramer(Nature Biotech.14303-309(1996))所描述的“信标探针”方法,它也是美国专利5,119,801和5,312,728的主题。该方法使用可形成发卡结构的寡核苷酸杂交探针。在杂交探针的一端(5′或3′端)有一个供体荧光团,在另一端有一个受体部分。在Tyagi和Kramer的方法中,该受体部分是淬灭剂,也就是说,受体可吸收供体释放的能量,但其本身没有荧光。因此当信标处于开放构象时,可检测到供体荧光团的荧光,而当信标处于发卡(闭合)构象时,供体荧光分子的荧光被淬灭。当用于PCR时,可与PCR产物的一条链杂交的分子信标探针处于“开放构象”,因此荧光可被检测,而那些未杂交的探针没有荧光(Tyagi和Kramer,Nature Biotech.14303-306(1996))。因此荧光的量将随PCR产物量的增加而增加,从而可用于测定PCR反应过程。那些本领域技术人员也应当知道可使用其它定量扩增方法。
其它甲基化作图方法[121]甲基化图谱可通过多种本领域技术人员所知的方法进行检测。例如,用甲基化敏感或甲基化依赖的限制性内切酶切割的核酸进行简单的杂交分析(例如Southern blotting)可用于甲基化图谱。典型地,这些方法包括使用一个或多个可与至少一个甲基化的序列杂交的靶。通过多聚核苷酸与探针杂交的长度来检测甲基化的限制性序列是否存在。该方法和其它检测DNA甲基化的方法,例如亚硫酸氢盐测序法,如Thomassin等,Methods19(3)465-75(1999)所描述。
3.甲基化图谱的应用A.一般方法[122]甲基化图谱可用于任何与特定的甲基化图谱相关的表型检测。一旦建立这种关系,甲基化图谱是一种有效地鉴定具有所需表型的个体细胞或生物体的方法。例如,甲基化图谱可与植物或动物有用的性状,或在医学领域,与特定的癌症类型相关联,从而可进行诊断和治疗。可通过任何方式将所需表型与甲基化图谱相关联。在一个简单的实施例中,个体(如细胞或生物体)的特定表型在群体(例如后代或个体的克隆)中是所需的。在这种情况下,测定个体的甲基化图谱,并选择群体中与具有所需表型的个体相同或相似图谱的个体。备选地,可通过选择缺失亲本细胞或生物体甲基化图谱的个体来避免特定的甲基化图谱。在其它实施例中,选择的后代或克隆具有与任何亲本不同的甲基化图谱。一个有用的将所需表型与甲基化图谱相关联的方法包括测定甲基化与转录的关系。测定不同个体或细胞中一个或一组转录物的转录情况,然后将转录情况与特定的甲基化图谱相关联。可通过本领域技术人员已知的任何方法对转录进行测定。特别有用的测定大量基因转录的方法包括微阵列(例如“基因芯片”)分析。另外,本发明中的甲基化作图方法可与比较基因组杂交(CGH)结合使用。CGH是一个检测一个样品的基因组DNA相对于另一个样品的缺失和扩增的方法。该方法通过比较微阵列与每个用不同荧光染料标记的靶样品的杂交信号强度而完成的。CGH可与本发明的甲基化作图方法相结合,因为其中一个与微阵列杂交的标记的靶是总DNA样品,它可与另一个来源于另一个甲基化作图实验的样品进行比较。例如,在本申请中,将来自两个不同个体、细胞系或生物体的基因组DNA进行剪切或随机切割,从而产生大小均一的DNA片段。每个样品的一部分(例如一半)用甲基化敏感或甲基化依赖的酶进行消化,如此处所述。然后所有四个样品进行重片段化,以从每个个体中分离总DNA和甲基化和未甲基化DNA分部分。然后这四个样品与核酸,例如微阵列进行杂交。在一些实施方案中,四个样品用四个不同的标记物(例如荧光染料)进行标记。总DNA样品的比例提供了CGH图谱,而缺失和总样品的比例提供了来自每个个体的甲基化图谱。备选地,标记的样品可以以改变的配对形式与微阵列杂交。在这种设计下,每个样品用两种染料的每一种进行标记,从而可同时分析所有样品的缺失和甲基化变化。这种分析有时候称为环设计(例如参见Craig,等2001.″Designing microarray experimentschips,dips,flips,and skips″inPROCEEDINGS OF APPLIED STATISTICS IN AGRICULTURE,2001(Ed.George Milliken))。这种设计的一个示例如下所示。在下面的示例中,两个个体表示为A和B。
阵列杂交实验序号Cy3 Cy51 AA缺失2 A缺失B3 BB缺失4 B缺失A在这种设计中,每个样品用每种染料进行标记,从而可考虑相对染料的掺入。因为只使用了四个阵列,因此减少了分析个体间甲基化图谱在整个基因组中差异所需的时间和资源。备选地,用四种不同的染料可从单个阵列的杂交中得到相同的数据。
B.选择所需的群体[130]通过测定个体的甲基化图谱,并选择具有相同图谱的个体可鉴定和选择外遗传均一的群体。例如,这些方法可用于分离具有所需表型的无性繁殖克隆,从而鉴定具有相同表型的克隆。在一些实施方案中,至少约80%、85%、90%、95%、98%或99%选择的克隆具有本质上与无性亲本相同的甲基化图谱。具有与具有所需表型(例如杂交优势)的个体相同或相似的甲基化图谱的克隆或后代可能具有所需的表型。当从一个个体产生无性后代时(例如,通过具有杂交优势的植物或动物的无性繁殖,通过核移植,微体繁殖,通过干细胞的细胞分裂等),克隆与个体在遗传上是相同的,但外遗传性状不同。通过选择具有与杂合子相似或相同的甲基化图谱的克隆可以选择到维持杂合子优势表型的克隆。无性繁殖后代在遗传上与杂合子相同。因此,此处所述的方法可用于鉴定遗传和外遗传性状相同,从而与亲本具有相同表型的无性后代。那些本领域中技术人员应知道选择的克隆群体的均一性依赖于杂合子与选择的克隆群体之间的图谱的相似性。例如,用户可决定并不需要在所有基因座与杂合子具有绝对的相似性,因此可选择具有所需比例的基因组相同的后代。例如,可选择至少约50%、60%、70%、80%、90%、95%、98%、99%或100%待测基因组具有与杂合子相同的甲基化状态的克隆。备选地,可监测群体(后代)中个别基因组的质量,从而测定杂种优势中特定基因座的相对重要性。在这种情况下,使用者可选择选择已知与对照完全相同或影响所需表型的重要基因座,在其它基因座可允许至少部分,有时候是全部的变异。可单独根据本发明或组合(例如库)的方法选择个体。个体的组合可以快速选择大量个体。本发明可用于大范围的生物体,包括真菌、动物和植物。例如,可用于任何农业生物。示例的动物是那些已驯化的动物,包括猪、牛、禽、其它鸟类、马、动物园的动物、几乎灭绝的种及类似动物。本发明也用于大范围的植物,包括Anacardium、Arachis、Asparagus、Atropa、Avena、Brassica、Citrus、Citrullus、Capsicum、Carthamus、Cocos、Coffea、Cucumis、Cucurbita、Daucus、Elaeis、Fragaria、Glycine、Gossypium、Helianthus、Heterocallis、Hordeum、Hyoseyamus、Lactuca、Linum、Lolium、Lupinus、Lycopersicon、Malus、Manihot、Majorana、Medicago、Nicotiana、Olea、Oryza、Panieum、Pannesetum、Persea、Phaseolus、Pistachia、Pisum、Pyrus、Prunus、Raphanus、Ricinus、Secale、Senecio、Sinapis、Solanum、Sorghum、Theobromus、Trigonella、Triticum、Vicia、Vitis、Vigna和Zea属的种。当选择克隆或后代时,可对其进行培养,从而得到表现出所需性状的植物。在一个实施例中,无性繁殖植物(例如棕榈)的甲基化图谱可用于选择包括具有相似或相同甲基化图谱的植物在内的均一群体。本发明也用于选择具有所需表型的细胞群体。示例的细胞包括干细胞,包括成人或胚胎干细胞,或其它任何可在群体中产生体细胞变异的细胞或生物体。从而本发明可用于监测变异的发生及选择具有或缺少该变异的个体。同样地,测定癌症细胞的甲基化图谱可用于诊断和治疗。在另一个实施例中,筛选转基因细胞或生物体,从而测定转基因对甲基化的作用。这种个体的甲基化图谱可在基因组水平测定,或在基因组中转基因插入区域的旁侧进行测定。例如,该方法可用于有效选择最可能不携带致死突变或测定转基因插入引起的染色体效应的转化株。
C.另外用于育种[139]通过测定潜在交配对的甲基化图谱可以提高传统的交配技术。通过将甲基化图谱与杂种优势性状相关联,饲养者可选择在后代中产生所需甲基化图谱的交配对,从而可获得杂种优势。另外,可鉴定甲基化图谱或各自序列,并用于设计最佳配对。杂种优势组是那些与另一个杂种优势组或群体杂交时,总是超过群体内杂交的个体群。通过将与每个杂种优势组相关联的(例如,连锁的)甲基化图谱进行比较,并测定表现出杂种优势的后代的图谱,可将甲基化图谱用于最佳配对组的选择。一旦测定了一个特定杂种优势组的甲基化图谱,则组内的新个体不需进一步杂交即可测定。本说明书引用的所有出版物和专利申请通过参考结合于此,似乎每个单个出版物或专利申请特别地和单独地显示通过参考结合于此。虽然为了便于理解,上述发明已通过举例说明和实施例进行了详细描述,但本领域普通技术人员应理解在不脱离附加的权利要求的主旨或范围的情况下,可对本发明进行某些修改和修饰。
实施例[143]以下实施例仅用于示例而不用于限定本发明。技术人员应理解各种非关键性参数可进行修改,以得到本质上相同的结果。
实施例1甲基化图谱的测定[144]将20微克总基因组DNA剪切为大小在1-10kb的片段。将剪切的DNA分为等量的两部分,一份用80个单位的mcrBC在37℃消化至少12个小时。雾化的目的是随机剪切基因组DNA,从而使整个基因组同等地由大小为1kb到10kb的全部片段所代表。另外,较小的片段也易于进行凝胶纯化和Cy-染料的掺入(参见下面)。然后将两份样品在0.8%的琼脂糖凝胶上与分子量标准一起进行片段化。凝胶可剪切成大小为1kb的范围,更大的片段被切割,然后用Qiagen Qiaquick凝胶提取柱根据制造商的方案对DNA进行纯化。用Megaprime DNA标记试剂盒,Amersham Pharmacia,对凝胶纯化的消化及未消化的样品分别标记Cy3和Cy5,并与微阵列在3xSSC,0.3%SDS中,65℃杂交过夜。12-16小时后,在50℃,1xSSC 0.1%SDS(1X)及0.2X SSC(2X)溶液中洗涤玻片,然后用商业化扫描仪,例如AxonInstruments Genepix Pro 4000A Dual Laser Scanner进行扫描。在背景及其它修正后,计算Cy3和Cy5通道信号强度的比值。通过与分别标记Cy5和Cy3的相同样品的重复杂交而进行的荧光交换分析是用于考虑实验误差。通过mcrBC消化可从片段中除去甲基化DNA,从而在标记和杂交后降低信号。因此Cy5相对于Cy3的比值表示微阵列上的点所代表的序列的相对甲基化程度。由于比值考虑了拷贝数,因此本方法可同时对高拷贝重复序列和低拷贝序列进行分析。通过标准方法分离约50μg总RNA。然后将RNA用寡聚-dT或随机引物转变为cDNA的第一条链。转变的cDNA用商品化可获得的随机引物试剂盒标记Cy3/Cy5。然后荧光标记的cDNA与含有待测基因的微阵列进行杂交,并在与上述相同的条件下进行洗涤和扫描。经过背景和其它修正后,计算Cy3和Cy5通道的信号强度的比值。通过与分别标记Cy5和Cy3的相同样品的重复杂交而进行的荧光交换分析是用于考虑实验误差,通过比较芯片所获得的数据组可建立相同区域DNA甲基化的关系。
实施例2甲基化图谱与转录的关系[149]用实施例1所述的技术构建了拟南芥的4号染色体上的异染色质结区一段长1.7Mb的甲基化图谱。在这里,我们表明该区的DNA甲基化图谱与其基因表达谱有关。而且我们也用突变分析表明,在遗传上改变该区的DNA甲基化将会显著改变该位点的基因表达谱。最后,我们表明该区染色质的修饰(通过不同的方法检测)均各自证实了我们关于DNA甲基化与基因表达的关系。拟南芥的4号染色体在其短臂上含有一个异染色质区或结区。我们对跨越该结区的连续1kb的区域进行扩增,得到代表该区的微阵列。我们测定了该区的甲基化图谱,并与在沉默DNA中富含的修饰组蛋白(H3K9)相关联。最后,我们测定了该区的基因表达转录图谱。如实施例1所述测定甲基化图谱。简而言之,将基因组DNA雾化为恒定大小,然后通过mcrBC消化缺失甲基化DNA。对代表未甲基化DNA的大片段进行纯化。将未消化和消化的DNA进行纯化,并分别标记不同标记物,然后与代表基因组中4号染色体的微阵列进行杂交。测定杂交靶标的比例。检测了在结区缺失甲基化对基因表达和染色质状态的作用。我们选择使用ddm1突变,从而将我们感兴趣的区域去甲基化。ddm1突变通过破坏SWI/SNF相关的染色质重建复合体而对基因组DNA进行次甲基化。例如参见Jeddeloh等,Nat Genet.22(1)94-7(1999)。我们检测到异染色质在ddm1中是解抑制的。通过上述所述方法,我们构建了4号染色体整个1.7Mb结区的图谱。测定了预测基因的位置和转录方向。通过甲基化图谱对该区域各个位置检测了DNA甲基化的量。另外,对该区域各个位置转录的量进行了检测,结果发现仅有少数活跃基因是未甲基化的。位置的转录图谱也可从ddm1突变植株获得。相对于野生型植株,ddm1突变株表达大量该区的可读框,大部分可读框相应于转座子。也在野生型和突变型植株中进行了染色质免疫共沉淀(ChIP)。染色质免疫共沉淀包括以下步骤用甲醛处理幼苗,通过体内交联将蛋白质-DNA及蛋白质-蛋白质相互作用进行固定。提取染色质,并进行超声、免疫共沉淀及洗脱。处理洗脱液,使交联逆转,并从洗脱液中纯化DNA。得到的DNA用PCR和Southern/微阵列进行分析。通过这些方法,可鉴定染色质上的蛋白质组成及其在每条序列上定量的丰度。组蛋白H3(H3)在赖氨酸4或赖氨酸9处甲基化。甲基化的修饰决定该分子的不同命运。在已表达基因中富含H3mK4,而在转录沉默基因中富含H3mK9。与松散装配的H3mH4不同,富含H3mK9的基因组区域是高度致密的。通过上述获得的数据,我们检测了组蛋白甲基化与DNA甲基化的关系。甲基化的组蛋白H3(mK9)从表达的基因中被排斥出来。同样,甲基化的组蛋白H3(mK4)从沉默基因中被排斥出来。在野生型植株中,该区的表达基因与H3mK4有关,沉默基因中仅含有H3mK9。我们也检测了异染色质的DNA甲基化与组蛋白H3赖氨酸9甲基化的关系。DNA的甲基化状态与基因组DNA的染色质装配状态密切相关。在ddm1突变株中,异染色质H3mK9及DNA甲基化同时缺失。因此ddm1突变株同时缺失甲基化信号及染色质装配信号。总之,这些数据表明特定基因组或基因特定区域的甲基化图谱的鉴定可同时提供该位点关于基因表达及染色质装配状态的信息。转录图谱将有助于验证基因表达数据及鉴定相关程度。ChIP可提供同样的信息,但操作更繁琐,并需要更多的数据处理来检测相关程度。
实施例3与大量复杂基因组的微阵列DNA/DNA杂交的检测[161]用GeneMachines Hydroshear将女性胎盘人基因组DNA(Sigma)剪切为大小在1到4kb的均一长度。电泳后,在低熔点琼脂糖凝胶中分离DNA。用Nanodrop扫描分光光度计测量洗脱DNA的浓度。将约1μg DNA通过Bioprime-试剂盒(Invitrogen)直接掺入Cy3-dCTP而进行随机引物标记,同时进行平行反应掺入Cy5-dCTP。标记的DNA在合成反应后进行纯化,并用spectrum-scanning 1000(NanoDrop)监测Cy荧光的掺入情况。杂交混合液同时包括合成反应、抑制背景的未标记的人C0t-1 DNA(Invitrogen)、Agilent/Operon阳性对照寡核苷酸及抑制与cDNA中的poly-A(或T)杂交的寡核苷酸。将编号为1的Agilent人cDNA阵列根据Agilent的指导在65℃杂交过夜。然后将阵列在改变SSC和SDS的量的条件下洗涤3次,每次温育5分钟。阵列在离心机中干燥,然后用Agilent扫描仪和软件(vA6.1)进行扫描。用Agilent图像提取软件(vA6.1)从TIFF文件中提取每个特征的杂交强度。然后将数据文件输入到Genespring 5.0(Silicon Genetics)中使其可视化。在三个阵列上进行实验,并用Lowess进行归一化(点对点及阵列对阵列的归一化),最后对数据组进行平均。阵列包括18,560个点,代表12,814个EST(其余~5000个剩余点是Agilent′s的对照)。结果表明用标记的全人基因组靶标检测编码序列是可行的。总共5.5%(1,022/18,560个点)的探针产生较差的结果,因为其检测的荧光强度在每个通道中均小于100U。但在这1,022个点中,只有260个是真正的EST,其余762个是Agilent的对照点。结果较差的基因点仅为阵列上2%的点(260/12,814)。由于数据随后进行较宽信号范围的1.0公算(3logs),因此认为本实验是成功的。
实施例4通过DNA微阵列检测的甲基化图谱[164]将甲基化作图技术应用于相同的人女性胎盘基因组DNA。当比值偏离1.0基线(深蓝色),且t-检验表明大于75%的点具有可接受的最小标准偏差(SD)时,则可通过甲基化作图预测甲基化(红色)。这些观察表明本技术可检测人基因组占的甲基化序列。如上所述,在甲基化作图实验中,只有845个点给出较差的结果。较差的点仅占阵列上总EST的1.2%(148/12814)。如前所述,大部分EST信号强度落在3logs中,从而表明拷贝数有较大差异。
实施例5本发明的方法检测的人甲基化等位基因的相关性[166]如果甲基化作图如预想进行工作,则荧光信号比值应随DNA用甲基化酶进行的体外预处理而改变,从而人工增加5mC的含量。对经过3个时程的甲基化酶混合液处理(0min、3min和15min@1U/u.g)的人女性胎盘基因组DNA上进行甲基化作图。DNA暴露在可在CpG序列处向胞嘧啶转移甲基的M.SssI及向基因组CCGG位点的外侧胞嘧啶转移甲基的M.MspI中(http://rebase.neb.Com)。在甲基化酶反应完成前选择时间点进行定量检测。除了无荧光交换外,该流程如前所述进行。对每个阵列来说,未处理的样品标记红色(Cy5)。四个不同阵列中相同的1,500个点的结果清楚地表明本发明的甲基化作图方法可在一系列的DNA样品中体外检测甲基化的升高。另外,多个基因座含有内源的甲基化。表1列出了女性胎盘基因组中前16种预测含有甲基化的基因座。
表1 来源于女性胎盘的含5mC的特征预测
*表1列出的每个点的平均(n=8(4种荧光交换)5mC的强度比值根据T检验、P值及总比例进行分类。比值反应了从由甲基化缺失的荧光通道未处理的荧光通道获得的平均强度。同时也表明了比值的范围。
**t-检验,p-值在GeneSpring(v5.0)中利用信号通道精度进行测定(点杂交强度的SD/点)。同样,该表也表明16个最具重现性的测量结果的性质相似性及相应的甲基化比例。通过检测表1中各性状的注释,可发现存在有趣的生物相关的位点。例如,可很容易地鉴定T-细胞γ受体基因家族和嗅觉受体假基因簇。T-细胞受体位点含有大量正确的T-细胞受体功能所需的DNA甲基化(Dennis,K.,等,Genes Dev 15(22)2940-4(2001);Geiman,T.M.,等,Biochim Biophys Acta 1526(2)211-20(2001);Geiman,T.M.和K.Muegge,Proc Natl Acad Sci USA 97(9)第4772-7页(2000))。第二个有趣的位点是嗅觉受体假基因簇。由于假基因是转录沉默的,因此假基因簇中可能含有甲基化序列。另外已表明,在鼠中,表达的嗅觉受体等位基因与相关的基因簇以亲本来源的特定方式对外源的基因沉默敏感(Ishii,T.,等,Genes Cells 6(1)71-8(2001))。第三个序列相应于由于其在男性血液中甲基化而以前克隆的CpG岛(Cross,S.H.等,NatGenet,6(3)p.236-44(1994))。来自相同假基因簇的不同性状表明了由检测法的定量所示的不同比例。然后通过独立的方法对预测含有甲基化的各个位点进行验证。为了在统计学意义上检测性状,在作为系统内源噪音的指示者的自身实验中对甲基化图谱的强度比值进行平均。由于每个实验中控制探针的能力可能不同,因此以这种方式的建模方法不是最优的。因此将数据重新进行划分。从预测含有5mC的数据组中选择出两个位点,即T细胞受体,比值=1.38;p-值=0.019,及CpG岛克隆Z62622,比值=1.26;p-值=0.017。同时选择出2个不含甲基化、也为CpG岛克隆的位点,Z65427的比值=1.03;p-值=0.99及Z59762的比值=0.91;p-值=0.87。得到每个位点的GenBank登录号,并选择可对每个基因组靶标的3′外显子扩增的PCR引物。关于独立的验证实验,用McrBC部分消化女性胎盘基因组DNA,并用引物从基因组的甲基化和未甲基化区域进行扩增。用同样McrBC-消化的模板浓度建立PCR反应,并用相同的循环数进行扩增。理论上,来源于未甲基化序列的产物量应保持恒定,而来源于甲基化序列的产物量应随McrBC消化量的比例而降低。平行的重复分析的结果很好地证明由甲基化图谱预测的甲基化位点事实上是内源甲基化的。同样地,由甲基化图谱预测不是内源甲基化的位点也被独立地证明是未甲基化的。总之,在人基因组中,本发明的甲基化作图方法可对基因组的体外甲基化和内源DNA的甲基化进行定量检测。
权利要求
1.一种测定细胞、组织或生物体的甲基化图谱的方法,该方法包括以下步骤a.提供均一的来源于所述细胞或生物体的随机切割或剪切的DNA群体,其中所述DNA包含第一部分和第二部分,每个部分包含甲基化和未甲基化核苷酸;b.将所述第二部分分为甲基化的DNA分部分和未甲基化的DNA分部分;c.对至少两个选自第一部分、甲基化的DNA分部分和未甲基化的DNA分部分的DNA样品中至少一个特定序列的相对量进行定量;从而测定细胞、组织或生物体的几个这种核酸序列的甲基化图谱。
2.权利要求1的方法,其中所述方法包括以下步骤用不同的标记物对至少两个DNA样品进行标记,和将至少两个DNA样品与核酸进行杂交;和通过计算两种杂交标记物的比例测定所述至少两个DNA样品与特定序列的相对杂交。
3.权利要求1的方法,其中所述定量步骤包括定量扩增。
4.权利要求1的方法,其中所述至少两个DNA样品是甲基化的DNA分部分和未甲基化的DNA分部分。
5.权利要求1的方法,其中所述至少两个DNA样品是第一部分和甲基化的DNA分部分。
6.权利要求1的方法,其中所述至少两个DNA样品是第一部分和未甲基化的DNA分部分。
7.权利要求1的方法,其中所述随机切割或剪切的DNA包括甲基化敏感的限制性酶的甲基化和未甲基化识别序列,所述分离步骤包括用甲基化敏感的限制性酶切割第二部分。
8.权利要求1的方法,其中所述随机切割或剪切的DNA包括甲基化依赖的限制性酶的甲基化和未甲基化识别序列,所述分离步骤包括用甲基化依赖的限制性酶切割第二部分。
9.权利要求2的方法,其中所述核酸与固相支持体连接。
10.权利要求9的方法,其中所述固相支持体是微阵列。
11.权利要求9的方法,其中所述固相支持体是珠子。
12.权利要求9的方法,其中所述固相支持体是基质。
13.权利要求1的方法,其中所述生物体是植物。
14.权利要求1的方法,其中所述生物体是真菌。
15.权利要求1的方法,其中所述生物体是原核生物。
16.权利要求15的方法,其中所述原核生物是细菌病原体。
17.权利要求16的方法,其中所述细菌病原体是从包括革兰氏阳性和革兰氏阴性菌和分枝杆菌的组中选择的。
18.权利要求1的方法,其中所述生物体是动物。
19.权利要求18的方法,其中所述动物是人。
20.权利要求1的方法,其中所述细胞是干细胞。
21.权利要求1的方法,其中所述细胞是转基因细胞,所述核酸对应于转基因的插入位点。
22.权利要求1的方法,其中所述组织是血液。
23.权利要求1的方法,其中所述组织是活检组织。
24.权利要求1的方法,其中所述组织是切除组织。
25.权利要求1的方法,其中所述组织是正常组织。
26.权利要求1的方法,其中所述组织是癌变前组织。
27.权利要求1的方法,其中所述细胞是转基因细胞,所述核酸对应于转基因的插入位点。在一些实施方案中,所述组织是血液。在一些实施方案中,所述组织是活检组织。在一些实施方案中,所述组织是切除组织。在一些实施方案中,所述组织是正常组织。
28.权利要求1的方法,其进一步包括将核酸的甲基化图谱与核酸的转录进行比较,从而测定核酸的甲基化与转录之间的关系。
29.权利要求28的方法,其中所述核酸的转录是通过微阵列进行检测的。
30.权利要求1的方法,其进一步包括将细菌病原体样品的甲基化图谱与病原体的参考菌株进行比较,其中甲基化图谱的相似性表明样品与参考菌株的共同起源。
31.一种与标记的第一个和第二个DNA部分杂交的多核苷酸微阵列,其中所述部分是来自细胞或生物体随机切割或剪切的DNA的均一群体;其中所述第一个DNA部分包含用第一种标记物标记的未甲基化和甲基化DNA;其中所述第二个DNA部分缺失未甲基化DNA或甲基化DNA,而且所述DNA的第二部分用不同于第一种标记物的第二种标记物进行标记。
32.权利要求31的多核苷酸微阵列,其中所述第二个检测DNA部分缺失甲基化DNA。
33.权利要求31的多核苷酸微阵列,其中所述第二个检测DNA部分缺失未甲基化DNA。
34.权利要求31的多核苷酸微阵列,其中用甲基化敏感或甲基化依赖的限制性酶处理随机切割或剪切的DNA,并选择未剪切的DNA,从而缺失所述第二个DNA部分。
35.权利要求31的多核苷酸微阵列,其中所述DNA群体来源于植物。
36.权利要求31的多核苷酸微阵列,其中所述DNA群体来源于动物。
37.权利要求31的多核苷酸微阵列,其中所述DNA群体来源于真菌。
38.权利要求31的多核苷酸微阵列,其中所述DNA群体来源于原核生物。
39.权利要求38的多核苷酸微阵列,其中所述原核生物是细菌病原体。
40.权利要求39的多核苷酸微阵列,其中细菌病原体从包括李斯特菌、大肠杆菌、沙门氏菌、耶尔森氏菌和奈瑟球菌的组中选择。
41.权利要求31的多核苷酸微阵列,其中所述DNA部分来源于转基因生物体或细胞。
42.权利要求31的多核苷酸微阵列,所述多核苷酸微阵列包括基因启动子和/或多核苷酸序列,当该序列甲基化时,可沉默邻近基因的表达。
43.一种从一个或多个亲本个体产生外遗传相同或不同的后代群体的方法,该方法包括以下步骤a.测定亲本个体的有性或无性繁殖后代的基因组甲基化图谱;b.选择显示相同或不同的甲基化图谱的后代,从而由一个或多个亲本个体产生外遗传相同的群体。
44.权利要求43的方法,其进一步包括测定亲本个体的甲基化图谱,所述选择步骤包括选择那些显示亲本个体甲基化图谱的后代。
45.权利要求44的方法,其中所述亲本是F1杂合子。
46.权利要求43的方法,其中所述后代是有性繁殖的。
47.权利要求43的方法,其中所述后代是无性繁殖的。
48.权利要求43的方法,其中所述亲本个体是植物。
49.权利要求43的方法,其中所述亲本个体是动物。
50.权利要求43的方法,其中所述亲本个体是真菌。
51.权利要求43的方法,其中所述亲本个体是原核生物。
52.权利要求43的方法,其中所述后代是亲本的克隆。
53.权利要求43的方法,其中所述基因组甲基化图谱是在固相支持体上测定的。
54.权利要求53的方法,其中所述固相支持体是膜。
55.权利要求53的方法,其中所述固相支持体是甲基结合柱。
56.权利要求53的方法,其中所述固相支持体是微阵列。
57.权利要求53的方法,其中所述固相支持体是珠子。
58.权利要求43的方法,其中所述测定步骤包括将随机切割或剪切的均一DNA群体分离为甲基化和未甲基化部分;用第一种标记物标记甲基化或未甲基化部分;和将甲基化或未甲基化部分与核酸进行杂交。
59.权利要求58的方法,其中所述方法进一步包括提供标记第二种标记物的基因组总DNA,并将所述基因组总DNA与核酸进行杂交,从而对第一种标记物的信号进行归一化。
60.权利要求43的方法,其中所述随机切割或剪切的DNA包括甲基化敏感的限制性酶的甲基化和未甲基化识别序列,所述缺失步骤包括用甲基化敏感的限制性酶切割第二个部分。
61.权利要求43的方法,其中所述随机切割或剪切的DNA包括甲基化依赖的限制性酶的甲基化和未甲基化识别序列,所述缺失步骤包括用甲基化依赖的限制性酶切割第二个部分。
62.权利要求43的方法,其中所述后代是以组进行筛选的。
63.一种将杂种优势与甲基化图谱相关联的方法,该方法包括个体杂交产生后代;测定个体和后代的甲基化图谱;将后代的性状与个体的甲基化图谱进行比较,从而将性状的表现与甲基化图谱相关联。
64.权利要求63的方法,其中所述个体来源于不同的杂种优势群体。
全文摘要
本发明提供测定个体甲基化图谱及使用该图谱鉴定具有所需性状的克隆的方法和组合物。
文档编号C12Q1/00GK1665937SQ03815159
公开日2005年9月7日 申请日期2003年6月26日 优先权日2002年6月26日
发明者R·马丁森, E·J·理查德, Z·李普曼, V·科洛 申请人:冷泉港实验室, 华盛顿大学圣·路易斯分校
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1