以Alu间聚合酶链式反应为基础的检测基因区特征的方法

文档序号:582769阅读:522来源:国知局
专利名称:以Alu间聚合酶链式反应为基础的检测基因区特征的方法
技术领域
本发明涉及集中检测基因区单核苷酸多态性(SNP)、点突变,插入/缺失及双脱氧 核苷酸分子(DNA)甲基化CpG位点的方法。总体上说,该方法是通过inter-Alu PCR,使新 一代测序技术可集中检测基因组中基因区序列特征的方法。 依据Alu重复序列集中于基因区这一特点,通过多引物inter-Alu PCR扩增基因 组中多个两Alu序列间区域,所得纯化PCR产物的质量为模板基因组DNA质量的6倍;并 且,该PCR产物为涵盖基因组中多个基因区域的DNA复制子。此方法可保证新一代测序技 术仅使用纳克级基因组DNA,便可以集中检测基因区的SNP、点突变,序列插入/缺失及DNA 甲基化CpG位点。 在本发明的一个实施方案中,根据AluY亚家族的特征,即多种遗传疾病经研究与 AluY亚家族插入基因组中造成基因组不稳定有关,另外,该亚家族作为重组热点区,其结构 内部及周围区域的SNP可能为疾病相关SNP ;因而寡核苷酸引物设计依据上述AluY的特 征,选取以AluY亚家族共同序列中的片段作为寡核苷酸引物。在Alu间聚合酶链式反应 (inter-Alu PCR)中,通过热稳定DNA聚合酶的作用,AluY共同序列小片段寡核苷酸引物 便可以与被检测的模板DNA在适当的序列位置互补,形成杂交的核酸结构。然后,在此聚合 条件下,以四种核苷酸(A、G、T、C)延伸寡核苷酸引物,以碱基互补原则,在热稳定DNA聚合 酶的催化下与需要扩增的模板链进行连接,从而达到复制模板链的目的。根据PCR的扩增 特点,即DNA的复制呈指数级扩增,也就是说PCR产物的质量要多于原模板DNA的质量。在 本发明中,纯化后的PCR产物质量为原模板质量的6倍。同时,因为Alu重复序列的结构 相似,且在基因组中的数量超过10X,所以单一AluY共同序 列小片段寡核苷酸引物可通过 inter-Alu PCR扩增基因组中多个区域,得到多个大小不等的DNA复制子。经过DNA琼脂 糖凝胶电泳,通过溴乙锭染色,在紫外灯下观察扩增产物形态为白色阶梯状影。如PCR反应 中的小片段寡核苷酸引物为多个,则紫外灯下扩增产物形态为白色斑片状影。在本发明中, 因为Alu重复序列多出现在基因组中的基因区,所以以AluY共同序列小片段寡核苷酸引物 inter-Alu PCR扩增的DNA复制子在基因区的比率要占到40% ;而整个基因区在整个基因 组中的比率只有25% 。这样便可仅用3 ii g纳克级的DNA模板扩增的inter-Alu PCR产物 放入高通量测序仪器中进行测序,所得的多位点SNP主要集中于基因区的Alu片段及Alu 周围片段中。因为约50X的SNP分布于重复序列区,其余则分布于重复序列以外的非编码 序列区和编码基因区。因此,该方法可用于检测基因组中,特别是基因区的多个SNP及发现 新SNP。 本发明的另一个实施方案是利用上述方法检测不同疾病,特别是癌症基因组中基 因区内含子及外显子的点突变,插入/缺失。在整个基因组中基因数量约为25, 000个,而 现已知肿瘤相关基因数量为6522个,占整个基因总数的26%。在本发明中,通过以AluY共 同序列小片段为寡核苷酸引物的inter-Alu PCR,扩增肿瘤基因组DNA,所得的基因区序列 所在的基因有58%为肿瘤相关基因。因此,可采用包括不同扩增方向的AluY共同序列为 寡核苷酸引物及"尾对尾"扩增方向的Alu共同序列寡核苷酸引物(R12A/267)作为混合引 物,在inter-Alu PCR中,通过热稳定DNA聚合酶的作用,多寡核苷酸引物与被检测的模板 DNA在适当的序列位置互补,形成杂交的核酸结构。然后,在此聚合条件下,以四种核苷酸(A、G、T、C)延伸寡核苷酸引物,以碱基互补原则,在热稳定DNA聚合酶的催化下与需要扩增 的模板链进行连接,从而达到复制模板链的目的。因为多个引物共同作用于同一 PCR反应 体系中,所以所得DNA产物经过DNA琼脂糖凝胶电泳,通过溴乙锭染色,在紫外灯观察下扩 增产物形态为白色斑片状影。按照如前所述技术,可检测inter-Alu PCR扩增区域中包含 的SNP是否为肿瘤相关性SNP,同时可将DNA复制子做进一步打断处理,结合外显子捕获技 术,着重分析扩增区域外显子中的SNP与肿瘤的相关性。 本发明的另一个实施方案是利用上述方法进行基因区DNA甲基化水平的检测。 DNA中的胞嘧啶(C)甲基化修饰多发生于5' -CpG-3'的"C"上,生成5-甲基胞嘧啶(5mC)。 绝大多数的5mC主要集中于富含CpG位点的重复序列Alu家族中,并且据估计,在整个人类 基因组,Alu家族可包含多达33 %的CpG位点。所以,以AluY共同序列中不含CpG位点的序 列设计2个不同扩增方向的寡核苷酸引物,将引物中的"C"全部转换成"T"。通过inter-Alu PCR扩增经亚硫酸氢盐预处理的肿瘤及正常对照组织(外周血)基因组DNA,可获得基因组 中富含CpG位点的Alu及其周围区域的PCR产物。2个不同扩增方向的寡核苷酸引物共同 作用于同一 inter-Alu PCR扩增反应体系,可获得包括了"尾对尾"、"头对头"、"头对尾"及 "尾对头"4个方向的DNA复制子,进一步增加了涵盖CpG位点区域的数量,可使经新一代测 序技术测序所获得的序列尽量多地提供肿瘤基因组CpG位点甲基化水平改变程度的信息。
在不背离本发明公开精神的前提下,对本发明所做的各种替换和修饰,都将落入 本发明范围内。 本说明书中使用的术语"基因区"是指基因组序列中基因所在的区域。基因(遗 传因子)是遗传的物质基础,是DNA分子上具有遗传信息的特定核苷酸序列的总称,是具有 遗传效应的DNA分子片段。 本说明书中使用的术语"纯化后PCR产物"是指在经过inter-Alu PCR反应后,将 PCR产物通过乙醇或纯化试剂盒去掉多余的引物、酶、矿物油、甘油,盐等杂质后所得的纯化 物。 本说明书中使用的术语"两个Alu序列间的区域"是指在inter-Alu PCR扩增产 物所位于的区域。由于Alu序列在基因组中分布较为广泛,在热稳定DNA聚合酶可以扩增 的DNA长度容许下,扩增所包括的相邻两个Alu序列之间的DNA序列。 本说明书中使用的术语"质量"是含有两个方面的意思。第一,指在inter-AluPCR 扩增产物的多少。第二,指测序数据满足研究要求的程度。 本说明书中使用的术语"DNA复制子"是指inter-Alu PCR扩增产物,这里是以Alu 寡核苷酸引物扩增基因组DNA所得的PCR产物。 本说明书中使用的术语"新一代测序技术"是指比第一代测序技术(荧光标记的 Sanger法)更为先进的循环阵列合成测序法。该技术可以在单次测序中获得数百万碱基的 序列。 本说明书中使用的术语"纳克级基因组DNA"是指实验中常用,汉语翻译出的DNA 质量的单位。其英语拼写为"ng"。 本说明书中使用的术语"AluY共同序列小片段寡核苷酸引物"是指选取AluY亚家 族共同序列中的10-20个碱基作为引物,并应用于inter-Alu PCR反应中。这些引物的片 段可以按照不同实验的要求,从AluY共同序列中的任意位置选取。
本说明书中使用的术语"白色阶梯状影"是指单个或多个寡核苷酸引物的 inter-Alu PCR反应所产生的DNA复制子,经过DNA琼脂糖凝胶电泳,通过溴乙锭染色,在紫 外灯下所显示的形态。其颜色为白色,形状如阶梯。 本说明书中使用的术语"白色斑片状影"是指多个寡核苷酸引物的inter-AluPCR 反应所产生的DNA复制子,经过DNA琼脂糖凝胶电泳,通过溴乙锭染色,在紫外灯下所显示 的形态。其颜色为白色,形状云翳或斑片。 本说明书中使用的术语"热稳定DNA聚合酶"是指用于inter-PCR反应的DNA聚 合酶。该热稳定DNA聚合酶可以是Taq酶,K0D酶及其他各种可以用于各种PCR反应的DNA 聚合酶。 本说明书中使用的术语"不同扩增方向"是指按照Alu具有"5'"端头部及"3'"端 尾部,inter-Alu PCR的扩增方向可以是朝向"5'"端,也可以朝向"3'"端。因此inter-Alu PCR扩增可以出现不同方向。 本说明书中使用的术语"'尾对尾'"是指按照Alu具有"5'"端头部及"3'"端尾 部,inter-Alu PCR扩增一个Alu "3'"端尾部与一个Alu "3'"端尾部间的DNA区域。
本说明书中使用的术语"'头对头'"是指按照Alu具有"5'"端头部及"3'"端尾 部,inter-Alu PCR扩增一个Alu "5'"端头部与一个Alu "5'"端头部间的DNA区域。
本说明书中使用的术语"'头对尾'"是指按照Alu具有"5'"端头部及"3'"端尾 部,inter-Alu PCR扩增一个Alu "5'"端头部与一个Alu "3'"端尾部间的DNA区域。
本说明书中使用的术语"'尾对头'"是指按照Alu具有"5'"端头部及"3'"端尾 部,inter-Alu PCR扩增一个Alu "3'"端尾部与一个Alu "5'"端头部间的DNA区域。
本说明书中使用的术语"外显子捕获"是指构建一种载体,从其插入片段中识别和 回收外显子序列,从而克隆目的基因。在本发明中,主要将inter-Alu PCR产物作为外显子 捕获的模板。 本说明书中使用的术语"CpG位点"是指DNA中的胞嘧啶(C)通过磷酸二酯键与鸟 嘌呤(G)形成线性连接。在哺乳动物中CpG位点中的"C"甲基化水平为70%到80%。
本发明涉及集中检测基因区特征的方法。该方法是通过inter-Alu PCR,使测序集 中于检测基因组中基因区序列的方法。依据以AluY共同序列为寡核苷酸引物的inter-Alu PCR扩增基因组中多个两Alu序列间区域,可获得高质量的纯化PCR产物;并且,该PCR产 物为涵盖基因组中多个基因区域的DNA复制子。此方法可保证新一代测序技术仅使用纳克 级基因组DNA,达到集中检测基因区特征的目的。 在本发明的一个实施方案中,根据AluY亚家族的特征,即AluY亚家族插入基因组 中造成基因组不稳定,另外,该亚家族作为重组热点区,其结构内部及周围区域的SNP可能 为疾病相关SNP ;因而寡核苷酸引物的设计需依据上述AluY的特征,选取以AluY亚家族共 同序列中的片段作为寡核苷酸引物。在inter-Alu PCR中,通过热稳定DNA聚合酶的作用, AluY共同序列小片段寡核苷酸引物便可以与被检测的模板DNA在适当的序列位置互补,形 成杂交的核酸结构。然后,在此聚合条件下,以四种核苷酸(A、G、T、C)延伸寡核苷酸引物, 以碱基互补原则,在热稳定DNA聚合酶的催化下与需要扩增的模板链进行连接,从而达到 复制模板链的目的。根据PCR的扩增特点,即DNA的复制呈指数级扩增,也就是说PCR产 物的质量要多于原模板DNA的质量。在本发明中,纯化后的PCR产物质量为原模板质量的6倍。同时,因为Alu重复序列的结构相似,且在基因组中的数量超过10X,所以单一AluY 共同序列小片段寡核苷酸引物可通过inter-Alu PCR扩增基因组中多个区域,得到多个大 小不同的DNA复制子。经过DNA琼脂糖凝胶电泳,通过溴乙锭染色,在紫外灯观察扩增产物 形态为白色阶梯状影。如PCR反应中的小片段寡核苷酸引物为多个,则紫外灯下扩增产物 形态为白色斑片状影。在本发明中,因为Alu重复序列多出现在基因组中的基因区,所以以 AluY共同序列小片段寡核苷酸引物inter-Alu PCR扩增的DNA复制子在基因区的比率要 占到40% ;而整个基因区在整个基因组中的比率只有25%。这样的扩增结果,可以仅用3 纳克级DNA,便可以进行高通量测序,所检测到的SNP主要集中于基因区中。因为SNP集中 分布于重复序列区,因此,该方法可用于检测基因组中,特别是基因区的多个SNP及发现新 SNP。 本发明的另一个实施方案是利用上述方法检测不同疾病,特别是肿瘤基因组中基 因区内含子及外显子的点突变,插入/缺失。在整个基因组中基因数量约为25, 000个,而 现已知肿瘤相关基因数量为6522个,占整个基因总数的26%。在本发明中,通过以AluY共 同序列小片段为寡核苷酸引物的inter-Alu PCR,扩增肿瘤基因组DNA,所得的基因区序列 所在的基因有58%为肿瘤相关基因。因此,可采用包括不同扩增方向的AluY共同序列或 Alu共同序列作为寡核苷酸引物,在inter-Alu PCR中,利用多个寡核苷酸引物混合物,通 过热稳定DNA聚合酶的作用,多寡核苷酸引物与被检测的模板DNA在适当的序列位置互补, 形成杂交的核酸结构。然后,在此聚合条件下,以四种核苷酸(A、 G、 T、 C)延伸寡核苷酸引 物,以碱基互补原则,在热稳定DNA聚合酶的催化下与需要扩增的模板链进行连接,从而达 到复制模板链的目的。所得DNA产物经过DNA琼脂糖凝胶电泳,通过溴乙锭染色,在紫外灯 观察扩增产物形态为白色斑片状影。按照如前所述技术,可检测inter-Alu PCR扩增区域 中与疾病相关的SNP,插入/缺失。同时可将DNA复制子做进一步打断处理,结合外显子捕 获技术,着重分析扩增区域外显子中的SNP与肿瘤的相关性。 本发明的另一个实施方案是利用上述方法进行基因区DNA甲基化水平的检测。利 用重复序列Alu家族中富含CpG位点的特点,以AluY共同序列中不含CpG位点的序列设计 不同扩增方向的2个扩增寡核苷酸引物,将引物中的"C"全部转换成"T"。通过inter-Alu PCR扩增经亚硫酸氢盐预处理的基因组DNA,可获得基因组中多位点,富含CpG的Alu及其 周围区域的PCR产物。2个不同方向的扩增引物共同作用于同一 inter-Alu PCR扩增反应 体系,可获得包括了 "尾对尾"、"头对头"、"头对尾"及"尾对头"4个方向的DNA复制子,可 使经新一代测序技术测序所获得的序列尽量多地提供基因组CpG位点甲基化程度的信息。 这一方法可用于正常人基因组甲基化水平的检测,或对各种不同疾病状态下DNA甲基化水 平改变程度进行分析。 以下,结合附图和下列实施例对本发明作进一步描述。


图1是实施例1中在基因区内SNP的示意图。显示本发明实施例1中,通过 inter-Alu PCR反应,使得寡核苷酸引物与基因组DNA在适当位置结合后,所扩增出来的片 段,该片段主要位于基因区,并且一个SNP包含在该基因区中。 图2是实施例1中的inter-Alu PCR以AluY共同序列中的小片段设计的两个寡
7核苷酸引物在AluY结构中的位置,及这两个引物在基因组DNA中的扩增方向的示意图。因 为AluY具有"5'"端的头部,及"3'"端的尾部,并且它们的分布在基因组中并不均匀,所以 适当距离的两个相邻Alu之间可以通过inter-Alu PCR反应扩增出来。也就产生了如图2 所示的,朝向"5'"方向扩增及朝向"3'"方向扩增。 图3是实施例1中两个AluY共同序列寡核苷酸引物在AluY中的具体位置 和序列的示意图。其中,"尾对尾"方向扩增的寡核苷酸引物(AluT-T)位于AluY共 同序列的第182位到第200位,碱基为"5' -AGGCTGAGGCAGGAGAATG-3';"头对头"方 向扩增的寡核苷酸引物(AluH-H)位于AluY共同序列的第66位到第86位,碱基为 "5, -TGGTCTCGATCTCCTGACCTC-3,"。 图4是实施例1经紫外灯所观察到的扩增后DNA复制子在琼脂糖凝胶中的影像 (反色显示)图。左侧为"尾对尾"AluY寡核苷酸引物inter-Alu PCR扩增产物在琼脂糖 凝胶中的影像,如阶梯状;中间为DNA分子标记(lkb) (Fermentas公司生产);右侧为"头对 头"AluY寡核苷酸引物inter-Alu PCR扩增产物在琼脂糖凝胶中的影像,如阶梯状。两种 寡核苷酸引物的inter-Alu PCR所扩增出的条带主要在300bp到2kb之间。箭头所指的是 切胶测序的条带位置。 图5是实施例2中,靠近AluY结构示意图尾部的寡核苷酸引物(AluYTl)的序列 及所在AluY中的位置的示意图。寡核苷酸引物的位置在AluY共同序列中的第278位到第 295位。碱基为"5'-GAGCGAGACTCCGTCTCA-3'"。它可以用来显示肿瘤基因组DNA复制错误 表型。 图6是3个寡核苷酸引物的扩增方向示意图。依据Alu的方向性,其中AluY共同 序列的一条寡核苷酸引物和Alu共同序列寡核苷酸引物R12A/267可以扩增一个Alu "3'" 端与另一个Alu "3'"端之间的DNA序列("尾对尾"方向),而另一条AluY共同序列的寡 核苷酸引物可以扩增一个Alu "5'"端与另一个Alu "5'"端之间的DNA序列("头对头"方 向)。混合寡核苷酸引物还可以扩增一个Alu "5'"端与另一个Alu "3'"端之间的DNA序 列("头对尾"方向),以及一个Alu "3'"端与另一个Alu "5'"端之间的DNA序列("尾 对头"方向)。 图7是实施例2中,经紫外灯所观察到的位于AluY尾部的单一寡核苷酸引物 inter-Alu PCR扩增后,肿瘤组织DNA复制子与对照外周血DNA复制子在琼脂糖凝胶中的影 像(反色显示)图。标记为F的2个样本为一名原发胶质母细胞瘤患者的肿瘤组织DNA与 外周血DNA扩增产物在琼脂糖凝胶中的影像。标记为L的2个样本为另一名原发胶质母细 胞瘤患者的肿瘤组织DNA与外周血DNA扩增产物在琼脂糖凝胶中的影像。标记为G的2个 样本为继发胶质母细胞瘤患者的肿瘤组织DNA与外周血DNA扩增产物在琼脂糖凝胶中的影 像。标记为W的2个样本为间变少枝胶质细胞瘤患者的肿瘤组织DNA与外周血DNA扩增产 物在琼脂糖凝胶中的影像。最后的条带为DNA分子标记(lkb)(Fermentas公司生产)。箭 头指出,复制错误表型出现在胶质细胞瘤各亚型中。 图8是实施例2中,经紫外灯所观察到的3个Alu混合寡核苷酸引物inter-AluPCR 扩增后,间变少枝胶质细胞瘤肿瘤组织DNA复制子与对照外周血DNA复制子在琼脂糖凝胶 中的影像图(均为白色斑片状影)。左侧为肿瘤组织DNA扩增复制子在琼脂凝胶中的影 像,中间为对照外周血DNA扩增复制子在琼脂凝胶中的影像;右侧为DNA分子标记(lkb)(Fermentas公司生产)。 图9是实施例3中,选取AluY共同序列中靠近中间区域的两段不含CpG位点的 序列作为引物在AluY结构中的位置及扩增方向的示意图。命名其中一条寡核苷酸引物为 CH11,其扩增方向朝向"5'",长度为llbp。该寡核苷酸引物可以进行"头对头"方向扩增,即 得到一个Alu "5'"端与另一个Alu "5'"端之间的DNA序列。命名另一条寡核苷酸引物为 CT11,其扩增方向朝向"3'",长度为llbp。该寡核苷酸引物可以进行"尾对尾"方向扩增, 即得到一个Alu "3'"端与另一个Alu "3'"端之间的DNA序列。CH11和CT11两个寡核苷 酸引物作用于同一个inter-Alu PCR反应,可以扩增一个Alu "5'"端与另一个Alu "3'" 端之间的DNA序列("头对尾"方向),以及一个Alu "3'"端与另一个Alu "5'"端之间的 DNA序列("尾对头"方向)。 图10显示的是实施例3中,2个AluY共同序列寡核苷酸引物的序列中"C"变"T" 的具体位置及序列。2个AluY共同序列寡核苷酸引物经过将"C"转换成"T"后,它们的序 列分别是CH1 "5' TTTAATAAAAA 3'",CT11 "5' AACATCAAAAT 3'"。 图11显示的是实施例3中,2个经过"C"转换成"T"后的Alu寡核苷酸引物扩 增基因组DNA的方向性。其与图6显示的3个寡核苷酸引物的inter-AluPCR扩增方向相 同。可包括一个Alu "3'"端与另一个Alu "3'"端之间的DNA序列("尾对尾"方向),一 个Alu "5'"端与另一个Alu "5'"端之间的DNA序列("头对头"方向);一个Alu "5'"端 与另一个Alu "3'"端之间的DNA序列("头对尾"方向)以及一个Alu "3'"端与另一个 Alu "5'"端之间的DNA序列("尾对头"方向)。所示实施例中,2个不同方向的AluY共同
序列寡核苷酸引物扩增经亚硫酸氢盐预处理后的肿瘤组织和对照组织(包括外周血)基因 组DNA,可产生上述4种不同的扩增产物。 图12显示的是实施例3中,经亚硫酸氢盐预处理后的DNA测序结果示意图。以新 一代测序技术为基础的高通量测序仪器仅需要3 ii gPCR产物,就可以检测到经亚硫酸氢盐 预处理后的DNA序列,甲基化的"C"不会产生变化,而非甲基化的"C"会转变成T。
具体实施例
实施例1 所检测的SNP为单倍体或纯合子二倍体或杂合子二倍体人类基因组DNA中集中于 基因区的SNP。图1显示了这样一个在基因区内SNP的例子。为获得基因区序列,需要通过 inter-Alu PCR反应集中扩增基因区,而后以新一代测序技术检测扩增后基因区中的SNP。 图2显示的是本发明中的inter-Alu PCR以AluY共同序列中的小片段设计的两个寡核苷 酸引物在Alu结构中的位置,及这两个引物在基因组DNA中的扩增方向;而图3显示的是这 两个引物的具体位置和序列。在inter-Alu PCR中,通过热稳定DNA聚合酶的作用,单一寡 核苷酸引物便可以与被检测的模板DNA在适当的序列位置互补,形成杂交的核酸结构。然 后,在此聚合条件下,以四种核苷酸(A、 G、 T、 C)延伸寡核苷酸引物,以碱基互补原则,在热 稳定DNA聚合酶的催化下与需要扩增的模板链进行连接,从而达到复制模板链的目的。依 据Alu的方向性,其中一条寡核苷酸引物可以扩增Alu "3'"端与Alu "3'"端之间的DNA 序列("尾对尾"方向),而另一条寡核苷酸引物可以扩增Alu "5'"端与Alu "5'"端之间 的DNA序列("头对头"方向)。这些DNA复制子经过高通量测序仪器检测,达到集中检测基因组中基因区SNP及发现基因组中基因区新SNP的目的。下面描述用本发明的方法可以 集中检测基因区SNP的实例。 方法的第一步是用苯酚/氯仿法提取人类基因组DNA,并用乙醇纯化。纯化后的 DNA被稀释到一定浓度,按实验要求,所加DNA浓度通常为10 50ng/iU。所选取的寡核苷 酸引物位于AluY共同序列中。其中,"尾对尾"方向扩增的寡核苷酸引物位于AluY共同序列 的第182位到第200位,碱基为"5'-AGGCTGAGGCAGGAGAATG-3';"头对头"方向扩增的寡核苷 酸引物位于AluY共同序列的第66位到第86位,碱基为"5' -TGGTCTCGATCTCCTGACCTC-3'。 在inter-Alu PCR反应中, 一个具体实例为,每个PCR反应体系的总体积为20iU,包括 5xMastermix(10xPCR扩增缓冲液(500mM KCl,100mM Tris-Cl,15mM MgCl2) , 50mM MgCl2,及 腦4种dNTP混合液)4iil,5iiM "尾对尾"或"头对头"方向扩增的寡核苷酸引物1 iU, 热稳定DNA聚合酶O. lyl,50ng/ul经人类基因组DNA2iil,及去离子水12. 9iU。 PCR扩增 反应包括95t:变性5分钟,而后35个扩增循环又包括95t:变性30秒,"头对头"扩增方向 的寡核苷酸引物需要66.3t:退火30秒("尾对尾"扩增方向的寡核苷酸引物需要66.8°C 退火30秒),72t:延伸2分钟;最后72t:延伸5分钟终止反应。反应完毕后,取10 y L进行 1. 5%琼脂糖凝胶电泳,通过溴乙锭染色,在紫外灯下观察扩增产物的形态及质量。图4为 经紫外灯所观察到的扩增后DNA复制子在琼脂糖凝胶中的影像。扩增所产生的阶梯状影像 对比DNA分子标记(lkb),显示扩增条带主要在300bp到2kb之间。选取两个寡核苷酸引物 分别扩增人类基因组DNA,并通过切胶的方法分离出DNA复制子中的7个大小在450bp到 2kb之间的DNA复制子,最终获得每个条带的总质量〉10iig。这些DNA复制子通过以新一 代测序技术为基础的高通量测序仪器测出372Mb的DNA序列数据。此后,借助小片段寡核 苷酸分析软件包(SOAPalinger)的组装,形成长链DNA序列,并通过对比人类基因组序列确 定检测出的各DNA序列的位置。另外,各序列通过BLAST及UCSC数据库比对人类基因组序 列,明确各序列中的SNP及发现新SNP。 经过测序及生物信息学处理,上述实例中inter-Alu PCR扩增产物包括DNA片段 374条,其中153条序列在基因区,占测序所得DNA序列的40X ;而整个基因区在整个基因 组中的比率只有25% ,这结果证明了 Alu主要集中于基因区,而通过inter-Alu PCR扩增的 两个Alu之间的序列也多集中于基因区。此外,在整个基因组中基因数量约为25, 000个, 而现已知肿瘤相关基因数量为6522个,占整个基因总数的26%。在本实例中的所有基因 区序列所在的基因为128个,其中75个基因为肿瘤相关性基因,占总测序所涵盖的基因数 量的58% 。通过BLAST及UCSC数据库对比人类基因组序列,发现包括非基因区在内的SNP 数量为262个,其中新SNP为42个。因此证明该方法可以提供更多量基因区SNP的信息。
实施例2 实施例2与实施例1相似,区别在于,此实施例主要集中于对多基因疾病相关性的 研究,利用该方法检测基因区SNP、插入/缺失与疾病的关系,特别是通过"外显子捕获"对 基因区外显子中的SNP、插入/缺失与疾病的关系进行分析。为获得肿瘤基因组复制错误 (implication error)的表型特征及更多测序数据,选取将AluY共同序列中靠近"3'"端的 序列作为寡核苷酸引物,引物扩增方向为"尾对尾"。图5显示的是该寡核苷酸引物的序列 及所在AluY中的位置。寡核苷酸引物的位置在Alu共同序列中的第278位到第295位。碱 基为"5' -GAGCGAGACTCCGTCTCA-3'"。将此寡核苷酸引物与前述"头对头"方向扩增的寡核苷酸弓I物,碱基为"5' -TGGTCTCGATCTCCTGACCTC-3'"及Alu共同序列弓|物Rl2A/267,碱基为 "5'-AGCGAGACTCCG-3'"按照一定比例进行混合。在inter-Alu PCR中,通过热稳定DNA聚 合酶的作用,任何一个寡核苷酸引物便可以与被检测的模板DNA在适当的序列位置互补, 形成杂交的核酸结构。然后,在此聚合条件下,以四种核苷酸(A、 G、 T、 C)延伸寡核苷酸引 物,以碱基互补原则,在热稳定DNA聚合酶的催化下与需要扩增的模板链进行连接,从而达 到复制模板链的目的。图6显示的是3个寡核苷酸引物的扩增方向。依据Alu的方向性, 其中AluY共同序列的一条寡核苷酸引物和Alu共同序列寡核苷酸引物R12A/267可以扩增 一个Alu "3'"端与另一个Alu "3'"端之间的DNA序列("尾对尾"方向),而另一条AluY 共同序列的寡核苷酸引物可以扩增一个Alu "5'"端与另一个Alu "5'"端之间的DNA序列 ("头对头"方向)。混合寡核苷酸引物还可以扩增一个Alu "5'"端与另一个Alu "3'"端 之间的DNA序列("头对尾"方向),以及一个Alu "3'"端与另一个Alu "5'"端之间的DNA 序列("尾对头"方向)。单一AluY "尾对尾"方向扩增的寡核苷酸引物可通过inter-Alu PCR扩增肿瘤组织DNA和对照组织DNA,通过DNA琼脂糖凝胶电泳显示出两组扩增产物中的 差异,即复制错误表型(r印licationerror)。多寡核苷酸引物的inter-Alu PCR扩增出的 这些DNA复制子经过高通量测序仪器检测,可获得与肿瘤相关的基因SNP、点突变,插入/缺 失片段的信息。 —个具体实例为,第一步是用苯酚/氯仿法提取患者肿瘤组织和肿瘤对照 组织(包括外周血)DNA,并用乙醇纯化。纯化后的DNA被稀释到一定浓度,按实验要 求所加DNA浓度为50ng/iU。所选取的寡核苷酸引物位于AluY共同序列的尾部,其 位置与碱基序列如前所述,为AluY共同序列中的第278位到第295位。碱基序列为 "5' -GAGCGAGACTCCGTCTCA-3'","尾对尾"方向扩增。在inter-Alu PCR反应中,每个 PCR反应体系的总体积为20ii 1,包括5x Mastermix(10x PCR扩增缓冲液(500mM KCl, lOOmM Tris-Cl,15mM MgCl2) , 50mM MgCl2,及10mM 4禾中dNTP混合液)4 ii 1, 5 ii M引物 AluYTl 1. 2iil,热稳定DNA聚合酶0. liil,50ng/iil经人类基因组DNA 2iU,及去离子水 12. 7 ill 。 PCR扩增反应包括95。C变性5分钟,而后35个扩增循环又包括95。C变性30秒, 寡核苷酸引物需要67t:退火30秒,72t:延伸2分钟;最后72t:延伸5分钟终止反应。反应 完毕后,20yL进行1.5%琼脂糖凝胶电泳,通过溴乙锭染色,在紫外灯下观察扩增产物的 形态及质量。图7为经紫外灯所观察到的扩增后肿瘤组织DNA复制子与对照外周血DNA复 制子在琼脂糖凝胶中的影像,箭头指出,复制错误表型出现在胶质细胞瘤各亚型中。
进一步获得丰富的肿瘤相关的基因区SNP、点突变,插入/缺失片段信息,需要多 Alu家族共同序列寡核苷酸引物参与的inter-Alu PCR反应,集中扩增基因组中基因区,所 得DNA复制子通过以新一代测序技术为基础的高通量测序仪器检测基因区SNP、点突变, 插入/缺失与肿瘤之间的关系。具体为,上述三个寡核苷酸引物,按5 : 3 : l混合后加 入PCR反应中。在inter-Alu PCR反应中,每个PCR反应体系的总体积为20 yl,包括5x Mastermix(10x PCR扩增缓冲液(500mM KCl,100mM Tris-Cl,15mM MgCl2) , 50mM MgCl2, 及10mM 4种dNTP混合液)4iil,5iiM AluY共同序列"尾对尾"扩增方向寡核苷酸引物 1.5iil,5iiMAluY共同序列"头对头"扩增方向寡核苷酸引物0.9ia,5iiM Alu共同序列 "尾对尾"扩增方向寡核苷酸引物R12A/267 0. 3iU,热稳定DNA聚合酶0. liil,10ng/iil人 类基因组DNA lyl,及去离子水12. 2iU。 PCR扩增反应包括95。C变性5分钟,而后20个扩增循环又包括95t:变性30秒,多寡核苷酸引物需要57.『C退火30秒,72。C延伸2分钟; 最后72t:延伸5分钟终止反应。反应完毕后,取5 ii L与50%甘油混合后进行1. 5%琼脂糖 凝胶电泳,在紫外灯下观察扩增产物的形态及质量。图8为经紫外灯所观察到的扩增后肿 瘤组织DNA复制子与对照外周血DNA复制子在琼脂糖凝胶中的影像,为白色斑片状影。该 实例中,仅需要750ng的模板DNA通过inter-Alu PCR反应及纯化步骤,即可产生大于3 y g 的DNA复制子。该DNA复制子可满足高通量测序仪器的检测要求,生成比实例1更多的集 中于基因区的序列,用于分析肿瘤基因组基因区的SNP、点突变,插入/缺失与肿瘤的关系。 同样可借助小片段寡核苷酸分析软件包(SOAPalinger)的组装,形成长链DNA序列,并通过 对比人类基因组序列确定检测出的各DNA序列的位置。另外,各序列通过BLAST及UCSC数 据库比对人类基因组序列,确定各序列中的SNP在肿瘤与对照基因组DNA中的差别,点突变 的位置,也可以确定肿瘤组织DNA插入/缺失的位置。 —个特殊实施例为,上述多寡核苷酸引物inter-Alu PCR产物经纯化后,利用"外 显子捕获"技术仅分析基因区外显子中的SNP、点突变,插入/缺失与肿瘤之间的关系。具 体为,通过捕获外显子的载体pETV-SD是一种反转录病毒穿梭载体(shuttle vector)。 因为凡是有内含子和外显子的基因在转录后都要经过RNA剪接,这就需要有剪接供体 (splicing donor, SD)位点和剪接受体(splicingacc印tor, SA)位点。DNA复制子被超声 打断成小片段后,克隆在载体位于"外显子捕获序列"下游的克隆位点上。而后,将这些重 组载体汇总后感染反转录病毒的专宿包装细胞系(ecotropicretroviral packaging cell line)——V2细胞系。V2细胞提供蛋白质产物使载体(自身不能合成病毒蛋白质)成 为反转录病毒在细胞里增殖。当反转录病毒在细胞内转录时,如果插入片段中包含有功 能的SA位点,则有可能发生RNA剪接反应而将IVS切除。已剪接和未剪接的病毒RNA都 包装在病毒子(virion)中,从细胞培养液中收集后用来感染兼宿反转录病毒包装细胞系 (卿hotropic retroviral packagingcell line)PA-317。这使反转录病毒再进行一轮复 制,并产生能感染猴肾细胞系COS细胞的高效价病毒原种。从第二个细胞系PA-317细胞中 分离得到的病毒,用来感染组成型产生SV40T(肿瘤)抗原的C0S细胞。病毒RNA基因组被 反转录,并在载体上的SV40复制起点作用下,以环状DNA附加体形式进行复制。从C0S细胞 中回收复制的附加体DNA,经限制性内切酶Dpn I酶切后转化细菌。在含卡那霉素(Kn)和 5_氯_4-溴-3-吲哚-13 -D-半乳糖苷(X-gal)的培养基上挑选转化子。卢_半乳糖苷酶 可水解X-gal而生成蓝色产物。因此,不产生P-半乳糖苷酶的转化子菌落则呈白色。只挑 选出白色菌落作进一步研究的材料。准确的剪接反应可切除作为标记的IVS,使人口 -珠蛋 白基因的第l外显子与落入了捕获陷阱的插入片段中的外显子序列连接。这样通过高通量 测序技术可以检测用于分析肿瘤基因组基因区外显子中的SNP、点突变,插入/缺失与肿瘤 的关系。同样可借助小片段寡核苷酸分析软件包(S0APalinger)的组装,形成长链DNA序 列,并通过对比人类基因组序列确定检测出的各DNA序列的位置。另外,各序列通过BLAST 及UCSC数据库比对人类基因组序列,确定各序列中的SNP在肿瘤与对照基因组DNA中的差 别,点突变的位置,也可以确定肿瘤组织DNA插入/缺失的位置。
实施例3 该实施例与实施例1及实施例2也有相似性。因为绝大多数的5-甲基胞嘧啶 (5mC)主要集中于富含CpG位点的重复序列Alu家族中,并且据估计,在整个人类基因组,
12Alu家族可包含多达33X的CpG位点。既往研究表明,在肿瘤基因组中,Alu序列中的某些 特殊CpG位点甲基化水平出现显著性降低,这一现象在AluY亚家族中尤为突出。此外,在 精神分裂症的相关研究中,我们发现,AluY序列内及其周围区域的某些CpG位点甲基化水 平亦出现显著性改变。因此,在本实施例中,为研究各类疾病中基因区CpG位点甲基化水平 改变程度,需要对所选取的AluY寡核苷酸引物的位置进行调整。因为DNA在经过亚硫酸氢 盐预处理后,未被甲基化的CpG位点中的"C"会转换成"T",所以核苷酸引物不能包括CpG 位点,并且需要将所选取位置中的非CpG位点中的"C"转换为"T"。另外,为了包含更多的 Alu区域序列,所选择的AluY共同序列需更靠近共同序列的中间区域。如图9中显示,选取 AluY共同序列中靠近中间区域的两段不含CpG位点的序列作为引物。命名其中一条寡核 苷酸引物为CH11,其扩增方向朝向"5'",长度为llbp。该寡核苷酸引物可以进行"头对头" 方向扩增,即一个Alu "5'"端与另一个Alu "5'"端之间的DNA序列。命名另一条寡核苷 酸引物为CT11,其扩增方向朝向"3'",长度为llbp。该寡核苷酸引物可以进行"尾对尾"方 向扩增,即一个Alu "3'"端与另一个Alu "3'"端之间的DNA序列。CH11和CT11两个寡核 苷酸引物作用于同一个inter-Alu PCR反应,可以扩增一个Alu "5'"端与另一个Alu "3'" 端之间的DNA序列("头对尾"方向),以及一个Alu "3'"端与另一个Alu "5'"端之间的 DNA序列("尾对头"方向)。 因为经亚硫酸氢盐预处理后的非甲基化"C"全部转换成"T"。所以,将设计的2条 寡核苷酸引物CHll与CTll中的"C"全部转换为"T"。图10中所示的是2个AluY共同序 列寡核苷酸引物中"C"变"T"的具体位置。2个AluY共同序列寡核苷酸引物经过将"C"转 换成"T"后,它们的序列分别是CHll "5'TTTAATAAAAA 3'",CT11 "5'AACATCAAAAT 3'"。 图11与图6显示的3个寡核苷酸引物的inter-Alu PCR扩增方向相同,所得PCR产物依据 Alu寡核苷酸引物扩增的方向性,可包括一个Alu "3'"端与另一个Alu "3'"端之间的DNA 序列("尾对尾"方向), 一个Alu "5'"端与另一个Alu "5'"端之间的DNA序列("头对头" 方向);一个Alu "5'"端与另一个Alu "3'"端之间的DNA序列("头对尾"方向)以及一 个Alu "3'"端与另一个Alu "5'"端之间的DNA序列("尾对头"方向)。所示实施例中,2 个不同方向的AluY共同序列寡核苷酸引物扩增经亚硫酸氢盐预处理后的肿瘤组织和对照 组织(包括外周血)基因组DNA,可产生上述4种不同的扩增产物。如图ll所示,扩增产物 包括"头对头"、"尾对尾"、"头对尾"及"尾对头"4个方向的DNA复制子。经DNA琼脂糖凝 胶电泳检测,扩增产物显示为白色斑片影。具体为,取900ng基因组DNA加入0. 3M氢氧化 钠(NaOH)并放置于42°C ,持续20分钟。之后在95。C放置3分钟,(TC放置1分钟。此后,上 述样品加入ra为5. 0的焦亚硫酸钠(2. 0M)及对苯二酚(0. 5mM),上层覆盖矿物油,放置于 55°C ,持续16小时。经亚硫酸氢盐预处理后的DNA经过纯化,可通过inter-Alu PCR反应 进行扩增。每个PCR反应体系的总体积为20iU,包括5x Mastermix(10x PCR扩增缓冲液 (500mM KCl,100mM Tris-Cl,15mM MgCl2) , 50mM MgCl2,及10mM 4种dNTP混合液)4 ii 1, 5uM 引物CHll liil,5uM引物CT11 lyl,热稳定DNA聚合酶O. 1 yl, 10ng/yl经亚硫酸氢盐预 处理后的基因组DNA 2iU,及去离子水11.9iU。 PCR扩增反应包括95t:变性5分钟,而 后20个扩增循环又包括95。C变性30秒,52。C退火30秒,72。C延伸2分钟;最后72。C延伸5 分钟终止反应。因为经过亚硫酸氢盐预处理过的基因组DNA为单链DNA,所以在inter-Alu PCR反应中不容易扩增。因此需要重复进行上述inter-Alu PCR反应,以增加DNA复制子的质量。反应完毕后,取5ii L与50%甘油混合后进行1. 5%琼脂糖凝胶电泳,在紫外灯下 观察扩增产物的质量。所获得的DNA复制子是集中于基因区Alu及Alu周围区域的DNA片 段。在图12中,新一代测序技术仅需要3ii gPCR产物,就可以检测到经亚硫酸氢盐预处理 后的DNA序列,甲基化的"C"不会产生变化,而非甲基化的"C"会转变成T。此后,经过前述 小片段寡核苷酸分析软件包(SOAPalinger)的组装,形成长链DNA序列,并通过对比人类基 因组序列确定检测出的各DNA序列的位置。另外,各序列通过BLAST及UCSC数据库比对人 类基因组序列,确定各序列中基因区肿瘤与对照基因组DNA CpG位点中的"C"甲基化程度 是否存在差别。 上述实施例3亦可用于对其他疾病的甲基化水平改变的探索,也就是说,虽然在 实施例1中,高通量测序仪器的测序结果显示,58%的基因区序列所属基因为肿瘤相关基 因,但是所有的基因均存在与各类疾病相关的可能性,因此,该方法可以扩展到对其他疾病 基因区特征的研究中。
权利要求
以Alu间聚合酶链式反应为基础的检测基因区特征的方法,包括以下步骤(1)以Alu家族共同序列为主要寡核苷酸引物,利用单一或多寡核苷酸引物作为引物对样本DNA进行inter-Alu PCR扩增;(2)采用循环阵列合成测序法为基础的高通量测序仪器进行测序;(3)对测序结果进行基因组中基因区单核苷酸多态性(SNP)、点突变,插入/缺失及双脱氧核苷酸分子(DNA)甲基化CpG位点的检测。
2. 根据权利要求1所述的方法,其特征是所述被扩增的样本DNA为多个两Alu序列 间的DNA片段。
3. 根据权利要求l所述的方法,其特征是所述步骤(1)的样本DNA是利用苯酚/氯 仿法提取组织或外周血分离的白细胞中的DNA,提取后的DNA使用琼脂糖凝胶电泳,通过溴 乙锭染色,在紫外灯下观察DNA提取质量。
4. 根据权利要求l所述的方法,其特征是以AluY共同序列中的片段设计的寡核 苷酸引物,其序列为5' -GAGCGAGACTCCGTCTCA-3',5' -TGGTCTCGATCTCCTGACCTC-3或 5, -TGGTCTCGATCTCCTGACCTC-3,。
5. 根据权利要求1所述的方法,其特征是以AluY共同序列寡核苷酸引物及Alu共同 序列引物R12A/267的混合物作为引物,以扩增更多基因区序列。
6. 根据权利要求1所述的方法,其特征是所述inter-Alu PCR使用热稳定DNA聚合酶。
7. 根据权利要求1所述的方法,其特征是在进行DNA CpG位点甲基化水平的检测时, DNA需要亚硫酸氢盐的处理。
8. 根据权利要求7所述的方法,其特征是inter-Alu PCR以AluY共同序列中靠 近中间区域的两段不含CpG位点的序列作为引物,引物CHll朝向"5'"方向扩增,长度 为11bp,序列为"5' TTTAATAAAAA 3'" ;CTll朝向"3'"方向扩增,长度为llbp,序列为 "5' AACATCAAAAT 3",。
9. 根据权利要求7所述的方法,其特征是在进行DNA CpG位点甲基化水平的检测时, 新一代测序技术检测对比经亚硫酸氢盐处理后的肿瘤及非肿瘤基因组DNA甲基化水平差 异,主要检测区域为富含CpG位点的基因组Alu区域及Alu旁区域。
10. 根据权利7所述的方法,其特征是以AluY或Alu共同序列中任意位置的不含CpG 位点的序列经过"C"转换为"T"后,作为寡核苷酸引物。
全文摘要
本发明涉及集中扩增并检测基因组DNA基因区的方法,目的在于探明基因组中基因区的特征。这些特征包括单核苷酸多态性(SNP)、点突变,序列插入/缺失及双脱氧核苷酸分子(DNA)甲基化CpG位点的水平。该方法以Alu家族,特别是AluY亚家族共同序列为主要寡核苷酸引物,利用多寡核苷酸引物Alu间聚合酶链式反应(inter-Alu PCR)扩增基因组DNA,扩增DNA复制子多集中于基因组中各基因区。该方法的特点在于,通过inter-Alu PCR可过滤掉部分非基因区序列,使新一代测序技术集中检测基因区的SNP、点突变,序列插入/缺失及DNA甲基化CpG位点的水平,并可节省测序所需基因组DNA用量。
文档编号C12Q1/68GK101792808SQ20101013948
公开日2010年8月4日 申请日期2010年3月30日 优先权日2010年3月30日
发明者梅玲玲, 薛红 申请人:广州市香港科大霍英东研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1