全基因组Alu元件检测技术的制作方法

文档序号:9762873阅读:2274来源:国知局
全基因组Alu元件检测技术的制作方法
【技术领域】
[0001] 本发明涉及生物技术领域。更具体而言,本发明涉及基因组序列的检测。
【背景技术】
[0002] Alu元件(Aluelement)是基因组中散在的一类重复序列,属于非自主的逆转录转 座子,每个拷贝的大小约300个碱基对。一般认为Alu元件是由逆转座酶连带一段序列插入 到基因组内形成的。每个人的基因组中大约有一百万个Alu元件拷贝,平均每三千个碱基 就有一个Alu插入,基因组异常的Alu插入和Alu的异常剪切重组会导致癌症的发生。目 前,在dbRIP和R印Base数据库中收录了 31个子家族的Alu。现在已知的Alu家族中最多的 子家族包括 AluY、AluYa5、AluYa8、AluYb8 和 AluYb9,其中 AluYa5 占 Alu 的 50% 以上。从 目前的研究结果来看,AluYa5和AluYb8是在基因组中最活跃的子家族。现有方法MEI-seq 利用AluYb8/9子家族特异性引物能够捕获到Alu Yb8/9, MEI-seq原理是先将基因组随机 打断成小片段,之后将末端补平并且加"A"碱基后连接Illumina测序接头。完成接头连接 后使用接头引物和带有生物素标记的AluYb8/9特异性引物序列进行扩增,得到的产物用 带有链霉亲和素的磁珠捕获得到AluYb8/9。
[0003] 该方法因为使用AluYb8/9特异引物扩增,所以只能捕获到大约1/3的Alu序列, 而无法捕获到全部的Alu子家族。并且该方法步骤较多,操作繁琐,耗时较长。
[0004] 因此,本领域需要一种能够捕获到全部Alu子家族的序列的方法。

【发明内容】

[0005] 为了克服现有方法的缺陷,本发明提供了一种新的方法,根据Alu绝大多数子家 族(除了 AluYd3、AluYd3al、AluJo和Alujb这四个含量低于1%并且在基因组中不活跃的 子家族之外,余下的Alu子家族,覆盖达99%以上)共有序列设计引物,利用半巢式PCR特 异性地捕获到几乎全部Alu子家族的序列。
[0006] 本技术方案利用半巢式PCR和Alu所有家族(除了 AluYd3、AluYd3al、Alujo和 Alujb这四个含量低于1 %并且在基因组中不活跃的子家族)共有引物序列进行Alu扩增。 原理如图1,图中黑色矩形方块代表插入到基因组的Alu元件,巢式PCR第一步用AluTC和 Seedprimer对基因组进行扩增,第二轮PCR用第一轮扩增产物作为样品,用PrimerAluGA和 PE1. 0为引物进行扩增,最终得到Alu序列的3'端序列。选取合适的扩增产物片段回收后 就可以直接测序了。
[0007] 因此,本发明提供了用于半巢式PCR的引物,用于特异性地捕获Alu子家族的序列 的,所述引物包括:
[0008] (1)第一引物,针对Alu共有序列的5'端基因组序列进行设计,其中所述共有序列 在15bp以上,并且具有一定的碱基复杂度和40% -60%的GC含量;
[0009] (2)第二引物,能退火结合到Alu共有序列的3'端基因组序列的随机碱基引物 (SeedPrimer),优选该引物5'端含有测序平台的引物序列,而3'端含有5个锚定碱基并且 紧邻着5-6个随机碱基;
[0010] (3)第三引物,所述引物的3'端能退火到Alu共有序列上,并且靠近Alu共有序列 的3'端序列,所述引物的5'端包含测序平台的引物序列;
[0011] ⑷第四引物,测序平台公用引物,所述引物连接有测序平台的接头序列。
[0012] 本发明提供了一种利用半巢式PCR特异性地捕获Alu子家族的序列的方法,所述 方法包括:利用本发明的引物进行半巢式PCR扩增,其中第一轮PCR的引物是第一引物和第 二引物,第二轮PCR的引物是第三引物和第四引物。
[0013] 在一个具体实施方案中,所述测序平台为高通量测序平台。
[0014] 在一个具体实施方案中,所述高通量测序平台选自Illumina HiSeq2000、 HiSeq2500、MiSeq、MiSeqDx、NextSeq500、Hiseq X ten、Life SOLiD、Ion TorrentPGM、 Proton、Roche 454和单分子测序平台中的至少一种。
[0015] 在一个更具体实施方案中,所述第一引物是SEQ ID N0. 1,或与其有80%以上,优 选90 %以上,更优选95 %以上的序列同一性的序列。
[0016] 在一个更具体实施方案中,所述第二引物选自SEQ ID N0. 2-9,或与其有80%以 上,优选90 %以上,更优选95 %以上的序列同一性的序列。
[0017] 在一个更具体实施方案中,所述第三引物是SEQ ID N0. 10,或与其有80%以上,优 选90 %以上,更优选95 %以上的序列同一性的序列。
[0018] 在一个更具体实施方案中,所述第四引物是SEQ ID N0. 11,或与其有80%以上,优 选90 %以上,更优选95 %以上的序列同一性的序列。
[0019] 本发明的优点至少如下:
[0020] 1.由于半巢式PCR使用的两条半特异性引物都是根据Alu所有子家族(除了 AluYd3、AluYd3al、Alujo和Alujb这四个含量低于1%并且在基因组中不活跃的子家族) 共有的序列设计,因此该方法能够捕获到几乎所有子家族的Alu元件(99%以上Alu子家 族)。
[0021] 2.半巢式PCR需要经过两次针对目标序列不同区域进行扩增,增加了扩增特异 性,获得可信度较高的Alu序列,在具体实例中发明人选择了 7个克隆进行Sanger测序, 其中6条均为Alu元件,结果也证明了该方法的特异性高。
【附图说明】
[0022] 图1.本发明的一个具体实施方案的原理图:图中黑色矩形方块代表插入到基因 组的Alu元件,巢式PCR第一步用AluTC和Seedprimer对基因组进行扩增,第二轮PCR用 第一轮扩增产物作为样品,用PrimerAluGA和PE1. 0为引物进行扩增,最终得到Alu序列。
[0023] 图2.挑选出Alu共有序列的图示。图2A-2B的序列比对统计结果中的Alu序列 来自数据库dbRIP和R印Base,星号表示共有序列,下划线标记为本发明设计的引物位置。
【具体实施方式】
[0024] 下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发 明,而不能理解为对本发明的限制。实施例中未注明具体技术或条件的,按照本领域内的文 献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均 为可以通过市购获得的常规产品。
[0025] 巢式PCR(Nested PCR)是先用一对靶序列的外引物扩增以提高模板量,然后再用 一对内引物扩增以得到特异的PCR带。而半巢式PCR(Semi-NestedPCR)则是巢式PCR的一 种特殊类型,用于扩增比普通PCR小的片断。半巢式PCR使用一条外引物替代内引物。其 中,在基因序列上的相近位点分别设计具有部分相同序列的外引物和内引物,进行扩增,可 认为是广义的半巢式PCR。
[0026] 本发明的引物符合基本的引物设计原则,例如GC含量,序列长度,TM值,引物与 引物之间不能形成发夹结构等等。
[0027] 在本发明中,锚定碱基目的是为了增加引物退火的特异性,根据5-mer碱基 (5-mer指的是将一条基因序列,连续切割,挨个碱基划动得到的序列长度为5的核苷 酸序列)在基因组上出现的频率统计出5-10条出现频率最高的序列命名为SeedPl至 SeedP5_10。
[0028] 在本发明中,"一定的碱基复杂度"是指一段DNA序列的4种碱基所占比例相当,例 如任两种碱基的比例相差不超过5 %,更优选任两种相差不超过2 %,并且不含有简单重复 序列,例如5个以上的AAAAA、CCCCC、GGGGG或TTTTT。
[0029] 在一个具体实施方案中,本发明的技术方案可以描述如下:
[0030] 首先,从数据库(如dbRIP和R印Base)中获取Alu所有家族(除了 AluYd3、 AluYd3al、Alujo和Alujb这四个含量低于1%并且在基因组中不活跃的子家族)的序列, 并从中挑选出Alu共有序列,该序列要求长度在15bp以上,并且具有一定的碱基复杂度和 适当的GC含量(40%-60%)来保证引物设计。挑选出的Alu共有序列如图2所示。
[0031] 其次,针对共有序列进行引物设计。引物设计具有一定复杂度。
[0032] (1)需要符合基本的引物设计原则,如GC含量、序列长度、TM值、引物与引物之间 不能形成发夹结构等等。
[0033] (2)需要确定测序平台的接头序列
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1