一种血浆中游离的目标dna低频突变富集测序方法_5

文档序号:9344403阅读:来源:国知局
LD PCR。4. 根据权利要求3所述的方法,其特征在于,步骤1)文库的Tm值通过以下方法来确 定,对正常人血浆中游离的目标DNA连接文库采用1对引物使用荧光定量PCR,根据溶解曲 线分析获得文库Tm值;所述1对引物的核苷酸序列为: 上游引物: AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, 下游引物: CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中 XXXXXXXX 为index标签。5. 根据权利要求3所述的方法,其特征在于,步骤2)所述的1对通用引物为通用文库 TT-COLD PCR引物,其核苷酸序列为: 上游引物: AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, 下游引物: CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中 XXXXXXXX 为index标签D6. 根据权利要求3所述的方法,其特征在于,所述1个系列循环条件为:7. 根据权利要求1-6任一所述的方法,其特征在于,步骤(3)所述探针富集捕获是将扩 增后的文库质控合格后,采用富集探针芯片进行杂交捕获,并对杂交捕获产物进行PCR扩 增,然后进行上机测序; 富集探针芯片的设计方法为:基于目的基因的用途确定芯片捕获区间,参考目标DNA 所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该位点 存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位点总 探针覆盖水平所占的比例;针对热点变异,将基于人基因组参考序列hgl9设计的探针替换 为基于突变碱基设计的探针,其他位点探针不变,同时热点变异探针总覆盖度与其他区域 正常探针覆盖度的差异比例不少于3 :1,从而实现捕获时对热点变异的富集。8. 根据权利要求1-6任一所述的方法,其特征在于,步骤(4)正反双链纠错低频信息分 析,具体方法为: 1) 基于测序结果,截取成对测序序列中的测序序列1的如12bp喊基和测序序列2的如 12bp碱基作为标签,且根据字母序排列以较小的标签在前连接成24bp的一条索引,同时根 据标签的排列组合方式,选定正链和反链; 2) 对索引进行外部排序,以达到将同一个DNA模板的所有测序序列聚集到一起的目 的; 3) 对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距 离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉 明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的; 4) 对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序列数 都达到2对以上,则进行后续分析; 5) 对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板的每 一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80 %,且在反链测序序列 中的一致率也达到80 %,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到 了代表原始DNA模板序列的新测序序列; 6) 将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序 列; 7) 根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计 目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率; 8. Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对,用mutect流程 call somatic SNV 变异;用 gatk 流程 call somatic InDel 变异;用 contra, py 流程 call CNV ;用 somVar 流程 call SV ; 所使用的筛选参数为:对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突变预 测P值彡〇. 05 ; 9) 变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变 异数据库中的该变异的情况。9. 根据权利要求8所述的方法,其特征在于,步骤1)中,基于插入片段两端的序列碱 基作为标签,经双末端测序,每个片段将形成一对成对测序序列;将成对测序序列的测序序 列1的如12bp喊基和测序序列2的如12bp喊基作为标签,字母序排列以车父小的标签在如 连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前 就标记成正链;测序序列2的标签在前就标记为反链。10. -种血浆中游离的目标DNA低频突变富集测序试剂盒,其特征在于,含有富集探针 芯片,芯片上探针是将基于人基因组参考序列hgl9设计的探针替换为基于突变碱基设计 的探针,其他位点探针不变,且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异 至少为3:1 ; 基于目标DNA突变碱基设计探针的方法为:根据目的基因的用途确定芯片捕获区间, 参考目标DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同 时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为 其在该位点总探针覆盖水平所占的比例。11. 一种血浆中CtDNA低频突变富集测序的系统,包括: (1) 血浆中CtDNA文库构建单元; (2) 通用文库TT-COLD PCR扩增富集单元; (3) 探针富集捕获单元、杂交捕获产物的扩增与上机测序单元; (4) 正反双链纠错低频信息分析单元。12. 如权利要求11所述的系统,其特征在于,单元(2)的通用文库TT-COLD PCR扩增富 集单元是基于通用引物对所有类型变异实现第一级突变富集扩增;所述通用引物的核苷酸 序列为: 上游引物: AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, 下游引物: CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中 XXXXXXXX 为index标签。13. 如权利要求11所述的系统,其特征在于,单元(3)的探针富集捕获单元是针对热点 变异通过富集探针芯片实现第二次富集捕获,所述富集探针芯片上探针是将原先基于人基 因组参考序列hgl9设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,且热 点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1 ; 基于CtDNA突变碱基设计探针的原则为:基于TCGA、ICGC、COSMIC数据库确定芯片捕 获区间,参考TCGA、ICGC、COSMIC数据库,在每200bp碱基范围内,确定至少1个最重要的热 点变异位点,同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的 发生频率作为其在该位点总探针覆盖水平所占的比例。14. 如权利要求11-13任一所述的系统,其特征在于,单元(4)的正反双链纠错低频信 息分析单元是: 1) 基于插入片段两端的序列碱基作为标签,所述插入片段是文库中与接头引物相连接 的DNA片段,经双末端测序,每个片段将形成一对成对测序序列;将成对测序序列的测序序 列1的如12bp喊基和测序序列2的如12bp喊基作为标签,字母序排列以车父小的标签在如 连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前 就标记成正链;测序序列2的标签在前就标记为反链; 2) 对索引进行外部排序,以达到将同一个DNA模板的所有测序序列聚集到一起的目 的; 3) 对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距 离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉 明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的; 4) 对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序列数 都达到2对以上,则进行后续分析; 5) 对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板的每 一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序序列 中的一致率也达到80 %,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到 了代表原始DNA模板序列的新测序序列; 6) 将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序 列; 7) 根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计 目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率; 8. Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对,用mutect流程 call somatic SNV 变异;用 gatk 流程 call somatic InDel 变异;用 contra, py 流程 call CNV ;用 somVar 流程 call SV ; 所使用的筛选参数为:对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突变预 测P值彡〇. 05 ; 9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变 异数据库中的该变异的情况。15. 权利要求1-9任一所述的方法或权利要求11-14任一所述的系统在制备疾病早期 筛查试剂盒中的应用。16. 如权利要求15所述的应用,其特征在于,所述的疾病为肿瘤。17. 权利要求1-9任一所述的方法或权利要求11-14任一所述的系统在制备疾病术后 监控试剂盒中的应用。18. 权利要求1-9任一所述的方法或权利要求11-14任一所述的系统在制备疾病用药 指导试剂盒中的应用。
【专利摘要】本发明提供了一种血浆中游离的目标DNA低频突变富集测序方法,包括血浆DNA提取与文库构建、通用文库TT?COLD?PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析,具体为基于通用引物进行TT?COLD?PCR对所有类型变异实现第一级突变富集扩增;设计富集探针芯片,针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,进行第二级富集捕获;基于文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对,提高数据利用率,实现低频精确检测。本发明方法操作简便,实用性强,可以对0.01%低频变异具有高特异性检测。
【IPC分类】C12Q1/68
【公开号】CN105063208
【申请号】CN201510487759
【发明人】吕小星, 易鑫, 赵美茹, 管彦芳, 刘涛, 杨玲
【申请人】北京吉因加科技有限公司
【公开日】2015年11月18日
【申请日】2015年8月10日
当前第5页1 2 3 4 5 
网友询问留言 已有1条留言
  • 访客 来自[江苏省常州市电信] 2020年03月02日 10:23
    ctDNA是循环肿瘤DNA,是原发肿瘤甚至是转移形成的新肿瘤上的细胞破裂掉落下来的DNA片段,对于肿瘤早筛、用药和预后都非常有意义,ctDNA的提取目前用的比较多的是离心法和磁珠法,我们实验室用BIOG cfDNA Enri Kit离心法提取目标DNA,能处理的1.0ML的样本,磁珠法只能处理0.1-0.5ml血液,而且样品处理成本较高
    0
1