一种血浆中游离的目标dna低频突变富集测序方法_5

文档序号：9344403阅读：来源：国知局

LD PCR。4. 根据权利要求3所述的方法，其特征在于，步骤1)文库的Tm值通过以下方法来确定，对正常人血浆中游离的目标DNA连接文库采用1对引物使用荧光定量PCR，根据溶解曲线分析获得文库Tm值；所述1对引物的核苷酸序列为：上游引物： AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT，下游引物： CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT，其中 XXXXXXXX 为index标签。5. 根据权利要求3所述的方法，其特征在于，步骤2)所述的1对通用引物为通用文库 TT-COLD PCR引物，其核苷酸序列为：上游引物： AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT，下游引物： CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT，其中 XXXXXXXX 为index标签D6. 根据权利要求3所述的方法，其特征在于，所述1个系列循环条件为：7. 根据权利要求1-6任一所述的方法，其特征在于，步骤（3)所述探针富集捕获是将扩增后的文库质控合格后，采用富集探针芯片进行杂交捕获，并对杂交捕获产物进行PCR扩增，然后进行上机测序；富集探针芯片的设计方法为：基于目的基因的用途确定芯片捕获区间，参考目标DNA 所属的数据库，在一定碱基范围内，确定至少1个最重要的热点变异位点，同时针对该位点存在的多种突变类型，以几种主要类型作为参考，基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例；针对热点变异，将基于人基因组参考序列hgl9设计的探针替换为基于突变碱基设计的探针，其他位点探针不变，同时热点变异探针总覆盖度与其他区域正常探针覆盖度的差异比例不少于3 :1，从而实现捕获时对热点变异的富集。8. 根据权利要求1-6任一所述的方法，其特征在于，步骤（4)正反双链纠错低频信息分析，具体方法为： 1) 基于测序结果，截取成对测序序列中的测序序列1的如12bp喊基和测序序列2的如 12bp碱基作为标签，且根据字母序排列以较小的标签在前连接成24bp的一条索引，同时根据标签的排列组合方式，选定正链和反链； 2) 对索引进行外部排序，以达到将同一个DNA模板的所有测序序列聚集到一起的目的； 3) 对聚集起来的拥有相同索引的测序序列进行中心聚类，根据其序列之间的汉明距离，将每个有相同索引的大簇聚集成若干个小簇，每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的； 4) 对步骤3)中获得的同一个DNA模板的重复簇进行筛选，若正链和反链的测序序列数都达到2对以上，则进行后续分析； 5) 对满足4)中条件的簇进行纠错，并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基，若某种碱基型在正链的测序序列中的一致率达到80 %，且在反链测序序列中的一致率也达到80 %，则记新测序序列的这个碱基为此碱基型，否则记为N，这样便得到了代表原始DNA模板序列的新测序序列； 6) 将新测序序列用bwa mem算法重新比对到基因组上，筛除比对质量小于30的测序序列； 7) 根据6)中得到的测序序列进行统计，得到捕获区域内每个位点的碱基型分布，统计目标区域覆盖大小、平均测序深度，正反链互配率，低频突变率； 8. Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对，用mutect流程 call somatic SNV 变异；用 gatk 流程 call somatic InDel 变异；用 contra, py 流程 call CNV ;用 somVar 流程 call SV ; 所使用的筛选参数为：对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突变预测P值彡〇. 05 ; 9) 变异注释：注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。9. 根据权利要求8所述的方法，其特征在于，步骤1)中，基于插入片段两端的序列碱基作为标签，经双末端测序，每个片段将形成一对成对测序序列；将成对测序序列的测序序列1的如12bp喊基和测序序列2的如12bp喊基作为标签，字母序排列以车父小的标签在如连接成24bp的一条索引，并且以这24bp作为成对测序序列的索引，测序序列1的标签在前就标记成正链；测序序列2的标签在前就标记为反链。10. -种血浆中游离的目标DNA低频突变富集测序试剂盒，其特征在于，含有富集探针芯片，芯片上探针是将基于人基因组参考序列hgl9设计的探针替换为基于突变碱基设计的探针，其他位点探针不变，且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1 ; 基于目标DNA突变碱基设计探针的方法为：根据目的基因的用途确定芯片捕获区间，参考目标DNA所属的数据库，在一定碱基范围内，确定至少1个最重要的热点变异位点，同时针对该位点存在的多种突变类型，以几种主要类型作为参考，基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例。11. 一种血浆中CtDNA低频突变富集测序的系统，包括： (1) 血浆中CtDNA文库构建单元； (2) 通用文库TT-COLD PCR扩增富集单元； (3) 探针富集捕获单元、杂交捕获产物的扩增与上机测序单元； (4) 正反双链纠错低频信息分析单元。12. 如权利要求11所述的系统，其特征在于，单元（2)的通用文库TT-COLD PCR扩增富集单元是基于通用引物对所有类型变异实现第一级突变富集扩增；所述通用引物的核苷酸序列为：上游引物： AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT，下游引物： CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT，其中 XXXXXXXX 为index标签。13. 如权利要求11所述的系统，其特征在于，单元（3)的探针富集捕获单元是针对热点变异通过富集探针芯片实现第二次富集捕获，所述富集探针芯片上探针是将原先基于人基因组参考序列hgl9设计的探针替换为基于突变碱基设计的探针，其他位点探针不变，且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1 ; 基于CtDNA突变碱基设计探针的原则为：基于TCGA、ICGC、COSMIC数据库确定芯片捕获区间，参考TCGA、ICGC、COSMIC数据库，在每200bp碱基范围内，确定至少1个最重要的热点变异位点，同时针对该位点存在的多种突变类型，以几种主要类型作为参考，基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例。14. 如权利要求11-13任一所述的系统，其特征在于，单元（4)的正反双链纠错低频信息分析单元是： 1) 基于插入片段两端的序列碱基作为标签，所述插入片段是文库中与接头引物相连接的DNA片段，经双末端测序，每个片段将形成一对成对测序序列；将成对测序序列的测序序列1的如12bp喊基和测序序列2的如12bp喊基作为标签，字母序排列以车父小的标签在如连接成24bp的一条索引，并且以这24bp作为成对测序序列的索引，测序序列1的标签在前就标记成正链；测序序列2的标签在前就标记为反链； 2) 对索引进行外部排序，以达到将同一个DNA模板的所有测序序列聚集到一起的目的； 3) 对聚集起来的拥有相同索引的测序序列进行中心聚类，根据其序列之间的汉明距离，将每个有相同索引的大簇聚集成若干个小簇，每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的； 4) 对步骤3)中获得的同一个DNA模板的重复簇进行筛选，若正链和反链的测序序列数都达到2对以上，则进行后续分析； 5) 对满足4)中条件的簇进行纠错，并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基，若某种碱基型在正链的测序序列中的一致率达到80%，且在反链测序序列中的一致率也达到80 %，则记新测序序列的这个碱基为此碱基型，否则记为N，这样便得到了代表原始DNA模板序列的新测序序列； 6) 将新测序序列用bwa mem算法重新比对到基因组上，筛除比对质量小于30的测序序列； 7) 根据6)中得到的测序序列进行统计，得到捕获区域内每个位点的碱基型分布，统计目标区域覆盖大小、平均测序深度，正反链互配率，低频突变率； 8. Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对，用mutect流程 call somatic SNV 变异；用 gatk 流程 call somatic InDel 变异；用 contra, py 流程 call CNV ;用 somVar 流程 call SV ; 所使用的筛选参数为：对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突变预测P值彡〇. 05 ; 9)变异注释：注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。15. 权利要求1-9任一所述的方法或权利要求11-14任一所述的系统在制备疾病早期筛查试剂盒中的应用。16. 如权利要求15所述的应用，其特征在于，所述的疾病为肿瘤。17. 权利要求1-9任一所述的方法或权利要求11-14任一所述的系统在制备疾病术后监控试剂盒中的应用。18. 权利要求1-9任一所述的方法或权利要求11-14任一所述的系统在制备疾病用药指导试剂盒中的应用。
【专利摘要】本发明提供了一种血浆中游离的目标DNA低频突变富集测序方法，包括血浆DNA提取与文库构建、通用文库TT？COLD？PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析，具体为基于通用引物进行TT？COLD？PCR对所有类型变异实现第一级突变富集扩增；设计富集探针芯片，针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针，其他位点探针不变，进行第二级富集捕获；基于文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对，提高数据利用率，实现低频精确检测。本发明方法操作简便，实用性强，可以对0.01％低频变异具有高特异性检测。
【IPC分类】C12Q1/68
【公开号】CN105063208
【申请号】CN201510487759
【发明人】吕小星, 易鑫, 赵美茹, 管彦芳, 刘涛, 杨玲
【申请人】北京吉因加科技有限公司
【公开日】2015年11月18日
【申请日】2015年8月10日

完整全部详细技术资料下载

当前第5页1 2 3 4 5