一种血浆中游离的目标dna低频突变富集测序方法

文档序号：9344403阅读：1169来源：国知局

一种血浆中游离的目标dna低频突变富集测序方法
【技术领域】
[0001] 本发明属于生物信息学高通量测序技术领域，具体涉及一种血浆中游离的目标 DNA低频突变富集测序方法。
【背景技术】
[0002] 近年来肿瘤患者血液中游离ctDNA(Cell-free Circulating Tumor DNA)的基因检测诊断已成为研究热点，研究显示血液中循环肿瘤DNA有可能成为一种新的肿瘤早期诊断，预后判断以及精确医疗的标志物。检测血液中循环游离DNA中的肿瘤标志物具有区别于传统组织肿瘤标志物的检测方式，具有无创、随时监控和早期筛查等优势，并且对循环游离DNA的取样检测避免了当前分子诊断需要采集癌组织作为标本来源的困难，是一种很有潜力的肿瘤标志物。然而在循环血中除了肿瘤游离DNA，也存在正常组织游离DNA，且因个体差异，肿瘤发生发展时期，治疗时期等原因，循环DNA的总量不定，且往往较癌组织相应频率低得多，尤其早期阶段的癌症血浆ctDNA的丰度甚至在0. 01 %水平，因此在血浆ctDNA 的临床应用中，低频突变的精确检测是目前亟待解决的问题。
[0003] 为高效实现对血浆ctDNA低频突变的精确检测以及应用潜能的充分发掘，富集扩增技术与高灵敏的检测技术的有力结合是必须的，然而目前相关技术如 preMiDTM,CAPP-Seq，DuplexSequencing等只能一定程度实现低频变异的检出，其相关实际应用或多或少仍存在一定局限性。preMiDTM融合突变偏向性扩增ARMS、荧光定量PCR 和高分辨熔解曲线分析HRM3种技术于一体，实现对非细胞体系的血浆微量突变检测，但是其检测灵敏度只能达到1%左右，而且只针对一些热点变异进行基因分析；CAPP-Seq的技术原理是将高通量测序技术与目标区域捕获技术结合起来应用于血浆ctDNA，对样本进行靶向捕获后再进行深度测序，基于相关数据过滤处理，不仅可以获得更多基因变异信息，而且可以得到0. 2%以上，98 %的高特异低频变异结果，但其距离基于血浆ctDNA的早期筛查，仍具有不小的差距。DuplexSequencing基于UID(uniqueidentifier)标签进行正反双链纠错，几乎可以矫正所有类型的测序错误，其检测到的突变频率可以达到10 7,但是该技术存在一个巨大的限制性，其需要相对常规测序更高的测序通量，而且针对血浆ctDNA 的高通量测序以解决0. 01%左右的稀有突变检测，巨大的样品需求也是一个挑战。

【发明内容】

[0004] 本发明提供一种血浆中游离的目标DNA低频突变富集测序方法以克服现有技术的不足。
[0005] 本发明提供的一种血浆中游离的目标DNA低频突变富集测序方法，包括以下步骤：
[0006] (1)血浆目标DNA的提取与文库构建；
[0007] (2)通用文库TT-COLDPCR扩增富集；
[0008] (3)探针富集捕获、杂交捕获产物的扩增与上机测序；
[0009] (4)正反双链纠错低频信息分析。
[0010] 本发明方法的流程图见图1。
[0011] 其中，步骤（1)所述的血浆来自人类外周血，文库构建方法按照3步酶促反应，即末端修复，加"A"和文库接头连接。
[0012] 文库接头使用的引物为：
[0013] 接头第一链：TACACTCTITCCCTACACGACGCTCTTCCGATCT，
[0014] 接头第二链：GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。
[0015] 本发明方法中，步骤（2)通用文库TT-COLD PCR扩增富集包括以下步骤：1)确定文库的Tm值；
[0016] 2)绕过每个插入片段存在的特异Tc值，基于1对通用引物，在1个系列的循环条件下，对文库中所有片段上的各种突变类型进行富集；设定Tc min~TM-2. 5,之后Tc以 0. 5°C逐步递增，在每个Tc条件下分别进行FULL COLD PCR。
[0017] 进一步地，文库Tm值通过以下方法来确定，对血浆目标DNA的文库采用一对引物使用荧光定量PCR，根据溶解曲线分析获得文库Tm值；所述引物的序列为：
[0018] 上游引物：
[0019] AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT，
[0020] 下游引物：
[0021] CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT，其中 xxxxxxxx 为 index 标签。
[0022] 上述步骤2)中，所述1对通用引物为通用文库TT-COLD PCR引物，其核苷酸序列为：
[0023] 上游引物：AATGATACGGCGACCACCGAGATCTACACTCTTTCC
[0024] CTACACGACGCTCTTCCGATCT，
[0025] 下游引物：
[0026]CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT，其中 xxxxxxxx 为 index 标签。
[0027] 上述步骤2)中，所述1个系列循环条件为：
[0028]
[0029]
[0030] 本发明方法中，步骤（3)所述探针富集捕获是将扩增后的文库质控合格后，采用富集探针芯片进行杂交捕获，并对杂交捕获产物进行PCR扩增，然后进行上机测序；
[0031] 富集探针芯片的设计方法为：基于目的基因的用途确定芯片捕获区间，参考目标 DNA所属的数据库，在一定碱基范围内，确定至少1个最重要的热点变异位点，同时针对该位点存在的多种突变类型，以几种主要类型作为参考，基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例；针对热点变异，将基于人基因组参考序列hgl9设计的探针替换为基于突变碱基设计的探针，其他位点探针不变，同时热点变异探针总覆盖度与其他区域正常探针覆盖度的差异比例不少于3 :1，从而实现捕获时对热点变异的富集。
[0032] 本发明方法中，步骤（4)正反双链纠错低频信息分析（RealSeq Pipeline)具体方法为：
[0033] 1)基于测序结果，截取成对测序序列中的测序序列一的如12bp喊基和测序序列二的前12bp碱基作为标签，且根据字母序排列以较小的标签在前连接成24bp的一条索引，同时根据标签的排列组合方式，选定正链和反链
[0034] 2)对索引进行外部排序，以达到将同一个DNA模板的所有测序重复测序序列聚集到一起的目的；
[0035] 3)对聚集起来的拥有相同索引的测序序列进行中心聚类，根据其序列之间的汉明距离，将每个有相同索引的大簇聚集成若干个小簇，每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的；
[0036] 4)对步骤3)中获得的同一个DNA模板的重复簇进行筛选，若正链和反链的测序序列数都达到2对以上，则进行后续分析；
[0037] 5)对满足4)中条件的簇进行纠错，并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基，若某种碱基型在正链的测序序列中的一致率达到80%，且在反链测序序列中的一致率也达到80 %，则记新测序序列的这个碱基为此碱基型，否则记为N，这样便得到了代表原始DNA模板序列的新测序序列；
[0038] 6)将新测序序列用bwa mem算法重新比对到基因组上，筛除比对质量小于30的测序序列；
[0039] 7)根据6)中得到的测序序列进行统计，得到捕获区域内每个位点的碱基型分布，统计目标区域覆盖大小、平均测序深度，正反链互配率，低频突变率；
[0040] 8)Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对，用mutect流程 call somatic SNV 变异；用 gatk 流程 call somatic InDel 变异；用 contra, py 流程 call CNV ;用 somVar 流程 call SV ;
[0041] 所使用的筛选参数为：对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突变预测P值< 〇. 05 ;
[0042] 9)变异注释：注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。
[0043] 进一步地，上述步骤1)中，基于插入片段两端的序列碱基作为标签，所述插入片段是文库中与接头引物相连接的DNA片段，经双末端测序，每个片段将形成一对成对测序序列；将成对测序序列的测序序列1的如12bp喊基和测序序列2的如12bp喊基作为标签，字母序排列以较小的标签在前连接成24bp的一条索引，并且以这24bp作为成对测序序列的索引，测序序列1的标签在前就标记成正链；测序序列2的标签在前就标记为反链。
[0044] 本发明提供了一种血浆中游离的目标DNA低频突变富集测序试剂盒，其含有富集探针芯片，所述芯片上探针是将基于人基因组参考序列hgl9设计的探针替换为基于突变碱基设计的探针，其他位点探针不变，且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1 ;
[0045] 基于目标DNA突变碱基设计探针的原则为：基于目的基因的用途确定芯片捕获区间，参考目标DNA所属的数据库，在一定碱基范围内，确定至少1个最重要的热点变异位点，同时针对该位点存在的多种突变类型，以几种主要类型作为参考，基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例。
[0046] 本发明提供了一种血浆中ctDNA低频突变富集测序系统，包括如下操作单元：
[0047] (1)血浆ctDNA的提取与文库构建单元；
[0048] (2)通用文库TT-COLD PCR扩增富集单元；
[0049] (3)探针富集捕获单元、杂交捕获产物的扩增单元与上机测序单元；
[0050](4)正反双链纠错低频信息分析单元。
[0051] 其中，操作单元（1)血浆ctDNA的提取与文库构建具体操作为：抽取早期患者外周血5-10mL，常温或4°C存于EDTA抗凝管中，在4-6小时内对外周血进行分离，得到血浆和白细胞，白细胞提取的DNA之后将作为对照用于体细胞突变的检出；血浆cfDNA/ctDNA的提取与定量；按照常规建库方法进行3步酶促反应：末端修复，加"A"和文库接头连接。

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吕小星;易鑫;赵美茹;管彦芳;刘涛;杨玲;
技术所有人：北京吉因加科技有限公司;
我是此专利的发明人

上一篇：一种外泌体miRNA的定量检测方法
上一篇：转基因大豆mon87705的lamp检测引物组、试剂盒及检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。