一种血浆中游离的目标dna低频突变富集测序方法

文档序号:9344403阅读:1169来源:国知局
一种血浆中游离的目标dna低频突变富集测序方法
【技术领域】
[0001] 本发明属于生物信息学高通量测序技术领域,具体涉及一种血浆中游离的目标 DNA低频突变富集测序方法。
【背景技术】
[0002] 近年来肿瘤患者血液中游离ctDNA(Cell-free Circulating Tumor DNA)的基因 检测诊断已成为研究热点,研究显示血液中循环肿瘤DNA有可能成为一种新的肿瘤早期诊 断,预后判断以及精确医疗的标志物。检测血液中循环游离DNA中的肿瘤标志物具有区别 于传统组织肿瘤标志物的检测方式,具有无创、随时监控和早期筛查等优势,并且对循环游 离DNA的取样检测避免了当前分子诊断需要采集癌组织作为标本来源的困难,是一种很有 潜力的肿瘤标志物。然而在循环血中除了肿瘤游离DNA,也存在正常组织游离DNA,且因个 体差异,肿瘤发生发展时期,治疗时期等原因,循环DNA的总量不定,且往往较癌组织相应 频率低得多,尤其早期阶段的癌症血浆ctDNA的丰度甚至在0. 01 %水平,因此在血浆ctDNA 的临床应用中,低频突变的精确检测是目前亟待解决的问题。
[0003] 为高效实现对血浆ctDNA低频突变的精确检测以及应用潜能的充分发 掘,富集扩增技术与高灵敏的检测技术的有力结合是必须的,然而目前相关技术如 preMiDTM,CAPP-Seq,DuplexSequencing等只能一定程度实现低频变异的检出,其相关实 际应用或多或少仍存在一定局限性。preMiDTM融合突变偏向性扩增ARMS、荧光定量PCR 和高分辨熔解曲线分析HRM3种技术于一体,实现对非细胞体系的血浆微量突变检测,但 是其检测灵敏度只能达到1%左右,而且只针对一些热点变异进行基因分析;CAPP-Seq的 技术原理是将高通量测序技术与目标区域捕获技术结合起来应用于血浆ctDNA,对样本进 行靶向捕获后再进行深度测序,基于相关数据过滤处理,不仅可以获得更多基因变异信息, 而且可以得到0. 2%以上,98 %的高特异低频变异结果,但其距离基于血浆ctDNA的早期 筛查,仍具有不小的差距。DuplexSequencing基于UID(uniqueidentifier)标签进行正 反双链纠错,几乎可以矫正所有类型的测序错误,其检测到的突变频率可以达到10 7,但是 该技术存在一个巨大的限制性,其需要相对常规测序更高的测序通量,而且针对血浆ctDNA 的高通量测序以解决0. 01%左右的稀有突变检测,巨大的样品需求也是一个挑战。

【发明内容】

[0004] 本发明提供一种血浆中游离的目标DNA低频突变富集测序方法以克服现有技术 的不足。
[0005] 本发明提供的一种血浆中游离的目标DNA低频突变富集测序方法,包括以下步 骤:
[0006] (1)血浆目标DNA的提取与文库构建;
[0007] (2)通用文库TT-COLDPCR扩增富集;
[0008] (3)探针富集捕获、杂交捕获产物的扩增与上机测序;
[0009] (4)正反双链纠错低频信息分析。
[0010] 本发明方法的流程图见图1。
[0011] 其中,步骤(1)所述的血浆来自人类外周血,文库构建方法按照3步酶促反应,即 末端修复,加"A"和文库接头连接。
[0012] 文库接头使用的引物为:
[0013] 接头第一链:TACACTCTITCCCTACACGACGCTCTTCCGATCT,
[0014] 接头第二链:GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。
[0015] 本发明方法中,步骤(2)通用文库TT-COLD PCR扩增富集包括以下步骤:1)确定 文库的Tm值;
[0016] 2)绕过每个插入片段存在的特异Tc值,基于1对通用引物,在1个系列的循环条 件下,对文库中所有片段上的各种突变类型进行富集;设定Tc min~TM-2. 5,之后Tc以 0. 5°C逐步递增,在每个Tc条件下分别进行FULL COLD PCR。
[0017] 进一步地,文库Tm值通过以下方法来确定,对血浆目标DNA的文库采用一对引物 使用荧光定量PCR,根据溶解曲线分析获得文库Tm值;所述引物的序列为:
[0018] 上游引物:
[0019] AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
[0020] 下游引物:
[0021] CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其 中 xxxxxxxx 为 index 标签。
[0022] 上述步骤2)中,所述1对通用引物为通用文库TT-COLD PCR引物,其核苷酸序列 为:
[0023] 上游引物:AATGATACGGCGACCACCGAGATCTACACTCTTTCC
[0024] CTACACGACGCTCTTCCGATCT,
[0025] 下游引物:
[0026]CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其 中 xxxxxxxx 为 index 标签。
[0027] 上述步骤2)中,所述1个系列循环条件为:
[0028]
[0029]
[0030] 本发明方法中,步骤(3)所述探针富集捕获是将扩增后的文库质控合格后,采用 富集探针芯片进行杂交捕获,并对杂交捕获产物进行PCR扩增,然后进行上机测序;
[0031] 富集探针芯片的设计方法为:基于目的基因的用途确定芯片捕获区间,参考目标 DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该 位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位 点总探针覆盖水平所占的比例;针对热点变异,将基于人基因组参考序列hgl9设计的探针 替换为基于突变碱基设计的探针,其他位点探针不变,同时热点变异探针总覆盖度与其他 区域正常探针覆盖度的差异比例不少于3 :1,从而实现捕获时对热点变异的富集。
[0032] 本发明方法中,步骤(4)正反双链纠错低频信息分析(RealSeq Pipeline)具体方 法为:
[0033] 1)基于测序结果,截取成对测序序列中的测序序列一的如12bp喊基和测序序列 二的前12bp碱基作为标签,且根据字母序排列以较小的标签在前连接成24bp的一条索引, 同时根据标签的排列组合方式,选定正链和反链
[0034] 2)对索引进行外部排序,以达到将同一个DNA模板的所有测序重复测序序列聚集 到一起的目的;
[0035] 3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明 距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的 汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
[0036] 4)对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序 列数都达到2对以上,则进行后续分析;
[0037] 5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板 的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序 序列中的一致率也达到80 %,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便 得到了代表原始DNA模板序列的新测序序列;
[0038] 6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测 序序列;
[0039] 7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布, 统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率;
[0040] 8)Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对,用mutect流 程 call somatic SNV 变异;用 gatk 流程 call somatic InDel 变异;用 contra, py 流程 call CNV ;用 somVar 流程 call SV ;
[0041] 所使用的筛选参数为:对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突 变预测P值< 〇. 05 ;
[0042] 9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已 有变异数据库中的该变异的情况。
[0043] 进一步地,上述步骤1)中,基于插入片段两端的序列碱基作为标签,所述插入片 段是文库中与接头引物相连接的DNA片段,经双末端测序,每个片段将形成一对成对测序 序列;将成对测序序列的测序序列1的如12bp喊基和测序序列2的如12bp喊基作为标签, 字母序排列以较小的标签在前连接成24bp的一条索引,并且以这24bp作为成对测序序列 的索引,测序序列1的标签在前就标记成正链;测序序列2的标签在前就标记为反链。
[0044] 本发明提供了一种血浆中游离的目标DNA低频突变富集测序试剂盒,其含有富集 探针芯片,所述芯片上探针是将基于人基因组参考序列hgl9设计的探针替换为基于突变 碱基设计的探针,其他位点探针不变,且热点变异探针总覆盖度与其他区域正常探针覆盖 度的差异至少为3:1 ;
[0045] 基于目标DNA突变碱基设计探针的原则为:基于目的基因的用途确定芯片捕获区 间,参考目标DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点, 同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作 为其在该位点总探针覆盖水平所占的比例。
[0046] 本发明提供了一种血浆中ctDNA低频突变富集测序系统,包括如下操作单元:
[0047] (1)血浆ctDNA的提取与文库构建单元;
[0048] (2)通用文库TT-COLD PCR扩增富集单元;
[0049] (3)探针富集捕获单元、杂交捕获产物的扩增单元与上机测序单元;
[0050](4)正反双链纠错低频信息分析单元。
[0051] 其中,操作单元(1)血浆ctDNA的提取与文库构建具体操作为:抽取早期患者外周 血5-10mL,常温或4°C存于EDTA抗凝管中,在4-6小时内对外周血进行分离,得到血浆和白 细胞,白细胞提取的DNA之后将作为对照用于体细胞突变的检出;血浆cfDNA/ctDNA的提取 与定量;按照常规建库方法进行3步酶促反应:末端修复,加"A"和文库接头连接。
当前第1页1 2 3 4 5 
网友询问留言 已有1条留言
  • 访客 来自[江苏省常州市电信] 2020年03月02日 10:23
    ctDNA是循环肿瘤DNA,是原发肿瘤甚至是转移形成的新肿瘤上的细胞破裂掉落下来的DNA片段,对于肿瘤早筛、用药和预后都非常有意义,ctDNA的提取目前用的比较多的是离心法和磁珠法,我们实验室用BIOG cfDNA Enri Kit离心法提取目标DNA,能处理的1.0ML的样本,磁珠法只能处理0.1-0.5ml血液,而且样品处理成本较高
    0
1