一种血浆中游离的目标dna低频突变富集测序方法_3

文档序号:9344403阅读:来源:国知局
止密码子获得突变:也被称为无义突变,指由于某个碱基的改变使代表某种氨基酸的密码 子突变为终止密码子,从而使肽链合成提前终止。本发明所述的终止密码子丧失突变:指由 于某个碱基的改变使终止密码子突变未其他密码子,从而使肽链合成无法正常终止。
[0100] 实施例1血浆中目标DNA低频突变富集测序方法(ER-seq方法)
[0101] (1)血浆目标DNA的提取与文库构建;所述的血浆来自人类外周血,文库构建方法 按照3步酶促反应,即末端修复,加"A"和文库接头连接。文库接头使用的引物为:
[0102] 接头第一链:TACACTCTITCCCTACACGACGCTCTTCCGATCT,
[0103] 接头第二链:GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。
[0104] (2)通用文库TT-COLD PCR扩增富集;包括以下步骤:
[0105] 1)确定文库的Tm值;文库Tm值通过以下方法来确定,对血衆目标DNA的文库采 用一对引物使用荧光定量PCR,根据溶解曲线分析获得文库Tm值;所述引物的序列为:
[0106] 上游引物:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
[0107] 下游引物:CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTC CGATCT,其中 xxxxxxxx 为 index 标签。
[0108] 2)绕过每个插入片段存在的特异Tc值,基于1对通用引物,在1个系列的循环条 件下,对文库中所有片段上的各种突变类型进行富集;设定Tc min~TM-2. 5,之后Tc以 0. 5°C逐步递增,在每个Tc条件下分别进行FULL COLD PCR。
[0109] 所述1对通用引物为通用文库TT-COLD PCR引物,其核苷酸序列为:上游引物:AAT GATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,下游引物:CAAGCAGAAGAC GGCATACGAGATxxxxxxxxGTGACTGGAGITCAGACGTGTGCTCTTCCGATCT,其中 xxxxxxxx 为 index 标 签。
[0110] 所述1个系列循环条件为:
[0111]
[0112]
[0113] (3)探针富集捕获、杂交捕获产物的扩增与上机测序;探针富集捕获是将扩增后 的文库质控合格后,采用富集探针芯片进行杂交捕获,并对杂交捕获产物进行PCR扩增,然 后进彳丁上机测序;
[0114] 富集探针芯片的设计方法为:基于目的基因的用途确定芯片捕获区间,参考目标 DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该 位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位 点总探针覆盖水平所占的比例;针对热点变异,将基于人基因组参考序列hgl9设计的探针 替换为基于突变碱基设计的探针,其他位点探针不变,同时热点变异探针总覆盖度与其他 区域正常探针覆盖度的差异比例不少于3 :1,从而实现捕获时对热点变异的富集。
[0115] (4)正反双链纠错低频信息分析(RealSeq Pipeline)具体方法为:
[0116] 1)基于插入片段两端的序列碱基作为标签,所述插入片段是文库中与接头引物相 连接的DNA片段,经双末端测序,每个片段形成一对成对测序序列;将成对测序序列的测序 序列1的如12bp喊基和测序序列2的如12bp喊基作为标签,字母序排列以车父小的标签在 前连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在 前就标记成正链;测序序列2的标签在前就标记为反链;
[0117] 2)对索引进行外部排序,以达到将同一个DNA模板的所有测序重复测序序列聚集 到一起的目的;
[0118] 3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明 距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的 汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
[0119] 4)对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序 列数都达到2对以上,则进行后续分析;
[0120] 5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板 的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序 序列中的一致率也达到80 %,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便 得到了代表原始DNA模板序列的新测序序列;
[0121] 6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测 序序列;
[0122] 7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布, 统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率;
[0123] 8)Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对,用mutect流 程 call somatic SNV 变异;用 gatk 流程 call somatic InDel 变异;用 contra, py 流程 call CNV ;用 somVar 流程 call SV ;
[0124] 所使用的筛选参数为:对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突 变预测P值< 〇. 05 ;
[0125] 9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已 有变异数据库中的该变异的情况。
[0126] 实施例2血浆中ctDNA低频突变富集测序方法的建立
[0127] 1、血浆ctDNA的提取与文库构建:
[0128] (1)抽取受检者外周血1-2管(5mL/管)于EDTA抗凝管中,轻柔上下颠倒(防止 细胞破裂),6-8次充分混匀,在采血当天4-6小时内进行以下处理;在4°C条件下1600g离 心10分钟,离心后将上清(血浆)分装到多个1.5mL/2mL离心管中,在吸取过程中不能吸 到中间层白细胞;在4°C条件下16000g离心10分钟,去除残余细胞,将上清(血浆)转移 至噺的1.5mL/2mL离心管中,不能吸到管底白细胞,即得到分离后所需血浆;血浆样本处理 完后,分离得到的血浆及剩余血细胞均保存到-80 °C冰箱中,避免反复冻融。
[0129] (2)血浆cfDNA/ctDNA的提取与定量:取分离出的血浆约2-3ml,按照QIAamp Circulating Nucleic Acid Kit (Qiagen)提取试剂说明书,进行血衆cfDNA的提取。 Qubit (Invitrogen,the Quant-iT? dsDNA HS Assay Kit)定量所提取的 DNA,总量约为 30 ~50ng。
[0130] (3)样品文库的制备:血浆中提取的cfDNA,之后按照KAPA LTP Library Preparation Kit建库说明书,进行3步酶促反应。
[0131] 3.1末端修复
[0132]
[0133] 充分混合,20°C孵育30min。
[0134] 之后,加入Agencourt AMPure XP reagent 120 y L,进行磁珠纯化,最后回溶 42 y L ddH20,带磁珠进行下一步反应。
[0135] 3. 2 加 A
[0136] CN 105063208 A ^ m TJ 18/33页
[0137]
[0138] 之后加入PEG/NaCl SPRI溶液90 y L,充分混合,进行磁珠纯化,最后回溶(35-接 头)y L ddH20,带磁珠进行下一步反应。
[0139] 3. 3接头连接
[0140]
[0141] 接头引物见表1中的接头第一、二链。之后分别加入PEG/NaCl SPRI溶液50 y L 2 次,进行2次磁珠纯化,最后回溶25 y L ddH20。
[0142] 2、通用文库 IT-COLD PCR :
[0143] 1)基于相同的仪器和试剂,对正常人血浆连接文库采用通用文库引物使用荧光定 量PCR,反应试剂包括:KAPA HiFi HotStart ReadyMix以及SYBR染料。从溶解曲线分析, 获得文库的Tm值(DNA解链温度),如图2所示;所述通用文库引物见表1。
[0144] 表1引物序列信息
[0145]
[0147] 注:xxxxxxxx: index 标签
[0148] 2)通用文库TT COLD PCR :反应体系为:
[0149]
[0150] 绕过每个插入片段存在的特异Tc值,基于表1中的1对通用文库引物,在1个系 列的循环条件下,对文库中所有片段上的各种突变类型进行富集。该方法具体为由经验公 式给出Tc min~TM-2. 5,之后Tc以0. 5°C逐步递增,在每个Tc条件下分别进行FULL COLD PCR。PCR反应程序设置,见表2。
[0151] 表 2
[0152]
[0153]
[0154] 3、探针富集捕获与上机测序:
[0155] 1)肿瘤富集探针芯片设计:
[0156] 基于TCGA、ICGC、COSMIC等数据库和相关文献参考,参考常规芯片捕获探针设计 原则,确定芯片捕获区间;
[0157] 在捕获区间内,参考TCGA、COSMIC等相关数据库,在每200BP范围内,确定1个最 重要的热点变异位点(SNV>3);同时针对该位点存在的多种突变类型,以几种主要类型作 为参考,基于其相应的发生频率作为其在该位点总探针覆盖水平上所占的比例;
[0158] 芯片设计时,针对相关热点变异,将原先基于REF设计的探针全部替换为基于突 变碱基进行设计,其他探针不变,同时热点变异探针总覆盖度与其他区域正常探针覆盖度 的差异至少为3 :1,从而实现捕获时对热点变异的富集。
[0159] 2)扩增后文库质控并进行富集探针捕获,之后进行杂交捕获产物的扩增与上机测 序。
[0160] 扩增后文库质控合格后并采用上述肿瘤富集探针芯片,参照芯片制造商(Roche) 提供的说明书进行杂交捕获。最后洗脱回溶21 yL ddH20带杂交洗脱磁珠。
[0161] 杂交捕获产物的扩增体系:
[0162]
当前第3页1 2 3 4 5 
网友询问留言 已有1条留言
  • 访客 来自[江苏省常州市电信] 2020年03月02日 10:23
    ctDNA是循环肿瘤DNA,是原发肿瘤甚至是转移形成的新肿瘤上的细胞破裂掉落下来的DNA片段,对于肿瘤早筛、用药和预后都非常有意义,ctDNA的提取目前用的比较多的是离心法和磁珠法,我们实验室用BIOG cfDNA Enri Kit离心法提取目标DNA,能处理的1.0ML的样本,磁珠法只能处理0.1-0.5ml血液,而且样品处理成本较高
    0
1