本发明涉及生物医学技术领域,特别是一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用。
背景技术:
血浆游离dna又称cfdna(cellfreedna),是指外周中游离于细胞外的dna,cfdna的来源既包括正常细胞,也有异常细胞(如肿瘤细胞)或者外源的微生物(如病毒dna),具体包括自身正常细胞代谢的凋亡小体,肿瘤细胞碎片,外泌体等。
循环肿瘤dna(circulatingtumordna)ctdna是指外周循环血中含有多种与癌症相关的突变基因,主要由肿瘤细胞脱落或凋亡后释放出而进入循环系统的dna。ctdna来自肿瘤细胞本身,是一种高度灵敏、特异性的特征性肿瘤生物标志物,可通过对其进行基因检测,进行定性、定量以及动态追踪观察肿瘤中发生突变的基因,从而为患者治疗前肿瘤分子分型、靶向治疗决策、治疗过程中肿瘤动态和负荷变化评估,以及实时监测治疗有效性等方面提供有效信息。来自宾夕法尼亚大学abramson癌症中心的研究人员发现,与单独的实体组织ngs检测相比,ngs液体活检能够识别出更多的非小细胞肺癌突变,帮助临床发现更多患者的靶向突变。在检测的靶向突变数量上,液体活检几乎是单独组织活检的两倍。此外,研究结果还表明,通过液体活检检测出靶向突变的患者,对靶向治疗的反应良好,86%的患者完全反应或部分反应,或保持稳定状态。“实体组织活检仍然是准确诊断的关键,但是我们现在已经证明,液体活检项目可以增加诊断价值,而且当实体组织活检无法进行时,它可以作为一种可行的替代方法”,研究作者carpenter说道,“鉴于靶向治疗的快速发展,液体活检应该被纳入常规护理标准。”
然而,精确测序ctdna存在三个巨大的技术障碍:首先是血浆中的ctdna含量极低,且多为小片段分子特点,部分为受损伤的双链dna和单链dna,导致提取较为困难,损失量大,检测灵敏度较低,因此限制了其在临床上的应用。其次是由于后续的建库过程中经过末端修复、腺苷酸化、加接头以及pcr扩增等多步骤后,样本会损失更多,进一步限制了检测灵敏度,因此增加每步实验的效率对提高ctdna的检出灵敏度都至关重要。最后,基于pcr方法的特意扩增或捕获,随着测序深度的提高而存在大量背景噪音,已严重限制了靶向测序技术在更高数据精度要求的检测。
对于某些低丰度,损伤的双链dna和单链dna的检测,以这些额外单链dna作为模板的话可以显著增加目标dna的模板量,有利于最终目的dna捕获。gansauge,mt等发明了一种单链dna建库,该方法在单链模板和单链接头的连接步骤,使用的为circ连接酶ii。该方法解决的这种短片段易降解的古生物dna的建库问题,但连接效率为较低,需要较长的连接时间,成本高。于是他们后续进行了优化,推出新版本ssdna2.0,其更换了接头引物,同时将circ连接酶ii用常规的t4dna连接酶替换,模板用量降低、文库产量和富集度都有扩高,其成本降低近7倍。从建库的效率上来讲,单链建库建库要高很多,相对于基于454平台的双链建库效率要高6倍左右,测序深度高1.9倍左右。
ctdna含量非常少,以10ml外周血为例,从中可以提取到cfdna含量约30ng,ctdna在所有cfdna中的比例非常少,按1%计算,只有约300pg,也就是大约45个细胞裂解的dna量,实际情况下,如果是做早期筛查,ctdna的含量可能相当于5000个细胞中只有1-2个细胞是肿瘤细胞,所以对检测方法的敏感性要求非常高。
同时由于dna的氧化损伤或脱氨基损伤、pcr扩增中dna聚合酶引入的突变(每个碱基出现错误的概率在10-6~10-4之间),尤其是在第一轮扩增引入错误,以及测序仪器读取碱基时引入的错误,测序得到的每个碱基出现错误的概率在10-3~10-2之间,即每1000个碱基就会出现1至10个错误碱基。因此,低于该频率的基因变异将无法准确检测。
目前,已经有针对超低频基因变异检测的建库测序方法,主要是在原始双链dna分子模板两端引入分子标签序列uniquemolecularidentifiers(umi)。根据这些分子标签,可以在去除冗余的过程中将pcr和测序等过程中带来的系统突变排除掉,可以大大降低低频突变的假阳性率。已有大量文章或商业化产品引入分子标签技术。在没有分子条形码技术之前,受制于常规技术的局限,二代测序的用户通常将变异检测域值设置为3-5%的等位基因频率,而sureselectxths大大提高了变异检出的灵敏度,可以检测突变频率<1%的稀有变异。
因此,需要结合上面的两项技术,对现有的超低频基因变异检测的建库测序方法进行改进,以提高对超低频基因变异检测的灵敏度,本发明解决这样的问题。
技术实现要素:
为解决现有技术的不足,本发明的目的在于提供一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用,本发明通过单链dna建库,解决现有检测技术中对液态活检特别是ctdna片段短、浓度低、碎片化、灵敏度低技术问题;其次基于分子标签技术和单链文库建库特点,实现准确辨别基因组坐标始末位点相同的测序reads是来自同一还是多个原始细胞释放出来的cfdna,并将来源于同一个细胞的原始正负链的测序reads配对起来分析的目的,从而降低测序重复工作,提高对假阳性突变的分辨率。
为了实现上述目标,本发明采用如下的技术方案:
一种单链分子标签接头,包括:14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火变性会形成茎环结构。
一种单链dna建库方法,包括如下步骤:
3’末端接头的制备;
5’末端接头的制备;
样本核酸在磷酸酶的作用下去磷酸化及变性处理:高温处理,将原来双链的dna变性为单链dna;
3’端接头连接:将单链dna产物和3’端双链dna接头进行碱基配对,并头进行连接反应;
3’端接头连接链霉亲和素:将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附,固定在链霉亲和素磁珠上;
延伸:将连接过链霉亲和素的单链连接产物为模板,将3’末端接头作为引物进行延伸,获得双链dna产物;
5’端接头连接:将双链dna产物和5’端双链dna接头进行分子间的双链连接;
链霉亲和素清洗及文库洗脱回收。
前述的一种单链dna建库方法,
3’末端接头的制备的具体过程如下:
制备pcr试剂,pcr试剂的配方包括:
用移液器将pcr试剂混匀,瞬时离心将样品收集至管底,再将样品置于pcr仪中,pcr程序如下:
95℃1min,
95℃-10℃-0.1℃/sec,
10℃5min。
前述的一种单链dna建库方法,
上链序列采用cl78(seqidno.1),序列为:
5’pho-agatcggaag[c3spacer]10-teg-biotin3’,该接头序列5’端磷酸化修饰,3’端生物素化修饰,中间引入10个c3相隔臂和teg分子;
下链序列采用cl93(seqidno.2),序列为:
5’amc12-aacttccgatctnnnnnn-amc73’,该接头序列5’端采用aminolinkerc12修饰,3’端含有6个随机核苷酸组成简并碱基,且末端aminolinkerc7修饰;
下链序列采用cl106(seqidno.3),序列为:
5’amc12-aacttccgatctnnnnnn-amc33’,3’端含有6个随机核苷酸组成简并碱基,且末端aminolinkerc3修饰;
下链序列采用cl110(seqidno.4),序列为:
5’spacerc12-aa[spacerc12]cttccgatctnnnnnn-amc63’,5’端和中间含有aminolinkerc12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端aminolinkerc6修饰;
下链序列采用cl136(seqidno.5),序列为:
5’spacerc12-aa[spacerc12]cttccgatctnnnnnnn-amc63’,5’端和中间含有aminolinkerc12修饰,3’端含有7个随机核苷酸组成简并碱基,且末端aminolinkerc6修饰;
下链序列采用cl137(seqidno.6),序列为:
5’spacerc12-aa[spacerc12]cttccgatctnnnnnnnn-amc63’,5’端和中间含有aminolinkerc12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端aminolinkerc6修饰。
前述的一种单链dna建库方法,
5’末端接头的制备的具体过程如下:
pcr试剂包括:
用移液器将pcr试剂混匀,瞬时离心将样品收集至管底,再将样品置于pcr仪中,pcr程序如下:
95℃1min,
95℃-14℃-0.1℃/sec,
14℃5min。
前述的一种单链dna建库方法,
上链序列或下链序列为:接头序列bell_adatpor或接头序列bell_ta_adapter;
bell_adatpor的序列为:
5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctc3'(seqidno.9),
bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成平末端的茎环结构;
bell_ta_adapter的序列为:
5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctct3'(seqidno.10),
bell_ta_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成带t的粘末端茎环结构。
前述的一种单链dna建库方法,
上链序列采用cl53(seqidno.7),序列为:5’cgacgctcttc-ddc3',3'端双脱氧修饰;
下链序列采用cl73(seqidno.8),序列为:
5’pho-ggaagagcgtcgtgtagggaaagag*t*g*t*a3',3'端末位4个碱基硫代修饰。
前述的一种单链dna建库方法,
延伸的具体过程如下:
配制延伸反应液,延伸反应液的配方包括:
将具有连接过链霉亲和素的单链连接产物的磁珠加入延伸反应液,再加入2~5μl聚合酶,混匀,瞬时离心将样品收集至管底,再将样品置于pcr仪中,pcr程序如下:
25℃5min,
35℃25min;
洗涤,移除上清;
聚合酶采用klenowfragment或klenowfragmentexo-。
前述的一种单链dna建库方法,
3’末端接头的制备;
5’末端接头的制备;
样本核酸在磷酸酶的作用下去磷酸化及变性处理:高温处理,将原来双链的dna变性为单链dna;
3’端接头连接:将单链dna产物和3’端双链dna接头进行碱基配对,并头进行连接反应;
3’端接头连接链霉亲和素:将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附,固定在链霉亲和素磁珠上;
延伸:将连接过链霉亲和素的单链连接产物为模板,3’端接头已知序列设计引物进行延伸,获得双链dna产物;
5’端接头连接:将双链dna产物和5’端双链dna接头进行分子间的双链连接;
去除脱氧尿嘧啶核苷;
链霉亲和素清洗及文库洗脱回收。
一种单链分子标签接头在检测循环肿瘤dna中的应用,包括如下内容:
提取检测血浆中游离的cfdna;
3’末端接头的制备;
采用单链分子标签接头进行5’末端接头的制备,所述单链分子标签接头,包括:14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火变性会形成茎环结构;
样本核酸在磷酸酶的作用下去磷酸化及变性处理:高温处理,将原来双链的dna变性为单链dna;
3’端接头连接:将单链dna产物和3’端双链dna接头进行碱基配对,并头进行连接反应;
3’端接头连接链霉亲和素:将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附,固定在链霉亲和素磁珠上;
延伸:将连接过链霉亲和素的单链连接产物为模板,3’端接头已知序列设计引物进行延伸,获得双链dna产物;
5’端接头连接:将双链dna产物和5’端双链dna接头进行分子间的双链连接;
链霉亲和素清洗及文库洗脱回收。
本发明的有益之处在于:
本发明提供了针对液态活检特别是cfdna二代测序文库构建时,有效回收单链和受损伤的模板dna,进行独特的单链建库的二代测序文库构建。现在的cfdna二代测序技术,绝大部分用常规的双链dna文库构建的方法,只能够检测没有受损伤的双链dna,本发明的方法通过单链建库的方法成功实现单链和受损伤的cfdna的建库,同时模板用量降低、文库产量和富集度都有扩高。
本发明通过单链建库,将起始模板放大,可以用于10-100个位点甚至1000个位点的靶向捕获/靶向扩增。同时,由于cfdna断裂的随机性,基于单链建库后,通过正反引物配合通用引物,能很大程度提供捕获的效率,特别是基于pcr方法特意扩增捕获,单侧引物结合概率是双侧引物结合概率的一倍。
本发明提供了8个随机核苷酸分子标签接头,基因组坐标始末位点相同的dna片段加上完全相同的8个随机核苷酸分子标签接头的概率极低,那么对于基因组坐标始末位点相同的测序reads,就很容易判断它们来自同一还是多个原始细胞释放出来的cfdna,从而降低测序重复工作。同时,对单一单链文库进行建库,可以有效的将来自同一个双链dna模板的正链和负链匹配,排除pcr导致的错误,提高了对假阳性的分辨率,从而保证了对cfdna中超低频突变的检测能力并矫正其扩增错误和测序错误。经过分子标签技术、背景去噪和正负链修正结合去噪之后,其背景噪音降到万分之一,且可以检测突变频率为0.02%的样本,与目前基于杂交探针法捕获技术检测灵敏度相当(即0.02%-0.05%)。因此,能有效地降低大量背景噪音,降低假阳性率、提高结果的准确性。
附图说明
图1为核酸序列bell_adaptor退火后二级结构图;
图2为核酸序列bell_ta_adaptor退火后二级结构图;
图3为线性5’末端接头构建文库的流程图,其中singlestranddissociation为单链变性之后再dephosphorylation(去磷酸化),经过primerannealing(引物退火)及t4dnaligase(t4dna连接酶)连接,然后固定到streptavidinmagneticbeads(链霉亲的磁珠),后续经primerannealing(引物退火)及klenowfragmen的amplification(扩增过程),形成双链,与亚玲结构的接头(8-ntbarcode),在t4dna连接酶(t4dnaligase)将接头连接上去,5端接头被user酶(userdigestion)移除u碱基,最后用p5/p7引物扩增文库(p5primer/p7primer);
图4为茎环接头构建的平末端文库的流程图,其中singlestranddissociation为单链变性之后再dephosphorylation(去磷酸化),经过primerannealing(引物退火)及t4dnaligase(t4dna连接酶)连接,然后固定到streptavidinmagneticbeads(链霉亲的磁珠),后续经primerannealing(引物退火)及klenowfragmen的amplification(扩增过程),形成双链,与亚玲结构的接头(8-ntbarcode),在t4dna连接酶(t4dnaligase)将接头连接上去,5端接头被user酶(userdigestion)移除u碱基,最后用p5/p7引物扩增文库(p5primer/p7primer);
图5为茎环接头构建的ta连接文库的流程图,其中singlestranddissociation为单链变性之后再dephosphorylation(去磷酸化),经过primerannealing(引物退火)及t4dnaligase(t4dna连接酶)连接,然后固定到streptavidinmagneticbeads(链霉亲的磁珠),后续经primerannealing(引物退火)及klenowfragmen的amplification(扩增过程),形成双链,与亚玲结构的接头(8-ntbarcode),在t4dna连接酶(t4dnaligase)将接头连接上去,5端接头被user酶(userdigestion)移除u碱基,最后用p5/p7引物扩增文库(p5primer/p7primer);
图6为基于单链文库构建的文库大小分布图,其中横坐标为样本迁移的时间(migrationtime),纵坐标是为样本的荧光信号(rfu);
图7为线性5’末端接头构建文库read覆盖度全图;
图8为茎环接头构建的平末端文库read覆盖度全图;
图9为茎环接头构建的ta连接文库read覆盖度全图;
图10为本发明实验三中ddpcr和单链建库等位基因突变频率比较示意图,其中横坐标为数字pcr检测到的突变频率(multantfrequence(%)),纵坐标是为基于ngs检测到的突变频率(multantfrequence(%));
图11为本发明实验四中来源于血浆中游离的ctdna经单链建库,靶向扩增后的文库与来源于肿瘤基因组(tumordna,tdna)的10个位点的突变信息比对结果图,其中横坐标为基因,纵坐标为突变频率。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
一种单链分子标签接头,包括:14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火变性会形成茎环结构。
作为一种实施例,包括:bell_adatpor和bell_ta_adapter;
bell_adatpor的序列为:
5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctc3'(seqidno.9),
bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成平末端的茎环结构;如图1为核酸序列bell_adaptor退火后二级结构图。
bell_ta_adapter的序列为:
5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctct3'(seqidno.10),
bell_ta_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成带t的粘末端茎环结构,图2为核酸序列bell_ta_adaptor退火后二级结构图。
作为一种实施例,如下演示一种单链dna建库方法,包括如下步骤:
一,3’末端接头的制备
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,按以下程序操作。
需要说明的是:上文只是一种实施例,上链序列和下链序列还可以采用如下所示的实施例;
上链序列采用cl78(seqidno.1),序列为:
5’pho-agatcggaag[c3spacer]10-teg-biotin3’,该接头序列5’端磷酸化修饰,3’端生物素化修饰,中间引入10个c3相隔臂和teg分子;
下链序列采用cl93(seqidno.2),序列为:
5’amc12-aacttccgatctnnnnnn-amc73’,该接头序列5’端采用aminolinkerc12修饰,3’端含有6个随机核苷酸组成简并碱基,且末端aminolinkerc7修饰;
下链序列采用cl106(seqidno.3),序列为:
5’amc12-aacttccgatctnnnnnn-amc33’,3’端含有6个随机核苷酸组成简并碱基,且末端aminolinkerc3修饰;
下链序列采用cl110(seqidno.4),序列为:
5’spacerc12-aa[spacerc12]cttccgatctnnnnnn-amc63’,5’端和中间含有aminolinkerc12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端aminolinkerc6修饰;
下链序列采用cl136(seqidno.5),序列为:
5’spacerc12-aa[spacerc12]cttccgatctnnnnnnn-amc63’,5’端和中间含有aminolinkerc12修饰,3’端含有7个随机核苷酸组成简并碱基,且末端aminolinkerc6修饰;
下链序列采用cl137(seqidno.6),序列为:
5’spacerc12-aa[spacerc12]cttccgatctnnnnnnnn-amc63’,5’端和中间含有aminolinkerc12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端aminolinkerc6修饰。
二,5’末端接头的制备
上链序列采用cl53(seqidno.7),序列为:5’cgacgctcttc-ddc3',3'端双脱氧修饰;
下链序列采用cl73(seqidno.8),序列为:
5’pho-ggaagagcgtcgtgtagggaaagag*t*g*t*a3',3'端末位4个碱基硫代修饰。
优选接头序列bell_adatpor,优选接头序列bell_ta_adatpor,
上链序列或下链序列为:接头序列bell_adatpor或接头序列bell_ta_adapter;
bell_adatpor的序列为:
5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctc3'(seqidno.9),
bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成平末端的茎环结构;
bell_ta_adapter的序列为:
5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctct3'(seqidno.10),
bell_ta_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成带t的粘末端茎环结构。
其体系如下:
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,按以下程序操作。
三,样本核酸在磷酸酶的作用下去磷酸化及变性处理;
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,按以下程序操作。
立即冰浴。
四,3’端接头连接;
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,37℃反应1小时。
五,3’端接头连接链霉亲和素;
取20μl的myonec1磁珠(thermofisherscientific),用500μl的1×bwt+sds缓冲液(1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20,0.5%sds)清洗2遍,最后用250μl的1×bwt+sds悬浮,将上述连接产物加入到磁珠中,于37℃反应20min。反应结束之后,于磁力架上移除上清,加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20,0.5%sds)洗涤一次,并去除上清,加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1%sds)洗涤一次,并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20)悬浮,于磁力架上移除上清。
六,延伸;
配制延伸反应液
其中cl130序列为5’gtgactggagttcagacgtgtgctcttcc*ga*tc*t3'(seqidno.11),3'端末位4个碱基硫代修饰。将上述得到的磁珠中加入延伸反应液,于65℃反应2min,后立即冰浴2-5min,加入2μlklenowfragment(10u/μl),作为一种优选,延伸反应的聚合酶可以选用klenowfragment(thermofisherscientific),也可以选用klenowfragmentexo-(thermofisherscientific)。用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,按以下程序操作。
反应结束之后,于磁力架上移除上清,加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20,0.5%sds)洗涤一次,并去除上清,加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1%sds)洗涤一次,并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20)悬浮,于磁力架上移除上清。
七,5’端接头连接;
配制延伸反应液
用移液器移入上述磁珠中,并轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,22℃反应1h。
反应结束之后,于磁力架上移除上清,加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20,0.5%sds)洗涤一次,并去除上清,加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1%sds)洗涤一次,并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20)悬浮,于磁力架上移除上清。
八,去除脱氧尿嘧啶核苷,优选neb的user酶(nebchina,m5505s)。
往步骤七的离心管中加入5μl的10×cutsmart,并加入43μl双蒸水,并轻轻吹打混匀。瞬时离心将样品收集至管底,加入2μl的user酶,37℃反应30min。反应结束之后,于磁力架上移除上清,加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20,0.5%sds)洗涤一次,并去除上清,加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1%sds)洗涤一次,并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05%tween-20)悬浮,于磁力架上移除上清。
九,文库洗脱回收;
往磁珠中加入50μl的ebt(10mmtris-hcl(ph8.0),0.05%tween-20)轻轻吹打混匀,将样品置于pcr仪中,95℃反应1min,于磁力架上吸取上清保存,即为文库。
如图3-4所示,△实验一,应用分子标签接头进行cfdna文库构建及检测,且对比使用3种5’末端接头,双链接头cl53/cl73,bell_adaptor,bell_ta_adaptor,得到的cfdna文库的barcode数,验证本发明的单链分子标签接头能够使得文库具有优秀的覆盖率。
实验过程如下所示:
1.cfdna的提取:
根据qiagen公司提供的qiaampcirculatingnucleicacidkit(50)试剂盒的使用说明书,使用该试剂盒对血浆中游离的cfdna进行提取。
2.cfdna文库的构建:
参考上文实施例,将步骤3的dna变成cfdna,即
反应制备3份,分别用于3种5’末端接头,即双链接头cl53/cl73,bell_adaptor,bell_ta_adaptor。其它步骤同其中实施例1,步骤7)结束之后,bell_adaptor和bell_ta_adaptor两种文库,增加一个步骤:脱氧尿嘧啶核苷的去除,优选neb的user酶(nebchina,m5505s)。构建出三种cfdna文库,即平端cfdna文库,bell平端cfdna文库,bell_ta_cfdna文库。
3.文库质检:
以文库分子为模板,进行pcr扩增,pcr体系如下
seqidno.12:
acactctttccctacacgac;
seqidno.13:
gtgactggagttcagagtgt;
pcr反应程序:
pcr产物进行片段分析仪qsep100进行分析,结果如图6,片段大小270bp左右,符合预期大小。
4.上机测序:
按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。
通过illumina测序仪对pcr产物进行测序,每个样本测序深度大约10层,50g数据量。
实验结果分析:从图7-9中可以看出文库具有良好的均一性和全基因组read覆盖度。其中又对bell平端cfdna文库,bell_tacfdna文库的barcode数进行了统计,分别为87581个和98845个,在均一性和全基因组read覆盖度相似的情况下,bell_tacfdna文库的barcode数优于bell平端cfdna文库的barcode数,后续接头优选bell_ta的。
△实验二,对检测方法的检测限进行测试;
应用分子标签接头进行超低频基因变异检测过程如下:
使用标准品cell-freednareferencestandard(苏州安可济生物科技有限公司,agstd-sz-tp-01)进行验证,其含有突变频率5%,1%,0.1%和0%核酸分子,核酸片段大小为150bp±10%(135~165bp)。模板信息如下:
本实施案例对检测方法的检测限进行测试,按照以下步骤进行
1.低频突变标准品准备
使用上述cfdna标准品进行egfr基因21外显子位点检测,突变频率分别为0%、0.1%、1%、5%,分别命名为:s0、s1、s2、s3。
2.文库构建
s0、s1、s2、s3分别安排实施例2中的建库方法进行单链文库构建,构建起始模板量为30ng,采用bell_ta_adapter接头作为5’末端接头。
3.文库的定量
按照qubitdsdnahsassaykit(thermofisherscientific,q32854)说明书进行操作,测定文库的浓度。
4.靶位点的pcr扩增
设计合成858位点正向引物5egfr858f(seqidno.14)及反向引物3egfr858r(seqidno.15)、790位点正向引物5egfr790f(seqidno.16)及反向引物3egfr790r(seqidno.17)、750位点正向引物5egfr750f(seqidno.18)及反向引物3egfr750r(seqidno.19)。
以构建的单链文库为模板,进行靶向扩增,pcr体系如下:
每个位点分别用相应的f引物或r引物扩增一管,轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,pcr程序如下:
pcr结束之后,取1μlpcr产物作第二轮接头特异性扩增,pcr体系如下
p7引物中含有不同的index序列,区别不同样本。其中同一个突变频率的样本用同一个index序列,同时同一突变频率的正负链引物扩增的样本,也以不同的index区分开。
轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,pcr程序如下:
使用60μlampurexpbeads(beckman,a63881)进行纯化,30μlelution缓冲液洗脱;
5.文库的质检与定量
按照kapalibraryquantifcationkit(kapabiosystems,catno.kk4854)
说明书进行操作,使用伯乐cfx96touch实时荧光定量pcr仪检测,参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度,可用于上机测试。
6.上机测序:
按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后,进行bwa比对,用于评估文库的特异性,分析结果见下表:
其中f或r代表以正向引物或反向引物构建的文库。
同时分析了样本的突变频率检测情况,如下表:
实验结果分析:经过分子标签技术、背景去噪和正负链修正结合去噪之后,其背景噪音降到万分之一,测定数据与理论数据一致性达95%以上;且可以检测突变频率为0.1%以上的样本,说明采用单链dna建库的方法灵敏度高。
实验三,ddpcr和单链建库等位基因突变频率比较实验;
应用分子标签接头进行多位点的超低频基因变异检测过程如下:
本实施例以以下基因突变为例对本发明进行验证:egfr基因突变c.2573t>g,p.l858r、c.2369c>t,t790m、dele746-a750;kras基因突变c.34g>t,p.g12c;nras基因突变c.35g>a,p.g12d,nras基因突变c.182a>g,p.q61r;braf基因突变c.1799t>a,p.v600e;pik3ca基因突变c.1624g>a,p.e542k,pik3ca基因突变c.3140a>g,p.h1074r,具体信息如下:
1.样本制备与验证:将上述8株细胞系及野生型细胞株nci-h596,将所有突变
位点均经sanger测序鉴定。将上述突变型dna(除a549和nci-h2347以外)分别用野生型dna稀释成40%的比例,将a549和nci-h2347基因组dna用野生型dna稀释成80%的比例,然后八种稀释好的dna按1∶1∶1∶1∶1∶1∶1∶1的比例混合,使得每一种突变型dna的比例均为10%,接着用野生型dna倍比稀释使得最终突变型与野生型的比例为1∶100,1∶1000,1∶10000,配制野生型的dna做为对照,比例定为100%,并混合好的比例的dna经covariss220打断至200~300bp,分别为s0,s1,s2,s3。4个浓度比例dna,对9个位点的突变频率进行数字pcr和二代测序验证,其位点突变频率为1%均值(三个重复)是1%±40%,位点突变频率小于1%均值(三个重复)是突变频率±50%。
2.单链文库的构建
3种浓度(s0,s1,s2,)比例分别安排实施例2中的建库方法进行单链文库构建,构建起始模板量为30ng,采用bell_ta_adapter接头作为5’末端接头。
3.文库的定量
按照qubitdsdnahsassaykit(thermofisherscientific,q32854)说明书进行操作,测定文库的浓度。
4.靶位点引物设计与pcr扩增
设计合成10个位点的正反引物,其引物名称和引物序列如下:
上述引物均不包括p7端部分接头序列
gtgactggagttcagacgtgtgctcttccgatct,实际引物合成时会在引物5’端加上上述p7端部分接头序列。同时,dck9和ppdpf两个位点为内参对照,其在三个文库中突变频率为100%,作为体系的假阳性内参对照。
以构建的单链文库为模板,进行靶向扩增,pcr体系如下:
seqidno.20:
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct;
每管分别用相应的10个位点正向引物池f引物或反向引物池r引物各扩增一管,轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,pcr程序如下:
pcr结束之后,取1μlpcr产物作第二轮接头特异性扩增,pcr体系如下
seqidno.20:
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct;
seqidno.21:
caagcagaagacggcatacgagatnnnnnngtgactggagttcagacgtgtgctcttcc;
p7引物中含有不同的index序列,区别不同样本。其中同一个突变频率的样本用同一个index序列,同时同一突变频率的正负链引物扩增的样本,也以不同的index区分开。
轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,pcr程序如下:
使用60μlampurexpbeads(beckman,a63881)进行纯化,30μlelution缓冲液洗脱;
7.文库的质检与定量
按照kapalibraryquantifcationkit(kapabiosystems,catno.kk4854)
说明书进行操作,使用伯乐cfx96touch实时荧光定量pcr仪检测,参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度,可用于上机测试。
8.上机测序:
按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后,进行bwa比对,用于评估文库的。
实验结果:
对ngs的结果进行bwa比对,标准品的实际基因突变频率的实验结果如下表和图10所示:
与标准品的实际基因突变频率比较如图10:
结果分析:经过分子标签技术、背景去噪和正负链修正结合去噪之后,其背景噪音降到万分之一,测定数据与理论数据一致性达95%以上,且可以检测突变频率为0.02%的样本,能达到数字pcr检测的灵敏度,同时跟目前基因杂交探针法捕获技术检测灵敏度相当(即0.02%-0.05%)。设定了两个内参基因,排除建库过程中存在假阴性的结果。同时,基于ngs的适用性及单次单价方面均比数据pcr存在优势。
△实验四,ctdna经单链建库靶向扩增后的文库与来源于肿瘤基因组(tumordna,tdna)的10个位点的突变信息进行比对实验:
应用分子标签接头进行临床样本基因变异检测的过程如下:
1.检测样本dna的提取:
收集临床10例肺癌组织样本及对应血液样本,组织样本dna提取和qiagen公司提供的dneasyblood&tissuekit,按照提取试剂盒的说明书进行操作。血液cfdna提取根据qiagen公司提供的qiaampcirculatingnucleicacidkit(50)试剂盒的使用说明书进行操作。提取得到的组织dna用nanodrop检测od260/od280应介于1.8~2.1,血液游离dna片段大小用2100检测,片段在150~200bp,血液游离dna用qubit2.0定量。
2.单链文库的构建
血液游离dna分别安排实施例2中的建库方法进行单链文库构建,构建起始模板量为20ng,采用bell_ta_adapter接头作为5’末端接头。
3.文库的定量
按照qubitdsdnahsassaykit(thermofisherscientific,q32854)说明书进行操作,测定文库的浓度。
4.靶位点引物设计与pcr扩增
设计合成10个位点的正反引物,其引物名称和引物序列如下:
上述引物均不包括p7端部分接头序列gtgactggagttcagacgtgtgctcttccgatct,实际引物合成时会在引物5’端加上上述p7端部分接头序列。同时,dck9和ppdpf两个位点为内参对照,其在四个文库中突变频率为100%,作为体系的假阳性内参对照。
以构建的单链文库为模板,进行靶向扩增,pcr体系如下:
每管分别用相应的10个位点正向引物池f引物或反向引物池r引物各扩增一管,轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,pcr程序如下:
pcr结束之后,取1μlpcr产物作第二轮接头特异性扩增,pcr体系如下
p7引物中含有不同的index序列,区别不同样本。其中同一个突变频率的样本用同一个index序列,同时同一突变频率的正负链引物扩增的样本,也以不同的index区分开。
轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于pcr仪中,pcr程序如下:
使用60μlampurexpbeads(beckman,a63881)进行纯化,30μlelution缓冲液洗脱;
9.文库的质检与定量
按照kapalibraryquantifcationkit(kapabiosystems,catno.kk4854)
说明书进行操作,使用伯乐cfx96touch实时荧光定量pcr仪检测,参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度,可用于上机测试。
10.上机测序:
按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后,进行bwa比对,用于评估文库的。
将来源于血浆中游离的ctdna经单链建库,靶向扩增后的文库与来源于肿瘤基因组(tumordna,tdna)的10个位点的突变信息进行比对,结果如下表和图11所示,
结果分析:根据上表和图11可知,将分子标签技术、背景去噪和正负链修正结合,其检测血液的ctdna突变信息跟其肿瘤样本的体细胞突变一致性,其中nras_12能检测到1.2%,而且内参基因位点其去噪音之后,其突变率低于0.06%。
本发明通过单链dna建库,解决现有检测技术中对液态活检特别是ctdna片段短、浓度低、碎片化、灵敏度低技术问题;其次基于分子标签技术和单链文库建库特点,实现准确辨别基因组坐标始末位点相同的测序reads是来自同一还是多个原始细胞释放出来的cfdna,并将来源于同一个细胞的原始正负链的测序reads配对起来分析的目的,从而降低测序重复工作,提高对假阳性突变的分辨率。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
序列表
<110>杭州纽安津生物科技有限公司
<120>一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用
<141>2019-02-11
<160>21
<170>siposequencelisting1.0
<210>1
<211>10
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>pho
<220>
<221>prim_transcript
<222>(10)..(10)
<223>[c3spacer]10-teg-biotin
<400>1
agatcggaag10
<210>2
<211>18
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>amc12
<220>
<221>prim_transcript
<222>(18)..(18)
<223>amc7
<220>
<221>misc_feature
<222>(13)..(13)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(14)..(14)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(15)..(15)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(16)..(16)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(17)..(17)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(18)..(18)
<223>nisa,c,g,toru
<400>2
aacttccgatctnnnnnn18
<210>3
<211>18
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>amc12
<220>
<221>prim_transcript
<222>(18)..(18)
<223>amc3
<220>
<221>misc_feature
<222>(13)..(13)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(14)..(14)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(15)..(15)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(16)..(16)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(17)..(17)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(18)..(18)
<223>nisa,c,g,toru
<400>3
aacttccgatctnnnnnn18
<210>4
<211>16
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>spacerc12-aa[spacerc12]
<220>
<221>prim_transcript
<222>(18)..(18)
<223>amc6
<220>
<221>misc_feature
<222>(11)..(11)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(12)..(12)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(13)..(13)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(14)..(14)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(15)..(15)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(16)..(16)
<223>nisa,c,g,toru
<400>4
cttccgatctnnnnnn16
<210>5
<211>17
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>spacerc12-aa[spacerc12]
<220>
<221>prim_transcript
<222>(19)..(19)
<223>amc6
<220>
<221>misc_feature
<222>(11)..(11)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(12)..(12)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(13)..(13)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(14)..(14)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(15)..(15)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(16)..(16)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(17)..(17)
<223>nisa,c,g,toru
<400>5
cttccgatctnnnnnnn17
<210>6
<211>18
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>spacerc12-aa[spacerc12]
<220>
<221>prim_transcript
<222>(20)..(20)
<223>amc6
<220>
<221>misc_feature
<222>(11)..(11)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(12)..(12)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(13)..(13)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(14)..(14)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(15)..(15)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(16)..(16)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(17)..(17)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(18)..(18)
<223>nisa,c,g,toru
<400>6
cttccgatctnnnnnnnn18
<210>7
<211>11
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(12)..(12)
<223>ddc
<400>7
cgacgctcttc11
<210>8
<211>29
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(0)..(1)
<223>pho
<220>
<221>prim_transcript
<222>(25)..(26)
<223>*
<220>
<221>prim_transcript
<222>(26)..(27)
<223>*
<220>
<221>prim_transcript
<222>(27)..(28)
<223>*
<220>
<221>prim_transcript
<222>(28)..(29)
<223>*
<400>8
ggaagagcgtcgtgtagggaaagagtgta29
<210>9
<211>79
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(58)..(59)
<223>u
<220>
<221>misc_feature
<222>(17)..(17)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(18)..(18)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(19)..(19)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(20)..(20)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(21)..(21)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(22)..(22)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(23)..(23)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(24)..(24)
<223>nisa,c,g,toru
<400>9
gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtaat60
ctctctcagacgtgtgctc79
<210>10
<211>80
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(58)..(59)
<223>u
<220>
<221>misc_feature
<222>(17)..(17)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(18)..(18)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(19)..(19)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(20)..(20)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(21)..(21)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(22)..(22)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(23)..(23)
<223>nisa,c,g,toru
<220>
<221>misc_feature
<222>(24)..(24)
<223>nisa,c,g,toru
<400>10
gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtaat60
ctctctcagacgtgtgctct80
<210>11
<211>34
<212>dna
<213>artificialsequence
<220>
<221>prim_transcript
<222>(29)..(30)
<223>*
<220>
<221>prim_transcript
<222>(31)..(32)
<223>*
<220>
<221>prim_transcript
<222>(33)..(34)
<223>*
<400>11
gtgactggagttcagacgtgtgctcttccgatct34
<210>12
<211>20
<212>dna
<213>artificialsequence
<400>12
acactctttccctacacgac20
<210>13
<211>20
<212>dna
<213>artificialsequence
<400>13
gtgactggagttcagagtgt20
<210>14
<211>57
<212>dna
<213>artificialsequence
<400>14
gtgactggagttcagacgtgtgctcttccgatctacaccgcagcatgtcaagatcac57
<210>15
<211>59
<212>dna
<213>artificialsequence
<400>15
gactggagttcagacgtgtgctcttccgatctgcctccttctgcatggtattctttctc59
<210>16
<211>55
<212>dna
<213>artificialsequence
<400>16
gtgactggagttcagacgtgtgctcttccgatctgctgggcatctgcctcacctc55
<210>17
<211>58
<212>dna
<213>artificialsequence
<400>17
gtgactggagttcagacgtgtgctcttccgatcgacatagtccaggaggcagccgaag58
<210>18
<211>59
<212>dna
<213>artificialsequence
<400>18
gtgactggagttcagacgtgtgctcttccgatctgtgagaaagttaaaattcccgtcgc59
<210>19
<211>59
<212>dna
<213>artificialsequence
<400>19
gtgactggagttcagacgtgtgctcttccgatcttcacatcgaggatttccttgttggc59
<210>20
<211>58
<212>dna
<213>artificialsequence
<400>20
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct58
<210>21
<211>59
<212>dna
<213>artificialsequence
<400>21
caagcagaagacggcatacgagatnnnnnngtgactggagttcagacgtgtgctcttcc59