一种单链分子标签接头及单链DNA建库方法及其在检测循环肿瘤DNA中应用与流程

文档序号：17742098发布日期：2019-05-24 20:14阅读：1896来源：国知局

本发明涉及生物医学技术领域，特别是一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用。

背景技术：

血浆游离dna又称cfdna(cellfreedna)，是指外周中游离于细胞外的dna，cfdna的来源既包括正常细胞，也有异常细胞(如肿瘤细胞)或者外源的微生物(如病毒dna)，具体包括自身正常细胞代谢的凋亡小体，肿瘤细胞碎片，外泌体等。

循环肿瘤dna(circulatingtumordna)ctdna是指外周循环血中含有多种与癌症相关的突变基因，主要由肿瘤细胞脱落或凋亡后释放出而进入循环系统的dna。ctdna来自肿瘤细胞本身，是一种高度灵敏、特异性的特征性肿瘤生物标志物，可通过对其进行基因检测，进行定性、定量以及动态追踪观察肿瘤中发生突变的基因，从而为患者治疗前肿瘤分子分型、靶向治疗决策、治疗过程中肿瘤动态和负荷变化评估，以及实时监测治疗有效性等方面提供有效信息。来自宾夕法尼亚大学abramson癌症中心的研究人员发现，与单独的实体组织ngs检测相比，ngs液体活检能够识别出更多的非小细胞肺癌突变，帮助临床发现更多患者的靶向突变。在检测的靶向突变数量上，液体活检几乎是单独组织活检的两倍。此外，研究结果还表明，通过液体活检检测出靶向突变的患者，对靶向治疗的反应良好，86％的患者完全反应或部分反应，或保持稳定状态。“实体组织活检仍然是准确诊断的关键，但是我们现在已经证明，液体活检项目可以增加诊断价值，而且当实体组织活检无法进行时，它可以作为一种可行的替代方法”，研究作者carpenter说道，“鉴于靶向治疗的快速发展，液体活检应该被纳入常规护理标准。”

然而，精确测序ctdna存在三个巨大的技术障碍：首先是血浆中的ctdna含量极低，且多为小片段分子特点，部分为受损伤的双链dna和单链dna，导致提取较为困难，损失量大，检测灵敏度较低，因此限制了其在临床上的应用。其次是由于后续的建库过程中经过末端修复、腺苷酸化、加接头以及pcr扩增等多步骤后，样本会损失更多，进一步限制了检测灵敏度，因此增加每步实验的效率对提高ctdna的检出灵敏度都至关重要。最后，基于pcr方法的特意扩增或捕获，随着测序深度的提高而存在大量背景噪音，已严重限制了靶向测序技术在更高数据精度要求的检测。

对于某些低丰度，损伤的双链dna和单链dna的检测，以这些额外单链dna作为模板的话可以显著增加目标dna的模板量，有利于最终目的dna捕获。gansauge,mt等发明了一种单链dna建库，该方法在单链模板和单链接头的连接步骤，使用的为circ连接酶ii。该方法解决的这种短片段易降解的古生物dna的建库问题，但连接效率为较低，需要较长的连接时间，成本高。于是他们后续进行了优化，推出新版本ssdna2.0，其更换了接头引物，同时将circ连接酶ii用常规的t4dna连接酶替换，模板用量降低、文库产量和富集度都有扩高，其成本降低近7倍。从建库的效率上来讲，单链建库建库要高很多，相对于基于454平台的双链建库效率要高6倍左右，测序深度高1.9倍左右。

ctdna含量非常少，以10ml外周血为例，从中可以提取到cfdna含量约30ng，ctdna在所有cfdna中的比例非常少，按1％计算,只有约300pg，也就是大约45个细胞裂解的dna量，实际情况下，如果是做早期筛查，ctdna的含量可能相当于5000个细胞中只有1-2个细胞是肿瘤细胞，所以对检测方法的敏感性要求非常高。

同时由于dna的氧化损伤或脱氨基损伤、pcr扩增中dna聚合酶引入的突变(每个碱基出现错误的概率在10^-6～10^-4之间)，尤其是在第一轮扩增引入错误，以及测序仪器读取碱基时引入的错误，测序得到的每个碱基出现错误的概率在10^-3～10^-2之间，即每1000个碱基就会出现1至10个错误碱基。因此，低于该频率的基因变异将无法准确检测。

目前，已经有针对超低频基因变异检测的建库测序方法，主要是在原始双链dna分子模板两端引入分子标签序列uniquemolecularidentifiers(umi)。根据这些分子标签，可以在去除冗余的过程中将pcr和测序等过程中带来的系统突变排除掉，可以大大降低低频突变的假阳性率。已有大量文章或商业化产品引入分子标签技术。在没有分子条形码技术之前，受制于常规技术的局限，二代测序的用户通常将变异检测域值设置为3-5％的等位基因频率，而sureselectxths大大提高了变异检出的灵敏度，可以检测突变频率<1％的稀有变异。

因此，需要结合上面的两项技术，对现有的超低频基因变异检测的建库测序方法进行改进，以提高对超低频基因变异检测的灵敏度，本发明解决这样的问题。

技术实现要素：

为解决现有技术的不足，本发明的目的在于提供一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用，本发明通过单链dna建库，解决现有检测技术中对液态活检特别是ctdna片段短、浓度低、碎片化、灵敏度低技术问题；其次基于分子标签技术和单链文库建库特点，实现准确辨别基因组坐标始末位点相同的测序reads是来自同一还是多个原始细胞释放出来的cfdna，并将来源于同一个细胞的原始正负链的测序reads配对起来分析的目的，从而降低测序重复工作，提高对假阳性突变的分辨率。

为了实现上述目标，本发明采用如下的技术方案：

一种单链分子标签接头，包括：14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列，其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷，该单链核酸序列经退火变性会形成茎环结构。

一种单链dna建库方法，包括如下步骤：

3’末端接头的制备；

5’末端接头的制备；

样本核酸在磷酸酶的作用下去磷酸化及变性处理：高温处理，将原来双链的dna变性为单链dna；

3’端接头连接：将单链dna产物和3’端双链dna接头进行碱基配对，并头进行连接反应；

3’端接头连接链霉亲和素：将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附，固定在链霉亲和素磁珠上；

延伸：将连接过链霉亲和素的单链连接产物为模板，将3’末端接头作为引物进行延伸，获得双链dna产物；

5’端接头连接：将双链dna产物和5’端双链dna接头进行分子间的双链连接；

链霉亲和素清洗及文库洗脱回收。

前述的一种单链dna建库方法，

3’末端接头的制备的具体过程如下：

制备pcr试剂，pcr试剂的配方包括：

用移液器将pcr试剂混匀，瞬时离心将样品收集至管底，再将样品置于pcr仪中，pcr程序如下：

95℃1min，

95℃-10℃-0.1℃/sec，

10℃5min。

前述的一种单链dna建库方法，

上链序列采用cl78(seqidno.1)，序列为：

5’pho-agatcggaag[c3spacer]10-teg-biotin3’，该接头序列5’端磷酸化修饰，3’端生物素化修饰，中间引入10个c3相隔臂和teg分子；

下链序列采用cl93(seqidno.2)，序列为：

5’amc12-aacttccgatctnnnnnn-amc73’，该接头序列5’端采用aminolinkerc12修饰，3’端含有6个随机核苷酸组成简并碱基，且末端aminolinkerc7修饰；

下链序列采用cl106(seqidno.3)，序列为：

5’amc12-aacttccgatctnnnnnn-amc33’，3’端含有6个随机核苷酸组成简并碱基，且末端aminolinkerc3修饰；

下链序列采用cl110(seqidno.4)，序列为：

5’spacerc12-aa[spacerc12]cttccgatctnnnnnn-amc63’，5’端和中间含有aminolinkerc12修饰，3’端含有8个随机核苷酸组成简并碱基，且末端aminolinkerc6修饰；

下链序列采用cl136(seqidno.5)，序列为：

5’spacerc12-aa[spacerc12]cttccgatctnnnnnnn-amc63’，5’端和中间含有aminolinkerc12修饰，3’端含有7个随机核苷酸组成简并碱基，且末端aminolinkerc6修饰；

下链序列采用cl137(seqidno.6)，序列为：

5’spacerc12-aa[spacerc12]cttccgatctnnnnnnnn-amc63’，5’端和中间含有aminolinkerc12修饰，3’端含有8个随机核苷酸组成简并碱基，且末端aminolinkerc6修饰。

前述的一种单链dna建库方法，

5’末端接头的制备的具体过程如下：

pcr试剂包括：

用移液器将pcr试剂混匀，瞬时离心将样品收集至管底，再将样品置于pcr仪中，pcr程序如下：

95℃1min，

95℃-14℃-0.1℃/sec，

14℃5min。

前述的一种单链dna建库方法，

上链序列或下链序列为：接头序列bell_adatpor或接头序列bell_ta_adapter；

bell_adatpor的序列为：

5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctc3'(seqidno.9)，

bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列，其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷，该单链核酸序列经退火后形成平末端的茎环结构；

bell_ta_adapter的序列为：

5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctct3'(seqidno.10)，

bell_ta_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列，其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷，该单链核酸序列经退火后形成带t的粘末端茎环结构。

前述的一种单链dna建库方法，

上链序列采用cl53(seqidno.7)，序列为：5’cgacgctcttc-ddc3'，3'端双脱氧修饰；

下链序列采用cl73(seqidno.8)，序列为：

5’pho-ggaagagcgtcgtgtagggaaagag*t*g*t*a3'，3'端末位4个碱基硫代修饰。

前述的一种单链dna建库方法，

延伸的具体过程如下：

配制延伸反应液，延伸反应液的配方包括：

将具有连接过链霉亲和素的单链连接产物的磁珠加入延伸反应液，再加入2～5μl聚合酶，混匀，瞬时离心将样品收集至管底，再将样品置于pcr仪中，pcr程序如下：

25℃5min，

35℃25min；

洗涤，移除上清；

聚合酶采用klenowfragment或klenowfragmentexo-。

前述的一种单链dna建库方法，

3’末端接头的制备；

5’末端接头的制备；

样本核酸在磷酸酶的作用下去磷酸化及变性处理：高温处理，将原来双链的dna变性为单链dna；

3’端接头连接：将单链dna产物和3’端双链dna接头进行碱基配对，并头进行连接反应；

3’端接头连接链霉亲和素：将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附，固定在链霉亲和素磁珠上；

延伸：将连接过链霉亲和素的单链连接产物为模板，3’端接头已知序列设计引物进行延伸，获得双链dna产物；

5’端接头连接：将双链dna产物和5’端双链dna接头进行分子间的双链连接；

去除脱氧尿嘧啶核苷；

链霉亲和素清洗及文库洗脱回收。

一种单链分子标签接头在检测循环肿瘤dna中的应用，包括如下内容：

提取检测血浆中游离的cfdna；

3’末端接头的制备；

采用单链分子标签接头进行5’末端接头的制备，所述单链分子标签接头，包括：14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列，其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷，该单链核酸序列经退火变性会形成茎环结构；

样本核酸在磷酸酶的作用下去磷酸化及变性处理：高温处理，将原来双链的dna变性为单链dna；

3’端接头连接：将单链dna产物和3’端双链dna接头进行碱基配对，并头进行连接反应；

3’端接头连接链霉亲和素：将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附，固定在链霉亲和素磁珠上；

延伸：将连接过链霉亲和素的单链连接产物为模板，3’端接头已知序列设计引物进行延伸，获得双链dna产物；

5’端接头连接：将双链dna产物和5’端双链dna接头进行分子间的双链连接；

链霉亲和素清洗及文库洗脱回收。

本发明的有益之处在于：

本发明提供了针对液态活检特别是cfdna二代测序文库构建时，有效回收单链和受损伤的模板dna，进行独特的单链建库的二代测序文库构建。现在的cfdna二代测序技术，绝大部分用常规的双链dna文库构建的方法，只能够检测没有受损伤的双链dna，本发明的方法通过单链建库的方法成功实现单链和受损伤的cfdna的建库，同时模板用量降低、文库产量和富集度都有扩高。

本发明通过单链建库，将起始模板放大，可以用于10-100个位点甚至1000个位点的靶向捕获/靶向扩增。同时，由于cfdna断裂的随机性，基于单链建库后，通过正反引物配合通用引物，能很大程度提供捕获的效率，特别是基于pcr方法特意扩增捕获，单侧引物结合概率是双侧引物结合概率的一倍。

本发明提供了8个随机核苷酸分子标签接头，基因组坐标始末位点相同的dna片段加上完全相同的8个随机核苷酸分子标签接头的概率极低，那么对于基因组坐标始末位点相同的测序reads，就很容易判断它们来自同一还是多个原始细胞释放出来的cfdna，从而降低测序重复工作。同时，对单一单链文库进行建库，可以有效的将来自同一个双链dna模板的正链和负链匹配，排除pcr导致的错误，提高了对假阳性的分辨率，从而保证了对cfdna中超低频突变的检测能力并矫正其扩增错误和测序错误。经过分子标签技术、背景去噪和正负链修正结合去噪之后，其背景噪音降到万分之一，且可以检测突变频率为0.02％的样本，与目前基于杂交探针法捕获技术检测灵敏度相当(即0.02％-0.05％)。因此，能有效地降低大量背景噪音，降低假阳性率、提高结果的准确性。

附图说明

图1为核酸序列bell_adaptor退火后二级结构图；

图2为核酸序列bell_ta_adaptor退火后二级结构图；

图3为线性5’末端接头构建文库的流程图，其中singlestranddissociation为单链变性之后再dephosphorylation(去磷酸化)，经过primerannealing(引物退火)及t4dnaligase(t4dna连接酶)连接，然后固定到streptavidinmagneticbeads(链霉亲的磁珠)，后续经primerannealing(引物退火)及klenowfragmen的amplification(扩增过程)，形成双链，与亚玲结构的接头(8-ntbarcode),在t4dna连接酶(t4dnaligase)将接头连接上去，5端接头被user酶(userdigestion)移除u碱基，最后用p5/p7引物扩增文库(p5primer/p7primer)；

图4为茎环接头构建的平末端文库的流程图，其中singlestranddissociation为单链变性之后再dephosphorylation(去磷酸化)，经过primerannealing(引物退火)及t4dnaligase(t4dna连接酶)连接，然后固定到streptavidinmagneticbeads(链霉亲的磁珠)，后续经primerannealing(引物退火)及klenowfragmen的amplification(扩增过程)，形成双链，与亚玲结构的接头(8-ntbarcode),在t4dna连接酶(t4dnaligase)将接头连接上去，5端接头被user酶(userdigestion)移除u碱基，最后用p5/p7引物扩增文库(p5primer/p7primer)；

图5为茎环接头构建的ta连接文库的流程图，其中singlestranddissociation为单链变性之后再dephosphorylation(去磷酸化)，经过primerannealing(引物退火)及t4dnaligase(t4dna连接酶)连接，然后固定到streptavidinmagneticbeads(链霉亲的磁珠)，后续经primerannealing(引物退火)及klenowfragmen的amplification(扩增过程)，形成双链，与亚玲结构的接头(8-ntbarcode),在t4dna连接酶(t4dnaligase)将接头连接上去，5端接头被user酶(userdigestion)移除u碱基，最后用p5/p7引物扩增文库(p5primer/p7primer)；

图6为基于单链文库构建的文库大小分布图，其中横坐标为样本迁移的时间(migrationtime)，纵坐标是为样本的荧光信号(rfu)；

图7为线性5’末端接头构建文库read覆盖度全图；

图8为茎环接头构建的平末端文库read覆盖度全图；

图9为茎环接头构建的ta连接文库read覆盖度全图；

图10为本发明实验三中ddpcr和单链建库等位基因突变频率比较示意图，其中横坐标为数字pcr检测到的突变频率(multantfrequence(％))，纵坐标是为基于ngs检测到的突变频率(multantfrequence(％))；

图11为本发明实验四中来源于血浆中游离的ctdna经单链建库，靶向扩增后的文库与来源于肿瘤基因组(tumordna,tdna)的10个位点的突变信息比对结果图，其中横坐标为基因，纵坐标为突变频率。

具体实施方式

以下结合附图和具体实施例对本发明作具体的介绍。

作为一种实施例，包括：bell_adatpor和bell_ta_adapter；

bell_adatpor的序列为：

5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctc3'(seqidno.9)，

bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列，其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷，该单链核酸序列经退火后形成平末端的茎环结构；如图1为核酸序列bell_adaptor退火后二级结构图。

bell_ta_adapter的序列为：

5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctct3'(seqidno.10)，

bell_ta_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列，其中测序引物序列与茎结构序列之间插入了一位碱基为“u”脱氧尿嘧啶核苷，该单链核酸序列经退火后形成带t的粘末端茎环结构，图2为核酸序列bell_ta_adaptor退火后二级结构图。

作为一种实施例，如下演示一种单链dna建库方法，包括如下步骤：

一，3’末端接头的制备

用移液器轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，按以下程序操作。

需要说明的是：上文只是一种实施例，上链序列和下链序列还可以采用如下所示的实施例；

上链序列采用cl78(seqidno.1)，序列为：

5’pho-agatcggaag[c3spacer]10-teg-biotin3’，该接头序列5’端磷酸化修饰，3’端生物素化修饰，中间引入10个c3相隔臂和teg分子；

下链序列采用cl93(seqidno.2)，序列为：

5’amc12-aacttccgatctnnnnnn-amc73’，该接头序列5’端采用aminolinkerc12修饰，3’端含有6个随机核苷酸组成简并碱基，且末端aminolinkerc7修饰；

下链序列采用cl106(seqidno.3)，序列为：

5’amc12-aacttccgatctnnnnnn-amc33’，3’端含有6个随机核苷酸组成简并碱基，且末端aminolinkerc3修饰；

下链序列采用cl110(seqidno.4)，序列为：

5’spacerc12-aa[spacerc12]cttccgatctnnnnnn-amc63’，5’端和中间含有aminolinkerc12修饰，3’端含有8个随机核苷酸组成简并碱基，且末端aminolinkerc6修饰；

下链序列采用cl136(seqidno.5)，序列为：

5’spacerc12-aa[spacerc12]cttccgatctnnnnnnn-amc63’，5’端和中间含有aminolinkerc12修饰，3’端含有7个随机核苷酸组成简并碱基，且末端aminolinkerc6修饰；

下链序列采用cl137(seqidno.6)，序列为：

5’spacerc12-aa[spacerc12]cttccgatctnnnnnnnn-amc63’，5’端和中间含有aminolinkerc12修饰，3’端含有8个随机核苷酸组成简并碱基，且末端aminolinkerc6修饰。

二，5’末端接头的制备

上链序列采用cl53(seqidno.7)，序列为：5’cgacgctcttc-ddc3'，3'端双脱氧修饰；

下链序列采用cl73(seqidno.8)，序列为：

5’pho-ggaagagcgtcgtgtagggaaagag*t*g*t*a3'，3'端末位4个碱基硫代修饰。

优选接头序列bell_adatpor，优选接头序列bell_ta_adatpor，

上链序列或下链序列为：接头序列bell_adatpor或接头序列bell_ta_adapter；

bell_adatpor的序列为：

5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctc3'(seqidno.9)，

bell_ta_adapter的序列为：

5’gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtauatctctctcagacgtgtgctct3'(seqidno.10)，

其体系如下：

用移液器轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，按以下程序操作。

三，样本核酸在磷酸酶的作用下去磷酸化及变性处理；

用移液器轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，按以下程序操作。

立即冰浴。

四，3’端接头连接；

用移液器轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，37℃反应1小时。

五，3’端接头连接链霉亲和素；

取20μl的myonec1磁珠(thermofisherscientific)，用500μl的1×bwt+sds缓冲液(1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20,0.5％sds)清洗2遍，最后用250μl的1×bwt+sds悬浮，将上述连接产物加入到磁珠中，于37℃反应20min。反应结束之后，于磁力架上移除上清，加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20,0.5％sds)洗涤一次，并去除上清，加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1％sds)洗涤一次，并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20)悬浮，于磁力架上移除上清。

六，延伸；

配制延伸反应液

其中cl130序列为5’gtgactggagttcagacgtgtgctcttcc*ga*tc*t3'(seqidno.11)，3'端末位4个碱基硫代修饰。将上述得到的磁珠中加入延伸反应液，于65℃反应2min，后立即冰浴2-5min，加入2μlklenowfragment(10u/μl)，作为一种优选，延伸反应的聚合酶可以选用klenowfragment(thermofisherscientific)，也可以选用klenowfragmentexo-(thermofisherscientific)。用移液器轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，按以下程序操作。

反应结束之后，于磁力架上移除上清，加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20,0.5％sds)洗涤一次，并去除上清，加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1％sds)洗涤一次，并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20)悬浮，于磁力架上移除上清。

七，5’端接头连接；

配制延伸反应液

用移液器移入上述磁珠中，并轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，22℃反应1h。

八，去除脱氧尿嘧啶核苷，优选neb的user酶(nebchina,m5505s)。

往步骤七的离心管中加入5μl的10×cutsmart，并加入43μl双蒸水，并轻轻吹打混匀。瞬时离心将样品收集至管底，加入2μl的user酶，37℃反应30min。反应结束之后，于磁力架上移除上清，加入0.1×bwt+sds(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20,0.5％sds)洗涤一次，并去除上清，加入100μl0.1×ssc+sds缓冲液(15mmnacl,100mmsodiumcitrate,0.1％sds)洗涤一次，并去除上清。最后用200μl0.1×bwt(0.1mnacl,10mmtris-hcl(ph8.0),1mmedta(ph8.0),0.05％tween-20)悬浮，于磁力架上移除上清。

九，文库洗脱回收；

往磁珠中加入50μl的ebt(10mmtris-hcl(ph8.0),0.05％tween-20)轻轻吹打混匀，将样品置于pcr仪中，95℃反应1min，于磁力架上吸取上清保存，即为文库。

如图3-4所示，△实验一，应用分子标签接头进行cfdna文库构建及检测，且对比使用3种5’末端接头，双链接头cl53/cl73，bell_adaptor，bell_ta_adaptor，得到的cfdna文库的barcode数，验证本发明的单链分子标签接头能够使得文库具有优秀的覆盖率。

实验过程如下所示：

1.cfdna的提取：

根据qiagen公司提供的qiaampcirculatingnucleicacidkit(50)试剂盒的使用说明书，使用该试剂盒对血浆中游离的cfdna进行提取。

2.cfdna文库的构建：

参考上文实施例，将步骤3的dna变成cfdna，即

反应制备3份，分别用于3种5’末端接头，即双链接头cl53/cl73，bell_adaptor，bell_ta_adaptor。其它步骤同其中实施例1，步骤7)结束之后，bell_adaptor和bell_ta_adaptor两种文库，增加一个步骤：脱氧尿嘧啶核苷的去除，优选neb的user酶(nebchina,m5505s)。构建出三种cfdna文库，即平端cfdna文库，bell平端cfdna文库，bell_ta_cfdna文库。

3.文库质检：

以文库分子为模板，进行pcr扩增，pcr体系如下

seqidno.12：

acactctttccctacacgac；

seqidno.13：

gtgactggagttcagagtgt；

pcr反应程序：

pcr产物进行片段分析仪qsep100进行分析，结果如图6，片段大小270bp左右，符合预期大小。

4.上机测序：

按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。

通过illumina测序仪对pcr产物进行测序，每个样本测序深度大约10层，50g数据量。

实验结果分析：从图7-9中可以看出文库具有良好的均一性和全基因组read覆盖度。其中又对bell平端cfdna文库，bell_tacfdna文库的barcode数进行了统计，分别为87581个和98845个,在均一性和全基因组read覆盖度相似的情况下，bell_tacfdna文库的barcode数优于bell平端cfdna文库的barcode数，后续接头优选bell_ta的。

△实验二，对检测方法的检测限进行测试；

应用分子标签接头进行超低频基因变异检测过程如下：

使用标准品cell-freednareferencestandard(苏州安可济生物科技有限公司，agstd-sz-tp-01)进行验证，其含有突变频率5％,1％,0.1％和0％核酸分子，核酸片段大小为150bp±10％(135～165bp)。模板信息如下：

本实施案例对检测方法的检测限进行测试，按照以下步骤进行

1.低频突变标准品准备

使用上述cfdna标准品进行egfr基因21外显子位点检测，突变频率分别为0％、0.1％、1％、5％，分别命名为：s0、s1、s2、s3。

2.文库构建

s0、s1、s2、s3分别安排实施例2中的建库方法进行单链文库构建，构建起始模板量为30ng，采用bell_ta_adapter接头作为5’末端接头。

3.文库的定量

按照qubitdsdnahsassaykit(thermofisherscientific,q32854)说明书进行操作，测定文库的浓度。

4.靶位点的pcr扩增

设计合成858位点正向引物5egfr858f(seqidno.14)及反向引物3egfr858r(seqidno.15)、790位点正向引物5egfr790f(seqidno.16)及反向引物3egfr790r(seqidno.17)、750位点正向引物5egfr750f(seqidno.18)及反向引物3egfr750r(seqidno.19)。

以构建的单链文库为模板，进行靶向扩增，pcr体系如下：

每个位点分别用相应的f引物或r引物扩增一管，轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，pcr程序如下：

pcr结束之后，取1μlpcr产物作第二轮接头特异性扩增，pcr体系如下

p7引物中含有不同的index序列，区别不同样本。其中同一个突变频率的样本用同一个index序列，同时同一突变频率的正负链引物扩增的样本，也以不同的index区分开。

轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，pcr程序如下：

使用60μlampurexpbeads(beckman,a63881)进行纯化，30μlelution缓冲液洗脱；

5.文库的质检与定量

按照kapalibraryquantifcationkit(kapabiosystems,catno.kk4854)

说明书进行操作，使用伯乐cfx96touch实时荧光定量pcr仪检测，参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度，可用于上机测试。

6.上机测序：

按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后，进行bwa比对，用于评估文库的特异性，分析结果见下表:

其中f或r代表以正向引物或反向引物构建的文库。

同时分析了样本的突变频率检测情况，如下表:

实验结果分析：经过分子标签技术、背景去噪和正负链修正结合去噪之后，其背景噪音降到万分之一，测定数据与理论数据一致性达95％以上；且可以检测突变频率为0.1％以上的样本，说明采用单链dna建库的方法灵敏度高。

实验三，ddpcr和单链建库等位基因突变频率比较实验；

应用分子标签接头进行多位点的超低频基因变异检测过程如下：

本实施例以以下基因突变为例对本发明进行验证：egfr基因突变c.2573t＞g，p.l858r、c.2369c＞t，t790m、dele746-a750；kras基因突变c.34g＞t，p.g12c；nras基因突变c.35g＞a，p.g12d，nras基因突变c.182a＞g，p.q61r；braf基因突变c.1799t＞a，p.v600e；pik3ca基因突变c.1624g＞a，p.e542k，pik3ca基因突变c.3140a＞g，p.h1074r，具体信息如下：

1.样本制备与验证：将上述8株细胞系及野生型细胞株nci-h596，将所有突变

位点均经sanger测序鉴定。将上述突变型dna(除a549和nci-h2347以外)分别用野生型dna稀释成40％的比例，将a549和nci-h2347基因组dna用野生型dna稀释成80％的比例，然后八种稀释好的dna按1∶1∶1∶1∶1∶1∶1∶1的比例混合，使得每一种突变型dna的比例均为10％，接着用野生型dna倍比稀释使得最终突变型与野生型的比例为1∶100，1∶1000，1∶10000，配制野生型的dna做为对照，比例定为100％，并混合好的比例的dna经covariss220打断至200～300bp，分别为s0，s1，s2，s3。4个浓度比例dna，对9个位点的突变频率进行数字pcr和二代测序验证，其位点突变频率为1％均值(三个重复)是1％±40％，位点突变频率小于1％均值(三个重复)是突变频率±50％。

2.单链文库的构建

3种浓度(s0，s1，s2，)比例分别安排实施例2中的建库方法进行单链文库构建，构建起始模板量为30ng，采用bell_ta_adapter接头作为5’末端接头。

3.文库的定量

按照qubitdsdnahsassaykit(thermofisherscientific,q32854)说明书进行操作，测定文库的浓度。

4.靶位点引物设计与pcr扩增

设计合成10个位点的正反引物，其引物名称和引物序列如下：

上述引物均不包括p7端部分接头序列

gtgactggagttcagacgtgtgctcttccgatct，实际引物合成时会在引物5’端加上上述p7端部分接头序列。同时，dck9和ppdpf两个位点为内参对照，其在三个文库中突变频率为100％，作为体系的假阳性内参对照。

以构建的单链文库为模板，进行靶向扩增，pcr体系如下：

seqidno.20：

aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct；

每管分别用相应的10个位点正向引物池f引物或反向引物池r引物各扩增一管，轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，pcr程序如下：

pcr结束之后，取1μlpcr产物作第二轮接头特异性扩增，pcr体系如下

seqidno.20：

aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct；

seqidno.21：

caagcagaagacggcatacgagatnnnnnngtgactggagttcagacgtgtgctcttcc；

轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，pcr程序如下：

使用60μlampurexpbeads(beckman,a63881)进行纯化，30μlelution缓冲液洗脱；

7.文库的质检与定量

按照kapalibraryquantifcationkit(kapabiosystems,catno.kk4854)

8.上机测序：

按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后，进行bwa比对，用于评估文库的。

实验结果：

对ngs的结果进行bwa比对，标准品的实际基因突变频率的实验结果如下表和图10所示：

与标准品的实际基因突变频率比较如图10：

结果分析：经过分子标签技术、背景去噪和正负链修正结合去噪之后，其背景噪音降到万分之一，测定数据与理论数据一致性达95％以上，且可以检测突变频率为0.02％的样本，能达到数字pcr检测的灵敏度，同时跟目前基因杂交探针法捕获技术检测灵敏度相当(即0.02％-0.05％)。设定了两个内参基因，排除建库过程中存在假阴性的结果。同时，基于ngs的适用性及单次单价方面均比数据pcr存在优势。

△实验四，ctdna经单链建库靶向扩增后的文库与来源于肿瘤基因组(tumordna,tdna)的10个位点的突变信息进行比对实验：

应用分子标签接头进行临床样本基因变异检测的过程如下：

1.检测样本dna的提取：

收集临床10例肺癌组织样本及对应血液样本，组织样本dna提取和qiagen公司提供的dneasyblood&tissuekit，按照提取试剂盒的说明书进行操作。血液cfdna提取根据qiagen公司提供的qiaampcirculatingnucleicacidkit(50)试剂盒的使用说明书进行操作。提取得到的组织dna用nanodrop检测od260/od280应介于1.8～2.1，血液游离dna片段大小用2100检测，片段在150～200bp，血液游离dna用qubit2.0定量。

2.单链文库的构建

血液游离dna分别安排实施例2中的建库方法进行单链文库构建，构建起始模板量为20ng，采用bell_ta_adapter接头作为5’末端接头。

3.文库的定量

按照qubitdsdnahsassaykit(thermofisherscientific,q32854)说明书进行操作，测定文库的浓度。

4.靶位点引物设计与pcr扩增

设计合成10个位点的正反引物，其引物名称和引物序列如下：

上述引物均不包括p7端部分接头序列gtgactggagttcagacgtgtgctcttccgatct，实际引物合成时会在引物5’端加上上述p7端部分接头序列。同时，dck9和ppdpf两个位点为内参对照，其在四个文库中突变频率为100％，作为体系的假阳性内参对照。

以构建的单链文库为模板，进行靶向扩增，pcr体系如下：

pcr结束之后，取1μlpcr产物作第二轮接头特异性扩增，pcr体系如下

轻轻吹打混匀。瞬时离心将样品收集至管底，将样品置于pcr仪中，pcr程序如下：

使用60μlampurexpbeads(beckman,a63881)进行纯化，30μlelution缓冲液洗脱；

9.文库的质检与定量

按照kapalibraryquantifcationkit(kapabiosystems,catno.kk4854)

10.上机测序：

按照illuminanovaseq6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后，进行bwa比对，用于评估文库的。

将来源于血浆中游离的ctdna经单链建库，靶向扩增后的文库与来源于肿瘤基因组(tumordna,tdna)的10个位点的突变信息进行比对，结果如下表和图11所示，

结果分析：根据上表和图11可知，将分子标签技术、背景去噪和正负链修正结合，其检测血液的ctdna突变信息跟其肿瘤样本的体细胞突变一致性，其中nras_12能检测到1.2％，而且内参基因位点其去噪音之后，其突变率低于0.06％。

本发明通过单链dna建库，解决现有检测技术中对液态活检特别是ctdna片段短、浓度低、碎片化、灵敏度低技术问题；其次基于分子标签技术和单链文库建库特点，实现准确辨别基因组坐标始末位点相同的测序reads是来自同一还是多个原始细胞释放出来的cfdna，并将来源于同一个细胞的原始正负链的测序reads配对起来分析的目的，从而降低测序重复工作，提高对假阳性突变的分辨率。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，上述实施例不以任何形式限制本发明，凡采用等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。

序列表

<110>杭州纽安津生物科技有限公司

<120>一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用

<141>2019-02-11

<160>21

<170>siposequencelisting1.0

<210>1

<211>10

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>pho

<220>

<221>prim_transcript

<222>(10)..(10)

<223>[c3spacer]10-teg-biotin

<400>1

agatcggaag10

<210>2

<211>18

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>amc12

<220>

<221>prim_transcript

<222>(18)..(18)

<223>amc7

<220>

<221>misc_feature

<222>(13)..(13)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(14)..(14)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(15)..(15)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(16)..(16)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(17)..(17)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(18)..(18)

<223>nisa,c,g,toru

<400>2

aacttccgatctnnnnnn18

<210>3

<211>18

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>amc12

<220>

<221>prim_transcript

<222>(18)..(18)

<223>amc3

<220>

<221>misc_feature

<222>(13)..(13)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(14)..(14)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(15)..(15)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(16)..(16)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(17)..(17)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(18)..(18)

<223>nisa,c,g,toru

<400>3

aacttccgatctnnnnnn18

<210>4

<211>16

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>spacerc12-aa[spacerc12]

<220>

<221>prim_transcript

<222>(18)..(18)

<223>amc6

<220>

<221>misc_feature

<222>(11)..(11)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(12)..(12)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(13)..(13)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(14)..(14)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(15)..(15)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(16)..(16)

<223>nisa,c,g,toru

<400>4

cttccgatctnnnnnn16

<210>5

<211>17

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>spacerc12-aa[spacerc12]

<220>

<221>prim_transcript

<222>(19)..(19)

<223>amc6

<220>

<221>misc_feature

<222>(11)..(11)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(12)..(12)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(13)..(13)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(14)..(14)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(15)..(15)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(16)..(16)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(17)..(17)

<223>nisa,c,g,toru

<400>5

cttccgatctnnnnnnn17

<210>6

<211>18

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>spacerc12-aa[spacerc12]

<220>

<221>prim_transcript

<222>(20)..(20)

<223>amc6

<220>

<221>misc_feature

<222>(11)..(11)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(12)..(12)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(13)..(13)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(14)..(14)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(15)..(15)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(16)..(16)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(17)..(17)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(18)..(18)

<223>nisa,c,g,toru

<400>6

cttccgatctnnnnnnnn18

<210>7

<211>11

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(12)..(12)

<223>ddc

<400>7

cgacgctcttc11

<210>8

<211>29

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(0)..(1)

<223>pho

<220>

<221>prim_transcript

<222>(25)..(26)

<223>*

<220>

<221>prim_transcript

<222>(26)..(27)

<223>*

<220>

<221>prim_transcript

<222>(27)..(28)

<223>*

<220>

<221>prim_transcript

<222>(28)..(29)

<223>*

<400>8

ggaagagcgtcgtgtagggaaagagtgta29

<210>9

<211>79

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(58)..(59)

<223>u

<220>

<221>misc_feature

<222>(17)..(17)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(18)..(18)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(19)..(19)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(20)..(20)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(21)..(21)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(22)..(22)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(23)..(23)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(24)..(24)

<223>nisa,c,g,toru

<400>9

gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtaat60

ctctctcagacgtgtgctc79

<210>10

<211>80

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(58)..(59)

<223>u

<220>

<221>misc_feature

<222>(17)..(17)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(18)..(18)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(19)..(19)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(20)..(20)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(21)..(21)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(22)..(22)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(23)..(23)

<223>nisa,c,g,toru

<220>

<221>misc_feature

<222>(24)..(24)

<223>nisa,c,g,toru

<400>10

gagcacacgtctgatannnnnnnnagatcggaagagcgtcgtgtagggaaagagtgtaat60

ctctctcagacgtgtgctct80

<210>11

<211>34

<212>dna

<213>artificialsequence

<220>

<221>prim_transcript

<222>(29)..(30)

<223>*

<220>

<221>prim_transcript

<222>(31)..(32)

<223>*

<220>

<221>prim_transcript

<222>(33)..(34)

<223>*

<400>11

gtgactggagttcagacgtgtgctcttccgatct34

<210>12

<211>20

<212>dna

<213>artificialsequence

<400>12

acactctttccctacacgac20

<210>13

<211>20

<212>dna

<213>artificialsequence

<400>13

gtgactggagttcagagtgt20

<210>14

<211>57

<212>dna

<213>artificialsequence

<400>14

gtgactggagttcagacgtgtgctcttccgatctacaccgcagcatgtcaagatcac57

<210>15

<211>59

<212>dna

<213>artificialsequence

<400>15

gactggagttcagacgtgtgctcttccgatctgcctccttctgcatggtattctttctc59

<210>16

<211>55

<212>dna

<213>artificialsequence

<400>16

gtgactggagttcagacgtgtgctcttccgatctgctgggcatctgcctcacctc55

<210>17

<211>58

<212>dna

<213>artificialsequence

<400>17

gtgactggagttcagacgtgtgctcttccgatcgacatagtccaggaggcagccgaag58

<210>18

<211>59

<212>dna

<213>artificialsequence

<400>18

gtgactggagttcagacgtgtgctcttccgatctgtgagaaagttaaaattcccgtcgc59

<210>19

<211>59

<212>dna

<213>artificialsequence

<400>19

gtgactggagttcagacgtgtgctcttccgatcttcacatcgaggatttccttgttggc59

<210>20

<211>58

<212>dna

<213>artificialsequence

<400>20

aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct58

<210>21

<211>59

<212>dna

<213>artificialsequence

<400>21

caagcagaagacggcatacgagatnnnnnngtgactggagttcagacgtgtgctcttcc59

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林志伟;莫凡;罗凯;郑文渊;韩宁;陈枢青
技术所有人：杭州纽安津生物科技有限公司
我是此专利的发明人

上一篇：一种基于时空特征融合学习的目标跟踪方法与流程
上一篇：一种湖北海棠叶黑果枸杞功能性食品及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。