一种检测血浆cfDNA中BCR和TCR免疫组库的方法

文档序号:9367915阅读:881来源:国知局
一种检测血浆cfDNA中BCR和TCR免疫组库的方法
【技术领域】
[0001] 本发明属于免疫组库测序技术领域,具体涉及一种检测血浆CfDNA中BCR和TCR 免疫组库的方法。
【背景技术】
[0002] 得益于下一代高通量测序技术的快速发展和广泛应用,DNA和RNA测序平台在基 因组学的各个方面发挥着突出的推动作用。同时,这一新兴的技术领域也已经被应用于T 细胞和B细胞受体的免疫组库测序。
[0003] 常规的T细胞和B细胞受体的免疫组库测序,主要基于2大策略,第一:基于细 胞DNA通过TCR/BCR基因重排规律,在TCR(alpha/beta/gamma/delta链)和BCR(heavy/ light链)的可变区(variable)基因设置上游引物,在连接区(joining)J基因或恒定区 (constant)C基因设置下游引物,通过PCR扩增出目的链的PCR产物,但其往往存在扩增时 的不均一性,从而影响结果的准确性;第二:基于细胞RNA,采用5'RACE技术,基于引入的接 头序列进行第二次无偏好(bias)的PCR扩增。但是RNA样品处理复杂,重复性不如DNA检 测结果,并不是一种理想的原材料。
[0004] 血浆中循环游离DNA(cfDNA),其来源主要是由细胞凋亡释放到血中。近年来肿 瘤患者血液中游离ctDNA(Cell_freeCirculatingTumorDNA)的基因检测诊断已成为研 究热点,而且相关基于血浆CtDNA的IG-seq检测正快速的发展中,其以血浆cfDNA/ctDNA 作为第一原料,针对特异性免疫亚克隆扩增,以用于相关疾病的风险评估与预测,拓展了 cfDNA这一"液体活检"标志物应用的广阔前景。但个别特异性克隆的分析研究,存在着局 限性,其并不能完整全面的展现患者的疾病进展情况。同时针对DNA扩增不均一性调整的 优化,目前分子标签编码技术的引入,不仅可以区分测序和扩增错误与参照序列中的罕见 突变,而且可以进行精准的分子定量,从而最大化的实现了无偏好性的数据分析。

【发明内容】

[0005] 本发明提供一种检测血浆cfDNA中BCR和TCR免疫组库的方法以克服现有技术的 不足。
[0006] 本发明提供的检测血浆CfDNA中BCR和TCR免疫组库的方法,包括以下步骤:
[0007] (1)血浆cfDNA提取;
[0008] (2)BCRH链全长多重PCR扩增和TCRP链CDR3多重PCR扩增;
[0009](3)步骤(2)中两种扩增产物混合后再进行一次PCR扩增;
[0010] ⑷高通量测序;
[0011] (5)免疫组库精准信息分析。
[0012] 本发明方法的流程图见图1。
[0013] 本发明方法中,步骤(2)中BCRH链全长多重PCR扩增采用的上游引物共22条, 序列分别如SEQIDNO. 1-22所示,下游引物共6条,序列分别如SEQIDNO. 23-28所示;
[0014]TCRP链⑶R3多重PCR扩增采用的上游引物共45条,序列分别如SEQID NO. 29-73所示,下游引物共4条,序列分别如SEQIDNO. 74-77所示。
[0015] 进一步地,步骤(2)中,各条上游引物的浓度相同,各条下游引物的浓度相同,且 下游单个引物浓度为上游单个引物浓度的20倍。
[0016] 优选地,步骤(2)中BCRH链全长多重PCR扩增条件为:98°C预变性45s;98°C变 性15s,60°C退火30s,72°C延伸30s,共8个循环;72°C终延伸60s;4°C保持。
[0017] 优选地,步骤⑵中TCRP链CDR3多重PCR扩增条件为:98°C预变性45s;98°C变 性15s,54°C退火30s,72°C延伸30s,共8个循环;72°C终延伸60s;4°C保持。
[0018] 本发明方法的步骤(3)所述的两种扩增产物分别是指BCRH链全长多重PCR扩增 产物中片段大小在300-350bp的片段回收纯化后的产物、以及TCRI3链⑶R3多重PCR扩增 产物中片段大小在200-250bp的片段回收纯化后的产物。
[0019] 优选地,步骤(3)中将步骤(2)的两种扩增产物等体积混合后再进行一次PCR扩 增;所采用的引物序列如SEQIDNO. 78-79所示。
[0020] 步骤(3)中PCR反应程序为:98°C预变性45s;98°C变性15s,65°C退火30s,72°C 延伸30s,共15个循环;72°C终延伸60s;4°C保持。
[0021] 本发明的检测血浆CfDNA中BCR和TCR免疫组库的方法中,步骤(5)的免疫组库 精准信息分析包括以下步骤:
[0022] 1)基于已知接头序列确定7个随机碱基N的位置,7个随机碱基可以形成47种唯 一标签,将成对测序序列的测序序列1和测序序列2的唯一标签序列首尾相连,形成14bp 的一条索引,并且以这14bp作为的成对测序序列索引进行外部排序,以达到将来源于同一 个DNA模板的所有测序序列聚集到一起的目的;
[0023] 2)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据插入序列之间的汉 明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列 的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
[0024] 3)对于每个DNA模板的dup簇(每个DNA模板扩增形成的系列重复片段)中的测 序序列的每一个测序碱基进行互相比对,若某种碱基型在测序序列中的一致率达到80 %, 则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列 的新测序序列,通过这种方法矫正,可以有效去除测序和PCR中随机引入的错误,提高检测 的准确性;
[0025] 4)对新测序序列进行数据过滤,去除接头序列以及比对质量小于30的测序序列;
[0026] 5)根据4)中得到的测序序列与頂GT数据库中V、D和J区基因片段的胚系参考 序列进行比对注释,同时根据唯一标签对每个模板的唯一标记,对各免疫亚克隆进行统计 定量;
[0027] 6)根据5)的结果进行序列结构分析,免疫组库表达谱分析、Biomarker分析。
[0028] 上述步骤2)所述的汉明距离值不超过3是本发明信息分析的一个关键点,为了尽 可能多的区分不同的亚克隆,需要尽量压缩汉明距离的容忍度,以得到更加全面的BCR和 TCR的亚克隆类型。
[0029] 另一方面,本发明提供了一种检测血浆CfDNA中BCR和TCR免疫组库的系统,包括 以下操作单元:
[0030] (1)血浆cfDNA提取单元;
[0031] (2)BCRH链全长多重PCR扩增和TCRP链⑶R3多重PCR扩增单元;
[0032] (3)步骤(2)中两种扩增产物混合后再进行一次PCR扩增单元;
[0033] (4)高通量测序单元;
[0034] (5)免疫组库精准信息分析单元。
[0035] 所述单元(2)中BCRH链全长多重PCR扩增采用的上游引物共22条,序列分别如 SEQIDNO. 1-22所示,下游引物共6条,序列分别如SEQIDNO. 23-28所示;
[0036]TCR链⑶R3多重PCR扩增采用的上游引物共45条,序列分别如SEQID NO. 29-73所示,下游引物共4条,序列分别如SEQIDNO. 74-77所示。
[0037] 单元(3)中是将单元(2)的两种扩增产物等体积混合后再进行一次PCR扩增;所 采用的引物序列如SEQIDNO. 78-79所示。
[0038] 单元(5)的免疫组库精准信息分析包括以下步骤:
[0039] 1)基于已知接头序列确定7个随机碱基N的位置,7个随机碱基可以形成47种唯 一标签,将成对测序序列的测序序列1和测序序列2的唯一标签序列首尾相连,形成14bp 的一条索引,并且以这14bp作为的成对测序序列索引进行外部排序,以达到将来源于同一
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1