构建可变区测序文库的方法及确定可变区核酸序列的方法

文档序号:9745728阅读:496来源:国知局
构建可变区测序文库的方法及确定可变区核酸序列的方法
【技术领域】
[0001] 本发明涉及生物技术领域,具体的,本发明涉及构建可变区测序文库的方法及确 定可变区核酸序列的方法。
【背景技术】
[0002] 淋己细胞肿瘤是由淋己细胞恶性克隆性增值引起的严重危害人体健康的恶性疾 病,其中包括淋己细胞白血病,骨髓瘤及各种淋己瘤。随着诊疗技术水平的增高,淋己细胞 肿瘤的诊疗水平方面得到了质的飞跃。其中微小残留的检测在淋己细胞肿瘤的分层、评判 疗效、估计患者预后、指导治疗方案的制定、提高患者生存治愈方面起到了关键的作用。
[0003] 微小残留病(M畑,Minimal resi化al disease)是指经诱导化疗获得完全缓解 (CR,Complete Remission)后或是骨髓移植治疗后体内残留的微量肿瘤细胞。随着化疗、 特异祀向治疗、造血干细胞移植技术的不断提高,淋己细胞肿瘤的治疗效果日益改善,然而 复发仍是困扰送类疾病治愈的一个难题,微小残留病是复发的主要根源。因此,对患者进行 定期MRD检测,具有重要临床意义。
[0004] 然而,目前对于MRD检测的手段仍有待改进。

【发明内容】

[0005] 本发明旨在至少解决现有技术中存在的技术问题之一。为此,根据本发明的实施 例,本发明提出了用于构建测序文库的方法W及确定可变区核酸序列的方法,其能够有效 用于MRD检测。
[0006] 在本发明的第一方面,本发明提出了一种构建可变区测序文库的方法。根据本发 明的实施例,该方法包括;W含有编码所述可变区的核酸样本作为模板,扩增编码所述可变 区的核酸,W便获得第一扩增产物;在所述第一扩增产物的两个末端至少之一添加测序接 头,W便获得所述可变区测序文库,其中,所述扩增采用下列引物:第一引物,所述第一引物 包括至少一个特异性识别V区的框架区编码序列的核酸分子;W及第二引物,所述第二引 物包括至少一个特异性识别J区或C区编码序列的核酸分子。由此,利用根据本发明实施例 的方法,能够有效地构建核酸样本中所包含的可变区的测序文库,不需要设计特异性的PCR 引物或者探针,节省了人力、时间等。
[0007] 根据本发明的实施例,所述第一引物和所述第二引物进一步含有适于扩增测序接 头的核酸序列。由此,可W便于通过扩增引入测序接头,从而提高了构建测序文库的效率。
[0008] 根据本发明的实施例,所述含有编码所述可变区的核酸样本为从动物外周血或骨 髓中提取的全基因组DNA或总RNA的至少一部分。由此,可W有效地针对动物个体构建其 可变区测序文库。
[0009] 根据本发明的实施例,所述动物为血液癌症患者或者曾经患有血液癌症的人。由 此,可W有效地通过监控可变区组成的变化,监控癌症病人尤其是血液癌症病人的病情发 展。
[0010] 根据本发明的实施例,所述核酸样本包括全基因组DM或总RNA的至少一部分,对 于RNA样品,在进行所述扩增之前,预先利用第Η引物对所述总RNA的至少一部分进行反转 录处理,其中,所述第Η引物包括至少一个特异性识别恒定区编码序列的核酸分子。根据本 发明的实施例,所述恒定区为BCR或TCR的恒定区。由此,可W有效地确定个体表达的可变 区的序列。需要说明的是,在本文中所使用的术语"BCR"表示Β细胞受体,"TCR"表示Τ细 胞受体。
[0011] 根据本发明的实施例,所述可变区为BCR或TCR的可变区。
[0012] 根据本发明的实施例,在所述第一扩增产物的两个末端至少之一添加测序接头是 通过下列进行的:将所述第一扩增产物进行末端修复,W便获得经过末端修复的第一扩增 产物;W及将所述经过末端修复的第一扩增产物与含有测序接头序列的寡核巧酸连接,W 便获得具有接头的第一扩增产物。由此,可W有效地提高构建测序文库的效率。
[0013] 根据本发明的实施例,所述含有测序接头序列的寡核巧酸进一步包括标签序列。 由此,可W有效地针对多个不同的样本构建测序文库,在后续测序中可W同时进行测序,可 W通过标签非常方便地对样本来源进行区分。
[0014] 根据本发明的实施例,对所述具有接头的第一扩增产物进行二次扩增,W便获得 第二扩增产物,其中,所述第二扩增产物构成所述测序文库。
[0015] 根据本发明的实施例,在所述第一扩增产物的两个末端至少之一添加测序接头是 通过下列进行的;采用含有测序接头序列的引物对所述第一扩增产物进行二次扩增,W便 获得具有接头的第二扩增产物,其中,所述第二扩增产物构成所述测序文库。
[0016] 根据本发明的实施例,所述含有测序接头序列的引物进一步含有标签序列。由此, 可W有效地针对多个不同的样本构建测序文库,在后续测序中可W同时进行测序,可W通 过标签非常方便地对样本来源进行区分。
[0017] 根据本发明的实施例,编码所述可变区的核酸为Τ细胞受体目链,所述第一引物 包括SEQ ID NO :1-32所示核酸序列,所述第二引物包括SEQ ID NO :33-45所示核酸序列。 具体序列如下表所示:
[0018]
[0019]

[0020] 根据本发明的另一些实施例,编码所述可变区的核酸为人类免疫球蛋白重链,所 述第一引物包括SEQ ID NO :46-57所示核酸序列,所述第二引物为SEQ ID NO ;58所示核酸 序列。具体序列如下表所示:
[0021]
[0022]
[002引在本发明的第二方面,本发明提出了一种确定可变区核酸序列的方法。根据本发 明的实施例,该方法包括:根据前面所述的构建可变区测序文库的方法,构建可变区测序文 库;W及对所述可变区测序文库进行测序,W便确定可变区核酸序列。由此,利用该方法,能 够有效地确定可变区核酸序列,且不需要设计特异性的PCR引物或者探针,节省了人力、时 间等。并且,当确定的可变区核酸序列来源于TCR或BCR的可变区时,利用获得的可变区核 酸序列,能够有效确定TCR或BCR的V-J谱多样性、TCR或BCR的克隆频率,进而W可变区 核酸序列中丰度超过健康群体的最高克隆丰度的克隆为标志物,可W根据患者不同阶段的 可变区核酸序列中的标志物的情况,有效实现对患者进行MRD检测,确定患者的预后效果, 实现动态监控患者的免疫系统的变化和重建情况,且灵敏度高,适用性广,操作简便,易于 标准化。
[0024] 根据本发明实施例的确定可变区核酸序列的方法还可W包括W下附加技术特 征:
[0025] 根据本发明的实施例,所述测序为高通量测序。
[0026] 根据本发明的实施例,所述高通量测序是利用选自化369、11369、454、50^0、1〇11 Torrent W及CG测序平台的至少之一进行的。
[0027] 根据本发明的实施例,所述可变区为TCR或BCR的可变区。
[0028] 根据本发明的实施例,进一步包括:基于所述可变区核酸序列,确定TCR或BCR的 V-J谱多样性。
[0029] 根据本发明的实施例,所述V-J谱多样性是通过分别确定各种V基因和J基因的 频率W及各种V-J组合的频率来确定的。
[0030] 根据本发明的实施例,针对患者,确定可变区核酸序列,并且确定各克隆的丰度, 选择丰度超过预定阔值的克隆作为标志物,所述丰度是通过下列公式确定的:
[0031] 每个克隆的相对丰度=该克隆的reads数/所有克隆的总reads数。其中,需要 说明的是,在本文中所使用的术语"克隆"是指确定为可变区的核酸序列。
[0032] 根据本发明的实施例,所述预定阔值是基于健康群体确定的。
[0033] 根据本发明的实施例,所述预定阔值是基于健康人群外周血或骨髓中存在的最高 克隆丰度确定的。由此,当标志物克隆的频率低于预定阔值时,可W确定所述患者的免疫重 建情况和预后效果好;反之,则可W确定所述患者的免疫重建情况和预后效果差。根据本发 明的一个具体示例,所述预定阔值为5%,送是因为,健康个体的抗原受体基因图谱一般情 况下多样性非常高,不会出现某种基因频率高于5%的情况。
[0034] 根据本发明的实施例,进一步包括:确定患者不同阶段的可变区核酸序列,并且对 不同阶段的可变区核酸序列中的标志物进行分析。由此,有效实现对患者进行MRD检测,实 现动态监
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1